PT96223B - Processo para a preparacao de um agente viral responsavel pela hepatite nao-a bnao-b de pos-transfusao - Google Patents
Processo para a preparacao de um agente viral responsavel pela hepatite nao-a bnao-b de pos-transfusao Download PDFInfo
- Publication number
- PT96223B PT96223B PT9622390A PT9622390A PT96223B PT 96223 B PT96223 B PT 96223B PT 9622390 A PT9622390 A PT 9622390A PT 9622390 A PT9622390 A PT 9622390A PT 96223 B PT96223 B PT 96223B
- Authority
- PT
- Portugal
- Prior art keywords
- nanbh
- viral
- sequence
- seq
- amino acid
- Prior art date
Links
- 230000003612 virological effect Effects 0.000 title claims abstract description 107
- 238000000034 method Methods 0.000 title claims abstract description 58
- 230000008569 process Effects 0.000 title claims abstract description 22
- 238000002360 preparation method Methods 0.000 title claims abstract description 9
- 208000006454 hepatitis Diseases 0.000 title description 2
- 231100000283 hepatitis Toxicity 0.000 title description 2
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 119
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 113
- 229920001184 polypeptide Polymers 0.000 claims abstract description 112
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 49
- 239000000427 antigen Substances 0.000 claims abstract description 47
- 108091007433 antigens Proteins 0.000 claims abstract description 46
- 102000036639 antigens Human genes 0.000 claims abstract description 46
- 238000010367 cloning Methods 0.000 claims abstract description 25
- 239000012634 fragment Substances 0.000 claims abstract description 24
- 239000013604 expression vector Substances 0.000 claims abstract description 20
- 230000000890 antigenic effect Effects 0.000 claims abstract description 15
- 206010019786 Hepatitis non-A non-B Diseases 0.000 claims abstract description 7
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 6
- 238000012258 culturing Methods 0.000 claims abstract description 5
- 230000001131 transforming effect Effects 0.000 claims abstract description 4
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract 18
- 239000002299 complementary DNA Substances 0.000 claims description 42
- 150000007523 nucleic acids Chemical class 0.000 claims description 27
- 108020004707 nucleic acids Proteins 0.000 claims description 26
- 102000039446 nucleic acids Human genes 0.000 claims description 26
- 238000012360 testing method Methods 0.000 claims description 24
- 238000001514 detection method Methods 0.000 claims description 18
- 108091026890 Coding region Proteins 0.000 claims description 9
- 108020000999 Viral RNA Proteins 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 7
- 210000002268 wool Anatomy 0.000 claims 1
- 208000005176 Hepatitis C Diseases 0.000 description 114
- 239000003795 chemical substances by application Substances 0.000 description 78
- 108020004414 DNA Proteins 0.000 description 59
- 210000004027 cell Anatomy 0.000 description 54
- 210000002966 serum Anatomy 0.000 description 39
- 239000002773 nucleotide Substances 0.000 description 35
- 125000003729 nucleotide group Chemical group 0.000 description 35
- 241000282414 Homo sapiens Species 0.000 description 31
- 108091034117 Oligonucleotide Proteins 0.000 description 31
- 108090000623 proteins and genes Proteins 0.000 description 30
- 208000015181 infectious disease Diseases 0.000 description 29
- 102000004169 proteins and genes Human genes 0.000 description 26
- 235000018102 proteins Nutrition 0.000 description 25
- 239000000523 sample Substances 0.000 description 25
- 239000013598 vector Substances 0.000 description 25
- 241000588724 Escherichia coli Species 0.000 description 24
- 239000000203 mixture Substances 0.000 description 24
- 238000003752 polymerase chain reaction Methods 0.000 description 24
- 241000700605 Viruses Species 0.000 description 22
- 150000001413 amino acids Chemical group 0.000 description 20
- 230000002458 infectious effect Effects 0.000 description 20
- 206010019791 Hepatitis post transfusion Diseases 0.000 description 19
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 19
- 238000003556 assay Methods 0.000 description 19
- 239000013615 primer Substances 0.000 description 19
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 16
- 239000000872 buffer Substances 0.000 description 15
- 229960005486 vaccine Drugs 0.000 description 15
- 230000004927 fusion Effects 0.000 description 14
- 239000011541 reaction mixture Substances 0.000 description 14
- 230000027455 binding Effects 0.000 description 13
- 210000002381 plasma Anatomy 0.000 description 13
- 239000011780 sodium chloride Substances 0.000 description 13
- 102000004190 Enzymes Human genes 0.000 description 12
- 108090000790 Enzymes Proteins 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 12
- 229940088598 enzyme Drugs 0.000 description 12
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 11
- 238000009472 formulation Methods 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- 239000000243 solution Substances 0.000 description 11
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 10
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 10
- 239000004202 carbamide Substances 0.000 description 10
- 238000003780 insertion Methods 0.000 description 10
- 230000037431 insertion Effects 0.000 description 10
- 108010077112 prolyl-proline Proteins 0.000 description 10
- 239000006228 supernatant Substances 0.000 description 10
- 238000012546 transfer Methods 0.000 description 10
- 241000701447 unidentified baculovirus Species 0.000 description 10
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 9
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 9
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 9
- 235000001014 amino acid Nutrition 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 108091008146 restriction endonucleases Proteins 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 230000006820 DNA synthesis Effects 0.000 description 8
- 238000002965 ELISA Methods 0.000 description 8
- 241000701959 Escherichia virus Lambda Species 0.000 description 8
- 108010076039 Polyproteins Proteins 0.000 description 8
- 108010067390 Viral Proteins Proteins 0.000 description 8
- 230000003321 amplification Effects 0.000 description 8
- 108010077515 glycylproline Proteins 0.000 description 8
- 238000003199 nucleic acid amplification method Methods 0.000 description 8
- 239000002245 particle Substances 0.000 description 8
- 108010061238 threonyl-glycine Proteins 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- 238000012286 ELISA Assay Methods 0.000 description 7
- 241000238631 Hexapoda Species 0.000 description 7
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 7
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 7
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 7
- 241000700159 Rattus Species 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 239000000284 extract Substances 0.000 description 7
- 238000011534 incubation Methods 0.000 description 7
- 239000006166 lysate Substances 0.000 description 7
- 239000000725 suspension Substances 0.000 description 7
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 6
- 239000003155 DNA primer Substances 0.000 description 6
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 6
- YKRQRPFODDJQTC-CSMHCCOUSA-N Thr-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN YKRQRPFODDJQTC-CSMHCCOUSA-N 0.000 description 6
- 239000002671 adjuvant Substances 0.000 description 6
- 239000011543 agarose gel Substances 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 108010062796 arginyllysine Proteins 0.000 description 6
- 210000004369 blood Anatomy 0.000 description 6
- 239000008280 blood Substances 0.000 description 6
- 238000005119 centrifugation Methods 0.000 description 6
- 238000003745 diagnosis Methods 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 238000002955 isolation Methods 0.000 description 6
- 238000002372 labelling Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 6
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 5
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 5
- 241000282577 Pan troglodytes Species 0.000 description 5
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 5
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 108010068380 arginylarginine Proteins 0.000 description 5
- 108010077245 asparaginyl-proline Proteins 0.000 description 5
- 108010093581 aspartyl-proline Proteins 0.000 description 5
- 238000007796 conventional method Methods 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- 108010089804 glycyl-threonine Proteins 0.000 description 5
- 230000028993 immune response Effects 0.000 description 5
- 101150066555 lacZ gene Proteins 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 108010029020 prolylglycine Proteins 0.000 description 5
- 108010015796 prolylisoleucine Proteins 0.000 description 5
- 239000007858 starting material Substances 0.000 description 5
- 239000003981 vehicle Substances 0.000 description 5
- 238000005406 washing Methods 0.000 description 5
- ALBODLTZUXKBGZ-JUUVMNCLSA-N (2s)-2-amino-3-phenylpropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound NCCCC[C@H](N)C(O)=O.OC(=O)[C@@H](N)CC1=CC=CC=C1 ALBODLTZUXKBGZ-JUUVMNCLSA-N 0.000 description 4
- 229920001817 Agar Polymers 0.000 description 4
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 4
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 4
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 4
- KGVHCTWYMPWEGN-FSPLSTOPSA-N Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CN KGVHCTWYMPWEGN-FSPLSTOPSA-N 0.000 description 4
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- 241000711549 Hepacivirus C Species 0.000 description 4
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 4
- KTGFOCFYOZQVRJ-ZKWXMUAHSA-N Ile-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O KTGFOCFYOZQVRJ-ZKWXMUAHSA-N 0.000 description 4
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 4
- 101710182846 Polyhedrin Proteins 0.000 description 4
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 4
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 4
- GVUVRRPYYDHHGK-VQVTYTSYSA-N Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GVUVRRPYYDHHGK-VQVTYTSYSA-N 0.000 description 4
- 108010006785 Taq Polymerase Proteins 0.000 description 4
- LCPVBXOHXMBLFW-JSGCOSHPSA-N Trp-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)=CNC2=C1 LCPVBXOHXMBLFW-JSGCOSHPSA-N 0.000 description 4
- DZHDVYLBNKMLMB-ZFWWWQNUSA-N Trp-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 DZHDVYLBNKMLMB-ZFWWWQNUSA-N 0.000 description 4
- 239000008272 agar Substances 0.000 description 4
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 4
- 230000000692 anti-sense effect Effects 0.000 description 4
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 238000010804 cDNA synthesis Methods 0.000 description 4
- 108010016616 cysteinylglycine Proteins 0.000 description 4
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 4
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 4
- 108010036413 histidylglycine Proteins 0.000 description 4
- 230000036039 immunity Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000002953 phosphate buffered saline Substances 0.000 description 4
- 229920000136 polysorbate Polymers 0.000 description 4
- 239000007790 solid phase Substances 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- JSLGXODUIAFWCF-WDSKDSINSA-N Arg-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O JSLGXODUIAFWCF-WDSKDSINSA-N 0.000 description 3
- XNSKSTRGQIPTSE-ACZMJKKPSA-N Arg-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XNSKSTRGQIPTSE-ACZMJKKPSA-N 0.000 description 3
- JZRLLSOWDYUKOK-SRVKXCTJSA-N Asn-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N JZRLLSOWDYUKOK-SRVKXCTJSA-N 0.000 description 3
- IIFDPDVJAHQFSR-WHFBIAKZSA-N Asn-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O IIFDPDVJAHQFSR-WHFBIAKZSA-N 0.000 description 3
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 3
- MPZWMIIOPAPAKE-BQBZGAKWSA-N Glu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MPZWMIIOPAPAKE-BQBZGAKWSA-N 0.000 description 3
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 3
- SNFUTDLOCQQRQD-ZKWXMUAHSA-N Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SNFUTDLOCQQRQD-ZKWXMUAHSA-N 0.000 description 3
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- VPZXBVLAVMBEQI-VKHMYHEASA-N Glycyl-alanine Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 108010065920 Insulin Lispro Proteins 0.000 description 3
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 3
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 3
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 3
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 3
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 3
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 3
- DZMGFGQBRYWJOR-YUMQZZPRSA-N Met-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O DZMGFGQBRYWJOR-YUMQZZPRSA-N 0.000 description 3
- PESQCPHRXOFIPX-RYUDHWBXSA-N Met-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-RYUDHWBXSA-N 0.000 description 3
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 3
- KNPVDQMEHSCAGX-UWVGGRQHSA-N Phe-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KNPVDQMEHSCAGX-UWVGGRQHSA-N 0.000 description 3
- GLEOIKLQBZNKJZ-WDSKDSINSA-N Pro-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GLEOIKLQBZNKJZ-WDSKDSINSA-N 0.000 description 3
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 3
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 3
- MMTOHPRBJKEZHT-BWBBJGPYSA-N Thr-Cys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O MMTOHPRBJKEZHT-BWBBJGPYSA-N 0.000 description 3
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 3
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 3
- RPECVQBNONKZAT-WZLNRYEVSA-N Thr-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H]([C@@H](C)O)N RPECVQBNONKZAT-WZLNRYEVSA-N 0.000 description 3
- PEEAINPHPNDNGE-JQWIXIFHSA-N Trp-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 PEEAINPHPNDNGE-JQWIXIFHSA-N 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 102000005936 beta-Galactosidase Human genes 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- 239000012148 binding buffer Substances 0.000 description 3
- XVBRCOKDZVQYAY-UHFFFAOYSA-N bronidox Chemical compound [O-][N+](=O)C1(Br)COCOC1 XVBRCOKDZVQYAY-UHFFFAOYSA-N 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- KZNQNBZMBZJQJO-YFKPBYRVSA-N glyclproline Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 3
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 3
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 238000003018 immunoassay Methods 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 108010005942 methionylglycine Proteins 0.000 description 3
- 239000012071 phase Substances 0.000 description 3
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 3
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000002285 radioactive effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000010186 staining Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- OPIFSICVWOWJMJ-AEOCFKNESA-N 5-bromo-4-chloro-3-indolyl beta-D-galactoside Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1OC1=CNC2=CC=C(Br)C(Cl)=C12 OPIFSICVWOWJMJ-AEOCFKNESA-N 0.000 description 2
- LHEJDBBHZGISGW-UHFFFAOYSA-N 5-fluoro-3-(3-oxo-1h-2-benzofuran-1-yl)-1h-pyrimidine-2,4-dione Chemical compound O=C1C(F)=CNC(=O)N1C1C2=CC=CC=C2C(=O)O1 LHEJDBBHZGISGW-UHFFFAOYSA-N 0.000 description 2
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 2
- 108010082126 Alanine transaminase Proteins 0.000 description 2
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 2
- YHSNASXGBPAHRL-BPUTZDHNSA-N Arg-Cys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N YHSNASXGBPAHRL-BPUTZDHNSA-N 0.000 description 2
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 2
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 2
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 2
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 2
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 2
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 2
- MMGCRPZQZWTZTA-IHRRRGAJSA-N Arg-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N MMGCRPZQZWTZTA-IHRRRGAJSA-N 0.000 description 2
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 2
- PZBSKYJGKNNYNK-ULQDDVLXSA-N Arg-Leu-Tyr Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O PZBSKYJGKNNYNK-ULQDDVLXSA-N 0.000 description 2
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 2
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 2
- NPDLYUOYAGBHFB-WDSKDSINSA-N Asn-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NPDLYUOYAGBHFB-WDSKDSINSA-N 0.000 description 2
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 2
- HLTLEIXYIJDFOY-ZLUOBGJFSA-N Asn-Cys-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O HLTLEIXYIJDFOY-ZLUOBGJFSA-N 0.000 description 2
- MQLZLIYPFDIDMZ-HAFWLYHUSA-N Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O MQLZLIYPFDIDMZ-HAFWLYHUSA-N 0.000 description 2
- LANZYLJEHLBUPR-BPUTZDHNSA-N Asn-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)N)N LANZYLJEHLBUPR-BPUTZDHNSA-N 0.000 description 2
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 2
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 2
- ZCKYZTGLXIEOKS-CIUDSAMLSA-N Asp-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N ZCKYZTGLXIEOKS-CIUDSAMLSA-N 0.000 description 2
- BSWHERGFUNMWGS-UHFFFAOYSA-N Asp-Ile Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(O)=O BSWHERGFUNMWGS-UHFFFAOYSA-N 0.000 description 2
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 2
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 2
- 241001203868 Autographa californica Species 0.000 description 2
- 102100029172 Choline-phosphate cytidylyltransferase A Human genes 0.000 description 2
- 101710100763 Choline-phosphate cytidylyltransferase A Proteins 0.000 description 2
- RGTVXXNMOGHRAY-WDSKDSINSA-N Cys-Arg Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RGTVXXNMOGHRAY-WDSKDSINSA-N 0.000 description 2
- SZQCDCKIGWQAQN-FXQIFTODSA-N Cys-Arg-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O SZQCDCKIGWQAQN-FXQIFTODSA-N 0.000 description 2
- OABOXRPGTFRBFZ-IMJSIDKUSA-N Cys-Cys Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(O)=O OABOXRPGTFRBFZ-IMJSIDKUSA-N 0.000 description 2
- MUZAUPFGPMMZSS-GUBZILKMSA-N Cys-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N MUZAUPFGPMMZSS-GUBZILKMSA-N 0.000 description 2
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 2
- SKSJPIBFNFPTJB-NKWVEPMBSA-N Cys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CS)N)C(=O)O SKSJPIBFNFPTJB-NKWVEPMBSA-N 0.000 description 2
- OOULJWDSSVOMHX-WDSKDSINSA-N Cys-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CS OOULJWDSSVOMHX-WDSKDSINSA-N 0.000 description 2
- IQXSTXKVEMRMMB-XAVMHZPKSA-N Cys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N)O IQXSTXKVEMRMMB-XAVMHZPKSA-N 0.000 description 2
- FANFRJOFTYCNRG-JYBASQMISA-N Cys-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CS)N)O FANFRJOFTYCNRG-JYBASQMISA-N 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 108010010803 Gelatin Proteins 0.000 description 2
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 2
- NADWTMLCUDMDQI-ACZMJKKPSA-N Glu-Asp-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NADWTMLCUDMDQI-ACZMJKKPSA-N 0.000 description 2
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 2
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 2
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 2
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 2
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 2
- JHSRJMUJOGLIHK-GUBZILKMSA-N Glu-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N JHSRJMUJOGLIHK-GUBZILKMSA-N 0.000 description 2
- QMOSCLNJVKSHHU-YUMQZZPRSA-N Glu-Met-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QMOSCLNJVKSHHU-YUMQZZPRSA-N 0.000 description 2
- XMBSYZWANAQXEV-QWRGUYRKSA-N Glu-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-QWRGUYRKSA-N 0.000 description 2
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 2
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 2
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 2
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 2
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 2
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 2
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 2
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 2
- NTOWAXLMQFKJPT-YUMQZZPRSA-N Gly-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN NTOWAXLMQFKJPT-YUMQZZPRSA-N 0.000 description 2
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 2
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 2
- PFMUCCYYAAFKTH-YFKPBYRVSA-N Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CN PFMUCCYYAAFKTH-YFKPBYRVSA-N 0.000 description 2
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 2
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 2
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 2
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 2
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 2
- AJHCSUXXECOXOY-NSHDSACASA-N Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-NSHDSACASA-N 0.000 description 2
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 2
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 2
- 206010019799 Hepatitis viral Diseases 0.000 description 2
- CZXKZMQKXQZDEX-YUMQZZPRSA-N His-Gly-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N CZXKZMQKXQZDEX-YUMQZZPRSA-N 0.000 description 2
- XMAUFHMAAVTODF-STQMWFEESA-N His-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XMAUFHMAAVTODF-STQMWFEESA-N 0.000 description 2
- JVEKQAYXFGIISZ-HOCLYGCPSA-N His-Trp-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(O)=O)C1=CN=CN1 JVEKQAYXFGIISZ-HOCLYGCPSA-N 0.000 description 2
- IIXDMJNYALIKGP-DJFWLOJKSA-N Ile-Asn-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IIXDMJNYALIKGP-DJFWLOJKSA-N 0.000 description 2
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 2
- LDRALPZEVHVXEK-KBIXCLLPSA-N Ile-Cys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N LDRALPZEVHVXEK-KBIXCLLPSA-N 0.000 description 2
- WEWCEPOYKANMGZ-MMWGEVLESA-N Ile-Cys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N WEWCEPOYKANMGZ-MMWGEVLESA-N 0.000 description 2
- UCGDDTHMMVWVMV-FSPLSTOPSA-N Ile-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(O)=O UCGDDTHMMVWVMV-FSPLSTOPSA-N 0.000 description 2
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 2
- BCVIOZZGJNOEQS-XKNYDFJKSA-N Ile-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)[C@@H](C)CC BCVIOZZGJNOEQS-XKNYDFJKSA-N 0.000 description 2
- BBIXOODYWPFNDT-CIUDSAMLSA-N Ile-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O BBIXOODYWPFNDT-CIUDSAMLSA-N 0.000 description 2
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 2
- DRCKHKZYDLJYFQ-YWIQKCBGSA-N Ile-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRCKHKZYDLJYFQ-YWIQKCBGSA-N 0.000 description 2
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 2
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 2
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- QLROSWPKSBORFJ-BQBZGAKWSA-N L-Prolyl-L-glutamic acid Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 2
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 2
- ZUKPVRWZDMRIEO-VKHMYHEASA-N L-cysteinylglycine Chemical compound SC[C@H]([NH3+])C(=O)NCC([O-])=O ZUKPVRWZDMRIEO-VKHMYHEASA-N 0.000 description 2
- AZLASBBHHSLQDB-GUBZILKMSA-N Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(C)C AZLASBBHHSLQDB-GUBZILKMSA-N 0.000 description 2
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 2
- GDBQQVLCIARPGH-UHFFFAOYSA-N Leupeptin Natural products CC(C)CC(NC(C)=O)C(=O)NC(CC(C)C)C(=O)NC(C=O)CCCN=C(N)N GDBQQVLCIARPGH-UHFFFAOYSA-N 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- KSFQPRLZAUXXPT-GARJFASQSA-N Lys-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)C(=O)O KSFQPRLZAUXXPT-GARJFASQSA-N 0.000 description 2
- YXTKSLRSRXKXNV-IHRRRGAJSA-N Lys-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N YXTKSLRSRXKXNV-IHRRRGAJSA-N 0.000 description 2
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 2
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 2
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 2
- ZVXSESPJMKNIQA-YXMSTPNBSA-N Lys-Thr-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZVXSESPJMKNIQA-YXMSTPNBSA-N 0.000 description 2
- RYOLKFYZBHMYFW-WDSOQIARSA-N Lys-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 RYOLKFYZBHMYFW-WDSOQIARSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- ZEDVFJPQNNBMST-CYDGBPFRSA-N Met-Arg-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZEDVFJPQNNBMST-CYDGBPFRSA-N 0.000 description 2
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 2
- VAGCEUUEMMXFEX-GUBZILKMSA-N Met-Met-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O VAGCEUUEMMXFEX-GUBZILKMSA-N 0.000 description 2
- XIGAHPDZLAYQOS-SRVKXCTJSA-N Met-Pro-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 XIGAHPDZLAYQOS-SRVKXCTJSA-N 0.000 description 2
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 2
- QYIGOFGUOVTAHK-ZJDVBMNYSA-N Met-Thr-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QYIGOFGUOVTAHK-ZJDVBMNYSA-N 0.000 description 2
- 102000016943 Muramidase Human genes 0.000 description 2
- 108010014251 Muramidase Proteins 0.000 description 2
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 239000000020 Nitrocellulose Substances 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 2
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 2
- GHNVJQZQYKNTDX-HJWJTTGWSA-N Phe-Ile-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O GHNVJQZQYKNTDX-HJWJTTGWSA-N 0.000 description 2
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 2
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 2
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 2
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 2
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 2
- JMCOUWKXLXDERB-WMZOPIPTSA-N Phe-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 JMCOUWKXLXDERB-WMZOPIPTSA-N 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- HXNYBZQLBWIADP-WDSKDSINSA-N Pro-Cys Chemical compound OC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 HXNYBZQLBWIADP-WDSKDSINSA-N 0.000 description 2
- LCWXSALTPTZKNM-CIUDSAMLSA-N Pro-Cys-Glu Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O LCWXSALTPTZKNM-CIUDSAMLSA-N 0.000 description 2
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 2
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 2
- QGOZJLYCGRYYRW-KKUMJFAQSA-N Pro-Glu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QGOZJLYCGRYYRW-KKUMJFAQSA-N 0.000 description 2
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 2
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 2
- QNZLIVROMORQFH-BQBZGAKWSA-N Pro-Gly-Cys Chemical compound C1C[C@H](NC1)C(=O)NCC(=O)N[C@@H](CS)C(=O)O QNZLIVROMORQFH-BQBZGAKWSA-N 0.000 description 2
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 2
- OCYROESYHWUPBP-CIUDSAMLSA-N Pro-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 OCYROESYHWUPBP-CIUDSAMLSA-N 0.000 description 2
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 2
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 2
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 2
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 2
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 2
- SNSYSBUTTJBPDG-OKZBNKHCSA-N Pro-Trp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N4CCC[C@@H]4C(=O)O SNSYSBUTTJBPDG-OKZBNKHCSA-N 0.000 description 2
- OIDKVWTWGDWMHY-RYUDHWBXSA-N Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 OIDKVWTWGDWMHY-RYUDHWBXSA-N 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- RNFKSBPHLTZHLU-WHFBIAKZSA-N Ser-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)O RNFKSBPHLTZHLU-WHFBIAKZSA-N 0.000 description 2
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 2
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 2
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 2
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 2
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 2
- FDALPRWYVKJCLL-PMVVWTBXSA-N Thr-His-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O FDALPRWYVKJCLL-PMVVWTBXSA-N 0.000 description 2
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 2
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 2
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 2
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 2
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 2
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 2
- DNCUODYZAMHLCV-XGEHTFHBSA-N Thr-Pro-Cys Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N)O DNCUODYZAMHLCV-XGEHTFHBSA-N 0.000 description 2
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- SCQBNMKLZVCXNX-ZFWWWQNUSA-N Trp-Arg-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N SCQBNMKLZVCXNX-ZFWWWQNUSA-N 0.000 description 2
- KZIQDVNORJKTMO-WDSOQIARSA-N Trp-Arg-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N KZIQDVNORJKTMO-WDSOQIARSA-N 0.000 description 2
- PMIJXCLOQFMOKZ-BPUTZDHNSA-N Trp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N PMIJXCLOQFMOKZ-BPUTZDHNSA-N 0.000 description 2
- VMBBTANKMSRJSS-JSGCOSHPSA-N Trp-Glu-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VMBBTANKMSRJSS-JSGCOSHPSA-N 0.000 description 2
- AZBIIKDSDLVJAK-VHWLVUOQSA-N Trp-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N AZBIIKDSDLVJAK-VHWLVUOQSA-N 0.000 description 2
- ACGIVBXINJFALS-HKUYNNGSSA-N Trp-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N ACGIVBXINJFALS-HKUYNNGSSA-N 0.000 description 2
- WJKJJGXZRHDNTN-UWVGGRQHSA-N Tyr-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WJKJJGXZRHDNTN-UWVGGRQHSA-N 0.000 description 2
- BVDHHLMIZFCAAU-BZSNNMDCSA-N Tyr-Cys-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BVDHHLMIZFCAAU-BZSNNMDCSA-N 0.000 description 2
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 2
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 2
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 2
- ZQOOYCZQENFIMC-STQMWFEESA-N Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=C(O)C=C1 ZQOOYCZQENFIMC-STQMWFEESA-N 0.000 description 2
- AUEJLPRZGVVDNU-STQMWFEESA-N Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-STQMWFEESA-N 0.000 description 2
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 2
- AKKYBQGHUAWPJR-MNSWYVGCSA-N Tyr-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)O AKKYBQGHUAWPJR-MNSWYVGCSA-N 0.000 description 2
- JAQGKXUEKGKTKX-HOTGVXAUSA-N Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 JAQGKXUEKGKTKX-HOTGVXAUSA-N 0.000 description 2
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 2
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 2
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 2
- IOUPEELXVYPCPG-UHFFFAOYSA-N Valylglycine Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 2
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 238000002820 assay format Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 2
- 108010004073 cysteinylcysteine Proteins 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 238000012869 ethanol precipitation Methods 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 239000008273 gelatin Substances 0.000 description 2
- 229920000159 gelatin Polymers 0.000 description 2
- 235000019322 gelatine Nutrition 0.000 description 2
- 235000011852 gelatine desserts Nutrition 0.000 description 2
- 229940012229 genone Drugs 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 2
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 2
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 208000002672 hepatitis B Diseases 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 210000004408 hybridoma Anatomy 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 238000013198 immunometric assay Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 238000004255 ion exchange chromatography Methods 0.000 description 2
- GDBQQVLCIARPGH-ULQDDVLXSA-N leupeptin Chemical compound CC(C)C[C@H](NC(C)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C=O)CCCN=C(N)N GDBQQVLCIARPGH-ULQDDVLXSA-N 0.000 description 2
- 108010052968 leupeptin Proteins 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000012317 liver biopsy Methods 0.000 description 2
- 229960000274 lysozyme Drugs 0.000 description 2
- 239000004325 lysozyme Substances 0.000 description 2
- 235000010335 lysozyme Nutrition 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 229920001220 nitrocellulos Polymers 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 229950000964 pepstatin Drugs 0.000 description 2
- 108010091212 pepstatin Proteins 0.000 description 2
- FAXGPCHRFPCXOO-LXTPJMTPSA-N pepstatin A Chemical compound OC(=O)C[C@H](O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)C[C@H](O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)NC(=O)CC(C)C FAXGPCHRFPCXOO-LXTPJMTPSA-N 0.000 description 2
- 102000013415 peroxidase activity proteins Human genes 0.000 description 2
- 108040007629 peroxidase activity proteins Proteins 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 239000002244 precipitate Substances 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 108010020432 prolyl-prolylisoleucine Proteins 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 238000000163 radioactive labelling Methods 0.000 description 2
- 230000009257 reactivity Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 238000001179 sorption measurement Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 108010036387 trimethionine Proteins 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010078580 tyrosylleucine Proteins 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 201000001862 viral hepatitis Diseases 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 108010027345 wheylin-1 peptide Proteins 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- BHNQPLPANNDEGL-UHFFFAOYSA-N 2-(4-octylphenoxy)ethanol Chemical compound CCCCCCCCC1=CC=C(OCCO)C=C1 BHNQPLPANNDEGL-UHFFFAOYSA-N 0.000 description 1
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 1
- HRDVWDQQYABHGH-UHFFFAOYSA-N 4-[4-(dimethylamino)phenyl]-N,N-dimethylaniline hydrochloride Chemical compound Cl.CN(C)c1ccc(cc1)-c1ccc(cc1)N(C)C HRDVWDQQYABHGH-UHFFFAOYSA-N 0.000 description 1
- TVZGACDUOSZQKY-LBPRGKRZSA-N 4-aminofolic acid Chemical compound C1=NC2=NC(N)=NC(N)=C2N=C1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 TVZGACDUOSZQKY-LBPRGKRZSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- GFEDXKNBZMPEDM-KZVJFYERSA-N Ala-Met-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFEDXKNBZMPEDM-KZVJFYERSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 1
- 102100027211 Albumin Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 1
- OSASDIVHOSJVII-WDSKDSINSA-N Arg-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N OSASDIVHOSJVII-WDSKDSINSA-N 0.000 description 1
- HJAICMSAKODKRF-GUBZILKMSA-N Arg-Cys-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O HJAICMSAKODKRF-GUBZILKMSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- JTZUZBADHGISJD-SRVKXCTJSA-N Arg-His-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JTZUZBADHGISJD-SRVKXCTJSA-N 0.000 description 1
- QYLJIYOGHRGUIH-CIUDSAMLSA-N Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N QYLJIYOGHRGUIH-CIUDSAMLSA-N 0.000 description 1
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 1
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 1
- UGJLILSJKSBVIR-ZFWWWQNUSA-N Arg-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)NCC(O)=O)=CNC2=C1 UGJLILSJKSBVIR-ZFWWWQNUSA-N 0.000 description 1
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 1
- NTXNUXPCNRDMAF-WFBYXXMGSA-N Asn-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC(N)=O)C)C(O)=O)=CNC2=C1 NTXNUXPCNRDMAF-WFBYXXMGSA-N 0.000 description 1
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 1
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 1
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 1
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 1
- TWXZVVXRRRRSLT-IMJSIDKUSA-N Asn-Cys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O TWXZVVXRRRRSLT-IMJSIDKUSA-N 0.000 description 1
- RRVBEKYEFMCDIF-WHFBIAKZSA-N Asn-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)C(=O)N RRVBEKYEFMCDIF-WHFBIAKZSA-N 0.000 description 1
- SPIPSJXLZVTXJL-ZLUOBGJFSA-N Asn-Cys-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O SPIPSJXLZVTXJL-ZLUOBGJFSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- QJMCHPGWFZZRID-BQBZGAKWSA-N Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O QJMCHPGWFZZRID-BQBZGAKWSA-N 0.000 description 1
- IQTUDDBANZYMAR-WDSKDSINSA-N Asn-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O IQTUDDBANZYMAR-WDSKDSINSA-N 0.000 description 1
- PBFXCUOEGVJTMV-QXEWZRGKSA-N Asn-Met-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O PBFXCUOEGVJTMV-QXEWZRGKSA-N 0.000 description 1
- OMSMPWHEGLNQOD-UWVGGRQHSA-N Asn-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UWVGGRQHSA-N 0.000 description 1
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 1
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 1
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 1
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- RGGVDKVXLBOLNS-JQWIXIFHSA-N Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)N)C(O)=O)=CNC2=C1 RGGVDKVXLBOLNS-JQWIXIFHSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- FKBFDTRILNZGAI-IMJSIDKUSA-N Asp-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O FKBFDTRILNZGAI-IMJSIDKUSA-N 0.000 description 1
- ZRAOLTNMSCSCLN-ZLUOBGJFSA-N Asp-Cys-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)O ZRAOLTNMSCSCLN-ZLUOBGJFSA-N 0.000 description 1
- WEDGJJRCJNHYSF-SRVKXCTJSA-N Asp-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N WEDGJJRCJNHYSF-SRVKXCTJSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- DYDKXJWQCIVTMR-WDSKDSINSA-N Asp-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O DYDKXJWQCIVTMR-WDSKDSINSA-N 0.000 description 1
- VWWAFGHMPWBKEP-GMOBBJLQSA-N Asp-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)O)N VWWAFGHMPWBKEP-GMOBBJLQSA-N 0.000 description 1
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 1
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 1
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 1
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 1
- NBKLEMWHDLAUEM-CIUDSAMLSA-N Asp-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N NBKLEMWHDLAUEM-CIUDSAMLSA-N 0.000 description 1
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 1
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 1
- CPMKYMGGYUFOHS-FSPLSTOPSA-N Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O CPMKYMGGYUFOHS-FSPLSTOPSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- GRNOCLDFUNCIDW-ACZMJKKPSA-N Cys-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N GRNOCLDFUNCIDW-ACZMJKKPSA-N 0.000 description 1
- QLCPDGRAEJSYQM-LPEHRKFASA-N Cys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)C(=O)O QLCPDGRAEJSYQM-LPEHRKFASA-N 0.000 description 1
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 1
- GGIHYKLJUIZYGH-ZLUOBGJFSA-N Cys-Cys-Asp Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N)C(=O)O GGIHYKLJUIZYGH-ZLUOBGJFSA-N 0.000 description 1
- ATPDEYTYWVMINF-ZLUOBGJFSA-N Cys-Cys-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O ATPDEYTYWVMINF-ZLUOBGJFSA-N 0.000 description 1
- BSFFNUBDVYTDMV-WHFBIAKZSA-N Cys-Gly-Asn Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BSFFNUBDVYTDMV-WHFBIAKZSA-N 0.000 description 1
- GUKYYUFHWYRMEU-WHFBIAKZSA-N Cys-Gly-Asp Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O GUKYYUFHWYRMEU-WHFBIAKZSA-N 0.000 description 1
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 1
- WXOFKRKAHJQKLT-BQBZGAKWSA-N Cys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CS WXOFKRKAHJQKLT-BQBZGAKWSA-N 0.000 description 1
- XMVZMBGFIOQONW-GARJFASQSA-N Cys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)C(=O)O XMVZMBGFIOQONW-GARJFASQSA-N 0.000 description 1
- LHJDLVVQRJIURS-SRVKXCTJSA-N Cys-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N LHJDLVVQRJIURS-SRVKXCTJSA-N 0.000 description 1
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 1
- YNJBLTDKTMKEET-ZLUOBGJFSA-N Cys-Ser-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O YNJBLTDKTMKEET-ZLUOBGJFSA-N 0.000 description 1
- GFAPBMCRSMSGDZ-XGEHTFHBSA-N Cys-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CS)N)O GFAPBMCRSMSGDZ-XGEHTFHBSA-N 0.000 description 1
- PNEAWXSKCKCHDK-XIRDDKMYSA-N Cys-Trp-His Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CS)N)C(O)=O)C1=CN=CN1 PNEAWXSKCKCHDK-XIRDDKMYSA-N 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 241001524679 Escherichia virus M13 Species 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 1
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 1
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 1
- DUYYPIRFTLOAJQ-YUMQZZPRSA-N Gly-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN DUYYPIRFTLOAJQ-YUMQZZPRSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- GNBMOZPQUXTCRW-STQMWFEESA-N Gly-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)CN)C(O)=O)=CNC2=C1 GNBMOZPQUXTCRW-STQMWFEESA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 1
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 1
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- ZOTGXWMKUFSKEU-QXEWZRGKSA-N Gly-Ile-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O ZOTGXWMKUFSKEU-QXEWZRGKSA-N 0.000 description 1
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 1
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 1
- ISSDODCYBOWWIP-GJZGRUSLSA-N Gly-Pro-Trp Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISSDODCYBOWWIP-GJZGRUSLSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 1
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- MWWOPNQSBXEUHO-ULQDDVLXSA-N His-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 MWWOPNQSBXEUHO-ULQDDVLXSA-N 0.000 description 1
- VOEGKUNRHYKYSU-XVYDVKMFSA-N His-Asp-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O VOEGKUNRHYKYSU-XVYDVKMFSA-N 0.000 description 1
- ZYDYEPDFFVCUBI-SRVKXCTJSA-N His-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZYDYEPDFFVCUBI-SRVKXCTJSA-N 0.000 description 1
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 1
- CTJHHEQNUNIYNN-SRVKXCTJSA-N His-His-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O CTJHHEQNUNIYNN-SRVKXCTJSA-N 0.000 description 1
- IDXZDKMBEXLFMB-HGNGGELXSA-N His-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 IDXZDKMBEXLFMB-HGNGGELXSA-N 0.000 description 1
- VJJSDSNFXCWCEJ-DJFWLOJKSA-N His-Ile-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O VJJSDSNFXCWCEJ-DJFWLOJKSA-N 0.000 description 1
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 1
- HTOOKGDPMXSJSY-STQMWFEESA-N His-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 HTOOKGDPMXSJSY-STQMWFEESA-N 0.000 description 1
- DLTCGJZBNFOWFL-LKTVYLICSA-N His-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N DLTCGJZBNFOWFL-LKTVYLICSA-N 0.000 description 1
- 101100297420 Homarus americanus phc-1 gene Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- HYXQKVOADYPQEA-CIUDSAMLSA-N Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HYXQKVOADYPQEA-CIUDSAMLSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- HZYHBDVRCBDJJV-HAFWLYHUSA-N Ile-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O HZYHBDVRCBDJJV-HAFWLYHUSA-N 0.000 description 1
- VQUCKIAECLVLAD-SVSWQMSJSA-N Ile-Cys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VQUCKIAECLVLAD-SVSWQMSJSA-N 0.000 description 1
- WMDZARSFSMZOQO-DRZSPHRISA-N Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WMDZARSFSMZOQO-DRZSPHRISA-N 0.000 description 1
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 1
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 1
- NSPNUMNLZNOPAQ-SJWGOKEGSA-N Ile-Tyr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N NSPNUMNLZNOPAQ-SJWGOKEGSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 1
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 1
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 1
- HGUUMQWGYCVPKG-DCAQKATOSA-N Leu-Pro-Cys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HGUUMQWGYCVPKG-DCAQKATOSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- RLZDUFRBMQNYIJ-YUMQZZPRSA-N Lys-Cys-Gly Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N RLZDUFRBMQNYIJ-YUMQZZPRSA-N 0.000 description 1
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 1
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 1
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- AEIIJFBQVGYVEV-YESZJQIVSA-N Lys-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCCN)N)C(=O)O AEIIJFBQVGYVEV-YESZJQIVSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- JMEWFDUAFKVAAT-WDSKDSINSA-N Met-Asn Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O JMEWFDUAFKVAAT-WDSKDSINSA-N 0.000 description 1
- LQMHZERGCQJKAH-STQMWFEESA-N Met-Gly-Phe Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LQMHZERGCQJKAH-STQMWFEESA-N 0.000 description 1
- MHQXIBRPDKXDGZ-ZFWWWQNUSA-N Met-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 MHQXIBRPDKXDGZ-ZFWWWQNUSA-N 0.000 description 1
- FTQOFRPGLYXRFM-CYDGBPFRSA-N Met-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCSC)N FTQOFRPGLYXRFM-CYDGBPFRSA-N 0.000 description 1
- IMTUWVJPCQPJEE-IUCAKERBSA-N Met-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN IMTUWVJPCQPJEE-IUCAKERBSA-N 0.000 description 1
- SOAYQFDWEIWPPR-IHRRRGAJSA-N Met-Ser-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SOAYQFDWEIWPPR-IHRRRGAJSA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- YDKYJRZWRJTILC-WDSOQIARSA-N Met-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 YDKYJRZWRJTILC-WDSOQIARSA-N 0.000 description 1
- PVSPJQWHEIQTEH-JYJNAYRXSA-N Met-Val-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PVSPJQWHEIQTEH-JYJNAYRXSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- 239000008896 Opium Substances 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- NOFBJKKOPKJDCO-KKXDTOCCSA-N Phe-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NOFBJKKOPKJDCO-KKXDTOCCSA-N 0.000 description 1
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 1
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 1
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 1
- DZVXMMSUWWUIQE-ACRUOGEOSA-N Phe-His-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N DZVXMMSUWWUIQE-ACRUOGEOSA-N 0.000 description 1
- GKZIWHRNKRBEOH-HOTGVXAUSA-N Phe-Phe Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)C1=CC=CC=C1 GKZIWHRNKRBEOH-HOTGVXAUSA-N 0.000 description 1
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 1
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 1
- FZBGMXYQPACKNC-HJWJTTGWSA-N Phe-Pro-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FZBGMXYQPACKNC-HJWJTTGWSA-N 0.000 description 1
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 241000701370 Plasmavirus Species 0.000 description 1
- 229920002535 Polyethylene Glycol 1500 Polymers 0.000 description 1
- 108010039918 Polylysine Proteins 0.000 description 1
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 1
- MLQVJYMFASXBGZ-IHRRRGAJSA-N Pro-Asn-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O MLQVJYMFASXBGZ-IHRRRGAJSA-N 0.000 description 1
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 1
- SZZBUDVXWZZPDH-BQBZGAKWSA-N Pro-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 SZZBUDVXWZZPDH-BQBZGAKWSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- WSRWHZRUOCACLJ-UWVGGRQHSA-N Pro-Gly-His Chemical compound C([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H]1NCCC1)C1=CN=CN1 WSRWHZRUOCACLJ-UWVGGRQHSA-N 0.000 description 1
- BEPSGCXDIVACBU-IUCAKERBSA-N Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BEPSGCXDIVACBU-IUCAKERBSA-N 0.000 description 1
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 1
- WIPAMEKBSHNFQE-IUCAKERBSA-N Pro-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@@H]1CCCN1 WIPAMEKBSHNFQE-IUCAKERBSA-N 0.000 description 1
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 1
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- GBUNEGKQPSAMNK-QTKMDUPCSA-N Pro-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2)O GBUNEGKQPSAMNK-QTKMDUPCSA-N 0.000 description 1
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 1
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 1
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 1
- AWJGUZSYVIVZGP-YUMQZZPRSA-N Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 AWJGUZSYVIVZGP-YUMQZZPRSA-N 0.000 description 1
- 101150012695 Procr gene Proteins 0.000 description 1
- 239000012614 Q-Sepharose Substances 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 1
- JJKSSJVYOVRJMZ-FXQIFTODSA-N Ser-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)CN=C(N)N JJKSSJVYOVRJMZ-FXQIFTODSA-N 0.000 description 1
- LTFSLKWFMWZEBD-IMJSIDKUSA-N Ser-Asn Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O LTFSLKWFMWZEBD-IMJSIDKUSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 1
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- SBMNPABNWKXNBJ-BQBZGAKWSA-N Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO SBMNPABNWKXNBJ-BQBZGAKWSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- PPQRSMGDOHLTBE-UWVGGRQHSA-N Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PPQRSMGDOHLTBE-UWVGGRQHSA-N 0.000 description 1
- LDEBVRIURYMKQS-WISUUJSJSA-N Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO LDEBVRIURYMKQS-WISUUJSJSA-N 0.000 description 1
- BCAVNDNYOGTQMQ-AAEUAGOBSA-N Ser-Trp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O BCAVNDNYOGTQMQ-AAEUAGOBSA-N 0.000 description 1
- ZWSZBWAFDZRBNM-UBHSHLNASA-N Ser-Trp-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ZWSZBWAFDZRBNM-UBHSHLNASA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- 241000256251 Spodoptera frugiperda Species 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 1
- JMQUAZXYFAEOIH-XGEHTFHBSA-N Thr-Arg-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)O JMQUAZXYFAEOIH-XGEHTFHBSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- NLJKZUGAIIRWJN-LKXGYXEUSA-N Thr-Asp-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O NLJKZUGAIIRWJN-LKXGYXEUSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- WXVIGTAUZBUDPZ-DTLFHODZSA-N Thr-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 WXVIGTAUZBUDPZ-DTLFHODZSA-N 0.000 description 1
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 1
- LCCSEJSPBWKBNT-OSUNSFLBSA-N Thr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N LCCSEJSPBWKBNT-OSUNSFLBSA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- TZQWJCGVCIJDMU-HEIBUPTGSA-N Thr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N)O TZQWJCGVCIJDMU-HEIBUPTGSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- KAFKKRJQHOECGW-JCOFBHIZSA-N Thr-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(O)=O)=CNC2=C1 KAFKKRJQHOECGW-JCOFBHIZSA-N 0.000 description 1
- ZEJBJDHSQPOVJV-UAXMHLISSA-N Thr-Trp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZEJBJDHSQPOVJV-UAXMHLISSA-N 0.000 description 1
- JNKAYADBODLPMQ-HSHDSVGOSA-N Thr-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)=CNC2=C1 JNKAYADBODLPMQ-HSHDSVGOSA-N 0.000 description 1
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 1
- CKHWEVXPLJBEOZ-VQVTYTSYSA-N Thr-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O CKHWEVXPLJBEOZ-VQVTYTSYSA-N 0.000 description 1
- AXEJRUGTOJPZKG-XGEHTFHBSA-N Thr-Val-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N)O AXEJRUGTOJPZKG-XGEHTFHBSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- GRQCSEWEPIHLBI-JQWIXIFHSA-N Trp-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 GRQCSEWEPIHLBI-JQWIXIFHSA-N 0.000 description 1
- DEZKIRSBKKXUEV-NYVOZVTQSA-N Trp-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N DEZKIRSBKKXUEV-NYVOZVTQSA-N 0.000 description 1
- DVIIYMVCSUQOJG-QEJZJMRPSA-N Trp-Glu-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DVIIYMVCSUQOJG-QEJZJMRPSA-N 0.000 description 1
- UYKREHOKELZSPB-JTQLQIEISA-N Trp-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(O)=O)=CNC2=C1 UYKREHOKELZSPB-JTQLQIEISA-N 0.000 description 1
- HNIWONZFMIPCCT-SIXJUCDHSA-N Trp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N HNIWONZFMIPCCT-SIXJUCDHSA-N 0.000 description 1
- BONYBFXWMXBAND-GQGQLFGLSA-N Trp-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N BONYBFXWMXBAND-GQGQLFGLSA-N 0.000 description 1
- LYMVXFSTACVOLP-ZFWWWQNUSA-N Trp-Leu Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 LYMVXFSTACVOLP-ZFWWWQNUSA-N 0.000 description 1
- AIISTODACBDQLW-WDSOQIARSA-N Trp-Leu-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 AIISTODACBDQLW-WDSOQIARSA-N 0.000 description 1
- CCZXBOFIBYQLEV-IHPCNDPISA-N Trp-Leu-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O CCZXBOFIBYQLEV-IHPCNDPISA-N 0.000 description 1
- CFMGQWYCEJDTDG-XIRDDKMYSA-N Trp-Lys-Cys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(O)=O)=CNC2=C1 CFMGQWYCEJDTDG-XIRDDKMYSA-N 0.000 description 1
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 1
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 1
- JXNRXNCCROJZFB-RYUDHWBXSA-N Tyr-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JXNRXNCCROJZFB-RYUDHWBXSA-N 0.000 description 1
- YLHFIMLKNPJRGY-BVSLBCMMSA-N Tyr-Arg-Trp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YLHFIMLKNPJRGY-BVSLBCMMSA-N 0.000 description 1
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 1
- QZOSVNLXLSNHQK-UWVGGRQHSA-N Tyr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UWVGGRQHSA-N 0.000 description 1
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 1
- ZSXJENBJGRHKIG-UWVGGRQHSA-N Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UWVGGRQHSA-N 0.000 description 1
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 1
- MFEVVAXTBZELLL-GGVZMXCHSA-N Tyr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-GGVZMXCHSA-N 0.000 description 1
- KLQPIEVIKOQRAW-IZPVPAKOSA-N Tyr-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KLQPIEVIKOQRAW-IZPVPAKOSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- YQMILNREHKTFBS-IHRRRGAJSA-N Val-Phe-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YQMILNREHKTFBS-IHRRRGAJSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- UFCHCOKFAGOQSF-BQFCYCMXSA-N Val-Trp-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N UFCHCOKFAGOQSF-BQFCYCMXSA-N 0.000 description 1
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 1
- FKNHDDTXBWMZIR-GEMLJDPKSA-N acetic acid;(2s)-1-[(2r)-2-amino-3-sulfanylpropanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(O)=O.SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O FKNHDDTXBWMZIR-GEMLJDPKSA-N 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 230000004520 agglutination Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 1
- 229960003896 aminopterin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 150000008064 anhydrides Chemical class 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 238000011091 antibody purification Methods 0.000 description 1
- 230000005875 antibody response Effects 0.000 description 1
- 210000000628 antibody-producing cell Anatomy 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000013602 bacteriophage vector Substances 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000005018 casein Substances 0.000 description 1
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 1
- 235000021240 caseins Nutrition 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- ASCHNMXUWBEZDM-UHFFFAOYSA-N chloroperoxyl Inorganic materials [O]OCl ASCHNMXUWBEZDM-UHFFFAOYSA-N 0.000 description 1
- 239000003593 chromogenic compound Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 230000009137 competitive binding Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000003796 diagnosis of exclusion Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 125000000664 diazo group Chemical group [N-]=[N+]=[*] 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 239000012154 double-distilled water Substances 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009585 enzyme analysis Methods 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 229960000301 factor viii Drugs 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 108700010758 gag-pro Proteins 0.000 description 1
- 101150081889 gag-pro gene Proteins 0.000 description 1
- 230000005021 gait Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- STKYPAFSDFAEPH-LURJTMIESA-N glycylvaline Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- 208000005252 hepatitis A Diseases 0.000 description 1
- 230000001553 hepatotropic effect Effects 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000037189 immune system physiology Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000010874 in vitro model Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000007972 injectable composition Substances 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 239000011147 inorganic material Substances 0.000 description 1
- 239000002198 insoluble material Substances 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 235000018977 lysine Nutrition 0.000 description 1
- 150000002669 lysines Chemical class 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 230000005389 magnetism Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- KRZWEBVPFGCYMY-UHFFFAOYSA-M methylmercury(1+);hydroxide Chemical compound [OH-].[Hg+]C KRZWEBVPFGCYMY-UHFFFAOYSA-M 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 235000010446 mineral oil Nutrition 0.000 description 1
- 230000037230 mobility Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 230000036963 noncompetitive effect Effects 0.000 description 1
- 238000007826 nucleic acid assay Methods 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 229960001027 opium Drugs 0.000 description 1
- 239000011368 organic material Substances 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 239000011049 pearl Substances 0.000 description 1
- 108010091617 pentalysine Proteins 0.000 description 1
- 238000005191 phase separation Methods 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 239000000902 placebo Substances 0.000 description 1
- 229940068196 placebo Drugs 0.000 description 1
- 238000013492 plasmid preparation Methods 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920000656 polylysine Polymers 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000009589 serological test Methods 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 210000004989 spleen cell Anatomy 0.000 description 1
- 210000004988 splenocyte Anatomy 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 108091035539 telomere Proteins 0.000 description 1
- 102000055501 telomere Human genes 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- RTKIYNMVFMVABJ-UHFFFAOYSA-L thimerosal Chemical compound [Na+].CC[Hg]SC1=CC=CC=C1C([O-])=O RTKIYNMVFMVABJ-UHFFFAOYSA-L 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 229960004906 thiomersal Drugs 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010029384 tryptophyl-histidine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Landscapes
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Description
DESCRICÃO
A presente invenção refere-se ao isolamento e caracterização do agente virai responsável pela hepatite pós-transfusão não-A não-B (PT-NANBH) e em particular a polipéptidos virais de PT-NANBH, sequências de ADN que codificam esses polipeptídosviraes, vectores de expressão que contêm essas sequências de ADN, e células de hospedeiro transformadas por esses vectores de expressão. A presente invenção também se refere à utilização de uma sequência de ADN num ensaio de hibridização de ãcido nucleico para o diagnóstico de PT-NANBH. A presente invenção refere-se ainda à utilização em polipéptidos virais PT-NANBH ou an ticorpos moniclonais ou monoclonais contra esses polipépti1 dos num imunoensaio para o diagnóstico de PT-NANBH ou numa vacina para a sua preparação.
A hepatite não-A não-B (NANBH) é por definição um diagnóstico de exclusão e tem sido geralmente utilizada para descrever casos de infecção por hepatite virai em seres humanos que não são devidos aos vírus de hepatite A ou B. Na maior parte desses casos, a causa da infecção não foi identificada embora, no aspecto clínico e epidemiológico, se tenham pensados em vários agentes como sendo responsáveis por essa doença como descrito por Shih e col (Procr. Liver Dis. , 1986, 8, 433-452). Apenas nos Estados Unidos da América, até 10% das transfusões de sangue podem resultar em NANBH o que constitui um problema significativo. Mesmo para PT-NANBH podem existir vários agentes responsáveis pela infecção e ao longo dos anos têm sido feitas muitas reinvindicações para a identificação do agente, contudo nenhuma delas foi devidamente comprovada.
Pedido da Patente Europeia
88310922.5 propõe-se descrever o isolamento e caracterização do agente etiológico responsável pela PT-NANBH que é também referido no pedido como vírus da hepatite C (HCV) . Foi preparada uma biblioteca de cADN a partir do ãcido nucleico vi ral obtido de um chimpanzé infectado com PT-NANBH e que foi escrutinado utilizando anti-soro humano. Foram isolados e se quenciados vários clones positivos. 0 ácido nucleico e os dados da sequência de aminoácidos resultantes, que são descritos no pedido, representam aproximadamente 70% do genoma virai de lOkb e são derivados totalmente do seu terminal 3' correspondente à região de codificação não estrutural.
A presente invenção permitiu agora isolar e caracterizar os polipéptidos virais de PT-NANBH pela clonação e expressão das sequências de ADN que codificam esses polipéptidos virais. 0 ãcido nucleico e os dados de sequência de aminoácidos revelam com supresa que ambos têm diferenças consideráveis em relação aos dados correspondentes referidos no Pedido da Patente Europeia 88310922.5. No global estas diferenças representam até cerca de 20% do nível do ácido nucleico e cerca de 15% do nível de aminoácidos
mas algumas regiões das sequências mostram diferenças ainda maiores. 0 nível global da diferença é muito superior do que seria esperado para dois isolados do mesmo vírus mesmo tendo em conta os factores geográficos, e pensa-se que isto é devido a uma de duas razões possíveis.
Em primeiro lugar, os presentes inventores e os autores do Pedido de Patente Europeia acima referida utilizaram fontes diferentes para o ácido nucleico utilizado para a clonação de cADN. Em particular, o pedido de Patente Europeia descreve a utilização de plasma de chimpanzé como fonte para o material de partida de ácido nucleico virai, tendo sido feito a passagem do vírus através de um chimpanzé durante duas ocasiões. O PT-NANBH é obviamente uma doença humana e a passagem do vírus através de um hospedeiro estranho, mesmo se for parecido com o homem, deve resultar numa mutação elevada do ácido nucleico virai. Desta forma, os dados de sequência contidos no Pedido de Patente Europeia 88310922.5. podem não ser totalmente representativos para o verdadeiro agente virai responsável pelo PT-NANBH no homem. Pelo contrário, os presentes inventores utilizaram ácido nucleico virai a partir de uma fonte de plasma humano como material de partida para a clonação do cADN. Os dados de sequência assim obtidos correspondem mais provavelmente às sequências de ácido nucleico e aminoãcidos nativos de PT-NANBH.
Em segundo lugar, pode acontecer que o agente virai exista sob a forma de mais de um subtipo e os dados de sequência descritos no Pedido de Patente Europeia e os elucidados pelos presentes inventores correspondam a subtipos separados e diferentes do mesmo agente virai. Alternativamente, pode acontecer que o valor da diferença entre os dois conjuntos de dados de sequência seja devido a uma combinação destes dois factores.
A presente invenção proporciona um polipéptido virai PT-NANBH compreendendo um antigénio que possui uma sequência de amino ácidos que é pelo menos 90% ho móloga à sequência de aminoácidos apresentada em SEQ ID NO:
3,4,5,18,19,20,21 ou 22, ou é um seu fragmento antigénico.
A SEQ ID NO: 3,4,5,18,19,20,21 ou 22 representa a sequência de aminoácidos tal como deduzida da sequência de ácidos nucleicos. A sequência de amino ácidos é de preferência de pelo menos 95% ou mesmo 98% homóloga com a sequência de aminoácidos representada em SEQ IN NO: 3,4,5,18,19,20,21 ou 22. Opcionalmente, o antigénio pode ser fundido num polipéptido heterólogo.
Podem ser opcionalmente utilizados em conjunto dois ou mais antigénios, quer em combinação quer fundidos como um polipéptido único. A utilização de dois ou mais antigénios desta forma num ensaio de diagnóstico proporciona resultados mais fiáveis na utilização do ensaio no escrutínio do sangue para o vírus de PT-NANBH. É obtido, de preferência, um antigénio a partir da região de codificação estrutural (a extremidade 5') e um outro antigénio é obtido a partir da região de codificação não estrutural (a extremidade 3') . É particularmente preferido que os antigénios sejam fundidos em conjunto como polipéptido recombinante. Esta última técnica oferece várias vantagens em gue os antigénios individuais podem ser combinados numa proporção fixa, pré-determinada (geralmente equimolar) e apenas é necessário produzir um único polipéptido, que é purificado e caracterizado..
Um fragmento antigénico de um antigénio possuindo uma sequência de aminoácidos que é de pelo menos 90% homóloga ou é representada na SEQ IN NO:
3,4,5,18,19,20,21 ou 22 contém de preferência um mínimo de cinco, seis, sete, oito, nove ou dez, quinze, vinte, trinta, quarenta, ou cinquenta aminoácidos. Os locais antigénicos desses antigénios podem ser identificados utilizando procedimentos convencionais. Estes procedimentos para envolver a fragmentação do próprio polipéptido utilizando enzimas proteolíticas ou agentes químicos e em seguida determinando a capacidade de cada fragmento para se ligar a anticorpos ou provocar uma resposta imune quando inoculado num animal ou sistema de modelo in vitro adequado (Strohmaier et col. J. Gen. Virol.. 1982, 59, 205-306). Alternativamente, o ADN que codifica o polipéptido pode ser fragmentado por digestão com
enzimas de restrição ou outras técnicas bem conhecidas e em seguida introduzido num sistema de expressão para produzir fragmentos (opcionalmente fundidos num polipéptido habitualmente de origem bacteriana) . Os fragmentos resultantes são ensaiados da forma anteriormente descrita (Spence et col. J. Gen. Virol.. 1989, 70, 2843-51; Smith et col. Gene.
1984, 29.; 263-9). Outra técnica é sintetizar quimicamente uns fragmentos pequenos de péptidos (com o comprimento de 3-20 aminoácidos, convencionalrnente 6 amino ácidos de comprimento) que cobre a sequência completa do polipéptido de comprimento total com cada péptido sobrepondo-se ao péptido adjacente. (Esta sobreposição pode ser de 1 a 10 aminoácidos mas é idealmente de n-1 aminoácidos em que n é o comprimento do péptido; Geysen e col. Proc. Natl. Acad. Sei., 1984, 81, 3998-4002). Cada péptido é em seguida ensaiado da forma anteriormente descrita com a excepção de o péptido ser habitualmente acoplado em primeiro lugar a alguma molécula veí culo para facilitar a inducção de uma resposta imune. Finalmente, existem processos preditivos que envolvem a análise da sequência para determinar características particulares, por exemplo hidrofllicidade, que se pensa estar associada com locais imunológicos importantes (Hopp e Woods, Proc. Natl. Acad. Sei., 1981,78, 3824-8; Berzofsky, Science,
1985, 229, 932-40). Estas previsões podem ser em seguida en saiadas utilizando as técnicas de polipéptido ou péptido recombinantes acima descritas.
polipéptido virai é, de preferência, proporcionado numa forma pura, isto é com uma pureza superior a 90% ou mesmo 95%.
polipéptido virai PT-NANBH da pre sente invenção pode ser obtido utilizando um sintetizador de aminoácido, se ele for um antigénio que possua não mais do que cerca de trinta resíduos, ou por tecnologia de ADN recombinante .
A presente invenção também proporciona uma sequência de ADN que codifica um polipéptido virai PT-NANBH como aqui definido.
A sequência de ADN da presente invenção pode ser sintética ou cionada. A sequência de ADN é, de preferência, a representada em SEQ ID NO: 3,4,5,18,19,20,21 ou 22.
Para se obter um polipéptido virai PT-NANBH compreendendo antigénios múltiplos, é preferível fundir as sequências de codificação individuais num quadro de leitura aberto único. A fusão deve obviamente ser efectuada de forma a que não seja significativamente comprometida a actividade antigénica de cada antigénio pela sua potência relativa em relação a outro antigénio. Deve ter-se particularmente em consideração a natureza das sequências da ligação real entre os antigénios. Os processos pelos quais podem ser obtidos esses polipéptidos simples são bem conhecidos.
A presente invenção também proporciona um vector de expressão contendo uma sequência de ADN, tal como aqui definida, e que é susceptível de, num hospedeiro adequado, expressar a sequência de ADN para produzir um polipéptido virai PT-NANBH.
O vector de expressão contem geralmente elementos de controlo de ADN que efectuam a expressão da sequência de ADN num hospedeiro adequado. Estes elementos podem variar de acordo com o hospedeiro mas incluem habitual mente um promotor, um local de ligação de ribosomas, e locais de início e paragem de translacção, e um local de terminação de transcrição. Exemplos desses vectores incluem plasmídios e vírus. Os vectores de expressão da presente invenção englobam vectores extracromossómicos e vectores que são integrados no cromossoma das células do hospedeiro. Para utilização em E. coli o vector de expressão pode conter a sequência de ADN da presente invenção opcionalmente sob a forma de uma fusão ligada ao terminal 5'- ou 3'- da sequência de ADN que codifica, por exemplo, β-galactosidade ou para o terminal 3'- da sequência de ADN que codifica, por exemplo o gene trNE. Para utilização no sistema de baculovirus de insecto (AcNPV), a sequência de ADN é opcionalmente fundida à sequência de codificação de polihedrina.
A presente invenção também proporciona uma célula hospedeiro transformada com um vector de expressão tal como aqui definido .
Exemplos de células hospedeiro para utilização na presente invenção incluem células procarióticas e eucarióticas, como por exemplo células de bactérias, leveduros, mamíferos e insectos. Exemplos particulares dessas células são E. coli, S. cerevisiae, P. pastoris, células do ovário da Hamster chinesa e da ratinha, e Spodoptera frugiperda e Tricoplusia ni. A escolha da célula hospedeiro pode depender de vários factores, mas, se for importante a modificação prós-translacional do polipéptido virai de PT-NANBH, então é preferível utilizar um hospedeiro eucariótico.
A presente invenção também proporciona um processo para a preparação de polipéptido virai PT-NANBH que compreende clonar-se ou sintetizar-se uma sequência de ADN codificando um polipéptido virai PT-NANBH, tal como aqui definido, inserir-se uma sequência de ADN num vector de expressão tal que seja susceptível de ser expresso num hospedeiro adequado, transformar-se uma célula hospedeiro com um vector de expressão, cultivar-se a célula do hospedeiro transformada, e isolar-se o polipéptido virai.
A clonação da sequência de ADN pode ser efectuada utilizando procedimentos convencionais conhecidos. Contudo, é particularmente vantajoso nesses procedimentos utilizar os dados de sequência aqui apresentados de forma a facilitar a identificação e isolamento das sequências de ADN clonadas pretendidas. 0 ARN é de preferência iso lado por agregação do virus do plasma de seres humanos infectados identificados por implicação na transmissão de PT-NANBH. 0 ARN isolado é transcrito inversamente no cADN utilizando uma primagem aleatória ou com oligo-dT. Opcionalmente, o ARN pode ser submetido a uma fase de pré-tratamento para remover qualquer estrutura secundária que possa interferir com a síntese de cADN, por exemplo, por aquecimento ou reacção com hidróxido de metil mercúrico. 0 cADN é habitualmente modificado por adição de ligantes seguido da digestão
com uma enzima de restrição. Ele em seguida inserido num vector de clonação, como por exemplo pBR322 ou um seu derivado ou nos vectores lambda gtlO e gtll (Huynh et col., DNA Cloninq, 1985, Vol 1: A Praticai Approach, Oxford, IRC Press) embalado em viriões como adequado, e as moléculas de ADN recombinantes resultantes utilizadas para transformar a
E.coli e assim produzir a biblioteca pretendida.
A biblioteca pode ser escrutinada utilizando uma técnica de escretinio convencional. Se a biblioteca for uma biblioteca de expressão, ela pode ser escrutinada utilizando um processo imunológico com antisoros obtidos da mesma fonte de plasma do material de partida de ARN e também com antisoros de fontes humanas adicionais que se pensa serem positivos a anticorpos contra PT-NANBH. Dado que os antisoros humanos contêm habitualmente anticorpos contra a E. coli que podem dar origem a um ruído de fundo elevado durante o escrutínio, é preferível tratar em primeiro lugar os antisoros com um lisado de E.coli não transformado de forma a remover todos esses anticorpos. É vantajoso utilizar um controlo negativo utilizando antisoros de dadores humanos credenciados isto é, de dadores humanos que tenham sido repetidamente ensaiados e que se verificou terem anticorpos contra a hepatite virai. Uma técnica de escrutínio alternativa seria utilizar como sondas de hibridização um ou mais oligonucleótidos marcados. A utilização de oligonucleótidos dos escrutínio de uma biblioteca de cADN é geralmente mais simples e mais fiável do que o escrutínio com antisoros. Os oligonucleótidos são preferivelmente sintetizados utilizando a informação das sequências de ADN aqui referidas. Podem ser efectuados um ou mais lotes adicionais de escrutínio de um tipo ou do outro, para caracterizar e identificar os clones positivos.
Tendo identificado um primeiro clone positivo, a biblioteca pode ser reescrutinada para a determinação de clones positivos adicionais utilizando o primeiro clone como sonda de hibridização. Alternativamente ou adicionalmente, podem ser preparadas outras bibliotecas e estas podem ser escrutinadas utilizando imunoescrutínios ou
sondas de hibridização. Desta forma, podem ser obtidas tras sequências de ADN.
Alternativamente, a sequência de ADN que codifica o polipéptido virai de PT-NANBH pode ser sintetizada utilizando procedimentos convencionais e isto pode ser preferido à clonagem do ADN em alguns casos (Gait, Oliqonucleotide Svnthesis: A Practical Approach, 1984, Oxford, IRL Press).
A sequência de ADN pretendida assim cionada ou sintetizada, pode ser inserida num vector de expressão utilizando técnicas conhecidas e convencionais. 0 vector de expressão é normalmente cortado utilizando enzimas de restrição e a sequência de ADN é inserida utilizando uma ligação de extremidade cega ou extremidade em lança. 0 corte é habitualmente feito no bocal de restrição numa posição conveniente no vector de expressão tal que, logo que inserido, a sequência de ADN esteja sob o controlo dos elementos funcionais de ADN que efectuam a sua expressão.
A transformação de uma célula hospedeiro pode ser efectuada utilizando técnicas convencionais. É habitualmente utilizado um marcador fenotípico para distinguir entre os transformantes que foram absorvidos com sucesso do vector de espressão e os que não foram.A cultura da célula hospedeiro transformada e o isolamento do polipéptido virai PT-NANBH pode também ser efectuada utilizando técnicas convencionais.
Os anticorpos específicos para um polipéptido virai PT-NANBH da presente invenção podem ser cultivados utilizando o polipéptido. 0 anticorpo pode ser policlonal ou monoclonal. 0 anticorpo pode ser utilizado ensaiando lotes de polipéptido virai PT-NANBH; purificação de um polipéptido virai PT-NANBH ou um lisado virai; mapeamento de epitopo; quando marcado, como conjugado num ensaio de tipo competitivo, para detecção de anticorpos; e nos ensaios de detecção de antigénios.
anticorpo policlonal contra um polipéptido virai PT-NANBH da presente invenção pode ser obtido por injecção de um polipéptido virai PT-NANBH, opcio ou9
nalmente acoplado a um veículo para promover uma resposta imune, num mamífero hospedeiro, como por exemplo ratinho, rato, ovelha ou coelho, e recuperando o anticorpo assim produzido. 0 polipéptido virai PT-NANBH é geralmente administrado sob a forma de uma formulação injectável em que o polipéptido é misturado com um diluente fisiologicamente aceitável. Podem ser incluídos na formulação adjuvantes como por exemplo o adjuvante completo de Freund (FCA) ou o adjuvante incompleto de Freund (FIA). A formulação é normalmente injectada num hospedeiro durante um período adequado de tempo, sendo tomadas amostras do plasma a intervalos de tempo adequados para ensaio para anticorpo virai anti- PT-NANBH. Quando é obtido um valor adequado de actividade, o hospedeiro é sangrado. O anticorpo é em seguida extraído e purificado do plasma sanguíneo utilizando procedimentos convencionais, por exemplo, por cromatografia de proteína A ou de permuta iónica.
Pode ser obtido um anticorpo monoclonal contra um polipéptido virai PT-NANBH da presente invenção fundindo células de uma linha de células imortalizantes cujas células produzem anticorpo contra o polipéptido virai, e cultivando a linha de células imortalizadas fundidas. Tipicamente, é inoculado um hospedeiro mamífero não humano, como por exemplo um ratinho ou um rato, com o polipéptido virai. Após ter passado um período de tempo suficiente para o hospedeiro criar uma resposta imune, são removidas as células que produzem anticorpos, como por exemplo esplenócitos. As células de uma linha de células imortalizantes, como por exemplo a linha de células do mieloma do ratinho ou do rato, são fundidas com as células produtoras de anticorpos e as fusões resultantes são escrutinadas para identificar uma linha de células, como por exemplo um hibridoma, que segrega o anticorpo monoclonal pretendido. A linha de células fundida pode ser cultivada e o anticorpo monoclonal purificado do meio de cultura de uma forma semelhante à purificação de anticorpo policlonal.
Os ensaios de diagnóstico com base na presente invenção podem ser utilizados para determinar a presença ou ausência de infecção PT-NANBH. Eles podem também ser utilizados para monitorar o tratamento dessa infecção, por exemplo em terapia com interferão. Num ensaio para o diagnóstico da infecção virai, existem três técnicas basicamente distintas que podem ser adotadas envolvendo a detecção do ácido nucleico virai, antigénio virai ou anticorpo virai. 0 ácido nucleico virai é geralmente encarado como o melhor indicador para a presença do próprio virus, e poderá identificar materiais que são susceptíveis de ser infecciosos. Contudo, a detecção do ácido nucleico não é habitualmente tão fácil como a detecção de antigénios ou anticorpos dado que o nível do alvo pode ser muito baixo. É utilizado o antigénio virai como marcador para a presença de vírus e como indicador da infecciosidade. Dependendo do vírus, a quantidade de antigénio presente numa amostra pode ser muito baixa e difícil de detectar. A detecção de anticorpos é relativamente fácil dado que, com efeito, o sistema imune do hospedeiro amplifica a resposta a uma infecção produzindo grandes quantidades de anticorpos circulantes. A natureza da resposta de anticorpos pode muitas vezes ser clinicamente útil, por exemplo, os anticorpos da classe IgM em vez de IgG são indicadores de uma infeccão recente, ou a resposta a um antigénio virai particular poder ser associado com o desaparecimento do vírus. Assim a técnica exacta adoptada para o diagnóstico de uma infecção virai depende das circunstâncias particulares e da informação conhecida. No caso de PT-NANBH, um ensaio de diagnóstico pode englobar qualquer destas três técnicas.
Num ensaio para o diagnóstico de PT-NANBH envolvendo a detecção de ãcido nucleico virai, o processo pode compreender hibridizar-se o ARN virai presente numa amostra de ensaio, ou cADN sintetizado desse ARN virai, com uma sequência de ADN correspondente à sequência de nucleótidos de SEQ ID NO: 3,4,5,18,19,20,21 ou 22 e escrutinando os híbridos de ãcido nucleico resultantes para identificar qualquer ácido nucleico virai de PT-NANBH. A aplicação deste processo é habitualmente restrita a uma amos tra de ensaio de um tecido adequado, como por exemplo uma
biópsia de fígado, em que o ARN virai está provavelmente pre sente a um teor elevado. A sequência de ADN correspondente à sequência de nucleótidos de SEQ ID NO: 3,4,5,18,19,20,21 ou 22 poder tomar a forma de um oligonucleótido ou de uma sequência de cADN opcionalmente contida dentro de um plasmídio. 0 escrutínio dos híbridos de ãcido nucleico é preferivelmente efectuado utilizando uma sequência de ADN marcado. Pode ser efectuado um ou mais lotes adicionais de escrutínio de um tipo ou de outro para caracterizar ainda mais os híbridos e identificar assim qualquer ácido nucleico virai PT-NANBH. As fases de hibridização e escrutínio são efectuadas de acordo com os procedimentos bem conhecidos.
Dada a aplicação limitada deste processo no ensaio do ácido nucleico virai, um processo preferido e mais conveniente compreende efectuar-se a síntese do cADN de ARN virai presente numa amostra de ensaio, amplificar-se uma sequência de ADN pré-escolhida correspondente a uma subsequência da sequência de nucleótidos de SEQ ID NO: 3,4,5,18,19,20,21 ou 22 e identificar-se a sequência de ADN pré-escolhida. A amostra de ensaio pode ser de qualquer tecido ou fluído fisiológico adequado e é preferivelmente concentrada para qualquer ARN virai presente. Exemplos de um tecido adequado incluem uma biópsia de fígado. Exemplos de um fluído fisiológico adequado incluem a urina, plasma, sangue, soro, sémen, lágrimas, saliva ou fluí do cebrebroespinal. Exemplos preferidos são o soro e o plasma.
A síntese do cADN é geralmente efeç tuada por transcrição inversa primada utilizando primários aleatórios definidos ou oligo-dT. 0 primário é, com vantagem, um oligonucleótido correspondente à sequência de nucleótidos de SEQ ID NO: 3,4,5,18,19,20,21 ou 22 e concebidos para enriquecer em cADN contendo a sequência préescolhida.
A amplificação da sequência de ADN pré-escolhida é preferivelmente efectuada utilizado a técnica da reacção em cadeia com polimerase (PCR) (Saiki et col, Science, 1985, 230. 1350-4). Nesta técnica, é utilizado
um par de primários de oligonucleótido um dos quais corresponde a uma parte da sequência de nucleótidos de SEQ ID NO:
3,4,5,18,19,20,21 ou 22 e o outro está localizado no lado 3' do primeiro e correspondente a uma parte da sequência complementar, definindo o par entre eles a sequência de ADN pré-escolhida. Os oligonucleótidos são habitualmente de pelo menos de 15, optimamente 20 a 26, base de comprimento e embora possam ser toleradas algumas incoerências variando as condições de reacção, a extremidade 3' dos oligonucleótidos deve ser perfeitamente complementar de forma a efectuar a primagem de forma eficaz. A distância entre as extremidades 3' dos oligonucleótidos podem ser de cerca de 100 a cerca de 2000 bases. Convenientemente, um dos pares de oligonucleótidos que é utilizado nesta técnica é também utilizado para efectuar a primagem da síntese de cADN. A própria técnica de PCR é efectuada no cADN numa forma de espiral única utilizando uma enzima, como por exemplo Taq polimerase e em excesso dos primários de oligonucleótidos em 20-40 ciclos de acordo com os protocolos publicados (Saiki e col, Science. 1988, 239, 487-491).
Como refinação técnica, podem ser efectuados vários lotes de amplificação, sendo cada lote primado por um par diferente de oligonucleótidos. Assim, após o primeiro lote de amplificação, pode ser utilizado um par interno de oligonucleótidos que define uma sequência de ADN mais pequena (por exemplo de 50 a 500 bases de comprimento) para um segundo lote de amplificação. Neste refinamento um pouco mais fiável,referido como PCR em Cadeia é obviamente a sequência de ADN final amplificada que constitui a sequência pré-seleccionada. (Kemp e col..Proc. Natl. Acad. Sei. . 1989, 86(7) , 2423-7 e Mullis e col, Methods in Enzvmolocrv 1987, 155, 335-350).
A identificação da sequência de ADN pré-selecionada pode ser efectuada por análise dos produtos de PCR num gel de agarose. A presença de uma banda no peso molecular calculado para a sequência pré-seleccionada é um indicador positivo da presença do ácido nucleico virai na amostra de ensaio. Os processos alternativos de identifica13
ção incluem aqueles que se baseiam no ensaio de revelação de Southern, revelação por pontos, restricção de oligómeros e sequenciação de ADN.
A presente invenção também proporciona um dispositivo de ensaio para a detecção do ácido nucleico virai de PT-NANBH, que compreende
i) um par de primários de oligonucleótidos um dos quais corresponde a uma parte da sequência de nucleótidos de SEQ IN NO: 3,4,5,18,19,20,21 ou 22 e o outro está localizado ao lado 3' do primeiro e corresponde a uma parte da sequência complementar definindo o par entre eles uma sequência de ADN pré-seleccionada;
ii) uma enzima de transcriptase inversa para a síntese de cADN a partir do ARN da amostra de ensaio a montagem do primário correspondente à sequência de nucleótidos complementares de SEQ ID NO: 3,4,5,18,19,20,21 ou 22;
iii) uma enzima susceptível de amplificar a sequência de ADN pré-seleccionada; e opcionalmente;
iv) soluções de lavagem e tampões de reacção.
O dispositivo de ensaio também contêm, com vantagem, uma amostra de controlo positiva para facilitar a identificação do ãcido nucleico virai.
As caracteristicas dos primários e as enzimas são preferivelmente como acima descrito em ligação com a técnica de PCR.
Num ensaio para o diagnóstico de PT-NANBH envolvendo a detecção de um antigénio virai ou de um anticorpo virai, o processo pode compreender fazer-se con tactar uma amostra de.ensaio com um polipéptido virai de PT-NANBH da presente invenção, ou um anticorpo policlonal ou monoclonal contra o polipéptido, e determinar-se se existe qualquer ligação de anticorpos-antigénio contido dentro da amostra de ensaio. Para este fim, pode proporcionar-se um dispositivo de ensaio compreendendo um polipéptido virai de PT-NANBH, tal como aqui definido, ou um anticorpo policlonal ou monoclonal para ele, e um sistema para determinar se exis
te qualquer ligação com o anticorpo ou antigénio contido res pectivamente na amostra de ensaio. A amostra de ensaio pode ser tomada de qualquer dos tecidos e de fluídos fisiológicos adequados acima mencionados para a detecção de ãcido nucleico virai. Se for obtido um fluído fisiológico, ele pode ser opcionalmente concentrado para um antigénio virai ou anticorpo presente.
Podem ser utilizados vários ensaios. 0 polipéptido virai de PT-NANBH pode ser utilizado para capturar selectivamente anticorpos contra. PT-NANBH de uma solução, para marcar selectivamente o anticorpo já capturado, ou para capturar e marcar o anticorpo. Além disso, o polipéptido virai pode ser utilizado em vários formatos de ensaio homogéneos em que o anticorpo reactivo com o antigénio é dectado em soluções sem separação de fases.
Os tipos de ensaio em que é utilizado o polipéptido virai PT-NANBH para capturar anticorpos da solução envolve a imobilização do polipéptido numa superfície sólida. Esta superfície deve ser capaz de ser lavada. Exemplos de superfícies adequadas incluem polímeros de vários tipos (moldados em furos de microtitulação; pérolas; palitos de mergulhar de vários tipos; pontas de aspiração; eléctrodos; e dispositivos ópticos), partículas (por exemplo látex; glóbulos vermelhos de sangue estabilizados; células de bactérias ou de fungos; esporos; sóis contendo ouro ou outros metais; e colóides proteicos) com o tamanho habitual de partícula de 0,02 a 5 micrometros, membranas(por exemplo de nitrocelulose; papel; acetato de celulose; e membranas de elevada porosidade/área superficial de um material orgânico ou inorgânico).
A fixação do polipéptido virai PT-NANBH à superfície pode ser por adsorção passiva de uma solução de composição óptima que pode incluir agentes tensioactivos, solventes, sais e/ou caotropos; ou por ligação quimica activa. A ligação activa pode ser realizada por vários grupos funcionais reactivos ou activãveis que podem ser expostos à superfície (por exemplo agentes de condensação; ésteres de ácidos activos, halogenetos e anidridos; grupos ami
no, hidroxilo, ou carboxilo, grupos sulfidrilo; grupos carbonilo; grupos diazo; ou grupos insaturados). A ligação activa pode, opcionalmente, ser feita através de uma proteína (ela própria fixada à superfície passivamente ou através de ligação activa), como por exemplo albumina ou caseína, à qual o polipéptido virai pode ser quimicamente ligado por qualquer um de entre vários processos. A utilização de uma proteína desta forma pode conferir vantagens devida ao ponto isoeléctrico, carga, hidrofilicidade ou outra propriedade físico-química. O polipéptido virai pode também ser fixado à superfície (geralmente mas não necessariamente uma membrana) após separação electroforética de uma mistura reac cional, como por exemplo precipitado imune.
Após contacto (reacção) a superfície que contém o polipéptido virai PT-NANBH com uma amostra de ensaio, permitindo algum tempo de reacção, e, quando necessário, remoção do excesso da amostra por qualquer um de vários processos (como, por exemplo lavagem, centrifugação, filtração magnetismo ou acção capilar) o anticorpo capturado é detectado por qualquer processo que dê um sinal detectável. Por exemplo, isto pode ser conseguido utilizando uma molécula ou partícula marcada como acima descrito que reagirá com o anticorpo capturado (por exemplo proteína A ou proteína G e produtos semelhantes; do subtipo anti-espécie ou anti-imunoglobulina; factor reumatóide; ou anticorpo ao antigénio, utilizado numa forma competitiva ou bloqueante), ou qualquer molécula contendo um epitopo contido no polipéptido.
sinal detectável pode ser óptico ou radioactivo ou físico-químico e pode ser proporcionado directamente por marcação da molécula ou partícula com, por exemplo, um corante, radiomarcação, espécie electroactiva, espécie magneticamente ressonante ou fluorofore ou indirectamente por marcação da molécula ou partícula com uma enzima ela própria capaz de dar origem a uma alteração mensurável de qualquer tipo. Alternativamente o sinal detectável pode ser obtido utilizando, por exemplo, aglutinação, ou através
de um efeito de difracção ou birrefringente se a superfície estiver na forma de partículas.
Os ensaios que se utiliza o próprio polipéptido virai PT-NANBH para marcar un anticorpo já capturado requer alguma forma de marcação do antigénio que lhe permitirá ser detectado. A marcação pode ser directa por ligação química ou passiva por exemplo uma marcação radioactiva, espécies ressonantes magnéticas, partículas de enzima de marcação ao polipéptido; ou indirectamente por fixação de qualquer forma de marcação a uma molécula que reagirá ela própria com o polipéptido. A química de ligação de uma marcação ao polipéptido virai PT-NANBH pode ser directamente feita através de um radical já presente no polipéptido , como por exemplo um grupo amino, ou através de um radical intermédio como por exemplo um grupo maleimido. A captura do anticorpo pode ser efectuada em qualquer das superfícies jã mencionadas por qualquer reagente incluindo adsorção passiva ou activada que resultará na ligação dos anticorpos ou complexos imunes específicos. Em particular, a captura do anticorpo pode ser feita por anti-espécies ou sub-tipo anti-imunoglobulina, por factor reumatóide, proteínas A, G e pro dutos semelhantes, ou por qualquer molécula que contenha um epitopo dentro do polipéptido.
polipéptido PT-NANBH marcado pode ser utilizado numa forma de ligação competitiva em que a sua ligação a qualquer molécula específica em qualquer das superfícies acima exemplificadas é bloqueada por antigénio na amostra. Alternativamente, ele pode ser utilizado numa forma não competitiva em que o antigénio na amostra é especificamente ou não especificamente ligado a qualquer das superfícies acima referidas e está também ligado a uma molécula específica bi- ou polivalente (por exemplo um anticorpo) sendo as valências restantes utilizadas para capturar o polipéptido marcado.
polipéptido virai PT-NANBH e um anticorpo são, com frequência em ensaios homogéneos, separadamente marcados de forma a que quando o anticorpo reage com o polipéptido virai em solução livre, as duas marcações in17
teractuam para permitir, por exemplo, a transferência não radiativa de energia capturada por uma marcação, para outra marcação, com detecção adequada da segunda marcação, excitada ou primeira marcação estabilizada (por exemplo por fluorimetria, ressonância magnética ou medida de enzima). A adição de um polipéptido ou anticorpo virai resulta na restrição do par marcado e assim num nível diferente de sinal no detector.
Um formato de ensaio adequado para detectar anticorpo PT-NANBH é o formato do imunoensaio directo de enzima em sanduíche (EIA). Faz-se o revestimento de um polipéptido virai PT-NANBH em furos de microtitulação. São adicionados simultaneamente uma amostra de ensaio e um polipéptido virai PT-NANBH a que a enzima é acoplada. Qualquer anticorpo PT-NANBH presente na amostra de ensaio ligase ao polipéptido virai que reveste o furo e ao polipéptido virai acoplado com a enzima. Tipicamente, é utilizado o mesmo polipéptido virai em ambos os lados da sanduíche. Após lavagem, é detectada a enzima ligada utilizando um substrato específico que envolve uma alteração de cor.
Um dispositivo de ensaio para utilização EIA compreende:
(1) um polipéptido virai PT-NANBH marcado com uma en zima;
(2) um substrato para a enzima;
(3) um sistema para proporcionar uma superfície em que o polipéptido virai PT-NANBH é imobilizado; e (4) opcionalmente, soluções de lavagem e/ou tampões.
Os polipéptidos virais da presente invenção podem ser incorporados numa formulação para vacinas para induzir a imunidade contra PT-NANBH no homem. Para este fim o polipéptido virai pode ser apresentado em associação com um veículo farmaceuticamente aceitável.
Para utilização numa formulação para vacinas, o polipéptido virai pode opcionalmente ser a18
presentado com parte de uma partícula de fusão do núcleo de hepatite B, como descrito por Clarke e col. (Nature, 1987, 330, 381-384) , ou um polímero com base em polilisina, como descrito em Tam (PNAS, 1988, 85, 5409-5413). Alternativamente, o polipéptido virai pode opcionalmente ser fixado a uma estrutura em partículas, como por exemplo liposomas ou ISCOMS.
Os veículos farmaceuticamente acei tãveis incluem sistemas líquidos adequados para utilização como veículos para introduzir o polipéptido virai num paciente. Um exemplo desse meio líquido é a solução salina. 0 próprio polipéptido virai pode ser dissolvido ou suspenso como sólido no veículo.
A formulação para vacinas pode também conter um adjuvante para estimular a resposta imune e potenciar assim o efeito da vacina. Exemplos de adjuvantes incluem o hidróxido de alumínio e o fosfato de alúminio.
A formulação para vacinas pode conter uma concentração final de polipéptido virai na gama de 0,01 a 5 mg/ml, de preferência 0,03 a 2 mg/ml. A formulação para vacinas pode ser incorporada num recipiente esterilizado, que é em seguida vedado e armazenado a baixa temperatura, por exemplo 4^0, ou pode ser liofilizado.
Para induzir a imunidade no homem ao PT-NANBH, podem ser administradas uma ou mais doses da formulação para vacinas. Cada dose pode ser de 0,1 a 2 ml, de preferência 0,2 a 1 ml. Um método para induzir a imunidade ao PT-NANBH no homem, compreende a administração de uma quantidade eficaz de uma formulação para vacinas, tal como atrás descrita. A presente invenção também proporciona a utilização de um polipéptido virai PT-NANBH para a preparação de uma vacina para utilização na indução de imunidade ao PT-NANBH no homem.
As vacinas da presente invenção podem ser administradas por qualquer processo conveniente para administração de vacinas incluindo a via oral e injecção parentérica (por exemplo intravenosa, subcutânea ou intramus19
cular). 0 tratamento pode consistir numa dose única de vacina ou várias doses durante um certo periodo de tempo.
Foram depositadas as seguintes estirpes E. coli no National Collection of Type Cultures (NCTC), Central Public Health Laboratory, 61, Colindale Avenue, Londres NW9 5HT nas datas indicadas:
i) E. coli TG1 transformada por pDX113 (WD001); Depósito No. NCTC 12369; 7 Dezembro de 1989.
ii) E. coli TG1 transformada por pDX128 (WD002); Depósito No. NCTC 12382; 23 Fevereiro de 1990.
iii) E. coli TG1 transformada por pl36/155 (WD003); Depósi to No. NCTC 12428; 28 Novembro de 1990.
iv) E. coli TG1 transformada por pl56/92 (WD004); Depósi to No. NCTC 12429; 28 Novembro de 1990.
ν) E. coli TG1 transformada por pl29/164 (WD005); Depósi to No. NCTC 12430; 28 Novembro de 1990.
vi) E. coli TGl transformada por pDX136 (WD006); Depósi to No. NCTC 12431; 28 Novembro de 1990.
Nas Figuras, a Figura 1 mostra uma representação da produção de pDX122 descrita no Exemplo 7, a Figura 2 mostra uma representação da produção de duas sequências alternativas fundidas descritas no Exemplo 17, e a Figura 3 mostra mapas de restrição de SEQ ID NO 21 e 22.
Na Listagem Sequencial, estão listadas as SEQ ID NO: 1 a 25 para as quais são feitas referências na descrição e reivindicações.
Os Exemplos a seguir apresentados servem para ilustrar a invenção.
EXEMPLO 1,
Síntese de cAND
Plasma combinado (160 ml) de dois indivíduos (referidos por A e L) conhecidos como tendo transmitido NANBH por transfusões foi diluído (1:2,5) com solução salina tamponada de fosfato (PBS) e em seguida centrifugou-se a 190 000 g (por exemplo 30 000 rpm num
rótor MSE 8x50) durante 5 horas a 4sc. Reteve-se o sobrenadante com uma fonte de anticorpos específicos para investigações subsequentes de bibliotecas de cAND. Suspendeu-se o agregado em 2 ml de 20 mM de tris-cloridrato, 2 mM de EDTA, 3% de SDS, NaCl 0,2 mM (2xPK) extraiu-se 3 vezes com igual volume de fenol, 3 vezes com clorofórmio, uma vez com éter, e em seguida precipitou-se com 2,5 volumes de etánol a -202C. Ressuspendeu-se o precipitado em 10 μΐ de 10 mM de tris-cloridrato, 1 mM de EDTA a pH 8,0 (TE). Utilizou-se o ácido nucleico como um molde num equipamento de síntese de ADN (Amersham International plc, Amersham, U.K.) com oligo-dT e hexanucleótidos de primagem aleatória. As condições de reacção foram as recomendadas pelo fornecedor do equipamento. Especificamente, utilizou-se o ácido nucleico para uma reacção de síntese da primeira banda que foi marcada com [eí-32p]dCTP (Amersham; actividade específica de 3000 Ci/mmol) num volume final de 20 μΐ e incubou-se a 42sc durante 1 hora. A reacção completa da primeira banda foi em seguida utilizada para a reacção de síntese da segunda banda, contendo E. coli RNaseH (0,8 U) e ADN polimerase I (23 U) num volume final de 100 μΐ, incubou-se a 12sc durante 60 minutos e em seguida a 22sc durante 60 minutos. A mistura reaccional completa foi em seguida incubada a 70QC durante 10 minutos, colocada em gelo, adicionou-se 1 U de polimerase T4 ADN em seguida incubou-se a 37sc durante 10 minutos. Parou-se a reacção pela adição de 5 μΐ de EDTA 0,2 M a pH 8.
Removeram-se os nucleótidos não incorporados fazendo passar a mistura reaccional por uma coluna NICK (Phar macia Ltd., Milton Keynes, Reino Unido). Extraiu-se em seguida o cADN duas vezes com fenol, três vezes com clorofórmio, uma vez com éter e em seguida adicionaram-se 20 μ% de dextrano antes da precipitação com 2,5 volumes de etánol a 100%.
EXEMPLO 2.
Produção de Bibliotecas de Expressão
Ressuspendeu-se o agregado seco de cADN em 5 μΐ de TE estéril e em seguida incubou-se com 500 ng de ligantes de EcoRI (Pharmacia; GGAATTCC fosforilado) e 0,5 U de T4 ADN ligase (New England BioLabs, Beverley, MA Estados Unidos da América) num volume final de 10 μΐ contendo 20 mM de Tris-HCl pH 7,5, 10 mM de MgCl2, 10 mM de DTT, 1 mM de ATP durante 3 horas a 15 2C. Neutralizou-se a ligase por aquecimento a 65 2 C durante 10 minutos e digeriu-se o cADN com 180 U de EcoRI (BCL, Lewes, Reino Unido) num volume final de 100 μΐ a 372C durante 1 hora. Adicionou-se EDTA para uma con centração final de 10 mM e deitou-se a mistura reaccional numa coluna AcA34 (LKB). Recolheram-se as fraç ções (50 μΐ) e contaram-se. Combinou-se o pico de CADN num volume eliminado (980 cpm), extraiu-se duas vezes com fenol, três vezes com clorofórmio, uma vez com éter e em seguida precipitou-se com etanol. Ressuspendeu-se o ds cADN em 5 μΐ de TE e ligou-se nos braços lambda gtll, EcoRI (Gibco, Paisley, Escócia) numa mistura reaccional de 10 μΐ contendo 0,5 U de T4 ADN ligase, 66 mM de tris-cloridrato, 10 mM MgCl2, 15 mM de DTT pH 7,6 a 152C durante a noite. Após neutralização da ligase por aquecimento para 65sc durante 10 minutos, adicionaram-se 5 μΐ da mistura reaccional a uma mistura reaccional de embalagem Amersham e incubou-se a 222c durante 2 horas. Titulou-se o material embalado em E. coli estirpe Y1090 (Huynh e col. 1985) e contendo um total de 2,6 χ 104 recombinantes.
Prepararam-se as células de placagem (Y1090) por inoculação de 10 ml de caldo-L com uma colónia simples de uma placa de ágar e agitou-se durante a noite a 37SC. No dia seguinte diluiram-se 0,5 ml da cultura da noite com 10 ml de caldo-L fresco e adicionaram-se 0,1 ml de MgSO4 1 M e adicionaram-se 0,1 ml de maltose a 20% (p/v). Agitou-se a cultura durante 2 horas a 372C, fez-se a recolha de bactéria por centrifu22
gação a 5000 g durante 10 minutos e ressuspendeu-se em 5 ml de MgSO4 10 mM para produzir as células de placagem para guardar. Misturou-se uma porção (1 μΐ) do material embalado com 0,2 ml de células de placagem, incubou-se a 37SC durante 20 minutos antes de se adicionarem 3 ml de agar superior e deitou-se a mistura toda numa placa de L-agar de 90 mm. Após incubação durante a noite a 37sc contaram-se as placas e determinou-se o número total de fagos recombinantes. 0 material restante embalado (500 μ1) foi guardado a 4^c.
Prepararam-se bibliotecas adicionais de maneira substancialmente semelhante.
EXEMPLO 3.
Escrutínio de bibliotecas de Expressão
A biblioteca inicial descrita no Exemplo 2 foi placada em E. coli estirpe Y1090 a uma densidade de cerca de 5 χ 103 pfu- por placa de 140 mm e cultivou-se a 37ec durante 2 horas até as placas se tornarem visíveis. Foram deixados em contacto filtros de nitrocelulose estéril que tinham sido impregnados com IPTG (isopropiltiogalactósido) com a placa durante 3 horas e em seguida eles foram removidos. Bloquearam-se em primeiro lugar os filtros por incubação com solução de bloqueamento [3% (p/v) BSA/TBS-Tween (10 mM de
Tris-HCI pH 8, 150 mM de NaCl, 0,05% (v/v) de Tween 20) contendo bronidox a 0,05%] (20 ml/filtro) e em seguida transferiu-se para um tampão de ligação [1% (p/v) de BSA/TBS-Tween contendo bronidox a 0,05%] con tendo anticorpos purificados (por cromatografia de permuta iónica) a partir de plama combinado de A e L (20 Mg/ml). Após incubação à temperatura ambiente durante 2 horas lavaram-se os filtros por três vezes com TBS-Tween e em seguida incubou-se em tampão de ligação contendo anti-humano de ovelha biotinilado (1:250). Após 1 hora à temperatura ambiente lavaramse os filtros por três vezes com TBS/Tween e em seguida incubou-se em tampão de ligação contendo com23
plexo de estreptavidina/peroxidase (1:100). Desenvolveu-se o sinal com DAB. Os sinais positivos apareceram como placas (coloridas) .
De um total de 2,6 χ 104 placas escrutinadas, obtiveram-se 8 positivas no primeiro lote de escrutínio. Utilizando os filtros como molde, foram tomadas as regiões das placas originais correspondentes a estes sinais positivos utilizando uma pipeta de Pasteur esterilizada. Os tampões de agar foram suspensos em 0,1 ml de tampão SM e o fago foi deixado difundir. O título do fago de cada tampão foi determinado em E. coli estirpe Y1090. O fogo guardado de cada tampão foi em seguida reescrutinado da forma anteriormente referida em placas individuais de 90 mm a uma densidade de cerca de 1 χ 103 pfu por placa. Dos primeiros 8 lotes positivos, um deles era claramente positivo no segundo lote, isto é >1% de placas positivas, e ele foi designado por JG2. Isto corresponde a uma taxa positiva de 40/106 na biblioteca.
Este e outro fago positivo identificado de modo semelhante de outras bibliotecas de cADN descritas no Exemplo 2 foram em seguida purificados por lotes repetidos de escrutínio de placas a uma densidade inferior (1-200 pfu/placa de 90 mm) até que 100% das placas fossem positivas com o escrutínio do anticorpo de A e L. Três destes fagos recombinantes foram designados por JG1, JG2 e JG3.
EXEMPLO 4.
Escrutínio Secundário de JG1, JG2 e JG3 com Painéis de Soro Cada um dos fagos recombinantes, JG1, JG2 e JG3 foi purificado por placa e armazenado como reservas tituladas em tampão SM a 42c. Estes fagos foram misturados (1:1) com um fago de reserva identificado como negativo no Exemplo 3 e a mistura utilizada para infectar a E. coli estirpe Y1090 a 1000 pfu por placa. Foram tomados pedaços de placas e processados da forma descrita no Exemplo 3 com a excepção de os filtros serem cortados em quadrantes e cada quadrante ser
incubado com um anticorpo diferente; estes foram os anticorpos de A e L (20 /ig/ml) ; plasma A (1:500); plasma L (1:500) e H IgG (20 Ag/ml). H é um paciente que se pensa ser positivo aos anticorpos PT-NANBH dado que ele era um hemofílico que tinha recebido o factor VIII não tratado termicamente. No final da reacção cada filtro foi classificado como positivo (quando existiam obviamente duas classe de sinal) ou negativo (quando todas as placas davam o mesmo sinal) . Isto podia ser um julgamento subjectivo e assim os resultados foram comparados e apenas os filtros onde existia um grande acordo foram tomados como positivos. Os resultados obtidos são apresentados na Tabela 1.
TABELA 1
| A e L | A | L | H | |
| JG1 | + | + | - | - |
| JG2 | + | + | + | + |
| JG3 | + | + | + | + |
JG1 parecia apenas reagir com anticorpos do paciente A e não do L ou H; isto é diferente do que seria de esperar de um polipéptido recombinante verdadeiro relacionado com PT-NANBH e assim foi desprezado o JG1 da análise. Contudo quer JG2 quer JG3 davam reacções positivas claras com três soros de PT-NANBH de A, L e H; estes foram mais analisados.
tipo de análise descrita acima foi repetida para JG2 e JG3 com a excepção de os filtros se25 »W«I
rem cortados em partes mais pequenas e estas foram incubadas com painéis de soros positivos e negativos. Os painéis de soros positivos compreendiam um painel de 10 soros hemofílicos e um painel de 9 soros de viciados da droga intravenosos (IVDA). Estes representavam a melhor fonte de soros positivos mesmo quando a taxa positiva real era desconhecida. 0 painel dos soros negativos foi obtido de dadores credenciados que tinham sido bem monitorados durante muitos anos pelo North London Blood Transfusion Centre, Deansbrook Road, Edgware, Middlesex, U.K. e nunca tinham revelado qualquer sinal de infecção com vários agentes incluindo PT-NANBH. Os resultados obtidos são apresentados na Tabela 2 e 3.
TABELA 2
I.D. JG2 JG3
IVDAS V19146
V27083
V29779
V12561
V15444
V18342
V8403
V20001
V21213
4/4
2/4
0/4
0/5
3/4
4/4
3/4
4/4
3/4
0/5
0/5
0/5
4/5
5/5
0/5
0/5
0/5
0/5
Hemofílicos M1582
M1581
M1575
M1579
M1585
M1576
M1580
M1578
M1587
M1577
4/4
5/5
3/5
5/5
3/5
1/5
1/5
1/5
1/5
2/5
4/5
5/5
0/5
5/5
0/5
1/5
0/5
0/5
3/5
1/5
Os positivos estão sublinhados
TABELA 3
| IVDA | Hemofílicos | Dador Credenciado | |
| JG2 | 6/9(66%) | 5/10(50%) | 0/10(0%) |
| JG3 | 2/9(22%) | 4/10(40%) | 0/10(0%) |
| JG2+JG3 | 1/9(11%) | 3/10(30%) | 0/10(0%) |
| JG2 ou JG3 | 7/9(77%) | 6/10(60%) | 0/10(0%) |
Estes dados são consistentes com a hipótese de ambos os recombinantes serem polipéptidos de expressão associados com um agente responsável por PT-NANBH e que estes polipéptidos não são idênticos mas podem partilhar alguns locais antigénicos.
EXEMPLO 5.
Mapeamento de Restrição e Sequenciacão de ADN de JG2 e JG3 Foi sujeita a ebulição uma parte (10 μΐ) dos fagos de reserva a JG2 e JG3 para desnaturar o fago e expor o ADN. Este ADN foi em seguida utilizado como molde numa amplificação de PCR utilizando Taq polimerase; cada mistura reaccional continha os seguintes produtos para um volume final de 50 μ1:10ιηΜ de Tris-HCL, 50mM de KCl, l,5mMde MgCl2, 0,01% de gelatina, pH 8,3 a 25sc mais primários de oligonucleótido dl9 e d20 (SEQ ID NO : 1 e 2 respectivamente: 200 ng cada) ;
estes primários estão localizados nas sequências lambda que flanqueiam o local de clonação Eco RI e assim efectuam a primagem da amplificação de qualquer coisa que seja clonada neste local.
Foi analisada uma parte da mistura reaccional no gel de agarose a 1,0% e comparada com marcadores. A amplificação de JG2 produzia um fragmento com aproximadamente 2 kb; JG3 um com aproximadamente 1 kb. A mistura reaccional restante foi extraída com fenol/clorofórmio na presença de lOmM de EDTA e 1% de SDS e o ADN foi recuperado por precipitação com etanol. 0 material amplificado foi em seguida sugerido com 2 OU de EcoRI durante 60 minutos a 37 2C e separado num gel de agarose a 1% LGT em TAE. Os fragmentos foram reduzidos de tamanho de forma esperada e foram eluídos e purificados com Elutips (S&S). As inserções JG2 e JG3 foram ligadas com EcoRI digerido com pUC13 e transformados em E. coli estirpe TG1. Os recombinantes foram identificados como colónias brancas em placas de X-gal/L-Amp (placas de L-Ágar suplementadas com 100 /zg/ml de ampicilina, 0,5 de mg/ml X-gal) e foram ensaiadas por preparações de plasmídio de peque na escala e digestão com enzima de restrição de EcoRI para determinar o tamanho da inserção de ADN. O plasmídio recombinante contendo a inserção JG2 foi designado por DM415 e o que continha a inserção de JG3 foi designado por DM416.
A sequência da inserção de JG2 foi determinada por se quenciação directa de dupla banda do ADN do plasmídio e por subclonação nos vectores de sequenciação de M13 como por exemplo mpl8 e mpl9 seguido de sequenciação de banda única. A sequencia da inserção de JG3 foi determinada de forma semelhante. 0 ADN resultante e as sequências de aminoácidos deduzidas são apresentadas na SEQ ID NO : 3 e 4.
EXEMPLO 6.
Expressão de Polipéptido PT-NANBH em E. coli
O plasmídio pDM416 (5 μg) foi digerido com EcoRI (2Ου) num volume final de 20 μΐ e a inserção de 1 kb foi recuperada por eluição de um gel de agarose a 1% de LGT. Este material foi em seguida purificado utilizando um fragmento de Klenow e uma mistura de dNTP para preencher as terminais soltos de EcoRI. O ADN foi recuperado por precipitação com etanol seguida de extracção com fenol/clorofórmio. 0 fragmento com terminal cego foi ligado em Smal clivado/fosfatasado
pDEV107 (um vector que permite a clonação no terminal 3' de lac Z) e em seguida transformado em células TG1 de E. coli. Ocorreu um aumento de 3 0 vezes nas colónias em relação a um controlo do vector único. Os transformantes contendo o plasmídio recombinante pretendido foram identificados por hibridização com uma sonda radioactiva produzida por amplificação de PCR do recombinante JG3. Foram analisadas doze colónias por digestão com enzima de restrição (Sall) de mini preparações de plasmídio para determinar a orientação da inserção. Um quarto destes recombinantes estavam na orientação correcta para expressar a sequência de PT-NANBH como fusão com β-galactosidase. Um destes (pDX113) foi tomado para análise posterior.
Foi utilizada uma colónia de pDX113 para inocular 50 ml de caldo L, cultivou-se a 372C com agitação de fase semi-logarítmica e a expressão foi induzida pela adição de 20 mM IPTG. Passadas 3 horas as células foram colhidas por centrifugação a 5000 g durante 20 minutos, ressuspensas em 50 ml de PBS e recentrifugadas. As células recentrifugadas foram ressuspensas em 5 ml de tampão. (25mM de Tris-HCl, lmM de EDTA, lmg/ml de lisozima, 0,2%(v/v) de Nonidet-P40, pH8.0) por grama de agregado e incubou-se a osc durante 2 horas. 0 ADN de bactérias libertado foi digerido por adição de DNASE I e MgSO4 para as concentrações finais de 40 jug/ml e 2mM respectivamente para reduzir a viscosidade.
Este lisado bruto foi analisado por PAGE e o padrão das proteínas foi revelado com azul de Coomassie. Foi inducida uma proteína com aproximadamente 150KD em bactérias contendo pDX113 e foi estimada uma fracção desta proteína de 10 a 15% da proteína total. Foram transferidos geís semelhantes para uma membrana PVDF (GRI, Dunmow, Essex, U.K.) e as membranas foram incubadas com soros positivos e negativos a PT-NANBH; a proteína de 150KD reagia com os soros A e L mas não com o soro humano normal. Os perfis de controlo con30 tendo o lisado de E. coli que expressavam B-galactosi dase não reagiam com A, L ou soro humano normal.
Foi adicionado a ureia ao lisado bruto até uma concen tração final de 6M e foi removido o material insosolúvel por centrifugação. O extracto de ureia 6M foi utilizado para revestir furos de microtitulação durante 1 hora a 37^0. Os furos foram lavados por três vezes com água duplamente destilada e em seguida bloqueado pela adicção de 0,25ml de BSA a 2% por furo contendo 0,02% de NaNj durante 20 minutos a 37^C. A placa foi em seguida aspirada. As placas de controlo revestidas com um lisado bruto de E. coli es tirpe (pXY461) produzindo β-galactosidase foram produzidas da mesma forma. Estas placas foram utilizadas nos ensaios de ELISA na forma descrita do Exemplo 10.
EXEMPLO 7.
Expressão do Polipéptido PT-NANBH em Células de Insectos
A inserção de PT-NANBH de JG3, isolada da forma descrita no Exemplo 5, foi clonada num quadro com os primeiros 34 nucleótidos de polihedrina no vector pAc360 (Luckow e Summers. Biotechnoloqy. 1988, 6, 47-55) , utilizando o conhecimento do quadro de leitura do gene lacZ no vector gtll. Foram sintetizados os oligonucleótidos que eram capazes de hibridizar as sequências gtll que flanqueavam o local de clonação de EcoRI e que permitiam a amplificação da inserção por PCR. Estes oligonucleótidos incluiam os locais de restrição de BamHI adequadamente colocados para permitirem a clonação directa no local de BamHI de pAc360, colocando o gene de inserção em quadro com as sequências terminais de amino da polihedrina.
Foi submetido a ebulição uma pequena quantidade do re combinante gtll JG3 para expôr o ADN e foi depois uti lizado numa amplificação PCR contendo os primários de oligonucleótidos d75 e d76 (SEQ ID NO : 6 e 7; 200 mg) e 0,5 U de Taq polimerase.
Após amplificação, a mistura reaccional foi extraída com um volume igual de fenol/clorofórmio, precipitada
com etanol e digerida com 10 U de BamHI para um volume final de 30 μΐ. O fragmento amplificado foi resolvido num gel de agarose a 1%, eluído e ligado em pAc360 digerido com BamHI para produzir a construção de transferência pDX119. O plasmídio recombinante (2 Mg) e o AcNPV ADN de tipo natural (1 Mg) foram co-transfectados para células de insectos por precipitação com fosfato de cálcio. O vírus recombinante negativo de inclusão foi escolhido por escrutínio visual. Após três lotes de purificação de placa, foi expandido o vírus recombinante (BHC-5) e foi avaliada a expressão da proteína recombinante em células de insectos por SDS-PAGE, revelação de Western e ELISA. Foi produzida uma proteína abundantemente expressa com aproximadamente 70KD nas células infectadas. Esta proteína é reactiva com os soros PT-NANBH por revelação de Western e ELISA.
Foi construído um outro recombinante de baculovírus (BHR-7) para incluir as sequências de JG2 adicionais às sequências de JG3 presentes em BHC-5, como se representa na Figura 1. As sequências de PT-NANBH presentes em JG2 foram amplificadas e clonadas num vector pAc360 da forma acima descrita de modo a produzir fragmentos de pDX118 e BamHI-Sal adequados de pDX119 e pDX118 e foram ligados em conjunto nessa ordem em pAc360 para produzir a construção de transferência de pDX112.
Os plasmídios recombinantes foram identificados por hibridização e orientação de ADN inserido determinado por análise de enzima de restrição. O vírus recombinante foi produzido da forma acima descrita e a pro teína expressa foi analisada por SDS-PAGE, revelação de Wastern e ELISA. Foi obtido um polipéptido de 95kDa muito abundante (40% da proteína total das células) que reagia com os soros de PT-NANBH encontrado nas células infectadas.
EXEMPLO 8.
Purificação do Polipéptido DX113
A estirpe Ε. coli TG1 contendo o plasmídio pDX113 designado por estirpe WDL001 foi cultivada e induzida num fermentador de 1,5 litros (modelo SET002, SGI, Newhaven, East Sussex, U.K.) a 372C durante 5 horas. As células foram recolhidas por centrifugação a 5000 g durante 20 minutos e tratadas da forma seguinte.
a) Extracção
As células húmidas foram ressuspensas (1:20, p/v) no Tampão A (50mM de Tris-HCl, 50mM de NaCI, lmM de EDTA, 5mM de DTT, 10%(v/v) de glicerol, pH-8,0). Foi adicionada lisozima a uma concentração de 5 mg de sólido por ml de suspensão e a mistura foi deixada em repouso a 4QC. Passados 15 minutos, a mistura foi tratada por sonificação (amplitude de 6μπι de pico a pico) em gelo durante um total de 3 minutos (pulsos de 6x30 se gundos) . A DNasel foi adicionada a 4 /ig por ml de suspensão e a mistura foi deixada em repouso durante mais 30 minutos. A suspensão foi centrifugada durante 20 minutos a 18000 g (máx) e o sobrenadante foi desprezado.
O agregado foi ressuspendido num tampão B (25mM de Hepes, 4M de ureia, 5mM de DTT, pH 8,0) a uma fracção de 1:6 (p/v) para se obter uma suspensão fina. Esta foi centrifugada a 18000 g (máx) durante 20 minutos e o sobrenadante desprezado. A pastilha foi resuspensa num tampão C (25mM de Hepes, 8M de ureia, 2mM de DTT, pH 8,0) a uma fusão de 1,6 (p/v), antes da suspensão foram adi cionados:leupeptina (l/ig/mg) ,pepstatina (l^g/mg) e, E64 (l/ig/ml) . A suspensão foi centrifugada a 18000 g (máx) durante 30 minutos e o sobrenadante decantado e guardado. A pastilha foi res suspensa em 25mM de Hepes, 1% de SDS pH 8,0.
b) Cromatografia sobrenadante obtido de uma fracção de ureia 8M foi diluído a 1,5 (v/v) em 25mM de Hepes, 8M de ureia, 2mM de DTT, pH 8,0 e fraccionado numa
coluna de 7 ml de Q-Sepharose. As proteínas foram eluídas através de um gradiente salino de NaCl 0 IM. A cromatografia e o tratamento de dados foram controlados por FPLC (Pharmacia). 0 DX113 elui a aproximadamente 500mM de NaCl e é virtualmente homogéneo por SDS Page e revelação de Western.
EXEMPLO 9.
Purificação de Polipéptido BHC-5
Foram infectadas células Sf9 (2xl09) com uma preparação de virus recombinante de BHC-5 (moi 5) . Após in-cubação a 28SC durante 2 dias as células foram recolhidas por centrifugação e em seguida processadas de forma seguinte.
a) Extracção
A massa das células húmida (1,2 g) foi ressuspen sa em 6 ml de tampão A (25mM de Hepes, 5mM DTT, leupeptina l/xg/ml, pepstatina l^g/ml, E64 l/xg/ml pH 8,0). As células ressuspendidas foram colocadas em gelo e tratadas por sonif icação por pulsos de 3 x 15 segundos (amplitude de 6 μτα de pico a pico) intervaladas com períodos de repouso de 30 segundos. A suspensão tratada com sonificação foi centrifugada a 18000 g (máx) durante 20 minutos e o sobrenadante foi desprezada. A pastilha foi ressuspensa em tampão A mais ureia 4M (6 ml) e centrifugada a 18000 g (máx) durante 20 minutos. 0 sobrenadante foi desprezado e a pastilha re-extraída com tampão A e ureia 8M (6ml). Após centrifugação a 18000 g (máx) durante 30 minutos o sobrenadante foi repetido e diluído a 1:6 em tampão A e ureia 8M. Este extracto foi cromatografado numa mono-coluna Q equilibrada no mesmo tampão. A coluna foi eluída através de um gradiente salino (0-1,0 M de NaCl) em 12 volumes de coluna. 0 BHC-5 eluía a aproximadamente 0,45 - 0,55mM de NaCl e era
superior a 90% de pureza determinada por SDSPAGE.
O rendimento foi de aproximadamente 70%.
EXEMPLO 10.
Resultados dos Polipéptidos DX113 e BHC-5 e 7 num Ensaio de
ELISA
Foram directamente revestidas placas de microelisa (96 furos, Nunc) com tampão de bicarbonato 50mM (bicarbonato de sódio 50mM e carbonato de sódio 50 mM, titulado a pH 9,5) com um lisado de ureia 6 M bruto de BHC-5 ou com pDX113 purificado. As placas foram bloqueadas com BSA a 0,2% e em seguida incubadas durante 30 minutos a 372C com soros diluídos a 1:20 (báculo) ou 1:100 (E. coli). Após lavagem em mistura de Tween-solução salina (0,85% de solução salina, 0,05% de Tween 20, 0,01% de Bronidox) as placas foram incubadas com imunoglobulina anti-humana de cabra conjugada com peroxidase (1:2000) durante 30 minutos a 37sc. As placas foram em seguida lavadas em mistura de Tween-solução salina e a cor foi revelada por adição de substrato cromogénico TMB (tetrametil-benzidina-HCl) (100 μΐ/furo) e incubou-se durante 20 minutos à temperatura ambiente. A reacção foi parada com 25 μ,Ι de ãcido sulfúrico 2M e foi determinado o valor de OD450 (Tabela 4).
TABELA 4
| Ensaio indirecto de ELISA de | formato de Ia anti-humano para | |
| a deteccão de anticorpo NANB | ||
| Báculo BHC-5 (Fase-sólida) | E. coli DX113 (Fase-sólida) | |
| >2 | 1,670 | |
| 1,855 | 1,531 | |
| 1,081 | 1,015 | |
| Soros de pacientes de | 1,842 | 1,558 |
| alto risco positivos | 0,526 | 0,638 |
| no Ensaio | >2 | 1,516 |
| 1,823 | 1,602 | |
| 1,779 | 1,318 | |
| 1,122 | 0,616 | |
| 1,686 | 1,441 | |
| 0,259 | 0,205 | |
| 0,158 | 0,120 | |
| 0,298 | 0,209 | |
| Soros de pacientes de | 0,194 | 0,111 |
| alto risco negativos | 0,282 | 0,181 |
| no Ensaio | 0,263 | 0,165 |
| 0,184 | 0,163 | |
| 0,121 | 0,099 | |
| 0,243 | 0,104 | |
| Dador credenciado | 0,224 | 0,119 |
Foram ensaiados os soros de pacientes de elevado risco de infecção por PT-NANBH (IVDA hemofílicos) da forma acima descrita; todos os dados são expressos como leituras OD450, servindo o dador credenciado como controlo negativo. Deste grupo particular de soros 10/19 são positivos em ambas as fases sólidas.
Foi conjugado DX113 adicionalmente purificado a fosfatase alcalina utilizando a redução de SATA/maleimida e foi estabelecido um ensaio imunométrico. Foram diluídos soros NANB conhecidos positivos e negativos como indicado no soro do dador credenciado e adicionado a uma fase sólida revestida com BHC-7. Quer simultaneamente quer após incubação (30 minutos a 372C) foi adicionado o con jugado DX113 (50 μΐ, 1:2000). Após incubação a 372C durante 30 minutos, foram lavadas as placas com tampão de bicarbonato 50 mM e a cor foi revelada utilizando o sistema de amplificação IQ Bio e foi determinado o valor de OD492 (Tabela
5).
TABELA 5
Ensaio imunométrico (polipéptido marcado) de ELISA para a detecção de anticorpo NANB
Positivo no Ensaio Negativo no Ensaio Dador
Credenciado
| >2 | 0,217 |
| 0,821 | 0,252 |
| >2 | 0,214 |
| 0,542 | 0,257 |
| 0,876 | 0,308 |
| 1,583 | 0,278 |
| >2 | 0,296 |
| >2 | 0,273 |
| 1,830 | 0,262 |
| >2 | 0,251 |
Assim em qualquer dos ensaios - antiglobulina ou imunométrico - todas as amostras de alto risco davam resultados concordantes.
EXEMPLO 11.
Formulação para Vacinas
Pode ser preparada uma formulação para vacinas por técnicas convencionais utilizando os seguintes constituintes nas quantidades indicadas:
Virai PT-NANBH Polipéptido >0,36 mg
Tiomersal 0,04-0,2 mg
Cloreto de sódio <8,5 mg
Água para lml
EXEMPLO 12.
Produção de Anticorpos Monoclonais em Polipéptidos PT
Foi sub-clonada a inserção de ADN de DM415 no vector de transferência de baculovirus p36C e o vírus recombinante produzido por um processo essencialmente semelhante à descrita no Exemplo 7. 0 vírus recombinante foi designado por BHC-1 e expressava valores muito baixos de proteína específica de PT-NANBH. Foram lisadas células Sf-9 (5xl07 células/ml) infectadas com BHC-1 em PBS contendo 1% (v/v) de NP40 e centrifugadas a 1300 g durante 2 minutos. O sobrenadante foi feito passar através de Extractigel - D (Pierce Chemicals) para remover o detergente e em seguida misturou-se como emulsão 1:1 como o adjuvante completo de Freund. Foram injectados subcutaneamente ratos com 0,1 ml de emulsão (equivalente a 5xl06 células) . Aos dias 14 e 28 após injecçâo, os ratos foram administrados com injecçâo intraperitoneal de 0,1 ml (equivalente a 5xl06 células) de um extracto isento de células Sf-9 infectadas com BHC-5: o BHC-5 contem a inserção de ADN de DM416. Foram tomadas amostras de sangue da cauda e ensaiadas para a determinação da actividade anti-PT-NANBH num ensaio de ELISA (Exemplo 10). Foram ainda administrados dois ratos com uma resposta específica a PT-NANBH por injecção intravenosa com um extracto isento de detergente de células Sf-9 infectadas com BHC-7; o BHC-7 contem uma inserção de ADN produzida por ligação em conjunto das regiões de sobreposição de DM415 e DM416 (Exemplo 7) . Os baços foram removidos passados três dias.
Células de baço foram fundidas com células do mielona NSo na presença de PEG1500 por técnicas convencionais. As células de hibridoma resultantes foram escolhidas para cultura em meio HAT (hipoxantina, amino pterina, timidina) . Nos dias 10 a 14 após fusão, os sobrenadantes foram escrutinados para a determinação da actividade anti-PT-NANBH por um ensaio de ELISA. Os furos que revelavam reactividade com antigénios DX113 e BHC-7 (Exemplo 10) foram identificados e as colónias individuais foram transferidas para furos separados, cultivadas e reensaiadas. Os furos que apresentavam reactividade específica nesta fase foram ainda clonados a uma diluição limite para assegurar a monoclonalidade.
EXEMPLO 13.
Detecção de Ácido Nucleico Virai PT-NANBH em Pacientes
Seropositivos
Soros: Foram congelados a -202C amostras de dadores de 1400 dadores, recolhidas num estudo prospectivo de hepatite após transfusão. As amostras de pré-transfusão e pós-transfusão em série recolhidas de 260 recipientes foram guardadas de forma semelhante. As amostras de pós-transfusão foram recolhidas quinzenalmente durante 3 meses, mensalmente durante 6 meses e semestralmente durante 18 meses. Os soros congelados de dadores e recipientes de três incidentes de PT-NANBH que ocorreram em 1981 foram também tornados disponíveis para o estudo. O diagnóstico de PT-NANBH foi baseado num aumento de alanina amino transferase no soro (ALT) que excedia 2,5 vezes o limite superior do normal em pelo menos duas amostras
de pós-transfusão separadas. Foram excluídos outros vírus hepatrópicos por ensaios sorológicos e as causas não virais de doenças hepatocelulares foram excluídas por estudos convencionais clínicos e laboratoriais.
Imunoensaio: Foram ensaiadas amostras de soro retrospectivamente para a determinação da presença de anticorpos a HCV (antigénio C100) com o dispositivo de Ortho Diagnostics ELISA utilizado de acordo com as instruções do fabricante. Foram titulados repetidamente soros reactivos de acordo com pontos finais num soro humano negativo para anti-ClOO.
Detecção de Sequências Virais de PT-NANBH: Foi extraí do ARN de soro ou plasma, inversamente transcrito, e amplificado da forma a seguir descrita. Os primãros de oligonucleótidos de transcrição inversa/PCR foram derivados da sequência de nucleótidos do gene JG2 iso lado no Exemplo 3, e sintetizou-se num sintetizador de APPlied Biosystems 381A. As sequências dos quatro primários de oligonucleótidos foram as seguintes:
Designação SEP ID NO: Tamanho do
Produto
Sentido d94 8
729bp anti-sentido d95 9
Sentido NI 10
402bp anti-sentido N2 11 (i) Extracção de ARN
Foram levados a um volume de 200 μΐ 5-50 μΐ de soro (ou plasma) por adição de água. A amostra de 200 μΐ foi adicionada a um volume igual de tampão 2 x PK = 0,2M de TrisCl, pH7,5, 25mM de EDTA, 0,3M de NaCl, 2% p/v de SDS, proteinase K 200/ig/ml) , misturada e incubada a 37sc durante
minutos. As proteínas foram removidas por extracção de duas vezes com fenol/clorofórmio e uma vez só com clorofórmio. Foram adicionados 20 μ$ de glicogénio à fase aquosa e o ARN então precipitou por adição de 3 volumes de etanol absoluto refrigerado com gelo. Após armazenagem a -70sc durante 1 hora o ARN foi centrifugado numa centrifugadora de Eppendorf (15 minutos, 14 000 rpm, 4SC) . O agregado obtido foi lavado uma vez com etanol a 95%, seco em vazio e dissolvido em 10 μΐ de ãgua destilada esterilizada. As soluções de ARN foram guardadas a -702C.
(ii) Síntese de cADN
Foram preparados 10 μΐ de uma mistura contendo 2 μΐ da solução de ARN, 50 ng de oligonucleótido sintético d95, 10 mM de Hepes-HCl pH 6,9 e 0,2 mM de EDTA pH 8,0. Esta mistura de 10 μΐ foi coberta com 2 gotas de óleo mineral, aquecida durante 2 minutos num banho de água a 90sc e arrefecida rapidamente com gelo. A síntese de cADN foi efectuada após se ajustar a mistura reaccional para conter 50mM de Tris-HCl pH7,5, 75mM KC1, 3mM de MgCl2, lOmM de DTT, 0,5mM cada de dATP, dCTP, dGTP e dTTP, 20 unidades de inibidor de RNase (Pharmacia) e 15 unidades de transcriptase inversa de MLV clonada (Pharmacia) para um volume final de 20 μΐ. Os 20 μΐ de mistura foram incubados a 37sc durante 90 minutos. Após síntese o cADN foi guardado a -20sc.
(iii) PCR Em cadeia
Ao longo deste ensaio foram evitados falsos resultados positivos de PCR por aplicação estrita das medidas necessárias para evitar a contaminação de Kwok e Higuchi (Nature, 1989, 339,237-238).
a) Lote 1
A reacção de cadeia de polimerase foi efectuada em 50 μΐ de uma mistura contendo lOmM de Tris-HC1 pH8,3, 50 mM de KC1, 1,5 mM de MgCl2, 0,01% p/v de gelatina, 1 Unidade Recombinante de taq ADN polimerase (Perkin Elmer Cetus), 2 00μΜ cada de dNTP, 30ng de cada primário exterior (d94 e d95; SEQ ID NO : 8 e 9 respectivamente) e 5 μΐ de solução de cADN. Após um período adicional de 5 minutos de desnaturação a 94 2C, foram conduzidos 35 ciclos de 95sc durante 1,2 minutos, seguidos por uma extensão final de 7 minutos a 72sc (Techne PHC-1 Automated Thermal Cycler).
b) Lote 2
Foi utilizada a mistura reaccional igual à acima descrita para o Lote 1 mas foram utilizados 125 ng de cada primário interno, NI e N2 (SEQ ID NO : 10 e 11 respectivamente) , em vez dos primários externos d94 e d95. Foi transferida uma aliquota de 1 μΐ dos produtos de PCR obtidos no Lote 1 para os 50 μΐ da mistura reaccional do Lote 2. Foram efectuados 25 ciclos de 95sc durante 1,2 minutos, 46ec durante 1 minuto, 72sc durante 1 minuto seguidos de um período de extensão de 7 minutos a 72sc.
c) Análise
Foram analisados 20 μΐ dos produtos de PCR do lo te 1 e do Lote 2 por electroforese num gel de 2% de agarose. As bandas foram visualizadas por meio de revelação com brometo de etídio e fotografadas a 302 nm.
Valor previsto de Serologia Anti-HCV e PCR no Es tudo Prospectivo: seis dos 1400 dadores (0,43%) envolvidos no estudo prospectivo revelaram ter anticorpos a C100 no seu soro. Destes seis dadores positivos de anticorpos positivos apenas um (dador D6) provou ser infeccioso como determinado pelo desenvolvimento de PT-NANBH e soroconversão de C100 num recipiente (recipiente R6)
ver Tabela 6 seguinte. Foram detectadas sequências virais por PCR no soro do dador D6 mas não em qualquer dos outros cinco dadores seropositivos de soro. 0 recipiente R6 que desenvolveu PT-NANBH tinha também recebido sangue de sete outros dadores (D7 a D13) . Os soros destes dadores foram ensaiados e revelaram ser ambos negativos a anticorpos e negativos a PCR.
TABELA 6
RESUMO DOS DADOS DE DADOR/RECIPIENTE : ESTUDO PROSPECTIVO
| DADORES | PCR | RECIPIENTES | |||
| Dador | anti-HCV | Recipiente | PT-NANBH | ANTI-HCV serocon- versão | |
| DI | + | MB | Rl | Não | Não |
| D2 | + | - | R2 | Não | Não |
| D3 | + | - | R3 | Não | Não |
| D4 | + | - | R4 | Não | Não |
| D5 | + | - | R5 | Não | Não |
| D6 | + | + | |||
| D7 | - | - | |||
| D8 | - | - | |||
| D9 | - | - | R6 | Sim* | Sim+ |
| D10 | - | - | |||
| Dll | - | - | |||
| D12 | - | - | |||
| D13 | — | — |
* período de incubação de 1 mês + A seroconversão ocorria a 5 meses após transfusão
EXEMPLO 14.
Isolamento e Expressão de Sequências Adicionais de PT-NANBH de ADN
As bibliotecas lambda gtll preparadas no Exemplo 2 foram também escrutinadas com soros de pacientes com um elevado risco para PT-NANBH mas que não reagiam com os antigénios virais, DX113, BHC-5 e BHC-7, sendo a razão disto que eles podem bem conter anticorpos que reconheciam antigénios diferentes. Os soros, PJ-5 (The Newcastle Royal Infirmary, Newcastle), Birm-64 (Queen Elizabeth Medicai Centre, Birmingham), PG e Le (University College and Middlesex School of Medicine, Londres) cumpriam este critério e foram utilizados para escrutinar as bibliotecas segundo o mesmo procedimento descrito nos Exemplos 3 e 4. Foram assim identificados vários recombinantes, nenhum dos quais se hibridizava cruzadamente com sondas feitas de JG2 e JG3. Um dos recombinantes, BR11, identificado por reacção com PJ-5, foi escolhido para análises adicionais.
clone, BR11, continha uma inserção com aproximadamente 900 pb que foi ampliada por PCR utilizando os primários d75 e d76 (SEQ ID NO : 6 e 7) como descrito no Exemplo 7. A sequência amplificada foi directamente clonada no vector de baculovirus pAc 360 para formar pDX128 contendo um quadro de leitura aberto em fase com os primeiros 11 aminoácidos da polihedrina. Os lotes de baculovirus recombinantes (designados por BHC-9) foram obtidos segundo os procedimentos descritos no Exemplo 7. As células dos insectos foram infectadas com o vírus recombinante purificado e foi obtido um polipéptido com aproximadamente 22 KD num extracto de células radiomarcadas. A inserção amplificada de BR11 foi também clonada nos vectores de fago pUC13 e M13 para sequenciação; os dados de ADN e de sequência de aminoácidos são apresentados na SEQ ID NO : 5. A inserção contem 834 pb mais os ligantes de EcoRI adicionados durante a clonação.
EXEMPLO 15.
Resultados de um Polipéptido BHC-9 num Ensaio de ELISA
Foi estabelecido um ensaio de ELISA utilizando placas de microtitulação revestidas com extracto de células infectadas com BHC-9 e um sistema de detecção conjugado de lg anti-humano segundo o procedimento descrito no Exemplo 10. Foi avaliado um painel de soro de elevado risco em paralelo contra BHC-7 e BHC-9 e foram também examinados por PCR utilizando o procedimento descrito no Exemplo 13. Os resultados obtidos são apresentados na Tabela 7 em que são sublinhadas as amostras positivas.
TABELA 7
| Número | PCR | BHC-7 | BHC-9 |
| 1 | + | 2f 09 | 2,00 |
| 2 | + | 2,09 | 2,00 |
| 3 | + | 1,89 | 1,37 |
| 4 | + | 1,57 | 0,27 |
| 5 | + | 1,26 | 2,00 |
| 6 | + | 0,91 | 2,00 |
| 7 | - | 0,90 | 0,51 |
| 8 | + | 0,84 | 1,19 |
| 9 | - | 0,53 | 0,43 |
| 10 | - | 0,45 | 2,00 |
| 11 | + | 0,37 | 1,07 |
| 12 | - | 0,32 | 2,00 |
| 13 | - | 0,23 | 0,30 |
| 14 | - | 0,15 | 0,43 |
| 15 | + | 0,16 | 0,76 |
| 16 | - | 0,09 | 1,74 |
| 17 | - | 0,27 | 2,00 |
| 18 | - | 0,15 | 2,00 |
| 19 | - | 0,12 | 2,00 |
| 20 | - | 0,08 | 0,05 |
| Corte | 0,27 | 0,29 |
Destas 20 amostras, 50% são claramente positivas com BHC-7 enquanto que 85% são positivas com BHC-9. Duas das amostras 11 e 12) que são positivas no limite com BHC-7 são claramente positivas com BHC-9 e algumas das amostras a ou abaixo do ponto do corte com o BHC-7 são positivas com BHC-9. Além disso, duas das amostras (11 e 15) que estão no limite ou são negativas com BHC-7 são positivas com BHC-9 e são positivas com PCR.
Globalmente existem apenas duas amostras (13 e 20) que são negativas com ambos os polipéptidos e com PCR.
EXEMPLO 16.
Isolamento das sequências de PT-NANBH ADN que sobrepõem aos clones existentes
O escrutínio imunológico das bibliotecas de expressão de cADN descritas nos Exemplos 3, 4 e 14, podem apenas identificar os clones que contêm uma região imuno creativa do vírus. Outra técnica para a produção de clones específicos para PT-NANBH é utilizar PCR para amplificar as moléculas de cADN que se sobrepõem aos clones existentes. Podem ser preparados conjuntos de primários em que um membro do par cai dentro das sequências clonadas existentes e o outro cai fora; esta técnica pode ser ampliada também para pares em cadeia de primários.
cADN preparado de forma descrita no Exemplo 1, foi amplificado por PCR, com pares de primários únicos ou em conjunto, utilizando as condições de reacção descritas no Exemplo 13. A técnica é ilustrada pela utilização dos seguintes pares de primários dl64 (SEQ ID NO : 12) e dl37 (SEQ ID NO : 13); dl36 (SEQ ID NO : 14) e dl55 (SEQ ID NO : 15); dl56 (SEQ ID NO : 16) e d92 (SEQ ID NO : 17) . Um elemento de cada par é designado para efectuar a primagem dentro das sequências clonadas existentes (dl37 e dl36 efectuam pr imagem dentro dos terminais 5' e 3' de BR11 respectivamente, d92 efectua a primagem na extre49
midade 5' de JG3). Os outros primários são baseados nas sequências disponíveis para outros agentes de PTNANBH. 0 primário dl64 corresponde às bases 10 a 31 da figura 2 em Okamoto e col, Japan. J. Exp. Med. . 1990, 60 167-177. Os primários dl55 e dl56 correspondem ás posições 462 a 489 e 3315 a 3337 respectivamente na figura 7 do pedido de Patente Europeia 88310922,5. Foram preparadas uma ou mais preparações de nucleótidos para introduzir um ponto de reconhecimento de EcoRI próximo da extremidade 5' dos primários, com a excepção de dl64 em que foi introduzido um ponto de reconhecimento Bgl2; estas alterações facilitam a clonagem posterior do produto ampliado.
Os produtos de PCR foram digeridos com as enzimas de restrição adequadas, resolvidas por electroforese em gel de agarose e bandas de tamanho esperado foram retiradas e clonadas no plasmídio e vectores de bacteriofagos da forma descrita no Exemplo 3. As sequências do ADN amplificado 164/137 (SEQ ID NO : 18), 136/155 (SEQ ID NO : 19) e 156/92 (SEQ ID NO : 20) são apresentados na listagem de Sequências. Estas novas sequências estendem a cobertura do genona PT-NANBH sobre o obtido por imunoescrutínio (SEQ ID NO : 3,4 e 5). Estas sequências juntamente com as outras que caiem dentro das regiões já descritas podem ser combinadas numa sequência contígua na extremidade 5' (SEQ ID NO : 21) e na extremidade 3' (SEQ ID NO : 22) do genoma PT-NANBH.
EXEMPLO 17.
Fusão de Anticfénios PT-NANBH Diferentes num Único Polipéptido Recombinante
Os dados apresentados na tabela 7 indicam que embora sejam detectadas mais amostras de soro como positivas a anticorpos utilizando BHC-9 como antigénio alvo (17/20) em vez de BHC-7(10/20) existem algumas amostras (por exemplo #4) que são positivas com apenas a BHC-7. Este quadro é construído por um
ensaio de grande escala de amostras. Desta forma, foi derivado uma construção de fusão utilizando a sequência de BHC-7 e BHC-9.
As sequências de BHC-7 e BHC-9 podem ser combinadas de várias maneiras; cada sequência pode ser posicionada no terminal de amino da fusão resultante e a natureza da sequência de ligação pode também ser variada. A figura 2 ilustra duas formas possíveis em que se podem combinar as sequências.
Foram produzidos fragmentos de restrição adequados contendo pontos de enzima de restrição adequados e sequências de ligação quer por PCR utilizando primários específicos quer por digestão de enzima de restrição de plasmídios existentes. O vector de transferência DX143 consiste num fragmento BmaHl/Pstl de DX122 (Figura 1; o ponto Pst está na posição 1504 JG2, SEQ ID NO : 3) ligado à extremidade 5' de toda a região de codificação de BR11 (SEQ ID NO : 7) que foi ampliada como um fragmento Pstl/BamHl utilizando os primários d24 (SEQ ID NO : 23) e d 126 (SEQ ID NO : 24); a região de ligação consiste em seis aminoácidos derivados do primário dl26 e sequências lambda de bacteriofago residuais. 0 vector de transferência DX136 difere de DX143 por o fragmento de BR11, ser produzido utilizando d24 (SEQ ID NO : 23) e dl32 (SEQ ID NO : 25) e assim as regiões de ligação contêm cinco liosinas. Estes vectores de transferência foram utilizados para transferir e cotransfectar células de insecto Sf9 em cultura com AcNPV ADN e foram produzidos lotes purificados em placa de baculovírus recombinantes da forma descrita no Exemplo 7. O BHC-10 foi produzido como resultado da transfecção com DX143; BHC-11 como resultado de transfecção com DX-136. Os polipéptidos recombinantes expressos por estes dois vírus foram analisados por SDS-PAGE e revelação de Western. 0 BHC-10 produzia um polipéptido com um lpeso molecular aparente de 118 kDa. O BHC-11 produzia um polipéptido com um peso molecular
aparente de 96 kDa. Ambos os polipéptidos reagiram com soro que se sabia reagir apenas em ELISA com BHC7 (por exemplo o soro A) ou apenas com BHC-9 (soro B64, Exemplo 14). Os dois polipéptidos diferiam apenas na sequência de ligação e este efeito afecta a sua mobilidade em SDS-PAGE ou a forma como eles são processados nas células infectadas.
EXEMPLO 18.
Comportamento dos Antiqénios de fusão PT-NANBH em ELISA
Foi estabelecido um ensaio ELISA utilizando furos de microtitulação revestidos com extractos de células infectadas com BHC-9 e um conjugado de lg anti-humano seguindo o procedimento descrito mo Exemplo 10. Na Tabela 8 são apresentados os dados obtidos de uma com paração das duas fusões com os outros antigénios recombinantes de PT-NANBH NHC-7 e BHC-9 bem como a proteína recombinante HCV C-100-3 (Ortho Diagnostic Systems, Raritan, New Jersey). Os soros são agrupados por tipo de reacção com BHC-7, BHC-9 e C-100-3. Os soros do Grupo I reagem fortemente com todos os três antigénios; o Grupo II reage fortemente com apenas BHC-7; o Grupo III reage fortemente com apenas BHC-9 e o Grupo IV reage fortemente com apenas dois de três antigénios.
Tabela 8
| SORO | BHC-7 | BHC-9 | C-100-3 | BHC-20 | BHC-ll |
| Grupo I AH | >2,0 | >2,0 | >2,0 | >2,0 | >2,0 |
| AC | >2,0 | >2,0 | >2,0 | >2,0 | >2,0 |
| 57 | >2,0 | >2,0 | >2,0 | >2,0 | >2,0 |
| 77 | >2,0 | >2,0 | >2,0 | >2,0 | >2,0 |
| 84 | 1,4 | >2,0 | >2,0 | >2,0 | >2,0 |
| Grupo II | |||||
| 805-6 805-17 805-149 | >2,0 >2,0 >2,0 | 0,261 0,181 0,651 | 0,1 0,12 0,084 | 1,78 1,37 1,57 | +* +* |
| Grupo III JS | 0,32 | >2,0 | 0,17 | >2,0 | >2,0 |
| 805-57 805-82 805-94 | 0,069 0,116 0,353 | 1,403 1,272 1,675 | 0,25 0,4 0,2 | 1,9 1,85 >2,0 | +* ++* +* |
| PJ1 | 0,27 | >2,0 | 0,2 | >0,2 | 1,85 |
| Grupo IV A | >2,0 | 0,14 | >2,0 | >2,0 | >2,0 |
| KT | 1,57 | 0,27 | >2,0 | >2,0 | >2,0 |
| Le | 0,152 | >2,0 | >2,0 | >2,0 | >2,0 |
| PJ5 | 0,123 | >2,0 | >2,0 | >2,0 | >2,0 |
| 303-923 303-939 | >2,0 >2,0 | 0,9 1,55 | 0,37 0,268 | 1,9 2,0 | +* +* |
Estas amostras foram apenas ensaiadas por revelação de Western em BHC-ll.
Estes dados mostram que quer o BHC10 quer o BHC-11 têm uma radioactividade semelhante com estes soros e, mais importante, que ambas as actividades antigénicas parecem ser retidas pelas fusões. Todos os soros dos Grupos II e III, que reagem com apenas BHC-7 ou BHC-9 respectivamente, dão uma reacção clara com as fusões. Adicionalmente existe uma indicação de que agrupando os dois antigénios se obtem um ensaio mais sensível. Por exemplo a amostra KT dá valores de OD de 1,57 e 0,27 com BHC-7 e BHC-9 respectivamente enquanto com as fusões o valor de OD é > 2,0.
SEQ ID NO: 1
TIPO DE SEQUÊNCIA: Nucleótido COMPRIMENTO DA SEQUÊNCIA: 21 BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: bacteriófago lambda gtll
FONTE EXPERIMENTAL IMEDIATA: Sintetizador de oligonucleótidos; oligo dl9
CARACTERÍSTICAS:
de 1 a 21 bases homólogas a uma parte a montante do gene lacZ flanqueando o local EcoRI no bacteriófago lambda gtll
PROPRIEDADES: faz a primagem da síntese do ADN do vector fago em cADN inserido no local EcoRI.
GGTGGCGACG ACTCCTGGAG 21
SRmíWíB p*3vç·. „>!raT
SEQ ID NO:2
TIPO DE SEQUÊNCIA: Nucleótido COMPRIMENTO DA SEQUÊNCIA: 21 BASES
No DE BANDAS: única
TOPOLOGIA: LINEAR
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: bacteriofago lambda gtll
FONTE EXPERIMENTAL IMEDIATA: Sintetizador de oligonucleótidos; oligo d20.
CARACTERÍSTICAS:
de 1 a 21 bases homólogas a uma parte a juzante do gene lacZ flanqueando o local EcoRI no bacteriofago lambda gtll
PROPRIEDADES: faz a primagem da síntese do ADN do vector fago em cADN inserido no local EcoRI
TTGACACCAG ACCAACTGGT A 21
SEQ ID NO:3
TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente COMPRIMENTO DA SEQUÊNCIA: 1770 PARES DE BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: cADN para ARN genómico
ORGANISMO FONTE ORIGINAL: humana; soro infeccioso para hepatite pos-transfusão não-A, não-B
FONTE EXPERIMENTAL IMEDIATA: clone JG2 de biblioteca cADN em lambda gtll
CARACTERÍSTICAS:
com 1 a 1779 pb na parte da poliproteína de PT-NANBH
PROPRIEDADES: codifica provavelmente as proteínas virais não estruturais
| CAA | AAT | GAC | TTC | CCA | GAC | GCT | GAC | CTC | ATC | GAG | GCC | AAC | CTC | CTG | TGG |
| Gin | Asn | Asp | Phe | Pro 5 | Asp | Ala | Asp | Leu | lie 10 | Glu | Ala | Asn | Leu | Leu 15 | Trp |
| CGG | CAT | GAG | ATG | GGC | GGG | GAC | ATT | ACC | CGC | GTG | GAG | TCA | GAG | AAC | AAG |
| Arg | His | Glu | Met 20 | Gly Gly Asp | Ile | Thr 25 | Arg | Vai | Glu | Ser | Glu 30 | Asn | Lys | ||
| GTA | GTA | ATC | CTG | GAC | TCT | TTC | GAC | CCG | CTC | CGA | GCG | GAG | GAG | GAT | GAG |
| Vai | Vai | Ile 35 | Leu | Asp | Ser | Phe | Asp 40 | Pro | Leu | Arg | Ala | Glu 45 | Glu | Asp | Glu |
| CGG | GAA | GTG | TCC | GTC | CCG | GCG | GAG | ATC | CTG | CGG | AAA | TCC | AAG | AAA | TTC |
| Arg | Glu | Vai | Ser | Vai | Pro | Ala | Glu | Ile | Leu | Arg | Lys | Ser | Lys | Lys | Phe |
55 60
| CCA Pro 65 | CCA GCG ATG | CCC GCA TGG GCA CGC CCG GAT TAC AAC CCT CCG CTG | 240 | |||||||||||||
| Pro | Ala | Met | Pro | Ala 70 | Trp | Ala Arg | Pro | Asp Tyr Asn Pro Pro Leu | ||||||||
| 75 | 80 | |||||||||||||||
| CTG | GAG | TCC | TGG | AAG | GCC | CCG | GAC | TAC | GTC | CCT | CCA | GTG | GTA | CAT | GGG | 288 |
| Leu | Glu | Ser | Trp | Lys | Ala | Pro | Asp | Tyr | Vai | Pro | Pro | Vai | Vai | His | Gly | |
| 85 | 90 | 95 | ||||||||||||||
| TGC | CCA | CTG | CCA | CCT | ACT | AAG | ACC | CCT | CCT | ATA | CCA | CCT | CCA | CGG | AGA | 336 |
| Cys | Pro | Leu | Pro | Pro | Thr | Lys | Thr | Pro | Pro | Ile | Pro | Pro | Pro | Arg Arg | ||
| 100 | 105 | 110 | ||||||||||||||
| AAG | AGG | ACA | GTT | GTT | CTG | ACA | GAA | TCC | ACC | GTG | TCT | TCT | GCC | CTG | GCG | 384 |
| Lys | Arg | Thr | Vai | Vai | Leu | Thr | Glu | Ser | Thr | Vai | Ser | Ser | Ala | Leu | Ala | • |
| 115 | 120 | 125 | ||||||||||||||
| GAG | CTT | GCC | ACA | ÂÂG | GCT | TTT | GGT | AGC | TCC | GGA | CCG | TCG | GCC | GTC | GAC | 432 |
| Glu | Leu | Ala | Thr | Lys | Ala | Phe | Gly | Ser | Ser | Gly | Pro | Ser | Ala | Vai | Asp | |
| 130 | 135 | 140 | ||||||||||||||
| AGC | GGC | ACG | GCA | ACC | GCC | CCT | CCt | GAC | CAA | TCC | TCC | GAC | GAC | GGC | GGA | 480 |
| Ser | Gly | Thr | Ala | Thr | Ala | Pro | Pro | Asp | Gin | Ser | Ser | Asp | Asp | Gly Gly | ||
| 145 | 150 | 155 | 160 | |||||||||||||
| GCA | GGA | TCT | GAC | GTT | GAG | TCG | TAT | TCC | TCC | ATG | CCC | CCC | CTT | GAG | GGG | 528 |
| Ala | Gly | Ser | Asp | Vai | Glu | Ser | Tyr | Ser | Ser | Met | Pro | Pro | Leu | Glu | Gly | |
| 165 | 170 | 175 | ||||||||||||||
| GAG | GCG | GGG | GAC | CCC | GAT | CTC | AGC | GAC | GGG | TCT | TGG | TCT | ACC | GTG | AGT | 576 |
| Glu | Pro | Gly Asp | Pro | Asp | Leu | Ser | Asp | Gly | Ser | Trp | Ser | Thr | Vai | Ser | ||
| 180 | 185 | 190 | ||||||||||||||
| GAG | GAG | GCC | GGT | GAG | GAC | GTC | GTC | TGC | TGC | TCG | ATG | TCC | TAC | ACA | TGG | 624 |
| Glu | Glu | Ala | Gly | Glu | Asp | Vai | Vai | Cys | Cys | Ser | Met | Ser | Tyr | Thr | Trp |
195 200 205
| ACA GGC Thr Gly | GCT Ala | CTG ATC ACG CCA TGC GCT GCG GAG GAA AGC AAG CTG CCC | 672 | |||||||||||||
| Leu Ile | Thr | Pro Cys 215 | Ala Ala | Glu | Glu Ser Lys 220 | Leu Pro | ||||||||||
| 210 | ||||||||||||||||
| ATC | AAC | GCG | TTG | AGC | AAC | TCT | TTG | CTG | CGT | CAC | CAC | AAC | ATG | GTC | TAC | 720 |
| Ile | Asn | Ala | Leu | Ser | Asn | Ser | Leu | Leu | Arg | His | His | Asn | Met | Val | Tyr | |
| 225 | 230 | 235 | 240 | |||||||||||||
| GCT | ACC | ACA | TCC | CGC | AGC | GCA | AGC | CAG | CGG | CAG | AAG | AAG | GTC | ACC | TTT | 768 |
| Ala | Thr | Thr | Ser | Arg | Ser | Ala | Ser | Gin | Arg | Gin | Lys | Lys | Val | Thr | Phe | |
| 245 | 250 | 255 | ||||||||||||||
| GAC | AGA | CTG | CAA | ATC | CTG | GAC | GAT | CAC | TAC | CAG | GAC | GTG | CTC | AAG | GAG | 816 |
| Asp | Arg | Leu | Gin | Ile | Leu | Asp | Asp | His | Tyr | Gin | Asp | Val | Leu | Lys | Glu | • |
| 260 | 265 | 270 | ||||||||||||||
| ATG | AAG | GCG | AAG | GCG | TCC | ACA | GTT | AAG | GCT | AAG | CTT | CTA | TCA | GTA | GAG | 864 |
| Met | Lys | Ala | Lys | Ala | Ser | Thr | Val | Lys | Ala | Lys | Leu | Leu | Ser | Val | Glu | |
| 275 | 280 | 285 | ||||||||||||||
| GAA | GCC | TGC | AAG | CTG | ACG | CCC | CCA | CAT | TCG | GCC | AAA | TCT | AAA | TTT | GGC | 912 |
| Glu | Ala | Cys | Lys | Leu | Thr | Pro | Pro | His | Ser | Ala | Lys | Ser | Lys | Phe | Gly | |
| 290 | 295 | 300 | ||||||||||||||
| TAT | GGG | GCA | AAG | GAC | GTC | CGG | AAC | CTA | TCC | AGC | AAG | GCC | ATT | AAC | CAC | 960 |
| Tyr | Gly | Ala | Lys | Asp | Val | Arg | Asn | Leu | Ser | Ser | Lys | Ala | Ile | Asn | His | |
| 305 | 310 | 315 | 320 | |||||||||||||
| ATC | CGC | TCC | GTG | TGG | GAG | GAC | TTG | TTG | GAA | GAC | ACT | GAA | ACA | CCA | ATT | 1008 |
| Ile | Arg | Ser | Val | Trp | Glu | Asp | Leu | Leu | Glu | Asp | Thr | Glu | Thr | Pro | Ile | |
| 325 | 330 | 335 | ||||||||||||||
| GAC | ACC | ACC | ATC | ATG | GCA | AAA | AAT | GAG | GTT | TTC | TGC | GTC | CAA | CCA | GAG | 1056 |
| Asp | Thr | Thr | Ile | Met | Ala | Lys | Asn | Glu | Val | Phe | Cys | Val | Gin | Pro | Glu |
340 345 350
| AGA GGA GGC CGC AAG | CCA Pro | GCT Ala | CGC CTT ATC GTG TTC CCA GAC TTG GGG | 1104 | |||||||
| Arg | Gly | Gly Arg 355 | Lys | Arg Leu 360 | Ile Vai | Phe | Pro Asp Leu 365 | Gly | |||
| GTC | CGT | GTG TGC | GAG | AAA | ATG | GCC CTC | TAT GAC | GTG | GTC TCC ACC | CTC | 1152 |
| Vai | Arg | Vai Cys | Glu | Lys | Met | Ala Leu | Tyr Asp | Vai | Vai Ser Thr | Leu | |
| 370 | 375 | 380 | |||||||||
| CCT | CAG | GCT GTG | ATG | GGC | TCC | TCG TAC | GGA TTC | CAG | TAT TCT CCT | GGA | 1200 |
| Pro | Gin | Ala Vai | Met | Gly | Ser | Ser Tyr Gly Phe | Gin | Tyr Ser Pro | Gly | ||
| 385 | 390 | 395 | 400 | ||||||||
| CAG | CGG | GTC GAG | TTC | CTG | GTG | AAC GCC | TGG AAA | TCA | AAG AAG ACC | CCT | 1248 |
| Gin | Arg | Vai Glu | Phe | Leu | Vai | Asn Ala | Trp Lys | Ser | Lys Lys Thr | Pro | |
| 405 | 410 | 415 | |||||||||
| ATG | GGC | TTT GCA | TAT | GAC | ACC | CGC TGT | TTT GAC | TCA | ACA GTC ACT | GAG | 1296 |
| Met | Gly | Phe Ala | Tyr | Asp | Thr | Arg Cys | Phe Asp | Ser | Thr Vai Thr | Glu | |
| 420 | 425 | 430 | |||||||||
| AAT | GAC | ATC CGT | GTA | GAG | GAG | TCA ATT | TAT CAA | TGT | TGT GAC TTG | GCC | 1344 |
| Asn | Asp | Ile Arg | Vai | Glu | Glu | Ser Ile | Tyr Gin | Cys | Cys Asp Leu | Ala | |
| 435 | 440 | 445 | |||||||||
| CCC | GAA | GCC AGA | CAG | GCC | ATA | AGG TCG | CTC ACA | GAG | CGG CTT TAT | ATC | 1392 |
| Pro | Glu | Ala Arg | Gin | Ala | Ile | Arg Ser | Leu Thr | Glu | Arg Leu Tyr | Ile | |
| 450 | 455 | 460 | |||||||||
| GGG | GGT | CCC CTG | ACT | AAT | TCA | AAA GGG | CAG AAC | TGC | GGC TAT CGC | CGG | 1440 |
| Gly Gly | Pro Leu | Thr | Asn | Ser | Lys Gly | Gin Asn | Cys | Gly Tyr Arg Arg | |||
| 465 | 470 | 475 | 480 | ||||||||
| TGC | CGC | GCG AGC | GGC | GTG | CTG | ACG ACT | AGC TGC | GGT | AAT ACC CTC | ACA | 1488 |
| Cys Arg | Ala Ser | Gly | Vai | Leu | Thr Thr | Ser Cys Gly | Asn Thr Leu | Thr |
485 490 495
| TGT TAC TTG AAG GCC TCT GCA | GCC TGT CGA GCT GCA AAG CTC CAG GAC | 1536 | ||||||||
| Gys Tyr Leu Lys | Ala Ser | Ala | Ala | Cys Arg 505 | Ala Ala Lys | Leu 510 | Gin | Asp | ||
| 500 | ||||||||||
| TGC ACG ATG | CTC | GTG TGC | GGA | GAC | GGC CTT | GTC GTT ATC | TGT | GAG | AGC | 1584 |
| Cys Thr Met | Leu | Vai Cys | Gly Asp | Asp Leu | Vai Vai Ile | Cys | Glu | Ser | ||
| 515 | 520 | 525 | ||||||||
| GCG GGA ACC | CAG | GAG GAC | GCG | GCG | AGC CTA | CGA GTC TTC | ACG | GAG | GCT | 1632 |
| Ala Gly Thr | Gin | Glu Asp | Ala | Ala | Ser Leu | Arg Vai Phe | Thr | Glu | Ala | |
| 530 | 535 | 540 | ||||||||
| ATG ACT AGG | TAC | TCT GCC | CCC | CCC | GGG GAC | CCG CCC CAA | CCA | GAA | TAC | 1680 |
| Met Thr Arg Tyr | Ser Ala | Pro | Pro | Gly Asp | Pro Pro Gin | Pro | Glu | Tyr | • | |
| 545 | 550 | 555 | 560 | |||||||
| GAC CTG GAG | TTG | ATA ACA | TCA | TGC | TCC TCC | AAT GTG TCG | GTC | GCG | CAC | 1728 |
| Asp Leu Glu | Leu | Ile Thr | Ser | Cys | Ser Ser | Asn Vai Ser | Vai | Ala | His | |
| 565 | 570 | 575 | ||||||||
| GAT GCA TCT | GGC | AAA AGG | GTA | TAC | TAC CTC | ACC CGT GAC | CCG | 1770 | ||
| Asp Ala Ser | Gly Lys Arg | Vai | Tyr Tyr Leu | Thr Arg Asp | Pro |
580 585 590
SEQ ID NO:4
TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente COMPRIMENTO DA SEQUÊNCIA: 1035 PARES DE BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: cADN para ARN genómico
ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B
FONTE EXPERIMENTAL IMEDIATA: clone JG3 de biblioteca cADN em lambda gtll
CARACTERÍSTICAS:
de 1 a 1035 pb na parte da poliproteína de PT-NANBH
PROPRIEDADES: codifica provavelmente as proteínas virais não estruturais
| ACA Thr | GAA Glu | GTG Val | GAT Asp | GGG GTG CGG CTG | CAC AGG TAC GCT CCG GCG TGC AAA | 48 | ||||||||||
| Gly Val 5 | Arg Leu | His | Arg 10 | Tyr Ala | Pro | Ala | Cys 15 | Lys | ||||||||
| CCT | CTC | CTA | CGG | GAG | GAG | GTC | ACA | TTC | CAG | GTC | GGG | CTC | AAC | CAA | TAC | 96 |
| Pro | Leu | Leu | Arg | Glu | Glu | Val | Thr | Phe | Gin | Val | Gly | Leu | Asn | Gin | Tyr | |
| 20 | 25 | 30 | ||||||||||||||
| CTG | GTT | GGG | TCG | CAG | CTC | CCA | TGC | GAG | CCC | GAA | CCG | GAT | GTA | GCA | GTG | 144 |
| Leu | Val | Gly | Ser | Gin | Leu | Pro | Cys | Glu | Pro | Glu | Pro | Asp | Val | Ala | Val |
40 45
| CTC | ACT | TCC | ATG | CTC | ACC | GAC | CCC | TCC | CAC | ATC | ACA | GCA | GAG | ACG | GCT | 192 |
| Leu | Thr | Ser | Met | Leu | Thr | Asp | Pro | Ser | His | lie | Thr | Ala | Glu | Thr | Ala | |
| 50 | 55 | 60 |
| AAG | CGC AGG | CTG | GCC | AGG GGG | TCT | CCC | CCC | TCC | TTG | GCC | AGC | TCT | TCA |
| Lys | Arg Arg | Leu | Ala | Arg Gly | Ser | Pro | Pro | Ser | Leu | Ala | Ser | Ser | Ser |
| 65 | 70 | 75 | 80 |
| GCT AGC Ala Ser | CAG TTG TCT GGC CCT | TCC TCG AAG GCG ACA TAC ATT ACC CAA | 288 | |||||||||||||
| Gin Leu Ser 85 | Gly Pro | Ser Ser | Lys 90 | Ala | Thr Tyr | Ile | Thr 95 | Gin | ||||||||
| AAT | GAC | TTC | CCA | GAC | GCT | GAC | CTC | ATC | GAG | GCC | AAC | CTC | CTG | TGG | CGG | 336 |
| Asn | Asp | Phe | Pro | Asp | Ala | Asp | Leu | Ile | Glu | Ala | Asn | Leu | Leu | Trp | Arg | |
| 100 | 105 | 110 | ||||||||||||||
| CAT | GAG | ATG | GGC | GGG | GAC | ATT | ACC | CGC | GTG | GAG | TCA | GAG | AAC | AAG | GTA | 384 |
| His | Glu | Met | Gly Gly | Asp | Ile | Thr | Arg | Vai | Glu | Ser | Glu | Asn | Lys | Vai | • | |
| 115 | 120 | 125 | ||||||||||||||
| GTA | ATC | CTG | GAC | TCT | TTC | GAC | CCG | CTC | CGA | GCG | GAG | GAG | GAT | GAG | CGG | 432 |
| Vai | Ile | Leu | Asp | Ser | Phe | Asp | Pro | Leu | Arg | Ala | Glu | Glu | Asp | Glu | Arg | |
| 130 | 135 | 140 | ||||||||||||||
| GAA | GTG | TCC | GTC | CCG | GCG | GAG | ATC | CTG | CGG | AAA | TCC | AAG | AAA | TTC | CCA | 480 |
| Glu | Vai | Ser | Vai | Pro | Ala | Glu | Ile | Leu | Arg Lys | Ser | Lys | Lys | Phe | Pro | ||
| 145 | 150 | 155 | 160 | |||||||||||||
| CCA | GCG | ATG | CCC | GCA | TGG | GCA | CGC | CCG | GAT | TAC | AAC | CCT | CCG | CTG | CTG | 528 |
| Pro | Ala | Met | Pro | Ala | Trp | Ala | Arg | Pro | Asp | Tyr | Asn | Pro | Pro | Leu | Leu | |
| 165 | 170 | 175 | ||||||||||||||
| GAG | TCC | TGG | AAG | GCC | CCG | GAC | TAC | GTC | CCT | CCA | GTG | GTA | CAT | GGG | TGC | 576 |
| Glu | Ser | Trp | Lys | Ala | Pro | Asp Tyr | Vai | Pro | Pro | Vai | Vai | His | Gly Cys |
180 185 190
CCA CTG CCA CCT ACT AAG ACC CCT CCT ATA CCA CCT CCA CGG AGA AAG 624
Pro Leu Pro Pro Thr Lys Thr Pro Pro Ile Pro Pro Pro Arg Arg Lys
195 200 205
| AGG ACA Arg Thr | GTT Val | GTT CTG ACA GAA TCC ACC GTG TCT TCT GCC CTG GCG GAG | ||||||||
| Val Leu | Thr | Glu Ser 215 | Thr Val | Ser | Ser Ala Leu 220 | Ala | Glu | |||
| 210 | ||||||||||
| CTT | GCC | ACA | AAG GCT | TTT | GGT AGC | TCC GGA | CCG | TCG GCC GTC | GAC | AGC |
| Leu | Aid | Thr | Lys Ala | Phe | Gly Ser | Ser Gly | Pro | Ser Ala Val | Asp | Ser |
| 225 | 230 | 235 | 240 | |||||||
| GGC | ACG | GCA | ACC GCC | CCT | CCT GAC | CAA TCC | TCC | GAC GAC GGC | GGA | GCA |
| Gly | Thr | Ala | Thr Ala | Pro | Pro Asp | Gin Ser | Ser | Asp Asp Gly Gly | Ala | |
| 245 | 250 | 255 | ||||||||
| GGA | TCT | GAC | GTT GAG | TCG | TAT TCC | TCC ATG | CCC | CCC CTT GAG | GGG | GAG |
| Gly | Ser | Asp | Val Glu | Ser | Tyr Ser | Ser Met | Pro | Pro Leu Glu | Gly | Glu |
| 260 | 265 | 270 | ||||||||
| CCG | GGG | GAC | CCC GAT | CTC | AGC GAC | GGG TCT | TGG | TCT ACC GTG | AGT | GAG |
| Pro | Gly Asp | Pro Asp | Leu | Ser Asp | Gly Ser | Trp | Ser Thr Val | Ser | Glu | |
| 275 | 280 | 285 | ||||||||
| GAG | GCC | GGT | GAG GAC | GTC | GTC TGC | TGC TCG | ATG | TCC TAC ACA | TGG | ACA |
| Glu | Ala | Gly | Glu .Asp | Val | Val Cys | Cys Ser | Met | Ser Tyr Thr | Trp | Thr |
| 290 | 295 | 300 | ||||||||
| GGC | GCT | CTG | ATC ACG | CCA | TGC GCT | GCG GAG | GAA | AGC AAG CTG | CCC | ATC |
| Gly | Ala | Leu | Ile Thr | Pro | Cys Ala | Ala Glu | Glu | Ser Lys Leu | Pro | Ile |
| 305 | 310 | 315 | 320 | |||||||
| AAC | GCG | TTG | AGC AAC | TCT | TTG CTG | CGT CAC | CAC | AAC ATG GTC | TAC | GCT |
| Asn | Ala | Leu | Ser Asn | Ser | Leu Leu | Arg His | His | Asn Met Val | Tyr | Ala |
| 325 | 330 | 335 | ||||||||
| ACC | ACA | TCC | CGC AGC | GCA | AGC CAG | CGG | ||||
| Thr | Thr | Ser | Arg Ser | Ala | Ser Gin | Arg |
345
672
720
768
816
864
912
960
1008
1035
340
SEQ ID NO:5
TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente
COMPRIMENTO DA SEQUÊNCIA: 834 PARES DE BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: cADN para ARN genómico
ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B
FONTE EXPERIMENTAL IMEDIATA: clone BR11 de biblioteca cADN em lambda gtll
CARACTERÍSTICAS:
de 1 a 834 pb na parte da poliproteína de PT-NANBH
PROPRIEDADES: codifica provavelmente as proteínas virais não estruturais
| AGA AAA ACC AAA | CGT AAC ACC Arg Asn Thr 5 | AAC CTC CGC CCA CAG GAC GTC AGG TTC | ||||||||
| Arg Lys | Thr | Lys | Asn Leu | Arg 10 | Pro | Gin | Asp | Vai Arg 15 | Phe | |
| CCG GGC | GGT | GGT | CAG ATC GTT | GGT GGA | GTT | TAC | CTG | TTG | CCG CGC | AGG |
| Pro Gly Gly Gly | Gin Ile Vai | Gly Gly | Vai | Tyr | Leu | Leu | Pro Arg Arg | |||
| 20 | 25 | 30 | ||||||||
| GGC CCC | AGG | TTG | GGT GTG CGC | GCG ACT | AGG | AAG | ACT | TCC | GAG CGG | TCG |
| Gly Pro | Arg | Leu | Gly Vai Arg | Ala Thr | Arg | Lys | Thr | Ser | Glu Arg | Ser |
| 35 | 40 | 45 | ||||||||
| CAA CCT | CGT | GGA | AGG CGA CAA | CCT ATC | CCC | AAG | GCT | CGC | CAG CCC | GAG |
| Gin Pro | Arg | Gly Arg Arg Gin | Pro Ile | Pro | Lys | Ala | Arg | Gin Pro | Glu | |
| 50 | 55 | 60 |
| GGC Gly 65 | AGG GCC TGG | GCT CAG CCC GGG TAC CCT TGG CCC CTC TAT GGC AAC | 240 | |||||||
| Arg | Ala Trp | Ala | Gin 70 | Pro | Gly Tyr | Pro | Trp Pro Leu Tyr Gly Asn | |||
| 75 | 80 | |||||||||
| GAG | GGC | ATG GGG | TGG | GCA | GGA | TGG CTC | CTG | TCA | CCC CGT GGC TCC CGG | 288 |
| Glu | Gly | Met Gly Trp 85 | Ala | Gly | Trp Leu | Leu 90 | Ser | Pro Arg Gly Ser Arg 95 | ||
| CCT | AGT | TGG GGC | CCC | ACT | GAC | CCC CGG | CGT | AGG | TCG CGT AAT TTG GGT | 336 |
| Pro | Ser | Trp Gly 100 | Pro | Thr | Asp | Pro Arg Arg Arg 105 | Ser Arg Asn Leu Gly 110 | |||
| AAA | GTC | ATC GAT | ACC | CTC | ACA | TGC GGC | TTC | GCC | GAC TCT CAT GGG GTA | 384 |
| Lys | Vai | lie Asp 115 | Thr | Leu | Thr | Cys Gly 120 | Phe | Ala | Asp Ser His Gly Vai 125 | |
| CAT | TCC | GCT CGT | CGG | CGC | TCC | CTT AGG | GGC | GCT | GCC AGG GCC CTG GCG | 432 |
| His | Ser 130 | Ala Arg Arg Arg | Ser 135 | Leu Arg Gly | Ala | Ala Arg Ala Leu Ala 140 | ||||
| CAT | GGC | GTC CGG | GTT | CTG | GAG | GAC GGC | GTG | AAC | TAT GCA ACA GGG AAT | 480 |
| His 145 | Gly | Vai Arg | Vai | Leu 150 | Glu | Asp Gly | Vai | Asn 155 | Tyr Ala Thr Gly Asn 160 | |
| TTA | CCC | GGT TGC | TCT | TTC | TCT | ATC TTC | CTC | TTG | GCT TTG CTG TCC TGT | 528 |
| Leu | Pro | Gly Cys | Ser 165 | Phe | Ser | Ile Phe | Leu 170 | Leu | Ala Leu Leu Ser Cys 175 | |
| TTG | ACC | ATT CCA | GCT | TCC | GCT | TAT GAA | GTG | CGC | AAC GTG TCC GGG ATC | 576 |
| Leu | Thr | Ile Pro 180 | Ala | Ser | Ala | Tyr Glu Vai 185 | Arg | Asn Vai Ser Gly lie 190 | ||
| TAC | CAT | GTC ACG | AAC | GAT | TGC | TCC AAC | TCA | AGC | ATC GTG TAC GAG ACA | 624 |
| Tyr | His | Vai Thr | Asn | Asp | Cys | Ser Asn | Ser | Ser | Ile Vai Tyr Glu Thr |
195 200 205
| GCG GAC | ATG ATC ATG CAC | ACC CCC GGG TGT GTG CCC TGT GTC CGG GAG | 672 | |||||||||
| Ala | Asp 210 | Met Ile | Met | His | Thr 215 | Pro | Gly Cys | Vai Pro 220 | Cys | Vai Arg | Glu | |
| GGT | AAT | TCC TCC | CGC | TGC | TGG | GTA | GCG CTC | ACT CCC | ACG | CTC GCG | GCC | 720 |
| Gly | Asn | Ser Ser | Arg Cys | Trp | Vai | Ala Leu | Thr Pro | Thr | Leu Ala | Ala | ||
| 225 | 230 | 235 | 240 | |||||||||
| AAG | GAC | GCC AGC | ATC | CCC | ACT | GCG | ACA ATA | CGA CGC | CAC | GTC GAT | TTG | 768 |
| Lys | Asp | Ala Ser | Ile | Pro | Thr | Ala | Thr Ile | Arg Arg | His | Vai Asp | Leu | |
| 245 | 250 | 255 | ||||||||||
| CTC | GTT | GGG GCG | GCT | GCC | TTC | TCG | TCC GCT | ATG TAC | GTG | GGG GAT | CTC | 816 |
| Leu | Vai | Gly Ala | Ala | Ala | Phe | Ser | Ser Ala | Met Tyr | Vai | Gly Asp | Leu | * |
| 260 | 265 | 270 | ||||||||||
| TGC | GGA | TCT GTT | TTC | CCG | 834 | |||||||
| Cys | Gly | Ser Vai | Phe | Pro | ||||||||
| 275 |
SEQ ID NO:6
TIPO DE SEQUÊNCIA: Nucleótido
COMPRIMENTO DA SEQUÊNCIA: 31 BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: bacteriófago lambda gtll
FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo d75
CARACTERÍSTÍCAS:
de 4 a 9 bases no local BamHI de 10 a 31 bases homólogas à parte a montate do gene lacZ flanqueando o local EcoRI no bacteriófago lambda gtll de 26 a 31 bases no local EcoRI
PROPRIEDADES: faz a primagem da síntese do ADN do vector fago em cADN inserido no local EcoRI e introduz um local BamHI adequado para a clonação subsequente nos vectores de expressão
TAAGGATCCC CCGTCAGTAT CGGCGGAATT C
SEQ ID NO:7
TIPO DE SEQUÊNCIA: Nucleótido
COMPRIMENTO DA SEQUÊNCIA: 30 BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: bacteriofago lambda gtll
FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonicleótidos; oligo d76
CARACTERÍSTICAS:
de 4 a 9 bases no local BamHI de 10 a 30 bases homólogas à parte a jusante do gene lacZ flanqueando o local EcoRl no bacteriofago lambda gtll
PROPRIEDADES: faz a primagem da síntese do ADN do vector fago em cADN inserido no local EcoRl e introduz um local BamHI adequado para a clonação subsequente nos vectores de expressão
TATGGATCCG TAGCGACCGG CGCTCAGCTG
SEQ ID NO:8
TIPO DE SEQUÊNCIA: Nucleótido
COMPRIMENTO DA SEQUÊNCIA: 19 BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B
FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; óligo d94
CARACTERÍSTICAS:
de l a 19 bases homólogas às bases 914 a 932 da banda de sentido de JG2 (SEQ ID NO:3)
PROPRIEDADES: faz a primagem da síntese do ADN na banda negativa do ARN/ADN genómico de PT-NANBH
ATGGGGCAAA GGACGTCCG
SEQ ID NO:9
TIPO DE SEQUÊNCIA: Nucleótido
COMPRIMENTO DA SEQUÊNCIA: 24 BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B
FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo d94
CARACTERÍSTICAS:
de 1 a 24 bases homólogas às bases 1620 a 1643 da banda de antisentido de JG2 (SEQ ID NO:3)
PROPRIEDADES: faz a primagem da síntese do ADN na banda positiva do ARN/ADN genómico de PT-NANBH
TACCTAGTCA TAGCCTCCGT GAAG 24
SEQ ID NO:10
TIPO DE SEQUÊNCIA: Nucleótido
COMPRIMENTO DA SEQUÊNCIA: 17 BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B
FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo NI
CARACTERÍSTICAS:
de 1 a 17 bases homólogas às bases 1033 a 1049 da banda de sentido de JG2 (SEQ ID NO:3)
PROPRIEDADES: faz a primagem da síntese do ADN na banda negativa do ARN/ADN genómico de PT-NANBH
GAGGTTTTCT GCGTCCA 17
SEQ ID NO:11
TIPO DE SEQUÊNCIA: Nucleótido
COMPRIMENTO DA SEQUÊNCIA: 17 BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B
FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo N2
CARACTERISTICAS:
de 1 a 17 bases homólogas às bases 1421 a 1437 da banda de anti-sentido de JG2 (SEQ ID NO:3)
PROPRIEDADES: faz a primagem da síntese do ADN na banda positiva do ARN/ADN genómico de PT-NANBH
GCCATAGCCG CAGTTCT 17
SEQ ID NO:12
TIPO DE SEQUÊNCIA: Nucleótido
COMPRIMENTO DA SEQUÊNCIA: 22 BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B
FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo dl64
CARACTERÍSTICAS:
de 1 a 22 bases homólogas às bases 10 a 31 da sequência na Fig 2 de Okamoto e col., Japão, J. Exp. Med. 1990, 60, 167-177, base 22 alterada de A para T para introduzir o local de reconhecimento Bgl2 de 8 a 13 bases do local de reconhecimento Bgl2
PROPRIEDADES: faz a primagem da síntese do ADN na banda negativa do ARN/ADN genómico de PT-NANBH e introduz um local Bgl2
CCACCATAGA TCTCTCCCCT GT 22
SEQ ID NO:13
TIPO DE SEQUÊNCIA: Nucleótido
COMPRIMENTO DA SEQUÊNCIA: 30 BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B
FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo dl37
CARACTERÍSTICAS:
de 1 a 30 bases homólogas às bases 154 a 183 da banda negativa de BR11 (SEQ ID NO : 5); bases 174, 177 e 178 modificadas para introduzir um local de reconhecimento EcoRI de 5 a 10 bases do local de reconhecimento EcoRI
PROPRIEDADES: faz a primagem da síntese do ADN na banda positiva do ARN/ADN genómico de PT-NANBH e introduz um local EcoRI para clonação
GCGAGAATTC GGGATAGGTT GTCGCCTTCC 30
SEQ ID NO:14
TIPO DE SEQUÊNCIA: Nucleótido
COMPRIMENTO DA SEQUÊNCIA: 27 BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B
FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo dl36
CARACTERÍSTICAS:
de 1 a 27 bases homólogas às bases 672 a 698 da banda positiva de BR11 (SEQ ID NO : 5) ; base 675 modificada para introduzir um local de reconhecimento EcoRI de 4 a 9 bases do local de reconhecimento EcoRI
PROPRIEDADES: faz a primagem da síntese do ADN na banda negativa do ARN/ADN genómico de PT-NANBH e introduz um local EcoRI para clonação
GGGGAATTCC TCCCGCTGCT GGGTAGC
SEQ ID NO:15
TIPO DE SEQUÊNCIA: Nucleótido
COMPRIMENTO DA SEQUÊNCIA: 28 BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: chimpanzé; soro infeccioso para hepatite pos-transfusão não-A, não-B
FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo dl55
CARACTERÍSTICAS:
de 1 a 28 bases homólogas às bases 462 a 489 da banda negativa da Fig 47, Pedido da Patente Europeia 88310922.5; bases 483 e 485, modificadas para introduzir um local de reconhecimento EcoRl de 5 a 10 bases do local de reconhecimento EcoRl
PROPRIEDADES: faz a primagem da síntese do ADN na banda positiva do ARN/ADN genómico de PT-NANBH e introduz um local EcoRl para clonação
ACGGGAATTC GACCAGGCAC CTGGGTGT
SEQ ID NO:16
TIPO DE SEQUÊNCIA: Nucleótido
COMPRIMENTO DA SEQUÊNCIA: 23 BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: chimpanzé; soro infeccioso para hepatite pos-transfusão não-A, não-B
FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo dl56
CARACTERÍSTICAS:
de 1 a 23 bases homólogas às bases 3315 a 3337 da banda positiva da Fig 47, Pedido da Patente Europeia 88310922.5; bases 3323 modificada para C para introduzir um local de reconhecimento EcoRI de 4 a 9 bases do local de reconhecimento EcoRI
PROPRIEDADES: faz a primagem da síntese do ADN na banda negativa do ARN/ADN genómico de PT-NANBH e introduz um local EcoRI para clonação
CTTGAATTCT GGGAGGGCGT CTT
SEQ ID NO:17
TIPO DE SEQUÊNCIA: Nucleótido
COMPRIMENTO DA SEQUÊNCIA: 29 BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B
FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo d92
CARACTERÍSTICAS:
de 1 a 29 bases homólogas às bases 36 a 64 da banda negativa de JG2 (SEQ ID NO : 3); bases 57, 58 e 60 modificadas para introduzir um local de reconhecimento EcoRI de 5 a 10 bases do local de reconhecimento EcoRI
PROPRIEDADES: faz a primagem da síntese do ADN na banda positiva do ARN/ADN genómico de PT-NANBH e introduz um local EcoRI para clonação
CGCCGAATTC ATGCCGCCAC AGGAGGTTG
SEQ ID NO:18
TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente
COMPRIMENTO DA SEQUÊNCIA: 504 PARES DE BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: cADN para ARN genómico
ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B FONTE EXPERIMENTAL IMEDIATA: clone 164/137
CARACTERÍSTÍCAS:
de 398 a 504 pb início da poliproteína PT-NANBH
PROPRIEDADES: codifica provavelmente as proteínas virais não estruturais
GATCACTCCC CTGTGAGGAA CTACTGTCTT CACGCAGAAA GCGTCTAGCC ATGGCGTTAG 60 TATGAGTGTC GTGCAGCCTC CAGGACCCCC CCTCCCGGGA GAGCCATAGT GGTCTGCGGA 120 ACCGGTGAGT ACACCGGAAT TGCCAGGACG ACCGGGTCCT TTCTTGGATT AACCCGCTCA 180 ATGCCTGGAG ATTTGGGCGT GCCCCCGCAA GACTGCTAGC CGAGTAGTGT TGGGTCGCGA 240 AAGGCCTTGT GGTACTGCCT GATAGGGTGC TTGCGAGTGC CCCGGGAGGT CTCGTAGACC 300
| GTGCACC ATG | AGC ACG AAT CCT AAA CCT CAA AGA AAA ACC AAA CGT AAC | 349 | ||||||
| Met | Ser Thr | Asn | Pro 5 | Lys Pro Gin Arg | Lys 10 | Thr Lys Arg Asn | ||
| ACC | AAC CGC | CGC CCA | CAG | GAC | GTC AAG TTC CCG | GGC | GGT GGT CAG ATC | 397 |
| Thr | Asn Pro | Arg Pro | Gin | Asp | Vai Lys Phe Pro | Gly Gly Gly Gin Ile | ||
| 15 | 20 | 25 | 30 | |||||
| GTT | GGT GGA | GTT TAC | CTG | TTG | CCG CGC AGG GGC | CCC | AGG TTG GGT GTG | 445 |
| Vai | Gly Gly | Vai Tyr | Leu | Leu | Pro Arg Arg Gly | Pro Arg Leu Gly Vai |
40 45
CGC GCG ACT AGG AAG ACT TCC GAG CGG TCG CAA CCT CGT GGA AGG CGA Arg Ala Thr Arg Lys Thr Ser Glu Arg Ser Gin Pro Arg Gly Arg Arg
55 60
493
CAA CCT ATC CC Gin Pro Ile Pro
504
SEQ ID NO:19
TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente COMPRIMENTO DA SEQUÊNCIA: 1107 PARES DE BASES
No DE BANDAS: única topologia: linear
TIPO DE MOLÉCULA: cADN para ARN genómico
ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B FONTE EXPERIMENTAL IMEDIATA: clone 136/155
CARACTERÍSTICAS:
de 1 a 1107 pb de parte da poliproteína PT-NANBH
PROPRIEDADES: codifica provavelmente as proteínas virais não estruturais
| TCC | TCC | CGC | TGC | TGG | GTA | GCG | CTC | ACT | CCC | ACG | CTC | GCG | GCC | AAG | GAC |
| Ser | Ser | Arg | Cys | Trp 5 | Vai | Ala | Leu | Thr | Pro 10 | Thr | Leu | Ala | Ala | Lys 15 | Asp |
| GCC | AGC | ATC | CCC | ACT | GCG | ACA | ATA | CGA | CGC | CAC | GTC | GAT | TTG | CTC | GTT |
| Ala | Ser | Ile | Pro 20 | Thr | Ala | Thr | Ile | Arg Arg 25 | His | Vai | Asp | Leu 30 | Leu | Vai | |
| GGG | GCG | GCT | GCC | TTC | TGC | TCC | GCT | ATG | TAC | GTG | GGG | GAT | CTC | TGC | GGA |
| Gly | Ala | Ala 35 | Ala | Phe | Cys | Ser | Ala 40 | Met | Tyr | Vai | Gly Asp 45 | Leu | Cys | Gly | |
| TCT | GTT | TTC | CTC | GTC | TCT | CAG | CTG | TTC | ACC | TTC | TCG | CCT | CGC | CGA | CAT |
| Ser | Vai 50 | Phe | Leu | Vai | Ser | Gin 55 | Leu | Phe | Thr | Phe | Ser 60 | Pro | Arg Arg | His |
| CAG Gin 65 | ACG GTA CAG Thr Vai Gin | GAC TGC | AAT TGT TCA ATC TAT CCC GGC CAC GTA TCA | 240 | ||||||||||||
| Asp | Cys 70 | Asn | Cys | Ser Ile | Tyr 75 | Pro | Gly | His Vai | Ser 80 | |||||||
| GGT | CAC | CGC | ATG | GCT | TGG | GAT | ATG | ATG | ATG | AAC | TGG | TCA | CCT | ACA | GCA | 288 |
| Gly | His | Arg | Met | Ala | Trp | Asp | Met | Met | Met | Asn | Trp | Ser | Pro | Thr | Ala | |
| 85 | 90 | 95 | ||||||||||||||
| GCC | CTA | GTG | GTA | TCG | CAG | CTA | CTC | CGG | ATC | CCA | CAA | GCT | GTC | GTG | GAC | 336 |
| Ala | Leu | Vai | Vai | Ser | Gin | Leu | Leu | Arg | Ile | Pro | Gin | Ala | Vai | Vai | Asp | |
| 100 | 105 | 110 | ||||||||||||||
| ATG | GTG | GCG | GGG | GCC | CAC | TGG | GGA | GTC | CTG | GCG | GGC | CTT | GCC | TAC | TAT | 384 |
| Met | Vai | Ala | Gly | Ala | His | Trp | Gly | Vel | Leu | Ala | Gly | Leu | Ala | Tyr | Tyr | |
| 115 | 120 | 125 | ||||||||||||||
| TCC | ATG | GTG | GGG | AAC | TGG | GCT | AAG | GTC | TTG | GTT | GTG | ATG | CTA | CTC | TTT | 432 |
| Ser | Met | Vai | Gly | Asn | Trp | Ala | Lys | Vai | Leu | Vai | Vai | Met | Leu | Leu | Phe | |
| 130 | 135 | 140 | ||||||||||||||
| GCC | GGC | GTT | GAC | GGG | GAA | CCT | TAO | ACG | ACA | GGG | GGG | ACA | CAC | GGC | CGC | 480 |
| Ala | Gly | Vai | Asp | Gly | Glu | Pro | Tyr | Thr | Thr | Gly Gly | Thr | His | Gly Arg | |||
| 145 | 150 | 155 | 160 | |||||||||||||
| GCC | GCC | CAC | GGG | CTT | ACA | TCC | CTC | TTC | ACA | CCT | GGG | CCG | GCT | CAG | AAA | 528 |
| Ala | Ala | His | Gly | Leu | Thr | Ser | Leu | Phe | Thr | Pro | Gly | Pro | Ala | Gin | Lys | |
| 165 | 170 | 175 | ||||||||||||||
| ATC | CAG | CTT | GTA | AAC | ACC | AAC | GGC | AGC | TGG | CAC | ATC | AAC | AGA | ACT | GCC | 576 |
| Ile | Gin | Leu | Vai | Asn | Thr | Asn | Gly | Ser | Trp | His | Ile | Asn | Arg | Thr | Ala | |
| 180 | 185 | 190 | ||||||||||||||
| TTG | AAC | TGC | AAT | GAC | TCC | CTC | CAA | ACT | GGG | TTC | CTT | GCC | GCG | CTG | TTC | 624 |
| Leu | Asn | Cys | Asn | Asp | Ser | Leu | Gin | Thr | Gly | Phe | Leu | Ala | Ala | Leu | Phe | |
| 195 | 200 | 205 |
| TAC ACG Tyr Thr | CAC His | AGG TTC AAT GCG TCC GGA TGC TCA GAG CGC ATG GCC AGC | 672 | |||||||||||||
| Arg Phe | Asn | Ala Ser 215 | Gly Cys | Ser | Glu Arg 220 | Met Ala | Ser | |||||||||
| 210 | ||||||||||||||||
| TGC | CGC | CCC | ATT | GAC | CAG | TTC | GAT | CAG | GGG | TGG | GGT | CCC | ATC | ACT | TAT | 720 |
| Cys | Arg | Pro | Ile | Asp | Gin | Phe | Asp | Gin | Gly | Trp | Gly | Pro | Ile | Thr | Tyr | |
| 225 | 230 | 235 | 240 | |||||||||||||
| AAT | GAG | TCC | CAC | GGC | TTG | GAC | CAG | AGG | CCC | TAT | TGC | TGG | CAC | TAC | GCA | 768 |
| Asn | Glu | Ser | His | Gly | Leu | Asp | Gin | Arg | Pro | Tyr | Cys | Trp | His | Tyr | Ala | |
| 245 | 250 | 255 | ||||||||||||||
| CCT | CAA | CCG | TGT | GGT | ATC | GTG | CCC | GCG | TTG | CAG | GTG | TGT | GGC | CCA | GTG | 816 |
| Pro | Gin | Pro | Cys | Gly | Ile | Vai | Pro | Ala | Leu | Gin | Vai | Cys | Gly | Pro | Vai | • |
| 260 | 265 | 270 | ||||||||||||||
| TAC | TGT | TTC | ACT | CCA | AGC | CCT | GTT | GTG | GTG | GGG | ACG | ACC | GAT | CGT | TTC | 864 |
| Tyr | Cys | Phe | Thr | Pro | Ser | Pro | Vai | Vai | Vai | Gly | Thr | Thr | Asp | Arg | Phe | |
| 275 | 280 | 285 | ||||||||||||||
| GGC | GCC | CCT | ACG | TAC | AGA | TGG | GGT | GAG | AAT | GAG | ACG | GAC | GTG | CTG | CTT | 912 |
| Gly | Ala | Pro | Thr | Tyr | Arg | Trp | Gly | Glu | Asn | Glu | Thr | Asp | Vai | Leu | Leu | |
| 290 | 295 | 300 | ||||||||||||||
| CTC | AAC | AAC | ACG | CGG | CCG | CCA | CGG | GGC | AAC | TGG | TTC | GGC | TGT | ACA | TGG | 960 |
| Leu | Asn | Asn | Thr | Arg | Pro | Pro | Arg Gly | Asn | Trp | Phe | Gly Cys | Thr | Trp | |||
| 305 | 310 | 315 | 320 | |||||||||||||
| ATG | AAT | AGC | ACC | GGG | TTC | ACC | AAG | ACG | TGT | GGG | GGC | CCC | CCG | TGC | AAC | 1008 |
| Met | Asn | Ser | Thr | Gly | Phe | Thr | Lys | Thr | Cys | Gly Gly | Pro | Pro | Cys | Asn | ||
| 325 | 330 | 335 | ||||||||||||||
| ATC | GGG | GGG | GTC | GGC | AAC | AAC | ACT | TTG | ATC | TGC | CCC | ACG | GAC | TGC | TTC | 1056 |
| Ile | Gly Gly | Vai | Gly | Asn | Asn | Thr | Leu | Ile | Cys | Pro | Thr | Asp | Cys | Phe |
340 345 350
CGG AAG Arg Lys
TTG
1107
Leu
CAT CCC GAG GCC ACT TAC ACC AAA TGC GGT TCG GGG CCT TGG 1104
His Pro Glu Ala Thr Tyr Thr Lys Cys Gly Ser Gly Pro Trp 355 360 365
SEQ ID NO:20
TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente COMPRIMENTO DA SEQUÊNCIA: 2043 PARES DE BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: cADN para ARN genómico
ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B FONTE EXPERIMENTAL IMEDIATA: clone 156/92
CARACTERISTICAS:
de 1 a 2043 pb na parte da poliproteína PT-NANBH
PROPRIEDADES: codifica provavelmente as proteínas virais não estruturais
| TGG | GAG | GGC | GTC | TTC | ACA | GGC | CTC | ACC | CAC | GTG | GAT | GCC | CAC | TTC | CTG |
| Trp | Glu | Gly | Vai | Phe 5 | Thr | Gly | Leu | Thr | His 10 | Vai | Asp | Ala | His | Phe 15 | Leu |
| TCC | CAA | ACA | AAG | CAG | GCA | GGA | GAC | AAC | TTC | CCC | TAC | CTG | GTG | GCG | TAC |
| Ser | Gin | Thr | Lys 20 | Gin | Ala | Gly Asp | Asn 25 | Phe | Pro | Tyr | Leu | Vai 30 | Ala | Tyr | |
| CAG | GCT | ACT | GTG | TGC | GCT | AGG | GCC | CAG | GCC | CCA | CCT | CCA | TCA | TGG | GAT |
| Gin | Ala | Thr 35 | Vai | Cys | Ala | Arg | Ala 40 | Gin | Ala | Pro | Pro | Pro 45 | Ser | Trp | Asp |
| CAA | ATG | TGG | AAG | TGT | CTC | ATA | CGG | CTA | AAG | CCT | ACT | CTG | CGC | CCG | CCA |
| Gin | Met 50 | Trp | Lys | Cys | Leu | Ile 55 | Arg | Leu | Lys | Pro | Thr 60 | Leu | Arg | Gly | Pro |
| ACA Thr 65 | CCC TTG CTG | TAT AGG CTG GGA GCC GTC CAA AAC GAG GTC ACC CTC | 240 | |||||||||||||
| Pro | Leu | Leu | Tyr | Arg 70 | Leu | Gly Ala | Val | Gin Asn Glu Val Thr Leu | ||||||||
| 75 | 80 | |||||||||||||||
| ACA | CAC | CCC | ATA | ACC | AAA | TTC | ATC | ATG | GCA | TGC | ATG | TCA | GCC | GAC | CTG | 288 |
| Thr | His | Pro | Ile | Thr | Lys | Phe | Ile | Met | Ala | Cys | Met | Ser | Ala | Asp | Leu | |
| 85 | 90 | 95 | ||||||||||||||
| GAG | GTC | GTC | ACG | AGC | ACC | TGG | GTG | CTG | GTG | GGC | GGG | GTC | CTT | GCA | GCT | 336 |
| Glu Val | Val | Thr | Ser | Thr | Trp | Val | Leu | Val | Gly Gly | Val | Leu | Ala | Ala | |||
| 100 | 105 | 110 | ||||||||||||||
| CTG | GCT | GCG | TAT | TGC | TTG | ACA | ACA | GGC | AGC | GTG | GTC | ATT | GTG | GGT | AGG | 384 |
| Leu | Ala | Ala | Tyr Cys | Leu | Thr | Thr | Gly | Ser | Val | Val | Ile | Val | Gly | Arg | • | |
| 115 | 120 | 125 | ||||||||||||||
| ATC | ATC | TTG | TCC | GGG | CGG | CCG | GCT | ATT | GTT | CCC | GAC | AGG | GAA | GTC | CTC | 432 |
| Ile | Ile | Leu | Ser | Gly Arg | Pro | Ala | Ile | Val | Pro | Asp | Arg | Glu | Val | Leu | ||
| 130 | 135 | 140 | ||||||||||||||
| TAC | CAG | GAG | TTC | GAT | GAG | ATG | GAA | GAG | TGC | GCG | TCG | CAC | CTC | CCT | TAC | 480 |
| Tyr | Gin | Glu | Phe | Asp | Glu | Met | Glu | Glu | Cys | Ala | Ser | His | Leu | Pro | Tyr | |
| 145 | 150 | 155 | 160 | |||||||||||||
| ATC | GAG | CAG | GGA | ATG | CAG | CTC | GCC | GAG | CAG | TTC | AAG | CAA | AAA | GCG | CTC | 528 |
| Ile | Glu | Gin | Gly | Met | Gin | Leu | Ala | Glu | Gin | Phe | Lys | Gin | Lys | Ala | Leu | |
| 165 | 170 | 175 | ||||||||||||||
| GGG | TTG | CTG | CAG | ACA | GCC | ACC | AAG | GAA | GCG | GAG | GCC | GCT | GCT | CCC | GTG | 576 |
| Gly | Leu | Leu | Gin | Thr | Ala | Thr | Lys | Gin | Ala | Glu | Ala | Ala | Ala | Pro | Val | |
| 180 | 185 | 190 | ||||||||||||||
| GTG | GAG | TCC | AAG | TGG | CGA | GCC | CTT | GAG | ACC | TTC | TGG | GCG | AAA | CAC | ATG | 624 |
| Val | Glu | Ser | Lys | Trp | Arg | Ala | Leu | Glu | Thr | Phe | Trp | Ala | Lys | His | Met |
195 200 205
| TGG Trp | AAC TTC ATC AGC GGG | ATA CAG TAC TTA GCA GGC TTG TCC ACT CTG | 672 | |||||||||||||
| Asn Phe 210 | Ile Ser | Gly | Ile Gin 215 | Tyr | Leu | Ala | Gly Leu 220 | Ser Thr | Leu | |||||||
| CCT | GGG | AAT | CCC | GCG | ATT | GCA | TCA | CTG | ATG | GCG | TTC | ACA | GCC | TCT | GTC | 720 |
| Pro | Gly | Asn | Pro | Ala | Ile | Ala | Ser | Leu | Met | Ala | Phe | Thr | Ala | Ser | Vai | |
| 225 | 230 | 235 | 240 | |||||||||||||
| ACT | AGC | CCG | CTC | ACC | ACC | CAA | TCT | ACC | CTC | CTG | CTT | AAC | ATC | CTG | GGG | 768 |
| Thr | Ser | Pro | Leu | Thr | Thr | Gin | Ser | Thr | Leu | Leu | Leu | Asn | Ile | Leu | Gly | |
| 245 | 250 | 255 | ||||||||||||||
| GGA | TGG | GTA | GCC | GCC | CAA | CTC | GCT | CCC | CCC | AGT | GCT | GCT | TCA | GCT | TTC | 816 |
| Gly | Trp | Vai | Ala | Ala | Gin | Leu | Ala | Pro | Pro | Ser | Ala | Ala | Ser | Ala | Phe | • |
| 260 | 265 | 270 | ||||||||||||||
| GTA | GGC | GCC | GGC | ATT | GCT | GGT | GCG | GCT | GTT | GGC | AGC | ATA | GGC | CTT | GGG | 864 |
| Vai | Gly | Ala | Gly | Ile | Ala | Gly | Ala | Ala | Vai | Gly | Ser | Ile | Gly | Leu | Gly | |
| 275 | 280 | 285 | ||||||||||||||
| AAG | GTG | CTT | GTG | GAC | ATC | TTG | GCG | GGC | TAT | GGA | GCA | GGA | GTG | GCA | GGC | 912 |
| Lys | Vai | Leu | Vai | Asp | Ile | Leu | Ala | Gly Tyr | Gly | Ala | Gly | Vai | Ala | Gly | ||
| 290 | 295 | 300 | ||||||||||||||
| GCG | CTC | GTG | GCC | TTT | AAG | GTC | ATG | AGC | GGC | GAA | ATG | CCC | TCC | ACC | GAG | 960 |
| Ala | Leu | Vai | Ala | Phe | Lys | Vai | Met | Ser | Gly | Glu | Met | Pro | Ser | Thr | Glu | |
| 305 | 310 | 315 | 320 | |||||||||||||
| GAC | CTG | GTT | AAC | TTA | CTC | CCT | GCC | ATC | CTC | TCT | CCT | GGT | GCC | CTG | GTC | 1008 |
| Asp | Leu | Vai | Asn | Leu | Leu | Pro | Ala | Ile | Leu | Ser | Pro | Gly | Ala | Leu | Vai | |
| 325 | 330 | 335 | ||||||||||||||
| GTC | GGG | GTC | GTG | TGC | GCA | GCG | ATA | CTG | CGT | CGG | CAC | GTG | GGT | CCA | GGG | 1056 |
| Vai | Gly | Vai | Vai | Cys | Ala | Ala | Ile | Leu | Arg Arg | His | Vai | Gly | Pro | Gly |
340 345 350
| GAG GGG GCT GTG CAG | TGG Trp | ATG Met | AAC CGG CTG ATA GCG TTC GCC TCG CGG | 1104 | ||||||
| Glu | Gly | Ala Vai 355 | Gin | Asn Arg 360 | Leu Ile | Ala | Phe Ala Ser Arg 365 | |||
| GGT | AAC | CAT GTT | TCC | CCC | ACG | CAC TAT | GTG CCA | GAG | AGC GAC GCC GCA | 1152 |
| Gly | Asn 370 | His Vai | Ser | Pro | Thr 375 | His Tyr | Vai Pro | Glu 380 | Ser Asp Ala Ala | |
| GCA | CGT | GTC ACT | CAG | ATC | CTC | TCC GAC | CTT ACT | ATC | ACC CAA CTG TTG | 1200 |
| Ala 385 | Arg | Vai Thr | Gin | Ile 390 | Leu | Ser Asp | Leu Thr 395 | Ile | Thr Gin Leu Leu 400 | |
| AAG | AGG | CTC CAC | CAG | TGG | ATT | AAC GAG | GAC TGC | TCC | ACG CCC TGC TCC | 1248 |
| Lys | Arg | Leu His | Gin 405 | Trp | Ile | Asn Glu | Asp Cys 410 | Ser | Thr Pro Cys Ser 415 | |
| GGC | TCG | TGG CTA | AGG | GAT | GTT | TGG GAC | TGG ATA | TGC | ACA GTT TTG GCT | 1296 |
| Gly | Ser | Trp Leu 420 | Arg Asp | Vai | Trp Asp 425 | Trp Ile | Cys | Thr Vai Leu Ala 430 | ||
| GAC | TTC | AAG ACC | TGG | CTC | CAG | TCC AAG | CTC CTG | CCG | CGA TTA CCG GGA | 1344 |
| Asp | Phe | Lys Thr 435 | Trp | Leu | Gin | Ser Lys 440 | Leu Leu | Pro | Arg Leu Pro Gly 445 | |
| GTC | CCC | TTT TTC | TCA | TGC | CAA | CGT GGG | TAC AAG | GGG | GTC TGG CGG GGA | 1392 |
| Vai | Pro 450 | Phe Phe | Ser | Cys | Gin 455 | Arg Gly Tyr Lys | Gly 460 | Vai Trp Arg Gly | ||
| GAC | GGC | ATC ATG | CAG | ACC | ACC | TGC TCA | TGT GGA | GCA | CAG ATC ACC GGA | 1440 |
| Asp 465 | Gly | Ile Met | Gin | Thr 470 | Thr | Cys Ser | Cys Gly 475 | Ala | Gin Ile Thr Gly 480 | |
| CAT | GTC | AAA AAC | GGT | TCC | ATG | AGG ATC | GTT GGG | CCT | AAG ACC TGT AGT | 1488 |
| His | Vai | Lys Asn | Gly | Ser | Met | Arg Ile | Vai Gly | Pro | Lys Thr Cys Ser |
485 490 495
| AAC ATG | TGG CAT | GGA ACA TTC CCC | ATC AAC | GCA TAC ACC ACG GGC CCC | 1536 | ||||||
| Asn | Met | Trp | His 500 | Gly Thr Phe | Pro | Ile 505 | Asn | Ala Tyr Thr | Thr Gly 510 | Pro | |
| TGC | ACG | CCC | TCC | CCA GCG CCA | AAC | TAT | TCC | AGG GCG CTG | TGG CGG | GTG | 1584 |
| Cys | Thr | Pro 515 | Ser | Pro Ala Pro | Asn 520 | Tyr | Ser | Arg Ala Leu 525 | Trp Arg | Vai | |
| GCT | GCT | GAG | GAG | TAC GTG GAG | GTT | ACG | CGG | GTG GGG GAT | TTC CAC | TAC | 1632 |
| Ala | Ala 530 | Glu | Glu | Tyr Vai Glu 535 | Vai | Thr | Arg | Vai Gly Asp 540 | Phe His | Tyr | |
| GTG | ACG | AGC | ATG | ACC ACT GAC | AAC | GTA | AAA | TGC CCG TGC | CAG GTT | CCA | 1680 |
| Vai 545 | Thr | Ser | Met | Thr Thr Asp 550 | Asn | Vai | Lys | Cys Pro Cys 555 | Gin Vai | Pro 560 | • |
| GCC | CCC | GAA | TTC | TTC ACA GAA | GTG | GAT | GGG | GTG CGG CTG | CAC AGG | TAC | 1728 |
| Ala | Pro | Glu | Phe | Phe Thr Glu 565 | Vai | Asp | Gly 570 | Vai Arg Leu | His Arg 575 | Tyr | |
| GCT | CCG | GCG | TGC | AAA CCT CTC | CTA | CGG | GAG | GAG GTC ACA | TTC CAG | GTC | 1776 |
| Ala | Pro | Ala | Cys 580 | Lys Pro Leu | Leu | Arg 585 | Glu | Glu Vai Thr | Phe Gin 590 | Vai | |
| GGG | CTC | AAC | CAA | TAC CTG GTT | GGG | TCG | CAG | CTC CCA TGC | GAG CCC | GAA | 1824 |
| Gly | Leu | Asn 595 | Gin | Tyr Leu Vai | Gly 600 | Ser | Gin | Leu Pro Cys 605 | Glu Pro | Glu | |
| CCG | GAT | GTA | GCA | GTG CTC ACT | TCC | ATG | CTC | ACC GAC CCC | TCC CAC | ATC | 1872 |
| Pro | Asp 610 | Vai | Ala | Vai Leu Thr 615 | Ser | Met | Leu | Thr Asp Pro 620 | Ser His | Ile | |
| ACA | GCA | GAG | ACG | GCT AAG CGC | AGG | CTG | GCC | AGG GGG TCT | CCC CCC | TCC | 1920 |
| Thr | Ala | Glu | Thr | Ala Lys Arg Arg | Leu | Ala | Arg Gly Ser | Pro Pro | Ser |
625
630
635
640
| TTG | GCC | AGC | TCT | TCA | GCT | AGC | CAG | TTG | TCT | GCG | CCT | TCC | TCG | AAG | GCG 1968 |
| Leu | Ala | Ser | Ser | Ser | Ala | Ser | Gin | Leu | Ser | Ala | Pro | Ser | Ser | Lys | Ala |
| 645 | 650 | 655 | |||||||||||||
| ACA | TAC | ATT | ACC | CAA | AAT | GAC | TTC | CCA | GAC | GCT | GAC | CTC | ATC | GAG | GCC 2016 |
| Thr | Tyr | Ile | Thr | Gin | Asn | Asp | Phe | Pro | Asp | Ala | Asp | Leu | lie | Glu | Ala |
| 660 | 665 | 670 | |||||||||||||
| AAC | CTC | CTG | TGG | CGG | CAT | GAG | ATG | GGC | 2043 | ||||||
| Asn | Leu | Leu | Trp | Arg | His | Glu | Met | Gly |
675
680
SEQ ID NO:21
TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente COMPRIMENTO DA SEQUÊNCIA: 2116 PARES DE BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: cADN para ARN genómico
ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B
FONTE EXPERIMENTAL IMEDIATA: contig formado por clones de cADN do terminal 5' do genoma
CARACTERÍSTICAS:
de 308 a 2116 pb do início da poliproteína PT-NANBH
PROPRIEDADES: codifica provavelmente as proteínas virais estruturais e não estruturais
GATCACTCCC CTGTGAGGAA CTACTGTCTT CACGCAGAAA GCGTCTAGCC ATGGCGTTAG 60 TATGAGTGTC GTGCAGCCTC CAGGACCCÔC CCTCCCGGGA GAGCCATAGT GGTCTGCGGA 120 ACCGGTGAGT ACACCGGAAT TGCCAGGACG ACCGGGTCCT TTCTTGGATT AACCÇGCTCA 180 ATGCCTGGAG ATTTGGGCGT GCCCCCGCAA GACTGCTAGC CGAGTAGTGT TGGGTCGCGA 240 AAGGCCTTGT GGTACTGCCT GATAGGGTGC TTGCGAGTGC CCCGGGAGGT CTCGTAGACC 300
| GTGCACC ATG | AGC ACG AAT CCT AAA CCT CAA AGA AAA ACC AAA CGT AAC | 349 | |||||||
| Met | Ser Thr | Asn | Pro 5 | Lys Pro Gin Arg | Lys 10 | Thr Lys Arg | Asn | ||
| ACC | AAC CGC | CGC CCA | CAG | GAC | GTC AAG TTC CCG | GGC | GGT GGT CAG | ATC | 397 |
| Thr | Asn Pro | Arg Pro | Gin | Asp | Val Lys Phe Pro | Gly Gly Gly Gin | Ile | ||
| 15 | 20 | 25 | 30 | ||||||
| GTT | GGT GGA | GTT TAC | CTG. | TTG | ÇCG CGC AGG GGC | cçc | AGG TTG GGT | GTG | 445 |
| Val | Gly Gly | Val Tyr | Leu | Leu | Pro Arg Arg Gly Pro Arg Leu Gly | Val |
40 45
| CGC GCG ACT AGG AAG ACT TCC GAG CGG TCG CAA CCT CGT GGA AGG CGA | 493 | ||||||
| Arg | Ala Thr | Arg Lys Thr Ser Glu Arg | Ser Gin | Pro Arg Gly 60 | Arg Arg | ||
| 50 | 55 | ||||||
| CAA | CCT ATC | CCC AAG GCT | CGC CAG CCC | GAG GGC | AGG GCC TGG | GCT CAG | 541 |
| Gin | Pro Ile 65 | Pro Lys Ala | Arg Gin Pro 70 | Glu Gly Arg Ala Trp 75 | Ala Gin | ||
| CCC | GGG TAC | CCT TGG CCC | CTC TAT GGC | AAC GAG | GGC ATG GGG | TGG GCA | 589 |
| Pro | Gly Tyr 80 | Pro Trp Pro | Leu Tyr Gly 85 | Asn Glu | Gly Met Gly Trp Ala 90 | ||
| GGA | TGG CTC | CTG TCA CCC | CGT GGC TCC | CGG CCT | AGT TGG GGC | CCC ACT | 637 |
| Gly 100 | Trp Leu | Leu Ser Pro 105 | Arg Gly Ser | Arg Pro 110 | Ser Trp Gly | Pro Thr 115 | |
| GAC | CCC CGG | CGT AGG TCG | CGT AAT TTG | GGT AAA | GTC ATC GAT | ACC CTC | 685 |
| Asp | Pro Arg Arg Arg Ser Arg Asn Leu 120 | Gly Lys 125 | Vai Ile Asp | Thr Leu 130 | |||
| ACA | TGC GGC | TTC GCC GAC | CTC ATG GGG | TAC ATT | CCG CTC GTC | GGC GCT | 733 |
| Thr | Cys Gly | Phe Ala Asp 135 | Leu Met Gly Tyr Ile 140 | Pro'Leu Vai 145 | Gly Ala | ||
| CCC | TTA GGG | GGC GCT GCC | AGG GCC CTG | GCG CAT | GGC GTC CGG | GTT GTG | 781 |
| Pro | Leu Gly Gly Ala Ala 150 | Arg Ala Leu 155 | Ala His | Gly Vai Arg 160 | Vai Leu | ||
| GAG | GAC GGC | GTG AAC TAT | GCA ACA GGG | AAT TTA | CCC GGT TGC | TCT TTC | 829 |
| Glu | Asp Gly 165 | Vai Asn Tyr | Ala Thr Gly 170 | Asn Leu | Pro Gly Cys 175 | Ser Phe | |
| TCT | ATC TTC | CTC TTG GCT | TTG CTG TCC | TGT TTG | ACC ATT CCA | GCT TCC | 877 |
| Ser 180 | Ile Phe | Leu Leu Ala 185 | Leu Leu Ser | Cys Leu 190 | Thr Ile Pro | Ala Ser 195 |
| GCT Ala | TAT GAA GTG CGC AAC GTG TCC | GGG ATC TAC CAT GTC ACG AAC GAT | 925 | |||||||||||||
| Tyr Glu Vai Arg Asn 200 | Vai Ser | Gly | Ile 205 | Tyr His | Vai | Thr | Asn Asp 210 | |||||||||
| TGC | TCC | AAC | TCA | AGC | ATC | GTG | TAC | GAG | ACA | GCG | GAC | ATG | ATC | ATG | CAC | 973 |
| Cys | Ser | Asn | Ser | Ser | Ile | Vai | Tyr | Glu | Thr | Ala | Asp | Met | Ile | Met | His | |
| 215 | 220 | 225 | ||||||||||||||
| ACC | CCC | GGG | TGT | GTG | CCC | TGT | GTC | CGG | GAG | GGT | AAT | TCC | TCC | CGC | TGC | 1021 |
| Thr | Pro | Gly | Cys | Vai | Pro | Cys | Vai | Arg | Glu | Gly | Asn | Ser | Ser | Arg | Cys | |
| 230 | 235 | 240 | ||||||||||||||
| TGG | GTA | GCG | CTC | ACT | CCC | ACG | CTC | GCG | GCC | AAG | GAC | GCC | AGC | ATC | CCC | 1069 |
| Trp | Vai | Ala | Leu | Thr | Pro | Thr | Leu | Ala | Ala | Lys | Asp | Ala | Ser | Ile | Pro | • |
| 245 | 250 | 255 | ||||||||||||||
| ACT | GCG | ACA | ATA | CGA | CGC | CAC | GTC | GAT | TTG | CTC | GTT | GGG | GCG | GCT | GCC | 1117 |
| Thr | Ala | Thr | Ile | Arg Arg | His | Vai | Asp | Leu | Leu | Vai | Gly | Ala | Ala | Ala | ||
| 260 | 265 | 270 | 275 | |||||||||||||
| TTC | TGC | TCC | GCT | ATG | TAC | GTG | GGG | GAT | CTC | TGC | GGA | TCT | GTT | TTC | CTC | 1165 |
| Phe | Cys | Ser | Ala | Met | Tyr | Vai | Gly | Asp | Leu | Cys | Gly | Ser | Vai | Phe | Leu | |
| 280 | 285 | 290 | ||||||||||||||
| GTC | TCT | CAG | CTG | TTC | ACC | TTC | TCG | CCT | CGC | CGA | CAT | CAG | ACG | GTA | CAG | 1213 |
| Vai | Ser | Gin | Leu | Phe | Thr | Phe | Ser | Pro | Arg Arg | His | Gin | Thr | Vai | Gin | ||
| 295 | 300 | 305 | ||||||||||||||
| GAC | TGC | AAT | TGT | TCA | ATC | TAT | CCC | GGC | CAC | GTA | TCA | GGT | CAC | CGC | ATG | 1261 |
| Asp | Cys | Asn | Cys | Ser | Ile | Tyr | Pro | Gly | His | Vai | Ser | Gly | His | Arg | Met | |
| 310 | 315 | 320 | ||||||||||||||
| GCT | TGG | GAT | ATG | ATG | ATG | AAC | TGG | TCA | CCT | ACA | GCA | GCC | CTA | GTG | GTA | 1309 |
| Ala | Trp | Asp | Met | Met | Met | Asn | Trp | Ser | Pro | Thr | Ala | Ala | Leu | Vai | Vai |
325 330 335
| TCG | CAG | CTA | CTC | CGG | ATC | CCA | CAA | GCT | GTC | GTG | GAC | ATG | GTG | GCG | GGG |
| Ser 340 | Gin | Leu | Leu | Arg | Ile 345 | Pro | Gin | Ala | Vai | Vai 350 | Asp | Met | Vai | Ala | Gly 355 |
| GCC | CAC | TGG | GGA | GTC | CTG | GCG | GGC | CTT | GCC | TAC | TAT | TCC | ATG | GTG | GGG |
| Ala | His | Trp | Gly | Vai 360 | Leu | Ala | Gly | Leu | Ala 365 | Tyr | Tyr | Ser | Met | Vai 370 | Gly |
| AAC | TGG | GCT | AAG | GTC | TTG | GTT | GTG | ATG | CTA | CTC | TTT | GCC | GGC | GTT | GAC |
| Asn | Trp | Ala | Lys 375 | Vai | Leu | Vai | Vai | Met 380 | Leu | Leu | Phe | Ala | Gly 385 | Vai | Asp |
| GGG | GAA | CCT | TAC | ACG | ACA | GGG | GGG | ACA | CAC | GGC | CGC | GCC | GCC | CAC | GGG |
| Gly | Glu | Pro 390 | Tyr | Thr | Thr | Gly Gly 395 | Thr | His | Gly Arg | Ala 400 | Ala | His | Gly | ||
| CTT | ACA | TCC | CTC | TTC | ACA | CCT | GGG | CCG | GCT | CAG | AAA | ATC | CAG | CTT | GTA |
| Leu | Thr 405 | Ser | Leu | Phe | Thr | Pro 410 | Gly | Pro | Ala | Gin | Lys 415 | Ile | Gin | Leu | Vai |
| AAC | ACC | AAC | GGC | AGC | TGG | CAC | ATG | AAC | AGA | ACT | GCC | TTG | AAC | TGC | AAT |
| Asn 420 | Thr | Asn | Gly | Ser | Trp 425 | His | Ile | Asn | Arg | Thr 430 | Ala | Leu | Asn | Cys | Asn 435 |
| GAC | TCC | CTC | CAA | ACT | GGG | TTC | CTT | GCC | GCG | CTG | TTC | TAC | ACG | CAC | AGG |
| Asp | Ser | Leu | Gin | Thr 440 | Gly | Phe | Leu | Ala | Ala 445. | Leu | Phe | Tyr | Thr | His 450 | Arg |
| TTC | AAT | GCG | TCC | GGA | TGC | TCA | GAG | CGC | ATG | GCC | AGC | TGC | CGC | CCC | ATT |
| Phe | Asn | Ala | Ser 455 | Gly | Cys | Ser | Glu | Arg 460 | Met | Ala | Ser | Cys | Arg 465 | Pro | Ile |
| GAC | CAG | TTC | GAT | CAG | GGG | TGG | GGT | CCC | ATC | ACT | TAT | AAT | GAG | TCC | CAC |
| Asp | Gin | Phe | Asp | Gin | Gly Trp | Gly | Pro | Ile | Thr | Tyr | Asn | Glu | Ser | His |
470 475 480
1357
1405
1453
1501
1549
1645
1741
1597
1693
| GGC TTG GAC CAG AGG | CCC Pro | TAT Tyr 490 | TGC TGG CAC | TAC GCA CCT CAA CCG TGT | 1789 | |||||||||||
| Gly Leu Asp Gin | Arg | Cys | Trp | His | Tyr Ala Pro 495 | Gin Pro Cys | ||||||||||
| 485 | ||||||||||||||||
| GGT | ATC | GTG | CCC | GCG | TTG | CAG | GTG | TGT | GGC | CCA | GTG | TAC | TGT | TTC | ACT | 1837 |
| Gly | Ile | Vai | Pro | Ala | Leu | Gin | Vai | Cys | Gly | Pro | Vai | Tyr | Cys | Phe | Thr | |
| 500 | 505 | 510 | 515 | |||||||||||||
| CCA | AGC | CCT | GTT | GTG | GTG | GGG | ACG | ACC | GAT | CGT | TTC | GGC | GCC | CCT | ACG | 1885 |
| Pro | Ser | Pro | Vai | Vai | Vai | Gly | Thr | Thr | Asp | Arg | Phe | Gly | Ala | Pro | Thr | |
| 520 | 525 | 530 | ||||||||||||||
| TAC | AGA | TGG | GGT | GAG | AAT | GAG | ACG | GAC | GTG | CTG | CTT | CTC | AAC | AAC | ACG | 1933 |
| Tyr Arg | Trp | Gly | Glu | Asn | Glu | Thr | A‘sp | Vai | Leu | Leu | Leu | Asn | Asn | Thr | ||
| 535 | 540 | 545 | ||||||||||||||
| CGG | CCG | CCA | CGG | GGC | AAC | TGG | TTC | GGC | TGT | ACA | TGG | ATG | AAT | AGC | ACC | 1981 |
| Arg | Pro | Pro | Arg | Gly | Asn | Trp | Phe | Gly Cys | Thr | Trp | Met | Asn | Ser | Thr | ||
| 550 | 555 | 560 | ||||||||||||||
| GGG | TTC | ACC | AAG | ACG | TGT | GGG | GGC' | CCC | CCG | TGC | AAC | ATC | GGG | GGG | GTC | 2029 |
| Gly | Phe | Thr | Lys | Thr | Cys | Gly Gly | Pro | Pro | Cys | Asn | Ile | Gly Gly | Vai | |||
| 565 | 570 | 575 | ||||||||||||||
| GGC | AAC | AAC | ACT | TTG | ATC | TGC | CCC | ACG | GAC | TGC | TTC | CGG | AAG | CAT | CCC | 2077 |
| Gly | Asn | Asn | Thr | Leu | Ile | Cys | Pro | Thr | Asp | Cys | Phe | Arg Lys | His | Pro | ||
| 580 | 585 | 590 | 595 | |||||||||||||
| GAG | GCC | ACT | TAC | ACC | AAA | TGC | GGT | TCG | GGG | CCT | TGG | TTG | 2116 | |||
| Glu | Ala | Thr | Tyr | Thr | Lys | Cys | Gly | Ser | Gly | Pro | Trp | Leu |
600 605
SEQ ID NO:22
TIPO DE SEQUÊNCIA: Nucleótido com proteína correspondente COMPRIMENTO DA SEQUÊNCIA: 3750 PARES DE BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: cADN para ARN genómico
ORGANISMO FONTE ORIGINAL: humano; soro infeccioso para hepatite pos-transfusão não-A, não-B
FONTE EXPERIMENTAL IMEDIATA: contig” formado por clones de cADN do terminal 3' do genona
CARACTERÍSTICAS:
de 1 a 3750 pb da parte da poliproteína PT-NANBH
PROPRIEDADES: proteínas virais não estruturais
| TGG GAG GGC GTC TTC ACA GGC CTC ACC CAC GTG GAT GCC CAC TTC | CTG Leu | ||||||||||||||
| Trp Glu Gly Val Phe Thr Gly Leú Thr His | Val | Asp | Ala | His | Phe 15 | ||||||||||
| 5 | 10 | ||||||||||||||
| TCC | CAA | ACA | AAG | CAG | GCA | GGA | GAC | AAC | TTC | CCC | TAC | CTG | GTG | GCG | TAC |
| Ser | Gin | Thr | Lys | Gin | Ala | Gly Asp | Asn | Phe | Pro | Tyr | Leu | Val | Ala | Tyr | |
| 20 | 25 | » | 30 | ||||||||||||
| CAG | GCT | ACT | GTG | TGC | GCT | AGG | GCC | CAG | GCC | CCA | CCT | CCA | TCA | TGG | GAT |
| Gin | Ala | Thr | Val | Cys | Ala | Arg | Ala | Gin | Ala | Pro | Pro | Pro | Ser | Trp | Asp |
| 35 | 40 | 45 | |||||||||||||
| CAA | ATG | TGG | AAG | TGT | CTC | ATA | CGG | CTA | AAG | CCT | ACT | CTG | GGC | GGG | CCA |
| Gin | Met | Trp | Lys | Cys | Leu | Ile | Arg | Leu | Lys | Pro | Thr | Leu | Arg | Gly | Pro |
| 50 | 55 | 60 |
| ACA Thr 65 | CCC TTG CTG Pro Leu Leu | TAT AGG | CTG GGA GCC GTC CAA AAC GAG GTC ACC CTC | 240 | ||||||||||||
| Tyr | Arg 70 | Leu | Gly | Ala Vai | Gin 75 | Asn | Glu | Vai Thr | Leu 80 | |||||||
| ACA | CAC | CCC | ATA | ACC | AAA | TTC | ATC | ATG | GCA | TGC | ATG | TCA | GCC | GAC | CTG | 288 |
| Thr | His | Pro | Ile | Thr | Lys | Phe | Ile | Met | Ala | Cys | Met | Ser | Ala | Asp | Leu | |
| 85 | 90 | 95 | ||||||||||||||
| GAG | GTC | GTC | ACG | AGC | ACC | TGG | GTG | CTG | GTG | GGC | GGG | GTC | CTT | GCA | GCT | 336 |
| Glu | Vai | Vai | Thr | Ser | Thr | Trp | Vai | Leu | Vai | Gly Gly | Vai | Leu | Ala | Ala | ||
| 100 | 105 | 110 | ||||||||||||||
| CTG | GCT | GCG | TAT | TGC | TTG | ACA | ACA | GGC | AGC | GTG | GTC | ATT | GTG | GGT | AGG | 384 |
| Leu | Ala | Ala | Tyr | Cys | Leu | Thr | Thr | Gly | Ser | Vai | Vai | Ile | Vai | Gly Arg | • | |
| 115 | 120 | 125 | ||||||||||||||
| ATC | ATC | TTG | TCC | GGG | CGG | CCG | GCT | ATT | GTT | CCC | GAC | AGG | GAA | GTC | CTC | 432 |
| Ile | Ile | Leu | Ser | Gly Arg | Pro | Ala | Ile | Vai | Pro | Asp | Arg | Glu | Vai | Leu | ||
| 130 | 135 | 140 | ||||||||||||||
| TAC | CAG | GAG | TTC | GAT | GAG | ATG | GAA | GAG | TGC | GCG | TCG | CAC | CTC | CCT | TAC | 480 |
| Tyr | Gin | Glu | Phe | Asp | Glu | Met | Glu | Glu | Cys | Ala | Ser | His | Leu | Pro | Tyr | |
| 145 | 150 | 155 | 160 | |||||||||||||
| ATC | GAG | CAG | GGA | ATG | CAG | CTC | GCC | GAG | CAG | TTC | AAG | CAA | AAA | GCG | CTC | 528 |
| Ile | Glu | Gin | Gly | Met | Gin | Leu | Ala | Glu | Gin | Phe | Lys | Gin | Lys | Ala | Leu | |
| 165 | 170 | 175 | ||||||||||||||
| GGG | TTG | CTG | CAG | ACA | GCC | ACC | AAG | CAA | GCG | GAG | GCC | GCT | GCT | CCC | GTG | 576 |
| Gly | Leu | Leu | Gin | Thr | Ala | Thr | Lys | Gin | Ala | Glu | Ala | Ala | Ala | Pro | Vai | |
| 180 | 185 | 190 | ||||||||||||||
| GTG | GAG | TCC | AAG | TGG | CGA | GCC | CTT | GAG | ACC | TTC | TGG | GCG | AAA | CAC | ATG | 624 |
| Vai | Glu | Ser | Lys | Trp | Arg | Ala | Leu | Glu | Thr | Phe | Trp | Ala | Lys | His | Met | |
| 195 | 200 | 205 |
| TGG AAC Trp Asn | TTC Phe | ATC AGC GGG ATA CAG TAC TTA GCA GGC TTG TCC ACT CTG | |||||||||||||
| Ile Ser | Gly | Ile Gin 215 | Tyr Leu | Ala | Gly Leu Ser 220 | Thr | Leu | ||||||||
| 210 | |||||||||||||||
| CCT | GGG | AAT | CCC | GCG | ATT | GCA | TCA | CTG | ATG | GCG | TTC | ACA | GCC | TCT | GTC |
| Pro | Gly | Asn | Pro | Ala | Ile | Ala | Ser | Leu | Met | Ala | Phe | Thr | Ala | Ser | Vai |
| 225 | 230 | 235 | 240 | ||||||||||||
| ACT | AGC | CCG | CTC | ACC | ACC | CAA | TCT | ACC | CTC | CTG | CTT | AAC | ATC | CTG | GGG |
| Thr | Ser | Pro | Leu | Thr | Thr | Gin | Ser | Thr | Leu | Leu | Leu | Asn | Ile | Leu | Gly |
| 245 | 250 | 255 | |||||||||||||
| GGA | TGG | GTA | GCC | GCC | CAA | CTC | GCT | CCC | CCC | AGT | GCT | GCT | TCA | GCT | TTC |
| Gly | Trp | Vai | Ala | Ala | Gin | Leu | Ala | Pro | Pro | Ser | Ala | Ala | Ser | Ala | Phe |
| 260 | 265 | 270 | |||||||||||||
| GTA | GGC | GCC | GGC | ATT | GCT | GGT | GCG | GCT | GTT | GGC | AGC | ATA | GGC | CTT | GGG |
| Vai | Gly | Ala | Gly | Ile | Ala | Gly | Ala | Ala | Vai | Gly | Ser | Ile | Gly | Leu | Gly |
| 275 | 280 | 285 | |||||||||||||
| AAG | GTG | CTT | GTG | GAC | ATC | TTG | GCG | GGC | TAT | GGA | GCA | GGA | GTG | GCA | GGC |
| Lys | Vai | Leu | Vai | Asp | Ile | Leu | Ala' Gly Tyr Gly | Ala | Gly | Vai | Ala | Gly | |||
| 290 | 295 | 300 | |||||||||||||
| GCG | CTC | GTG | GCC | TTT | AAG | GTC | ATG | AGC | GGC | GAA | ATG | CCC | TCC | ACC | GAG |
| Ala | Leu | Vai | Ala | Phe | Lys | Vai | Met | Ser | Gly | Glu | Met | Pro | Ser | Thr | Glu |
| 305 | 310 | 315 | 320 | ||||||||||||
| GAC | CTG | GTT | AAC | TTA | CTC | CCT | GCC | ATC | CTC | TCT | CCT | GGT | GCC | CTG | GTC |
| Asp | Leu | Vai | Asn | Leu | Leu | Pro | Ala | Ile | Leu | Ser | Pro | Gly | Ala | Leu | Vai |
| 325 | 330 | 335 | |||||||||||||
| GTC | GGG | GTC | GTG | TGC | GCA | GCG | ATA | CTG | CGT | CGG | CAC | GTG | GGT | CCA | GGG |
| Vai | Gly | Vai | Vai | Cys | Ala | Ala | Ile | Leu | Arg Arg | His | Vai | Gly | Pro | Gly |
672
720
768
816
864
912
960
1008
1056
340 345 350
| GAG GGG GCT GTG CAG | TGG Trp | ATG Met | AAC CGG CTG ATA GCG TTC GCC TCG CGG | 1104 | ||||||
| Glu | Gly | Ala Vai 355 | Gin | Asn Arg 360 | Leu Ile | Ala | Phe Ala Ser Arg 365 | |||
| GGT | AAC | CAT GTT | TCC | CCC | ACG | CAC TAT | GTG CCA | GAG | AGC GAC GCC GCA | 1152 |
| Gly | Asn | His Vai | Ser | Pro | Thr | His Tyr | Vai Pro | Glu | Ser Asp Ala Ala | |
| 370 | 375 | 380 | ||||||||
| GCA | CGT | GTC ACT | CAG | ATC | CTC | TCC GAC | CTT ACT | ATC | ACC CAA CTG TTG | 1200 |
| Ala | Arg | Vai Thr | Gin | Ile | Leu | Ser Asp | Leu Thr | Ile | Thr Gin Leu Leu | |
| 385 | 390 | 395 | 400 | |||||||
| AAG | AGG | GTC CAC | CAG | TGG | ATT | AAC GAG | GAC TGC | TCC | ACG CCC TGC TCC | 1248 |
| Lys | Arg | Leu His | Gin | Trp | Ile | Asn Glu Asp Cys | Ser | Thr Pro Cys Ser | ||
| 405 | 410 | 415 | ||||||||
| GGC | TCG | TGG CTA | AGG | GAT | GTT | TGG GAC | TGG ATA | TGC | ACA GTT TTG GCT | 1296 |
| Gly | Ser | Trp Leu | Arg Asp | Vai | Trp Asp | Trp Ile | Cys | Thr Vai Leu Ala | ||
| 420 | 425 | 430 | ||||||||
| GAC | TTC | AAG ACC | TGG | CTC | CAG | TCG AAG | CTC CTG | CCG | CGA TTA CCG GGA | 1344 |
| Asp | Phe | Lys Thr | Trp | Leu | Gin | Ser Lys | Leu Leu | Pro | Arg Leu Pro Gly | |
| 435 | 440 | 445 | ||||||||
| GTC | CCC | TTT TTC | TCA | TGC | CAA | CGT GGG | TAC AAG | GGG | GTC TGG CGG GGA | 1392 |
| Vai | Pro | Phe Phe | Ser | Cys | Gin | Arg Gly Tyr Lys | Gly | Vai Trp Arg Gly | ||
| 450 | 455 | 460 | ||||||||
| GAC | GGC | ATC ATG | CAG | ACC | ACC | TGC TCA | TGT GGA | GCA | CAG ATC ACC GGA | 1440 |
| Asp | Gly | Ile Met | Gin | Thr | Thr | Cys Ser | Cys Gly | Ala | Gin Ile Thr Gly | |
| 465 | 470 | 475 | 480 | |||||||
| CAT | GTC | AAA AAC | GGT | TCC | ATG | AGG ATC | GTT GGG | CCT | AAG ACC TGT AGT | 1488 |
| His | Vai | Lys Asn | Gly | Ser | Met | Arg Ile | Vai Gly | Pro | Lys Thr Cys Ser |
485 490 495
100
| AAC ATG TGG CAT GGA ACA TTC CCC ATC AAC GCA TAC ACC ACG GGC CCC | 1536 | |||||||||||||||
| Asn | Met Trp | His Gly Thr Phe Pro Ile | Asn Ala | Tyr Thr Thr 510 | Gly Pro | |||||||||||
| 500 | 505 | |||||||||||||||
| TGC | ACG | CCC | TCC | CCA | GCG | CCA | AAC | TAT | TCC | AGG | GCG | CTG | TGG | CGG | GTG | 1584 |
| Cys | Thr | Pro | Ser | Pro | Ala | Pro | Asn | Tyr | Ser | Arg | Ala | Leu | Trp | Arg | Vai | |
| 515 | 520 | 525 | ||||||||||||||
| GCT | GCT | GAG | GAG | TAC | GTG | GAG | GTT | ACG | CGG | GTG | GGG | GAT | TTC | CAC | TAC | 1632 |
| Ala | Ala | Glu | Glu | Tyr | Vai | Glu | Vai | Thr | Arg | Vai | Gly Asp | Phe | His | Tyr | ||
| 530 | 535 | 540 | ||||||||||||||
| GTG | ACG | AGC | ATG | ACC | ACT | GAC | AAC | GTA | AAA | TGC | CCG | TGC | CAG | GTT | CCA | 1680 |
| Vai | Thr | Ser | Met | Thr | Thr | Asp | Asn | Vai | Lys | Cys | Pro | Cys | Gin | Vai | Pro | • |
| 545 | 550 | 555 | 560 | |||||||||||||
| GCC | CCC | GAA | TTC | TTC | ACA | GAA | GTG | GAT | GGG | GTG | CGG | CTG | CAC | AGG | TAC | 1728 |
| Ala | Pro | Glu | Phe | Phe | Thr | Glu | Vai | Asp | Gly | Vai | Arg | Leu | His | Arg | Tyr | |
| 565 | 570 | 575 | ||||||||||||||
| GCT | CCG | GCG | TGC | AAA | CCT | CTC | CTA- | CGG | GAG | GAG | GTC | ACA | TTC | CAG | GTC | 1776 |
| Ala | Pro | Ala | Cys | Lys | Pro | Leu | Leu | Arg | Glu | Glu | Vai | Thr | Phe | Gin | Vai | |
| 580 | 585 | 590 | ||||||||||||||
| GGG | CTC | AAC | CAA | TAC | CTG | GTT | GGG | TCG | CAG | CTC | CCA | TGC | GAG | CCC | GAA | 1824 |
| Gly | Leu | Asn | Gin | Tyr | Leu | Vai | Gly | Ser | Gin | Leu | Pro | Cys | Glu | Pro | Glu | |
| 595 | 600 | 605 | ||||||||||||||
| CCG | GAT | GTA | GCA | GTG | CTC | ACT | TCC | ATG | CTC | ACC | GAC | CCC | TCC | CAC | ATC | 1872 |
| Pro | Asp | Vai | Ala | Vai | Leu | Thr | Ser | Met | Leu | Thr | Asp | Pro | Ser | His | Ile | |
| 610 | 615 | 620 | ||||||||||||||
| ACA | GCA | GAG | ACG | GCT | AAG | CGC | AGG | CTG | GCC | AGG | GGG | TCT | CCC | CCC | TCC | 1920 |
| Thr | Ala | Glu | Thr | Ala | Lys | Arg Arg | Leu | Ala | Arg | Gly | Ser | Pro | Pro | Ser | ||
| 625 | 630 | 635 | 640 |
101
| TTG | GCC | AGC | TCT | TCA | GCT | AGC | CAG | TTG | TCT | GCG | CCT | TCC | TCG | AAG | GCG | 1968 |
| Leu | Ala | Ser | Ser | Ser | Ala | Ser | Gin | Leu | Ser | Ala | Pro | Ser | Ser | Lys | Ala | |
| 645 | 650 | 655 | ||||||||||||||
| ACA | TAC | ATT | ACC | CAA | AAT | GAC | TTC | CCA | GAC | GCT | GAC | CTC | ATC | GAG | GCC | 2016 |
| Thr | Tyr | Ile | Thr | Gin | Asn | Asp | Phe | Pro | Asp | Ala | Asp | Leu | Ile | Glu | Ala | |
| 660 | 665 | - | 670 | |||||||||||||
| AAC | CTC | CTG | TGG | CGG | CAT | GAG | ATG | GGC | GGG | GAC | ATT | ACC | CGC | GTG | GAG | 2064 |
| Asn | Leu | Leu | Trp | Arg | His | Glu | Met | Gly Gly Asp | Ile | Thr | Arg | Vai | Glu | |||
| 675 | 680 | 685 | ||||||||||||||
| TCA | GAG | AAC | AAG | GTA | GTA | ATC | CTG | GAC | TCT | TTC | GAC | CCG | CTC | CGA | GCG | 2112 |
| Ser | Glu | Asn | Lys | Vai | Vai | Ile | Leu | Asp | Ser | Phe | Asp | Pro | Leu | Arg | Ala | • |
| 690 | 695 | 700 | ||||||||||||||
| GAG | GAG | GAT | GAG | CGG | GAA | GTG | TCC | GTC | CCG | GCG | GAG | ATC | CTG | CGG | AAA | 2160 |
| Glu | Glu | Asp | Glu | Arg | Glu | Vai | Ser | Vai | Pro | Ala | Glu | Ile | Leu | Arg | Lys | |
| 705 | 710 | 715 | 720 | |||||||||||||
| TCC | AAG | AAA | TTC | CCA | CCA | GCG | ATG‘ CCC | GCA | TGG | GCA | CGC | CCG | GAT | TAC | 2208 | |
| Ser | Lys | Lys | Phe | Pro | Pro | Ala | Met | Pro | Ala | Trp | Ala | Arg | Pro | Asp | Tyr | |
| 725 | 730 | 735 | ||||||||||||||
| AAC | CCT | CCG | CTG | CTG | GAG | TCC | TGG | AAG | GCC | CCG | GAC | TAC | GTC | CCT | CCA | 2256 |
| Asn | Pro | Pro | Leu | Leu | Glu | Ser | Trp | Lys | Ala | Pro | Asp | Tyr | Vai | Pro | Pro | |
| 740 | 745 | 750 | ||||||||||||||
| GTG | GTA | CAT | GGG | TGC | CCA | CTG | CCA | CCT | ACT | AAG | ACC | CCT | CCT | ATA | CCA | 2304 |
| Vai | Vai | His | Gly Cys | Pro | Leu | Pro | Pro | Thr | Lys | Thr | Pro | Pro | Ile | Pro | ||
| 755 | 760 | 765 | ||||||||||||||
| CCT | CCA | CGG | AGG | AAG | AGG | ACA | GTT | GTT | CTG | ACA | GAA | TCC | ACC | GTG | TCT | 2352 |
| Pro | Pro | Arg Arg Lys | Arg | Thr | Vai | Vai | Leu | Thr | Glu | Ser | Thr | Vai | Ser |
770
775
780
102
| TCT Ser 785 | GCC CTG GCG | GAG CTT GCC ACA AAG GCT TTC GGT AGC TCC GAA CCG | 2400 | |||||||||||||
| Ala | Leu Ala | Glu | Leu 790 | Ala | Thr Lys | Ala | Phe Gly Ser Ser Glu Pro | |||||||||
| 795 | 800 | |||||||||||||||
| TCG | GCC | GTC | GAC | AGC | GGC | ACG | GCA | ACC | GCC | CCT | CCT | GAC | CAA | CCC | TCC | 2448 |
| Ser | Ala | Vai | Asp | Ser | Gly | Thr | Ala | Thr | Ala | Pro | Pro | Asp | Gin | Pro | Ser | |
| 805 | 810 | 815 | ||||||||||||||
| GAC | GAC | GGC | GGA | GCA | GGA | TCT | GAC | GTT | GAG | TCG | TAT | TCC | TCC | ATG | CCC | 2496 |
| Asp | Asp | Gly Gly | Ala | Gly | Ser | Asp | Vai | Glu | Ser | Tyr | Ser | Ser | Met | Pro | ||
| 820 | 825 | 830 | ||||||||||||||
| CCC | CTT | GAG | GGG | GAG | CCG | GGG | GAC | CCC | GAT | CTC | AGC | GAC | GGG | TCT | TGG | 2544 |
| Pro | Leu | Glu | Gly | Glu | Pro | Gly Asp | Pro | Asp | Leu | Ser | Asp | Gly | Ser | Trp | • | |
| 835 | 840 | 845 | ||||||||||||||
| TCT | ACC | GTG | AGT | GAG | GAG | GCC | GGT | GAG | GAC | GTC | GTC | TGC | TGC | TCG | ATG | 2592 |
| Ser | Thr | Vai | Ser | Glu | Glu | Ala | Gly | Glu | Asp | Vai | Vai | Cys | Cys | Ser | Met | |
| 850 | 855 | 860 | ||||||||||||||
| TCC | TAC | ACA | TGG | ACA | GGC | GCT | CTÓ | ATC | ACG | CCA | TGC | GCT | GCG | GAG | GAA | 2640 |
| Ser | Tyr | Thr | Trp | Thr | Gly | Ala | Leu | Ile | Thr | Pro | Cys | Ala | Ala | Glu | Glu | |
| 865 | 870 | 875 | 880 | |||||||||||||
| AGC | AAG | CTG | CCC | ATC | AAC | GCG | TTG | AGC | AAC | TCT | TTG | CTG | CGT | CAC | CAC | 2688 |
| Ser | Lys | Leu | Pro | Ile | Asn | Ala | Leu | Ser | Asn | Ser | Leu | Leu | Arg | His | His | |
| 885 | 890 | 895 | ||||||||||||||
| AAC | ATG | GTC | TAC | GCT | ACC | ACA | TCC | CGC | AGC | GCA | AGC | CAG | CGG | CAG | AAG | 2736 |
| Asn | Met | Vai | Tyr | Ala | Thr | Thr | Ser | Arg | Ser | Ala | Ser | Gin | Arg | Gin | Lys | |
| 900 | 905 | 910 | ||||||||||||||
| AAG | GTC | ACC | TTT | GAC | AGA | CTG | CAA | ATC | CTG | CAC | GAT | CAC | TAC | CAG | GAC | 2784 |
| Lys | Vai | Thr | Phe | Asp | Arg | Leu | Gin | Ile | Leu | Asp | Asp | His | Tyr | Gin | Asp |
915 920 925
103
| GTG | CTC | AAG | GAG | ATG | AAG | GCG | AAG | GCG | TCC | ACA | GTT | AAG | GCT | AAG | CTT |
| Vai | Leu | Lys | Glu | Met | Lys | Ala | Lys | Ala | Ser | Thr | Vai | Lys | Ala | Lys | Leu |
| 930 | 935 | 940 | |||||||||||||
| CTA | TCA | GTA | GAG | GAA | GCC | TGC | AAG | CTG | ACG | CCC | CCA | CAT | TCG | GCC | AAA |
| Leu | Ser | Vai | Glu | Glu Ala | Cys | Lys | Leu | Thr | Pro | Pro | His | Ser | Ala | Lys | |
| 945 | 950 | 955 | 960 | ||||||||||||
| TCT | AAA | TTT | GGC | TAT | GGG | GCA | AAG | GAC | GTC | CGG | AAC | CTA | TCC | AGC | AAG |
| Ser | Lys | Phe | Gly Tyr | Gly | Ala | Lys | Asp | Vai | Arg | Asn | Leu | Ser | Ser | Lys | |
| 965 | 970 | 975 | |||||||||||||
| GCC | ATT | AAC | CAC | ATC | CGC | TCC | GTG | TGG | GAG | GAC | TTG | TTG | GAA | GAC | ACT |
| Ala | Ile | Asn | His | Ile | Arg | Ser | Vai | Trp | Glu | Asp | Leu | Leu | Glu | Asp | Thr |
| 980 | 985 | 990 | |||||||||||||
| GAA | ACA | CCA | ATT | GAC | ACC | ACC | ATC | ATG | GCA | AAA | AAT | GAG | GTT | TTC | TGC |
| Glu | Thr | Pro | Ile | Asp | Thr | Thr | Ile | Met | Ala | Lys | Asn | Glu | Vai | Phe | Cys |
| 995 | 1000 | 1005 | |||||||||||||
| GTC | CAA | CCA | GAG | AGA | GGA | GGC | CGC | AAG | CCA | GCT | CGC | CTT | ATC | GTG | TTC |
| Vai | Gin | Pro | Glu | Arg | Gly Gly Arg Lys | Pro | Ala | Arg | Leu | Ile | Vai | Phe | |||
| 1010 | 1015 | 1020 | |||||||||||||
| CCA | GAC | TTG | GGG | GTC | CGT | GTG | TGC | GAG | AAA | ATG | GCC | CTC | TAT | GAC | GTG |
| Pro Asp | Leu | Gly | Vai | Arg | Vai | Cys | Glu | Lys | Met | Ala | Leu | Tyr | Asp | Vai | |
| 1025 | 1030 | 1035 | 1040 | ||||||||||||
| GTC | TCC | ACC | CTC | CCT | CAG | GCT | GTG | ATG | GGC | TCC | TCG | TAC | GGA | TTC | CAG |
| Vai | Ser | Thr | Leu | Pro | Gin | Ala | Vai | Met | Gly | Ser | Ser | Tyr Gly | Phe | Gin | |
| 1045 | 1050 | 1055 | |||||||||||||
| TAT | TCT | CCT | GGA | CAG | CGG | GTC | GAG | TTC | CTG | GTG | AAC | GCC | TGG | AAA | TCA |
| Tyr | Ser | Pro | Gly Gin Arg | Vai | Glu | Phe | Leu | Vai | Asn | Ala Trp Lys | Ser |
2832
2880
2928
2976
3024
3072
3168
3216
1065
3120
1060
1070
104
AAG AAG ACC CCT ATG GGC TTT GCA TAT GAC ACC CGC TGT TTT GAC TCA
Lys Lys Thr Pro Met Gly Phe Ala Tyr Asp Thr Arg Cys Phe Asp Ser
1075 1080 1085
ACA GTC ACT GAG AAT GAC ATC CGT GTA GAG GAG TCA ATT TAT CAA TGT
Thr Vai Thr Glu Asn Asp Ile Arg Vai Glu Glu Ser Ile Tyr Gin Cys
1090 1095 1100
TGT GAC TTG GCC CCC GAA GCC AGA CAG GCC ATA AGG TCG CTC ACA GAG
Cys Asp Leu Ala Pro Glu Ala Arg Gin Ala Ile Arg Ser Leu Thr Glu
1105 1110 1115 1120
CGG CTT TAT ATC GGG GGT CCC CTG ACT AAT TCA AAA GGG CAG AAC TGC
Arg Leu Tyr Ile Gly Gly Pro Leu Thr Asn Ser Lys Gly Gin Asn Cys
1125 1130 1135
GGC TAT CGC CGG TGC CGC GCG AGC GGC GTG CTG ACG ACT AGC TGC GGT
Gly Tyr Arg Arg Cys Arg Ala Ser Gly Vai Leu Thr Thr Ser Cys Gly
1140 1145 1150
AAT ACC CTC ACA TGT TAC TTG AAG GCC TCT GCA GCC TGT CGA GCT GCA
Asn Thr Leu Thr Çys Tyr Leu Lys Ala Ser Ala Ala Cys Arg Ala Ala
1155 1160 1165
AAG CTC CAG GAC TGC ACG ATG CTC GTG TGC GGA GAC GGC CTT GTC GTT
Lys Leu Gin Asp Cys Thr Met Leu Vai Cys Gly Asp Asp Leu Vai Vai
1170 1175 1180
ATC TGT GAG AGC GCG GGA ACC CAG GAG GAC GCG GCG AGC CTA CGA GTC
Ile Cys Glu Ser Ala Gly Thr Gin Glu Asp Ala Ala Ser Leu Arg Vai
1185 1190 1195 1200
TTC ACG GAG GCT ATG ACT AGG TAC TCT GCC CCC CCC GGG GAC CCG CCC
Phe Thr Glu Ala Met Thr Arg Tyr Ser Ala Pro Pro Gly Asp Pro Pro
1205 1210 1215
3264
3312
3360
3408
3456
3504
3552
3600
3648
105
CAA CCA GAA TAC GAC CTG GAG TTG ATA ACA TCA TGC TCC TCC AAT GTG 3696
Gin Pro Glu Tyr Asp Leu Glu Leu Ile Thr Ser Cys Ser Ser Asn Vai
1220 1225 1230
TCG GTC GCG CAC GAT GCA TCT GGC AAA AGG GTA TAC TAC CTC ACC CGT 3744
Ser_Val Ala His Asp Ala Ser Gly Lys Arg Vai Tyr Tyr Leu Thr Arg
1235 1240 1245
GAC CCG 3750
Asp Pro
1250
106
SEQ ID NO:23
TIPO DE SEQUÊNCIA: Nucleótido COMPRIMENTO DA SEQUÊNCIA: 23
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: baculovírus Autographa californica Nuclear vírus da Polihedrose (AcNPV)
FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo d24
CARACTERÍSTICAS:
faz a primagem da síntese ADN para as sequências do vector de transferência de baculovírus que flanqueia o ADN inserido no local BamHl
CGGGTTTAAC ATTACGGATT TCC
107
SEQ ID NO:24
TIPO DE SEQUÊNCIA: Nucleótido
COMPRIMENTO DA SEQUÊNCIA: 31 BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: baculovirus Autographa californica Nuclear vírus da Polihedrose (AcNPV)
FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo dl26
CARACTERÍSTICAS:
de 1 a 31 bases homólogas às sequências da junção a montante produzidas quando o cADN amplificado por d75 (SEQ ID : 5) é clonado no local de clonação BamHl em pAc360 e vectores semelhantes; as incoerências nas bases 13 e 14 introduzem um local Pstl de 1 a 10 bases homólogas à região do local BamHl em pAc360 e vectores semelhantes de 4 a 9 bases no local BamHl de 12 a 27 bases no local Pstl
PROPRIEDADES: faz a primagem da síntese de ADN na função das sequências do vector de transferência de baculovirus e sequências previamente amplificadas por oligo d75: introduz um local de reconhecimento de Pstl para o trabalho de clonação posterior
TAAGGATCCC CCT GCA GTA TCG GCG GAA TTC 31
Ser Ala Val Ser Ala Glu Phe 5
108
SEQ ID NO:25
TIPO DE SEQUÊNCIA: Nucleótido COMPRIMENTO DA SEQUÊNCIA: 45 BASES
No DE BANDAS: única
TOPOLOGIA: linear
TIPO DE MOLÉCULA: ADN sintético
ORGANISMO FONTE ORIGINAL: N/A
FONTE EXPERIMENTAL IMEDIATA: sintetizador de oligonucleótidos; oligo dl32
CARACTERÍSTICAS:
de 5 a 10 bases no local de reconhecimento Pstl de 13 a 27 bases de ligação codificando para cinco resíduos de Lys de 28 a 45 bases homólogas às bases 4 a 21 de BR11 (SEQ ID 7)
PROPRIEDADES: faz a primagem da síntese de ADN no terminal
5' de BR11 e introduz uma sequência sintética que codifica para cinco lisinas bem como um local de reconhecimento de Pstl para trabalho de clonação posterior
CTGCCTGCA GTA AAG AAG AAG AAG AAG AAA ACC AAA CGT AAC ACC A 45
Vai Lys Lys Lys Lys Lys Lys Thr Lys Arg Asn Leu
Claims (1)
- REIVINDICAÇÕES- lã Processo para a preparação de um polipéptido virai responsável pela hepatite não-A não-B de pós-transfusão (PT-NANBH) caracterizado por se clonar ou sintetizar uma sequência de ADN que codifica um antigénio possuindo uma sequência de aminoácidos que é pelo menos 90% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 3,4,5,18,19,20,21 ou 22, ou um seu fragmento antigénico, inserir-se a sequência de ADN num vector de expressão tal que ele é susceptível de ser expresso num hospedeiro adequado, transformar-se uma célula de hospedeiro com o vector de expressão, cultivar-se célula de hospedeiro transformada, e isolar-se o polipéptido virai._ 2§ Processo de acordo com a reivindicação 1, caracterizado por se obter um polipéptido virai PT-NANBH em que a sequência de aminoácidos é pelo menos 90% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 3,4 ou 5, ou é um seu fragmento antigénico._ 3a _Processo de acordo com a reivindicação 2, caracterizado por se obter um polipéptido virai PT-NANBH em que a sequência de aminoácidos é pelo menos 90% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 3, ou 4, ou é um seu fragmento antigénico.- 4ã Processo de acordo com a reivindicação 2, caracterizado por se obter um polipéptido virai PT-NANBH em que a sequência de aminoácidos é pelo menos 90% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 5, ou é um seu fragmento antigénico._ 5a _Processo de acordo com qualquer das reivindicações anteriores, caracterizado por se obter um lio polipéptido virai PT-NANBH em que a sequência de aminoácidos é pelo menos 95% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 3,4,5,18,19,20,21 ou 22 , ou é um seu fragmento antigénico.- 6ã Processo de acordo com a reivindicação 5, caracterizado por se obter um polipéptido virai PT-NANBH em que a sequência de aminoácidos é pelo menos 98% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 3,4,5,18,19,20,21 ou 22 ou é um seu fragmento antigénico.- 73 Processo para a preparação de um polipéptido virai PT-NANBH caracterizado por se clonar ou sintetizar uma sequência de ADN que codifica um antigénio da região de codificação estrutural do genoma virai e um antigénio da região de codificação não-estrutural do genoma virai, inserir-se a sequência de ADN num vector de expressão tal que ele seja susceptível de ser expresso num hospedeiro adequado, transformar-se uma célula de hospedeiro com o vector de expressão, cultivar-se a célula de hospedeiro transformada, e isolar-se o polipéptido virai.- 83 Processo de acordo com a reivindicação 7, caracterizado por se obter um polipéptido virai PT-NANBH em que o antigénio da região de codificação estrutural tem uma sequência de aminoácidos que é pelo menos 90% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 5 ou um seu fragmento antigénico, e o antigénio da região de codificação não-estrutural tem uma sequência de aminoácidos que é pelo menos 90% homóloga da sequência de aminoácidos referida na sequência identificada por SEQ ID NO : 3 ou 4, ou um seu fragmento antigénico.- 93 Processo de acordo com a reivindicação 7, caracterizado por se obter um polipéptido virai PT-NANBH em que a sequência de ADN é como referida na se111 quência identificada por SEQ ID NO : 3, 4, 5, 18, 19, 20, 21 ou 22.- 10- Processo para a detecção de ãcido nucleico virai PT-NANBH caracterizado por:i) hibridizar-se o ARN virai presente numa amostra de en saio, ou cADN sintetizado a partir desse ARN, com uma sequência de ADN correspondente à sequência identificada por SEQ ID NO : 3, 4, 5, 18, 19, 20, 21 ou 22, e escrutinarem-se os híbridos de ácido nucleico resultantes para identificar qualquer ácido nucleico virai PT-NANBH, ou ii) sintetizar-se o cADN do ARN virai presente numa amostra de ensaio, amplificar-se uma sequência de ADN pré-escolhida correspondente a uma subsequência da sequência identificada por SEQ ID NO: 3, 4, 5, 18,19, 20, 21 ou 22, e identificar-se a sequência de ADN pré-escolhida.- lia Processo para a detecção de antigénio virai ou anticorpo virai PT-NANBH caracterizado por se fazer contactar uma amostra de ensaio com um polipéptido virai PT-NANBH quando preparado de acordo com qualquer das reivindicações 1 a 8, ou um anticorpo policlonal ou monoclonal e determinar-se se existe qualquer ligação antigénio-anticorpo dentro da amostra de ensaio.A requerente reivindica as prioridades dos pedidos britânicos apresentados em 18 de Dezembro112 de 1989 e em 27 de Fevereiro de 1990, sob os nss. 8928562.1 a 9004414.0, respectivamente.Lisboa, 17 de Dezembro de 1990.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| GB898928562A GB8928562D0 (en) | 1989-12-18 | 1989-12-18 | Viral agent |
| GB909004414A GB9004414D0 (en) | 1990-02-27 | 1990-02-27 | Viral agent |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| PT96223A PT96223A (pt) | 1991-09-30 |
| PT96223B true PT96223B (pt) | 1998-05-29 |
Family
ID=26296387
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PT9622390A PT96223B (pt) | 1989-12-18 | 1990-12-17 | Processo para a preparacao de um agente viral responsavel pela hepatite nao-a bnao-b de pos-transfusao |
Country Status (1)
| Country | Link |
|---|---|
| PT (1) | PT96223B (pt) |
-
1990
- 1990-12-17 PT PT9622390A patent/PT96223B/pt not_active IP Right Cessation
Also Published As
| Publication number | Publication date |
|---|---|
| PT96223A (pt) | 1991-09-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6210675B1 (en) | PT-NANB hepatitis polypeptides | |
| RU2130969C1 (ru) | Композиция для диагностики гепатита c человека (варианты), способ и набор для обнаружения антител к вирусу гепатита c человека | |
| RU2155228C2 (ru) | Hcv геномные последовательности для диагностических и терапевтических целей | |
| JP3892443B2 (ja) | 診断用及び治療用の精製c型肝炎ウイルスエンベロープ蛋白 | |
| JP3514680B2 (ja) | C型肝炎ウイルス(hcv)ポリペプチド | |
| US7728121B2 (en) | Hepatitis-C virus type 4, 5 and 6 | |
| EP0980434B1 (en) | Intracellular production of hepatitis c e2 truncated polypeptid | |
| JP2007197456A (ja) | Nanbvの診断用薬 | |
| JP2002528140A (ja) | ヒトpan−hcvヒトモノクローナル抗体 | |
| KR100394693B1 (ko) | G형 간염바이러스 및 이것의 분자클로닝 방법 | |
| JPH07503614A (ja) | Hcv蛋白のための哺乳動物発現システム | |
| DE69230917T2 (de) | Verfahren zur detektion von hepatitis c | |
| JP4641695B2 (ja) | 新規なhev抗原性ペプチド及び方法 | |
| US5843450A (en) | Hepatitis GB Virus synthetic peptides and uses thereof | |
| US5670310A (en) | Methods and compositions for differential diagnosis of acute and chronic hepatitis c virus infection | |
| PT96223B (pt) | Processo para a preparacao de um agente viral responsavel pela hepatite nao-a bnao-b de pos-transfusao | |
| US7166287B1 (en) | Viral agent | |
| CZ285834B6 (cs) | Peptidy účinné proti virové hepatitidě C | |
| US20020150990A1 (en) | Hepatitis C virus peptides | |
| PL167059B1 (pl) | Sposób wytwarzania wirusowego polipeptydu PT-NANBH | |
| JPH0568563A (ja) | C型肝炎ウイルス遺伝子およびその利用方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| BB1A | Laying open of patent application |
Effective date: 19910506 |
|
| FG3A | Patent granted, date of granting |
Effective date: 19980217 |
|
| MM3A | Annulment or lapse |
Free format text: LAPSE DUE TO NON-PAYMENT OF FEES Effective date: 19990831 |