PT796344E - Método de detecção de ácidos nucleicos com uma composição de sequência específica. - Google Patents
Método de detecção de ácidos nucleicos com uma composição de sequência específica. Download PDFInfo
- Publication number
- PT796344E PT796344E PT95943035T PT95943035T PT796344E PT 796344 E PT796344 E PT 796344E PT 95943035 T PT95943035 T PT 95943035T PT 95943035 T PT95943035 T PT 95943035T PT 796344 E PT796344 E PT 796344E
- Authority
- PT
- Portugal
- Prior art keywords
- leu
- gly
- lys
- binding
- thr
- Prior art date
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 244
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 221
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 221
- 238000000034 method Methods 0.000 title claims abstract description 140
- 238000001514 detection method Methods 0.000 title claims abstract description 43
- 239000000203 mixture Substances 0.000 title claims abstract description 25
- 230000027455 binding Effects 0.000 claims abstract description 241
- 239000000523 sample Substances 0.000 claims abstract description 109
- 238000004519 manufacturing process Methods 0.000 claims abstract description 30
- 238000009396 hybridization Methods 0.000 claims description 88
- 108090000623 proteins and genes Proteins 0.000 claims description 73
- 108010057466 NF-kappa B Proteins 0.000 claims description 72
- 102000003945 NF-kappa B Human genes 0.000 claims description 71
- 102000004169 proteins and genes Human genes 0.000 claims description 68
- 230000000295 complement effect Effects 0.000 claims description 53
- 101150006308 botA gene Proteins 0.000 claims description 36
- 102000052510 DNA-Binding Proteins Human genes 0.000 claims description 29
- 229920000642 polymer Polymers 0.000 claims description 26
- 238000012360 testing method Methods 0.000 claims description 23
- 101710096438 DNA-binding protein Proteins 0.000 claims description 17
- 102000040430 polynucleotide Human genes 0.000 claims description 15
- 108091033319 polynucleotide Proteins 0.000 claims description 15
- 239000002157 polynucleotide Substances 0.000 claims description 15
- 241000701959 Escherichia virus Lambda Species 0.000 claims description 14
- 239000011324 bead Substances 0.000 claims description 14
- 108091008324 binding proteins Proteins 0.000 claims description 14
- 239000002773 nucleotide Substances 0.000 claims description 13
- 125000003729 nucleotide group Chemical group 0.000 claims description 13
- 239000000047 product Substances 0.000 claims description 13
- 102000044158 nucleic acid binding protein Human genes 0.000 claims description 12
- 108700020942 nucleic acid binding protein Proteins 0.000 claims description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 10
- 244000052769 pathogen Species 0.000 claims description 10
- 239000000126 substance Substances 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000001717 pathogenic effect Effects 0.000 claims description 9
- 102000004190 Enzymes Human genes 0.000 claims description 8
- 108090000790 Enzymes Proteins 0.000 claims description 8
- 241001515965 unidentified phage Species 0.000 claims description 8
- 230000003014 reinforcing effect Effects 0.000 claims description 7
- 102000009661 Repressor Proteins Human genes 0.000 claims description 6
- 239000003550 marker Substances 0.000 claims description 6
- 239000007790 solid phase Substances 0.000 claims description 6
- 102000006467 TATA-Box Binding Protein Human genes 0.000 claims description 5
- 108020004711 Nucleic Acid Probes Proteins 0.000 claims description 4
- 108010034634 Repressor Proteins Proteins 0.000 claims description 4
- 108010044281 TATA-Box Binding Protein Proteins 0.000 claims description 4
- 239000002853 nucleic acid probe Substances 0.000 claims description 4
- 102000044126 RNA-Binding Proteins Human genes 0.000 claims description 3
- 241000251539 Vertebrata <Metazoa> Species 0.000 claims description 3
- 239000002253 acid Substances 0.000 claims description 3
- 238000000855 fermentation Methods 0.000 claims description 3
- 230000004151 fermentation Effects 0.000 claims description 3
- 238000000338 in vitro Methods 0.000 claims description 3
- 101710159080 Aconitate hydratase A Proteins 0.000 claims description 2
- 101710159078 Aconitate hydratase B Proteins 0.000 claims description 2
- 101710105008 RNA-binding protein Proteins 0.000 claims description 2
- 239000007795 chemical reaction product Substances 0.000 claims description 2
- 239000003623 enhancer Substances 0.000 claims description 2
- 230000003100 immobilizing effect Effects 0.000 claims description 2
- 230000035945 sensitivity Effects 0.000 claims description 2
- 102000023732 binding proteins Human genes 0.000 claims 5
- 239000007788 liquid Substances 0.000 claims 1
- 230000003321 amplification Effects 0.000 abstract description 20
- 238000003199 nucleic acid amplification method Methods 0.000 abstract description 20
- 230000000712 assembly Effects 0.000 abstract description 11
- 238000000429 assembly Methods 0.000 abstract description 11
- 230000009870 specific binding Effects 0.000 abstract description 9
- 238000012544 monitoring process Methods 0.000 abstract description 4
- 238000004458 analytical method Methods 0.000 abstract description 3
- 238000003745 diagnosis Methods 0.000 abstract description 3
- 201000010099 disease Diseases 0.000 abstract description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 3
- 230000002068 genetic effect Effects 0.000 abstract description 3
- 230000004807 localization Effects 0.000 abstract description 3
- 150000001413 amino acids Chemical group 0.000 description 128
- 235000001014 amino acid Nutrition 0.000 description 116
- 241000725303 Human immunodeficiency virus Species 0.000 description 88
- 239000012634 fragment Substances 0.000 description 78
- 230000000692 anti-sense effect Effects 0.000 description 77
- 108020004414 DNA Proteins 0.000 description 75
- 235000018102 proteins Nutrition 0.000 description 64
- 239000002299 complementary DNA Substances 0.000 description 63
- 108090000765 processed proteins & peptides Proteins 0.000 description 43
- 241000701806 Human papillomavirus Species 0.000 description 30
- 102100035348 Serine/threonine-protein phosphatase 2B catalytic subunit alpha isoform Human genes 0.000 description 30
- 101001007348 Arachis hypogaea Galactose-binding lectin Proteins 0.000 description 28
- 230000004568 DNA-binding Effects 0.000 description 26
- 230000015572 biosynthetic process Effects 0.000 description 25
- 239000000539 dimer Substances 0.000 description 24
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 23
- 210000004027 cell Anatomy 0.000 description 23
- 238000007792 addition Methods 0.000 description 22
- 102100023050 Nuclear factor NF-kappa-B p105 subunit Human genes 0.000 description 20
- 101710123496 Spindolin Proteins 0.000 description 20
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 20
- 108010050848 glycylleucine Proteins 0.000 description 20
- 238000003556 assay Methods 0.000 description 19
- 101150015482 BBR gene Proteins 0.000 description 18
- 108010047857 aspartylglycine Proteins 0.000 description 17
- 230000002787 reinforcement Effects 0.000 description 16
- 108091034117 Oligonucleotide Proteins 0.000 description 15
- 241000700605 Viruses Species 0.000 description 14
- 108010054155 lysyllysine Proteins 0.000 description 14
- 238000002360 preparation method Methods 0.000 description 14
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 13
- 101710149951 Protein Tat Proteins 0.000 description 13
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 13
- 108010062796 arginyllysine Proteins 0.000 description 13
- 108010061238 threonyl-glycine Proteins 0.000 description 13
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 12
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 12
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 12
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 11
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 11
- 238000006116 polymerization reaction Methods 0.000 description 11
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 10
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 10
- 241000341655 Human papillomavirus type 16 Species 0.000 description 10
- KYJHWKAMFISDJE-RCWTZXSCSA-N Met-Thr-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCSC KYJHWKAMFISDJE-RCWTZXSCSA-N 0.000 description 10
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 108010034529 leucyl-lysine Proteins 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 9
- 102000014914 Carrier Proteins Human genes 0.000 description 9
- 101000626125 Homo sapiens Tetranectin Proteins 0.000 description 9
- 108700026244 Open Reading Frames Proteins 0.000 description 9
- 102100024554 Tetranectin Human genes 0.000 description 9
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 9
- 235000013305 food Nutrition 0.000 description 9
- 108010015792 glycyllysine Proteins 0.000 description 9
- 230000003993 interaction Effects 0.000 description 9
- 108010077112 prolyl-proline Proteins 0.000 description 9
- 108091008146 restriction endonucleases Proteins 0.000 description 9
- 239000007787 solid Substances 0.000 description 9
- DCGXHWINSHEPIR-SRVKXCTJSA-N Leu-Lys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N DCGXHWINSHEPIR-SRVKXCTJSA-N 0.000 description 8
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 8
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 8
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 8
- -1 Target Binding Set Chemical class 0.000 description 8
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 8
- 239000003153 chemical reaction reagent Substances 0.000 description 8
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 8
- 108010003700 lysyl aspartic acid Proteins 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 7
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 7
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 7
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 7
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 7
- 206010028980 Neoplasm Diseases 0.000 description 7
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 7
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 7
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 7
- 108010047495 alanylglycine Proteins 0.000 description 7
- 108010068265 aspartyltyrosine Proteins 0.000 description 7
- 210000004369 blood Anatomy 0.000 description 7
- 239000008280 blood Substances 0.000 description 7
- 238000012217 deletion Methods 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 7
- 239000003814 drug Substances 0.000 description 7
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 7
- 230000003902 lesion Effects 0.000 description 7
- 108010057821 leucylproline Proteins 0.000 description 7
- 239000013612 plasmid Substances 0.000 description 7
- 230000002285 radioactive effect Effects 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 239000003656 tris buffered saline Substances 0.000 description 7
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 6
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 6
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 6
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 6
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 6
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 6
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 6
- 101710163270 Nuclease Proteins 0.000 description 6
- 241001631646 Papillomaviridae Species 0.000 description 6
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 6
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 6
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 6
- KAFKKRJQHOECGW-JCOFBHIZSA-N Thr-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(O)=O)=CNC2=C1 KAFKKRJQHOECGW-JCOFBHIZSA-N 0.000 description 6
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 6
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 6
- 108010038633 aspartylglutamate Proteins 0.000 description 6
- 108010092854 aspartyllysine Proteins 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 238000001574 biopsy Methods 0.000 description 6
- 229940079593 drug Drugs 0.000 description 6
- 230000001747 exhibiting effect Effects 0.000 description 6
- 238000013467 fragmentation Methods 0.000 description 6
- 238000006062 fragmentation reaction Methods 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 6
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 6
- 108010056582 methionylglutamic acid Proteins 0.000 description 6
- 108010070643 prolylglutamic acid Proteins 0.000 description 6
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 5
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 5
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 5
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 5
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 5
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 5
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 5
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 5
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 5
- VZIFYHYNQDIPLI-HJWJTTGWSA-N Ile-Arg-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N VZIFYHYNQDIPLI-HJWJTTGWSA-N 0.000 description 5
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 5
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 5
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 5
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 5
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 5
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 5
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 5
- NXJZCPKZIKTYLX-XEGUGMAKSA-N Trp-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NXJZCPKZIKTYLX-XEGUGMAKSA-N 0.000 description 5
- VMBBTANKMSRJSS-JSGCOSHPSA-N Trp-Glu-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VMBBTANKMSRJSS-JSGCOSHPSA-N 0.000 description 5
- CDRYEAWHKJSGAF-BPNCWPANSA-N Tyr-Ala-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O CDRYEAWHKJSGAF-BPNCWPANSA-N 0.000 description 5
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 5
- GZUIDWDVMWZSMI-KKUMJFAQSA-N Tyr-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GZUIDWDVMWZSMI-KKUMJFAQSA-N 0.000 description 5
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 5
- 108010077245 asparaginyl-proline Proteins 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 201000011510 cancer Diseases 0.000 description 5
- 208000019065 cervical carcinoma Diseases 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 5
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 5
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 238000002372 labelling Methods 0.000 description 5
- 230000036210 malignancy Effects 0.000 description 5
- 230000003211 malignant effect Effects 0.000 description 5
- 239000012071 phase Substances 0.000 description 5
- 108010029020 prolylglycine Proteins 0.000 description 5
- 238000011282 treatment Methods 0.000 description 5
- 108010020532 tyrosyl-proline Proteins 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- ZSOICJZJSRWNHX-ACZMJKKPSA-N Ala-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)[C@H](C)[NH3+] ZSOICJZJSRWNHX-ACZMJKKPSA-N 0.000 description 4
- QQACQIHVWCVBBR-GVARAGBVSA-N Ala-Ile-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QQACQIHVWCVBBR-GVARAGBVSA-N 0.000 description 4
- SIFXMYAHXJGAFC-WDSKDSINSA-N Arg-Asp Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O SIFXMYAHXJGAFC-WDSKDSINSA-N 0.000 description 4
- SYAUZLVLXCDRSH-IUCAKERBSA-N Arg-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N SYAUZLVLXCDRSH-IUCAKERBSA-N 0.000 description 4
- PRLPSDIHSRITSF-UNQGMJICSA-N Arg-Phe-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PRLPSDIHSRITSF-UNQGMJICSA-N 0.000 description 4
- MQLZLIYPFDIDMZ-HAFWLYHUSA-N Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O MQLZLIYPFDIDMZ-HAFWLYHUSA-N 0.000 description 4
- GGRSYTUJHAZTFN-IHRRRGAJSA-N Asp-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O GGRSYTUJHAZTFN-IHRRRGAJSA-N 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- YMBAVNPKBWHDAW-CIUDSAMLSA-N Cys-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N YMBAVNPKBWHDAW-CIUDSAMLSA-N 0.000 description 4
- SAEVTQWAYDPXMU-KATARQTJSA-N Cys-Thr-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O SAEVTQWAYDPXMU-KATARQTJSA-N 0.000 description 4
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 4
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 4
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 4
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 4
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 4
- 208000031886 HIV Infections Diseases 0.000 description 4
- 208000037357 HIV infectious disease Diseases 0.000 description 4
- 108010065920 Insulin Lispro Proteins 0.000 description 4
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 4
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 4
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 4
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 4
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 4
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 4
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 4
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 4
- 208000009608 Papillomavirus Infections Diseases 0.000 description 4
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 4
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 4
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 4
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 4
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 4
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 4
- 108020004511 Recombinant DNA Proteins 0.000 description 4
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 4
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 4
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 4
- CSZFFQBUTMGHAH-UAXMHLISSA-N Thr-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O CSZFFQBUTMGHAH-UAXMHLISSA-N 0.000 description 4
- 102100030246 Transcription factor Sp1 Human genes 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 239000012472 biological sample Substances 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 108010060199 cysteinylproline Proteins 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 4
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 239000000710 homodimer Substances 0.000 description 4
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 description 4
- 238000003018 immunoassay Methods 0.000 description 4
- 108010078274 isoleucylvaline Proteins 0.000 description 4
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 4
- 108010012058 leucyltyrosine Proteins 0.000 description 4
- 108010038320 lysylphenylalanine Proteins 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 239000011859 microparticle Substances 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 3
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 3
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 3
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 3
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 3
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 3
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 3
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 3
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 3
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 3
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 3
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 3
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 3
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 3
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 3
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 3
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 3
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 3
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 3
- 241000193830 Bacillus <bacterium> Species 0.000 description 3
- VBPGTULCFGKGTF-ACZMJKKPSA-N Cys-Glu-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VBPGTULCFGKGTF-ACZMJKKPSA-N 0.000 description 3
- WYVKPHCYMTWUCW-YUPRTTJUSA-N Cys-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)N)O WYVKPHCYMTWUCW-YUPRTTJUSA-N 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 3
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 3
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 3
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 3
- LLEUXCDZPQOJMY-AAEUAGOBSA-N Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 LLEUXCDZPQOJMY-AAEUAGOBSA-N 0.000 description 3
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 3
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 3
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 3
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 3
- KGVHCTWYMPWEGN-FSPLSTOPSA-N Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CN KGVHCTWYMPWEGN-FSPLSTOPSA-N 0.000 description 3
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 3
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 3
- PCPOYRCAHPJXII-UWVGGRQHSA-N Gly-Lys-Met Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PCPOYRCAHPJXII-UWVGGRQHSA-N 0.000 description 3
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 3
- MXIULRKNFSCJHT-STQMWFEESA-N Gly-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 MXIULRKNFSCJHT-STQMWFEESA-N 0.000 description 3
- LBDXVCBAJJNJNN-WHFBIAKZSA-N Gly-Ser-Cys Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O LBDXVCBAJJNJNN-WHFBIAKZSA-N 0.000 description 3
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 3
- SJIGTGZVQGLMGG-NAKRPEOUSA-N Ile-Cys-Arg Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O SJIGTGZVQGLMGG-NAKRPEOUSA-N 0.000 description 3
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 3
- 101710125507 Integrase/recombinase Proteins 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 3
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 3
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 3
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 3
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 3
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 3
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 3
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 3
- 239000000637 Melanocyte-Stimulating Hormone Substances 0.000 description 3
- 108010007013 Melanocyte-Stimulating Hormones Proteins 0.000 description 3
- OBVHKUFUDCPZDW-JYJNAYRXSA-N Met-Arg-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OBVHKUFUDCPZDW-JYJNAYRXSA-N 0.000 description 3
- CEGVMWAVGBRVFS-XGEHTFHBSA-N Met-Cys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CEGVMWAVGBRVFS-XGEHTFHBSA-N 0.000 description 3
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 3
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 3
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 3
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 3
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 3
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 3
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 3
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 3
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 101710156592 Putative TATA-binding protein pB263R Proteins 0.000 description 3
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 3
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 3
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 3
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 102100040296 TATA-box-binding protein Human genes 0.000 description 3
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 3
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 3
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 3
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 3
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 3
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 3
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 3
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 3
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 3
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 3
- 101710085924 Transcription factor Sp1 Proteins 0.000 description 3
- 239000007983 Tris buffer Substances 0.000 description 3
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 3
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 3
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 3
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 3
- 108010081404 acein-2 Proteins 0.000 description 3
- 108010011559 alanylphenylalanine Proteins 0.000 description 3
- 108010087924 alanylproline Proteins 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 239000000356 contaminant Substances 0.000 description 3
- 108010016616 cysteinylglycine Proteins 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 239000003365 glass fiber Substances 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 3
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 3
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 3
- 208000006454 hepatitis Diseases 0.000 description 3
- 231100000283 hepatitis Toxicity 0.000 description 3
- 239000000833 heterodimer Substances 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 108010040030 histidinoalanine Proteins 0.000 description 3
- 108010085325 histidylproline Proteins 0.000 description 3
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 3
- 108010027338 isoleucylcysteine Proteins 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 3
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 230000003505 mutagenic effect Effects 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 108010083127 phage repressor proteins Proteins 0.000 description 3
- 108010012581 phenylalanylglutamate Proteins 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 3
- 108010029384 tryptophyl-histidine Proteins 0.000 description 3
- 241000701447 unidentified baculovirus Species 0.000 description 3
- 108010009962 valyltyrosine Proteins 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 2
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 2
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 2
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 2
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 2
- NJIFPLAJSVUQOZ-JBDRJPRFSA-N Ala-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C)N NJIFPLAJSVUQOZ-JBDRJPRFSA-N 0.000 description 2
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 2
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 2
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 2
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 2
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 2
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 2
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- XEPSCVXTCUUHDT-AVGNSLFASA-N Arg-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N XEPSCVXTCUUHDT-AVGNSLFASA-N 0.000 description 2
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 2
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 2
- QYLJIYOGHRGUIH-CIUDSAMLSA-N Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N QYLJIYOGHRGUIH-CIUDSAMLSA-N 0.000 description 2
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 2
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 2
- AFNHFVVOJZBIJD-GUBZILKMSA-N Arg-Met-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O AFNHFVVOJZBIJD-GUBZILKMSA-N 0.000 description 2
- PQBHGSGQZSOLIR-RYUDHWBXSA-N Arg-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PQBHGSGQZSOLIR-RYUDHWBXSA-N 0.000 description 2
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 2
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 2
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 2
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 2
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 2
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 2
- ZPMNECSEJXXNBE-CIUDSAMLSA-N Asn-Cys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZPMNECSEJXXNBE-CIUDSAMLSA-N 0.000 description 2
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 2
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 2
- QJMCHPGWFZZRID-BQBZGAKWSA-N Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O QJMCHPGWFZZRID-BQBZGAKWSA-N 0.000 description 2
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 2
- PBFXCUOEGVJTMV-QXEWZRGKSA-N Asn-Met-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O PBFXCUOEGVJTMV-QXEWZRGKSA-N 0.000 description 2
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 2
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 2
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 2
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 2
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 2
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 2
- JGDBHIVECJGXJA-FXQIFTODSA-N Asp-Asp-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JGDBHIVECJGXJA-FXQIFTODSA-N 0.000 description 2
- FMWHSNJMHUNLAG-FXQIFTODSA-N Asp-Cys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FMWHSNJMHUNLAG-FXQIFTODSA-N 0.000 description 2
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 2
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 2
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 2
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 2
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 2
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 2
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 2
- 241000304886 Bacilli Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 2
- 241000606161 Chlamydia Species 0.000 description 2
- GMXSSZUVDNPRMA-FXQIFTODSA-N Cys-Arg-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GMXSSZUVDNPRMA-FXQIFTODSA-N 0.000 description 2
- UUERSUCTHOZPMG-SRVKXCTJSA-N Cys-Asn-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UUERSUCTHOZPMG-SRVKXCTJSA-N 0.000 description 2
- ASHTVGGFIMESRD-LKXGYXEUSA-N Cys-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)O ASHTVGGFIMESRD-LKXGYXEUSA-N 0.000 description 2
- KOHBWQDSVCARMI-BWBBJGPYSA-N Cys-Cys-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KOHBWQDSVCARMI-BWBBJGPYSA-N 0.000 description 2
- GCDLPNRHPWBKJJ-WDSKDSINSA-N Cys-Gly-Glu Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GCDLPNRHPWBKJJ-WDSKDSINSA-N 0.000 description 2
- GGRDJANMZPGMNS-CIUDSAMLSA-N Cys-Ser-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O GGRDJANMZPGMNS-CIUDSAMLSA-N 0.000 description 2
- 241000701022 Cytomegalovirus Species 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 2
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 2
- NKSGKPWXSWBRRX-ACZMJKKPSA-N Glu-Asn-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N NKSGKPWXSWBRRX-ACZMJKKPSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 2
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 2
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 2
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical group [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 2
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 2
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 2
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 2
- ZWMYUDZLXAQHCK-CIUDSAMLSA-N Glu-Met-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O ZWMYUDZLXAQHCK-CIUDSAMLSA-N 0.000 description 2
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 2
- ARIORLIIMJACKZ-KKUMJFAQSA-N Glu-Pro-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ARIORLIIMJACKZ-KKUMJFAQSA-N 0.000 description 2
- UCZXXMREFIETQW-AVGNSLFASA-N Glu-Tyr-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O UCZXXMREFIETQW-AVGNSLFASA-N 0.000 description 2
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 2
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 2
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 2
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 2
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 2
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 2
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 2
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 2
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 2
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 2
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 2
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 2
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- 108700025685 HIV Enhancer Proteins 0.000 description 2
- 208000007514 Herpes zoster Diseases 0.000 description 2
- RAVLQPXCMRCLKT-KBPBESRZSA-N His-Gly-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RAVLQPXCMRCLKT-KBPBESRZSA-N 0.000 description 2
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 2
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical group NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 2
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 2
- 241000701828 Human papillomavirus type 11 Species 0.000 description 2
- MHAJPDPJQMAIIY-UHFFFAOYSA-N Hydrogen peroxide Chemical compound OO MHAJPDPJQMAIIY-UHFFFAOYSA-N 0.000 description 2
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 2
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 2
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 2
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 2
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 2
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 2
- TWVKGYNQQAUNRN-ACZMJKKPSA-N Ile-Ser Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O TWVKGYNQQAUNRN-ACZMJKKPSA-N 0.000 description 2
- DRCKHKZYDLJYFQ-YWIQKCBGSA-N Ile-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRCKHKZYDLJYFQ-YWIQKCBGSA-N 0.000 description 2
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 2
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 2
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 2
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 2
- XYUBOFCTGPZFSA-WDSOQIARSA-N Leu-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 XYUBOFCTGPZFSA-WDSOQIARSA-N 0.000 description 2
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 2
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 2
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- RRSLQOLASISYTB-CIUDSAMLSA-N Leu-Cys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O RRSLQOLASISYTB-CIUDSAMLSA-N 0.000 description 2
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 2
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 2
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 2
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 2
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 2
- XWOBNBRUDDUEEY-UWVGGRQHSA-N Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XWOBNBRUDDUEEY-UWVGGRQHSA-N 0.000 description 2
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 2
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 2
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 2
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 2
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 2
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 2
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 2
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 2
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 2
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 2
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 2
- AIPHUKOBUXJNKM-KKUMJFAQSA-N Lys-Cys-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O AIPHUKOBUXJNKM-KKUMJFAQSA-N 0.000 description 2
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 2
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 2
- XDPLZVNMYQOFQZ-BJDJZHNGSA-N Lys-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N XDPLZVNMYQOFQZ-BJDJZHNGSA-N 0.000 description 2
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 2
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 2
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 2
- AHFOKDZWPPGJAZ-SRVKXCTJSA-N Lys-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N AHFOKDZWPPGJAZ-SRVKXCTJSA-N 0.000 description 2
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 2
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 2
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 2
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 2
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 2
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 2
- AFLBTVGQCQLOFJ-AVGNSLFASA-N Lys-Pro-Arg Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AFLBTVGQCQLOFJ-AVGNSLFASA-N 0.000 description 2
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 2
- WAAZECNCPVGPIV-RHYQMDGZSA-N Lys-Thr-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O WAAZECNCPVGPIV-RHYQMDGZSA-N 0.000 description 2
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 2
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 2
- JQEBITVYKUCBMC-SRVKXCTJSA-N Met-Arg-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JQEBITVYKUCBMC-SRVKXCTJSA-N 0.000 description 2
- ZEDVFJPQNNBMST-CYDGBPFRSA-N Met-Arg-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZEDVFJPQNNBMST-CYDGBPFRSA-N 0.000 description 2
- OGAZPKJHHZPYFK-GARJFASQSA-N Met-Glu-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGAZPKJHHZPYFK-GARJFASQSA-N 0.000 description 2
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 2
- WEDDFMCSUNNZJR-WDSKDSINSA-N Met-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O WEDDFMCSUNNZJR-WDSKDSINSA-N 0.000 description 2
- 241000408551 Meza Species 0.000 description 2
- 241001480037 Microsporum Species 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- 108010065395 Neuropep-1 Proteins 0.000 description 2
- 108010038807 Oligopeptides Proteins 0.000 description 2
- 102000015636 Oligopeptides Human genes 0.000 description 2
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 2
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 2
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 2
- IEOHQGFKHXUALJ-JYJNAYRXSA-N Phe-Met-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IEOHQGFKHXUALJ-JYJNAYRXSA-N 0.000 description 2
- FZBGMXYQPACKNC-HJWJTTGWSA-N Phe-Pro-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FZBGMXYQPACKNC-HJWJTTGWSA-N 0.000 description 2
- XOHJOMKCRLHGCY-UNQGMJICSA-N Phe-Pro-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOHJOMKCRLHGCY-UNQGMJICSA-N 0.000 description 2
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 2
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 2
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 2
- QCARZLHECSFOGG-CIUDSAMLSA-N Pro-Glu-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O QCARZLHECSFOGG-CIUDSAMLSA-N 0.000 description 2
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 2
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 2
- WCNVGGZRTNHOOS-ULQDDVLXSA-N Pro-Lys-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O WCNVGGZRTNHOOS-ULQDDVLXSA-N 0.000 description 2
- IWIANZLCJVYEFX-RYUDHWBXSA-N Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 IWIANZLCJVYEFX-RYUDHWBXSA-N 0.000 description 2
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 2
- AFWBWPCXSWUCLB-WDSKDSINSA-N Pro-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 AFWBWPCXSWUCLB-WDSKDSINSA-N 0.000 description 2
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 2
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 2
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 230000004570 RNA-binding Effects 0.000 description 2
- 241000702263 Reovirus sp. Species 0.000 description 2
- 240000005384 Rhizopus oryzae Species 0.000 description 2
- 235000013752 Rhizopus oryzae Nutrition 0.000 description 2
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 2
- VBKBDLMWICBSCY-IMJSIDKUSA-N Ser-Asp Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O VBKBDLMWICBSCY-IMJSIDKUSA-N 0.000 description 2
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 2
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 2
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 2
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 2
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 2
- SRKMDKACHDVPMD-SRVKXCTJSA-N Ser-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N SRKMDKACHDVPMD-SRVKXCTJSA-N 0.000 description 2
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 2
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 2
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 2
- OJFFAQFRCVPHNN-JYBASQMISA-N Ser-Thr-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OJFFAQFRCVPHNN-JYBASQMISA-N 0.000 description 2
- KIEIJCFVGZCUAS-MELADBBJSA-N Ser-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N)C(=O)O KIEIJCFVGZCUAS-MELADBBJSA-N 0.000 description 2
- 241001478880 Streptobacillus moniliformis Species 0.000 description 2
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 2
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 2
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 2
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 2
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 2
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 2
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- VEENWOSZGWWKHW-SZZJOZGLSA-N Thr-Trp-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N)O VEENWOSZGWWKHW-SZZJOZGLSA-N 0.000 description 2
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 2
- JBBYKPZAPOLCPK-JYJNAYRXSA-N Tyr-Arg-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O JBBYKPZAPOLCPK-JYJNAYRXSA-N 0.000 description 2
- QZOSVNLXLSNHQK-UWVGGRQHSA-N Tyr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UWVGGRQHSA-N 0.000 description 2
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 2
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 2
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 2
- FQNUWOHNGJWNLM-QWRGUYRKSA-N Tyr-Cys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FQNUWOHNGJWNLM-QWRGUYRKSA-N 0.000 description 2
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 2
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 2
- JYVKKBDANPZIAW-AVGNSLFASA-N Val-Arg-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N JYVKKBDANPZIAW-AVGNSLFASA-N 0.000 description 2
- IRLYZKKNBFPQBW-XGEHTFHBSA-N Val-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N)O IRLYZKKNBFPQBW-XGEHTFHBSA-N 0.000 description 2
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 2
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 2
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 238000003149 assay kit Methods 0.000 description 2
- 108010058966 bacteriophage T7 induced DNA polymerase Proteins 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 108010004073 cysteinylcysteine Proteins 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 2
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 230000002757 inflammatory effect Effects 0.000 description 2
- 206010022000 influenza Diseases 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- PNDPGZBMCMUPRI-UHFFFAOYSA-N iodine Chemical compound II PNDPGZBMCMUPRI-UHFFFAOYSA-N 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 208000032839 leukemia Diseases 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 239000004005 microsphere Substances 0.000 description 2
- 238000001823 molecular biology technique Methods 0.000 description 2
- 231100000219 mutagenic Toxicity 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 244000045947 parasite Species 0.000 description 2
- 230000004983 pleiotropic effect Effects 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 230000000069 prophylactic effect Effects 0.000 description 2
- 210000005000 reproductive tract Anatomy 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 239000011534 wash buffer Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- VLAFRQCSFRYCLC-FXQIFTODSA-N (2s)-2-[[(2s)-2-[[2-[[(2s)-2-aminopropanoyl]amino]acetyl]amino]-3-hydroxypropanoyl]amino]pentanedioic acid Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VLAFRQCSFRYCLC-FXQIFTODSA-N 0.000 description 1
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 1
- RVLOMLVNNBWRSR-KNIFDHDWSA-N (2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O RVLOMLVNNBWRSR-KNIFDHDWSA-N 0.000 description 1
- BCHIXGBGRHLSBE-UHFFFAOYSA-N (4-methyl-2-oxochromen-7-yl) dihydrogen phosphate Chemical compound C1=C(OP(O)(O)=O)C=CC2=C1OC(=O)C=C2C BCHIXGBGRHLSBE-UHFFFAOYSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- PEZMQPADLFXCJJ-ZETCQYMHSA-N 2-[[2-[[(2s)-1-(2-aminoacetyl)pyrrolidine-2-carbonyl]amino]acetyl]amino]acetic acid Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(=O)NCC(O)=O PEZMQPADLFXCJJ-ZETCQYMHSA-N 0.000 description 1
- NOIIUHRQUVNIDD-UHFFFAOYSA-N 3-[[oxo(pyridin-4-yl)methyl]hydrazo]-N-(phenylmethyl)propanamide Chemical compound C=1C=CC=CC=1CNC(=O)CCNNC(=O)C1=CC=NC=C1 NOIIUHRQUVNIDD-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- IMIZPWSVYADSCN-UHFFFAOYSA-N 4-methyl-2-[[4-methyl-2-[[4-methyl-2-(pyrrolidine-2-carbonylamino)pentanoyl]amino]pentanoyl]amino]pentanoic acid Chemical compound CC(C)CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(CC(C)C)NC(=O)C1CCCN1 IMIZPWSVYADSCN-UHFFFAOYSA-N 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- 241000186046 Actinomyces Species 0.000 description 1
- 241000186042 Actinomyces bovis Species 0.000 description 1
- 241000186045 Actinomyces naeslundii Species 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 1
- FSBCNCKIQZZASN-GUBZILKMSA-N Ala-Arg-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O FSBCNCKIQZZASN-GUBZILKMSA-N 0.000 description 1
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 1
- XQJAFSDFQZPYCU-UWJYBYFXSA-N Ala-Asn-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N XQJAFSDFQZPYCU-UWJYBYFXSA-N 0.000 description 1
- XAEWTDMGFGHWFK-IMJSIDKUSA-N Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O XAEWTDMGFGHWFK-IMJSIDKUSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical group [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- XZWXFWBHYRFLEF-FSPLSTOPSA-N Ala-His Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XZWXFWBHYRFLEF-FSPLSTOPSA-N 0.000 description 1
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- FUKFQILQFQKHLE-DCAQKATOSA-N Ala-Lys-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O FUKFQILQFQKHLE-DCAQKATOSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- DWYROCSXOOMOEU-CIUDSAMLSA-N Ala-Met-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DWYROCSXOOMOEU-CIUDSAMLSA-N 0.000 description 1
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- 241000588813 Alcaligenes faecalis Species 0.000 description 1
- 108700015979 Arabidopsis TatA Proteins 0.000 description 1
- WVRUNFYJIHNFKD-WDSKDSINSA-N Arg-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N WVRUNFYJIHNFKD-WDSKDSINSA-N 0.000 description 1
- SBVJJNJLFWSJOV-UBHSHLNASA-N Arg-Ala-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SBVJJNJLFWSJOV-UBHSHLNASA-N 0.000 description 1
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical group NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 1
- JSLGXODUIAFWCF-WDSKDSINSA-N Arg-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O JSLGXODUIAFWCF-WDSKDSINSA-N 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 1
- BNODVYXZAAXSHW-IUCAKERBSA-N Arg-His Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BNODVYXZAAXSHW-IUCAKERBSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- HCIUUZGFTDTEGM-NAKRPEOUSA-N Arg-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HCIUUZGFTDTEGM-NAKRPEOUSA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-IUCAKERBSA-N Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N WYBVBIHNJWOLCJ-IUCAKERBSA-N 0.000 description 1
- NOZYDJOPOGKUSR-AVGNSLFASA-N Arg-Leu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O NOZYDJOPOGKUSR-AVGNSLFASA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 1
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 1
- JBIRFLWXWDSDTR-CYDGBPFRSA-N Arg-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCN=C(N)N)N JBIRFLWXWDSDTR-CYDGBPFRSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- RATVAFHGEFAWDH-JYJNAYRXSA-N Arg-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCN=C(N)N)N RATVAFHGEFAWDH-JYJNAYRXSA-N 0.000 description 1
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 1
- XFXZKCRBBOVJKS-BVSLBCMMSA-N Arg-Phe-Trp Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 XFXZKCRBBOVJKS-BVSLBCMMSA-N 0.000 description 1
- LQJAALCCPOTJGB-YUMQZZPRSA-N Arg-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 1
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 1
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 1
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 1
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 1
- KSHJMDSNSKDJPU-QTKMDUPCSA-N Arg-Thr-His Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KSHJMDSNSKDJPU-QTKMDUPCSA-N 0.000 description 1
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 1
- QNYWYYNQSXANBL-WDSOQIARSA-N Arg-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QNYWYYNQSXANBL-WDSOQIARSA-N 0.000 description 1
- XTWSWDJMIKUJDQ-RYUDHWBXSA-N Arg-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XTWSWDJMIKUJDQ-RYUDHWBXSA-N 0.000 description 1
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 1
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- RRVBEKYEFMCDIF-WHFBIAKZSA-N Asn-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)C(=O)N RRVBEKYEFMCDIF-WHFBIAKZSA-N 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- ZKDGORKGHPCZOV-DCAQKATOSA-N Asn-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZKDGORKGHPCZOV-DCAQKATOSA-N 0.000 description 1
- QUAWOKPCAKCHQL-SRVKXCTJSA-N Asn-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QUAWOKPCAKCHQL-SRVKXCTJSA-N 0.000 description 1
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 1
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 1
- FODVBOKTYKYRFJ-CIUDSAMLSA-N Asn-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FODVBOKTYKYRFJ-CIUDSAMLSA-N 0.000 description 1
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 1
- QDXQWFBLUVTOFL-FXQIFTODSA-N Asn-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)N)N QDXQWFBLUVTOFL-FXQIFTODSA-N 0.000 description 1
- KEUNWIXNKVWCFL-FXQIFTODSA-N Asn-Met-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O KEUNWIXNKVWCFL-FXQIFTODSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- SONUFGRSSMFHFN-IMJSIDKUSA-N Asn-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O SONUFGRSSMFHFN-IMJSIDKUSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- FHCRKXCTKSHNOE-QEJZJMRPSA-N Asn-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FHCRKXCTKSHNOE-QEJZJMRPSA-N 0.000 description 1
- FYRVDDJMNISIKJ-UWVGGRQHSA-N Asn-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FYRVDDJMNISIKJ-UWVGGRQHSA-N 0.000 description 1
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 1
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 1
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 1
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 1
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- ACEDJCOOPZFUBU-CIUDSAMLSA-N Asp-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N ACEDJCOOPZFUBU-CIUDSAMLSA-N 0.000 description 1
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 1
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 1
- KPNUCOPMVSGRCR-DCAQKATOSA-N Asp-His-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KPNUCOPMVSGRCR-DCAQKATOSA-N 0.000 description 1
- WSXDIZFNQYTUJB-SRVKXCTJSA-N Asp-His-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O WSXDIZFNQYTUJB-SRVKXCTJSA-N 0.000 description 1
- KQBVNNAPIURMPD-PEFMBERDSA-N Asp-Ile-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KQBVNNAPIURMPD-PEFMBERDSA-N 0.000 description 1
- AITKTFCQOBRJTG-CIUDSAMLSA-N Asp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N AITKTFCQOBRJTG-CIUDSAMLSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- FQHBAQLBIXLWAG-DCAQKATOSA-N Asp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N FQHBAQLBIXLWAG-DCAQKATOSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- DYDKXJWQCIVTMR-WDSKDSINSA-N Asp-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O DYDKXJWQCIVTMR-WDSKDSINSA-N 0.000 description 1
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- NTQDELBZOMWXRS-IWGUZYHVSA-N Asp-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O NTQDELBZOMWXRS-IWGUZYHVSA-N 0.000 description 1
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- 241001225321 Aspergillus fumigatus Species 0.000 description 1
- 241000351920 Aspergillus nidulans Species 0.000 description 1
- 241000711404 Avian avulavirus 1 Species 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 241000193755 Bacillus cereus Species 0.000 description 1
- 241000194107 Bacillus megaterium Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000606660 Bartonella Species 0.000 description 1
- 241000606108 Bartonella quintana Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 241000335423 Blastomyces Species 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 241000588832 Bordetella pertussis Species 0.000 description 1
- 241000589968 Borrelia Species 0.000 description 1
- 241000701822 Bovine papillomavirus Species 0.000 description 1
- 241000589567 Brucella abortus Species 0.000 description 1
- 241001148111 Brucella suis Species 0.000 description 1
- 102000015280 CCAAT-Enhancer-Binding Protein-beta Human genes 0.000 description 1
- 108010064535 CCAAT-Enhancer-Binding Protein-beta Proteins 0.000 description 1
- 0 CCC*CC1=CCC=*1 Chemical compound CCC*CC1=CCC=*1 0.000 description 1
- 108010072454 CTGCAG-specific type II deoxyribonucleases Proteins 0.000 description 1
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 1
- 241000222122 Candida albicans Species 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 201000006082 Chickenpox Diseases 0.000 description 1
- 241000222290 Cladosporium Species 0.000 description 1
- 241000193155 Clostridium botulinum Species 0.000 description 1
- 241000186581 Clostridium novyi Species 0.000 description 1
- 241000193468 Clostridium perfringens Species 0.000 description 1
- 241000193466 Clostridium septicum Species 0.000 description 1
- 241000193470 Clostridium sporogenes Species 0.000 description 1
- 241000186528 Clostridium tertium Species 0.000 description 1
- 241000193449 Clostridium tetani Species 0.000 description 1
- 241000223205 Coccidioides immitis Species 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241000709687 Coxsackievirus Species 0.000 description 1
- 201000007336 Cryptococcosis Diseases 0.000 description 1
- 241000221204 Cryptococcus neoformans Species 0.000 description 1
- 108700020473 Cyclic AMP Receptor Proteins 0.000 description 1
- MBPKYKSYUAPLMY-DCAQKATOSA-N Cys-Arg-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MBPKYKSYUAPLMY-DCAQKATOSA-N 0.000 description 1
- SQJSYLDKQBZQTG-FXQIFTODSA-N Cys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N SQJSYLDKQBZQTG-FXQIFTODSA-N 0.000 description 1
- WXKWQSDHEXKKNC-ZKWXMUAHSA-N Cys-Asp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N WXKWQSDHEXKKNC-ZKWXMUAHSA-N 0.000 description 1
- HYKFOHGZGLOCAY-ZLUOBGJFSA-N Cys-Cys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O HYKFOHGZGLOCAY-ZLUOBGJFSA-N 0.000 description 1
- UXUSHQYYQCZWET-WDSKDSINSA-N Cys-Glu-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O UXUSHQYYQCZWET-WDSKDSINSA-N 0.000 description 1
- HQZGVYJBRSISDT-BQBZGAKWSA-N Cys-Gly-Arg Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQZGVYJBRSISDT-BQBZGAKWSA-N 0.000 description 1
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 1
- DZSICRGTVPDCRN-YUMQZZPRSA-N Cys-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N DZSICRGTVPDCRN-YUMQZZPRSA-N 0.000 description 1
- ZQHQTSONVIANQR-BQBZGAKWSA-N Cys-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N ZQHQTSONVIANQR-BQBZGAKWSA-N 0.000 description 1
- UVZFZTWNHOQWNK-NAKRPEOUSA-N Cys-Ile-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UVZFZTWNHOQWNK-NAKRPEOUSA-N 0.000 description 1
- IZUNQDRIAOLWCN-YUMQZZPRSA-N Cys-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N IZUNQDRIAOLWCN-YUMQZZPRSA-N 0.000 description 1
- IDFVDSBJNMPBSX-SRVKXCTJSA-N Cys-Lys-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O IDFVDSBJNMPBSX-SRVKXCTJSA-N 0.000 description 1
- KGIHMGPYGXBYJJ-SRVKXCTJSA-N Cys-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CS KGIHMGPYGXBYJJ-SRVKXCTJSA-N 0.000 description 1
- UIKLEGZPIOXFHJ-DLOVCJGASA-N Cys-Phe-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O UIKLEGZPIOXFHJ-DLOVCJGASA-N 0.000 description 1
- RAGIABZNLPZBGS-FXQIFTODSA-N Cys-Pro-Cys Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(O)=O RAGIABZNLPZBGS-FXQIFTODSA-N 0.000 description 1
- MBRWOKXNHTUJMB-CIUDSAMLSA-N Cys-Pro-Glu Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O MBRWOKXNHTUJMB-CIUDSAMLSA-N 0.000 description 1
- HMWBPUDETPKSSS-DCAQKATOSA-N Cys-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CCCCN)C(=O)O HMWBPUDETPKSSS-DCAQKATOSA-N 0.000 description 1
- CMYVIUWVYHOLRD-ZLUOBGJFSA-N Cys-Ser-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CMYVIUWVYHOLRD-ZLUOBGJFSA-N 0.000 description 1
- JIZRUFJGHPIYPS-SRVKXCTJSA-N Cys-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O JIZRUFJGHPIYPS-SRVKXCTJSA-N 0.000 description 1
- CLEFUAZULXANBU-MELADBBJSA-N Cys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CS)N)C(=O)O CLEFUAZULXANBU-MELADBBJSA-N 0.000 description 1
- VRJZMZGGAKVSIQ-SRVKXCTJSA-N Cys-Tyr-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VRJZMZGGAKVSIQ-SRVKXCTJSA-N 0.000 description 1
- YQEHNIKPAOPBNH-DCAQKATOSA-N Cys-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N YQEHNIKPAOPBNH-DCAQKATOSA-N 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 108020003215 DNA Probes Proteins 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 241000725619 Dengue virus Species 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 238000009007 Diagnostic Kit Methods 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 108700034853 E coli TRPR Proteins 0.000 description 1
- 241000710945 Eastern equine encephalitis virus Species 0.000 description 1
- 241000709661 Enterovirus Species 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000223664 Exophiala jeanselmei Species 0.000 description 1
- CWYNVVGOOAEACU-UHFFFAOYSA-N Fe2+ Chemical compound [Fe+2] CWYNVVGOOAEACU-UHFFFAOYSA-N 0.000 description 1
- 241000122862 Fonsecaea Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 102100024375 Gamma-glutamylaminecyclotransferase Human genes 0.000 description 1
- 101710201613 Gamma-glutamylaminecyclotransferase Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- MPZWMIIOPAPAKE-BQBZGAKWSA-N Glu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MPZWMIIOPAPAKE-BQBZGAKWSA-N 0.000 description 1
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- PKYAVRMYTBBRLS-FXQIFTODSA-N Glu-Cys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O PKYAVRMYTBBRLS-FXQIFTODSA-N 0.000 description 1
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- SNFUTDLOCQQRQD-ZKWXMUAHSA-N Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SNFUTDLOCQQRQD-ZKWXMUAHSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 1
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- MXXXVOYFNVJHMA-IUCAKERBSA-N Gly-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN MXXXVOYFNVJHMA-IUCAKERBSA-N 0.000 description 1
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 1
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- 108010050006 Gly-Asp-Gly-Arg Proteins 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- LGQZOQRDEUIZJY-YUMQZZPRSA-N Gly-Cys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CS)NC(=O)CN)C(O)=O LGQZOQRDEUIZJY-YUMQZZPRSA-N 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- HHRODZSXDXMUHS-LURJTMIESA-N Gly-Met-Gly Chemical compound CSCC[C@H](NC(=O)C[NH3+])C(=O)NCC([O-])=O HHRODZSXDXMUHS-LURJTMIESA-N 0.000 description 1
- LXTRSHQLGYINON-DTWKUNHWSA-N Gly-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN LXTRSHQLGYINON-DTWKUNHWSA-N 0.000 description 1
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical group NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 1
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- NGBGZCUWFVVJKC-IRXDYDNUSA-N Gly-Tyr-Tyr Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NGBGZCUWFVVJKC-IRXDYDNUSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 108700038832 HPV-33 E2 Proteins 0.000 description 1
- 241000193159 Hathewaya histolytica Species 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 241000709721 Hepatovirus A Species 0.000 description 1
- 208000028782 Hereditary disease Diseases 0.000 description 1
- 208000009889 Herpes Simplex Diseases 0.000 description 1
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 1
- NIKBMHGRNAPJFW-IUCAKERBSA-N His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 NIKBMHGRNAPJFW-IUCAKERBSA-N 0.000 description 1
- MWWOPNQSBXEUHO-ULQDDVLXSA-N His-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 MWWOPNQSBXEUHO-ULQDDVLXSA-N 0.000 description 1
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 1
- LYSMQLXUCAKELQ-DCAQKATOSA-N His-Asp-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N LYSMQLXUCAKELQ-DCAQKATOSA-N 0.000 description 1
- CYHWWHKRCKHYGQ-GUBZILKMSA-N His-Cys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N CYHWWHKRCKHYGQ-GUBZILKMSA-N 0.000 description 1
- UJWYPUUXIAKEES-CUJWVEQBSA-N His-Cys-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UJWYPUUXIAKEES-CUJWVEQBSA-N 0.000 description 1
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 1
- BRZQWIIFIKTJDH-VGDYDELISA-N His-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N BRZQWIIFIKTJDH-VGDYDELISA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical group [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- LJUIEESLIAZSFR-SRVKXCTJSA-N His-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LJUIEESLIAZSFR-SRVKXCTJSA-N 0.000 description 1
- BPOHQCZZSFBSON-KKUMJFAQSA-N His-Leu-His Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BPOHQCZZSFBSON-KKUMJFAQSA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 1
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 1
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 1
- OWYIDJCNRWRSJY-QTKMDUPCSA-N His-Pro-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O OWYIDJCNRWRSJY-QTKMDUPCSA-N 0.000 description 1
- MDOBWSFNSNPENN-PMVVWTBXSA-N His-Thr-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O MDOBWSFNSNPENN-PMVVWTBXSA-N 0.000 description 1
- NBWATNYAUVSAEQ-ZEILLAHLSA-N His-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O NBWATNYAUVSAEQ-ZEILLAHLSA-N 0.000 description 1
- UIRUVUUGUYCMBY-KCTSRDHCSA-N His-Trp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CN=CN3)N UIRUVUUGUYCMBY-KCTSRDHCSA-N 0.000 description 1
- YERBCFWVWITTEJ-NAZCDGGXSA-N His-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CN=CN3)N)O YERBCFWVWITTEJ-NAZCDGGXSA-N 0.000 description 1
- FRDFAWHTPDKRHG-ULQDDVLXSA-N His-Tyr-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CN=CN1 FRDFAWHTPDKRHG-ULQDDVLXSA-N 0.000 description 1
- CGAMSLMBYJHMDY-ONGXEEELSA-N His-Val-Gly Chemical compound CC(C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N CGAMSLMBYJHMDY-ONGXEEELSA-N 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 241000228404 Histoplasma capsulatum Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000979342 Homo sapiens Nuclear factor NF-kappa-B p105 subunit Proteins 0.000 description 1
- 241000598436 Human T-cell lymphotropic virus Species 0.000 description 1
- 101000622327 Human papillomavirus type 18 Regulatory protein E2 Proteins 0.000 description 1
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 1
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 1
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 1
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 1
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 1
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- JSZMKEYEVLDPDO-ACZMJKKPSA-N Ile-Cys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CS)C(O)=O JSZMKEYEVLDPDO-ACZMJKKPSA-N 0.000 description 1
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 1
- DURWCDDDAWVPOP-JBDRJPRFSA-N Ile-Cys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N DURWCDDDAWVPOP-JBDRJPRFSA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- JLWLMGADIQFKRD-QSFUFRPTSA-N Ile-His-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CN=CN1 JLWLMGADIQFKRD-QSFUFRPTSA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- DMSVBUWGDLYNLC-IAVJCBSLSA-N Ile-Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DMSVBUWGDLYNLC-IAVJCBSLSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 1
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 1
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 1
- RMJWFINHACYKJI-SIUGBPQLSA-N Ile-Tyr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RMJWFINHACYKJI-SIUGBPQLSA-N 0.000 description 1
- NSPNUMNLZNOPAQ-SJWGOKEGSA-N Ile-Tyr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N NSPNUMNLZNOPAQ-SJWGOKEGSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 241001221585 Keratinomyces Species 0.000 description 1
- 241000588747 Klebsiella pneumoniae Species 0.000 description 1
- QLROSWPKSBORFJ-BQBZGAKWSA-N L-Prolyl-L-glutamic acid Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 1
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 108010054278 Lac Repressors Proteins 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- 241000589902 Leptospira Species 0.000 description 1
- 241001550390 Leptospira interrogans serovar Canicola Species 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 1
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 1
- JUWJEAPUNARGCF-DCAQKATOSA-N Leu-Arg-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JUWJEAPUNARGCF-DCAQKATOSA-N 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- HUEBCHPSXSQUGN-GARJFASQSA-N Leu-Cys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N HUEBCHPSXSQUGN-GARJFASQSA-N 0.000 description 1
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- NRFGTHFONZYFNY-MGHWNKPDSA-N Leu-Ile-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NRFGTHFONZYFNY-MGHWNKPDSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 1
- MJTOYIHCKVQICL-ULQDDVLXSA-N Leu-Met-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MJTOYIHCKVQICL-ULQDDVLXSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- LHSGPCFBGJHPCY-STQMWFEESA-N Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-STQMWFEESA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 1
- 241000144128 Lichtheimia corymbifera Species 0.000 description 1
- 241000186779 Listeria monocytogenes Species 0.000 description 1
- 208000016604 Lyme disease Diseases 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 1
- JPNRPAJITHRXRH-BQBZGAKWSA-N Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O JPNRPAJITHRXRH-BQBZGAKWSA-N 0.000 description 1
- WLCYCADOWRMSAJ-CIUDSAMLSA-N Lys-Asn-Cys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O WLCYCADOWRMSAJ-CIUDSAMLSA-N 0.000 description 1
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 1
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 1
- CFVQPNSCQMKDPB-CIUDSAMLSA-N Lys-Cys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N CFVQPNSCQMKDPB-CIUDSAMLSA-N 0.000 description 1
- SSYOBDBNBQBSQE-SRVKXCTJSA-N Lys-Cys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O SSYOBDBNBQBSQE-SRVKXCTJSA-N 0.000 description 1
- DZQYZKPINJLLEN-KKUMJFAQSA-N Lys-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O DZQYZKPINJLLEN-KKUMJFAQSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- KZJQUYFDSCFSCO-DLOVCJGASA-N Lys-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N KZJQUYFDSCFSCO-DLOVCJGASA-N 0.000 description 1
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 1
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 1
- CBNMHRCLYBJIIZ-XUXIUFHCSA-N Lys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N CBNMHRCLYBJIIZ-XUXIUFHCSA-N 0.000 description 1
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- DAHQKYYIXPBESV-UWVGGRQHSA-N Lys-Met-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O DAHQKYYIXPBESV-UWVGGRQHSA-N 0.000 description 1
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 1
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 1
- AEIIJFBQVGYVEV-YESZJQIVSA-N Lys-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCCN)N)C(=O)O AEIIJFBQVGYVEV-YESZJQIVSA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- YRNRVKTYDSLKMD-KKUMJFAQSA-N Lys-Ser-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YRNRVKTYDSLKMD-KKUMJFAQSA-N 0.000 description 1
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 1
- LMMBAXJRYSXCOQ-ACRUOGEOSA-N Lys-Tyr-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O LMMBAXJRYSXCOQ-ACRUOGEOSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 102000043129 MHC class I family Human genes 0.000 description 1
- 108091054437 MHC class I family Proteins 0.000 description 1
- 241001444203 Madurella mycetomatis Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000712079 Measles morbillivirus Species 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- VTKPSXWRUGCOAC-GUBZILKMSA-N Met-Ala-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCSC VTKPSXWRUGCOAC-GUBZILKMSA-N 0.000 description 1
- UASDAHIAHBRZQV-YUMQZZPRSA-N Met-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N UASDAHIAHBRZQV-YUMQZZPRSA-N 0.000 description 1
- TUSOIZOVPJCMFC-FXQIFTODSA-N Met-Asp-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O TUSOIZOVPJCMFC-FXQIFTODSA-N 0.000 description 1
- GODBLDDYHFTUAH-CIUDSAMLSA-N Met-Asp-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O GODBLDDYHFTUAH-CIUDSAMLSA-N 0.000 description 1
- XOMXAVJBLRROMC-IHRRRGAJSA-N Met-Asp-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOMXAVJBLRROMC-IHRRRGAJSA-N 0.000 description 1
- CNUPMMXDISGXMU-CIUDSAMLSA-N Met-Cys-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O CNUPMMXDISGXMU-CIUDSAMLSA-N 0.000 description 1
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 1
- HGCNKOLVKRAVHD-RYUDHWBXSA-N Met-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-RYUDHWBXSA-N 0.000 description 1
- IILAGWCGKJSBGB-IHRRRGAJSA-N Met-Phe-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IILAGWCGKJSBGB-IHRRRGAJSA-N 0.000 description 1
- NTYQUVLERIHPMU-HRCADAONSA-N Met-Phe-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N NTYQUVLERIHPMU-HRCADAONSA-N 0.000 description 1
- SMVTWPOATVIXTN-NAKRPEOUSA-N Met-Ser-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SMVTWPOATVIXTN-NAKRPEOUSA-N 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 241000893980 Microsporum canis Species 0.000 description 1
- 241001430197 Mollicutes Species 0.000 description 1
- 241000588772 Morganella morganii Species 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- 241000711386 Mumps virus Species 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 241000187482 Mycobacterium avium subsp. paratuberculosis Species 0.000 description 1
- 241000186366 Mycobacterium bovis Species 0.000 description 1
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 1
- 241000202934 Mycoplasma pneumoniae Species 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 102000005395 NF-kappa B p50 Subunit Human genes 0.000 description 1
- 108010006401 NF-kappa B p50 Subunit Proteins 0.000 description 1
- 241000381130 Naucrates ductor Species 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000588652 Neisseria gonorrhoeae Species 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 101710204212 Neocarzinostatin Proteins 0.000 description 1
- 241000187678 Nocardia asteroides Species 0.000 description 1
- 241001503696 Nocardia brasiliensis Species 0.000 description 1
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 108091081548 Palindromic sequence Proteins 0.000 description 1
- 241000193157 Paraclostridium bifermentans Species 0.000 description 1
- 241000526686 Paracoccidioides brasiliensis Species 0.000 description 1
- 208000002606 Paramyxoviridae Infections Diseases 0.000 description 1
- 206010033976 Paravaccinia Diseases 0.000 description 1
- 241000606860 Pasteurella Species 0.000 description 1
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 1
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 1
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 1
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 1
- WGXOKDLDIWSOCV-MELADBBJSA-N Phe-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O WGXOKDLDIWSOCV-MELADBBJSA-N 0.000 description 1
- UEXCHCYDPAIVDE-SRVKXCTJSA-N Phe-Asp-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEXCHCYDPAIVDE-SRVKXCTJSA-N 0.000 description 1
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 1
- HQVPQHLNOVTLDD-IHRRRGAJSA-N Phe-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N HQVPQHLNOVTLDD-IHRRRGAJSA-N 0.000 description 1
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- VADLTGVIOIOKGM-BZSNNMDCSA-N Phe-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 VADLTGVIOIOKGM-BZSNNMDCSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 1
- RTUWVJVJSMOGPL-KKUMJFAQSA-N Phe-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RTUWVJVJSMOGPL-KKUMJFAQSA-N 0.000 description 1
- WURZLPSMYZLEGH-UNQGMJICSA-N Phe-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N)O WURZLPSMYZLEGH-UNQGMJICSA-N 0.000 description 1
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 1
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 1
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical group OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 1
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 1
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 1
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 1
- GCFNFKNPCMBHNT-IRXDYDNUSA-N Phe-Tyr-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)NCC(=O)O)N GCFNFKNPCMBHNT-IRXDYDNUSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- 241001531356 Phialophora verrucosa Species 0.000 description 1
- 102000004861 Phosphoric Diester Hydrolases Human genes 0.000 description 1
- 108090001050 Phosphoric Diester Hydrolases Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 1
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- ZTVCLZLGHZXLOT-ULQDDVLXSA-N Pro-Glu-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O ZTVCLZLGHZXLOT-ULQDDVLXSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- FDINZVJXLPILKV-DCAQKATOSA-N Pro-His-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O FDINZVJXLPILKV-DCAQKATOSA-N 0.000 description 1
- VWXGFAIZUQBBBG-UWVGGRQHSA-N Pro-His-Gly Chemical compound C([C@@H](C(=O)NCC(=O)[O-])NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 VWXGFAIZUQBBBG-UWVGGRQHSA-N 0.000 description 1
- BAKAHWWRCCUDAF-IHRRRGAJSA-N Pro-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BAKAHWWRCCUDAF-IHRRRGAJSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 1
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 1
- SWRNSCMUXRLHCR-ULQDDVLXSA-N Pro-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 SWRNSCMUXRLHCR-ULQDDVLXSA-N 0.000 description 1
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 1
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 1
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 1
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 1
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 1
- 101710097688 Probable sphingosine-1-phosphate lyase Proteins 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 101710132593 Protein E2 Proteins 0.000 description 1
- 102000002067 Protein Subunits Human genes 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 241000588769 Proteus <enterobacteria> Species 0.000 description 1
- 241000588770 Proteus mirabilis Species 0.000 description 1
- 241000588767 Proteus vulgaris Species 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 108020004518 RNA Probes Proteins 0.000 description 1
- 239000003391 RNA probe Substances 0.000 description 1
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 1
- 108091028733 RNTP Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241000235546 Rhizopus stolonifer Species 0.000 description 1
- 241000606723 Rickettsia akari Species 0.000 description 1
- 241000606720 Rickettsia australis Species 0.000 description 1
- 241000606726 Rickettsia typhi Species 0.000 description 1
- 241000711897 Rinderpest morbillivirus Species 0.000 description 1
- 241000710799 Rubella virus Species 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 241000223598 Scedosporium boydii Species 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- RZUOXAKGNHXZTB-GUBZILKMSA-N Ser-Arg-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O RZUOXAKGNHXZTB-GUBZILKMSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- XSYJDGIDKRNWFX-SRVKXCTJSA-N Ser-Cys-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XSYJDGIDKRNWFX-SRVKXCTJSA-N 0.000 description 1
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 1
- PBUXMVYWOSKHMF-WDSKDSINSA-N Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO PBUXMVYWOSKHMF-WDSKDSINSA-N 0.000 description 1
- RQXDSYQXBCRXBT-GUBZILKMSA-N Ser-Met-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RQXDSYQXBCRXBT-GUBZILKMSA-N 0.000 description 1
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 1
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 1
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 1
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- 108010053551 Sp1 Transcription Factor Proteins 0.000 description 1
- 101710105985 Sphingosine-1-phosphate lyase Proteins 0.000 description 1
- 101710122496 Sphingosine-1-phosphate lyase 1 Proteins 0.000 description 1
- 241000605008 Spirillum Species 0.000 description 1
- 241000589970 Spirochaetales Species 0.000 description 1
- 241001085826 Sporotrichum Species 0.000 description 1
- 241000295644 Staphylococcaceae Species 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 241000191963 Staphylococcus epidermidis Species 0.000 description 1
- 241000193998 Streptococcus pneumoniae Species 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 241000194024 Streptococcus salivarius Species 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- VOGXLRKCWFLJBY-HSHDSVGOSA-N Thr-Arg-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VOGXLRKCWFLJBY-HSHDSVGOSA-N 0.000 description 1
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- QNJZOAHSYPXTAB-VEVYYDQMSA-N Thr-Asn-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O QNJZOAHSYPXTAB-VEVYYDQMSA-N 0.000 description 1
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 1
- NRUPKQSXTJNQGD-XGEHTFHBSA-N Thr-Cys-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NRUPKQSXTJNQGD-XGEHTFHBSA-N 0.000 description 1
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 1
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 1
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- YKRQRPFODDJQTC-CSMHCCOUSA-N Thr-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN YKRQRPFODDJQTC-CSMHCCOUSA-N 0.000 description 1
- OHDXOXIZXSFCDN-RCWTZXSCSA-N Thr-Met-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OHDXOXIZXSFCDN-RCWTZXSCSA-N 0.000 description 1
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- IJKNKFJZOJCKRR-GBALPHGKSA-N Thr-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 IJKNKFJZOJCKRR-GBALPHGKSA-N 0.000 description 1
- BGHVVGPELPHRCI-HZTRNQAASA-N Thr-Trp-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N)O BGHVVGPELPHRCI-HZTRNQAASA-N 0.000 description 1
- WCRFXRIWBFRZBR-GGVZMXCHSA-N Thr-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WCRFXRIWBFRZBR-GGVZMXCHSA-N 0.000 description 1
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 1
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 241000045663 Trematosphaeria grisea Species 0.000 description 1
- 241000589886 Treponema Species 0.000 description 1
- 241000589884 Treponema pallidum Species 0.000 description 1
- LTLBNCDNXQCOLB-UBHSHLNASA-N Trp-Asp-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 LTLBNCDNXQCOLB-UBHSHLNASA-N 0.000 description 1
- CZWIHKFGHICAJX-BPUTZDHNSA-N Trp-Glu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 CZWIHKFGHICAJX-BPUTZDHNSA-N 0.000 description 1
- OWSRIUBVJOQHNY-IHPCNDPISA-N Trp-Lys-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N OWSRIUBVJOQHNY-IHPCNDPISA-N 0.000 description 1
- TUUXFNQXSFNFLX-XIRDDKMYSA-N Trp-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N TUUXFNQXSFNFLX-XIRDDKMYSA-N 0.000 description 1
- UEFHVUQBYNRNQC-SFJXLCSZSA-N Trp-Phe-Thr Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=CC=C1 UEFHVUQBYNRNQC-SFJXLCSZSA-N 0.000 description 1
- ABRICLFKFRFDKS-IHPCNDPISA-N Trp-Ser-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 ABRICLFKFRFDKS-IHPCNDPISA-N 0.000 description 1
- VMXLNDRJXVAJFT-JYBASQMISA-N Trp-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O VMXLNDRJXVAJFT-JYBASQMISA-N 0.000 description 1
- NLKUJNGEGZDXGO-XVKPBYJWSA-N Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLKUJNGEGZDXGO-XVKPBYJWSA-N 0.000 description 1
- MICSYKFECRFCTJ-IHRRRGAJSA-N Tyr-Arg-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O MICSYKFECRFCTJ-IHRRRGAJSA-N 0.000 description 1
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 1
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 1
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 1
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 1
- MOCXXGZHHSPNEJ-AVGNSLFASA-N Tyr-Cys-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O MOCXXGZHHSPNEJ-AVGNSLFASA-N 0.000 description 1
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 1
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 1
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 1
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 1
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 1
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 1
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- VNYDHJARLHNEGA-RYUDHWBXSA-N Tyr-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 1
- SOEGLGLDSUHWTI-STECZYCISA-N Tyr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 SOEGLGLDSUHWTI-STECZYCISA-N 0.000 description 1
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 1
- BQASAMYRHNCKQE-IHRRRGAJSA-N Tyr-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N BQASAMYRHNCKQE-IHRRRGAJSA-N 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 1
- IVXJODPZRWHCCR-JYJNAYRXSA-N Val-Arg-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IVXJODPZRWHCCR-JYJNAYRXSA-N 0.000 description 1
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 1
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 1
- SJLVYVZBFDTRCG-DCAQKATOSA-N Val-Lys-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N SJLVYVZBFDTRCG-DCAQKATOSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- USXYVSTVPHELAF-RCWTZXSCSA-N Val-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N)O USXYVSTVPHELAF-RCWTZXSCSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- KRNYOVHEKOBTEF-YUMQZZPRSA-N Val-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O KRNYOVHEKOBTEF-YUMQZZPRSA-N 0.000 description 1
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 1
- 206010046980 Varicella Diseases 0.000 description 1
- 241000700647 Variola virus Species 0.000 description 1
- 241000607626 Vibrio cholerae Species 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 108010069490 alanyl-glycyl-seryl-glutamic acid Proteins 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 229940005347 alcaligenes faecalis Drugs 0.000 description 1
- ZVDPYSVOZFINEE-BQBZGAKWSA-N alpha-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O ZVDPYSVOZFINEE-BQBZGAKWSA-N 0.000 description 1
- OMOZGSRMZAYUCI-UHFFFAOYSA-N amino cyanate Chemical compound NOC#N OMOZGSRMZAYUCI-UHFFFAOYSA-N 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000036436 anti-hiv Effects 0.000 description 1
- 108010080488 arginyl-arginyl-leucine Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 229940091771 aspergillus fumigatus Drugs 0.000 description 1
- 229940065181 bacillus anthracis Drugs 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 238000010256 biochemical assay Methods 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 230000000711 cancerogenic effect Effects 0.000 description 1
- 229940095731 candida albicans Drugs 0.000 description 1
- VPKDCDLSJZCGKE-UHFFFAOYSA-N carbodiimide group Chemical group N=C=N VPKDCDLSJZCGKE-UHFFFAOYSA-N 0.000 description 1
- 150000001718 carbodiimides Chemical class 0.000 description 1
- 231100000315 carcinogenic Toxicity 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- MYSWGUAQZAJSOK-UHFFFAOYSA-N ciprofloxacin Chemical compound C12=CC(N3CCNCC3)=C(F)C=C2C(=O)C(C(=O)O)=CN1C1CC1 MYSWGUAQZAJSOK-UHFFFAOYSA-N 0.000 description 1
- 231100000670 co-carcinogen Toxicity 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000003936 denaturing gel electrophoresis Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 206010013023 diphtheria Diseases 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 206010014599 encephalitis Diseases 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 210000000416 exudates and transudate Anatomy 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 210000004392 genitalia Anatomy 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- KZNQNBZMBZJQJO-YFKPBYRVSA-N glyclproline Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010043293 glycyl-prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 239000010440 gypsum Substances 0.000 description 1
- 229910052602 gypsum Inorganic materials 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 102000047410 human NFKB1 Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 239000011147 inorganic material Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 238000009830 intercalation Methods 0.000 description 1
- 238000000050 ionisation spectroscopy Methods 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 208000020298 milker nodule Diseases 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 208000008588 molluscum contagiosum Diseases 0.000 description 1
- 230000004899 motility Effects 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- QZGIWPZCWHMVQL-UIYAJPBUSA-N neocarzinostatin chromophore Chemical compound O1[C@H](C)[C@H](O)[C@H](O)[C@@H](NC)[C@H]1O[C@@H]1C/2=C/C#C[C@H]3O[C@@]3([C@@H]3OC(=O)OC3)C#CC\2=C[C@H]1OC(=O)C1=C(O)C=CC2=C(C)C=C(OC)C=C12 QZGIWPZCWHMVQL-UIYAJPBUSA-N 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000011368 organic material Substances 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 238000004816 paper chromatography Methods 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 230000000379 polymerizing effect Effects 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 229940007042 proteus vulgaris Drugs 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 238000003127 radioimmunoassay Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 235000010378 sodium ascorbate Nutrition 0.000 description 1
- 229960005055 sodium ascorbate Drugs 0.000 description 1
- PPASLZSBLFJQEF-RKJRWTFHSA-M sodium ascorbate Substances [Na+].OC[C@@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RKJRWTFHSA-M 0.000 description 1
- YZHUMGUJCQRKBT-UHFFFAOYSA-M sodium chlorate Chemical compound [Na+].[O-]Cl(=O)=O YZHUMGUJCQRKBT-UHFFFAOYSA-M 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- PPASLZSBLFJQEF-RXSVEWSESA-M sodium-L-ascorbate Chemical compound [Na+].OC[C@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RXSVEWSESA-M 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 210000004085 squamous epithelial cell Anatomy 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012956 testing procedure Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000036964 tight binding Effects 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 238000000539 two dimensional gel electrophoresis Methods 0.000 description 1
- 238000010396 two-hybrid screening Methods 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 108010021889 valylvaline Proteins 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 229940118696 vibrio cholerae Drugs 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 229950009268 zinostatin Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
- C12Q1/682—Signal amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6804—Nucleic acid analysis using immunogens
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10T—TECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
- Y10T436/00—Chemistry: analytical and immunological testing
- Y10T436/14—Heterocyclic carbon compound [i.e., O, S, N, Se, Te, as only ring hetero atom]
- Y10T436/142222—Hetero-O [e.g., ascorbic acid, etc.]
- Y10T436/143333—Saccharide [e.g., DNA, etc.]
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Description
ΕΡ Ο 796 344 /ΡΤ
DESCRIÇÃO "Método de detecção de ácidos nucleicos com uma composição de sequência especifica"
Antecedentes do invento 1. Campo do Invento 0 presente invento proporciona um método e composições para utilizar em ligação, detecção e amplificação da detecção de sequências de Ácido Nucleico Alvo especificas numa amostra com fidelidade e precisão, mesmo na presença de ácidos nucleicos intimamente relacionados mas diferentes. A ligação pode envolver o acompanhamento e montagem de moléculas especificas em Conjuntos de Ligação ao Alvo que se ligam especificamente a Regiões de Ligação ao Alvo formadas através da hibridação de Ácidos Nucleicos Sonda com sequências de Ácido Nucleico Alvo. A amplificação pode envolver o acompanhamento e/ou a montagem de moléculas especificas em Conjuntos de Ligação de Reforço que se ligam especificamente a Regiões de Ligação de Reforço formadas através da hibridação de Ácidos Nucleicos de Reforço com Ácidos Nucleicos Sonda, Ácidos Nucleicos Alvo ou outros Ácidos Nucleicos de Reforço. A detecção envolve proporcionar um ou mais marcadores detectáveis, incluindo moléculas radioactivas, emissoras de luz ou fluorescentes, enzimáticas ou outras moléculas detectáveis ou geradoras de sinais, em associação com o Ácido Nucleico Sonda, o Conjunto de Ligação ao Alvo, o Ácido Nucleico de Reforço ou o Conjunto de Ligação de Reforço. 2. Antecedentes e Descrição da Arte Relacionada
Existe um número crescente de casos nos quais é importante ser capaz de detectar ácidos nucleicos contendo uma sequência especifica, daqui em diante designados Ácidos Nucleicos Alvo (TNA), numa amostra. É desejável ser-se capaz de detectar TNA com o menor número de passos de processamento, com os componentes mais simples e até à exclusão de outros ácidos nucleicos semelhantes mas diferentes, daqui em diante designados Ácidos Nucleicos Primos (CNA). É desejável ser-se capaz de detectar TNA específicos até à exclusão de qualquer um e de todos os CNA na amostra de detecção sem a necessidade de amplificação ou de outro processamento pós-detecção. 2 ΕΡ Ο 796 344 /ΡΤ
Existem numerosos métodos que utilizam ácidos nucleicos imobilizados ou marcados como sondas para TNA. No entanto, utilizando métodos conhecidos, é dificil discriminar entre um tna ligado ao Ácido Nucleico Sonda (PNA) em oposição a um CNA ligado ao PNA. Por exemplo, um ou mais erros de emparelhamento de bases entre o PNA e um CNA podem mesmo assim resultar numa hibridação CNA-PNA que é quase indistinguível de uma hibridação TNA-PNA. Assim, apenas a hibridação não é um indicador óptimo de que um PNA tenha hibridado com um único TNA.
Existem muitas situações nas quais seria utilizado um PNA para tentar determinar se um TNA estava presente numa amostra que pudesse conter CNA. A hibridação do PNA com qualquer CNA nesta situação limitaria o valor de diagnóstico que o PNA pudesse ter para a detecção de um TNA, ausente de verificação adicional. Para além disso, é desejável ser-se capaz de detectar e localizar TNA com baixo número de cópias em amostras que possam conter muitas cópias de CNA, sem a necessidade de criar cópias adicionais do TNA. Seria também desejável ser-se capaz de confirmar a presença de CNA, independentes dos TNA, sem a necessidade de separação dos CNA e TNA na amostra.
Para além disso, seria desejável ser-se capaz de amplificar o sinal de uma hibridação mesmo de baixa frequência de um determinado TNA-PNA. Para este fim, seria desejável um método de polimerização de múltiplas cópias de um marcador, daqui em diante referido como um Ácido Nucleico de Reforço (BNA) sobre O TNA-PNA. 0 presente invento proporciona métodos e composições para alcançar os objectivos anteriores desejados. Tal como revelado pela seguinte revisão, as presentes composições e métodos não foram relatados ou sugeridos na arte. Uma revisão geral e abrangente do estado da arte da detecção de ácidos nucleicos é proporcionada em Keller, Η., M.M. Manak, “dna Probes", Stockton Press, 1989.
Foi relatado um método para detecção de erros de emparelhamento de bases através de meios químicos para determinar se um PNA tinha hibridado com um CNA em vez de com 3 ΕΡ Ο 796 344 /ΡΤ um ΤΝΑ. Na Patente U.S. 4 794 075 de Ford et al., é discutido um método para distinguir fragmentos de ADN que contenham erros de emparelhamento de uma base em relação aos seus homólogos perfeitamente emparelhados. As regiões de cadeia simples dentro de um fragmento dúplex são modificadas com carbodiimida, que reage com residuos não emparelhados de guanina (G) e timina (T) no ADN. Moléculas de ADN dúplex lineares não reagem, enquanto que moléculas de ADN com emparelhamentos errados de uma base reagem quantitativamente. Após a reacção com carbodiimida, as moléculas de ADN são fraccionadas em géis de poliacrilamida de elevada percentagem de modo a que os fragmentos modificados e não modificados possam ser distinguidos. Ford et al. aplicaram esta técnica para localizar e purificar diferenças na sequência de ADN responsáveis por variação fenotipica e doença hereditária. Embora este método seja útil para seguir variações em material genético, possui um grande número de passos, requer componentes dispendiosos e não oferece um meio directo para determinar se um PNA hibridou com o TNA em exclusivo relativamente aos CNA na amostra.
Houve algumas tentativas para assegurar que pelo menos uma porção da hibridação entre o PNA e outro ácido nucleico fosse complementar. Um método envolve a monitorização dos produtos de transcrição que são produzidos se o PNA hibridar com um ácido nucleico de forma suficiente para ser transcrito a partir de um local promotor contido na sonda. A Patente U.S. 5 215 899 de Dattagupta divulga o modo como sequências de ácido nucleico especificas são amplificadas através da utilização de uma sonda em "gancho de cabelo" que, após hibridação e ligação a uma sequência alvo, é capaz de ser transcrita. A sonda compreende uma sequência auto-complementar de cadeia simples que, sob condições de hibridação, forma uma estrutura em "gancho de cabelo" possuindo uma região promotora funcional e compreende ainda uma sequência sonda de cadeia simples prolongando-se a partir da extremidade 3' da sequência em "gancho de cabelo". Após hibridação com uma sequência alvo complementar à sequência sonda e ligação da extremidade 3' da sequência alvo hibridada com a extremidade 5' da sonda em "gancho de cabelo", a sequência alvo é tornada passível de transcrição na presença de uma ARN-polimerase adequada e dos ribonucleósido-trifosfatos apropriados (rNTP). A amplificação 4 ΕΡ Ο 796 344 /ΡΤ
é conseguida através da hibridação da sequência do TNA desejado com a sonda, ligando o TNA ao PNA, adicionando a ARN-polimerase e os rNTP aos híbridos separados e permitindo que a transcrição prossiga até se acumular uma quantidade desejada do produto da transcrição do ARN. Esse método envolve, geral e especificamente, a utilização de ADN em "gancho de cabelo" formado com uma extremidade de cadeia simples desemparelhada para hibridar com uma sequência alvo. Quando a sequência alvo se liga, é permitida a produção de produtos da transcrição do ARN. Assim, o método envolve a detecção de produtos de transcrição secundários em vez da utilização de um conjunto de ligação de ácido nucleico para imobilizar e/ou localizar directamente uma sequência alvo. Um CNA pode ligar-se facilmente à sonda e a falta de complementaridade não interferirá necessariamente com a formação de um híbrido CNA-PNA que possa então suportar a produção de produtos de transcrição indesejados.
Um CNA ligado ao PNA pode ser detectado se a falta de complementaridade interferir com a susceptibilidade do par híbrido CNA-PNA para ser cortado por uma endonuclease de restrição. Na Patente U.S. 5 118 605 de Urdea e na Patente U.S. 4 775 619 de Urdea, foram proporcionados novos métodos para ensaio de um ácido nucleico a analisar, que empregam polinucleótidos possuindo sequências oligonucleotídicas substancialmente homólogas a uma sequência de interesse na substância a analisar, onde a presença ou ausência de hibridação a um rigor predeterminado proporciona a libertação de um marcador de um suporte. São empregues várias técnicas para a ligação de um marcador a um suporte, após o que a clivagem de uma cadeia simples ou dupla permite a libertação de um marcador de um suporte e a libertação do marcador pode ser detectada como indicadora da presença de uma determinada sequência polinucleotídica numa amostra. No entanto, esta técnica possui a desvantagem de um par CNA-PNA poder ser cortado pela endonuclease de restrição, mesmo se houver um emparelhamento errado, desde que o emparelhamento errado esteja fora da região de reconhecimento da endonuclease. Isto conduziria ao insucesso do ensaio para identificar um híbrido CNA-PNA. 5 ΕΡ Ο 796 344 /ΡΤ
Outro método utiliza uma sonda de ADN ramificada para detectar ácidos nucleicos. A Patente U.S. 5 124 246 de Urdea et al. divulga multimeros oligonucleotidicos lineares ou ramificados úteis como amplificadores em ensaios bioquímicos que compreendem (1) pelo menos uma primeira unidade oligonucleotídica de cadeia simples (PNA) que é complementar a uma sequência oligonucleotídica de cadeia simples de interesse (TNA), e (2) uma multiplicidade de segundas unidades oligonucleotídicas de cadeia simples que são complementares a um oligonucleótido marcado de cadeia simples. Embora sejam descritas hibridações de ácidos nucleicos em sanduíche amplificadas e imunoensaios utilizando os multimeros, o método tem a limitação de poderem ocorrer hibridações PNA-CNA e resultar na produção de um sinal indesejado.
Para além dos métodos para identificação de TNA, foram divulgados métodos para a amplificação deste ADN. Na Patente U.S. 5 200 314 de Urdea, uma cadeia polinucleotídica a analisar possuindo uma sequência a analisar (TNA) é detectada dentro de uma amostra contendo polinucleótidos através do contacto do polinucleótido a analisar com uma sonda de captura (PNA) sob condições de hibridação, onde a sonda de captura possui um primeiro parceiro de ligação específico para o TNA, e uma segunda sequência de ligação específica para um terceiro parceiro de ligação de fase sólida. O dúplex resultante é então imobilizado através de ligação específica entre os parceiros de ligação, e os polinucleótidos não ligados são separados das espécies ligadas. O polinucleótido a analisar é opcionalmente deslocado da fase sólida, depois amplificado através de PCR. Os iniciadores de PCR possuem, cada um, uma região polinucleotídica capaz de hibridar com uma região do polinucleótido a analisar e pelo menos um dos iniciadores possui ainda um parceiro de ligação adicional capaz de se ligar a um parceiro de ligação de fase sólida. O produto amplificado é então separado da mistura reaccional através da ligação específica entre os parceiros de ligação e o produto amplificado é detectado. Embora seja possível confirmar (através de PCR) que um determinado ácido nucleico hibridou com o PNA, a confirmação é dispendiosa e envolve múltiplos passos. 6 ΕΡ Ο 796 344 /ΡΤ
Quanto aos relatórios que envolvem a interacção de um ácido nucleico de cadeia dupla e uma proteína de ligação a ADN, foi descrito um método através do qual uma sequência de ADN imobilizada que contém locais de ligação a uma única proteína é utilizada para purificar essa proteína. A Patente U.S. 5 122 600 de Kawaguchi et al. divulga uma microesfera com ADN imobilizado compreendendo cadeias de ADN possuindo sequências de bases que se ligam especificamente a uma determinada proteína, e um transportador possuindo um tamanho de partícula de não mais de 50 pm e não menos de 0,01 pm que não absorve qualquer proteína, sendo as cadeias do referido transportador e do referido ADN ligadas uma à outra através de uma ligação química, e um processo para purificação de uma proteína utilizando a referida microesfera. Uma vez que isto é um método de purificação para uma proteína, não divulga um método de detecção de um TNA nem um método através do qual uma proteína se ligue a um ácido nucleico de cadeia dupla para fins de detecção e localização de sequências de TNA específicas.
Em EP-A-0453301 descreve-se um método para detecção de uma sequência alvo polinucleotídica numa amostra, em que as sequências num TNA são detectadas através da hibridação do primeiro e do segundo PNA com o TNA. Cada PNA contém um dúplex pré-formado, ou um dúplex que é formado através de prolongamento da cadeia, capaz de se ligar a uma proteína de ligação específica da sequência nucleotídica.
Em EP-A-0147665 divulga-se também a utilização de proteínas de ligação a ADN dúplex específicas da sequência como meios de detecção num ensaio de hibridação. Novamente, a sonda dúplex é pré-formada.
Em EP-A-0450594 divulga-se a possibilidade de marcação das designadas moléculas reveladoras com compostos específicos da sequência dúplex, p.ex. certos intercaladores. Estes compostos são unidos às moléculas reveladoras antes da hibridação.
Em US-A-4556643 divulga-se a detecção não radioactiva de sequências nucleotídicas específicas numa amostra, envolvendo 7 ΕΡ Ο 796 344 /ΡΤ a hibridação de uma sonda contendo sequências específicas da proteína de ligação ao ADN. WO 93/00446 divulga oligonucleótidos de cadeia simples compreendendo uma porção que, quando tornada de cadeia dupla, se liga à proteína UL9 derivada do vírus de Herpes simples, e outra porção que, quando tornada de cadeia dupla, se liga a compostos intercaladores.
Sumário do Invento O presente invento é definido nas reivindicações anexas. Proporciona métodos através dos quais sequências de Ácido Nucleico Alvo (TNA) específicas são detectadas através da utilização de Ácidos Nucleicos Sonda (PNA) que, após hibridação com os TNA, são capazes de se ligar a Conjuntos de Ligação ao Alvo (TBA) . Cada TBA liga-se pelo menos a uma região específica do par híbrido PNA-TNA, a Região de Ligação Alvo (TBR). O TBA é constituído por uma ou mais moléculas, das quais uma ou mais se podem ligar a sequências TBR de um modo específico e dependente da sequência ou da conformação. O TBA pode compreender uma ou mais sequências piloto, designadas "PILOTOS" ou "Sequências de Assimetria", que se montam e restringem os componentes de ligação aos nucleótidos do TBA a geometrias específicas. Os PILOTOS actuam montando unidades de reconhecimento de ácido nucleico específicas ou outros pilotos aos quais as unidades de reconhecimento de ácidos nucleicos específicas se unem nos TBA de um modo predeterminado. O TBA pode também conter uma ou mais moléculas que ancoram ou localizam o TBA.
Os PNA de acordo com o presente invento são definidos na reivindicação 1. As utilizações destes ácidos nucleicos são definidas noutras reivindicações.
Os PNA, para além das sequências específicas de TNA, contêm também uma ou mais sequências, 1/2 BBR, capazes de hibridar com 1/2 BBR complementares em Ácidos Nucleicos de Reforço (BNA). Através da hibridação dos BNA adicionados aos 1/2 BBR iniciais presentes nos PNA, os prolongamentos dos PNA são feitos na forma de híbridos PNA-BNA e depois BNA-BNA. Estes prolongamentos contêm uma ou mais Regiões de Ligação de 8 ΕΡ Ο 796 344 /ΡΤ
Reforço (BBR) . Cada BBR é capaz de se ligar a um Conjunto de Ligação de Reforço (BBA). 0 BBA é constituído por moléculas, uma ou mais das quais pode ligar-se a uma BBR de um modo específico e dependente da sequência ou da conformação. O BBA pode compreender uma ou mais sequências piloto, designadas "PILOTOS" ou "Sequências de Assimetria", que montam e restringem os componentes de ligação dos nucleótidos do TBA a geometrias específicas. Os PILOTOS actuam montando unidades de reconhecimento de ácidos nucleicos específicas ou outros pilotos aos quais unidades de reconhecimento de ácidos nucleicos específicas se unem nos BBA de um modo predeterminado. 0 BBA pode conter moléculas que ancoram ou localizam o BBA ou que permitem a detecção dos BBA ligados e deste modo dos complexos TBA-TNA-PNA aos quais elas, por sua vez, se ligam. São divulgados métodos e composições para utilização dos 1/2 BBR, BNA, BBR, BBA e PILOTOS BBA, incluindo a sua utilização como componentes de estojos de testes de diagnóstico e forenses. São divulgados métodos e composições para os procedimentos de teste e a produção de um estojo de teste contendo PNA, TBA, TBR, BNA, BBR e BBA para a detecção, localização e diferenciação de sequências de ácido nucleico específicas, incluindo sequências de ácido nucleico que se verificam em células humanas, no Vírus da Imunodeficiência Humana (HIV), no Vírus do Papiloma Humano (HPV) e noutros sistemas contendo ácidos nucleicos incluindo vírus e bactérias.
Assim, é um objectivo deste invento proporcionar métodos e composições para utilizar na ligação, detecção e amplificação da detecção de sequências de Ácido Nucleico Alvo numa amostra com fidelidade e precisão, mesmo na presença de sequências de ácido nucleico intimamente relacionadas mas diferentes.
Assim, é um objectivo deste invento proporcionar métodos e composições para a criação de Conjuntos de Ligação ao Alvo que se ligam especificamente a Regiões de Ligação Alvo formadas através da hibridação de Ácidos Nucleicos Sonda com sequências do Ácido Nucleico Alvo. 9 ΕΡ Ο 796 344 /ΡΤ
Outro objectivo deste invento é o de proporcionar um método e composições para a criação de Conjuntos de Ligação de Reforço que se liguem especificamente a Regiões de Ligação de Reforço formadas através da hibridação de sequências de Ácido Nucleico de Reforço com Ácidos Nucleicos Sonda, Ácidos Nucleicos de Reforço e Ácidos Nucleico em "gancho de cabelo".
Outro objectivo deste invento é o de proporcionar um método e composições para utilizar na amplificação da detecção de conjuntos de Ligação ao Alvo ligados a Regiões de Ligação Alvo utilizando Conjuntos de Ligação de Reforço e Ácidos Nucleicos de Reforço.
Outro objectivo deste invento é o de proporcionar um método e composições que permitam a utilização de um ou mais marcadores detectáveis, incluindo mas limitado a marcadores radioactivos, emissores de luz, fluorescentes, enzimáticos ou outras moléculas geradores de sinal. Estes marcadores são utilizados em associação com Ácidos Nucleicos Sonda, Conjuntos de Ligação ao Alvo, Conjuntos de Ligação de Reforço, Ácidos Nucleicos de Reforço ou Ácidos Nucleicos em "gancho de cabelo".
Breve Descrição dos Desenhos
As seguintes ilustrações estão contidas na Figura 1: a Figura 1-1 é um PNA contendo um 1/2 TBR, que é uma sequência de cadeia simples que é complementar a um TNA e a uma sequência de 1/2 bbr. a Figura 1-Ila é um TNA ao qual são adicionados os componentes da Figura 1-1 e, sob condições de hibridação, se liga ao PNA para formar os componentes da Figura 1-IIIa, um hibrido PNA-TNA contendo pelo menos uma TBR. A Figura 1-IVa é um BNA que é adicionado aos componentes da Figura 1-llla e, sob condições de hibridação, se liga a 1/2 BBR da Figura 1-IIIa para formar um hibrido PNA-BNA contendo uma BBR mostrada na Figura 1-Va. A Figura 1-IIb é um BNA que é adicionado aos componentes da Figura 1-1, e que, sob condições de hibridação, se liga ao PNA para formar os componentes da Figura 1-IIIb, um hibrido PNA-TNA contendo uma BBR. A Figura 1-IVb é um TNA ao qual se adicionam os componentes da Figura 1-Illb e que, sob condições 10 ΕΡ Ο 796 344 /ΡΤ de hibridação, se liga a 1/2 TBR da Figura l-lllb para formar um híbrido PNA-BNA contendo uma TBR mostrada na Figura 1-Vb. A Figura 1-IIc é um HNA que é adicionado aos componentes da Figura 1-1, e que, sob condições de hibridação, se liga ao pna para formar os componentes da Figura 1-IIIc, um híbrido PNA-HNA contendo uma BBR. A Figura 1-IVc é um TNA que é adicionado aos componentes da Figura 1-IIIc e que, sob condições de hibridação, se liga a 1/2 TBR da Figura 1-iiic para formar um híbrido PNA-BNA contendo uma BBR mostrada na Figura 1-Vb.
Os híbridos que formam as TBR e BBR são úteis no presente invento. Os PNA e BNA, tal como indicado na Figura 1, podem não conter um suporte e/ou indicador ligado ou conter um suporte ligado ou outro meio de localização, incluindo, mas não se limitando a, ligação a esferas, polímeros e superfícies, e/ou indicadores (OSA). A Figura 2a é um diagrama de estratégias para polimerização de BNA sobre PNA e protecção das extremidades por HNA. A Figura 2b é um diagrama de estratégias adicionais para amplificação de sinais PNA-TNA através da polimerização de BNA e protecção das extremidades por HNA. A Figura 3 é um diagrama mostrando a utilização de BNA contendo múltiplas 1/2 BBR por BNA. A Figura 4a é um diagrama mostrando a ligação de TBA e BBA a TBR e BBR, e a capacidade do TBA para discriminar entre TNA e CNA. De acordo com esta concretização, se o TBA for imobilizado, numa esfera, superfície de uma placa de microtítulo ou qualquer outra superfície, apenas complexos tais como o complexo X seriam mantidos e detectados, enquanto que complexos tais como os complexos XI não. A Figura 4b é um diagrama que exemplifica acontecimentos semelhantes aos mostrados na Figura 4a mas numa ordem de ocorrência ligeiramente diferente. 11 ΕΡ Ο 796 344 /ΡΤ A Figura 5 é um diagrama exemplificando PNA contendo entre uma 1/2 TBR e nenhuma 1/2 BBR até PNA contendo até cinco 1/2 TBR e uma 1/2 BBR. Os membros (a) e (b) de cada número (I, II, III, IV, V) formam um conjunto que, após hibridação com um TNA, proporciona TBR com (membros (a) ) ou sem (membros (b) ) uma 1/2 BBR disponível para amplificação através de hibridação com BNA possuindo 1/2 BBR complementares. A Figura 6a é um diagrama exemplificando um determinado TNA possuindo duas 1/2 TBR que, após ligação a um PNA apropriado, forma duas TBR infimamente associadas capazes de se ligar a dois TBA. É também proporcionada uma 1/2 BBR para amplificação. A Figura 6b é um diagrama mostrando os mesmos acontecimentos que a Figura 6a excepto que aqui é utilizado um duplo TBA de modo a que a discriminação entre TBR simples que ocorrem em amostras celulares normais possa ser discriminada de TBR duplos, anormais. A Figura 6c é um diagrama mostrando o mesmo cenário que a Figura 6a excepto que aqui são identificadas cinco TBR no TNA. Cada TBR pode ser ligada a um TBA igual ou diferente e cada TBA pode ser diferenciadamente marcado, permitindo a confirmação de todos os cinco locais presentes no TNA. A Figura 6d é um diagrama dos mesmos acontecimentos que na Figura 6c excepto que aqui é mostrado um duplo TBA, prolongando o que é mostrado na Figura 6b à utilização do duplo TBA. Um exemplo do TNA mostrado no item II das Figuras 6a, 6b, 6c e 6d é o ADN ou ARN de cadeia simples de HIV. A Figura 7 mostra a LTR de HIV como um TNA e dois PNA, e uma estratégia para a detecção do TNA utilizando os PNA. A Figura 8 é um esquema de uma concretização do presente invento em que é utilizada um conjunto de ligação ao alvo para ligar um hibrido TNA-PNA, e são utilizados conjuntos de ligação de reforço para ligar BNA polimerizados. A Figura 9 é um esquema de um TBA modular no qual as sequências do conjunto, as sequências ligantes e as sequências 12 ΕΡ Ο 796 344 /ΡΤ de assimetria são utilizadas para acompanhar unidades de reconhecimento do ácido nucleico desejadas juntas para formar um TBA. A Figura 10 mostra TBA modulares úteis na detecção de sequências especificas de HIV. A Figura 11 mostra TBA modulares úteis na detecção de sequências de virus do papiloma humano. Cada unidade de E2 é de facto um dimero da porção de ligação ao ADN de E2. A Figura 12a é um esquema do fraccionamento do TNA e da mudança de mobilidade devida à ligação de um TBA. A Figura 12b é um esquema do fraccionamento do TNA e do aumento na mudança de mobilidade devida à ligação de BBA para além de TBA. A Figura 13 mostra uma estratégia de detecção para sequências de deleção; um exemplo da utilização desta estratégia é para um ensaio de integração de virus do papiloma humano. A Figura 14 mostra a montagem de TBA de ordem superior através da utilização de unidades de reconhecimento de ácidos nucleicos, sequências ligantes, de montagem e de assimetria de modo a serem formados vários Conjuntos de Ligação ao Alvo específicos para locais de ligação na LTR de HIV. A Figura 15 mostra a montagem de TBA de ordem superior através da utilização de unidades de reconhecimento de ADN, sequências ligantes, de montagem e de assimetria de modo a serem formados vários Conjuntos de Ligação ao Alvo específicos para locais de ligação no genoma de HPV. A Figura 16 mostra a discriminação alcançada através da utilização de um TBA complexo e a capacidade de moléculas de ligação alvo competidoras endógenas para eliminar a ligação do TBA a uma molécula de ácido nucleico prima mas não do TNA que contém a orientação apropriada de mais de um local reconhecido pelo TBA. 13 ΕΡ Ο 796 344 /ΡΤ A Figura 17 mostra a capacidade de um TBA para ser especificamente direccionado para se ligar a locais de emparelhamento errado da sequência e a ligar-se de preferência aqueles locais em locais primos que não contenham todos os emparelhamentos errados alvo.
Breve Descrição das Sequências SEQ ID NO:l corresponde à Figura 5-la-I e mostra o local de ligação a NF-kB de MHC de classe I. SEQ ID NO:2 corresponde à Figura 5 (Ia) e mostra o local de ligação a NF-kB da microglobina B2. SEQ ID NO:3 corresponde à Figura 5 (Ia) e mostra o local de ligação a NF-kB da imunoglobulina capa. SEQ ID NO:4 corresponde à Figura 5 (Ia) e mostra um dos locais de ligação a NF-kB de HIV. SEQ ID NO:5 corresponde à Figura 5 (Ia) e mostra um dos locais de ligação a NF-kB de HIV. SEQ ID NO:6 corresponde à Figura 5 (la) e mostra o local de ligação a NF-kB de c-myc. SEQ ID NO:7 corresponde à Figura 5 (lia) e mostra um local de ligação duplo a NF-kB de HIV. SEQ ID NO:8 corresponde à Figura 5 (lia) e mostra um local de ligação duplo a NF-kB de HIV. SEQ ID NO:9-16 correspondem à Figura 5 (lia) e mostram um local de ligação duplo com um local sendo um local de ligação a NF-kB de HIV e o outro local sendo um local de ligação a SPl de HIV. SEQ ID NO :17-18 correspondem à Figura 5 (Ha) e mostram um local de ligação duplo a SPl de HIV. 14 ΕΡ Ο 796 344 /ΡΤ SEQ ID ΝΟ:19-31 correspondem à Figura 5 (iila) e mostram um local de ligação duplo a NF-kB de HIV e um local de ligação a SP1 de HIV. SEQ ID NO:32-33 correspondem à Figura 5 (IVa) e mostram um local de ligação quádruplo onde dois locais são locais de ligação a NF-kB de Hiv e dois locais são locais de ligação a SP1 de HIV. SEQ ID NO:34 corresponde à Figura 5 (Via) e mostra um local de ligação quíntuplo onde dois locais são locais de ligação a NF-kB de HIV e três locais são locais de ligação a SP1 de HIV. SEQ ID NO:35 é um exemplo de uma 1/2 BBR, neste caso os elementos 0L1, 0L2 e 0L3 do operador esquerdo do bacteriófago lambda, incluindo sequências intervenientes. SEQ ID NO:36 é um exemplo de uma 1/2 BBR, neste caso os elementos 0R3, 0R2 e 0R1 do operador direito do bacteriófago lambda, incluindo sequências intervenientes. SEQ ID NO:37 é a LTR de HIV. SEQ ID NO:38 é um PNA complementar ao PNA da LTR de HIV. SEQ ID NO:39 é um PNA complementar a um PNA da LTR de HIV diferente do de SEQ ID NO:38. SEQ ID NO:40 é um PNA complementar a parte da LTR de HIV e contém também 1/2 BBR e uma sequência solta para polimerização dos BNA no PNA.
SEQ ID NO:41 é um BNA complementar à 1/2 BBR de SEQ ID NO:40. SEQ ID NO:42 é um BNA que polimerizará sobre o BNA de SEQ ID NO:41 e que, com as SEQ ID NO:40 e 41, cria um local de reconhecimento PstI. SEQ ID NO:43 é um BNA que é complementar ao BNA de SEQ ID NO:42 e que completa um local de reconhecimento Bamhl. 15 ΕΡ Ο 796 344 /ΡΤ SEQ ID ΝΟ:44 é um ΗΝΑ que possui um local de reconhecimento BamRl que hibridará com o local de reconhecimento BamRl criado por SEQ ID NO:42 e 43 no polímero em crescimento. SEQ ID NO:45 é um segundo PNA que, tal como SEQ ID NO:40, é complementar a parte da LTR de HIV, mas não à mesma sequência que SEQ ID NO:40. SEQ ID NO:45 codifica também uma 1/2 bbr e uma ponta solta que permitirá a polimerização de BNA começando com um local de reconhecimento Sphl. SEQ ID NO:46-62 são PNA específicos do vírus do papiloma humano (HPV) que, após hibridação com sequências de HPV, formam TBR que se ligam a proteínas de ligação ao ADN de HPV. SEQ ID NO:63-71 são unidades de reconhecimento de ADN de NF-kB para incorporação em TBA. SEQ ID NO:72 é uma sequência de localização nuclear. SEQ ID NO:73 é uma unidade de reconhecimento da sequência de SPl. SEQ ID NO:74 é uma unidade de reconhecimento de proteínas de ligação a TATA. SEQ ID NO:75-84 são unidades de reconhecimento do ADN de E2 do vírus de papiloma. SEQ ID NO:85-92 são sequências de assimetria. SEQ ID NO:93 é uma unidade de reconhecimento de proteínas de ligação a TATA de Arabidopsis. SEQ ID NO:94 é uma unidade de reconhecimento de proteínas de ligação ao ADN de HPV-16-E2-1. SEQ ID NO:95 é uma unidade de reconhecimento de proteínas de ligação ao ADN de HPV-16-E2-2. SEQ ID NO:96 é uma unidade de reconhecimento de proteínas de ligação ao ADN de HPV-18-E2. 16 ΕΡ Ο 796 344 /ΡΤ SEQ ID ΝΟ:97 é uma unidade de reconhecimento de proteínas de ligação ao ADN de HPV-33-E2. SEQ ID NO:98 é uma unidade de reconhecimento de proteínas de ligação ao ADN de E2 do vírus do papiloma bovino. SEQ ID NO :99-102 são sequências ligantes exemplificativas. SEQ ID NO:103 é uma sequência sinal de localização nuclear (NLS) exemplificativa. SEQ ID NO :104-108 são sequências de acompanhamento exemplificativas. SEQ ID NO:109-116 são sequências de TBA montadas exemplificativas. SEQ ID NO:117 é um local de ligação a NF-kB de consenso. SEQ ID NO: 118 é uma sequência de aminoácidos de Tat de HIV.
Abreviaturas ácido nucleico de cadeia simples 111111111111111 ^ ^ ^ ^ ^ ^ ^ ácido nucleico de cadeia dupla
Ifí 1111ΙΤΤΠ11ΓΓ lll M 11111111111
Região de ligação no ácido nucleico
sem suporte nem indicadores, ou com suporte sólido ou outros meios de localização, incluindo, mas não se limitando a esferas, polímeros e superfícies ou indicadores = OSA BBA conjunto de ligação de reforço (Booster Bíndíng
Assembly) bbr região de ligação de reforço (Booster Binding
Region) 17 ΕΡ Ο 796 344 /ΡΤ ΒΝΑ ácido nucleico de reforço (Booster Nucleic Acid) CNA ácido nucleico primo (Cousin Nucleic Acid)
1/2 BBR região de cadeia simples que, quando hibridada com a sequência complementar de um HNA ou de um BNA, se pode ligar a um BBA
1/2 TBR região de cadeia simples do PNA que, quando hibridada com a sequência complementar de um TNA, se pode ligar a um TBA OSA suporte ou ligação opcional, circulo com caixa (Optional Support ou Attachment) PNA ácido nucleico sonda (Probe Nucleic Acid) TBA conjunto de ligação ao alvo (Target Binding
Assembly) TBR região de ligação alvo (Target Binding Region) TNA ácido nucleico alvo (Target Nucleic Acid) HNA Ácido Nucleico em "gancho de cabelo" (Hairpin
Nucleic Acid)
Definições
Deve também entender-se a partir da descrição que se segue que quando se mencionam termos como conjuntos de ligação ao alvo (TBA), conjuntos de ligação de reforço (BBA), proteínas de ligação ao ADN, proteínas de ligação ao ácido nucleico ou proteínas de ligação ao ARN, o que se pretende são composições constituídas por moléculas que se ligam a sequências de ácido nucleico alvo (TNA) de ADN ou ARN independentemente da especificidade da categoria das moléculas de ligação a partir das quais são derivadas. Assim, por exemplo, um TBA adaptado para se ligar a sequências do vírus da imunodeficiência humana pode ser muito semelhante a um factor de transcrição NF-kB que tipicamente se liga a sequências de ADN. No entanto, tal como aqui se utiliza, entender-se-á que o TBA pode ser adaptado para uma utilização óptima para se ligar a sequências de ARN de uma determinada composição ou conformação de sequência. 18 ΕΡ Ο 796 344 /ΡΤ A fidelidade do método de detecção aqui divulgado depende em grande medida da ligação selectiva dos TBA e BBA a motivos de ácido nucleico particulares. Deve entender-se ao longo desta divulgação que a base da discriminação de TBA e BBA dos TNA de sequências aparentadas (ácidos nucleicos primos ou CNA) pode ser a formação de segmentos hibridos precisos de ácido nucleico sonda (PNA)-ácido nucleico alvo (TNA) (hibridos PNA-TNA) . No entanto, a base da discriminação pode também ser a formação de uma determinada conformação e pode não requerer a completa ausência de emparelhamento errado de bases no híbrido TNA-PNA. Assim, a base da operação de TBA ou BBA deve ser sempre entendida como dependendo da discriminação de qualquer propriedade única do híbrido TNA-PNA em oposição a quaisquer propriedades mostradas por quaisquer híbridos PNA-CNA que se possam formar numa amostra de teste colocada em contacto com um dado PNA.
Descrição Detalhada do Invento 0 presente invento é definido pelas reivindicações anexas. Proporciona um método para identificar especificamente um ácido nucleico alvo (TNA) numa amostra através da utilização de conjuntos de ligação ao alvo (TBA) que incorporam proteínas de ligação a ácido nucleico específicas. Através da utilização de ácidos nucleicos sonda (PNA) específicos para uma dada sequência de TNA e um TBA que seja específico para a região de ligação alvo (TBR) dúplex formada após a formação de sequências híbridas TNA-PNA, forma-se um complexo TBA-TNA-PNA estável. Proporcionando adicionalmente sequências amplificáveis específicas no PNA, para além de sequências que contribuam especificamente para a formação da TBR reconhecida pelo TBA, a ligação do PNA ao TNA é detectada e a detecção amplificada. Para este fim, pode ser utilizado qualquer um de vários sistemas de amplificação de ácidos nucleicos, incluindo reacção em cadeia da polimerase ou a utilização de ADN ramificado, cada ramificação do qual contém um marcador detectável. Em particular, é aqui descrito um novo método de amplificação onde a porção amplificável do PNA contém sequências sobre as quais podem ser polimerizados ácidos nucleicos de reforço (BNA). Após a formação de cada híbrido BNA-PNA, forma-se uma região de ligação de reforço (BBR) à qual um conjunto de ligação de reforço (BBA) se liga 19 ΕΡ Ο 796 344 /ΡΤ especificamente. Se marcados de forma detectável, os BBA ou BNA proporcionam uma amplificação essencialmente ilimitada do acontecimento de ligação TNA-PNA original.
De acordo com este invento, entender-se-á que o TNA inclui sequências de ácido nucleico especificas. 0 TBA entender-se-á ser qualquer conjunto molecular que possa de forma especifica e apertada ligar-se a um hibrido TNA-PNA formado. 0 tba conterá uma ou mais moléculas cujas sequências são suficientes para se ligarem à TBR. Os dominios de ligação ao ácido nucleico que são conhecidos podem ser utilizados directamente como componentes do TBA ou modificados de acordo com os ensinamentos aqui proporcionados. As moléculas mais facilmente disponíveis com tais sequências são os domínios de ligação ao ADN das proteínas de ligação ao ADN. Especificamente, conhecem-se muitas proteínas de ligação ao ADN ou ao ARN que podem ser utilizadas directamente como a proteína não modificada conhecida, ou o TBA pode ser uma proteína de ligação ao ácido nucleico modificada de acordo com os ensinamentos específicos aqui proporcionados. No último caso, as modificações específicas que são desejáveis incluiriam a optimização de afinidades de ligação, remoção de actividades indesejadas (tais como actividade de nuclease e reorganização do TBA na presença de outras moléculas com uma afinidade para componentes do TBA), optimização da selectividade de uma sequência alvo sobre sequências intimamente aparentadas, e optimização da estabilidade.
Exemplos de proteínas de ligação ao ADN que podiam ser utilizadas de acordo com este invento são as porções de ligação ao ADN do factor de transcrição NF-kB (p50 e p65), NF-IL6, NF-AT, rei, TBP, a proteína E2 do vírus do papiloma humano, spl, os repressores cro e Cl do bacteriófago lambda e proteínas semelhantes bem como proteínas conhecidas cuja porção de ligação ao ADN foi isolada, clonada, sequenciada e caracterizada. Adicionalmente, é incluída qualquer outra proteína de ligação ao ADN ou porção de uma proteína que seja necessária e suficiente para se ligar a um híbrido de TBR ou a uma BBR. Isto inclui proteínas ou porções de proteínas de tipo selvagem com actividade de ligação ao ADN alterada bem como proteínas criadas com especificidade de ligação ao ADN alterada, tal como a troca de uma hélice de reconhecimento da 20 ΕΡ Ο 796 344 /ΡΤ ligação ao ADN de uma proteína para outra. Adicionalmente, proteínas que exibem ligação ao ácido nucleico e outras funções no ácido nucleico, tais como endonucleases de restrição, podem ser utilizadas como função de ligação ao ácido nucleico. Proteínas que se ligam a regiões alvo em híbridos ADN-ARN bem como híbridos ARN-ARN estão incluídas (ver, por exemplo, Shi, 1995; DeStefano, 1993, Zhu, 1995; Gonzales, 1994; Salazar, 1993; Jaishree, 1993; Wang, 1992; Roberts, 1992; Kainz, 1992; Salazar, 1993 (b)) . Os conjuntos de ligação podem ser construídos com a utilização de uma molécula que acompanha porções do conjunto de ligação de modo a possam ser alcançadas combinações e geometrias de componentes específicas. Esta molécula é aqui designada como um PILOTO. Os pilotos podem ser constituídos por proteínas ou qualquer combinação de materiais orgânicos e inorgânicos que alcancem a selecção combinatória e/ou induzam geometrias específicas entre membros do TBA ou BBA. Um acompanhante é uma estrutura estável sobre a qual pode ser construído um TBA ou BBA de modo a que seja proporcionada a conformação correcta do TBA ou BBA enquanto que ao mesmo tempo elimina propriedades indesejáveis de uma proteína de ligação a ácido nucleico de ocorrência natural. Como exemplo específico desta concretização, é proporcionada uma versão modificada do factor de transcrição pleiotrópico, NF-kB, utilizando uma proteína cro do bacteriófago lambda modificada como acompanhante. Cada dímero de ligação de NF-kB retém a afinidade de ligação picomolar para o local de ligação de NF-kB enquanto que ao mesmo tempo o conjunto de ligação apresenta várias características vantajosas de produção, estabilidade e especificidade.
Tendo em vista o antecedente, os vários aspectos e concretizações deste invento são descritos abaixo em detalhe. 1. Os Ácidos Nucleicos Sonda (PNA) e sua preparação. Os PNA do presente invento compreendem pelo menos três partes principais unidas umas às outras. Com referência à Figura 1(I) dos desenhos, a primeira parte do PNA é uma ou mais sequências de bases, designada "1/2 TBR". Com referência à Figura 1(1 e lia) dos desenhos, a 1/2 TBR no PNA é complementar a uma sequência de interesse numa amostra, contendo o TNA uma 1/2 TBR. Com referência à Figura l(llla) dos desenhos, o TNA, 21 ΕΡ Ο 796 344 /ΡΤ quando adicionado ao ΡΝΑ sob condições de hibridação, forma um híbrido PNA-TNA contendo uma TBR. Com referência à Figura 1(1) dos desenhos, a segunda parte do PNA é uma sequência de bases, designada "1/2 bbr". Com referência à Figura 1(1, Ilb, lie e IVa) dos desenhos, a 1/2 BBR no PNA é complementar a uma 1/2 BBR contida num BNA ou num HNA. Com referência à Figura l(lllb, Illc e Va) dos desenhos, o BNA ou HNA, quando adicionado ao PNA sob condições de hibridação, forma um híbrido pna-bna ou um híbrido PNA-HNA, respectivamente, contendo uma BBR. Com referência à Figura 1(1) dos desenhos, a terceira parte do PNA é o OSA, designado por um círculo dentro de uma caixa. 0 OSA é a ausência de suporte e/ou de um indicador, ou um suporte sólido ou outro meio de localização, incluindo, mas não se limitando a, ligação a esferas, polímeros e superfícies e/ou indicadores que é/são ligados covalentemente ou não covalentemente, mas especificamente, associados ao PNA. 0 OSA pode ser um átomo ou molécula que ajuda na separação e/ou localização tal como um grupo de ligação a um suporte sólido ou marcador que pode ser detectado através de vários meios físicos incluindo, mas não se limitando a, adsorção ou imagiologia de partículas emitidas ou luz. Os métodos para unir indicadores a oligonucleótidos ou para imobilizar oligonucleótidos a suportes sólidos são bem conhecidos na arte (ver Keller e Manak, supra). 0 PNA do presente invento pode ser preparado através de qualquer método adequado. Tais métodos, em geral, incluirão síntese de oligonucleótidos e clonagem num vector replicável. Os métodos para a síntese de ácidos nucleicos são bem conhecidos na arte. Quando clonados ou sintetizados, a purificação da cadeia e a separação podem ser necessárias para utilizar o produto como um PNA puro. Os métodos de preparação de sondas de ARN são bem conhecidos (ver por exemplo Blais 1993, Blais 1994, que utiliza transcrição in vitro a partir de uma reacção PCR incorporando um promotor da ARN-polimerase de T7) .
Será entendido pelos peritos na arte que o comprimento e a sequência específica do PNA dependem do comprimento e da sequência a detectar num TNA, e das constrições para se alcançar uma ligação apertada e específica do TBA particular a utilizar (ver discussão sobre TBA abaixo). Em geral, PNA com 22 ΕΡ Ο 796 344 /ΡΤ comprimentos de sequência entre cerca de 10 e cerca de 300 nucleótidos de comprimento são adequados, sendo os de cerca de 5-100 nucleótidos de comprimento desejáveis para muitas das concretizações especificamente exemplificadas aqui.
Deve entender-se também que o PNA pode ser construído de modo a conter mais de uma 1/2 TBR e a produzir mais de uma TBR para um ou mais TBA, iguais ou diferentes, bem como TBR complexas reconhecidas por novos tba dúplex e multíplice (ver descrição abaixo em relação a estes novos TBA) após hibridação dos PNA e TNA. A Figura 5 ilustra PNA específicos que contêm uma ou mais 1/2 TBR. As sequências específicas que correspondem às sequências de 1/2 TBR ilustradas na Figura 5 (la, lia, Illa, IVa e Va) são SEQ ID NO:l-34 (ver Descrição das Sequências acima).
Tal como mostrado nas Figuras 2a e 2b, o PNA, contendo uma 1/2 TBR, pode ser hibridado com um ou mais BNA (ver descrição abaixo) e a cadeia de bna polimerizada até qualquer potencial comprimento desejado para amplificação do acontecimento de hibridação TNA-PNA. De preferência, estarão presentes no PNA entre 1 e 10 1/2 BBR.
Tal como mostrado nas Figuras 6a e 6b, o PNA pode conter várias 1/2 TBR, iguais ou diferentes, que podem hibridar com várias 1/2 TBR num TNA. De cada vez que uma 1/2 TBR no PNA coincide com uma 1/2 TBR num TNA, forma-se uma Região de Ligação Alvo, TBR, que se pode ligar a uma TBA. Para além disso, não é essencial que todas as TBR estejam num único PNA contíguo. Assim, numa concretização do presente invento, são utilizados dois PNA diferentes para detectar sequências num determinado TNA. Como ilustração deste aspecto do presente invento, a Figura 7 mostra uma representação da repetição terminal longa (LTR) do vírus da imunodeficiência humana (HIV) . Tal como se sabe na arte, a LTR de HIV compreende dois locais de ligação a NF-kB e três locais de ligação a SPl, muito próximos, em que NF-kB e SPl são proteínas de ligação ao ADN conhecidas. A Figura 7 proporciona dois PNA, PNA1 (SEQ ID NO:38) e PNA2 (SEQ ID NO:39), cada um dos quais é complementar à cadeia oposta mostrada como um TNA (SEQ ID NO: 37), que mostra os dois locais de ligação a NF-kB e os três locais de ligação a SPl da LTR de HIV. De acordo com este aspecto do 23 ΕΡ Ο 796 344 /ΡΤ presente invento, PNAl híbrida especificamente com a secção do TNA mostrada na Figura 7 com as bases sublinhadas com um símbolo enquanto que PNA2 híbrida especificamente com a secção do TNA mostrada na Figura 7 com as bases sublinhadas com um símbolo Cada um de PNAl e PNA2 pode também conter sequências (indicadas pelos símbolos "#" ou "*") que hibridarão com sequências 1/2 BBR de um BNA (ver abaixo). Adicionalmente, cada um de PNAl e PNA2 pode ser marcado de modo diferencial com um OSA, tal como um fluoróforo como um marcador de fluoresceína ou rodamina, que permitirá a confirmação de que ambas as sondas se ligaram ao TNA. Se for detectada apenas um ou nenhum marcador, conclui-se que o TNA não está presente na amostra a testar.
Noutro aspecto da concretização mostrada na Figura 7, é mostrado um método para alterar a especificidade do presente método de ensaio. Através da alteração do comprimento do intervalo entre PNAl e PNA2, de modo a que seja alterada a região de TNA que permanece sem hibridar, um executante deste invento é capaz de alterar a discriminação do ensaio.
Para exemplificar mais claramente este aspecto do presente invento, é necessário enfatizar que a TBR pode ter uma estrutura helicoidal. Assim, enquanto PNAl cria TBR numa "face" da hélice, PNA2 cria uma TBR na mesma face ou numa face diferente da hélice, dependendo da distância entre o meio de cada TBR (sublinhado na Figura 7). Se o meio de cada local de ligação for um produto inteiro de 10,5 bases de distância, as TBR estarão no mesmo lado da hélice, enquanto que produtos não inteiros de 10,5 bases de distância colocarão as TBR em lados opostos da hélice. Deste modo, qualquer cooperatividade na ligação pelo TBA reconhecendo a TBR de PNAl e pelo TBA reconhecendo a TBR de PNA2 pode ser manipulada (ver Hochschild, A., M. Ptashne, Cell 44: 681-687, 1986, mostrando este efeito para a ligação do repressor do bacteriófago lambda a dois locais diferentes do operador situados a diferentes distâncias um do outro numa hélice de ADN). Tal como descrito por Perkins et al. (EMBO J. 12: 3551-3558, 1993), é necessária cooperatividade entre os locais de NF-kB e SPl para se alcançar a activação da LTR de HIV. No entanto, para os fins do presente invento, pode-se tirar vantagem do motivo do local de ligação duplo NF-kB-triplo SPl na LTR de HIV proporcionando 24 ΕΡ Ο 796 344 /ΡΤ uma nova proteína de ligação única capaz de se ligar a ambos os locais simultaneamente, mas apenas se o espaço entre os locais for geometricamente praticável. Isto é controlado tanto pela estrutura do tba seleccionado como pelo tna utilizado. Assim, na concretização exemplificada na Figura 7, as duas sondas podem ser utilizadas com uma região inter-sondas suficientemente grande de ADN de cadeia simples restante de modo a que, mesmo se os locais de ligação a NF-kB e SPl estiverem em lados opostos da hélice, a região de cadeia simples entre as sondas proporciona uma "charneira" suficientemente flexível de modo a que o ADN se possa dobrar e torcer para acomodar a geometria do TBA. Alternativamente, pode ser desenhado um ensaio mais rigoroso através do estreitamento da distância inter-sondas de modo a que o ADN se possa apenas dobrar, mas não torcer. Finalmente, as sondas podem ser tão pouco espaçadas ou ser utilizado um único PNA, de modo a que o ADN se possa dobrar mas não torcer. Assim, esta figura exemplifica e permite a produção de sistemas de detecção com qualquer grau desejado de discriminação entre os ácidos nucleicos alvo possuindo sequências semelhantes, mas diferentes justaposições destas sequências.
Em termos de um estojo de diagnóstico ou forense para HIV, os peritos na arte compreenderão que os aspectos acima mencionados deste invento permitem a obtenção de componentes do estojo de diagnóstico ou forense à medida para corresponder ao que se sabe a dado momento sobre as estirpes prevalentes de HIV ou de outro patogénio ou condição de doença. Será apreciado pelos peritos na arte que, embora a detecção de infecção de HIV não seja a única utilidade do presente invento, devido à mutabilidade do genoma de HIV, é provavelmente um dos ambientes de teste mais complexos para um tal diagnóstico. No entanto, é precisamente num tal ambiente mutável que a flexibilidade do presente método, ligada à sua capacidade para discriminar entre sequências muito intimamente aparentadas, podem ser melhor apreciadas. Em ambientes menos mutáveis, alguma da sofisticação à qual este método se sujeita não necessita ser utilizada. Assim, num estojo de diagnóstico para infecção de virus do papiloma, todas as caracteristicas de discriminação da interacção TBA-TBR estão disponíveis, juntamente com a capacidade para amplificar o sinal utilizando os BNA e BBA, mas pode ser utilizado um único PNA simples, tal 25 ΕΡ Ο 796 344 /ΡΤ como qualquer um de SEQ ID NO :44-62, que identifique sequências únicas do virus do papiloma, que também se saiba que se ligam a um TBA tal como a proteina E2 do virus do papiloma ou porções de ligação ao ADN truncadas desta (ver Hedge et al., Nature 359: 505-512, 1992; Monini et al., J.
Virol. 65: 2124-2130, 1991).
Na aplicação do presente método à detecção de um determinado TNA para fins de avaliação de se estão presentes certos ácidos nucleicos que estão associados com a progressão de melanoma, hepatoma, cancros da mama, cervical, do pulmão, do cólon, da próstata, pancreático ou dos ovários, o TNA pode ser obtido a partir de materiais de biopsia tomados de órgãos e fluidos suspeitos de conter as células cancerosas. Para a detecção de deficiências genéticas, o TNA pode ser obtido a partir de amostras de pacientes contendo as células afectadas. Para detecção de contaminantes e produtos de fermentação no fabrico de alimentos, produtos químicos ou biotecnológicos ou na bio-resolução de desperdícios, o TNA pode ser obtido a partir de amostras tomadas a vários estádios no processo de fermentação ou tratamento. Para a detecção de patogénios ou contaminantes em alimentos ou fármacos, a amostra de TNA pode ser obtida a partir do alimento ou fármaco, esfregaços de alimentos ou superfícies em contacto com os alimentos, fluidos em contacto com os alimentos, materiais de processamento, fluidos e semelhantes associados ao fabrico ou em contacto com os alimentos, fármacos ou amostras biológicas tomadas daqueles em contacto com os alimentos ou fármacos ou semelhantes. 2. Ácidos Nucleicos de Reforço (BNA), Regiões de Ligação de Reforço (BBR) e sua preparação. Os BNA do presente invento são constituídos por pelo menos uma ou mais 1/2 BBR ligadas a um OSA. As 1/2 BBR podem hibridar com 1/2 BBR complementares contidas no PNA, outros BNA ou num HNA.
Com referência à Figura 1 (I, Ilb e Illb) dos desenhos, o BNA mais simples é constituído por duas partes. Com referência à Figura l(IIb) dos desenhos, a primeira parte do BNA mais simples é uma sequência de bases que é complementar à sequência no PNA que é designada "1/2 BBR". Com referência à Figura l(IIb) dos desenhos, a segunda parte do BNA mais simples é o OSA, designado por um círculo dentro de uma caixa. 26 ΕΡ Ο 796 344 /ΡΤ Ο OSA é ausência de suporte e/ou de indicador, ou um suporte sólido ou outro meio de localização, incluindo, mas não se limitando a, ligação a esferas, polímeros e superfícies e/ou indicadores que são ligados covalentemente ou não covalentemente, mas especificamente, associados ao BNA.
Com referência à Figura 2a (II e III) dos desenhos, o BNA pode conter mais de uma sequência de 1/2 BBR. 0 BNA ilustrado na Figura 3(11) contém uma sequência que é complementar ao PNA ilustrado na Figura 3(1) e duas outras sequências de 1/2 BBR. 0 BNA ilustrado na Figura 3 (III) contém duas sequências de 1/2 BBR que são complementares a duas das sequências de 1/2 BBR no BNA ilustrado na Figura 3(11), mais até "n" 1/2 BBR adicionais para polimerização de mais BNA.
Sob condições de hibridação, o BNA ilustrado na Figura 3(11), quando combinado com o PNA ilustrado na Figura 3(1), cria o híbrido PNA-BNA ilustrado na Figura 3(IVa) contendo uma BBR e uma extensão não hibridada com duas sequências de 1/2 BBR adicionais ou sequências de "reforço". As BBR criadas através da referida hibridação podem ser idênticas, semelhantes ou dissemelhantes na sequência. As BBR criadas através da referida hibridação podem ligar-se a BBA idênticas, semelhantes ou dissemelhantes (ver abaixo). Os BNA podem ter sido preparados de forma análoga aos PNA.
Sob condições de hibridação, o híbrido BNA-BNA ilustrado na Figura 3(IVb), quando combinado com o PNA ilustrado na Figura 3(Vb), cria o híbrido PNA-BNA ilustrado na Figura 3(VI) contendo uma BBR, dois híbridos BNA-BNA adicionais contendo BBR e uma extensão não hibridada com uma sequência de 1/2 BBR adicional, uma sequência de "reforço". As BBR criadas pela referida hibridação podem ser idênticas, semelhantes ou dissemelhantes na sequência. As BBR criadas pela referida hibridação podem-se ligar a BBA idênticas, semelhantes ou dissemelhantes (ver abaixo). Os BNA podem ser preparados de um modo análogo ao da preparação dos PNA. 3. Os Ácidos Nucleicos Alvo (TNA) e sua preparação. 0 primeiro passo na detecção e amplificação de sinais produzidos através da detecção de um determinado TNA de acordo com o presente método é a hibridação de tal alvo com o PNA numa 27 ΕΡ Ο 796 344 /ΡΤ mistura adequada. Tal hibridação é alcançada sob condições adequadas bem conhecidas na arte. A amostra suspeita de conter ou que se sabe conter o tna pretendido pode ser obtida a partir de uma variedade de fontes. Pode ser uma amostra biológica, uma amostra de alimento ou agrícola, uma amostra ambiental e por aí adiante. Na aplicação do presente método para a detecção de um determinado TNA para fins de diagnóstico médico ou forense, o TNA pode ser obtido a partir de uma amostra de biopsia, um fluido corporal ou exsudado tal como urina, sangue, leite, líquido cerebrospinal, expectoração, saliva, fezes, aspirados pulmonares, esfregaços da garganta ou genitais e semelhantes. Adicionalmente, a detecção pode ser in situ (ver por exemplo Embretson, 1993, Patterson, 1993; Adams, 1994) .
Assim, PNA específicos para vertebrados (incluindo mamíferos e incluindo humanos) ou para qualquer um ou para todos os seguintes microrganismos de interesse podem ser considerados e utilizados de acordo com o presente método:
Corinebactérias
Corynebacterium diphtheria Bacilos
Bacillus thuríngíensis Pneumococos
Diplococcus pneumoniae Estreptococos
Streptococcus pyogenes Streptococcus salivarius Estafilococos
Staphylococcus aureus Staphylococcus albus Pseudomonas
Pseudomonas stutzen Neissérias
Neisseria meningitidis Neisseria gonorrhea 28 ΕΡ Ο 796 344 /ΡΤ
Enterobacteriáceas Escheríchía colí Aerobacteria aerogenes Klebsiella pneumoniae Salmonella typhosa Salmonella choleraesuis Salmonella typhimurium Shigellae dysenteriae Shigellae schmítzíí Shigellae arabinotarda Shigellae flexneri Shigellae boydii Shigellae sonnei Outros bacilos entéricos Proteus vulgaris Proteus mirabilis Proteus morgani Pseudomonas aeruginosa Alcaligenes faecalis Vibrio cholerae Grupo Hemófilos-Bordetelas Hemophilus influenza, H. Ducryi Hemophilus hemophilus Hemophilus aegypticus Hemophilus parainfluenzae Bordetella pertussis Pasteurelas Pasteurella pestis Pasteurella tulareusis Brucelas Brucella melitensis Brucella abortus
As bactérias coliformes
As Salmonellae
As Shigellae
Espécies de Proteus
Brucella suis 29 ΕΡ Ο 796 344 /ΡΤ
Bacilos Aeróbicos Formadores de Esporos Bacillus anthracis Bacillus subtilis Bacillus megaterium Bacillus cereus
Bacilos Anaeróbicos Formadores de Esporos Clostridium botulinum Clostridium tetani Clostridium perfringens Clostridium novyi Clostridium septicum Clostridium histolyticum Clostridium tertium Clostridium bifermentans Clostridium sporogenes
Micobactérias
Mycobacterium tuberculosis hominis Mycobacterium bovis Mycobacterium avium Mycobacterium leprae Mycobacterium paratuberculosis
Actinomicetos (bactérias tipo fungo) Actinomyces isaeli Actinomyces bovis Actinomyces naeslundii Nocardia asteroides Nocardia brasiliensis
As Espiroquetas
Treponema pallidum Treponema pertenue Treponema carateum Spirillum minus Streptobacillus moniliformis Borrelia recurrens Leptospira icterohemorrhagiae Leptospira canicola 30 ΕΡ Ο 796 344 /ΡΤ
Tripanassomas
Micoplasmas
Mycoplasma pneumoniae Outros patoqénios
Listeria monocytogenes Erysípelothríx rhusiopathiae Streptobacíllus moniliformis Donvanía granulomatis Bartonella bacillformls Ricketsias (parasitas tipo bactérias) Ríckettsía prowazekíí Rickettsia mooseri Ríckettsía rickettsii Rickettsia conori Rickettsia australís Rickettsia sibiricus Rickettsia akari Rickettsia tsutsugamushi Rickettsia burnetti Rickettsia quintana
Clamídias (parasitas bacterianos/virais inclassificáveis) agentes Chlamydia (denominação incerta)
Fungos
Cryptococcus neoformans Blastomyces dermatidis Histoplasma capsulatum Coccidioides immitis Paracoccidioides brasiliensis Candida albicans Aspergillus fumigatus
Mucor corymbífera (Absidia corymbifera)
Rhízopus oryzae
Rhizopus arrhizus Phycomycetes
Rhízopus nigricans
Sporotrichum schenkii
Flonsecaea pedrosoi
Fonsecaea compact 31 ΕΡ Ο 796 344 /ΡΤ
Fonsecacae dermatidis Cladosporium carríoní Phialophora verrucosa Aspergillus nidulans Madurella mycetomi Madurella grisea Allescheria boydii Phialophora jeanselmei Microsporum gypsum Tríchophyton mentagrophytes Keratinomyces ajelloi Microsporum canis Tríchophyton rubrum Microsporum adouini Vírus
Adenovírus
Herpesvírus
Herpes simplex Varicela (Chicken pox)
Herpes zoster (Shingles)
Vírus B
Citomegalovírus
Poxvírus
Varíola (smallpox)
Vaccinia Poxvírus bovís Paravaccinia Molluscum contagiosum Picornavírus Poliovírus Vírus Coxsackie Ecovírus Rinovírus Mixovírus
Influenza (A, B e C)
Parainfluenza (1-4) Vírus da papeira Vírus da Doença de Newcastle 32 ΕΡ Ο 796 344 /ΡΤ Vírus do sarampo Vírus da peste bovina (Rinderpest) Vírus da esgana canina Vírus sincicial respiratório Vírus da rubéola Arbovírus Vírus da encefalite equina Oriental Vírus da encefalite equina Ocidental Vírus Sindbis Vírus Chikugunya Vírus da floresta Semliki Vírus de Mayora Vírus da encefalite de St. Louis Vírus da encefalite da Califórnia vírus da febra da carraça do Colorado Vírus da febre amarela Vírus do Dengue
Reovírus
Reovírus tipos 1-3 Retrovírus Vírus da imunodeficiência humana (HIV) Vírus linfotrófico de células T humanas I & II (HTLV) Hepatite
Vírus da hepatite A
Vírus da hepatite B
Vírus da hepatite nãoA-nãoB
Hepatite, C, D, E Vírus Tumorais Vírus da leucemia de Rauscher Vírus Gross Vírus da leucemia de Maloney Virus dos papilomas humanos
Será entendido por um perito na arte que é geralmente necessário tratar amostras suspeitas de conter um determinado TNA de um tal modo de forma a produzir fragmentos que possam facilmente hibridar com o PNA. Pode ser necessário tratar a amostra de teste para efectuar a libertação ou para extrair o 33 ΕΡ Ο 796 344 /ΡΤ ΤΝΑ para hibridação, tal como expondo sangue ou outras células a um ambiente hipotónico, ou rompendo de outro modo a amostra utilizando meios mais vigorosos. Quando se pensa que o TNA está presente na forma de cadeia dupla, será naturalmente desejável separar as cadeias para tornar o TNA hibridável na forma de cadeia simples através de métodos bem conhecidos na arte, incluindo mas não se limitando a aquecimento ou exposição limitada a condições alcalinas que possam ser neutralizadas após a adição do pna de cadeia simples para permitir que a hibridação ocorra. Os métodos para preparação de alvos de ARN são bem conhecidos (ver Waterhouse, 1993; Mitchell, 1992) . A fragmentação de amostras de ácido nucleico contendo TNA é habitualmente necessária para diminuir a viscosidade da amostra e para aumentar a acessibilidade dos TNA aos PNA. Tal fragmentação é alcançada através de meios aleatórios ou específicos conhecidos na arte. Assim, por exemplo, nucleases especificas que se saiba cortarem com uma determinada frequência no genoma particular a analisar, podem ser utilizadas para produzir fragmentos de um tamanho molecular médio conhecido. Adicionalmente, outras nucleases, fosfodiesterases, exonucleases e endonucleases, fragmentação fisica e ultra-sons são todos métodos possíveis para este fim. Estes processos são bem conhecidos na arte. A utilização de enzimas de restrição para fins de fragmentação do ADN é geralmente preferida. No entanto, o ADN pode também ser fragmentado através de uma variedade de meios químicos tais como a utilização dos seguintes tipos de reagentes: EDTA-Fe(ll) (de acordo com Stroebel et al., J. Am. Chem. Soc. 110: 792 7, 1988; Dervan, Science 232: 464, 1986); Cu(II)- fenantrolina (de acordo com Chen e Sigman, Science 231: 1197, 1987); enzima de restrição de classe IIS (de acordo com Kim et al., Science 240: 504, 1988); ADNase híbrida (de acordo com Corey et al., Biochem. 28: 8277, 1989); bleomicina (de acordo com Umezawa et al., J. Antibiot. (Tokyo) Ser. A. 19: 200, 1986); neocarzinostatina (Goldberg et al., "Second Annual Bristol-Myers Symposium in Câncer Research", Academic Press, New York, pág. 163, 1981); e metidiumpropil-EDTA-Fe(II) (de acordo com Hrtzberg et al., J. Am. Chem. Soc. 104: 313, 1982). A remoção de proteínas, como através do tratamento com uma protease, é também geralmente desejável e os métodos para 34 ΕΡ Ο 796 344 /ΡΤ efectuar a remoção das proteínas de amostras de ácidos nucleicos, sem perda apreciável de ácido nucleico, são bem conhecidos na arte.
Os TNA do presente invento devem ser suficientemente longos para que exista uma quantidade suficiente de híbrido de cadeia dupla a flanquear a TBR de modo a que um TBA se possa ligar sem ser perturbado pelas extremidades dos fragmentos não ligados. Tipicamente, são utilizados fragmentos no intervalo de cerca de 10 nucleótidos a cerca de 100 000 nucleótidos, e de preferência no intervalo de cerca de 20 nucleótidos a cerca de 1000 nucleótidos como tamanho médio para fragmentos de TNA. Exemplos de sequências específicas de TNA que podem ser
detectadas são sequências complementares às sequências de PNA aqui descritas para a detecção de sequências de ácido nucleico celulares normais, celulares anormais (como em oncogenes activados, genes estranhos integrados, genes geneticamente deficientes) e específicas de patogénios, para as quais são conhecidas proteínas de ligação a ácido nucleico específicas, ou que podem ser produzidas de acordo com métodos descritos nesta divulgação. Com referência à Figura 7, um TNA relacionado com HIV específico é mostrado como SEQ ID NO:37. 4. Extensões do PNA utilizando BNA, sua preparação e amplificação do sinal. Sob condições de hibridação, podem ser adicionados BNA que hibridam com os PNA, híbridos PNA-BNA, BNA e/ou híbridos BNA-BNA. As adições acima mencionadas podem ser feitas de um modo polimérico não vectorial ou de um modo vectorial, com uma ordem conhecida de BNA.
Com referência à Figura 2a, é apresentado um reforço simples. Um polímero de reforço é produzido através da adição de dois BNA, ilustrados na Figura 2a (Ib e Ic), que quando combinados sob condições de hibridação com o PNA, formam os híbridos PNA-BNA-BNA, constituídos pelo PNA e pelas "extensões de reforço", ilustrados na Figura 2a (lia, Ilb, IIc e Ild) deixando pelo menos uma sequência de 1/2 bbr desemparelhada. Cada sequência de 1/2 BBR desemparelhada, ilustrada na Figura 2a (lia, Ilb, IIc e Ild), pode hibridar com BNA adicionais para formar extensões de "reforço" adicionais. Cada sequência de 1/2 BBR desemparelhada, ilustrada na Figura 2a (lia, Ilb, IIc e Ild) pode hibridar com HNA adicionados, 35 ΕΡ Ο 796 344 /ΡΤ ilustrados na Figura 2a (Illa e Illb). A hibridação dos HNA, que não podem hibridar com BNA adicionais, actua "rematando" da adição dos BNA no PNA, tal como ilustrado na Figura 2a (iva, ivb, ivc e ivd).
Com referência à Figura 2b, é possível controlar e especificar a ordem e os componentes das extensões do PNA. Se for necessária uma única BBR, um HNA contendo a sequência complementar à 1/2 BBR no PNA é adicionado ao PNA para produzir uma única BBR e para "rematar" evitando quaisquer extensões de "reforço" no PNA. Se houver BBR adicionais a adicionar ao PNA, pode ser alcançada uma extensão controlada do PNA.
Com referência à Figura 2b, é apresentado um reforço simples. A extensão polimérica vectorial é alcançada através da adição de um BNA que seja especifico para o PNA, tal como ilustrado na Figura 2b (Ia e lia), que quando combinado sob condições de hibridação com o PNA, forma híbridos pna-bna-BNA, constituídos pelo PNA e extensões de "reforço". Estas extensões, se marcadas com um OSA, proporcionam um método para amplificar grandemente qualquer sinal produzido após a ligação de um PNA a um TNA na amostra. Para além disso, através da ligação de ΒΒΑ marcados às BBR do polímero, é alcançada uma amplificação adicional.
Qualquer um de vários métodos pode ser utilizado para preparar os BNA, incluindo, p.ex., síntese através de química conhecida ou através de métodos de produção de ADN recombinante. No último método, pode ser produzido um número essencialmente ilimitado de BNA de modo simples e económico, por exemplo, através da produção em procariotas (E. colí por exemplo) de um ADN plasmídico possuindo múltiplas repetições das sequências de BNA específicas flanqueadas por locais de restrição possuindo extremidades soltas. Deste modo, por exemplo, os locais operadores esquerdo ou direito do bacteriófago lambda, ou qualquer outro ADN ou outras sequências de ácido nucleico que se saiba ligarem-se especificamente e fortemente a um determinado BBA, tal como uma proteína de ligação a ADN ou ARN, podem ser produzidas num número de cópias essencialmente ilimitado, com cada cópia flanqueada por um EcoRI, PstI, Bamtil ou qualquer um de vários 36 ΕΡ Ο 796 344 /ΡΤ outros locais de nucleases de restrição vulgares. Alternativamente, um polímero em locais repetidos pode ser excisado através de locais de restrição únicos não presentes dentro do polímero. Grandes quantidades de plasmídeo pBR322, pUC ou outro plasmídeo possuindo múltiplas cópias destas sequências são produzidas através de métodos bem conhecidos na arte, o plasmídeo é cortado com a enzima de restrição flanqueando o local polimerizado e as múltiplas cópias libertadas dos operadores são isoladas através de cromatografia ou de quaisquer outros meios convenientes conhecidos na arte. 0 BNA, antes da utilização, é então separado da cadeia e é então passível de polimerização sobre um PNA codificando uma cópia complementar de cadeia simples do operador como uma 1/2 BBR. Os BNA podem ser polimerizados vectorialmente sobre o PNA através da utilização de diferentes enzimas de restrição para flanquear cada repetição do polímero no plasmídeo utilizado para produzir múltiplas cópias do BNA. Alternativamente, o polímero de BNA pode ser hibridado com o PNA através de extremidades soltas numa ou em ambas as extremidades do polímero de BNA, sem necessidade de separar as cadeias e de hibridar cada segmento de BNA. Exemplos de sequências de BNA específicas são proporcionados acima na secção intitulada Descrição das Sequências, como SEQ ID NO:35-36. Para estabilizar o polímero de BNA, pode ser utilizada ADN-ligase para ligar de modo covalente os BNA hibridados. 5. Os Ácidos Nucleicos em "gancho de cabelo" (HNA) e sua preparação. Os HNA aqui descritos compreendem pelo menos duas partes principais unidas uma à outra: Uma sequência de cadeia simples, que é complementar a uma 1/2 BBR, e uma região de ácido nucleico de cadeia dupla formada, sob condições de hibridação, pela auto-associação de sequências auto-complementares dentro do HNA. Com referência à Figura 1 (IIc) dos desenhos, a 1/2 BBR no HNA pode ser construída de modo a ser complementar à 1/2 BBR no PNA. Com referência à Figura 1 (I, IIc e IIIc) dos desenhos, o HNA acima mencionado, quando adicionado ao PNA sob condições de hibridação, forma um híbrido PNA-HNA contendo uma BBR. Com referência à Figura 1 (IIIc, IVc e Vc) dos desenhos, um híbrido PNA-HNA, sob condições de hibridação, após a adição do TNA, pode formar um híbrido TNA-PNA-HNA contendo uma TBR e uma BBR. 37 ΕΡ Ο 796 344 /ΡΤ
Com referência à Figura 2a e 2b, os HNA podem ser utilizados para "rematar" ou terminar a adição de extensões de BNA ao PNA. Os dois BNA da Figura 2a (Ib e Ic) podem associar-se para formar o híbrido mostrado na Figura 3(ivb) ou podem hibridar directamente e individualmente com o PNA tal como ilustrado na Figura 2a (Ia-c, Ila-d) . Os dois HNA (mostrados na Figura 2a (Illa e Illb)) podem terminar a hibridação do BNA com outros BNA que se estendem do PNA, tal como ilustrado na Figura 2a (iva-d). 0 HNA na Figura 2a (Illa) pode terminar os híbridos PNA-BNA mostrados na Figura 2a (Ilb e Ild) e qualquer híbrido PNA-BNA com uma 1/2 BBR de cadeia simples que seja complementar à 1/2 BBR no HNA ilustrado na Figura 2a (Illa) . De modo semelhante, o HNA na Figura 2a(IIIb) pode terminar os híbridos PNA-BNA mostrados na Figura 2a (lia e lie) e qualquer híbrido PNA-BNA com duas 1/2 BBR de cadeia simples que sejam complementares às 1/2 BBR no HNA ilustrado na Figura 2a(IIIb). São construídos HNA que terminarão os híbridos PNA-BNA que são construídos a partir da adição sequencial de BNA ao PNA tal como ilustrado na Figura (2b). As sequências de cadeia simples de 1/2 BBR ilustradas na Figura 2b (Ia, Illa, Va e Vila) são especificamente complementares às sequências de 1/2 BBR de cadeia simples ilustradas na Figura 2b (Ib, Illb, Vb e VIIb) e produzem os híbridos PNA-BNA-HNA rematados únicos ilustrados na Figura 2b (Ic, IIIc, Vc e VIIc).
As sequências auto-complementares no HNA e a sequência de volta que se liga às sequências em "gancho de cabelo" auto-complementares podem ser de qualquer composição e comprimento, desde que não impeçam substancialmente nem inibam a apresentação da 1/2 BBR de cadeia simples que compreende parte do HNA pelo HNA ou se liguem selectivamente ao BBA ou ao TBA. As sequências de volta devem ser seleccionadas de modo a que a formação da volta não impeça a formação do "gancho de cabelo". Um exemplo de um HNA útil neste pedido é proporcionado como SEQ ID NO:44 (ver Descrição das Sequências acima). 6. Os Conjuntos de Ligação ao Alvo (TBA) e sua preparação. Um TBA pode ser qualquer substância que se liga a uma determinada TBR formada através de hibridação de determinados TNA e PNA, desde que o TBA tenha pelo menos os seguintes atributos: 38 ΕΡ Ο 796 344 /ΡΤ a) Ο ΤΒΑ tem de se ligar à(s) TBR de um modo que seja altamente específico para a(s) TBR de interesse. Isto é, o TBA tem de discriminar entre as TBR presentes no híbrido TNA-PNA e sequências dúplex semelhantes formadas por híbridos PNA-CNA. O TBA tem de se ligar ao híbrido PNA-CNA com uma avidez suficientemente baixa para que após lavagem do complexo TBA-TNA-PNA, o híbrido PNA-CNA seja deslocado e o híbrido PNA-TNA não seja deslocado; b) 0 TBA tem de se ligar de forma ávida à(s) TBR criada (s) através da hibridação do TNA com o PNA. Afinidades de ligação no intervalo de 1CT5 a cerca de 10~12 ou mais são geralmente consideradas suficientes. Tal como observado abaixo, nalguns casos pode ser desejável utilizar um determinado TBA que possua uma avidez muito baixa para uma determinada TBR, mas que possua uma afinidade muito maior quando é proporcionada uma determinada configuração de múltiplas TBR de modo a que o quadrado da afinidade do TBA para cada TBR se torne a afinidade relevante para esse TBA em particular.
Exemplos de componentes de ligação ao ADN úteis na formação dos TBA incluem, mas não se limitam a NF-kB, proteína E2 do vírus do papiloma, factor de transcrição SP1, enzimas de restrição inactivas, anticorpos, etc. Foi reconhecido na arte que cada uma destas proteínas contém sequências que se ligam a determinadas sequências de ácido nucleico e as afinidades destas interacções são conhecidas. Naturalmente, o método do presente invento não se limita à utilização destas proteínas de ligação ao ADN conhecidas ou a fragmentos destas. A partir da presente divulgação, será aparente para um vulgar perito na arte que o presente método pode facilmente ser aplicado à utilização de novos TBA exibindo pelo menos os atributos necessários observados acima. Assim, por exemplo, em WO 92/20698, foi descrita uma molécula de ligação ao ADN específica da sequência compreendendo um conjugado oligonucleotídico formado pela ligação covalente de um fármaco de ligação ao ADN a um oligonucleótido formando um tríplex. O método dessa divulgação podia ser utilizado para produzir novos TBA para utilizar de acordo com a presente divulgação, desde que os TBA assim formados verificassem os critérios descritos acima. Adicionalmente, os métodos das Patentes U.S. 5 096 815, 5 198 346 e WO 88/06601, podem ser 39 ΕΡ Ο 796 344 /ΡΤ utilizados para criar novos TBA para utilizar de acordo com o método deste invento. Podem ser utilizados anticorpos específicos ou porções destes (ver por exemplo Blais, 1994).
Quando o TBA é uma proteína, ou um complexo de proteínas, será reconhecido que pode ser utilizado qualquer um de vários métodos de rotina na arte para produzir o TBA. 0 TBA pode ser isolado a partir do seu ambiente natural ou, se isto for impraticável, produzido através de técnicas padrão de biologia molecular. Assim, utilizando NF-kB como exemplo, utilizando as porções de ligação ao ADN das subunidades p50 ou p65, este conjunto de ligação pode ser produzido de acordo com métodos recombinantes conhecidos na arte (ver por exemplo Ghosh, Cell 62: 1019-1029, 1990, que descreve a clonagem da subunidade de ligação ao ADN p50 de NF-kB e a homologia dessa proteína com rei e dorsal). São conhecidas muitas proteínas de ligação ao ADN e a outros ácidos nucleicos que podem ser utilizadas como ou em TBA de acordo com este invento. Uma vez conhecida a sequência de aminoácidos de qualquer proteína de ligação a ADN, ARN:ADN, ARN ou outro ácido nucleico, uma sequência de ADN apropriada codificando a proteína pode ser preparada através de meios sintéticos ou pode ser utilizada uma cópia de ADNc do ARNm codificando a proteína a partir de uma fonte de tecido apropriada. Para além disso, podem ser obtidas cópias genómicas codificando a proteína e os intrões serem removidos de acordo com métodos conhecidos na arte. Para além disso, os TBA podem ser quimicamente sintetizados.
Uma vez obtida uma sequência de codificação apropriada, pode ser utilizada mutagénese dirigida ao local para alterar a sequência de aminoácidos codificada para produzir proteínas de ligação ao ácido nucleico mutantes exibindo características de ligação mais desejáveis que as da proteína de ligação ao ácido nucleico original. Como exemplo deste processo, a sequência de aminoácidos das porções de ligação ao ADN de NF-kB podem ser alteradas de forma a produzir uma molécula NF-kB' que se liga de forma mais forte ao local de ligação de NF-kB (ver exemplos abaixo Hiv-Detect e Hiv-Lock). 40 ΕΡ Ο 796 344 /ΡΤ
Para proporcionar uma melhor perspectiva deste aspecto do presente invento, deve-se observar as seguintes considerações. Utilizando NF-kB como exemplo, pode ser preparado um TBA utilizando a molécula NF-kB de ocorrência natural. No entanto, como esta molécula está presente em quantidades pequenas e decrescentes nas células e como as subunidades desta proteína de ligação ao ADN foram clonadas, seria mais razoável preparar grandes quantidades do complexo através de meios de ADN recombinante tal como foi já alcançado para esta proteína (ver por exemplo Ghosh, Cell 62: 1019-1029, 1990). NF-kB é um indutor pleiotrópico de genes envolvidos em respostas imunitárias, inflamatórias e reguladoras do crescimento a confrontos patogénicos primários (virais, bacterianos ou de stress) ou a confrontos patogénicos secundários (citoquinas inflamatórias). NF-kB é uma proteína de ligação ao ADN dimérica compreendendo uma subunidade p50 e uma p65, ambas as quais contactam e ligam-se a sequências de ADN específicas. Num estado inactivado, NF-kB reside no citoplasma celular, complexado com um inibidor específico, 1-kB, para formar um heterodímero citoplasmático. Após activação, o inibidor é descomplexado e o dímero p50-p65 relocaliza-se através de um sinal de localização nuclear (NLS) específico no núcleo celular onde se pode ligar ao ADN e efectuar o seu papel como activador da transcrição de numerosos genes (ver Grimm e Baeuerle, Biochem. J. 290: 297-308, 1993, para uma revisão do estado da arte em relação a NF-kB). O dímero p50-p65 liga-se com uma afinidade picomolar a sequências correspondentes à de consenso GGGAMTNYCC (SEQ ID NO:117), com afinidades ligeiramente diferentes dependendo da sequência exacta. Deve notar-se que se observou também a ocorrência de homodímeros de p50 e p65. Estes homodímeros apresentam propriedades bioquímicas diferentes bem como afinidades ligeiramente diferentes das sequências de ligação dentro e semelhantes à de consenso acima. Assim, dependendo das características de ligação desejadas do TBA, pode ser utilizado um heterodímero p50-p65, um homodímero p50-p50 ou um homodímero p65-p65 ou fragmentos dos dímeros acima mencionados.
Um modo pelo qual podem ser produzidos vários novos TBA é mostrado esquematicamente na Figura 9. As unidades de 41 ΕΡ Ο 796 344 /ΡΤ reconhecimento dos ácidos nucleicos do TBA podem ser montadas e associadas a unidades de reconhecimento de ácidos nucleicos de TBA semelhantes ou diferentes através de um "acompanhante". 0 acompanhante é uma estrutura na qual são construídos os vários elementos de reconhecimento do TBA e que confere propriedades desejáveis nas unidades de reconhecimento dos ácidos nucleicos. 0 acompanhante é constituído por qualquer sequência que proporcione sequências de montagem de modo a que as mesmas ou diferentes unidades de reconhecimento dos ácidos nucleicos sejam colocadas em íntima e estável associação umas com as outras. Assim, por exemplo, no caso de um TBA desenhado para ligar fortemente a TBR de NF-kB, um TBA é montado proporcionando sequências cro de lambda como sequências de montagem, ligadas às sequências de ligação ao ácido nucleico para p50 ou p65 de NF-kB. As sequências de ligação ao ácido nucleico de p50 ou p65 são ligadas às sequências cro no terminal carboxilo ou amino de cro e no terminal carboxilo ou amino da unidade de reconhecimento do ácido nucleico da p50 ou p65. Sequências de ligação são opcionalmente proporcionadas para permitir o espaçamento apropriado das unidades de reconhecimento do ácido nucleico para uma óptima ligação à TBR.
As sequências de montagem, exemplificadas acima pelas sequências cro e Cl (SEQ ID NO:104-108), compreendem quaisquer oligopéptidos estáveis que se liguem naturalmente e fortemente a sequências semelhantes. Assim, no caso de cro, é bem conhecido que um dímero de cro se liga aos locais operadores do bacteriófago lambda (Anderson et al.r Nature 290: 754-758, 1981; Harrison e Aggarwal, Ann. Rev. Biochem. 59: 933-969). As unidades monoméricas de cro associam-se de forma apertada e específica umas às outras. Assim, através da ligação de sequências de unidades de reconhecimento de ADN às sequências cro, é alcançada uma associação íntima e apertada.
As sequências ligantes opcionais compreendem qualquer sequência de aminoácidos que não interfira com a montagem do TBA ou a ligação ao ácido nucleico, e que não seja instável de modo a libertar a unidade de reconhecimento do ácido nucleico do TBA completo. É desejável mas não necessário que as sequências ligantes sejam covalentemente ligadas a outros componentes do conjunto de ligação. A associação deve ser 42 ΕΡ Ο 796 344 /ΡΤ específica de modo a ajudar na montagem e fabrico dos conjuntos de ligação. Exemplos de tais sequências incluem, mas não se limitam a, sequências tão bem conhecidas como as verificadas a ligar vários domínios em proteínas estruturais. Assim, por exemplo, na proteína repressora de lambda, existe uma sequência ligante entre o domínio de ligação ao ADN e o domínio de dimerização que é útil para este fim. São conhecidas muitas outras destas sequências e a sequência exacta destas não é crítica para este invento, desde que seja conduzida experimentação de rotina para assegurar a estabilidade e a não interferência com a ligação ao ácido nucleico alvo. Exemplos de tais sequências são aqui proporcionados como Met Ser e SEQ ID NO:99-102. A inserção de locais de proteólise específicos conhecidos nestes ligantes é também uma parte integral deste invento. A presença de tais locais nas sequências ligantes proporcionará vantagens de fabrico, permitindo que moléculas diferentes sejam montadas na estrutura de acompanhamento.
Para além das unidades de reconhecimento do ácido nucleico, sequências de ligação opcionais e sequências de montagem, os novos TBA deste invento possuem opcionalmente sequências de TNA de assimetria ou PILOTO e uma ou mais unidades OSA. As sequências de assimetria são proporcionadas para favorecer ou prevenir determinadas associações desejáveis ou indesejáveis. Por exemplo, no caso de se desejar que um TBA possua unidades de reconhecimento de ADN de p50 homodiméricas, as sequências de assimetria são proporcionadas para destruir a associação naturalmente mais forte das subunidades p50 e das subunidades p65 de NF-kB, ao mesmo tempo que não destrói as sequências de montagem que mantêm as subunidades p50 juntas. Exemplos de tais sequências são aqui proporcionados como SEQ ID NO:85-92 e SEQ ID NO:105 e 106.
Numa configuração diferente, sequências da subunidade p50 de NF-kB são colocadas em íntima associação com sequências da unidade de reconhecimento de ADN do factor de transcrição SPl. Isto é desejável no caso de um motivo de ligação a NF-kB/SPl ser significativo, como na LTR de HIV onde se sabe existir um motivo de pelo menos seis locais de reconhecimento da proteína de ligação ao ADN, dois NF-kB, três SPl e um local TATA. Uma vez que se sabe também que o segundo local NF-kB e o primeiro 43 ΕΡ Ο 796 344 /ΡΤ SPl são significativos para a regulação da transcrição do HIV (Perkins et ai., EMBO J. 12: 3551-3558, 1993), esta configuração particular de TBA é útil não apenas na detecção de Hiv, mas como terapêutico ou profilático contra a infecção de HIV (ver abaixo). Do mesmo modo, a região de controlo longa (LCR) do virus do papiloma humano pode ser utilizada como região de controlo chave para sondar de acordo com este método.
Tendo em vista os diferentes elementos que podem ser associados, em modo de cassete, de acordo com este método de formação do TBA, é produzida uma variedade essencialmente ilimitada de TBA. Na Figura 10, é exemplificada uma série de moléculas diferentes, referida como "Hiv-detect I-IV" em que "CHAP" denomina o acompanhante, "nfkb" denomina subunidades de NF-kB, "spl" denomina a unidade de reconhecimento do ácido nucleico do factor de transcrição SPl e "TATA" denomina um dimero da unidade de reconhecimento de ADN de uma proteína de ligação ao ADN na sequência TATA (TBP), também conhecida como proteína de ligação a TATA ou TBP. Estas configurações são ainda exemplificadas abaixo e são todas partes integrais do presente invento.
Ainda noutra concretização, a estrutura modular mostrada na Figura 9 é adaptada à detecção e/ou ao tratamento ou profilaxia de um patogénio completamente diferente. Na Figura 11, de um modo semelhante ao das moléculas "HIV-detect I-IV" acima descritas, é produzida uma série de moléculas "HPV-Detect I-IV". Nesta concretização é tirada vantagem das propriedades de ligação ao ADN da proteína E2 do vírus do papiloma humano (HPV). Adicionalmente, é tirado partido dos papéis de SPl e TBP proporcionando unidades de reconhecimento de ADN específicas adaptadas para se ligarem a estas sequências no genoma de HPV. Na formação de TBA específicos de E2 para utilizar na detecção de infecção de HPV, pode ser desejável utilizar qualquer uma de SEQ ID NO:75-84 ou 93-98 como unidades de reconhecimento do ADN de E2. Um TBA contendo um domínio de ligação ao ADN do dimero de E2 bovino e do dimero de E2 humano pode ser particularmente útil.
As várias sequências descritas acima podem ser quimicamente ligadas utilizando materiais de partida 44 ΕΡ Ο 796 344 /ΡΤ oligopeptídicos puros ou podem ser ligadas através do fornecimento de ácidos nucleicos recombinantes codificando, através do bem conhecido código genético, os vários sub- elementos. No caso da produção recombinante, a ligação de sequências de codificação cro a sequências de unidades de reconhecimento do ácido nucleico para formar TBA é vantajosa porque não só cro actua como sequências de montagem no acompanhante como também actua a dirigir a dobragem correcta dos elementos de reconhecimento do ácido nucleico. Sequências exemplificativas para acompanhantes são aqui proporcionadas como SEQ ID NO:104-108. Para além disso, no caso de serem desejadas estruturas de ordem superior compreendendo múltiplos locais de ligação, como num TBA pentamérico NF-kB/NF-kB/ SPl/SPl/SPl, o desenho correcto das sequências de assimetria permite que tais estruturas sejam feitas.
Do modo antecedente, são preparados TBA que se ligam aos seus locais de ligação cognatos com elevada afinidade. Por exemplo, espera-se que os componentes de ligação ao ADN de NF-kB dos TBA da Figura 10 se liguem à LTR de HIV com uma afinidade de entre cerca de 1CT8 e IO”12 molar. Sequências úteis como unidades de reconhecimento do ADN são proporcionadas como SEQ ID NO:63-71, 73-84, 93-98 e 104-108 e exemplificadas mais abaixo.
Tendo em vista a descrição antecedente da montagem dirigida das proteínas de ligação ao ácido nucleico utilizando sequências de montagem e assimetria (ou pilotagem), os peritos na arte reconhecerão que é proporcionado por este invento um método geralmente aplicável para montagem de estruturas proteicas. A generalidade deste método é ainda demonstrada pela consideração, como outro exemplo, da utilização de uma interacção anticorpo-epítopo na montagem de estruturas desejadas. Por meio da especificidade, uma estrutura proteica de ligação ao ADN pode ser montada através da ligação de uma subunidade p50 de NF-kB a um antigénio, tal como uma hormona estimuladora dos melanócitos (MSH) circularizada (através de ligações dissulfureto). Esta pró molécula MSH pode então ser ligada através de um anticorpo anti-MSH para proporcionar um novo conjunto de ligação ao ácido nucleico, com o antigénio e o anticorpo a actuar como sequências de montagem. 45 ΕΡ Ο 796 344 /ΡΤ A estrutura modular proporcionada pela Figura 9 revela que pode ser montada uma grande variedade de TBA utilizando diferentes combinações dos componentes. Assim, são proporcionadas concretizações representativas desta estrutura geral como SEQ ID NO:109-116. 7. Os Conjuntos de Ligação de Reforço (BBA) e sua preparação. Um BBA pode ser qualquer substância que se ligue a uma determinada bbr formada através da hibridação de determinados PNA e BNA, incluindo quando múltiplos ΒΝΑ (até e incluindo "n" BNA, i.e., BNAn, em que "n" é teoricamente 0-°°, mas na prática está entre 1 e 100) são polimerizados sobre o PNA para amplificação do sinal, desde que o BBA tenha pelo menos os seguinte atributos: a) O BBA tem de se ligar às BBR de um modo que seja altamente especifico para a BBR de interesse. Isto é, o BBA tem de discriminar entre as BBR presentes no híbrido PNA-BNA e sequências dúplex semelhantes em híbridos BNA-CNA ou outros CNA. Assim, mesmo quando ocorre apenas um único emparelhamento errado de bases ou diferenças conformacionais com ou sem emparelhamentos errados de bases na produção do híbrido PNA-BNAn ou PNA-BNAn-HNA, o BBA tem de se ligar ao híbrido com uma avidez suficientemente baixa para que após lavagem do complexo TBA-TNA-PNA-BNAn, o BBA seja deslocado das sequências de CNA mas não das sequências de BBR. b) O BBA tem de se ligar avidamente à(s) BBR(s) . Afinidades de ligação no intervalo de 10“5 a cerca de 10“9 ou mais são geralmente consideradas suficientes.
Exemplos de BBA incluem, mas não se limitam a cro e à proteína repressora do bacteriófago lambda, Cl. Adicionalmente, ver Patente U.S. 4 556 643, que sugere outras sequências de ADN e proteínas de ligação específicas tais como repressores, histonas, enzimas modificadoras do ADN e a proteína activadora de genes de catabolitos. Ver também EP 0453301, que sugere uma variedade de proteínas de ligação específicas da sequência nucleotídica (NSSBP) tais como o repressor da tetraciclina, o repressor lac e o repressor do triptofano. Foi reconhecido na arte que cada um destes BBA se liga a determinadas sequências de ácido nucleico conhecidas e as afinidades destas interacções são conhecidas. Naturalmente, 46 ΕΡ Ο 796 344 /ΡΤ ο método do presente invento não se limita à utilização destes BBA conhecidos. A partir da presente divulgação, um perito na arte pode facilmente aplicar a utilização de novos BBA exibindo pelo menos os atributos necessários observados acima no presente método.
Exemplos de novos BBA úteis de acordo com este aspecto do presente invento incluem novas proteínas com base no motivo de uma proteína de ligação a ADN ou ARN ou ADNrARN conhecida tal como cro ou a proteína repressora de λ Cl. De preferência, tais modificações são feitas para melhorar o manuseamento destes componentes do presente invento. Assim, pode ser desejável adicionar uma elevada concentração de cro a um ensaio. Uma das qualidades negativas de cro é que a elevadas concentrações, a ligação de cro ao seu alvo de ADN entra em competição com interacções cro-cro. Assim, por exemplo, pode ser produzida uma cro acompanhada ou mutada que não possua este inconveniente. Exemplos de tais acompanhantes alterados são SEQ ID NO:105-106 e 108. Métodos conhecidos na arte, tais como a produção de novas proteínas de ligação utilizando populações variegadas de ácidos nucleicos e selecção de bacteriófagos que se ligam a determinados alvos pré-seleccionados (i.e., a designada tecnologia de apresentação de fagos, ver discussão acima para a produção de novos TBA) podem ser utilizados para produzir tais novos BBA bem como os novos TBA acima mencionados.
Quando o BBA é uma proteína ou um complexo de proteínas, será reconhecido que qualquer um de vários métodos de rotina na arte pode ser utilizado para produzir o BBA. O BBA pode ser isolado a partir do seu ambiente natural ou, se isto for impraticável, produzido através de técnicas padrão de biologia molecular. Assim, por exemplo, a sequência da proteína cro é conhecida e qualquer clone molecular do bacteriófago lambda pode ser utilizado para obter os ácidos nucleicos apropriados codificando cro para produção recombinante desta. Adicionalmente, os TBA aqui descritos podem ser utilizados como BBA, desde que sejam utilizados TBA diferentes para se ligarem a TBR e BBR. 8. A utilização de BBA e BBR para localizar e amplificar a localização dos complexos PNA-TNA-TBA (ver Figura 8) . Numa concretização deste invento, a ligação altamente específica e extremamente forte dos TBA constituídos por componentes de ligação ao ácido nucleico é utilizada para produzir um ensaio 47 ΕΡ Ο 796 344 /ΡΤ em sanduíche de ácidos nucleicos amplificável. De acordo com um aspecto desta concretização, um suporte sólido é revestido com um primeiro TBA criando um TBA imobilizado. Em solução, um PNA e um tna são postos em contacto sob condições de hibridação e depois postos em contacto com o TBA imobilizado. Apenas as interacções PNA-TNA que formam a TBR específica reconhecida pelo TBA imobilizado são mantidas após a lavagem da superfície sólida que se liga ao complexo TBA-TBR. A detecção da TBR ligada é alcançada através da ligação de Ácidos Nucleicos de Reforço, BNA, às 1/2 BBR presentes nos PNA sob condições de hibridação. Deste modo, mesmo que apenas se ligue um único complexo TBA-TBR ao TBA imobilizado, pode ser produzido um grande sinal amplificado através da polimerização de múltiplos BNA no TNA imobilizado. Cada BNA que se liga ao TNA forma uma BBR que se pode ligar através de BBA que, tal como os TBA imobilizados na superfície sólida, podem ser escolhidos pela sua ligação muito forte e específica a determinadas estruturas de ácido nucleico. Assim, de acordo com esta concretização, o TBA imobilizado pode conter a porção de ligação ao ADN de NF-kB, que se liga de forma muito específica e forte aos locais de ligação de NF-kB formados após hibridação do TNA e PNA para formar um tal local.
Porque é bem conhecido que existem locais de ligação de NF-kB tanto no genoma humano normal como nas repetições terminais longas do vírus da imunodeficiência humana (HIV), este invento proporciona um método de discriminar entre os locais humanos "normais" e os locais presentes em células devido a infecção de HIV. Portanto, num teste desenhado para determinar a presença ou ausência de ADN de HIV numa amostra de ADN humano, os locais de ligação de NF-kB de HIV podem ser vistos como o TNA e os locais de ligação de NF-kB humanos normais podem ser vistos como CNA. De acordo com o método deste invento, a discriminação entre estes TNA e CNA é alcançada tirando vantagem do facto de na LTR de HIV existirem dois locais de ligação de NF-kB, seguidos de três locais de SPl (ver, por exemplo, Koken et al., Virology 191: 968-972, 1992), enquanto que locais de ligação de NF-kB celulares com as mesmas sequências não se verificam em cadeia. 48 ΕΡ Ο 796 344 /ΡΤ
Em casos onde ο ΤΝΑ contém mais de uma 1/2 TBR e é desejável perseguir as aplicações terapêuticas e profiláticas dos TBA, pode ser desejável utilizar mais de um TBA, cada um com a capacidade de se ligar a um tbr no complexo TNA-PNA. Neste caso, pode ser vantajoso seleccionar, como componentes dos TBA, dominios de ligação ao ADN ou de ligação ao ARN com menor afinidade para a sua TBR que o domínio de ligação ao ADN ou de ligação ao ARN de tipo selvagem. Dado que os TBA que estão envolvidos na ligação a múltiplas TBR se podem montar antes da ligação às suas TBR ou montar após a ligação às suas TBR, os TBA individuais não bloquearão as correspondentes TBR nos outros genomas para além do genoma alvo a menos que as TBR sejam espacialmente capazes de se ligar ao complexo de TBA montado. Uma característica da montagem multimérica de TBA que é especificamente reivindicada aqui como parte deste invento é que se espera que uma tal montagem multimérica tenha uma afinidade muito reduzida para um único local dentro do TNA. No entanto, uma vez que a ligação é dramaticamente aumentada relativamente a qualquer TBA, esperar-se-ia que o complexo de TBA não competisse pela ligação a qualquer TBR única com as proteínas nativas correspondentes in situ mas se ligasse fortemente a sequências no híbrido PNA-TNA contendo as TBR para cada um dos componentes de ligação ao ácido nucleico montados no TBA. 0 complexo de TBA deve ser montado e os ligantes ajustados nos TBA individuais de forma a permitir que as regiões de ligação ao ácido nucleico contidas no complexo de TBA alcancem e se liguem simultaneamente a estes alvos.
Uma vez formados os híbridos TNA-PNA e colocados em contacto com o TBA imobilizado, o ácido nucleico não ligado é lavado da superfície imobilizada e os híbridos imobilizados são detectados. Isto é alcançado através de um de vários modos. Num aspecto deste invento, o PNA é marcado com um OSA, tal como um radionuclido, esferas coloridas ou uma enzima capaz de formar um produto de reacção colorido. Para além disso, para além de possuir uma ou mais 1/2 TBR, o PNA pode também conter pelo menos uma 1/2 BBR. As sequências de 1/2 bbr são escolhidas de forma a serem complementares a sequências de 1/2 BBR únicas nos BNA. Na concretização descrita acima, por exemplo, onde o TBA é NF-kB e a TBR formada após hibridação TNA-PNA é um ou mais locais de ligação de NF-kB, a 1/2 BBR pode proporcionar sequências que podem hibridar (isto é, de 49 ΕΡ Ο 796 344 /ΡΤ cadeia simples e complementares) dos operadores esquerdo e direito do bacteriófago lambda (ver, por exemplo, Ptashne, Scientific American 247: 128-140, 1982, e referências ai citadas para sequências destes operadores). Estas podem ser polimerizadas sobre as 1/2 BBR do PNA de um modo vectorial (ver Figuras 2 e 3) proporcionando até "n" BBR e cada BBR forma um local de ligação cro. A cro marcada enzimaticamente, radioactivamente ou de outro modo é colocada em contacto com o complexo TBA-TNA-PNA-(BNA)n. Deste modo é produzido um sinal altamente selectivo e amplificado. O sinal produzido utilizando um PNA possuindo uma única 1/2 TBR indica o sucesso do ensaio em alcançar a ligação TBA-TBR e a polimerização dos BNA para produzir o sinal a partir de locais celulares (i.e., a partir de CNA). A ausência de sinal quando é utilizado um TBA dimerizado indica que no TNA não havia LTR de HIV uma vez que não estavam presentes locais de ligação duplos de NF-kB. Por outro lado, a presença de sinal utilizando o dímero de NF-kB indica infecção de HIV. Como exemplo específico da descrição antecedente desta concretização do presente invento, ver o Exemplo 6 descrevendo um estojo de teste de HIV.
Naturalmente, os peritos na arte reconhecerão que a descrição antecedente está sujeita a várias modificações na escolha dos PNA, TNA, TBA, BNA e BBA. Para além disso, em sistemas que não de HIV, os peritos na arte reconhecerão que o método geral descrito acima pode igualmente ser aplicado. No entanto, estas outras aplicações podem ser mais simples que o método descrito acima uma vez que os TBA utilizados podem não reconhecer quaisquer locais celulares normais e portanto o recorrer à dimerização ou a outros métodos de discriminação entre TNA e CNA pode ser menos critico. No desenho de sondas e conjuntos de ligação para estes outros sistemas, o perito na arte será guiado pelos seguintes princípios e considerações.
Na concretização acima descrita, o interesse de utilizar as porções de ligação ao ADN da proteína NF-kB como o TBA e os elementos de ligação de reconhecimento de NF-kB como as TBR é que estes elementos formam um "ponto de controlo" importante para a replicação do HIV. Isto é, sabe-se que o HIV necessita de utilizar NF-kB como uma característica crítica no seu ciclo de vida replicativo. Pontos de controlo semelhantes para 50 ΕΡ Ο 796 344 /ΡΤ outros patogénios são escolhidos e utilizados como base para a detecção de acordo com os métodos aqui descritos.
Da descrição antecedente de características gerais deste invento e do modo da sua operação, um perito na arte reconhecerá que existe uma variedade de modos específicos para a prática deste invento. Como exemplo, o método deste invento é adaptável a um método e dispositivos utilizando estojos de teste cromatográficos descritos nas Patentes U.S. 4 690 691 e 5 310 650 (as patentes '691 e '650) . Nessas patentes, foi utilizado um meio poroso para imobilizar um TNA ou uma sonda de captura e foi utilizado um solvente para transportar uma fase móvel contendo um PNA marcado, se o TNA estivesse imobilizado, ou o TNA, se estivesse imobilizada uma sonda de captura, para a "zona de captura". Uma vez o TNA ligado na zona de captura, através da sua imobilização directa ou através de captura, um PNA marcado era sujeito a cromatografia através da zona de captura e era detectado qualquer marcador ligado. A adaptação do presente invento a um tal sistema proporciona a melhoria da utilização de um Conjunto de Ligação ao Alvo na zona de captura e, deste modo, a captura de apenas sequências de TBR que coincidem perfeitamente ou de outras TBR que representem conformações do ácido nucleico que se ligam especificamente ao TBA dentro dos dúplices TNA-PNA em virtude da discriminação sensivel anteriormente descrita pelo TBA entre TNA e CNA.
Uma vez os híbridos TNA-PNA ligados ao TBA imobilizado, o sinal é amplificado através da adição de BNA ou de BNA de cromatografia através da zona de captura. Finalmente, o sinal pode ser ainda amplificado através da adição de BBA ou de BBA marcados cromatograficamente através da zona de captura. Deste modo, a facilidade de realização dos passos de análise descritos nas patentes '691 e '650 é aqui melhorada proporcionando uma capacidade adicional de aumentar a especificidade e, através da amplificação, a sensibilidade do método descrito nessas patentes.
Os peritos na arte reconhecerão também que o método do presente invento é passível de ser realizado em placas de 51 ΕΡ Ο 796 344 /ΡΤ microtítulo ou de ser automatizado. A utilização de máquinas incorporando o método deste invento recai deste modo naturalmente dentro do âmbito da presente divulgação e das reivindicações anexas a ela. Assim, por exemplo, este invento é adaptável para utilização em instrumentos tais como o analisador de bancada IMx de Abbott Laboratories (Abbott Park, IL). 0 IMx é actualmente desenhado para correr o imunoensaio de polarização fluorescente (FPZA, ver Kier, KCLA 3: 13-15, 1983) e o imunoensaio enzimático de micropartículas (MEZA, ver "Laboratory Medicine", Vol. 20. N° 1, Janeiro de 1989, págs. 47-49). O método MEZA é facilmente transformado num método de detecção de ácidos nucleicos utilizando o presente invento através da utilização de um TBA como molécula de captura revestida numa microparticula com tamanho submicrométrico (<0,5 pm em média) suspensa em solução. As micropartículas revestidas com TBA são pipetadas para uma célula de reacção. O IMx pipeta então a amostra (PNA-TNA hibridados) para a célula de reacção, formando um complexo com o TBA. Após um período de incubação apropriado, a solução é transferida para uma matriz de fibra de vidro inerte para a qual as partículas têm uma forte afinidade e à qual as micropartículas aderem. Antes ou após a filtração da mistura reaccional através da matriz de fibra de vidro, são adicionados os BNA e BBA ou é utilizado outro meio de amplificação e detecção do sinal que dependa da formação específica de híbridos TNA-PNA. O complexo imobilizado é lavado e o material não ligado flui através da matriz de fibra de vidro.
Os complexos ligados são detectados por meio de BBA marcados com fosfatase alcalina ou BBA marcados de outro modo (radioactivamente, enzimaticamente, por fluorescência). No caso de BBA marcados com fosfatase alcalina, pode ser adicionado o substrato fluorescente 4-metil-umbeliferil-fosfato ou um reagente semelhante. Alternativamente, a enzima pode ser obviada através da marcação directa dos BBA com este ou com um reagente semelhante. Em qualquer caso, o sinal fluorescente ou outro é proporcional à quantidade de híbridos PNA-TNA presentes. A fluorescência é detectada à superfície da matriz por meio de um fluorómetro de superfície frontal tal como descrito pelo fabricante do IMx. Com ajustes menores que podem ser 52 ΕΡ Ο 796 344 /ΡΤ feitos através de experimentação de rotina para optimizar um instrumento tal como o IMx para a hibridação de ácidos nucleicos e interacções ácido nucleico-TBA, o presente invento é completamente adaptável a análises automáticas de amostras de TNA. 9. Outras aplicações de diagnóstico deste invento. Embora a descrição antecedente permita a utilização do presente invento de várias maneiras diferentes, muitas utilidades adicionais deste invento são facilmente apreciadas, por exemplo, num sistema de atraso da mobilidade.
Nesta concretização do presente invento, uma melhoria do bem conhecido ensaio de mudança da mobilidade electroforética (EMSA) é conduzida como se segue (ver Figuras 12a e 12b):
Uma amostra de ADN é fragmentada, através de clivagem aleatória ou através de tratamento com endonucleases de restrição especificas. 0 adn na amostra é então dividido em duas aliquotas iguais e é adicionado um TNA especifico à primeira aliquota mas não à segunda. A primeira e a segunda aliquotas são então sujeitas a electroforese num gel de acrilamida ou agarose e o padrão das bandas de ADN (visualizadas através de ligação a brometo de etidio ou por serem radioactivamente marcadas antes da electroforese) é então comparado para as duas aliquotas. Os fragmentos de ADN possuindo locais de ligação para os quais o tba é específico são atrasados na sua migração ao longo do meio electroforético. Através da utilização de um TBA apropriado, qualquer número de sequências de ADN ou de outro ácido nucleico pode ser seguido deste modo.
Numa modificação do EMSA descrito acima, o TNA fragmentado é hibridado com um PNA e fraccionado numa primeira dimensão. 0 ADN fraccionado é então feito reagir com um TBA apropriado e é observada a mudança na mobilidade dos fragmentos de adn. 0 aumento do atraso é possível através da adição de BBA tal como descrito acima (ver, por exemplo, Vijg e referências aí citadas para técnicas conhecidas de electroforese de ácidos nucleicos a duas (2) dimensões, às quais o presente método pode ser aplicado). 53 ΕΡ Ο 796 344 /ΡΤ
Os seguintes Exemplos são proporcionados para orientar melhor os peritos na arte nos métodos da prática deste invento. As técnicas de ADN recombinante padrão são divulgadas em Sambrook, Fritsch e Maniatis "Molecular Cloning: A Laboratory Manual", 2a Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989, e textos mais recentes não são divulgados uma vez que estes estão agora bem dentro dos conhecimentos de uma pessoa competente na matéria.
Exemplo 1 - Preparação dos PNA e Marcação dos PNA Ácidos nucleicos sonda, PNA, podem ser preparados por meios bem conhecidos na arte. Assim, PNA polinucleotidicos de cadeia simples de sequência definida podem ser preparados através de síntese química de fase sólida de acordo com Merrifield. Os PNA podem ser preparados através de síntese automática utilizando tecnologia comercialmente disponível, tal como resinas e máquinas produzidas ou comercializadas por Applied Biosystems, ABI, ou outros fabricantes. Alternativamente, através de métodos de ADN recombinante conhecidos, determinadas sequências de PNA são sintetizadas in vivo, por exemplo, através de clonagem de um PNA dúplex num vector que se possa replicar em E. coli, podem ser preparadas grandes quantidades de PNA dúplex. Os multímeros do PNA podem ser clonados no vector de forma a que para cada mole de vector são libertadas várias moles de PNA após digestão do vector com um fragmento de restrição a flanquear a sequência do PNA. Subsequente à síntese ou à produção recombinante, os PNA são purificados através de métodos bem conhecidos na arte tais como através de electroforese em gel ou cromatografia líquida de alta pressão (HPLC). Se o PNA for produzido como um dúplex, antes da utilização num ensaio de hibridação para detecção das sequências de ácido nucleico alvo, as cadeias do PNA são separadas através de aquecimento ou de outros métodos conhecidos na arte. A sequência específica de bases no PNA é escolhida para reflectir a sequência a detectar num TNA, com a condição de que, de acordo com este invento, o PNA contenha uma sequência de 1/2 BBR, que é uma que após hibridação do PNA e TNA forma uma TBR. Uma vez que existe um número essencialmente ilimitado de tais sequências conhecidas na arte, a escolha da sequência 54 ΕΡ Ο 796 344 /ΡΤ do ΡΝΑ é passível de selecção pelo perito na arte para uma dada aplicação. A sequência da LTR de HIV é uma sequência tal que após hibridação das porções de codificação de um PNA da LTR com os TNA codificando a LTR de Hiv, formará tbr capazes de se ligar às proteínas de ligação ao ADN NF-kB e SPl.
Para além das sequências que formarão uma TBR após hibridação, o PNA pode também conter uma 1/2 BBR. Esta sequência é uma que, após hibridação com um ácido nucleico de reforço, BNA, forma uma BBR que é capaz de se ligar a uma BBA. A BBA é de preferência uma proteína de ligação ao ADN possuindo elevada afinidade para a sequência da BBR.
Neste exemplo particular, a hibridação entre um PNA possuindo como 1/2 TBR, SEQ ID NO:4, e na extremidade 3' dessa sequência, uma sequência de 1/2 BBR mostrada como SEQ ID NO:35. 0 PNA codificando estas sequências é utilizado sem marcação ou é marcado com um isótopo radioactivo tal como P32, S35 ou um isótopo semelhante, de acordo com métodos conhecidos na arte. Alternativamente, o PNA é ligado a uma esfera de entre 0,01 a 10 pm, que pode ser colorida para facilidade de detecção visual. Este marcador forma o OSA tal como descrito no fascículo. Esta sonda híbrida com as sequências da LTR de HIV para formar uma TBR que se liga a NF-kB. Adicionalmente, o PNA híbrida com BNA possuindo uma 1/2 BBR complementar para formar um operador esquerdo do bacteriófago lambda que se liga a cro ou a proteínas repressoras de lambda.
De um modo semelhante ao descrito acima, são utilizados PNA em que a 1/2 TBR é qualquer uma de SEQ ID NO:5 ou SEQ ID NO: 7-34, e uma 1/2 BBR tal como SEQ ID NO:35 ou SEQ ID NO:36 está na extremidade 3' ou 5' da 1/2 TBR.
Exemplo 2 - Preparação e Marcação de BNA
De forma semelhante aos métodos descritos no Exemplo 1 para preparação e marcação de PNA, os BNA são preparados e marcados de acordo com métodos conhecidos na arte. Tal como descrito na Patente U.S. 4 556 643, aqui incorporada por referência (ver particularmente o Exemplo 1), as sequências de ácido nucleico codificando sequências de ligação ao ácido nucleico particulares podem ser produzidas em massa através de 55 ΕΡ Ο 796 344 /ΡΤ clonagem num vector replicável. Para além disso, de forma semelhante a essa divulgação, as sequências de 1/2 TBR e de 1/2 BBR podem ser co-linearmente produzidas deste modo, no entanto, com a distinção de que, de acordo com o presente invento, a sequência de 1/2 TBR forma ela própria um local de reconhecimento do componente de ligação ao ácido nucleico e a 1/2 BBR, ao mesmo tempo que forma um local de reconhecimento do componente de ligação ao ácido nucleico, proporciona também um meio de amplificar o sinal produzido após a ligação da 1/2 TBR a sequências complementares no TNA proporcionando polimerização de BNA sobre o TNA ligado ao PNA. Para permitir isto, é proporcionada uma sequência tal como SEQ ID NO:35, que codifica o operador esquerdo do bacteriófago lambda, com sequências adicionais de modo a que seja criada uma sequência solta numa ou em ambas as extremidades do BNA após hibridação com o PNA.
Como exemplo especifico, a polimerização vectorial dos BNA sobre um TNA é proporcionada através de SEQ ID NO:40-43. Neste exemplo, SEQ ID NO:40 codifica duas 1/2 TBR que hibridarão com duas 1/2 TBR num TNA para formar dois locais de ligação de NF-kB, enquanto que ao mesmo tempo proporciona uma 1/2 BBR do operador esquerdo do bacteriófago lambda, que é adicionalmente terminada na extremidade 3' com o local de reconhecimento para a enzima de restrição PstI. A adição do BNA, SEQ ID NO: 41, com a 1/2 BBR complementar à 1/2 BBR do PNA, SEQ ID NO:40, completa a BBR enquanto que ao mesmo tempo completa o local de reconhecimento PstI, deixando uma extremidade solta de quatro bases para hibridação com BNA adicionais. Concordantemente, é adicionada SEQ ID NO:42 que possui uma sequência de quatro pares de bases na extremidade 3' que é complementar à extremidade solta de quatro bases restante da hibridação de SEQ ID NO:40 e 41. Adicionalmente, é proporcionada SEQ ID NO:42 com uma sequência de cinco bases na sua extremidade 5' que faz parte de um local de reconhecimento BamHI. O polimero em crescimento de BNA é ainda prolongado através da adição do BNA de SEQ ID NO:43 que é complementar a SEQ ID NO:42, completando a BBR ao mesmo tempo que completa o local de reconhecimento BamHI e deixa uma extremidade solta de quatro bases que pode ainda hibridar com BNA possuindo sequências complementares. Deste modo, os BNA podem ser 56 ΕΡ Ο 796 344 /ΡΤ hibridados extensamente de modo a amplificar grandemente o sinal de um único acontecimento de hibridação PNA-TNA.
Tal como com os PNA descritos no Exemplo 1, os BNA podem ser utilizados numa forma não marcada ou podem ser marcados de acordo com métodos conhecidos na arte e descritos no Exemplo 1. Será também apreciado que, em vez de se produzir o polímero de BNA através da adição sequencial de BNA ao complexo PNA-TNA, o polímero de BNA pode ser pré-formado e adicionado directamente ao complexo PNA-TNA. Um método simples para pré-formação de um tal polímero de BNA inclui a produção recombinante de um vector no qual são proporcionados multímeros do BNA com um único local de restrição em cada extremidade do polímero. Este polímero de BNA contendo múltiplas BBR é cortado do vector e híbrida com uma 1/2 BBR de cadeia simples que permanece no PNA após a hibridação do PNA com o TNA. Isto é alcançado proporcionando uma sequência de cadeia simples no PNA complementar a uma extremidade solta produzida no polímero de BNA quando é excisado do vector de produção.
Exemplo 3 - Produção de HNA e Sua Utilização para Protecção de Polímeros de BNA
Os HNA deste invento são produzidos de acordo com métodos conhecidos na arte para produção de polinucleótidos tal como descrito nos Exemplos 1 e 2 para PNA e BNA. No entanto, na produção dos HNA a sequência do HNA é especif icamente desenhada para que uma porção substancial do HNA forme um palindroma auto-complementar para formar um "gancho de cabelo", enquanto que ao mesmo tempo, deixa numa forma de cadeia simples suficientes bases para ser capaz de hibridar com sequências de cadeia simples na cadeia crescente de BNA descrita no Exemplo 2.
Neste Exemplo é proporcionado um HNA de SEQ ID NO:44 para rematar a extensão de BNA no PNA no Exemplo 2 após a adição do BNA, SEQ ID NO:43. Isto é alcançado porque SEQ ID NO:44, para além de possuir uma sequência palindrómica que forma um "gancho de cabelo" estável possui também uma sequência na extremidade 5' do HNA que completa a sequência de BamRI formada através da hibridação de SEQ ID NO:42 e SEQ ID NO:43. 57 ΕΡ Ο 796 344 /ΡΤ
Naturalmente, a terminação do polímero após a adição de apenas 3 BNA é para fins de simplicidade na demonstração do presente invento. Tal como descrito acima, esta polimerização pode ser continuada essencialmente de forma indefinida para amplificar o sinal do acontecimento de hibridação PNA-TNA.
Exemplo 4 - Preparação de TBA e BBA, Marcação e Imobilização Destes
As TBA e as BBA que podem ser utilizadas de acordo com o presente invento incluem qualquer substância que se possa ligar de modo específico às TBR e BBR formadas através de hibridação dos PNA, TNA e BNA. A utilização de proteínas de ligação ao ADN forma um exemplo de tais substâncias.
Para este exemplo, a TBA é o dímero da porção de ligação ao ADN de p50, e a BBA é a proteína cro de lambda. Estas proteínas podem ser produzidas de acordo com métodos conhecidos na arte. Os genes para ambas estas proteínas foram clonados. Assim, estas proteínas são produzidas de forma recombinante e purificadas de acordo com métodos conhecidos na arte. Para além disso, estas proteínas são marcadas, com um radioisótopo, tal como iodo radioactivo, ou com uma enzima, tal como beta-galactosidase ou peroxidase de rábano, ou com um corante fluorescente tal como fluoresceína ou rodamina, de acordo com métodos bem conhecidos na arte. Adicionalmente, um ou ambos os TBA e BBA podem ser imobilizados numa superfície sólida tal como a superfície de uma placa de microtítulo ou a superfície de uma esfera, tal como uma esfera colorida de diâmetro entre 0,01 e 10 pm. Os marcadores nos TBA e BBA podem ser os mesmos ou diferentes.
Neste exemplo, o TBA contendo o domínio de ligação ao ADN de p50 dimérico é marcado com rodamina, enquanto que o BBA, cro, é marcado com fluoresceína. Assim, após a hibridação dos PNA, TNA, BNA e HNA tal como descrito nesta divulgação de patente e os antecedentes e seguintes exemplos, os híbridos de ácidos nucleicos, se formados, são colocados em contacto com um excesso de TBA e cro marcados. A fluorescência destes marcadores é medida de acordo com métodos conhecidos e a detecção de ambos os sinais é indicadora da presença de sequências de 1/2 TBR no TNA. O sinal diferencial produzido 58 ΕΡ Ο 796 344 /ΡΤ pela fluorescência da NF-kB e da cro é uma medida do grau ao qual a polimerização dos BNA sobre o híbrido PNA-TBA resultou em amplificação do sinal. Está contemplada uma amplificação de uma a mais de mil vezes de acordo com o método deste invento.
Exemplo 5 - Hibridação de dois PNA com um TNA e Discriminação Entre um TNA e um CNA OS PNA, PNAl, SEQ ID NO: 40 e PNA2, SEQ ID NO: 45, são utilizados num excesso molar de cerca de dez vezes em relação à concentração de TNA numa amostra de teste. Para este exemplo, uma LTR de HIV dúplex isolada, em que uma cadeia da qual possui a sequência SEQ ID NO:37, mostrada na Figura 7, e a outra cadeia da qual é complementar à sequência mostrada na Figura 7, é utilizada como o TNA. É também utilizado neste exemplo um CNA dúplex isolado, do qual uma cadeia possui a mesma sequência que SEQ ID NO: 37 excepto que, no primeiro local de ligação de NF-kB mostrado na Figura 7, no centro da do local de ligação, posição 1 na Figura 7, em vez de um "T" existe um "A", cuja cadeia complementar portanto emparelha erradamente com o PNA de SEQ ID NO:40 nessa localização. SEQ ID NO: 40 e SEQ ID NO: 50 são ambas adicionadas para separar reacções, a primeira contendo o TNA acima descrito e a segunda contendo o CNA acima descrito. As amostras são solubilizadas num tampão de hibridação apropriado, tal como Tris 10 mM (pH 7,5), edta 1 mM. As amostras são aquecidas a cerca de 90°C durante cerca de cinco minutos para separar as cadeias dos tna dúplex e dos CNA nas amostras e depois as amostras são deixadas a arrefecer para permitir que as cadeias dos PNA, TNA e CNA hibridem.
Uma vez completada a hibridação, o que pode ser determinado de acordo com métodos conhecidos tais como através do cálculo de tl/2 com base nas composições de bases e na temperatura de hibridação de acordo com métodos conhecidos, o PNA de SEQ ID NO:40 é polimerizado através da adição de BNA tal como no Exemplo 2 e a sonda PNA2 de SEQ ID NO: 45 é polimerizada com BNA a começar com a extremidade solta de reconhecimento de Sphl. Após a adição dos BNA e de um breve período de hibridação, são adicionadas amostras separadas a esferas revestidas com NF-kB covalentemente imobilizada e a 59 ΕΡ Ο 796 344 /ΡΤ NF-kB é deixada a ligar-se a quaisquer TBR formadas nas amostras de TNA e CNA. Após cerca de 15 minutos de ligação, as amostras foram lavadas duas vezes com cerca de três volumes de um tampão de lavagem apropriado, tal como Tris 10 mM, pH 7,5, NaCl 100 mM ou outro tampão predeterminado para não interferir com NF-kB ou com a actividade de ligação da proteina repressora Cl do bacteriófago lambda. Após cada lavagem, as esferas foram deixadas a assentar sob gravidade ou através de uma breve centrifugação. isto remove quaisquer ácidos nucleicos que não possuam um local de ligação a NF-kB perfeito formado através de hibridação das sequências de PNA1 e TNA.
Após a lavagem final, a proteína repressora Cl do bacteriófago lambda marcada com um isótopo radioactivo, tal como com iodo radioactivo, ou marcada com uma enzima, tal como peroxidase de rábano, com esferas coloridas ou com um marcador fluorescente, é adicionada a cada amostra. As amostras são então lavadas várias vezes (cerca de 3) com vários volumes (cerca de 2) de um tampão de lavagem apropriado tal como Tris 10 mM, pH 7,5, NaCl 100 mM ou outro tampão predeterminado para não interferir com NF-kB ou com a actividade de ligação da proteina repressora Cl do bacteriófago lambda. Após cada lavagem, as esferas foram deixadas assentar sob gravidade ou através de uma breve centrifugação. Após a última vez que se deixa assentar ou a última centrifugação, o marcador ligado é quantificado através da detecção da radioactividade ligada, da cor libertada num ensaio enzimático, da cor das esferas ou da detecção de fluorescência. Alternativamente, pode ser adicionado um anticorpo anti-Ci e efectuado um imunoensaio enzimático em sanduíche ou um radioimunoensaio padrão para detectar o repressor ligado. Adicionalmente, como controlo negativo (fundo) todas as manipulações antecedentes são realizadas em cadeia com uma amostra na qual as esferas são utilizadas sem possuírem NF-kB imobilizada.
Como resultado do ensaio antecedente, as amostras contendo o controlo e o CNA possuem sinais semelhantemente baixos enquanto que a amostra contendo TNA possui um sinal bem acima do fundo. 60 ΕΡ Ο 796 344 /ΡΤ
Exemplo 6 - Estojo de Teste para a Detecção de HIV A. Conteúdo do estojo: 1. Placa de microtítulo. 2. Solução 1 mg/ml de NF-kB produzida de forma recombinante em solução salina tamponada com tris. 3. Tubo contendo PNA de HIV de cadeia simples (uma mistura de oligonucleótidos pré-misturados codificando dois 1/2 locais de ligação de NF-kB, i.e. uma mistura de SEQ ID NO:7 e 8). 4. Tubo contendo PNA genómico humano de cadeia simples, SEQ ID NO:1. 5. Tubo de nuclease {PstI). 6. Tubo de protease. 7. Tubo contendo BNA pré-polimerizados, 100 unidades de repetição de 0R do bacteriófago lambda, rematados com um HNA mas com 1/2 BBR disponíveis para ligação a hibridos PNA-TNA. 8. Tubo de cro conjugada com peroxidase de rábano (hrp). 9. Tubo de substrato colorido de hrp. 10. Solução salina tamponada com tris, 100 ml. 11. Lanceta. 12. Tubos de reacção A, B, C, contendo cada um 250 μΐ de água destilada. 13. Conta-gotas. B. Método de ensaio: a) A placa de microtítulo (item 1) é revestida com a solução de NF-kB produzida de forma recombinante (item 2) a uma concentração de 1 mg/ml em solução salina tamponada com tris de um dia para o outro a 4°C com agitação. b) Obtêm-se três gotas de sangue do sujeito a testar picando um dedo com a lanceta (reagente 11) e é dispensada uma gota para cada tubo de reacção A, B e C (reagente 12). c) Para cada tubo é dispensada uma gota de solução de protease (reagente 6) com o conta-gotas (item 12) e o tubo é agitado e deixado a repousar durante 5 minutos. 61 ΕΡ Ο 796 344 /ΡΤ d) Uma gota de nuclease (item 5) é adicionada a cada um dos tubos A-C utilizando o conta-gotas e os tubos são agitados e deixados a repousar durante 10 minutos. e) Uma gota do item 3 é adicionada ao tubo A (amostra de teste); uma gota de item 4 é adicionada ao tubo B (controlo positivo); e uma gota de solução salina (item 12) é adicionada ao tubo C como controlo negativo. Os tubos são aquecidos a 50°C em água quente e deixados arrefecer à temperatura ambiente durante uma hora. f) Embora se deixe ocorrer a hibridação no passo (d), a proteína em excesso é drenada da superfície e da placa de microtítulo, do passo (a) e a placa é lavada com solução salina tamponada com tris (tubo 10). g) Os conteúdos dos tubos A-C do passo (e) são transferidos para três poços da placa de microtítulo e deixados a repousar durante 1 hora com agitação. h) Os poços de microtítulo contendo os conteúdos dos tubos A-C são lavados com solução salina tamponada com tris e esvaziados. i) É adicionada uma gota de item 7 a cada poço e deixa-se hibridar com quaisquer locais 1/2 BBR ligados à placa, durante uma hora, seguido de três lavagens com solução salina tamponada com tris . j) É adicionada uma gota de item 8 a cada poço e deixa-se a cro ligar a quaisquer BNA ligados durante 10 minutos, seguido de cinco lavagens de 1 ml com solução salina tamponada com tris. k) É adicionada uma gota de substrato de hrp a cada poço e deixa-se revelar a cor. C. Resultados:
Se os poços A e B mostrarem ambos revelação de cor e o poço C não, o teste é válido e o sujeito foi infectado com HIV. Se apenas o poço A apresentar revelação de cor ou se o poço C apresentar revelação de cor, o teste foi efectuado incorrectamente e é inválido. Se os poços A e C não apresentarem revelação de cor mas o B sim, o teste é válido e o indivíduo não foi infectado com HIV. 62 ΕΡ Ο 796 344 /ΡΤ
Exemplo 7 - Produção de Vários Novos TBA
Novos TBA para utilizar de acordo com o presente invento são preparados como se segue: a) NFkB/NF-kB (Hiv-Detect I). Um ácido nucleico codificando qualquer uma de SEQ ID NO:63-71 ou uma proteína de ligação ao ADN semelhante a NF-kB, é fundido, enquadrado, com uma sequência nucleotídica codificando uma sequência de montagem, tal como cro, de modo a que a sequência de reconhecimento do ADN de NF-kB seja codificada no terminal amino ou carboxilo da sequência de cro. Opcionalmente, é proporcionada uma sequência ligante entre a sequência de NF-kB e a sequência de cro. No outro terminal de cro é opcionalmente proporcionada uma sequência sinal de localização nuclear, tal como SEQ ID NO:72. Mais, são opcionalmente proporcionadas sequências de assimetria no terminal de cro não utilizado pela sequência de reconhecimento de NF-kB. Exemplos de TBA completos são mostrados abaixo. b) NF-kB/SPl (HIV-Detect II) . De um modo semelhante ao descrito em (a) acima, é preparada uma sequência de codificação recombinante codificando um domínio de reconhecimento de NF-kB. Numa construção separada, em vez de SEQ ID NO:63-72, é incluída a sequência de codificação para a porção de reconhecimento do ADN de SP1. Uma tal sequência deve codificar toda ou uma parte funcional de SEQ ID NO:73, que é a porção do factor de transcrição SP1 que exibe ligação ao ADN (ver Kadonaga et al., Cell 51: 1079-1090, 1987). O vector codificando NF-kB e o vector codificando SPl são então co-transfectados num sistema de expressão apropriado tal como é bem conhecido na arte. Uma unidade de reconhecimento de NF-kB monomérica é adicionada para completar o dímero de reconhecimento de NF-kB após a montagem das unidades de reconhecimento de SPl e NF-kB pelo acompanhante. As sequências de assimetria impedem a formação de dímeros de NF-kB ou SPl e dirigem, por sua vez, a formação de heterodímeros NFkB-SPl (i.e., HIV-Detect II), que são então isolados do sistema de expressão (células de mamífero ou bacterianas) através de métodos conhecidos. 63 ΕΡ Ο 796 344 /ΡΤ c) ΤΒΑ de SP1/SP1 (HIV-Detect III). Tal como descrito em (b) acima, é preparada uma construção de TBA codificando SPl. No entanto, apenas esta construção é transfectada para o sistema de expressão e estão incluídas as sequências de assimetria que permitem a formação de dímeros SP1-SP1. d) SPl-TATA (HIV-Detect IV) . Tal como descrito em (b) acima, é produzido um recombinante de TBA codificando SPl. Adicionalmente, é preparado um recombinante codificando um TBA possuindo a sequência de ligação SEQ ID NO:74 ou uma sequência semelhante codificando uma unidade de reconhecimento TATA com sequências de assimetria complementares às incluídas na construção codificando TBA de SPl. Estas construções são co-transfectadas e os heterodímeros isolados através de métodos padrão, incluindo purificação de afinidade numa coluna de ADN possuindo as regiões de ligação ao alvo SPl-TATA apropriadas. e) SP1-E2 (HPV-Detect I). Uma construção codificando SPl é preparada tal como em (b) acima. Uma construção codificando um TBA de E2 é preparada através da utilização de uma sequência codificando qualquer uma de SEQ ID NO:75-84 e 94-98 que são unidades de reconhecimento do ADN de E2 (ver Hedge et al., Nature 359: 505-512, 1992) ou unidades de reconhecimento semelhantes, é preparada e co-transformada ou co-transfectada com a construção codificando o TBA de SPl. A unidade de reconhecimento de E2 monomérica é adicionada ao dímero de reconhecimento de E2 completo após a montagem da unidade de reconhecimento de E2-SP1 pelo acompanhante. O heterodímero HPV-Detect I é isolado de acordo com métodos conhecidos. f) E2-E2 (HPV-Detect II). Tal como descrito acima em (e), é preparada uma construção codificando TBA de E2, excepto que são incluídas sequências de assimetria que permitem a formação de dímeros de E2. Os dímeros expressos são então isolados através de métodos conhecidos incluindo afinidade para um local de ligação de E2 dimérico numa coluna de afinidade de ADN. g) E2-TATA (HPV-Detect III) . Tal como descrito acima em (e) e (d), são preparados TBA de ligação de E2 e TATA (respectivamente), excepto que são incluídas sequências de assimetria que aumentam a formação de heterodímeros em vez de 64 ΕΡ Ο 796 344 /ΡΤ homodímeros. Estas construções são então co-expressas e os heterodímeros são isolados. h) TATA-TATA (HPV-Detect IV) . Tal como descrito acima em (a) e (d), é preparada uma construção codificando TBA de ligação a TATA utilizando sequências de assimetria que favorecem a formação deste homodímero e o homodimero é isolado. i) Outros TBA. Tal como descrito acima para os TBA de HIV e HPV, TBA para qualquer dado patogénio ou estado de doença podem ser produzidos através da identificação de proteínas de ligação ao ADN específicas e da formação de uma construção de expressão utilizando sequências ligantes, de montagem e de assimetria apropriadas.
Exemplo 8
De um modo semelhante ao do ensaio descrito no Exemplo 5, é produzido um ensaio mais rigoroso através da utilização da proteína de ligação NF-kB-SPl dúplex preparada de acordo com o Exemplo 6. Assim, as sondas mostradas na Figura 7 e utilizadas no Exemplo 5 podem ser alongadas para reduzir a distância inter-sondas e deste modo reduzir a flexibilidade do ADN no TNA.
Exemplo 9 - Produção de TBA de "Ordem Superior"
Através da utilização apropriada de sequências de assimetria, são produzidos TBA que são dimeros, trímeros, tetrâmeros, pentâmeros ou hexâmeros de determinadas unidades de reconhecimento de ADN. Deste modo, é produzido um TBA hexamérico através da produção de um primeiro TBA dimérico de p50 de NF-kB utilizando sequências de assimetria que permitem a formação do dímero. Adicionalmente, as sequências de assimetria permitem a tetramerização do dímero de p50 com um dímero SPl-SPl. Finalmente, sequências de assimetria adicionais dirigem a hexamerização com um dímero exibindo sequências de localização nuclear. Isto é alcançado através da incorporação, por exemplo, de sequências de assimetria de insulina, que na natureza forma hexâmeros. Esta formação de hexâmeros é dirigida pelas sequências SEQ ID NO:85 (A) e 65 ΕΡ Ο 796 344 /ΡΤ 86 (Β), 87 (A) e 88 (Β), 89 (A) e 90 (Β), e 91 (A) e 92 (Β) (ver Figuras 13 e 14).
Devido à afinidade extremamente elevada para a LTR de hiv que pode ser gerada utilizando um TBA multimérico, os compostos possuindo esta estrutura e que podem ser utilizados para este fim são aqui referidos como "HIV-Lock".
Um HIV-Lock óptimo é definido por “footprinting" (de acordo com métodos bem conhecidos na arte) de TBA ligados a TBR na LTR de HIV para confirmar que a afinidade de ligação de cada proteína de ligação ao ADN que contribui para a formação do complexo multimérico de TBA é diminuída relativamente à afinidade de qualquer sequência alvo natural (i.e. CNA) da qual a unidade de reconhecimento de ligação ao ADN do TBA é derivada. Qualquer perda concomitante na afinidade de ligação para as TBR de HIV é mais do que compensada após a formação do multímero tal como descrito abaixo.
Pode haver competição entre a ligação de cada TBA componente pela sua TBR e montagem, através das sequências de assimetria para formar o multímero. Isto é evitado ajustando os ligantes entre as sequências de acompanhamento e de assimetria em cada componente do TBA de modo a que estes acontecimentos de competição estejam desacoplados. A redução resultante na dimensionalidade da difusão (eficaz aumento da concentração) para os componentes de assimetria e de montagem do TBA resulta na formação eficiente do complexo multimérico.
Com base no "footprinting", o comprimento e a composição dos ligantes são ajustados para alcançar uma discriminação óptima entre as sequências de HIV alvo e as sequências naturais. Deste modo, embora cada TBA componente terá baixa afinidade para as sequências de CNA e TBR, o complexo multimérico terá uma afinidade extremamente elevada para a TBR agora expandida reconhecida pelo complexo multimérico (o quadrado da afinidade de cada TBR reconhecida por cada TBA componente do TBA multimérico), ao mesmo tempo que possui ainda uma baixa afinidade para os CNA. Do mesmo modo são preparados outros complexos multiméricos de TBA, para além do HIV-Lock. 66 ΕΡ Ο 796 344 /ΡΤ
Os ΤΒΑ que podem ser formados deste modo incluem as seguintes sequências, que são montadas através da ligação de subunidades proteicas ou sequências de ácidos nucleicos codificando estas subunidades, como se segue:
Conjunto A B C
Ligar as Sequências dos Grupos i + II + III IV + V + III IV + III em que os grupos I-V consistem em sequências seleccionadas de entre:
Grupo Seleccionado de entre as Sequências I Qualquer uma de SEQ ID NO:85-92
II Met Ser, ligada a qualquer uma de SEQ ID
NO :104-106, cada uma das quais é ligada a SEQ ID NO: 99
III SEQ ID NO: 100 ligada a qualquer uma de SEQ ID
NO: 75-84 ou 94-98; SEQ ID NO: 101 ligada a SEQ ID
NO:74 ou SEQ ID NO:93; ou SEQ ID NO:102 ligada a SEQ ID NO:74 ou SEQ ID NO:93; ou qualquer uma de SEQ ID NO:72, 103, 73 ou 63-71. IV Qualquer uma de SEQ ID NO:104-106. V SEQ ID NO:99.
Exemplos específicos de tais TBA são SEQ ID NO:109-106, montadas como se segue:
Ligar SEQ IDS. Ser + 104 + 99 + 100 + 94 Ser + 104 + 99 + 72 Ser + 105 + 99 + 102 + 74 Ser + 106 + 99 + 73 Ser + 106 + 99 + 63
Conjunto SEQ ID NO. A 109 85 + Met A 110 85 + Met A 111 86 + Met A 112 86 + Met A 113 89 + Met C 114 106 + 64 C 115 105 + 64 B 116 106 + 99 + 73
Deste modo, escolhendo entre sequências de assimetria, sequências de montagem e unidades de reconhecimento do ADN 67 ΕΡ Ο 796 344 /ΡΤ apropriadas, podem ser formados muitos TBA diferentes. Para além disso, conjuntos destes, tais como SEQ ID NO:114 e 115, associar-se-ão uns aos outros mas não se formarão dimeros de SEQ ID NO:114 ou 115 devido à repulsão de cargas nas sequências de montagem mutadas (SEQ ID NO: 104 é cro; SEQ ID NO: 105 é uma nova cro mutada, carregada negativamente, e SEQ ID NO:106 é uma nova cro mutada, carregada positivamente).
Naturalmente, dada a sequência de aminoácidos destes TBA, um vulgar perito na arte pode produzir clones de ácidos nucleicos recombinantes codificando-as e tais clones recombinantes formam naturalmente uma parte integral deste invento.
Exemplo 10 - Teste de HIV Utilizando "HIV-Lock"
Praticamente como no método utilizado no Exemplo 6, o "HIV-Lock" produzido de acordo com o Exemplo 9 é utilizado como TBA, reagente 2, com resultados semelhantes.
Exemplo 11 - Teste de HIV Utilizando "HIV-Lock" Quando se
Testa Sangue para Doação
Quando a quantidade de sangue a testar não é limitante, tal como quando se testam amostras de sangue para doação quanto a contaminação por HIV, são realizados testes semelhantes aos do Exemplo 6, mas para cada um dos tubos A-C, são sedimentados cerca de 5 ml de sangue numa centrífuga de bancada. Os outros reagentes são proporcionais conforme o necessário para manusear a maior quantidade de TNA presente na amostra.
Exemplo 12 - "HIV-Lock" como Agente Terapêutico Anti-HIV O "HIV-Lock" produzido de acordo com o Exemplo 9 é formulado como uma solução 1 mg/ml em lipossomas e injectado intravenosamente num sujeito que foi testado e confirmado estar infectado com HIV. Uma dose de cerca de 0,1 mg a 100 mg de "HIV-Lock"/quilograma de massa corporal é infundida durante um período de vinte e quatro horas e é monitorizada a concentração de p24 de HIV no soro do paciente. O tratamento é 68 ΕΡ Ο 796 344 /ΡΤ repetido tão frequentemente conforme o necessário tal como quando ocorrem elevações na p24 sérica.
Exemplo 13 - Utilização de uma Construção de TBA de hiv como Terapêutico
Um vector retroviral recombinante ou semelhante é utilizado para distribuir uma construção codificando um TBA de ligação à ltr de hiv a um paciente infectado. 0 vector codifica um acompanhante, tal como cro, e sequências de ADN para porções de ligação de p50. 0 mesmo vector codifica também um acompanhante no qual se dobra um TBA de SPl. São proporcionadas sequências de assimetria de modo que após a co-expressão do TBA de p50 e do TBA de SPl numa única célula infectada com HIV in vivo, ocorre uma associação imediata entre estes TBA, ao mesmo tempo que se impede qualquer associação entre a porção de ligação ao ADN de p50 e monómeros endógenos de p50 ou p65. São também proporcionadas sequências NLS nos TBA de modo a que, após a formação dos dimeros, o TBA se re-localize imediatamente no núcleo da célula e se ligue especificamente às sequências de HIV integradas, impedindo assim qualquer transcrição a partir desse locus.
Para este fim, é desejável seleccionar sequências codificando domínios de ligação ao ADN de modo a que os monómeros expressos sejam montados num TBA que não se ligue a sequências humanas naturais. Assim, é apenas após a ligação dos componentes do TBA às suas sequências alvo que a associação entre todos os componentes do TBA ocorre para formar um complexo que se liga fortemente e especificamente à LTR de HIV.
Exemplo 14 - Estojo de Teste de Diagnóstico para Vírus do Papiloma Humano
Este diagnóstico para o vírus do papiloma humano tira vantagem do diferencial conhecido entre HPV benigno e carcinogénico para proporcionar um teste que indica a susceptibilidade à malignidade num paciente. Os vírus do papiloma são um grupo de pequenos vírus de ADN associados a tumores de células epiteliais escamosas benignos nos vertebrados superiores. Foram verificados pelo menos 27 tipos 69 ΕΡ Ο 796 344 /ΡΤ humanos distintos de vírus do papiloma (HPV); muitos destes foram associados a lesões clínicas específicas. Quatro destes, HPV-6, HPV-11, HPV-16, HPV-18 e HPV-33 foram associados a lesões do tracto genital humano. Em geral, os ADN de HPV-β e HPV-11 foram verificados estar associados a lesões benignas do tracto genital. HPV-16, HPV-18 e HPV-33 foram também verificados estar associados a lesões pré-malignas e malignas e são transcritos na maioria das linhas celulares estabelecidas a partir de carcinomas cervicais. É provável que HPV-16, HPV-18 e HPV-33 sejam apenas dois membros de um grande conjunto de ADN de HPV associados a carcinomas cervicais humanos malignos.
Modelos animais mostraram que lesões benignas do vírus do papiloma podem progredir para lesões malignas na presença de um co-carcinogénio. 0 ADN de HPV foi verificado em metástases de carcinomas cervicais. Em lesões cervicais malignas, o ADN de HPV está habitualmente integrado no genoma humano, mas pode também estar presente ADN de HPV extracromossómico. A integração de HPV para formar o pró-vírus resulta habitualmente na destruição do enquadramento de leitura aberto (ORF) de E2. Apesar da destruição do ORF de E2, o exame de linhas celulares de vários carcinomas cervicais mostrou HPV-16 e HPV-18 transcricionalmente activos e integrados. Quando os genomas de HPV-16 que estão presentes nas linhas celulares de carcinoma cervical humano SiHa e CaSki são examinados, há diferenças verificadas na integração de HPV-16. Na linha SiHa, a integração única do genoma de HPV-16 ocorreu nas bases 3132 e 3384, destruindo os ORF de El e E2 com uma deleção de 0,3 kb. Uma deleção adicional de 50 pares de bases do ADN de HPV-16 resultou na fusão dos ORF de E2 e E4. A porção 5' do ADN de HPV-16, que consiste no ORF de E2 destruído, é ligada a sequências flanqueadoras à direita humanas contínuas. Adicionalmente, é detectada uma única guanina adicional no nucleótido 1138 no meio do ORF de El. Esta adição de um par de bases resulta na fusão dos ORF de Ela e Elb num único ORF de El. O genoma completo de HPV-16 está disponível em GenBank com o número de acesso K02718; o genoma completo de HPV-33 está disponível em GenBank como número de acesso M12732; o 70 ΕΡ Ο 796 344 /ΡΤ genoma completo de HPV-18 está disponível em GenBank como número de acesso X05015.
Como pesquisa preliminar, o facto de uma infecção de HPV ser estabelecida para uma dada amostra de biopsia cervical através de uma simples análise de tipo "sim/não" utilizando, por exemplo, qualquer um ou todos os PNA SEQ ID NO:46-53 e um TBA de E2 tal como descrito acima (i.e., fragmentar o ADN, ligar ao pna, imobilizar com o TBA e detectar o sinal com BNA e BBA).
Uma vez a biopsia se verifique positiva para HPV, obtém-se informação adicional quanto à potencial malignidade do HPV através da análise do estado de integração do vírus no genoma humano. 1. Fragmentar o ADN na amostra da biopsia cervical e hibridar com uma sonda de bloqueio possuindo a sequência SEQ ID NO:60. Esta sonda ligar-se-á a todos os fragmentos no ADN que não foram removidos do fragmento de 0,3 kb. 2. Expor o ADN da amostra da biopsia a um PNA possuindo a sequência SEQ ID NO:61. Esta sonda ligar-se-á apenas a fragmentos que foram suprimidos do fragmento de 0,3 kb (a sonda de bloqueio impedirá a formação de uma volta dos grandes segmentos de deleção se presentes).
3. Um PNA possuindo SEQ ID NO:62 é hibridado com SEQ ID NO:41 para formar uma BBR que se ligará a cro ou ao repressor Cl de λ como BBA, deixando uma porção de cadeia simples capaz de hibridar com o local TATA em SEQ ID NO:61. Este foi adicionado para formar uma TBR na extremidade 5' da grande deleção. 4. A TBR é imobilizada por um TBA possuindo uma unidade de reconhecimento do ADN da proteína de ligação a TATA. 5. Os fragmentos ligados são detectados através da adição de BNA e BBA tal como descrito acima. A detecção do sinal neste ensaio indica que o fragmento grande está suprimido no HPV presente no TNA. Uma vez que esta 71 ΕΡ Ο 796 344 /ΡΤ deleção se correlaciona com malignidade, este ensaio proporciona uma perspectiva sobre o potencial de malignidade da infecção de HPV. Esta conclusão pode ser confirmada através da realização de um ensaio análogo com base na deleção do fragmento de 52 pares de bases que também se correlaciona com malignidade induzida por HPV. A unidade de reconhecimento de TBP utilizada no TBA para este ensaio pode ser escolhida, por exemplo, a partir de uma sequência tal como SEQ ID NO:70 ou SEQ ID NO:93.
Exemplo 15 - Produção de HlV-Lock™ Recombinante
Fase Um - Preparação de ADN para Produzir o HlV-Lock™. É efectuada mutagénese in vitro das regiões de codificação dos componentes de ocorrência natural e clonados do HIV-Lock™ que necessitam ser modificados com um estojo MutaGene Phagemid. O protocolo modificado inclui a utilização de um plasmídeo Blue-script contendo cada um dos componentes de ligação de HIV-Lock™. Estes são transformados para células competentes e os fagemideos contendo uracilo são criados. O ADN de cadeia simples é extraído e utilizado como molde para a cadeia mutagénica. Oligonucleótidos contendo as mutações desejadas, incluindo a incorporação de um novo local de restrição, são sintetizados e tratados com polinucleótido-quinase e ATP. Os oligonucleótidos tratados com a quinase são hibridados com o molde de cadeia simples e a cadeia mutagénica é sintetizada e ligada de acordo com o protocolo MutaGene, com a excepção de que Sequenase 2.0 proporciona a polimerase. As bibliotecas são pesquisadas utilizando nucleótidos marcados nas extremidades com g-32P contendo sequências complementares às mutações introduzidas e através de isolamento do ADN plasmídico e identificação dos mutantes através da presença do local de restrição introduzido. As mutações são também confirmadas através de sequenciação com um estojo Sequenase. O ADN de HIV-Lock™ é clonado no sistema de expressão de baculovírus com um promotor de poliedro.
Fase Dois - Produção de Proteínas HlV-Lock™ Utilizando Baculovírus. Células Sf-9 são cultivadas até uma densidade predeterminada (cerca de lxlO6 células/ml, fase logarítmica), infectadas com o baculovírus contendo as instruções de HIV- 72 ΕΡ Ο 796 344 /ΡΤ
Lock™ θ colhidas para recuperar as proteínas recombinantes compreendendo o HIV-Lock™. No processo de ampliação, as culturas são expandidas de balões para garrafas e subsequentemente para biorreactores. Após infecção as células são colhidas às 12, 24, 36 e 48 horas pela proteína. Os índices de viabilidade são monitorizados ao longo de todo o processo.
Fase Três - Purificação das Proteínas HIV-Lock™. As proteínas colhidas são primeiro separadas dos particulados através de ultracentrifugação de fluxo para facilitar a purificação a jusante. 0 produto centrifugado é então filtrado para esterilização. Os extractos são então centrifugados a 40 000 rpm a 4°C durante 30 minutos e as alíquotas são imunoprecipitadas com anticorpo policlonal de coelho contra um dos componentes de HIV-Lock . As proteínas imunoprecipitadas são corridas numa gel de SDS-PAGE a 10%.
Fase Quatro - Teste das Proteínas HIV-Lock™ Contra ADN de HIV. Os ensaios de mudança de mobilidade são realizados utilizando uma sonda oligonucleotídica compreendendo elementos da repetição terminal longa de HIV e fragmentos contendo NFKB que se liga a ADN associado à cadeia leve capa e a regulação de microglobulina. O oligonucleótido é hibridado com a sua cadeia complementar e marcado na extremidade com ATP g- P. O "footprinting" é alcançado combinando uma pequena quantidade (1CT15 M) de ADN da LTR de HIV radiomarcado com uma quantidade ligeiramente maior de HIV-Lock num tampao a temperatura ambiente durante 10 minutos. O ditiotreitol é adicionado antes da adição da proteína. São adicionados ferro (II), EDTA, peróxido de hidrogénio e ascorbato de sódio e a mistura reaccional é incubada. É adicionado um agente de extinção e os produtos são analisados utilizando electroforese em gel desnaturante. Isto é feito para diferentes concentrações de proteína. O gel resultante é visualizado utilizando um digitalizador "Phosphoimager" e o ficheiro de imagem de elevada resolução resultante é analisado para calcular a afinidade de ligação de HIV-Lock™ para o ADN de HIV relativamente ao ADN celular. 73 ΕΡ Ο 796 344 /ΡΤ
Pode ser utilizado desenho múltiplo e interacções de teste para refinar a ligaçao de HlV-Lock e outros TBA para HIV e outros organismos. Este processo torna possível desenhar conjuntos de ligação de modo a que o conjunto de ligação não seja competitivo com as proteínas de tipo selvagem para locais de ligação únicos nas amostras de genoma. O desenvolvimento de TBA para outros organismos e de TNA para sequências dentro destes organismos pode ser feito utilizando o método acima mencionado. Este método é válido quando a produção de conjuntos de ligação para todas as TBR de ácidos nucleicos incluindo híbridos ADN-ADN, ADN-ARN e ARN-ARN e combinações destes híbridos.
Exemplo 16 - Método para identificação de moléculas de ligação a ácidos nucleicos para produção de TBA e BBA do presente invento:
No método deste invento, os conjuntos de ligação ao alvo e os conjuntos de ligação de reforço são montados através da identificação de moléculas de ligação ao ácido nucleico, e da ligação das porções de ligação ao ácido nucleico das moléculas de modo a alcançar TBA que discriminam entre determinadas sequências alvo e até sequências intimamente aparentadas. Um método para identificação das moléculas de ligação ao ácido nucleico envolve os seguintes passos: 1. Obtenção de uma amostra biológica contendo o ácido nucleico alvo. Esta pode ser por exemplo, um organismo ou um extracto de tecido infectado com um patogénio. 2. Fragmentação da amostra de modo a expor os ácidos nucleicos e a reduzir a complexidade do tamanho do ácido nucleico contido na amostra. 3. Colocação de uma primeira alíquota dos ácidos nucleicos fragmentados em contacto com um meio tampão de controlo e colocação de uma segunda alíquota de ácidos nucleicos fragmentados em contacto com o meio tampão de controlo contendo um perfil conhecido de moléculas de ligação ao ácido nucleico. 4. Análise das duas alíquotas para identificar fragmentos que possuam um comportamento alterado na alíquota em contacto com as moléculas de ligação ao alvo em oposição à alíquota de controlo. Isto é alcançado através de 74 ΕΡ Ο 796 344 /ΡΤ electroforese em gel de uma dimensão, electroforese em gel de duas dimensões, cromatografia liquida de alta resolução, cromatografia em papel ou através de outros meios que revelem um comportamento diferente dos fragmentos de ácido nucleico quando ligados a uma molécula de ligação ao ácido nucleico em oposição a quando o fragmento de ácido nucleico não está ligado. 5. Identificação e isolamento de fragmentos que exibem um comportamento alterado quando colocados em contacto com a molécula de ligação ao ácido nucleico e sequenciação do fragmento de ácido nucleico para determinar se os motivos da molécula de ligação ao ácido nucleico conhecidos estão presentes, ou identificação directa da molécula de ligação ao ácido nucleico ligada ao ácido nucleico. A última pode ser alcançada, por exemplo, através do contacto de uma grelha bidimensional dos ácidos nucleicos sujeitos a electroforese com anticorpos marcados diferencialmente que se ligam às várias moléculas de ligação ao ácido nucleico.
Neste método, de preferência os motivos do ácido nucleico são utilizados para fins diagnósticos ou terapêuticos em que o ácido nucleico alvo possui mais de um alvo molécula de ligação ao ácido nucleico utilizável. Deste modo, pode ser gerado um conjunto de ligação ao alvo complexo que tira vantagem da proximidade de diferentes motivos moleculares de ligação ao ácido nucleico para aumentar a especificidade do TBA montado a partir dos componentes de ligação ao ácido nucleico individuais identificados. As várias porções de ligação ao ácido nucleico das moléculas de ligação ao ácido nucleico são então montadas nos TBA completos tal como descrito acima, por exemplo, para HIV-Lock™.
Exemplo 17 - Método de identificação de sequências de ARN específicas numa amostra
De acordo com os métodos e composições ensinados neste invento, qualquer sequência de ácido nucleico pode ser especificamente identificada. A identificação do ARN de HIV alvo numa amostra é alcançada através da obtenção de uma amostra de sangue do paciente ou de outro fluido biológico ou extracto que possa conter o ARN de HIV, e de testes da 75 ΕΡ Ο 796 344 /ΡΤ presença de locais de ligação a TAR. Tat é um regulador positivo da replicação de HIV que se liga à região TAR do ARN de HIV. A forma completamente activa mais pequena de ocorrência natural de Tat de Hiv tem 72 aminoácidos de comprimento, SEQ ID NO:118 aqui. Tat contém pelo menos dois domínios funcionais e transactiva a expressão génica da repetição terminal longa de HIV (LTR de HIV). Tat liga-se a uma estrutura de caule e volta do ARN formada através da auto-hibridação de sequências em TAR, que ficam imediatamente a 5' da LTR de HIV. 0 ARN da TAR de HIV forma uma protuberância dinucleotídica e duas estruturas de caule e volta (Rhim et al., Virology 202: 202-211, 1994). Tat (SEQ ID NO:118) liga-se a esta estrutura com menor avidez do que variantes de Tat em que Ala58 é uma treonina ou onde His65 é um resíduo Asp (Derse et al., Virology 194: 530-536, 1993). A utilização destes factos no presente método é alcançada através de: 1. Fragmentação de uma amostra biológica para expor os ácidos nucleicos e reduzir a complexidade do tamanho dos ácidos nucleicos. 2. Colocação de um TBA em contacto com a amostra que identifica uma sequência proteica de ligação a TAR híbrida e uma sequência de flanqueamento próxima no genoma de HIV. O TBA utilizado para este fim é montado em cro como acompanhante utilizando Tat como molécula de ligação específica do ARN de HIV. Para proporcionar especificidade tal como a comunicação cruzada entre o local TAR de HIV e locais TAR intimamente aparentados que possam estar presentes devido a outros patogénios tais como citomegalovírus, o tba tem também um componente de anticorpo que reconhece a região de ligação ao híbrido ADN-ARN alvo formada quando o ácido nucleico sonda se liga ao ARN da LTR de HIV. 3. Eliminação de qualquer "comunicação cruzada" produzida através da ligação de Tat à região TAR do ARN de HIV devido a tais contaminantes (ARN primos) tais como a sequência TAR de CMV através do contacto da reacção com excesso de variante de Tat (as variantes Ala58 para Thr ou His65 para Asp) que se ligam mais avidamente. Deste modo, acontecimentos de ligação únicos devidos à ligação de TBA a ARN primos competem com a amostra de ácido nucleico pela variante de Tat. Por outro lado, através da 76 ΕΡ Ο 796 344 /ΡΤ selecção apropriada da afinidade da dupla ligação alcançada em resultado do anticorpo e de Tat, o TBA não é deslocado dos verdadeiros alvos. Este processo é ilustrado na Figura 16. Noutro aspecto deste mesmo método, o TBA pode ser um em que, em vez de se utilizar uma variante de Tat, é utilizado um anticorpo que reconhece este segmento de ácido nucleico e o TBA utilizado é um TBA de duplo anticorpo.
Numa versão alternativa deste método, pode ser utilizado uma ácido nucleico sonda que hibride com o ARN da LTR de HIV. Concordantemente, pode ser criado um segmento dúplex dos locais Spl da LTR como parte da região de ligação ao alvo. Esta região do ARN de HIV flanqueia a região TAR que fica a 5' da LTR mas muito próximo desta. Um TBA contendo Tat e duas unidades de ligação de Spl é acompanhado para proporcionar ligação de Tat a TAR e ligação de Spl aos locais de ligação de Spl. A amplificação e detecção são então realizadas através da adição de BNA, BBA e HNA apropriados. Ainda noutra alternativa, podem ser utilizados PNA possuindo SEQ ID NO:38 e SEQ ID NO:39 (ver Figura 7). É utilizado um TBA que contém uma ou mais unidades de ligação de Spl e uma unidade de anticorpo que se liga ao ADN-ARN híbrido produzido a partir do ARN da amostra e do PNA de SEQ ID NO: 38. Os BNA, BBA e HNA apropriados são então adicionados para amplificar o sinal.
Naturalmente, os peritos na arte reconhecerão que podem ser utilizadas outras combinações de TBA e TNA para optimizar os métodos aqui exemplificados.
Entender-se-á que as sequências aqui proporcionadas são apenas exemplificativas e que outras sequências sugeridas por estas podem ser utilizadas nos métodos deste invento. Será também entendido que embora qualquer sequência aqui proporcionada possa ser desenhada como linear, pode ser utilizada numa forma circular ou permutada de outro modo e que embora designada como não sendo anti-sentido, pode ser utilizada na forma de codificação ou de não codificação ou para se ligar a sequências complementares codificantes ou não codificantes. 77 ΕΡ Ο 796 344 /ΡΤ
LISTAGEM DE SEQUÊNCIAS (1) INFORMAÇÃO GERAL: (i) REQUERENTE:
Nome(s) do(s) Requerente(s): THE GENE POOL, INC.
Rua: 300 Queen Anne Ave. N., Suite 392 Cidade: Seattle Estado/Província: Washington Pais: EUA Código Postal/Zip: 98109-4599 Número de telefone: (206) 526-8617 Número de Fax:
(ii) TÍTULO DA INVENÇÃO: MÉTODO DE DETECÇÃO DE ÁCIDO NUCLEICOS COM UMA COMPOSIÇÃO DE SEQUÊNCIA ESPECÍFICA (iii) NÚMERO DE SEQUÊNCIAS: 118 (iv) ENDEREÇO PARA CORRESPONDÊNCIA: (A) DESTINATÁRIO: Saliwanchik & Saliwanchik (B) RUA: 2421 N.W. 41st St., Suite A-l (C) CIDADE: Gainesville (D) ESTADO: Florida
(E) PAÍS: EUA (F) CÓDIGO POSTAL: 32606 (v) FORMATO LEGÍVEL COMPUTADOR: (A) TIPO DE MEIO: disquete
(B) COMPUTADOR: compatível com PC IBM
(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Release #1.0, Versão #1.25 (vi) DADOS DO PRESENTE PEDIDO: (A) NÚMERO DE PEDIDO: (B) DATA DE APRESENTAÇÃO: (C) CLASSIFICAÇÃO: (viii) INFORMAÇÃO SOBRE REPRESENTANTE/AGENTE: (A) NOME: Gerard H Bencen (B) NÚMERO DE REGISTRO: 35,746 (C) NÚMERO DE REFERÊNCIA/PROCESSO: GP-100.C1 (ix) INFORMAÇÃO PARA TELECOMUNICAÇÕES: (A) TELEFONE: (904) 375-8100 (B) TELEFAX: (904) 372-5800 (2) INFORMAÇÃO PARA SEQ ID NO:1: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 13 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear 78 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:l TGGGGATTCC CCA 13 (2) INFORMAÇÃO PARA SEQ ID NO:2: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 13 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:2 AAGGGACTTT CCC 13 (2) INFORMAÇÃO PARA SEQ ID NO:3: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 13 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:3 AGGGGACTTT CCG 13 (2) INFORMAÇÃO PARA SEQ ID NO:4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 15 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO 79 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUENCIA: SEQ ID NO:4 GCTGGGGACT TTCCA 15 (2) INFORMAÇÃO PARA SEQ ID NO:5: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 15 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:5 ACAAGGGACT TTCCG 15 (2) INFORMAÇÃO PARA SEQ ID NO:6: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 13 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:6 CCGGGTTTTC CCC 13 (2) INFORMAÇÃO PARA SEQ ID NO:7: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 27 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:7 AAGGGACTTT CCGCTGGGGA CTTTCCA 27 80 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:8: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 27 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:8: AAGGGACTTT CCGCTGGGGA CTTTCCG 27 (2) INFORMAÇÃO PARA SEQ ID NO:9: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:9: GCTGGGGACT TTCCAGGGAG GCGTGG 26 (2) INFORMAÇÃO PARA SEQ ID NO:10: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:10 GCTGGGGACT TTCCAGGGGA GGTGTG 26 (2) INFORMAÇÃO PARA SEQ ID NO:11: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear 81 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:11 GCTGGGGACT TTCCGGGGAG CGTGGC 26 (2) INFORMAÇÃO PARA SEQ ID NO:12: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:12 GCTGGGGACT TTCCGGGGAG GCGCGG 26 (2) INFORMAÇÃO PARA SEQ ID NO:13: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:13 GCTGGGGACT TTCCAGAGAG GCGTGG 26 (2) INFORMAÇÃO PARA SEQ ID NO:14: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO 82 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUENCIA: SEQ ID NO:14 GCTGGGGACT TTCCAGGGGA GGCGTG 26 (2) INFORMAÇÃO PARA SEQ ID NO:15: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:15 GCTGGGGACT TTCCAGGGAG GCGTGG 26 (2) INFORMAÇÃO PARA SEQ ID NO:16: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:16 GCTGGGGACT TTCCAGGGAG GCTGCC 26 (2) INFORMAÇÃO PARA SEQ ID NO:17: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 33 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:17 TTTCCAGGGA GGCGTGGCCT GGGCGGGACT GGG 33 83 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:18: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 33 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:18: CGTGGCCTGG GCGGGACTGG GGAGTGGCGT CCC 33 (2) INFORMAÇÃO PARA SEQ ID NO:19: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 45 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:19: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGCGT GGCCT 45 (2) INFORMAÇÃO PARA SEQ ID NO:20: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 46 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:20: CAGCAAGGGA CTTTCCGCTG GGGACTTTCC AGGGGAGGTG TGGCCT 46 (2) INFORMAÇÃO PARA SEQ ID NO:21: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 46 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear 84 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:21: CATCAAGGGA CTTTCCGCTG GGGACTTTCC AGGGGAGGTG TGGCCT 46 (2) INFORMAÇÃO PARA SEQ ID NO:22: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 46 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:22: CAACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGGAGGTG TGGCCT 46 (2) INFORMAÇÃO PARA SEQ ID NO:23: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 45 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:23: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGCGT GGCAT 45 (2) INFORMAÇÃO PARA SEQ ID NO:24: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 44 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO 85 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:24: CTACAAGGGA CTTTCCGCTG GGGACTTTCC GGGGAGCGTG GCCT 44 (2) INFORMAÇÃO PARA SEQ ID NO:25: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 44 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:25: CTACAAGGGA CTTTCCGCTG GGGACTTTCC GGGGAGGCGC GGCT 44 (2) INFORMAÇÃO PARA SEQ ID NO:26: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 45 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:26: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGAGAGGCGT GGACT 45 (2) INFORMAÇÃO PARA SEQ ID NO:27: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 46 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:27: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGGAGGCG TGGACT 46 86 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:28: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 46 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:28: CTACAGGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGCGT GGGGAG 46 (2) INFORMAÇÃO PARA SEQ ID NO:29: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 43 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:29: CTACAGGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGCTG CCT 43 (2) INFORMAÇÃO PARA SEQ ID NO:30: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 48 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:30: CTTTCCGCTG GGGACTTTCC AGGGAGGCGT GGCCTGGGCG GGACTGGG 48 (2) INFORMAÇÃO PARA SEQ ID NO:31: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 45 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear 87 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:31: TTTCCAGGGA GGCGTGGCCT GGGCGGGACT GGGGAGTGGC GTCCC 45 (2) INFORMAÇÃO PARA SEQ ID NO:32: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 59 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:32: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGCGT GGCCTGGGCG GGACTGGGG 59 (2) INFORMAÇÃO PARA SEQ ID NO:33: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 59 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:33: TTTCCGCTGG GGACTTTCCA GGGAGGCGTG GCCTGGGCGG GACTGGGGAG TGGCGTCCC 59 (2) INFORMAÇÃO PARA SEQ ID NO:34: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 70 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO 88 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:34: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGCGT GGCCTGGGCG GGACTGGGGA 60 GTGGCGTCCC 70 (2) INFORMAÇÃO PARA SEQ ID NO:35: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 61 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:35: TATCACCGCC AGTGGTATTT ATGTCAACAC CGCCAGAGAT AATTTATCAC CGCAGATGGT 60 T 61 (2) INFORMAÇÃO PARA SEQ ID NO:36: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 64 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:36: TATCACCGCA AGGGATAAAI ATCTAACACC GTGCGTGTTG ACTATTTTAC CTCTGGCGGT 60 GATA 64 (2) INFORMAÇÃO PARA SEQ ID NO:37: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 70 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO 89 ΕΡ Ο 796 344 /ΡΤ (ίν) ΑΝΤΙ-SENTIDO: ΝΑΟ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:37: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGCGT GGCCTGGGCG GGACTGGGGA 60 GTGGCG7CCC 70 (2) INFORMAÇÃO PARA SEQ ID NO:38: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 37 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:38: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGAGG 37 (2) INFORMAÇÃO PARA SEQ ID NO:39: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:39: CGGGACTGGG GAGTGGCGTC CC 22 (2) INFORMAÇÃO PARA SEQ ID NO:40: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 103 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO 90 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:40: CTACAAGGGA CTTTCCGCTG GGGACTTTCC AGGGAGGTAT CACCGCCAGT GGTATTTATG 60 TCAACACCGC CAGAGATAAT TTATCACCGC AGATGGTTCT GCA 103 (2) INFORMAÇÃO PARA SEQ ID NO:41: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 62 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) MÂ
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:41; GAACCATCTG CGGTGATAAA TTATCTCTGG CGGTGTTGAC ATAAATACCA CTGGCGGTGA 60 ΪΑ 62 (2) INFORMAÇÃO PARA SEQ ID NO:42: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 71 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:42: GATCCAACCA TCTGCGGTGA TAAATTATCT CTGGCGGTGT TGACATAAAT ACCACTGGCG 60 GTGATACTGC A 71 (2) INFORMAÇÃO PARA SEQ ID NO:43: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 63 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO 91 ΕΡ Ο 796 344 /ΡΤ (ίν) ΑΝΤΙ-SENTIDO: ΝΑΟ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:43: GTATCACCGC CAGTGGTATT TATGTCAACA CCGCCAGAGA TAATTTATCA CCGCAGATGG 60 TTG 63 (2) INFORMAÇÃO PARA SEQ ID NO:44: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:44: GATCCGGGGG GATACCCCCC G 21 (2) INFORMAÇÃO PARA SEQ ID NO:45: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 91 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:45: CGGGACTGGG GAGTGGCGTC CCTATCACCG CAAGGGATAA ATATCTAACA CCGTGCGTGT 60 TGACTATTTT ACCTCTGGCG GTGATAGCAT G 91 (2) INFORMAÇÃO PARA SEQ ID NO:46: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 53 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO 92 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:46: CTAAGGGCGT AACCGAAATC GGTTGAACCG AAACCGGTTA GTATAAAAGC AGA 53 (2) INFORMAÇÃO PARA SEQ ID NO:47: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 54 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:47: AAAAGGGAGT AACCGAAAAC GGTCGGGACC GAAAACGGTG TATATAAAAG ATGT 54 (2) INFORMAÇÃO PARA SEQ ID NO:48: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 54 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:48: AGTAGGGTGT AACCGAAAGC GGTTCAACCG AAAACGGTGC ATATATAAAG CAAA 54 (2) INFORMAÇÃO PARA SEQ ID NO:49: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:49: GCTTCAACCG AATTCGGTTG CATG 24 93 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:50: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:50 TGTGCAACCG ATTTCGGTTG CCTT 24 (2) INFORMAÇÃO PARA SEQ ID NO:51: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:51 TATGCAACCG AAATAGGTTG GGCA 24 (2) INFORMAÇÃO PARA SEQ ID NO:52: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:52 TGCCTAACCG TTTTCGGTTA CTTG 24 (2) INFORMAÇÃO PARA SEQ ID NO:53: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear 94 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:53: GGACTAACCG TTTTAGGTCA TATT 24 (2) INFORMAÇÃO PARA SEQ ID NO:54: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 52 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:54: GACGACTATC CAGCGACCAA GATCAGAGCC AGACACCGGA AACCCCTGCC AC 52 (2) INFORMAÇÃO PARA SEQ ID NO:55: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 53 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:55: GACGACACGG TATCCGCTAC TCAGCTTGTT AAACAGCTAC AGCACACCCC CTC 53 (2) INFORMAÇÃO PARA SEQ ID NO:56: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 60 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO 95 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:56: GACGACGACC TGCAGACACC ACAGACACCG CCCAGCCCCT TACAAAGCTG TTCTGTGCAG 60 (2) INFORMAÇÃO PARA SEQ ID NO:57: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 68 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:57: CATACCAAAG CC6TC6CCTT GGGCACCGAA GAAACACAAC CACTAAGTTG TTGCACAGAG £0 ACTCAGTG 68 (2) INFORMAÇÃO PARA SEQ ID NO:58: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 77 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:58: TAATGTAATT GATTGTAATG ACTCTATGTG CAGTACCAGT ACCGTATTCC AGCACCGTGT 60 CCGTGGGCAC CGCAAAG 77 (2) INFORMAÇÃO PARA SEQ ID NO:59: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 80 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NAO
(iv) ANTI-SENTIDO: NÃO 96 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:59: ACAGACAACG ATAACCGACC ACCACAAGCA GCGGCCAAAC ACCCCGCCTT GGACAATAGA 60 ACAGCACGTA CTGCAACTAA 80 (2) INFORMAÇÃO PARA SEQ ID NO:60: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 266 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:60: CATATGCAAT ACAATGCATT ATACAAACTG GACACATATA TATATTTGTG AAGAAGCATC 60 AGTAACTGTG GTAGAGGGTC AAGTTGACTA TTATGGTTTA TATTATGTTC ATGAAGGAAT 120 ACGAACATAT TTTGTGCAGT TTAAAGATGA TGCAGAAAAA TATAGTAAAA ATAAAGTATG 180 GGAAGTTCAT GCGGGTGGTC AGGTAATATT ATGTCCTACA TCTGTGTTTA GCAGCAACGA 240 AGTATCCTCT CCTGAAATTA TTAGGC 266 (2) INFORMAÇÃO PARA SEQ ID NO:61: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 95 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:61: AGSATGTATA AAAAAACATG GATATACAGT GGAAGTGCAG TTTGATGGAG ACATATGCTA 60 TTAGGCAGCA CTTGGCCAAC CACCCCGCCG CGACC 95 (2) INFORMAÇÃO PARA SEQ ID NO:62: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 81 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear 97 ΕΡ Ο 796 344 /ΡΤ
(ii) TIPO DE MOLÉCULA: ADNc (iii) HIPOTÉTICA: NÃO (iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:62: CATGTTTTTT TATACATCCA tatcaccgcc agtggtattt atgtcaacac cgccagagat AATTTATCAC CGCAGATGGT T 60 81 (2) INFORMAÇÃO PARA SEQ ID NO:63: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 322 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:63:
Met Ala Aap Aap Asp pro Tyr Gly Thr Gly Gin Met Pbe Bis Leu Asn 15 10 15
Thr Ala l>eu Thr Bis ser lie Phe Asn Ala Glu Leu Tyr ser Pro Glu 20 25 30
Ile Pro Leu Ser Thr Asp Gly Pro Tyr Leu Gin Xle Leu Glu Gin Pro 35 40 45
Lys Gin Arg Gly Phe Arg Phe Arg Tyr Vai Cya Glu Gly Pro ser Bis 50 55 60
Gly Gly Leu Pro Gly Ala Ser Ser Glu Lys Asn Lya Lys Ser Tyr pro 65 70 75 80
Gin vai Lys Xle cye Asn Tyr vai Gly Pro Ala Lye Vai xle vai Gin 85 90 95
Leu vai Thr Asn Gly Lys Asn He His Leu Bis Ala Bis Ser Leu vai 100 105 110 98 ΕΡ Ο 796 344 /ΡΤ
Gly Lys Hia Cya Glu Asp Gly Vai Cys Thr Vai Thr Ala Gly Pro Lys 115 120 125
Asp Met Vai Vai Gly Phe Ala Asn Leu Gly Ile Leu Bis Vai Thr Lye 130 135 140
Lys Lye val Phe Glu Thr Leu Glu Ala Arg Hat Thr Glu Ala cys Ile 145 150 155 160
Arg Gly Tyr Asn Pro Gly Leu Leu Val Hia Ser Asp Leu Ala Tyr Leu 165 170 175
Gin Ala Glu Gly Gly Gly Asp Arg Gin Leu Thr Asp Arg Glu Lys Glu 1B0 185 190 lie Ile Arg Gin Ala Ala Val Gin Gin Thr Lys Glu Het Asp Leu Ser 195 200 205 t
Val Val Arg Leu Het phe Thr Ala Fhe Leu Pro Asp ser Thr Gly Ser 210 215 220
Phe Thr Arg Arg Leu Glu Pro Val Val ser Asp Ala Ile Tyr Asp ser 225 230 235 240
Lys Ala Pro Asn Ala Ser Asn Leu Lys Ile Val Arg Het Asp Arg Thr 245 250 255
Ala Gly cys val Thr Gly Gly Glu Glu lie Tyr Leu Leu Cys Asp Lys 260 265 270
Val Gin Lys Asp Asp Ile Gin Ile Arg Phe Tyr Glu Glu Glu Glu Asn 275 280 285
Gly Gly Val Trp Glu Gly Phe Gly Asp Phe ser Pro Thr Asp Val Bis 290 295 300
Arg Gin Phe Ala Ile Val Phe Lys Thr Pro Lys Tyr Lys Asp Val Asn 305 310 315 320
Ile Thr (2) INFORMAÇÃO PARA SEQ ID NO:64: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 325 aminoácidos (B) TIPO: aminoacido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno 99 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:64:
Het Ala Glu Aep Asp Pro Tyr Leu Gly Arg Pro Glu Gin Met Pbe Bis 15 10 15
Leu Asp Pro Ser Leu Thr Bis Thr Ile phe Asn Pro Glu Vai Pbe Gin 20 25 30
Pro Gin Het Ala Leu Pro Thr Ala Aep Gly Pro Tyr Leu Gin Ile Leu 35 40 45
Glu Gin Pro Lys Gin Arg Gly Phe Arg Phe Arg Tyr Vai Cys Glu Gly 50 55 60
Pro ser His Gly Gly Leu Pro Gly Ala ser Ser Glu Lys Asn Lys Lys 65 70 75 80
Ser Tyr Pro Gin vai Lys Ile cys Asn Tyr Vai Gly Pro Ala Lys Vai 85 90 95
Ile vai Gin Leu vai Thr Asn Gly Lys Asn Ile Bis Leu Bis Ala Bis 100 105 110
Ser Leu Vai Gly Lys Bis cys Glu Asp Gly Ile Cys Thr vai Thr Ala 115 120 125
Gly Pro Glu Asp Cys Vai Bis Gly Phe Ala Asn Leu Gly ile Leu Bis 130 135 140 vai Thr Lys Lys Lys vai Phe Glu Thr Leu Glu Ala Arg Met Thr Glu 145 150 155 160
Ala Cys Ile Arg Gly Tyr Asn Pro Gly Leu Leu Vai His Pro Asp Leu 165 170 175
Ala Tyr Leu Gin Ala Glu Gly Gly Gly Asp Arg Gin Leu Gly Asp Arg 180 185 190
Glu Lys Glu Leu Ile Arg Gin Ala Ala Leu Gin Gin Thr Lys Glu Met 195 200 205
Asp Leu Ser Vai Vai Arg Leu Het Phe Thr Ala Phe Leu Pro Asp Ser 210 215 220
Thr Gly Ser Phe Thr Arg Arg Leu Glu Pro Vai Vai Ser Asp Ala Ile 225 230 235 240
Tyr Asp ser Lys Ala Pro Asn Ala ser Asn Leu Lys Ile Vai Arg Met 245 250 255
Asp Arg Thr Ala Gly cys Vai Thr Gly Gly Glu Glu Ile Tyr Leu Leu 260 265 270
Cys Asp Lys Vai Gin Lys Asp Asp Ile Gin ile Arg Phe Tyr Glu Glu 275 280 285
Glu Glu Asn Gly Gly Vai Trp Glu Gly phe Gly Asp Phe ser Pro Thr 290 295 300
Asp Vai Bis Arg Gin Phe Ala Ile vai Phe Lys Thr Pro Lys Tyr Lys 305 310 315 320
Asp lie Αβπ Ile Thr 325 100 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:65: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 268 aminoácidos (Β) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:65:
Met Glu Pro Ala Asp Leu Leu Pro Leu Tyr Leu Gin Pro GlU Trp Gly 1 5 10 15 Glu Gin Glu Pro Gly Gly Ala Thr Pro Phe Vai Glu Xle Leu Glu Gin 20 25 30 Pro Lys Gin Arg Gly Met Arg Phe Arg Tyr Lys Cys Glu Gly Arg ser 35 40 45 >1 a cl« WJ Ser Xle Pro Gly Bis Ser Thr Asp gay Ala Arg Thr Bxs 50 55 60 Pro Thr Xle Arg Vai Asn HÍS Tyr Arg Gly Pro Gly Arg Val Arg Val 65 70 75 80 ser Leu Vai Thr Lys Asp Pro Pro His Gly Pro Bis Pro Bis Glu Leu 85 90 95 vai Gly Arg Bis cys Gin Bis Gly Tyr Tyr Glu Ala Glu Leu Ser Pro 100 105 110 Asp Arg ser Xle HÍS ser Phe Gin Asn Leu Gly Xle Gin Cys Val Lys 115 120 125 ID Arg Glu Leu Glu Ala Ala Vai Ala Glu Arg xle Arg Thr Asn Asn 130 135 140 Asn Pro Phe Asn Vai pro Met Glu Glu Arg Gly Ala Glu Tyr Asp Leu 145 150 155 160 101 ΕΡ Ο 796 344 /ΡΤ ser Ala Vai Arg Leu cys Phe Gin Vai Trp Vai Aan Gly Pro Gly Gly 165 170 175
Leu Cys Pro Leu pro Pro Vai Leu ser Gin Pro lie Tyr Asp Aan Arg 180 185 190
Ala Pro ser Thr Ala Glu Leu Arg lie Leu Pro Gly Asp Arg Asn ser 195 200 205
Gly ser Cys Gin Gly Gly Asp Glu lie Phe Leu Leu Cys Asp Lys Vai 210 215 220
Gin Lys Glu Asp Ile Glu Vai Arg Phe Trp Ala Glu Gly Trp Glu Ala 225 230 235 240
Lys Gly Ser Phe Ala Ala Ala Asp vai Bis Arg Gin Vai Ala zle Vai 245 250 255
Phe Arg Thr Pro Pro Phe Arg Glu Arg Ser Leu Arg 260 265 (2) INFORMAÇÃO PARA SEQ ID NO:66: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 263 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:66:
Met Asp Asp Leu Phe Pro Leu Ile Phe Pro ser Glu Pro Ala Gin Ala 15 10 15 ser Gly Pro Tyr vai Glu ile ile Glu Gin Pro Lys Gin Arg Gly Met 20 25 30
Arg Phe Arg Tyr Lys Cys Glu Gly Arg ser Ala Gly Ser Ile Pro Gly 35 40 45
Glu Arg Ser Thr Asp Thr Thr Lys Thr His Pro Thr Ile Lys Ile Asn 50 55 60
Gly Tyr Thr Gly Pro Gly Thr vai Arg ile Ser Leu Vai Thr Lys Asp 65 70 75 80 102 ΕΡ Ο 796 344 /ΡΤ
Pro Pro Bis Arg Pro Híb Pro Hia Glu Leu vai Gly Lya Asp Cys Arg 85 90 95
Asp Gly Tyr Tyr Glu Ala Asp Leu cys Pro Asp Arg ser Xle Hia ser 100 105 110
Phe Gin Aan Leu Gly Ile Gin Cys vai Lya Lya Arg Asp Leu Glu Gin 115 120 125
Ala xle ser Gin Arg ile Gin Thr Αβη Aan Aan Pro Phe Bis vai Pro 130 135 140
Ile Glu Glu Gin Arg Gly Asp Tyr Asp Leu Aan Ala vai Arg Leu Cys 145 150 155 160
Phe Gin vai Thr Vai Arg Asp Pro Ala Gly Arg Pro Leu Leu Leu Thr 165 170 175
Pro Vai Leu ser Bis Pro Ile Phe Asp Aan Arg Ala Pro Αβη Thr Ala 180 185 190
Glu Leu Lya Ile cys Arg Vai Aan Arg Asn ser Gly ser cys Leu Gly 195 200 205
Gly Aap Glu Ile Phe Leu Leu cya Asp Lya Vai Gin Lya Glu Asp xle 210 215 220
Glu Vai Tyr Phe Thr Gly Pro Gly Trp Glu Ala Arg Gly ser phe ser 225 230 235 240
Gin Ala Asp Vai Bis Arg Gin Vai Ala Ile vai Phe Arg Thr Pro Pro 245 250 255
Tyr Ala Asp Pro Ser Leu Gin 260 (2) INFORMAÇÃO PARA SEQ ID NO:67: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 263 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:67:
Met Asp Glu Leu Phe Pro Leu Ile Phe Pro Ala Glu Pro Ala Gin Ala 15 10 15 103 ΕΡ Ο 796 344 /ΡΤ ser Gly pro Tyr Vai Glu lie Ile Glu Gin Pro Lys Gin Arg Gly Met 20 25 30
Arg Phe Arg Tyr Lys Cys Glu Gly Arg Ser Ala Gly Ser Ile Pro Gly 35 40 45
Glu Arg ser Thr Asp Thr Thr Lys Thr Hie Pro Thr Ile Lys Ile Asn 50 55 60
Gly Tyr Thr Gly Pro Gly Thr Vai Arg Ile Ser Leu Vai Thr Lys Asp 65 70 75 80
Pro pro ais Arg Pro ais Pro Bis Glu Leu vai Gly Lys Asp Cys Arg 85 90 95
Asp Gly Phe Tyr Glu Ala Glu Leu cys Pro Asp Arg Cys Ile Bis Ser 100 105 110
Phe Gin Asn Leu Gly Ile Gin Cys Vai Lys Lys Arg Asp Leu Glu Gin 115 120 125
Ala ile ser Gin Arg Ile Gin Thr Asn Asn Asn Pro Phe Gin vai Pro 130 135 140
Ile Glu Glu Gin Arg Gly Asp Tyr Asp Leu Asn Ala Vai Arg Leu Cys 145 150 155 160
Phe Gin vai Thr vai Arg Asp pro ser Gly Arg Pro Leu Arg Leu Pro 165 170 175
Pro vai Leu Pro His Pro He Phe 180
Asp Asn Arg Ala Pro Asn Thr Ala 185 190
Glu Leu Lys ile Cys Arg Vai Asn Arg Asn Ser Gly Ser Cys Leu Gly 195 200 205
Gly Asp Glu lie Phe Leu Leu cys Asp Lys Vai Gin Lys Glu Asp Ile 210 '215 220
Glu vai Tyr phe Thr Gly Pro Gly Trp Glu Ala Arg Gly ser Phe ser 225 230 235 240
Gin Ala Asp vai ais Arg Gin Vai Ala Ile Vai Phe Arg Thr Pro Pro 245 250 255
Tyr Ala Asp Pro Ser Leu Gin 260 (2) INFORMAÇÃO PARA SEQ ID NO:68: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 299 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno 104 ΕΡ Ο 796 344 /ΡΤ (χί) DESCRIÇÃO DA SEQUENCIA: SEQ ID NO:68:
Met Phe Pro Asn Gin Asn Asn Gly 1 5
Vai Asp Gly Gin Gin Ser Leu Asn 20
Gin Gin Gin Leu Ala Gin ser Thr 35 40
Vai Lys Xle Thr Glu Gin Pro Ala 50 55
Glu Cys Glu Gly Arg ser Ala Gly 65 70
Pro Glu Asn Lys Thr Tyr Pro Thr 85
Arg Ala Vai Vai vai Vai Ser cys 100
Pro Bis Pro His Asn Leu vai Gly 115 120
Cys Thr Leu Glu xle Asn ser Glu 130 135
Leu Gly Xle Gin Cys Vai Lys Lys 145 150
Ala Arg Glu Glu xle Arg vai Asp 165
Arg Phe Gin Pro ser ser xle Asp 180
Gin Vai Phe Met Glu Ser Glu Gin 195 200
Pro Pro Vai Vai Ser Glu Pro Ile 210 215
Leu vai Xle Cys Arg Leu Cys Ser 225 230
Thr Gin Xle Xle Leu Leu Cys Glu 245
Ala Ala Pro Gly Gin Gly Pro Ala 10 15
Tyr Asn Gly Leu Pro Ala Gin Gin 25 30
Lys Asn Vai Arg Lys Lys Pro Tyr 45
Gly Lys Ala Leu Arg Phe Arg Tyr 60 ser Xle Pro Gly Vai Asn Ser Thr 75 80 xle Glu Xle Vai Gly Tyr Lys Gly 90 95 vai Thr Lys Asp Thr Pro Tyr Arg 105 no
Lys Glu Gly cys Lys Lys Gly Vai 125
Thr Met Arg Ala Vai Phe Ser Asn 140
Lys Asp Xle Glu Ala Ala Leu Lys 155 160
Pro Phe Lys Thr Gly phe Ser His 170 175
Leu Asn Ser Vai Arg Leu Cys Phe 185 190
Lys Gly Arg Phe Thr Ser Pro Leu 205
Phe Asp Lys Lys Ala Met Ser Asp 220
Cys Ser Ala Thr Vai Phe Gly Asn 235 240
Lys vai Ala Lys Glu Asp He ser 250 255
Vai Arg Phe Phe Glu GlU Lys Asn 260 Gly Asp Phe Gin Bis Thr Asp val 275 280 Lys Thr Pro Arg Tyr Bis Thr Leu 290 295
Gly Gin ser Vai Trp Glu Ala Phe 265 270 híb Lys Gin Thr Ala ile Thr Phe 285
Asp Ile Thr 105 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO:69: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 261 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:69:
Het Asp Phe Leu Thr Asn Leu Arg Phe Thr Glu Gly Ile ser Glu Pro 1 5 10 15 Tyr Ile Glu Ile phe Glu Gin Pro Arg Gin Arg Gly Thr Arg Phe Arg 20 25 30 Tyr Lys Cys Glu Gly Arg ser Ala Gly ser Ile Pro Gly Glu HÍ8 ser 35 40 45 Thr Asp Asn Asn Lys Thr Phe Pro ser Ile Gin Ile Leu Asn Tyr Phe SO 55 60 Gly Lys Vai Lya Ile Arg Thr Thr Leu Vai Thr Lys Asn Glu Pro Tyr 65 70 75 80 Lys Pro Bis Pro Bis Asp Leu vai Gly Lys Gly cys Arg Asp Gly Tyr 85 90 95 Tyr Glu Ala Glu Pbe Gly Pro Glu Arg Gin Vai Leu Ser Phe Gin Asn 100 105 110 Leu Gly Ile Gin Cys Vai LyB Lys Lys Asp Leu Lys Glu ser Ile Ser 115 120 125 Leu Arg Ile Ser Lys Lys Asn Pro Phe Asn Vai Pro Glu Glu Gin Leu 130 135 140 106 ΕΡ Ο 796 344 /ΡΤ
Bis Asn Ile Asp Glu Tyr Αβρ Leu Asn Val Val Arg Leu cys Phe Gin 145 150 155 160 Ala Phe Leu Pro Αβρ Glu BÍS Gly Asn Tyr Thr Leu Ala Leu Pro Pro 165 170 175 Leu Ile ser Asn Pro Ile Tyr Asp Asn Arg Ala Pro Asn Thr Ala Glu 180 185 190 Leu Arg Ile cys Arg Val Asn Lys Asn Cys Gly ser val Lys Gly Gly 195 200 205 Asp Glu ile Phe Leu Leu Cys Asp Lys Val Gin Lys Αβρ Asp Ile Glu 210 215 220 Val Arg Phe Val Leu Gly Asn Trp Glu Ala Lys Gly ser Phe Ser Gin 225 230 . 235 240 Ala Asp Val His Arg Gin Val Ala Ile Val Phe Arg Thr Pro Pro Phe 245 250 255 Leu Gly Asp Ile Thr 260 2) INFORMAÇÃO i PARA SEQ ID NO:70: (ί) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 262 aminoácidos (Β) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:70:
Met Asp Phe Leu Thr Asn Leu Arg Phe Thr Glu Gly He ser Glu pro 15 10 15
Tyr Zle Glu lie Phe Glu Gin Pro Arg Gin Arg Gly Met Arg phe Arg 20 25 30
Tyr Lys Cys Glu Gly Arg ser Ala Gly ser ile Pro Gly Glu Bis ser 35 40 45
Thr Asp Asn Asn Lys Thr Phe Pro ser Ile Gin lie Leu Asn Tyr Phe 50 55 60
Gly Lys Val Lys ile Arg Thr Thr Leu vai Thr Lys Asn Glu Pro Tyr 65 70 75 80 107 ΕΡ Ο 796 344 /ΡΤ
Lye Pro Bis Pro Bis Asp Leu vai Gly Lys Gly cys Arg Asp Gly Tyr 85 90 95 Tyr Glu Ala Glu Phe Gly Pro Glu Arg Gin Vai Leu Ser Phe Gin Asn 100 105 110 Leu Gly Ile Gin Cys Vai Lys Lys Lys Asp Leu Lys Glu ser Ile Ser 115 120 125 Leu Arg ile ser Lys Lys Ile Asn pro Phe Asn val Pro Glu Glu Gin 130 135 140 Leu Bis Asn Ile Asp Glu Tyr Asp Leu Asn Vai Val Arg Leu Cys Phe 145 150 155 160 Gin Ala Phe Leu Pro Asp Glu Bis Gly Asn Tyr Thr Leu Ala Leu Pro 165 170 175 Pro Leu ile ser Asn Pro Ile Tyr Asp Asn Arg Ala Pro Asn Thr Ala iao 185 190 Glu Leu Arg Ile Cys Arg Vai Asn Lys Asn Cys Gly Ser Val Lys Gly 195 200 205 Gly Aep Glu Ile Phe Leu Leu Cys Asp Lys Val Gin Lys Asp Asp Ile 210 215 220 Glu Vai Arg Phe Vai Leu Gly Asn Trp Glu Ala Lys Gly ser Phe ser 225 230 235 240 Gin Ala Asp Vai Bis Arg Gin vai Ala Ile val Phe Arg Thr Pro Pro 245 250 255 Phe Leu Gly Asp Ile Thr 260 (2) INFORMAÇÃO PARA SEQ ID NO :71: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 314 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:71:
Met ser Asn Lys Lys Gin ser Asn Arg Leu Thr Glu Gin Bis Lys Leu 15 10 15 108 ΕΡ Ο 796 344 /ΡΤ
Ser Gin Gly vai Ile Gly Ile Phe Gly Asp Tyr Ala Lya Ala Hia Asp 20 25 30
Leu Ala Vai Gly Glu Vai Ser Lys Leu vai Lya Lys Ala Leu ser Asn 35 40 45
Glu Tyr Fro Gin Leu Ser Phe Arg Tyr Arg Asp ser Ile Lya Lya Thr 50 55 60
Glu Ile Αβη Glu Ala Leu Lys Lys Ile Αβρ Pro Asp Leu Gly Gly Thr 65 70 75 80
Leu Phe vai Ser Asn Ser Ser Ile Lys Pro Asp Gly Gly lie Vai Glu 85 90 95
Vai Lys Asp Asp Tyr Gly Glu Trp Arg vai Vai Leu Vai Ala Glu Ala 100 105 110
Lys Bis Gin Gly Lys Asp Ile Ile Asn Ile Arg Asn Gly Leu Leu Vai 115 120 125
Gly Lys Arg Gly Asp Gin Aap Leu Met Ala Ala Gly Asn Ala Ile Glu 130 135 140
Arg Ser Bis Asn Ile ser Glu ile Ala Asn Phe Met Leu ser Glu ser 145 150 155 160
Bis Phe Pro Tyr Vai Leu Phe Leu Glu Gly Ser Asn Phe Leu Thr Glu 165 170 175
Asn Ile Ser Ile Thr Arg Fro Asp Gly Arg Vai vai Asn Leu Glu Tyr 180 185 190
Aan Ser Gly Ser Glu Ser Bis Phe Pro Tyr Vai Leu Phe Leu Glu Gly 195 200 205
Ser Asn Phe Leu Thr Glu Asn Ile Ser Ile Thr Arg Pro Asp Gly Arg 210 215 220
Vai vai Asn Leu Glu Tyr Asn Ser Gly Ile Leu Asn Arg Leu Asp Arg 225 230 235 240
Leu Thr Ala Ala Asn Tyr Gly Met Pro Ile Asn ser Asn Leu Cya Ile 245 250 255
Asn Lys Phe Vai Asn His Lys Asp Lys ser ile Met Leu Gin Ala Ala 260 265 270 ser Ile Tyr Thr Gin Gly Asp Gly Arg Glu Trp Asp ser Lys Ile Met 275 280 285
Phe Glu ile Met Phe Asp Ile Ser Thr Thr Ser Leu Arg Vai Leu Gly 290 295 300
Arg Asp Leu Phe Glu Gin Leu Thr ser Lys 305 310 (2) INFORMAÇÃO PARA SEQ ID NO:72: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 17 aminoácidos (B) TIPO: amínoácído (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido 109 ΕΡ Ο 796 344 /ΡΤ
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:72: cys Asp Thr Asp Asp Arg Bis Arg Ile Glu Glu Lys Arg Lys Arg Lys 15 10 15
Thr (2) INFORMAÇÃO PARA SEQ ID NO:73: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 168 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (x) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:73:
Gly Asp Pro Gly Lys Lys Lys Gin Bis He Cys Bis Ile Gin Gly cys 1 5 10 15 Gly Lys vai Tyr Gly Lys Thr ser His Leu Arg Ala Bis Leu Arg Trp 20 25 30 Bia Thr Gly Glu Arg Pro Phe Met Cys Thr Trp Ser Tyr Cys Gly Lys 35 40 45 Arg Phe Thr Arg Ser Asp Glu Leu Gin Arg Bis Lys Arg Thr Bis Thr 50 55 60 Gly Glu Lys Lys Phe Ala cys Pro Glu Cys Pro Lys Arg Phe Met Arg 65 70 75 80 ser Asp Bis Leu ser Lys Bis lie Lys Thr Bis Gin Asn Lys Lys Gly 85 90 95 Gly Pro Gly Vai Ala Leu Ser val Gly Thr Leu Pro Leu Asp ser Gly 100 105 110 Ala Gly Ser Glu Gly Ser Gly Thr Ala Thr Pro ser Ala Leu ile Thr 115 120 125 Thr Asn Met Vai Ala Met Glu Ala lie Cys Pro Glu Gly Ile Ala Arg 130 135 140 Leu Ala Asn Ser Gly lie Asn Val Met Gin Val Ala Asp Leu Gin Ser 145 150 155 160 11· Asn Zle Ser Gly Asn Gly Phe 165 110 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:74: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 181 aminoácidos (Β) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:74:
Ser Gly Ile Vai ?ro Gin Leu Gin Asn Ile Vai Ser Thr Vai Asn Leu 1 5 ' 10 15
Gly cys Lys Leu Asp Leu Lys Thr ile Ala Leu Arg Ala Arg Asn Ala 20 25 30
Glu Tyr Asn Pro Lys Arg Phe Ala Ala Vai Zle Met Arg Ile Arg Glu 35 40 45
Pro Arg Thr Thr Ala Leu Zle Phe Ser Ser Gly Lys Met vai cys Thr 50 55 60
Gly Ala Lys ser Glu Glu Gin Ser Arg Leu Ala Ala Arg Lys Tyr Ala 65 70 75 80
Arg Val vai Gin Lys Leu Gly Phe Pro Ala Lys Phe Leu Asp Phe Lys 85 90 95
Ile Gin Asn Met Val Gly ser cys Asp Val Lys Phe Pro Zle Arg Leu 100 105 110
Glu Gly Leu Val Leu Thr His Gin Gin Phe Ser Ser Tyr Glu Pro Glu 115 120 125
Leu Phe Pro Gly Leu Ile Tyr Arg Met Zle Lys Pro Arg Ile Val Leu 130 135 140
Leu Zle Phe val ser Gly Lys val val Leu Thr Gly Ala Lys Val Arg 145 150 155 160
Ala Glu Zle Tyr Glu Ala Phe Glu Asn Zle Tyr pro Zle Leu Lys Gly 165 170 175
Phe Arg Lys Thr Thr 180 (2) INFORMAÇÃO PARA SEQ ID NO:75: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 85 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO 111 ΕΡ Ο 796 344 /ΡΤ
(ίν) ΑΝΤΙ-SENTIDO: NÃO (ν) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:75:
Ser Cys Phe Ala Leu Zle ser Gly Thr Ala Asn Gin val Lys Cys Tyr 1 5 10 15 Arg Phe Arg val Lys Lys Asn His Arg His Arg Tyr Glu Asn Cys Thr 20 25 30 Thr Thr Trp Phe Thr Val Ala Asp Asn Gly Ala GlU Arg Gin Gly Gin 35 40 45 Ala Gin Zle Leu Zle Thr Phe Gly Ser Pro ser Gin Arg Gin Asp Phe 50 55 60 Leu Lys His Val Pro Leu Pro Pro Gly Het Asn Zle Ser Gly Phe Thr 65 70 75 80
Ala ser Leu Asp Phe 85 (2) INFORMAÇÃO PARA SEQ ID NO:76: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 87 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:76:
Cys Pro Cys Leu Leu Zle Gly Thr Ser Gly Asn Gly Asn Gin Val Lys 1 5 10 15 Cys Tyr Ser Phe Arg Val Lys Arg Trp His Asp Arg Asp Lys Tyr HÍB 20 25 30 His Thr Thr Thr Trp Trp Ala val Gly Gly Gin Gly ser Glu Arg Pro 35 40 45 Gly Asp Ala Thr Val Zle Val Thr Phe Lys Asp Gin Ser Gin Arg Ser 50 55 60 His Phe Leu Gin Gin val Pro Leu Pro Pro Gly Het Ser Ala His Gly 65 70 75 80 Val Thr Met Thr Val Asp Phe 85 (2) INFORMAÇÃO PARA SEQ ID NO:77: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 112 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:77:
Pro pro vai ile cys Leu Lys Gly Gly Hia Aan Gin Leu Lys cys Leu 15 10 15
Arg Tyr Arg Leu Lye Ser Lys His Ser ser Leu Phe Asp Cys lie Ser 20 25 30
Thr Thr Trp ser Trp Vai Asp Thr Thr ser Thr cys Arg Leu Gly Ser 35 40 45
Gly Arg Met Leu Ile Lys Phe Ala Asp ser Glu Gin Arg Asp Lys Phe 50 55 60
Leu Ser Arg vai Pro Leu Pro Ser Thr Thr Gin Vai Phe Leu Gly Asn 65 70 75 80
Phe Tyr Gly Leu (2) INFORMAÇÃO PARA SEQ ID NO:78: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:78:
Pro Pro vai Ile Leu Vai Arg Gly Gly Ala Asn Thr Leu Lys cys Phe 15 10 15
Arg Asn Arg Ala Arg vai Arg Tyr Arg Gly Leu Phe Lys Tyr Phe ser 20 25 30
Thr Thr Trp ser Trp vai Ala Gly Asp ser Thr Glu Arg Leu Gly Arg 35 40 45
Ser Arg Met Leu Ile Leu Phe Thr Ser Ala cys Gin Arg Glu Lys Pro 50 55 60
Asp Glu Thr Vai Lys Tyr Pro Lys Gly vai Asp Thr ser Tyr Gly Asn 65 70 75 80
Leu Asp ser Leu 113 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:79: (ί) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (Β) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (x) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:79:
Pro Pro Vai Vai Cys vai Lya Gly Gly Ala Asn Gin Leu Lys Cys Leu 15 10 15
Arg Tyr Arg Leu Lys Ala Ser Thr Gin vai Asp Phe Asp ser Ile ser 20 25 30
Thr Thr Trp His Trp Thr Asp Arg Lys Asn Thr Glu Arg Ile Gly Ser 35 40 45
Ala Arg Met Leu vai Lys Phe Ile Asp Glu Ala Gin Arg Glu Lys Phe 50 55 60
Leu Glu Arg Vai Ala Leu Pro Arg Ser Vai Ser Vai Phe Leu Gly Gin 65 70 75 80
Phe Asn Gly ser (2) INFORMAÇÃO PARA SEQ ID NO:80: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:80:
Thr Pro ile Vai Gin Leu Gin Gly Asp ser Asn Cys Leu Lys cys Phe 15 10 15
Arg Tyr Arg Leu Asn Asp Lys Tyr Lys His Leu Phe Glu Leu Ala Ser 20 25 30
Ser Thr Trp His Trp Ala ser Pro Glu Ala Pro His Lys Asn Ala Ile 35 40 45 vai Thr Leu Thr Tyr ser ser Glu Glu Gin Arg Gin Gin Phe Leu Asn 50 55 60 114 ΕΡ Ο 796 344 /ΡΤ ser vai Lye Ile Pro Pro Thr Xle Arg His Lya Vai Gly Phe Met Ser 65 70 75 80
Leu His Leu Leu (2) INFORMAÇÃO PARA SEQ ID NO:81: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:81:
Thr Pro Ile Vai Gin Phe Gin Gly Glu Ser Asn cys Leu Lys Cys Phe 15 10 15
Arg Tyr Arg Leu Asn Arg Asp His Arg Bis Leu Phe Asp Leu Ile Ser 20 25 30 ser Thr Trp His Trp Ala ser ser Lys Ala Pro híb Lys His Ala xle 35 40 45
Vai Thr Vai Thr Tyr Asp ser Glu Glu Gin Arg Gin Gin Phe Leu Asp 50 55 60
Vai vai Lys Ile Pro Pro Thr Ile ser His Lys Leu Gly phe Met ser 65 70 75 80
Leu His Leu Leu (2) INFORMAÇÃO PARA SEQ ID NO:82: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 80 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno 115 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:82:
Thr pro Ile Ile Bis Leu Lys Gly Asp Arg Asn ser Leu Lys cys Leu 1 5 10 15 Arg Tyr Arg Leu Arg Lys Bis Ser Asp Bis Tyr Arg Asp Ile Ser ser 20 25 30 Thr Trp Bis Trp Thr Gly Ala Gly Asn Glu Lys Thr Gly Ile Leu Thr 35 40 45 Vai Thr Tyr His Ser Glu Thr Gin Arg Thr Lys Phe Leu Asn Thr Vai 50 55 60
Ala Ila Pro Asp ser vai Gin lie Leu Vai Gly Tyr Asn Thr Met Tyr 65 70 75 80 (2) INFORMAÇÃO PARA SEQ ID NO:83: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 80 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:83:
Thr Pro ile Vai Bis Leu Lys Gly Asp Ala Asn Thr Leu Lys cys Leu 1 5 10 15 Arg Tyr Arg Phe Lys Lys Bis cys Thr Leu Tyr Thr Ala Vai Ser Ser 20 25 30 Thr Trp Bis Trp Thr Gly Bis Aen Tyr Lys Bis Lys Ser Ala Ile Vai 35 40 45 Thr Leu Thr Tyr Asp Ser Glu Trp Gin Arg Asp Gin Phe Leu ser Gin 50 55 60 Vai Lys Ile Pro Lys Thr Ile Thr Vai Ser Thr Gly Phe Met ser Ile 65 70 75 80 (2) INFORMAÇÃO PARA SEQ ID NO:84: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 81 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO 116 ΕΡ Ο 796 344 /ΡΤ
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:84:
Ala Pro lie Vai His Leu Lys cly Glu ser Asn ser Lea Lys cys Leu 1 5 10 15
Arg Tyr Arg Leu Lys Pro Tyr Asn Glu Leu Tyr ser ser Met ser ser 20 ‘ 25 30
Thr Trp Bis Trp Tbr Ser Αβρ Asn Lys Asn Ser Lys Asn Gly ile vai 35 40 45
Thr vai Tbr Phe Vai Thr Gly Gin Gin Gin Gin Met Phe Leu Gly Thr 50 55 60
Vai Lys Ile Pro Pro Tbr Vai Gin lie ser Tbr Gly Phe Met Tbr Leu 65 70 75 80
Vai (2) INFORMAÇÃO PARA SEQ ID NO:85: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:85:
Gly Zle Vai Glu Gin Cys Cys Thr Ser He Cys Ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 (2) INFORMAÇÃO PARA SEQ ID NO:86: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 30 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno 117 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:86:
Phe Vai Asn Gin Bis Leu Cys Gly Ser His Leu Vai Glu Ala Leu Tyr 15 10 15
Leu Vai Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30 (2) INFORMAÇÃO PARA SEQ ID NO:87: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:87:
Gly Ile Vai Glu Gin Cys Cys Ala Ser Vai Cys ser Leu Tyr Gin Leu 15 10 15
Glu Asn Tyr Cys Asn 20 (2) INFORMAÇÃO PARA SEQ ID NO:88: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 30 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:88:
Phe Vai Asn Gin His Leu Cys Gly ser Bis Leu Vai Glu Ala Leu Tyr 15 10 15
Leu Vai Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr 20 25 30 (2) INFORMAÇÃO PARA SEQ ID NO:89: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 118 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:89:
Gin Leu Tyr ser Ala Leu Ala Asn Lys cys cys His vai Gly cys lie 15 10 15
Lys Arg ser Leu Ala Arg Phe Cys 20 (2) INFORMAÇÃO PARA SEQ ID NO:90: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 33 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:90:
Asp ser Trp Met Glu Glu Vai Xle Lys Xle Cys Gly Arg Glu Leu Vai 15 10 15
Arg Ala Gin lie Ala Ile Cys Gly Met ser Thr Trp Ser Lys Arg Ser 20 25 30
Leu (2) INFORMAÇÃO PARA SEQ ID NO:91: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno 119 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:91:
Glu GIu Lys Het Gly Thr Ala Lys Lys cys cya Ala lie Gly Cys Ser 15 10 15
Thr Glu Asp Phe Arg Het Vai cys 20 (2) INFORMAÇÃO PARA SEQ ID NO:92: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 40 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:92:
Arg Pro Asn Trp Glu Glu Arg ser Arg Leu Cys Gly Arg Asp Leu lie 15 10 15
Arg Ala Phe lie Tyr Leu Cys Gly Gly Thr Arg Trp Thr Arg Leu Pro 20 25 30
Asn Phe Gly Asn Tyr Pro Ile Met 35 40 (2) INFORMAÇÃO PARA SEQ ID NO:93: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 182 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno 120 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:93:
Ser Gly Ile Vai Pro Thr Leu Gin Asn ile val ser Thr val Asn Leu 1 5 10 15 ASp Cys Lys Leu Asp Leu Lys Ala Ile Ala Leu Gin Ala Arg Asn Ala 20 25 30 Glu Tyr Asn Pro Lys Arg Phe Ala Ala val lie Met Arg Ile Arg Glu 35 40 45 Pro Lye Thr Thr Ala Leu Ile Phe Ala ser Gly Lys Met Val cys Thr 50 55 60 Gly Ala Lys Ser Glu Asp Phe Ser Lys Met Ala Ala Arg Lys Tyr Ala 65 70 75 80 Arg Ile vai Gin Lys Leu Gly Phe Pro Ala Lys Phe Lys Asp Phe Lye 85 90 95 Xle Gin Asn Ile Vai Gly Ser Cys Asp Val Lys Phe Pro Ile Arg Leu 100 105 110 Glu Gly Leu Ala Tyr Ser Bis Ala Ala Phe ser ser Tyr Glu pro Glu 115 120 125 Leu Phe Pro Gly Leu Ile Tyr Arg Met Lys val Pro Lys Ile val Leu 130 135 140 Leu Xle Phe Vai Ser Gly Lys Ile Vai Ile Thr Gly Ala Lys Met Arg 145 150 155 160 ASp Glu Thr Tyr Lys Ala Phe Glu Asn Ile Tyr pro val Leu Ser Glu 165 170 175 Phe Arg Lya Ile Gin Gin 180 (2) INFORMAÇÃO PARA SEQ ID NO:94: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno 121 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:94:
Asn Ser Asn Ser Tbr Pr o He Vai His Leu Lys Gly Asp Ala Asn Thr 15 io 15
Leu Lys cys Leu Arg Tyr Arg Phe Lys Lys Eis cys Thr Leu Tyr Thr 20 25 30
Ala Vai Ser ser Thr Trp Bis Trp Thr Gly His Asn vai Lys His Lys 35 40 45
Ser Ala Zle Vai Thr Leu Thr Tyr Asp ser Glu Trp Gin Arg Asp Gin 50 55 60
Phe Leu Ser Gin Vai Lys xle pro Lys Thr lie Thr Vai ser Thr Gly 65 70 75 80
Phe Het Ser lie (2) INFORMAÇÃO PARA SEQ ID NO:95: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:95:
Asn Ser Asn Thr Thr Pro He vai Bis Leu Lys Gly Asp Ala Asn Thr 15 10 15
Leu Lys Cys Leu Arg Tyr Arg Phe Lys Lys Bis cys Thr Leu Tyr Thr 20 25 30
Ala Vai Ser ser Thr Trp Bis Trp Thr Gly Bis Asn Vai Lys Bis Lys 35 40 45
Ser Ala lie vai Thr Leu Thr Tyr Asp ser Glu Trp Gin Arg Asp Gin 50 55 60
Phe Leu ser Gin Vai Lys lie Pro Lys Thr Ile Thr Vai Ser Thr Gly 65 70 75 80
Phe Het ser Ile (2) INFORMAÇÃO PARA SEQ ID NO:96: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 83 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 122 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: : SEQ ID NO:96: ser Gly Asn Thr Thr Pro Ile ile Bis Leu Lya Gly Asp Arg Asn ser 1 5 10 15 Leu Lys cys Leu Arg Tyr Arg Leu Arg Lys HÍS Ser Asp His Tyr Arg 20 25 30 Asp lie ser ser Thr Trp His Trp Thr Gly Ala Gly Asn Glu Lys Thr 35 40 45 Gly Ile Leu Thr Vai Thr Tyr Eis Ser Glu Thr Gin Arg Thr Lys Phe 50 55 60 Leu Asn Thr Vai Ala Ile Pro Asp Ser vai Gin Ile Leu vai Gly Tyr 65 70 75 80 Met Thr Met (2) INFORMAÇÃO PARA SEQ ID NO:97: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 84 aminoácidos (B) TIPO: aminoácído (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:97:
Ser Gly Asn Thr Ala Pro lie vai Bis Leu Lys Gly Glu Ser Asn Ser 15 10 15
Leu Lys Cys Leu Arg Tyr Arg Leu Lys Pro Tyr Lys Glu Leu Tyr Ser 20 25 30
Ser Met Ser Ser Thr Trp Bis Trp Thr Ser Asp Asn Lys Asn $er Lys 35 40 45
Asn Gly Xle Vai Thr Vai Thr Phe Vai Thr Glu Gin Gin Gin Gin Met 50 55 60
Phe Leu Gly Thr Vai Lys ile Pro Pro Thr Vai Gin lie Ser Thr Gly 65 70 75 80
Phe Met Thr Leu 123 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:98: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 89 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:98:
Ser Gly Asn Thr ser Cys Phe Ala Leu lie Ser Gly Thr Ala Asn Gin 15 10 15
Vai Lys Cys Tyr Arg Phe Arg Vai Lys Lys Asn His Arg Hia Arg Tyr 20 25 30
Glu Asn Cys Thr Thr Thr Trp Phe Thr Vai Ala Asp Asn Gly Ala Glu 35 40 45
Arg Gin Gly Gin Ala Gin Xle Leu Ile Thr Phe Gly ser Pro Ser Gin 50 55 60
Arg Gin Asp Phe Leu Lys Bis Vai Pro Leu Pro Pro Gly Met Asn Ile 65 70 75 80
Ser Gly phe Thr Ala Ser Leu Asp Phe 85 (2) INFORMAÇÃO PARA SEQ ID NO:99: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 7 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: C-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:99:
Ser Asn Lys Lys Thr Thr Ala 1 5 124 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO:100: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 4 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:100
Asn Ser Asn Thr 1 (2) INFORMAÇÃO PARA SEQ ID NO:101: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 4 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:101
Ser Gly Asn Thr 1 (2) INFORMAÇÃO PARA SEQ ID NO:102: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 6 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:102
Ser ser Gly Ser ser Gly 1 5 125 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO:103: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 15 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:103:
Cys Tyr Pro Glu Ile Lys Asp Lys Glu Glu Vai Gin Arg Lys Arg 15 10 15 (2) INFORMAÇÃO PARA SEQ ID NO:104: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 66 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:104:
Met Glu Gin Arg Ile Thr Leu Lys Asp Tyr Ala Het Arg Phe Gly Gin 1 5 10 15
Thr Lys Thr Ala Lys Asp Leu Gly vai Tyr Gin Ser Ala Ile Αβη Lys 20 25 30
Ala Ile His Ala Gly Arg Lys Ile Phe Leu Thr Ile Asn Ala Asp Gly 35 40 45
Ser Vai Tyr Ala Glu Glu Vai Lys Pro Phe Pro Ser Asn Lys Lys Thr 50 55 60
Thr Ala 65 (2) INFORMAÇÃO PARA SEQ ID NO:105: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 66 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína 126 ΕΡ Ο 796 344 /ΡΤ
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (x) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:105:
Met Glu Gin Glu Ile Thr Leu Lye Asp Tyr Ala Met Arg phe Gly Gin 15 10 15
Thr Lys Thr Ala Lys Asp Leu Gly vai Tyr Gin Ser Ala Ile Asn Lya 20 25 30
Ala Ile Bis Ala Gly Arg Lys ile Phe Leu Thr ile Asn Ala Asp Gly 35 40 45
Ser vai Tyr Ala Glu Glu vai Lys pre Phe Pro ser Asn Lys Lys Thr 50 55 60
Thr Ala 65 (2) INFORMAÇÃO PARA SEQ ID NO:106: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 66 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:106:
Net Arg Gin Arg Ile Thr Leu Lys Asp Tyr Ala Met Arg Phe Gly Gin 15 10 15
Thr Lys Thr Ala Lys Asp Leu Gly Vai Tyr Gin ser Ala Ile Asn Lys 20 25 30
Ala Ile Bis Ala Gly Arg Lys Ile Phe Leu Thr ile Asn Ala Asp Gly 35 40 45 ser vai Tyr Ala Glu Glu vai Lys Pro Phe Pro ser Asn Lys Lys Thr 50 55 60
Thr Ala 65 (2) INFORMAÇÃO PARA SEQ ID NO:107: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 96 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 127 ΕΡ Ο 796 344 /ΡΤ (íi) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:107:
Ser Thr Lys Lys Lys Pro Leu Thr Gin Glu Gin Leu Glu Asp Ala Arg 1 5 10 15 Arg Leu Lys Ala Ile Tyr Glu Lys Lys Lys Asn Glu Leu Gly Leu Ser 20 25 30 Gin Glu ser val Ala Asp Lys Met Gly Met Gly Gin ser Gly Val Gly 35 40 45 Ala Leu Phe Asn Gly Ile Asn Ala Leu Asn Ala Tyr Asn Ala Ala Leu 50 55 60 Leu Ala Lys Ile Leu Lys val Ser Val Glu Glu Phe ser Pro Ser xle 65 70 75 so Ala Arg Glu Ile Tyr Glu Met Tyr Glu Ala Val Ser Met Glu Pro ser 85 90 95 (2) INFORMAÇÃO PARA SEQ ID NO:108: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 96 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:108: ser Thr Lys Lys Lys pro Leu Thr Gin Glu Gin Leu Glu Asp Ala Arg 15 10 15
Arg Leu Lys Ala ile Tyr Glu Lye Lys Lys Asn Glu Leu Gly Leu Ser 20 25 30
Gin Glu ser Vai Ala Asp Lys Met Gly Met Gly Gin Ser Gly Vai Gly 35 40 45
Ala Leu Phe Asn Gly Xle Asn Ala Leu Asn Ala Tyr Asn Ala Ala Leu 50 55 60
Leu Ala Lys Xle Leu Lys Vai Ser Vai Glu Glu Phe ser Pro Ser Xle 65 70 75 80
Ala Arg Glu Ile Tyr Glu Met Cys Glu Ala Vai Ser Met Glu Pro Ser 85 90 95 128 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID NO:109: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 180 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:109:
Gly Φ ^4 H vai Glu Gin cya cys Thr ser Ile Cys Ser Leu Tyr Gin Leu 1 5 10 15 Glu Asn Tyr cye Asn Met Ser Het Glu Gin Arg Ile Thr Leu Lys Asp 20 25 30 Tyr Ala Het Arg Phe Gly Gin Thr Lys Thr Ala Lys Asp Leu Gly val 35 40 45 Tyr Gin ser Ala Ile Asn Lys Ala Ile His Ala Gly Arg Lys Ile Phe 50 55 60 Leu Thr Ile Aan Ala Asp Gly Ser Val Tyr Ala Glu Glu Val Lys Pro 65 70 75 80 Phe ?ro ser Asn Lye Lys Thr Thr Ala Ser Asn Lys Lys Thr Thr Ala 85 90 95 Asn Ser ΑΒΠ Thr Thr pro Ile val Bis Leu Lys Gly Asp Ala Asn Thr 100 105 110 Leu Lys cya Leu Arg Tyr Arg Phe Lys Lys His Cys Thr Leu Tyr Thr 115 120 125 Ala Vai Ser ser Thr Trp Bis Trp Thr Gly His Asn Val Lys His Lys 130 135 140 Ser Ala Ile Val Thr Leu Thr Tyr ASp ser Glu Trp Gin Arg Asp Gin 145 150 155 160 Phe Leu ser Gin val Lys ile pro Lys Thr Ile Thr val ser Thr Gly 165 170 175
Phe Het Ser Zle 180 (2) INFORMAÇÃO PARA SEQ ID NO:110: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 113 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína
(iii) HIPOTÉTICA: NÃO 129 ΕΡ Ο 796 344 /ΡΤ
(iv) ANTI-SENTIDO: NÃO (ν) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:110:
Gly Xle Vai Glu Gin Cys Cys Thr Ser Xle Cys ser Leu Tyr Gin Leu 1 5 10 15 Glu Asn Tyr Cys Asn Met Ser Met Glu Gin Arg Xle Thr Leu Lys Asp 20 25 30 Tyr Ala Met Arg Phe Gly Gin Thr Lys Thr Ala Lys Asp Leu Gly Vai 35 40 45 Tyr Gin ser Ala Xle &sn Lys Ala ile Bis Ala Gly Arg Lys xle Phe 50 55 60 Leu Thr Xle Asn Ala Asp Gly ser vai Tyr Ala Glu Glu Vai Lys Pro 65 70 75 80 Pbe Pro ser Asn Lys Lys Thr Thr Ala Ser Asn Lys Lys Thr Thr Ala 85 90 95 cys Asp Thr Asp Asp Arg His Arg Xle GlU Glu Lys Arg Lys Arg Lys 100 105 110 (2) INFORMAÇÃO PARA SEQ ID NO:111: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 292 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal 130 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:111:
Phe vai Asn Gin Bis Leu Cys Gly ser Bis Leu Vai Glu Ala Leu Tyr 15 10 15
Leu Vai Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Met ser 20 25 30
Met Glu Gin Glu lie Thr Leu Lys Asp Tyr Ala Met Arg Phe Gly Gin 35 40 45
Thr Lys Thr Ala Lys Asp Leu Gly vai Tyr Gin ser Ala Ile Asn Lys 50 55 60
Ala Ile Bis Ala Gly Arg Lys Ile Phe Leu Thr Ile Asn Ala Asp Gly 65 70 75 80 ser vai Tyr Ala Glu Glu vai Lys Pro Phe Pro ser Asn Lys Lys Thr 85 90 95
Thr Ala ser Asn Lys Lys Thr Thr Ala ser Ser Gly Ser Ser Gly Ser 100 105 110
Gly ile Vai Pro Gin Leu Gin Asn ile Vai Ser Thr vai Asn Leu Gly 115 120 125
Cys Lys Leu Asp Leu Lys Thr ile Ala Leu Arg Ala Arg Asn Ala Glu 130 135 140
Tyr Asn Pro Lys Arg Phe Ala Ala Vai Ile Met Arg Ile Arg Glu Pro 145 150 155 160
Arg Thr Thr Ala Leu Ile Phe ser ser Gly Lys Met Vai cys Thr Gly 165 170 175
Ala Lys ser Glu Glu Gin ser Arg Leu Ala Ala Arg Lys Tyr Ala Arg 180 185 190 val val Gin Lys Leu Gly Phe Pro Ala Lys Phe Leu Asp Phe Lys xle 195 200 205
Gin Asn Met val Gly ser cys Asp Val Lys Phe Pro Ile Arg Leu Glu 210 215 220
Gly Leu Val Leu Thr Bis Gin Gin Phe Ser Ser Tyr Glu Pro Glu Leu 225 230 235 240
Phe Pro Gly Leu Ile Tyr Arg Met Ile Lys Pro Arg Ile val Leu Leu 245 250 255
Ile Phe val ser Gly Lys Val Val Leu Thr Gly Ala Lys Val Arg Ala 260 265 270
Glu Ile Tyr Glu Ala Phe Glu Asn Ile Tyr Pro Ile Leu Lys Gly Phe 275 280 285
Arg Lys Thr Thr 290 131 ΕΡ Ο 796 344 /ΡΤ (2) INFORMAÇÃO PARA SEQ ID ΝΟ:112: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 273 aminoácidos (Β) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:112:
Phe Vai Asn Gin Bis Leu cys Gly ser BiS Leu Vai Glu Ala Leu Tyr 1 5 10 15 Leu vai cys Gly GlU Arg Gly phe Phe Tyr Thr Pro Lys Thr Met ser 20 25 30 Met Arg Gin Arg Ile Thr Leu Lys Asp Tyr Ala Met Arg Phe Gly Gin 35 40 45 Thr Lys Thr Ala Lys Asp Leu Gly Vai Tyr Gin Ser Ala Ile Asn Lys 50 55 60 Ala zle Bis Ala Gly Arg Lys Ile Phe Leu Thr Ile Asn Ala Asp Gly 65 70 75 80 ser Vai Tyr Ala Glu Glu Vai Lys Pro Phe Pro Ser Asn Lys Lys Thr 85 90 95 Thr Ala Ser Asn Lys Lys Thr Thr Ala Gly Asp Pro Gly Lys Lys Lys 100 105 110 Gin BiS Ile Cys Bis Ile Gin Gly cys Gly Lys Vai Tyr Gly Lys Thr 115 120 125 Ser Bis Leu Arg Ala Bis Leu Arg Trp His Thr Gly Glu Arg Pro Phe 130 135 140 Met Cys Thr Trp ser Tyr Cys Gly Lye Arg Phe Thr Arg Ser Asp Glu 145 150 155 160 Leu Gin Arg His Lys Arg Thr His Thr Gly GlU Lys Lys Phe Ala Cys 165 170 175 pro Glu cys Pro Lys Arg Phe Met Arg Ser ASp Bis Leu Ser Lys His 180 185 190 132 ΕΡ Ο 796 344 /ΡΤ
Ile Lys Thr His Gin Asn Lys Lye Gly Gly Pro Gly vai Ala Leu Ser 195 200 205
Vai Gly Thr Leu Pro Leu Asp ser Gly Ala Gly Ser Glu Gly Ser Gly 210 215 220
Thr Ala Thr Pro ser Ala Leu Ile Thr Thr Asn Met vai Ala Met Glu 225 230 235 240
Ala Ile cys Pro Glu Gly Ile Ala Arg Leu Ala Asn ser Gly Ile Aen 245 250 255
Vai Met Gin Vai Ala Asp Leu Gin Ser Ile Asn Ile ser Gly Asn Gly 260 265 270
Phe (2) INFORMAÇÃO PARA SEQ ID NO:113: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 421 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:113:
Gin Leu Tyr Ser Ala Leu Ala Asn Lys cys Cys His Val Gly Cys Ile 1 5 10 15 Lys Arg Ser Leu Ala Arg Phe Cys Met Ser Met Arg Gin Arg Ile Thr 20 25 30 Leu Lye Asp Tyr Ala Met Arg Phe Gly Gin Thr Lys Thr Ala Lys Asp 35 40 45 Leu Gly Val Tyr Gin Ser Ala Ile Asn Lys Ala Ile His Ala Gly Arg 50 55 60 Lys Ile Phe Leu Thr Ile Asn Ala Asp Gly ser Val Tyr Ala Glu Glu 65 70 75 80 val Lys Pro Phe Pro Ser Asn Lys Lys Thr Thr Ala Ser Asn Lys Lys 85 90 95 Thr Thr Ala Met Ala Asp Asp Asp Pro Tyr Gly Thr Gly Gin Met Phe 100 105 110 133 ΕΡ Ο 796 344 /ΡΤ
His Leu Asη Thr Ala Leu Thr His ser Ile Phe Asn Ala elu Leu Tyr 115 120 125
Ser Pro Glu Ile Pro Leu Ser Thr Asp Gly Pro Tyr Leu Gin Ile Leu 130 135 140
Glu Gin Pro Lys Gin Arg Gly Phe Arg Phe Arg Tyr vai cys Glu Gly 145 150 155 160
Pro Ser Bis Gly Gly Leu Pro Gly Ala ser Ser Glu Lys Asn Lys Lys 165 170 175
Ser Tyr Pro Gin Vai Lys ile Cys Asn Tyr Vai Gly Pro Ala Lys Vai 180 185 190 lie Vai Gin Leu Vai Thr Asn Gly Lys Asn Ile His Leu His Ala Bis 195 200 205
Ser Leu Vai Gly Lys His Cys Glu Asp Gly Vai Cys Thr Vai Thr Ala 210 215 220
Gly Pro Lys Asp Met Vai Vai Gly Phe Ala Asn Leu Gly Ile Leu Bis 225 230 235 240
Vai Thr Lys Lys Lys Vai Phe Glu Thr Leu Glu Ala Arg Het Thr Glu 245 250 255
Ala Cys Ile Arg Gly Tyr Asn Pro Gly Leu Leu Vai His Ser Asp Leu 260 265 270
Ala Tyr Leu Gin Ala Glu Gly Gly Gly Asp Arg Gin Leu Thr Asp Arg 275 280 285
Glu Lys Glu Ile Ile Arg Gin Ala Ala Vai Gin Gin Thr Lys Glu Het 290 295 300
Asp Leu Ser vai vai Arg Leu Het Phe Thr Ala Phe Leu Pro Asp Ser 305 310 315 320
Thr Gly Ser Phe Thr Arg Arg Leu Glu Pro Vai Vai Ser Asp Ala Ile 325 330 335
Tyr Asp Ser Lys Ala Pro Asn Ala ser Asn Leu Lys Ile vai Arg Het 340 345 350
Asp Arg Thr Ala Gly cys vai Thr Gly Gly Glu Glu ile Tyr Leu Leu 35S 360 365
Cys Asp Lys Vai Gin Lys Asp Asp Ile Gin Ile Arg Phe Tyr Glu Glu 370 375 380
Glu Glu Asn Gly Gly Vai Trp Glu Gly Phe Gly Asp Phe Ser Pro Thr 385 390 395 400
Asp Vai His Arg Gin Phe Ala Ile Vai Phe Lys Thr Pro Lys Tyr Lys 405 410 415
Asp val Asn ile Thr 420 (2) INFORMAÇÃO PARA SEQ ID NO:114: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 391 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 134 ΕΡ Ο 796 344 /ΡΤ (ii) TIPO DE MOLÉCULA: proteína
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:114:
Met Arg Gin Arg Ile Thr Leu Lys Asp Tyr Ala Met Arg Phe Gly Gin 1 5 10 15 Thr Lys Thr Ala Lys Aep Leu Gly Val Tyr Gin Ser Ala Ile Asn Lys 20 25 30 Ala Zle Bis Ala Gly Arg Lys Ile Phe Leu Thr Ile Asn Ala Asp Gly 35 40 45 ser Vai Tyr Ala Glu Glu val Lys Pro Phe Pro ser Asn Lye Lys Thr 50 55 60 Thr Ala Met Ala Glu Asp Asp Pro Tyr Leu Gly Arg Pro Glu Gin Met 65 70 75 80 Phe Bis Leu Asp Pro Ser Leu Thr Bis Thr Ile Phe Asn pro Glu Val 85 90 95 Phe Gin Pro Gin Met Ala Leu Pro Thr Ala Asp Gly Pro Tyr Leu Gin 100 105 110 Ile Leu Glu Gin pro Lys Gin Arg Gly Phe Arg Phe Arg Tyr val Cys 115 120 125 Glu Gly Pro Ser Bis Gly Gly Leu Pro Gly Ala ser Ser Glu Lys Asn 130 135 140 Lys Lys ser Tyr Pro Gin Val Lys Ile cys Asn Tyr Val Gly Pro Ala 145 150 155 160 Lys val Ile Val Gin Leu Val Thr Asn Gly Lys Asn lie Bis Leu Bis 165 170 175 Ala Bis ser Leu Val Gly Lys Bis Cys Glu Asp Gly Ile cys Thr val 180 185 190 135 ΕΡ Ο 796 344 /ΡΤ
Thr Ala Gly Pro GlU Asp cys vai His Gly Phe Ala Asn Leu Gly Ile 195 200 205 Leu His Vai Thr Lya Lys Lys Vai Phe Glu Thr Leu Glu Ala Arg Met 210 215 220 Thr Glu Ala cys Ile Arg Gly Tyr Asn Pro Gly Leu Leu Val His Pro 225 230 235 240 Oi m < Leu Ala Tyr Leu Gin Ala Glu Gly Gly Gly Asp Arg Gin Leu Gly 245 250 255 Asp Arg Glu Lys Glu Leu Ile Arg Gin Ala Ala Leu Gin Gin Thr Lys 260 265 270 Glu Met Asp Leu ser vai Vai Arg Leu Met Phe Thr Ala Phe Leu Pro 275 280 285 Asp Ser Thr Gly ser Phe Thr Arg Arg Leu Glu Pro Val val Ser Asp 290 295 300 Ala lie Tyr λβρ ser Lys Ala Pro Asn Ala Ser Asn Leu Lys Ile val 305 310 315 320 Arg Met Asp Arg Thr Ala Gly Cys vai Thr Gly Gly Glu Glu Ile Tyr 325 330 335 Leu Leu cys Asp Lys vai Gin Lys Asp Asp Ile Gin Ile Arg Phe Tyr 340 345 350 Glu Glu GlU Glu Abd Gly Gly vai Trp Glu Gly Phe Gly Asp Phe Ser 355 360 365 Pro Thr Asp Vai His Arg Gin Phe Ala lie Val Phe Lys Thr Pro Lys 370 375 380 Tyr Lys Asp Ile Asn Ile Thr 385 390 (2) INFORMAÇÃO PARA SEQ ID NO:115: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 391 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal 136 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:115:
Met Glu Gin Glu Zle Thr Leu Lys Asp Tyr Ala Met Arg Phe Gly Gin 15 10 15
Thr Lys Thr Ala Lye Asp Leu Gly vai Tyr Gin ser Ala Zle Asn Lys 20 25 30
Ala Zle Bis Ala Gly Arg Lys Zle Phe Leu Thr zle Asn Ala Asp Gly 35 40 45
Ser Vai Tyr Ala Glu Glu vai Lys pro Phe Pro Ser Asn Lys Lys Thr 50 55 SO
Thr Ala Met Ala Glu Asp Asp Pro Tyr Leu Gly Arg Pro Glu Gin Met 65 70 75 80
Phe His Leu Asp Pro Ser Leu Thr His Thr Zle Phe Asn Pro Glu Vai 85 90 95
Phe Gin Pro Gin Met Ala Leu Pro Thr Ala Asp Gly Pro Tyr Leu Gin 100 105 110
Zle Leu Glu Gin Pro Lys Gin Arg Gly Phe Arg Phe Arg Tyr Vai Cys 115 120 125
Glu Gly Pro ser His Gly Gly Leu Pro Gly Ala Ser Ser Glu Lye Asn 130 135 140
Lys Lys Ser Tyr Pro Gin vai Lys Zle cys Asn Tyr vai Gly Pro Ala 145 150 155 160
Leu Bis 175
Lys Vai Zle Vai Gin Leu vai Thr Asn Gly Lys Asn Zle His 165 170
Ala His ser Leu vai Gly Lys His cys Glu Asp Gly zle cye Thr Vai 180 185 190
Thr Ala Gly Pro Glu Asp'Cys Vai His Gly Phe Ala Asn Leu Gly Zle 195 200 205
Leu His Vai Thr Lys Lys Lys Vai 210 215
Thr Glu Ala Cys Zle Arg Gly Tyr 225 230
Asp Leu Ala Tyr Leu Gin Ala Glu 245
Asp Arg Glu Lye Glu Leu zle Arg 260
Glu Met Asp Leu Ser Vai Vai Arg 275 280
Phe Glu Thr Leu Glu Ala Arg Met 220
Asn Pro Gly Leu Leu Vai His Pro 235 240
Gly Gly Gly Asp Arg Gin Leu Gly 250 255
Gin Ala Ala Leu Gin Gin Thr Lys 265 270
Leu Met Phe Thr Ala Phe Leu Pro 285 137 ΕΡ Ο 796 344 /ΡΤ
Asp Ser Thr Gly Ser Phe Thr Arg Arg Leu Glu Pro Vai Vai Ser Asp 290 295 300 Ala Ile Tyr Asp ser Lys Ala Pro Asn Ala ser Asn Leu Lys Ile Vai 305 310 315 320 Arg Met Asp Arg Thr Ala Gly Cys Vai Thr Gly Gly Glu Glu Ile Tyr 325 330 335 Leu Leu Cys Asp Lys vai Gin Lys Asp ASp Ile Gin Ile Arg Phe Tyr 340 345 350 Glu Glu Glu Glu Asn Gly Gly vai Trp Glu Gly Phe Gly Asp Phe ser 355 360 365 Pro Thr Asp vai His Arg Gin Phe Ala Ile vai Phe Lys Thr Pro Lys 370 375 380 Tyr Lys ASP Ile Asn Ile Thr 385 390 (2) INFORMAÇÃO PARA SEQ ID NO:116: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 241 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína
(iii) HIPOTÉTICA: NÃO
(iv) ΑΝΤΙ-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:116:
Met Arg Gin Arg ile Thr Leu Lys Asp Tyr Ala Met Arg Phe Gly Gin 15 10 15
Thr Lys Thr Ala Lys Asp Leu Gly Vai Tyr Gin Ser Ala Ile Asn Lys 20 25 30
Ala ile His Ala Gly Arg Lys Ile Phe Leu Thr He Asn Ala Asp Gly 35 40 45
Ser Vai Tyr Ala Glu Glu vai Lys Pro Phe Pro Ser Asn Lys Lys Thr 50 55 60
Thr Ala ser Asn Lys Lys Thr Thr Ala Gly Asp Pro Gly Lys Lys Lys 65 70 75 80
Gin His ile cys His Ile Gin Gly cys Gly Lys Vai Tyr Gly Lys Thr . 85 90 95 138 ΕΡ Ο 796 344 /ΡΤ
Ser His Leu Arg Ala His Leu Arg Trp His Thr Gly Glu Arg Pro Phe 100 105 no
Met cys Thr Trp ser Tyr cys Gly Lys Arg phe Thr Arg ser Asp Glu 115 120 125
Leu Glu Arg His Lys Arg Thr His Thr Gly Glu Lys Lys Phe Ala cys 130 135 140
Pro Glu cys Pro Lys Arg Phe Met Arg ser Asp His Leu Ser Lys His 145 150 155 160 lie Lys Thr His Gin Asn Lys Lys Gly Gly Pro Gly Vai Ala Leu Ser 165 170 175
Vai Gly Thr Leu Pro Leu Asp ser Gly Ala Gly ser Glu Gly ser Gly 180 185 190
Thr Ala Thr Pro ser Ala Leu lie Thr Thr Asn Met vai Ala Met Glu 195 200 205
Ala ile cys Pro Glu Gly Xle Ala Arg Leu Ala Asn ser Gly lie Asn 210 215 220 vai Met Gin vai Ala Asp Leu Gin Ser Ile Asn Xle Ser Gly Asn Gly 225 230 235 240
Phe (2) INFORMAÇÃO PARA SEQ ID NO:117: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 10 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: ambos (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA : NO
(iv) ANTI-SENTIDO: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:117: GGGAMTNYCC 10 (2) INFORMAÇÃO PARA SEQ ID NO:118: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 72 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-SENTIDO: NÃO (v) TIPO DE FRAGMENTO: N-terminal 139 ΕΡ Ο 796 344 /ΡΤ (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:118: H6t GlU pro val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly ser 1 5 10 15 GlH pro Lys Thr Ala Cys Thr Aan Cys Tyr Cys Lys Lys Cys Cys Phe 20 25 30 Hia Cya Gin Val Cya Phe lie Thr Lya Ala Leu Gly Ile Ser Tyr Gly 35 40 45 Arg Lys Lys Arg Arg Gin Arg Arg Arg Ala His Gin Asn Ser Gin Thr 50 55 60 His Gin Ala Ser Leu Ser Lys Gin 65 70
Lisboa,
Claims (14)
- ΕΡ Ο 796 344 /ΡΤ 1/5 REIVINDICAÇÕES 1. Ácido nucleico sonda (PNA) compreendendo duas sequências diferentes que são: a) uma sequência de cadeia simples (1/2 tbr) que é capaz de formar, sob condições de hibridação, um híbrido (TBR) com um ácido nucleico alvo (TNA); e b) uma sequência de cadeia simples (1/2 BBR) que é capaz de formar, sob condições de hibridação, um híbrido (BBR) com uma sequência de cadeia simples presente num ácido nucleico de reforço (BNA); em que a referida TBR é capaz de se ligar com elevada afinidade a uma substância (TBA) capaz de discriminar entre um híbrido emparelhado (TBR) e um híbrido possuindo nucleótidos desemparelhados, e em que a referida BBR é capaz de se ligar com elevada afinidade a uma substância (BBA) capaz de discriminar entre um híbrido emparelhado (BBR) e um híbrido possuindo nucleótidos desemparelhados.
- 2. pna de acordo com a reivindicação 1 em que a TBR é constituída por um ou mais locais de reconhecimento para uma proteína de ligação a um ácido nucleico, uma proteína de ligação ao ADN, uma proteína de ligação a um híbrido ADN-ARN ou uma proteína de ligação a ARN.
- 3. PNA de acordo com a reivindicação 2 em que a TBR é um local de reconhecimento de uma proteína de ligação a um ácido nucleico presente no genoma de um patogénio ou é um local de ligação associado a uma condição patogénica numa genoma de vertebrado ou é um local de reconhecimento de uma proteína de ligação a um ácido nucleico presente no genoma de um organismo que contamina um processo de fermentação.
- 4. PNA de acordo com a reivindicação 2 em que a TBR é a LTR de HIV ou uma sua porção.
- 5. Método para detecção ou localização de uma sequência de tna específica, compreendendo os passo de: a) hibridação do referido TNA com o PNA da reivindicação 1; ΕΡ Ο 796 344 /ΡΤ 2/5 b) hibridação do referido PNA com um BNA contendo uma 1/2 BBR cuja sequência é complementar a uma sequência de 1/2 BBR no PNA; c) adição dos produtos dos passos (a) e (b) contendo uma TBR e uma BBR, a uma superfície, a um líquido ou a outro meio contendo um TBA; d) adição de BBA à mistura no passo (c) em que os referidos BBA compreendem: i) uma molécula ou uma porção de uma molécula que é capaz de se ligar selectivamente a uma BBR; ii) um indicador detectável; e e) detecção do sinal produzido pelo indicador ligado ao bba.
- 6. Método de acordo com a reivindicação 5 em que o referido indicador é uma proteína, incluindo enzimas capazes de catalisar reacções que conduzam à produção de produtos de reacção coloridos; um radionuclido; esferas coloridas.
- 7. Método in vitro de amplificação do sinal obtido através da ligação do PNA de acordo com a reivindicação 1 a um TNA, que compreende a ligação dos BNA ao híbrido PNA-TNA e a ligação dos BBA marcados aos BNA.
- 8. Método para detecção ou localização de sequências de ácido nucleico específicas com um elevado grau de sensibilidade e especificidade que compreende: a) adição de PNA tal como definidos na reivindicação 1, contendo uma 1/2 BBR e uma 1/2 TBR, a uma amostra contendo ou suspeita de conter TNA contendo sequências de 1/2 TBR, para formar um complexo possuindo regiões de ligação ao alvo, TBR, formadas pela hibridação de 1/2 TBR complementares presentes nos PNA e TNA, respectivamente; b) ligação das TBR formadas no passo (a) a um TBA imobilizado para formar um complexo TBA-TNA-PNA; c) adição de Ácidos Nucleicos de Reforço, BNA, contendo regiões de ligação de reforço, 1/2 BBR, ao complexo formado no passo (b) de modo a que as 1/2 BBR nos BNA hibridem com as sequências de 1/2 BBR presentes nos PNA ou com as 1/2 BBR presentes nos BNA já ligados ao PNA, ΕΡ Ο 796 344 /ΡΤ 3/5 para formar BBR, de modo que se formem complexos TBA-TNA-PNA-(BNA)n; d) adição de Ácidos Nucleicos em "gancho de cabelo", HNA, contendo sequências de 1/2 BBR, ao complexo formado no passo (c) de modo a que as 1/2 BBR nos HNA hibridem com quaisquer sequências de 1/2 BBR disponíveis presentes nos BNA do complexo do passo (c), rematanto deste modo a extensão dos BNA nos complexos TBA-TNA-PNA-(BNA)n do passo (c) para formar complexos TBA-TNA-PNA-(BNA) n-HNA; e) adição de Conjuntos de Ligação de Reforço, BBA, ligados a porções indicadoras, aos complexos TBA-TNA-PNA-(BNA)n-HNA formados no passo (d) para formar complexos TBA-TNA-PNA-(BNA-BBA) n-HNA; e f) detecção dos sinais produzidos pelas porções indicadoras ligadas aos TBA, PNA, BNA, BBA OU HNA nos complexos TBA-TNA-PNA-(BNA-BBA) n-HNA do passo (e); em que o TNA compreende: i) uma ou mais sequências de ácido nucleico de 1/2 TBR específicas, cuja presença ou ausência numa determinada amostra se pretende confirmar; o BNA compreende: i) uma 1/2 BBR, tal como mostrada na Figura 1 (Ilb), que possui uma sequência que é complementar a uma sequência de 1/2 BBR num PNA e que é capaz de formar, sob condições de hibridação, um híbrido, BBR, com o PNA; ii) um OSA, que é sem suporte ou indicador ligado ou com suporte ligado, ou outro meio de localização, incluindo, mas não se limitando a, ligação a esferas, polímeros e superfícies e/ou indicadores; iii) locais de hibridação adicionais, 1/2 BBR, para outros BNA; e iv) sequências, 1/2 BBR, que podem hibridar com BNA já hibridados com o PNA; o BBA compreende: i) uma molécula ou uma porção de uma molécula que é capaz de se ligar selectivamente a uma BBR; e ΕΡ Ο 796 344 /ΡΤ 4/5 ii) um OSA, que é sem suporte e/ou indicador ligado ou com suporte ligado, ou outro meio de localização, incluindo, mas não se limitando a, ligação a esferas, polímeros e superfícies e/ou indicadores; e o tba compreende: i) uma molécula ou uma porção de uma molécula que é capaz de se ligar selectivamente a uma TBR; e ii) sem suporte e/ou indicador ligado ou com suporte ligado, ou outro meio de localização, incluindo, mas não se limitando a, ligação a esferas, polímeros e superfícies e/ou indicadores.
- 9. Método de hibridação de fase sólida para detecção da presença de um polinucleótido alvo através da utilização de um PNA tal como definido na reivindicação 1, envolvendo: a imobilização de um polinucleótido alvo, se presente numa amostra de teste, directamente ou através de uma estrutura de captura intermediária, numa fase sólida num local de captura; antes, durante ou após a referida imobilização, a ligação de um marcador detectável ao referido polinucleótido alvo, se presente; e detecção do referido marcador, se houver algum, no referido local de captura; em que a imobilização compreende a utilização de um conjunto de ligação ao alvo (TBA) que se liga apenas a um único híbrido do ácido nucleico alvo e um ácido nucleico sonda (PNA) compreendendo uma 1/2 BBR capaz de se ligar a um ácido nucleico de reforço (BNA) contendo uma 1/2 BBR complementar de cadeia simples que, após hibridação com a 1/2 BBR no PNA, forma uma BBR capaz de se ligar a conjuntos de ligação de reforço marcados (BBA), em que os termos TBA, BNA, BBR e BNA são tal como definidos na reivindicação 1.
- 10. Estojo de teste de diagnóstico ou forense para a detecção de uma sequência de ácido nucleico alvo numa amostra de ácido nucleico, que compreende uma primeira e uma segunda sondas de ácido nucleico e uma primeira e uma segunda proteínas de ligação ao ácido nucleico, em que a primeira sonda possui uma sequência complementar à sequência alvo e uma sequência adicional; a primeira proteína de ligação é específica para o primeiro dúplex sonda-alvo; ΕΡ Ο 796 344 /ΡΤ 5/5 a segunda sonda é complementar à sequência adicional na primeira sonda; e a segunda proteína de ligação liga-se especificamente ao dúplex primeira sonda-segunda sonda e é marcada com um marcador detectável.
- 11. Estojo de acordo com a reivindicação 10, em que a primeira sonda é complementar à LTR de HIV e, após hibridação da primeira sonda com a LTR de HIV, forma-se um local de ligação para NF-kB ou uma sua subunidade, SP1, proteína de ligação a TATA, HIV-Detect I, II, III ou IV ou HIV-Lock.
- 12. Estojo de acordo com a reivindicação 11, em que a primeira proteína de ligação é NF-kB ou uma sua subunidade, SPl, proteína de ligação a TATA, HIV-Detect I, II, III ou IV ou HIV-Lock.
- 13. Estojo de acordo com qualquer uma das reivindicações 10 a 12, em que a primeira sonda, para além de ser complementar à LTR de HIV, compreende uma sequência que codifica o operador esquerdo ou direito do bacteriófago lambda, e a segunda sonda compreende a sequência complementar à referida sequência do operador esquerdo ou direito do bacteriófago lambda, de modo que, após hibridação da primeira e da segunda sondas, se forma um local de ligação para a proteína repressora Cl do bacteriófago lambda, a proteína cro do bacteriófago lambda ou um seu derivado ou homólogo.
- 14. Estojo de acordo com a reivindicação 13, em que a segunda proteína de ligação é a proteína repressora Cl do bacteriófago lambda, a proteína cro do bacteriófago lambda ou um seu derivado ou homólogo. Lisboa
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/353,476 US5871902A (en) | 1994-12-09 | 1994-12-09 | Sequence-specific detection of nucleic acid hybrids using a DNA-binding molecule or assembly capable of discriminating perfect hybrids from non-perfect hybrids |
Publications (1)
Publication Number | Publication Date |
---|---|
PT796344E true PT796344E (pt) | 2007-05-31 |
Family
ID=23389290
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PT95943035T PT796344E (pt) | 1994-12-09 | 1995-12-07 | Método de detecção de ácidos nucleicos com uma composição de sequência específica. |
Country Status (15)
Country | Link |
---|---|
US (1) | US5871902A (pt) |
EP (2) | EP0796344B1 (pt) |
JP (2) | JPH10510157A (pt) |
CN (2) | CN1936020A (pt) |
AT (1) | ATE353372T1 (pt) |
BR (1) | BR9509977A (pt) |
CA (1) | CA2206127A1 (pt) |
DE (1) | DE69535384T2 (pt) |
DK (1) | DK0796344T3 (pt) |
ES (1) | ES2279516T3 (pt) |
IL (2) | IL150713A (pt) |
MX (1) | MX9704281A (pt) |
NO (2) | NO321557B1 (pt) |
PT (1) | PT796344E (pt) |
WO (1) | WO1996017956A2 (pt) |
Families Citing this family (71)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6140466A (en) | 1994-01-18 | 2000-10-31 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
US20050084885A1 (en) * | 1994-01-18 | 2005-04-21 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
USRE45721E1 (en) | 1994-08-20 | 2015-10-06 | Gendaq, Ltd. | Relating to binding proteins for recognition of DNA |
GB9824544D0 (en) | 1998-11-09 | 1999-01-06 | Medical Res Council | Screening system |
US5871902A (en) * | 1994-12-09 | 1999-02-16 | The Gene Pool, Inc. | Sequence-specific detection of nucleic acid hybrids using a DNA-binding molecule or assembly capable of discriminating perfect hybrids from non-perfect hybrids |
US20030104361A1 (en) * | 1997-09-29 | 2003-06-05 | Susan Weininger | Method of detection of nucleic acids with a specific sequence composition |
US5853990A (en) | 1996-07-26 | 1998-12-29 | Edward E. Winger | Real time homogeneous nucleotide assay |
JP2001501825A (ja) * | 1996-10-04 | 2001-02-13 | ダコ アクティーゼルスカブ | マイコバクテリア(Mycobacteria)の検出のための新規プローブ |
GB9710809D0 (en) * | 1997-05-23 | 1997-07-23 | Medical Res Council | Nucleic acid binding proteins |
US6410248B1 (en) | 1998-01-30 | 2002-06-25 | Massachusetts Institute Of Technology | General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites |
EP1060261B1 (en) * | 1998-03-02 | 2010-05-05 | Massachusetts Institute of Technology | Poly zinc finger proteins with improved linkers |
US6235480B1 (en) * | 1998-03-13 | 2001-05-22 | Promega Corporation | Detection of nucleic acid hybrids |
US6335162B1 (en) | 1998-03-13 | 2002-01-01 | Promega Corporation | Nucleic acid detection |
US6391551B1 (en) | 1998-03-13 | 2002-05-21 | Promega Corporation | Detection of nucleic acid hybrids |
US6268146B1 (en) | 1998-03-13 | 2001-07-31 | Promega Corporation | Analytical methods and materials for nucleic acid detection |
US7090975B2 (en) | 1998-03-13 | 2006-08-15 | Promega Corporation | Pyrophosphorolysis and incorporation of nucleotide method for nucleic acid detection |
US6270973B1 (en) | 1998-03-13 | 2001-08-07 | Promega Corporation | Multiplex method for nucleic acid detection |
US6703211B1 (en) | 1998-03-13 | 2004-03-09 | Promega Corporation | Cellular detection by providing high energy phosphate donor other than ADP to produce ATP |
US6312902B1 (en) | 1998-03-13 | 2001-11-06 | Promega Corporation | Nucleic acid detection |
US6270974B1 (en) | 1998-03-13 | 2001-08-07 | Promega Corporation | Exogenous nucleic acid detection |
AU751487B2 (en) | 1998-03-17 | 2002-08-15 | Gendaq Limited | Nucleic acid binding proteins |
US6287772B1 (en) | 1998-04-29 | 2001-09-11 | Boston Probes, Inc. | Methods, kits and compositions for detecting and quantitating target sequences |
US6664045B1 (en) | 1998-06-18 | 2003-12-16 | Boston Probes, Inc. | PNA probes, probe sets, methods and kits pertaining to the detection of microorganisms |
US7013219B2 (en) * | 1999-01-12 | 2006-03-14 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US6599692B1 (en) | 1999-09-14 | 2003-07-29 | Sangamo Bioscience, Inc. | Functional genomics using zinc finger proteins |
US6534261B1 (en) * | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US7070934B2 (en) | 1999-01-12 | 2006-07-04 | Sangamo Biosciences, Inc. | Ligand-controlled regulation of endogenous gene expression |
US6453242B1 (en) | 1999-01-12 | 2002-09-17 | Sangamo Biosciences, Inc. | Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites |
US6794136B1 (en) | 2000-11-20 | 2004-09-21 | Sangamo Biosciences, Inc. | Iterative optimization in the design of binding proteins |
US20030104526A1 (en) * | 1999-03-24 | 2003-06-05 | Qiang Liu | Position dependent recognition of GNN nucleotide triplets by zinc fingers |
US7030215B2 (en) * | 1999-03-24 | 2006-04-18 | Sangamo Biosciences, Inc. | Position dependent recognition of GNN nucleotide triplets by zinc fingers |
AU6751800A (en) * | 1999-08-13 | 2001-03-13 | Aventis Research And Technologies Gmbh | Microelectronic molecular descriptor array devices, methods, procedures, and formats for combinatorial selection of intermolecular ligand binding structures and for drug screening |
US6428957B1 (en) | 1999-11-08 | 2002-08-06 | Agilent Technologies, Inc. | Systems tools and methods of assaying biological materials using spatially-addressable arrays |
AU776576B2 (en) | 1999-12-06 | 2004-09-16 | Sangamo Biosciences, Inc. | Methods of using randomized libraries of zinc finger proteins for the identification of gene function |
EP1250424B1 (en) * | 2000-01-24 | 2007-02-28 | Gendaq, Ltd. | Nucleic acid binding polypeptides characterized by flexible linkers connected nucleic acid binding modules |
US6235483B1 (en) | 2000-01-31 | 2001-05-22 | Agilent Technologies, Inc. | Methods and kits for indirect labeling of nucleic acids |
WO2001075174A2 (en) * | 2000-04-03 | 2001-10-11 | Cytyc Corporation | Detection and typing of human papillomavirus using pna probes |
AU2001286584A1 (en) * | 2000-08-18 | 2002-03-04 | Massachusetts Institute Of Technology | Inhibition of protein-protein interaction |
AU2002225623A8 (en) * | 2000-11-17 | 2009-07-30 | John G Wise | Creation and identification of proteins having new dna binding specificities |
US7067317B2 (en) * | 2000-12-07 | 2006-06-27 | Sangamo Biosciences, Inc. | Regulation of angiogenesis with zinc finger proteins |
US7026462B2 (en) * | 2000-12-07 | 2006-04-11 | Sangamo Biosciences, Inc. | Regulation of angiogenesis with zinc finger proteins |
EP1288292A1 (en) * | 2001-08-31 | 2003-03-05 | Leids Universitair Medisch Centrum | Long peptides of 22-40 amino acid residues that induce and/or enhance antigen specific immune responses. |
ES2409080T3 (es) | 2001-01-22 | 2013-06-24 | Sangamo Biosciences Inc. | Proteínas de unión con dedos de zinc modificadas |
US20040161753A1 (en) * | 2001-11-16 | 2004-08-19 | Wise John G. | Creation and identification of proteins having new dna binding specificities |
US7262054B2 (en) * | 2002-01-22 | 2007-08-28 | Sangamo Biosciences, Inc. | Zinc finger proteins for DNA binding and gene regulation in plants |
CN100507564C (zh) * | 2002-04-09 | 2009-07-01 | 唐舜荣 | 改进的通过颗粒结合来检测靶分子的方法 |
US7361635B2 (en) | 2002-08-29 | 2008-04-22 | Sangamo Biosciences, Inc. | Simultaneous modulation of multiple genes |
US7563600B2 (en) | 2002-09-12 | 2009-07-21 | Combimatrix Corporation | Microarray synthesis and assembly of gene-length polynucleotides |
JP2005304489A (ja) * | 2004-03-24 | 2005-11-04 | Sysmex Corp | 標的物質検出用プローブセット及び標的物質検出方法。 |
WO2007109749A2 (en) * | 2006-03-21 | 2007-09-27 | Wyeth | Methods for preventing and treating amyloidogenic diseases |
US20070231805A1 (en) * | 2006-03-31 | 2007-10-04 | Baynes Brian M | Nucleic acid assembly optimization using clamped mismatch binding proteins |
WO2007136834A2 (en) * | 2006-05-19 | 2007-11-29 | Codon Devices, Inc. | Combined extension and ligation for nucleic acid assembly |
CN104849228B (zh) * | 2006-06-29 | 2018-04-13 | 皇家飞利浦电子股份有限公司 | 使用基于uv 光的dna 成像细胞术来检测和/或诊断癌症的体外方法 |
WO2008027558A2 (en) | 2006-08-31 | 2008-03-06 | Codon Devices, Inc. | Iterative nucleic acid assembly using activation of vector-encoded traits |
WO2008062479A2 (en) * | 2006-11-21 | 2008-05-29 | Jawaharlal Nehru Centre For Advanced Scientific Research | A high sensitivity assay for molecular typing of biological sample, probes and a kit thereof |
CN102292451A (zh) * | 2008-06-30 | 2011-12-21 | 生物纳米芯股份有限公司 | 用于单分子全基因组分析的方法和装置 |
CN102597006A (zh) * | 2009-09-16 | 2012-07-18 | 梅西大学 | 融合多肽以及其应用 |
WO2011056872A2 (en) | 2009-11-03 | 2011-05-12 | Gen9, Inc. | Methods and microfluidic devices for the manipulation of droplets in high fidelity polynucleotide assembly |
WO2011066185A1 (en) | 2009-11-25 | 2011-06-03 | Gen9, Inc. | Microfluidic devices and methods for gene synthesis |
WO2011085075A2 (en) | 2010-01-07 | 2011-07-14 | Gen9, Inc. | Assembly of high fidelity polynucleotides |
US9295965B2 (en) | 2010-11-12 | 2016-03-29 | Gen9, Inc. | Methods and devices for nucleic acid synthesis |
EP2637780B1 (en) | 2010-11-12 | 2022-02-09 | Gen9, Inc. | Protein arrays and methods of using and making the same |
US20130059296A1 (en) | 2011-08-26 | 2013-03-07 | Gen9, Inc. | Compositions and Methods For High Fidelity Assembly of Nucleic Acids |
US9150853B2 (en) | 2012-03-21 | 2015-10-06 | Gen9, Inc. | Methods for screening proteins using DNA encoded chemical libraries as templates for enzyme catalysis |
CA2871505C (en) | 2012-04-24 | 2021-10-12 | Gen9, Inc. | Methods for sorting nucleic acids and multiplexed preparative in vitro cloning |
US20150191719A1 (en) | 2012-06-25 | 2015-07-09 | Gen9, Inc. | Methods for Nucleic Acid Assembly and High Throughput Sequencing |
BR112015011224A2 (pt) * | 2012-11-15 | 2017-10-31 | Molecular Detection Israel Ltd | misturas de reação de pcr e métodos de usar as mesmas |
CN105039586A (zh) * | 2015-04-20 | 2015-11-11 | 广东温氏食品集团股份有限公司 | 检测鸭2型腺病毒的引物及试剂盒 |
CN105039587A (zh) * | 2015-04-20 | 2015-11-11 | 广东温氏食品集团股份有限公司 | 用于检测鸭腺病毒2型的引物对及试剂盒 |
KR20210107618A (ko) | 2018-12-21 | 2021-09-01 | 일루미나, 인코포레이티드 | 뉴클레아제 기반 rna 고갈 |
CN114592022A (zh) * | 2022-03-30 | 2022-06-07 | 南京大学 | 一种基于dna模板的长链tna合成方法 |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4556643A (en) * | 1982-07-26 | 1985-12-03 | Agracetus | Assay method and probe for polynucleotide sequences |
US4948882A (en) * | 1983-02-22 | 1990-08-14 | Syngene, Inc. | Single-stranded labelled oligonucleotides, reactive monomers and methods of synthesis |
US4623627A (en) * | 1983-08-19 | 1986-11-18 | Cetus Corporation | Monoclonal antibody having specificity for the double-stranded conformation of native DNA and diagnostic methods using same |
US4777129A (en) * | 1983-12-12 | 1988-10-11 | Molecular Diagnostics, Inc. | Nucleic acid probe detectable by specific nucleic acid binding protein |
EP0146039A3 (en) * | 1983-12-12 | 1986-08-27 | Miles Inc. | Hybridization assay with immobilization of hybrids by antihybrid binding |
US4724202A (en) * | 1983-12-12 | 1988-02-09 | Molecular Diagnostics, Inc. | Use of non-hybridizable nucleic acids for the detection of nucleic acid hybridization |
US5118605A (en) * | 1984-10-16 | 1992-06-02 | Chiron Corporation | Polynucleotide determination with selectable cleavage sites |
US4775619A (en) * | 1984-10-16 | 1988-10-04 | Chiron Corporation | Polynucleotide determination with selectable cleavage sites |
US4683195A (en) * | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
US4751177A (en) * | 1985-06-13 | 1988-06-14 | Amgen | Methods and kits for performing nucleic acid hybridization assays |
US4794075A (en) * | 1985-08-29 | 1988-12-27 | Lifecodes Corporation | Method for locating and purifying DNA containing single base mismatches |
US4868105A (en) * | 1985-12-11 | 1989-09-19 | Chiron Corporation | Solution phase nucleic acid sandwich assay |
US4882269A (en) * | 1985-12-13 | 1989-11-21 | Princeton University | Amplified hybridization assay |
US5306614A (en) * | 1986-01-22 | 1994-04-26 | Institut Pasteur | Methods and kits for diagnosing human immunodeficiency virus type 2(HIV-2) |
US4960691A (en) * | 1986-09-29 | 1990-10-02 | Abbott Laboratories | Chromatographic test strip for determining ligands or receptors |
US5310650A (en) * | 1986-09-29 | 1994-05-10 | Abbott Laboratoires | Method and device for improved reaction kinetics in nucleic acid hybridizations |
WO1988006601A1 (en) * | 1987-03-02 | 1988-09-07 | Genex Corporation | Gene repressors |
US5124246A (en) * | 1987-10-15 | 1992-06-23 | Chiron Corporation | Nucleic acid multimers and amplified nucleic acid hybridization assays using same |
US5185243A (en) * | 1988-08-25 | 1993-02-09 | Syntex (U.S.A.) Inc. | Method for detection of specific nucleic acid sequences |
JP2739068B2 (ja) * | 1988-09-24 | 1998-04-08 | 春馬 川口 | Dna固定ミクロスフェア及びそれを用いるdna転写制御因子精製法 |
US5324829A (en) * | 1988-12-16 | 1994-06-28 | Ortho Diagnostic Systems, Inc. | High specific activity nucleic acid probes having target recognition and signal generating moieties |
US5096815A (en) * | 1989-01-06 | 1992-03-17 | Protein Engineering Corporation | Generation and selection of novel dna-binding proteins and polypeptides |
US5198346A (en) * | 1989-01-06 | 1993-03-30 | Protein Engineering Corp. | Generation and selection of novel DNA-binding proteins and polypeptides |
US5556750A (en) * | 1989-05-12 | 1996-09-17 | Duke University | Methods and kits for fractionating a population of DNA molecules based on the presence or absence of a base-pair mismatch utilizing mismatch repair systems |
US5459039A (en) * | 1989-05-12 | 1995-10-17 | Duke University | Methods for mapping genetic mutations |
WO1991006679A1 (en) * | 1989-10-24 | 1991-05-16 | Stratagene | An improved method for hybridizing nucleic acids using single-stranded nucleic acid binding protein |
US5215899A (en) * | 1989-11-09 | 1993-06-01 | Miles Inc. | Nucleic acid amplification employing ligatable hairpin probe and transcription |
US5215882A (en) * | 1989-11-30 | 1993-06-01 | Ortho Diagnostic Systems, Inc. | Method of immobilizing nucleic acid on a solid surface for use in nucleic acid hybridization assays |
WO1991011534A1 (en) * | 1990-01-24 | 1991-08-08 | The United States Of America, As Represented By The Secretary, U.S. Department Of Commerce | A rapid and sensitive test for detecting hepatitis a virus |
US5200314A (en) * | 1990-03-23 | 1993-04-06 | Chiron Corporation | Polynucleotide capture assay employing in vitro amplification |
CA2039517C (en) * | 1990-04-03 | 2006-11-07 | David Segev | Dna probe signal amplification |
CA2040896C (en) * | 1990-04-20 | 2002-01-29 | Edwin F. Ullman | Double receptor polynucleotide assay method |
AU2028792A (en) * | 1991-05-17 | 1992-12-30 | Uab Research Foundation | Sequence specific dna binding drugs |
DE69213112T2 (de) * | 1991-06-20 | 1997-04-03 | Hoffmann La Roche | Verbesserte Methoden zur Nukleinsäure-Amplifizierung |
WO1993000446A1 (en) * | 1991-06-27 | 1993-01-07 | Genelabs Technologies, Inc. | Screening assay for the detection of dna-binding molecules |
EP0672177B1 (en) * | 1992-01-28 | 2006-07-19 | President And Fellows of Harvard College | Method for nucleic acid hybridization using single-stranded dna binding protein |
AU3919293A (en) * | 1992-03-27 | 1993-11-08 | University Of Maryland At Baltimore | Detection of gene mutations with mismatch repair enzymes |
JPH05308999A (ja) * | 1992-05-08 | 1993-11-22 | Sumitomo Metal Ind Ltd | B型肝炎ウイルスpre−C変異の判定法 |
WO1994017087A1 (en) * | 1993-01-28 | 1994-08-04 | The Regents Of The University Of California | Tata-binding protein associated factors, nucleic acids encoding tafs, and methods of use |
US5593834A (en) * | 1993-06-17 | 1997-01-14 | The Research Foundation Of State University Of New York | Method of preparing DNA sequences with known ligand binding characteristics |
US5871902A (en) * | 1994-12-09 | 1999-02-16 | The Gene Pool, Inc. | Sequence-specific detection of nucleic acid hybrids using a DNA-binding molecule or assembly capable of discriminating perfect hybrids from non-perfect hybrids |
-
1994
- 1994-12-09 US US08/353,476 patent/US5871902A/en not_active Expired - Lifetime
-
1995
- 1995-12-07 CA CA002206127A patent/CA2206127A1/en not_active Abandoned
- 1995-12-07 EP EP95943035A patent/EP0796344B1/en not_active Expired - Lifetime
- 1995-12-07 WO PCT/US1995/015944 patent/WO1996017956A2/en active IP Right Grant
- 1995-12-07 AT AT95943035T patent/ATE353372T1/de active
- 1995-12-07 BR BR9509977A patent/BR9509977A/pt not_active Application Discontinuation
- 1995-12-07 EP EP07002519A patent/EP1820864A3/en not_active Withdrawn
- 1995-12-07 JP JP8517797A patent/JPH10510157A/ja not_active Withdrawn
- 1995-12-07 ES ES95943035T patent/ES2279516T3/es not_active Expired - Lifetime
- 1995-12-07 PT PT95943035T patent/PT796344E/pt unknown
- 1995-12-07 DK DK95943035T patent/DK0796344T3/da active
- 1995-12-07 DE DE69535384T patent/DE69535384T2/de not_active Expired - Lifetime
- 1995-12-07 CN CN200610071545.7A patent/CN1936020A/zh active Pending
- 1995-12-07 CN CN95197558.7A patent/CN1255551C/zh not_active Expired - Fee Related
- 1995-12-10 IL IL150713A patent/IL150713A/en not_active IP Right Cessation
- 1995-12-10 IL IL11632195A patent/IL116321A/en not_active IP Right Cessation
-
1997
- 1997-06-06 NO NO19972611A patent/NO321557B1/no not_active IP Right Cessation
- 1997-06-06 MX MX9704281A patent/MX9704281A/es not_active IP Right Cessation
-
2005
- 2005-06-17 NO NO20052968A patent/NO20052968D0/no not_active Application Discontinuation
-
2006
- 2006-06-13 JP JP2006163414A patent/JP4598722B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH10510157A (ja) | 1998-10-06 |
IL116321A0 (en) | 1996-03-31 |
EP1820864A3 (en) | 2008-01-23 |
IL116321A (en) | 2004-09-27 |
NO20052968L (no) | 1997-08-11 |
NO972611L (no) | 1997-08-11 |
DK0796344T3 (da) | 2007-06-04 |
DE69535384T2 (de) | 2007-09-13 |
WO1996017956A2 (en) | 1996-06-13 |
WO1996017956A3 (en) | 1997-07-24 |
IL150713A (en) | 2011-02-28 |
EP0796344A1 (en) | 1997-09-24 |
ATE353372T1 (de) | 2007-02-15 |
CN1176663A (zh) | 1998-03-18 |
DE69535384D1 (de) | 2007-03-22 |
ES2279516T3 (es) | 2007-08-16 |
EP0796344B1 (en) | 2007-02-07 |
JP2006320326A (ja) | 2006-11-30 |
NO321557B1 (no) | 2006-05-29 |
MX9704281A (es) | 1998-07-31 |
CN1936020A (zh) | 2007-03-28 |
NO972611D0 (no) | 1997-06-06 |
EP1820864A2 (en) | 2007-08-22 |
CA2206127A1 (en) | 1996-06-13 |
NO20052968D0 (no) | 2005-06-17 |
US5871902A (en) | 1999-02-16 |
CN1255551C (zh) | 2006-05-10 |
JP4598722B2 (ja) | 2010-12-15 |
BR9509977A (pt) | 1998-06-09 |
IL150713A0 (en) | 2003-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
PT796344E (pt) | Método de detecção de ácidos nucleicos com uma composição de sequência específica. | |
US8114962B2 (en) | Method of detection of nucleic acids with a specific sequence composition | |
CN108368538B (zh) | 用于生成邻近探针的方法 | |
KR100830623B1 (ko) | 핵산의 프라이머 기초 멀티플렉스 증폭을 위한 방법 및 키트 | |
JPH02135100A (ja) | 特異的核酸配列の検出方法 | |
BR0111992B1 (pt) | Métodos para detectar um ácido nucleico alvo por captura de híbrido de tipo específico | |
WO2004042057A1 (ja) | 遺伝子変異検出法 | |
CN113186341B (zh) | CRISPR介导的一步式恒温扩增检测SARS-CoV-2的方法 | |
JPH10508746A (ja) | rasがん遺伝子、特にK−rasがん遺伝子の検出方法 | |
JP2003503011A (ja) | 固定プローブを使用する微生物の検出方法 | |
WO2011022820A1 (en) | Binding-induced hairpin detection system | |
JP7313485B2 (ja) | 核酸検出用多価核酸ナノ構造体及びこれを用いた高感度核酸探針 | |
He et al. | Signal extraction, transformation, and magnification for ultrasensitive and specific detection of nucleic acids | |
AU757472B2 (en) | Method of detection of nucleic acids with a specific sequence composition | |
AU2007201871A1 (en) | Method of detection of nucleic acids with a specific sequence composition | |
AU4418996A (en) | Method of detection of nucleic acids with a specific sequence composition | |
WO2024062126A1 (en) | Method of detection of a target nucleic acid sequence | |
JP4134351B2 (ja) | 核酸結合用粒子担体 | |
JP2003164299A (ja) | オリゴヌクレオチド自己集合体の検出方法及び遺伝子の定量分析方法 | |
LE et al. | Patent 2772123 Summary | |
AU1523799A (en) | Methods and compositions for detection of specific nucleotide sequences | |
JP2005504308A (ja) | 標的分子および分子間相互作用の検出法 | |
Lundeberg | DIANA, A DNA-diagnostic method for detection and analysis of viruses, bacteria and parasites. | |
WO2003083106A1 (fr) | Procede permettant de tester un acide nucleique cible et kit associe | |
JP2006055065A (ja) | 非対称pcrを用いた核酸の検出方法、ポリヌクレオチドプローブ、それを固定するプローブ固定化担体およびキット |