CZ20031090A3 - Způsob provozování počítačového systému pro provádění diskrétní podstrukturní analýzy - Google Patents
Způsob provozování počítačového systému pro provádění diskrétní podstrukturní analýzy Download PDFInfo
- Publication number
- CZ20031090A3 CZ20031090A3 CZ20031090A CZ20031090A CZ20031090A3 CZ 20031090 A3 CZ20031090 A3 CZ 20031090A3 CZ 20031090 A CZ20031090 A CZ 20031090A CZ 20031090 A CZ20031090 A CZ 20031090A CZ 20031090 A3 CZ20031090 A3 CZ 20031090A3
- Authority
- CZ
- Czechia
- Prior art keywords
- chemical
- molecules
- compounds
- fragment
- fragments
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 250
- 238000004458 analytical method Methods 0.000 title claims abstract description 59
- 239000000126 substance Substances 0.000 claims abstract description 369
- 239000012634 fragment Substances 0.000 claims abstract description 254
- 230000008569 process Effects 0.000 claims abstract description 99
- 230000000144 pharmacologic effect Effects 0.000 claims abstract description 37
- 150000001875 compounds Chemical class 0.000 claims description 321
- 230000000694 effects Effects 0.000 claims description 90
- 238000012360 testing method Methods 0.000 claims description 44
- 238000004364 calculation method Methods 0.000 claims description 26
- 150000001413 amino acids Chemical class 0.000 claims description 16
- 238000003041 virtual screening Methods 0.000 claims description 16
- 238000013459 approach Methods 0.000 claims description 12
- 230000027455 binding Effects 0.000 claims description 12
- 102000004169 proteins and genes Human genes 0.000 claims description 10
- 108090000623 proteins and genes Proteins 0.000 claims description 10
- 239000003814 drug Substances 0.000 claims description 9
- 230000014509 gene expression Effects 0.000 claims description 9
- 229940079593 drug Drugs 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 3
- 230000004807 localization Effects 0.000 claims 1
- 150000007523 nucleic acids Chemical group 0.000 claims 1
- 230000002110 toxicologic effect Effects 0.000 abstract description 12
- 238000007876 drug discovery Methods 0.000 abstract description 10
- 231100000027 toxicology Toxicity 0.000 abstract description 7
- 238000000137 annealing Methods 0.000 abstract description 5
- 230000002363 herbicidal effect Effects 0.000 abstract description 4
- 230000000361 pesticidal effect Effects 0.000 abstract description 4
- 230000003197 catalytic effect Effects 0.000 abstract description 3
- 239000003292 glue Substances 0.000 abstract 1
- 230000006870 function Effects 0.000 description 132
- 102000005962 receptors Human genes 0.000 description 43
- 108020003175 receptors Proteins 0.000 description 43
- 239000003112 inhibitor Substances 0.000 description 35
- 230000002401 inhibitory effect Effects 0.000 description 34
- 239000003446 ligand Substances 0.000 description 33
- 108091000080 Phosphotransferase Proteins 0.000 description 30
- 102000020233 phosphotransferase Human genes 0.000 description 30
- 230000004071 biological effect Effects 0.000 description 29
- 230000000875 corresponding effect Effects 0.000 description 28
- 238000004422 calculation algorithm Methods 0.000 description 24
- 238000003556 assay Methods 0.000 description 22
- 230000015572 biosynthetic process Effects 0.000 description 22
- 238000012216 screening Methods 0.000 description 21
- 230000001965 increasing effect Effects 0.000 description 19
- 108090000765 processed proteins & peptides Proteins 0.000 description 19
- 108091006146 Channels Proteins 0.000 description 17
- 229940024606 amino acid Drugs 0.000 description 16
- 235000001014 amino acid Nutrition 0.000 description 16
- 238000003786 synthesis reaction Methods 0.000 description 14
- 108090000862 Ion Channels Proteins 0.000 description 12
- 102000004310 Ion Channels Human genes 0.000 description 12
- 108091005804 Peptidases Proteins 0.000 description 11
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 11
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 11
- 239000004365 Protease Substances 0.000 description 11
- 230000005764 inhibitory process Effects 0.000 description 11
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 10
- VYFYYTLLBUKUHU-UHFFFAOYSA-N dopamine Chemical compound NCCC1=CC=C(O)C(O)=C1 VYFYYTLLBUKUHU-UHFFFAOYSA-N 0.000 description 10
- 238000013537 high throughput screening Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 238000009826 distribution Methods 0.000 description 9
- 239000003596 drug target Substances 0.000 description 9
- 238000011835 investigation Methods 0.000 description 9
- 239000000463 material Substances 0.000 description 9
- 235000018102 proteins Nutrition 0.000 description 9
- 108010016626 Dipeptides Proteins 0.000 description 8
- 108010052164 Sodium Channels Proteins 0.000 description 8
- 102000018674 Sodium Channels Human genes 0.000 description 8
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 8
- 125000003275 alpha amino acid group Chemical group 0.000 description 8
- 238000010276 construction Methods 0.000 description 8
- 229940043355 kinase inhibitor Drugs 0.000 description 8
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 8
- 239000003757 phosphotransferase inhibitor Substances 0.000 description 8
- 238000007423 screening assay Methods 0.000 description 8
- 229940126062 Compound A Drugs 0.000 description 7
- NLDMNSXOCDLTTB-UHFFFAOYSA-N Heterophylliin A Natural products O1C2COC(=O)C3=CC(O)=C(O)C(O)=C3C3=C(O)C(O)=C(O)C=C3C(=O)OC2C(OC(=O)C=2C=C(O)C(O)=C(O)C=2)C(O)C1OC(=O)C1=CC(O)=C(O)C(O)=C1 NLDMNSXOCDLTTB-UHFFFAOYSA-N 0.000 description 7
- 230000000903 blocking effect Effects 0.000 description 7
- 239000007795 chemical reaction product Substances 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 7
- 238000007824 enzymatic assay Methods 0.000 description 7
- 239000002213 purine nucleotide Substances 0.000 description 7
- 125000000561 purinyl group Chemical class N1=C(N=C2N=CNC2=C1)* 0.000 description 7
- 230000002588 toxic effect Effects 0.000 description 7
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000001747 exhibiting effect Effects 0.000 description 6
- 229910052757 nitrogen Inorganic materials 0.000 description 6
- 239000000018 receptor agonist Substances 0.000 description 6
- 229940044601 receptor agonist Drugs 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 231100000331 toxic Toxicity 0.000 description 6
- 229960004441 tyrosine Drugs 0.000 description 6
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 6
- 229910052799 carbon Inorganic materials 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 238000013329 compounding Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 5
- 229960003638 dopamine Drugs 0.000 description 5
- 229910052739 hydrogen Inorganic materials 0.000 description 5
- 230000003389 potentiating effect Effects 0.000 description 5
- 239000000376 reactant Substances 0.000 description 5
- 102000001253 Protein Kinase Human genes 0.000 description 4
- 238000004617 QSAR study Methods 0.000 description 4
- MMWCIQZXVOZEGG-HOZKJCLWSA-N [(1S,2R,3S,4S,5R,6S)-2,3,5-trihydroxy-4,6-diphosphonooxycyclohexyl] dihydrogen phosphate Chemical compound O[C@H]1[C@@H](O)[C@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@H](O)[C@H]1OP(O)(O)=O MMWCIQZXVOZEGG-HOZKJCLWSA-N 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 150000005829 chemical entities Chemical class 0.000 description 4
- 239000002532 enzyme inhibitor Substances 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- 239000005556 hormone Substances 0.000 description 4
- 229940088597 hormone Drugs 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 230000006916 protein interaction Effects 0.000 description 4
- 108060006633 protein kinase Proteins 0.000 description 4
- 102000028828 purine nucleotide binding proteins Human genes 0.000 description 4
- 108091009376 purine nucleotide binding proteins Proteins 0.000 description 4
- 108010085082 sigma receptors Proteins 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 229940102550 Estrogen receptor antagonist Drugs 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- 108090000137 Opioid Receptors Proteins 0.000 description 3
- 102000003840 Opioid Receptors Human genes 0.000 description 3
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 3
- 239000000556 agonist Substances 0.000 description 3
- -1 but not limited to Chemical class 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- JNGZXGGOCLZBFB-IVCQMTBJSA-N compound E Chemical compound N([C@@H](C)C(=O)N[C@@H]1C(N(C)C2=CC=CC=C2C(C=2C=CC=CC=2)=N1)=O)C(=O)CC1=CC(F)=CC(F)=C1 JNGZXGGOCLZBFB-IVCQMTBJSA-N 0.000 description 3
- 230000030609 dephosphorylation Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000002288 dopamine 2 receptor stimulating agent Substances 0.000 description 3
- 102000015694 estrogen receptors Human genes 0.000 description 3
- 108010038795 estrogen receptors Proteins 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000002825 functional assay Methods 0.000 description 3
- 239000004009 herbicide Substances 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 239000000575 pesticide Substances 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 230000009822 protein phosphorylation Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 229910052717 sulfur Inorganic materials 0.000 description 3
- 239000003440 toxic substance Substances 0.000 description 3
- 231100000419 toxicity Toxicity 0.000 description 3
- 230000001988 toxicity Effects 0.000 description 3
- 238000005303 weighing Methods 0.000 description 3
- 108010001857 Cell Surface Receptors Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- 206010061218 Inflammation Diseases 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 230000008484 agonism Effects 0.000 description 2
- 230000008485 antagonism Effects 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 230000030833 cell death Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 231100000481 chemical toxicant Toxicity 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000006209 dephosphorylation reaction Methods 0.000 description 2
- 238000009510 drug design Methods 0.000 description 2
- 239000000328 estrogen antagonist Substances 0.000 description 2
- 235000012041 food component Nutrition 0.000 description 2
- 239000005417 food ingredient Substances 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 230000004054 inflammatory process Effects 0.000 description 2
- 229960000367 inositol Drugs 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 102000006240 membrane receptors Human genes 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 230000004770 neurodegeneration Effects 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 229960005190 phenylalanine Drugs 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 235000021317 phosphate Nutrition 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 229940121649 protein inhibitor Drugs 0.000 description 2
- 239000012268 protein inhibitor Substances 0.000 description 2
- 230000005588 protonation Effects 0.000 description 2
- 238000003653 radioligand binding assay Methods 0.000 description 2
- 229940044551 receptor antagonist Drugs 0.000 description 2
- 239000002464 receptor antagonist Substances 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 2
- 239000003982 sigma receptor ligand Substances 0.000 description 2
- 238000012916 structural analysis Methods 0.000 description 2
- 125000001424 substituent group Chemical group 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 231100000723 toxicological property Toxicity 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- YFGBQHOOROIVKG-BHDDXSALSA-N (2R)-2-[[(2R)-2-[[2-[[2-[[(2S)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]-4-methylsulfanylbutanoic acid Chemical compound C([C@H](C(=O)N[C@H](CCSC)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 YFGBQHOOROIVKG-BHDDXSALSA-N 0.000 description 1
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- DLGAUVSRZXNATA-DHYYHALDSA-N (2s,3s)-2-amino-3-methylpentanoic acid;(2s)-pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1.CC[C@H](C)[C@H](N)C(O)=O DLGAUVSRZXNATA-DHYYHALDSA-N 0.000 description 1
- IQUPABOKLQSFBK-UHFFFAOYSA-N 2-nitrophenol Chemical compound OC1=CC=CC=C1[N+]([O-])=O IQUPABOKLQSFBK-UHFFFAOYSA-N 0.000 description 1
- 238000010953 Ames test Methods 0.000 description 1
- 231100000039 Ames test Toxicity 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 102400000748 Beta-endorphin Human genes 0.000 description 1
- 101800005049 Beta-endorphin Proteins 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 102000015554 Dopamine receptor Human genes 0.000 description 1
- 108050004812 Dopamine receptor Proteins 0.000 description 1
- 102400000242 Dynorphin A(1-17) Human genes 0.000 description 1
- 108010065372 Dynorphins Proteins 0.000 description 1
- 238000000729 Fisher's exact test Methods 0.000 description 1
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 1
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 206010062767 Hypophysitis Diseases 0.000 description 1
- 108010044467 Isoenzymes Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 102400000243 Leu-enkephalin Human genes 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108010022337 Leucine Enkephalin Proteins 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 231100000002 MTT assay Toxicity 0.000 description 1
- 238000000134 MTT assay Methods 0.000 description 1
- 102400000988 Met-enkephalin Human genes 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108010042237 Methionine Enkephalin Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 102000016979 Other receptors Human genes 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 229940122907 Phosphatase inhibitor Drugs 0.000 description 1
- 102000004861 Phosphoric Diester Hydrolases Human genes 0.000 description 1
- 108090001050 Phosphoric Diester Hydrolases Proteins 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 206010070834 Sensitisation Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 229940122490 Sigma receptor antagonist Drugs 0.000 description 1
- 108010085012 Steroid Receptors Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 229960003121 arginine Drugs 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- WOPZMFQRCBYPJU-NTXHZHDSSA-N beta-endorphin Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)[C@@H](C)O)C1=CC=CC=C1 WOPZMFQRCBYPJU-NTXHZHDSSA-N 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 150000001607 bioavailable molecules Chemical class 0.000 description 1
- 238000012742 biochemical analysis Methods 0.000 description 1
- 238000010256 biochemical assay Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 125000000837 carbohydrate group Chemical group 0.000 description 1
- 125000006297 carbonyl amino group Chemical group [H]N([*:2])C([*:1])=O 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 238000012875 competitive assay Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 229960002433 cysteine Drugs 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- KAKKHKRHCKCAGH-UHFFFAOYSA-L disodium;(4-nitrophenyl) phosphate;hexahydrate Chemical compound O.O.O.O.O.O.[Na+].[Na+].[O-][N+](=O)C1=CC=C(OP([O-])([O-])=O)C=C1 KAKKHKRHCKCAGH-UHFFFAOYSA-L 0.000 description 1
- 239000003136 dopamine receptor stimulating agent Substances 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- JMNJYGMAUMANNW-FIXZTSJVSA-N dynorphin a Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 JMNJYGMAUMANNW-FIXZTSJVSA-N 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 208000030172 endocrine system disease Diseases 0.000 description 1
- 239000006274 endogenous ligand Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011010 flushing procedure Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 125000002485 formyl group Chemical group [H]C(*)=O 0.000 description 1
- 229940049906 glutamate Drugs 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 150000002367 halogens Chemical class 0.000 description 1
- 229960002885 histidine Drugs 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 108091006086 inhibitor proteins Proteins 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 239000002917 insecticide Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000009878 intermolecular interaction Effects 0.000 description 1
- 208000037906 ischaemic injury Diseases 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000000021 kinase assay Methods 0.000 description 1
- URLZCHNOLZSCCA-UHFFFAOYSA-N leu-enkephalin Chemical compound C=1C=C(O)C=CC=1CC(N)C(=O)NCC(=O)NCC(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 URLZCHNOLZSCCA-UHFFFAOYSA-N 0.000 description 1
- 125000005647 linker group Chemical group 0.000 description 1
- 229960003646 lysine Drugs 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- FDZZZRQASAIRJF-UHFFFAOYSA-M malachite green Chemical compound [Cl-].C1=CC(N(C)C)=CC=C1C(C=1C=CC=CC=1)=C1C=CC(=[N+](C)C)C=C1 FDZZZRQASAIRJF-UHFFFAOYSA-M 0.000 description 1
- 229940107698 malachite green Drugs 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 229960004452 methionine Drugs 0.000 description 1
- 235000006109 methionine Nutrition 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 125000000896 monocarboxylic acid group Chemical group 0.000 description 1
- 230000007886 mutagenicity Effects 0.000 description 1
- 231100000299 mutagenicity Toxicity 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000009223 neuronal apoptosis Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000003402 opiate agonist Substances 0.000 description 1
- 239000000813 peptide hormone Substances 0.000 description 1
- 230000002263 peptidergic effect Effects 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 210000003635 pituitary gland Anatomy 0.000 description 1
- 239000000419 plant extract Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- LVTJOONKWUXEFR-FZRMHRINSA-N protoneodioscin Natural products O(C[C@@H](CC[C@]1(O)[C@H](C)[C@@H]2[C@]3(C)[C@H]([C@H]4[C@@H]([C@]5(C)C(=CC4)C[C@@H](O[C@@H]4[C@H](O[C@H]6[C@@H](O)[C@@H](O)[C@@H](O)[C@H](C)O6)[C@@H](O)[C@H](O[C@H]6[C@@H](O)[C@@H](O)[C@@H](O)[C@H](C)O6)[C@H](CO)O4)CC5)CC3)C[C@@H]2O1)C)[C@H]1[C@H](O)[C@H](O)[C@H](O)[C@@H](CO)O1 LVTJOONKWUXEFR-FZRMHRINSA-N 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000013102 re-test Methods 0.000 description 1
- 239000012429 reaction media Substances 0.000 description 1
- 238000001525 receptor binding assay Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009291 secondary effect Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000008313 sensitization Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000003195 sodium channel blocking agent Substances 0.000 description 1
- 229910001415 sodium ion Inorganic materials 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 description 1
- 239000004753 textile Substances 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 231100000563 toxic property Toxicity 0.000 description 1
- 231100000820 toxicity test Toxicity 0.000 description 1
- 231100000759 toxicological effect Toxicity 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 229960004799 tryptophan Drugs 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/40—Searching chemical structures or physicochemical data
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
Landscapes
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Medicinal Chemistry (AREA)
- Computing Systems (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Pharmacology & Pharmacy (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
Předkládaný vynález se týká počítačového systému a způsobu jejího provozování za účelem provádění diskrétní podstrukturní analýzy. Tato analýza umožňuje provádění počítačově realizované identifikace molekul majících určité vlastnosti, jako je biologická a/nebo chemická aktivita. Počítačově řízená diskrétní podstrukturní analýza múze být využita při objevování léků nebo v jiných oblastech, kde jsou středem zájmu biologicky, farmakologicky, toxikologicky, pesticidně, herbicidně, katalyticky nebo jinak aktivní sloučeniny.
Dosavadní stav techniky
Pokrok v oblasti například lékařské chemie závisí na identifikaci biologicky aktivních molekul. V mnoha případech jsou výzkumné programy zaměřeny na syntézu malých organických molekul, které budou interagovat se známým enzymatickým nebo receptorovým terčem, aby se vytvořil požadovaný farmakologický účinek. Takové sloučeniny mohou, alespoň částečně, napodobovat nebo zabraňovat v aktivitě známých, přirozeně se vyskytujících substancí, ale jsou určeny pro zajištění silnějšího a/nebo selektivnějšího působení. 25
Sloučeniny, vznikající z tohoto typu výzkumu, mohou zahrnovat určité strukturní znaky relevantních, přirozeně se vyskytujících substancí.
Výzkumné programy mohou být rovněž založeny na 3q přirozeně se vyskytujících sloučeninách nalézaných jako • 9 • 9 * · · « · · ·
9« · · « 99* 9 * • 9 · · ♦ · výsledky zdrojů screeningu, dostupných v přírodě, jako jsou například vzorky půd nebo rostlinné extrakty.
V nedávných letech se zvýšil tlak na identifikování nových a použitelných biologicky aktivních molekul a v důsledku toho byly vyvinuty nové metody generování sloučenin. V tomto ohledu měly obzvláštní důležitost dva vývoje, jmenovitě kombinatorní chemie a vysokovýkonný screening (HTS).
Kombinatorní chemie využívá robotické nebo manuální techniky pro provádění množství menších chemických reakcí, z nichž každá využívá odlišnou kombinaci reagentů, současně nebo paralelně, čímž se generuje velké množství různých chemických entit pro screening. Souhrn sloučenin, generovaných touto metodou, je známý jako knihovna. Knihovny pro generování nových chemických vodičů jsou obvykle tak rozmanité, jak jen je možné. Za určitých okolností ale mohou být knihovny nakloněny nebo zacíleny k určitému farmakologickému tercí či cílí, nebo mohou být zaměřeny na určitou chemickou oblast, prostřednictvím volby reagentů určených pro zavedení specifických strukturních znaků do finálních sloučenin.
Vysokovýkonný screening zahrnuje využití biochemické analýzy pro rychlé testování aktivity velkých počtů chemických sloučenin in vitro vzhledem k jednomu nebo více biologickým terčům. Tato metoda je ideální pro screening velkých knihoven sloučenin, vytvořených kombinatorní chemií.
Navzdory nezpochybnitelným výhodám kombinatorní chemie a HTS při generování nových vodících struktur, existují u těchto metod určité nevýhody. Vysoký podíl ϊ ζ. ΐ ϊ '··· · · ; ;
sloučenin v nezacílených kombinatorních knihovnách nemá žádnou využitelnou aktivitu. Objevení použitelných vodících struktur tudíž spoléhá na náhodu a/nebo počet testovaných sloučenin. Zaměřené knihovny mohou mít vyšší podíl aktivních sloučenin, ale jsou závislé na selekčních kritériích a mohou dokonce zcela selhat při hledání optimálních sloučenin. Navíc obě tyto techniky vyžadují značné zdroje a experimentální kapacitu.
Možnost nebo pravděpodobnost nalezení aktivní 0 molekuly v dané sadě sloučenin může být zvýšena buď zvýšením celkového počtu testovaných sloučenin (to jest zvětšením velikosti sady) nebo zvýšením podílu aktivních sloučenin ve stejné sadě. Muže být ilustrováno, že zvýšení podílu aktivních sloučenin v sadě sloučenin je mnohem účinnější pro
CZ zvýšení pravděpodobnosti nalezeni aktivní molekuly, než jednoduché zvýšení celkového počtu sloučenin, které jsou testovány. Tento přístup snižuje počet sloučenin, které musí být vytvořeny a testovány, a je tudíž také mnohem výhodnější, pokud se týká zdrojů požadovaných, například, pro nalezení 0 biologicky aktivních molekul.
Podstrukturní analýza, jako přístup k problému konstrukce léků, je popsána v Richard D. Cramer III. a kol.,
J. Med. Chem., 17 (1974), strany 553 až 535. Zde je uvedeno, že biologická aktivita molekuly, nebo jakákoliv jiná z jejích 5 vlastností, musí být vzata do úvahy prostřednictvím kombinování příspěvků z jejích strukturních komponentů (podstruktur) a jejich intra- a intermolekulárních interakcí. Příspěvek dané podstruktury k pravděpodobnosti aktivity může být získán z údajů o předtím testovaných sloučeninách obsahujících tuto podstrukturu. Prvním krokem je vytvoření ··· * · • · · * · · ·» ·· «4 ·· kvalifikační tabulky podstruktury, která shrnuje dostupné údaje. Frekvence aktivity podstruktury (SAF) je definována pro každou podstrukturu jako poměr počtu aktivních sloučenin, obsahujících tuto podstrukturu, k počtu testovaných sloučenin, obsahujících tuto podstrukturu. Sad reprezentuje příspěvek, se kterou tato podstruktura muže zvýšit pravděpodobnost, že sloučenina bude aktivní. Potom se vypočítá pro každou sloučeninu aritmetický průměr hodnot SAF podstruktur přítomných v této sloučenině.
Ačkoliv tento přístup dosavadního stavu techniky umožňuje třídění sloučenin prostřednictvím jejich středních hodnot SAF, získání těchto hodnot vyžaduje výpočet aritmetického průměru SAF hodnot pro každou podstrukturu, která je přítomná ve sloučenině. Navíc, hodnoty SAF, požadované pro tento výpočet, jsou výsledkem předchozích výpočtů, které zahrnují vyhodnocení každé podstruktury v každé jedné z testovaných molekul. Tento přístup tudíž vede na značné výpočtové zatížení, které brání tomu, aby tato technika byla aplikována na větší datové sady, které jsou v současnosti dostupné a které by mohly být použity jako zdroj informací pro provádění molekulární strukturní analýzy. Metoda podle Cramera ale selhává pro vlastní odhad skutečného příspěvku, kterým podstruktura přispívá k aktivitě.
Existuje tudíž množství technik dosavadního stavu techniky v oblasti chemické strukturní analýzy.
EP 938 055 A popisuje způsob vytvoření kvantitativních vztahů strukturní aktivity na základě údajů generovaných z vysokovýkonného screeningu prostřednictvím identifikováni strukturních charakteristik, které určují, že sloučenina je aktivní. Tento způsob je zkonstruován pro • 9 ζ Z.*’··· ·’···· · · · · · · • 9 9* ·· ·· vytvoření statistického modelu pro biologicky aktivní sloučeniny, který nejprve asociuje různé chemické deskriptory s daným souborem sloučenin a potom, prostřednictvím užití podskupin sloučenin se známou biologickou aktivitou, vytváří model pro předpovídání, zda nová sloučenina by mohla být biologicky aktivní či nikoliv.
Sheridan a Kearsley, J. Chem. Inf. Comput. Sci., 35 (1995), strany 310 až 320, popisují použití vývojových algoritmů pro volbu podskupiny fragmentů pro použití při konstruování kombinatorní knihovny. Tento postup zahrnuje vytvoření populace molekul z podskupin molekulárních fragmentů a vypočítání skóre pro každou molekulu na základě specifikovaných deskriptorů (například páry atomů nebo topologická torze) s využitím postupů zkoumání pravděpodobnosti nebo směrových vektorů. Další populace jsou vytvářeny s použitím vývojových algoritmů a jsou skórovány. Výsledky vytváření seznam fragmentů, které se vyskytují v maximálně skórujících molekulách, který pak může být použit jako základ pro konstruování kombinatorní knihovny.
WO 99/26901A1 popisuje způsob konstruování chemických substancí, jako jsou molekuly. Sloučenina sestává z kostry a množství bodů. Způsob začíná volbou kandidátských prvků pro body a vytvořením prediktivně konstruovaného pole PAD. Příklad PAD sestává z množství virtuálních sloučenin splňujících určité kombinatorní podmínky. Tyto sloučeniny jsou potom vytvářeny a testovány na biologickou aktivitu. Potom se provede algoritmus pro odhadnutí celkové biologické aktivity těch sloučenin, které nebyly vytvořeny. Pro tento účel se vypočítávají hodnoty příspěvku k vlastnostem pro jednotlivé kandidátské prvky, které pak- reprezentují • * 4 4 · • * · 4
• · příslušný příspěvek každého jednotlivého prvku k aktivitě. Navíc je vypočítán také průměrný příspěvek každé skupiny substituentů v určitém bodě k biologické aktivitě. Je rovněž uveden příklad jak takovýto příspěvek vypočítat.
H. Gao a kol., J. Chem. Inf
Comput. Sci. (39) 1999,
164 až 168 je článek popisující aplikaci techniky QSAR (kvantitativních vztahů strukturní aktivity) pro problém objevování léků. Poté, co jsou zvoleny biologicky aktivní sloučeniny, je optimalizována jejich biologická aktivita. Protože technika QSAR je založena na hypotetickém vztahu mezi biologickou aktivitou a molekulárními strukturami, zabývá se tato technika identifikováním strukturních vlastností, které činí sloučeniny aktivními, a předpovídáním aktivních a neaktivních analogů.
WO 00/41060 popisuje způsob korelování aktivit substancí se strukturními znaky substancí. Termín znak se týká atomů a vazeb struktury, která odpovídá předloze. V prvním kroku jsou stanoveny prvky sady substancí, které splňují daná omezení strukturních znaků a vlastností. Potom pro každou kategorii aktivit jsou zkonstruovány substance, které spadají do této kategorie. Po rozdělení sady substancí mezi několik kategorií aktivit se vypočítá očekávaná aktivita pro jakoukoliv podsadu a pro každý strukturní znak se zkonstruuje sada bitových vektorů pro aktivitu, vlastnost a znak, které označují počty substancí, které obsahují uvedený znak a jsou v uvedené kategorii aktivit. Tento dokument se týká biologických aktivit a rovněž se zabývá objevováním léků.
US 6,185,506 Bl popisuje způsob volby optimální rozmanité knihovny malých molekul na základě ověřených • 9 9 ··· · · molekulárních strukturních deskriptorů. Jsou použity sady údajů z množství literatury, které obsahují nej různější chemické struktury a přidružené aktivity. Aktivitou může být biologická a chemická aktivita. Technika je popsána v kontextu farmakologických léčiv. Navíc je popsán způsob výběru podskupiny molekul produktu pro všechny možné molekuly produktu, které by mohly být vytvořeny v kombinatorní syntéze ze specifikovaných reakčních molekul a společných jádrových molekul. V části, popisující dosavadní stav techniky, je uveden odkaz na biologicky specifické knihovny, které byly zkonstruovány na základě znalostí o geometrických uspořádáních strukturních fragmentů abstrahovaných z molekulárních struktur, o nichž je známo, že jsou aktivní. V tomto dokumentu je uvedeno, že je naprosto nezbytné použít menší racionálně konstruovanou screeningovou knihovnu, která ještě zachová rozmanitost kombinát orně dostupných sloučenin.
WO 00/49539 Al popisuje způsob screeningu sady molekul pro identifikování sady molekulárních znaků, které pravděpodobně korelují se specifikovanou aktivitou. Termín znak se zde týká chemických podstruktur. Sada molekul je roztříděna do skupin podle jejích molekulární struktury, jak je charakterizována sadou deskriptorů. Potom jsou identifikovány skupiny, které reprezentují nejvyšší úroveň aktivity, a jsou nalezeny nejběžnější podstruktury mezi molekulami ve skupinách, které tak mohou být přiměřeně korelovány se zjištěnou úrovní aktivity. Je vytvořena sada údajů, která reprezentuje tyto molekuly, z počáteční sady údajů, která obsahuje společnou podskupinu znaků. Tato technika je zde popsána v podobě systému na bázi počítačů pro provádění automatizované analýzy sady údajů.
99» · ·
9 · • 9
US 5,463,564 popisuje postup na bázi počítačů pro automatické generováni sloučenin prostřednictvím robotického sestavování (syntézy) a analyzování množství chemických sloučenin. Tento proces se provádí iteračně a zaměřuje se na generování chemických entit s definovanými vlastnostmi aktivit. Je sestavena knihovna chemických sloučenin s řízenou rozmanitostí, která zahrnuje množství chemických sloučenin. Údaje o strukturní aktivitě jsou získány robotickou analýzou sestavených sloučenin. Je rovněž popsáno množství databází, z nichž každá obsahuje pole indikující hodnotící faktor přidělený příslušné sloučenině. Hodnotící faktor je přidělen každé sloučenina na základě toho, jak přesně se aktivita této sloučeniny shoduje s požadovanou aktivitou.
Shora popisované postupy jsou buď prediktivními 15 modely nebo stále selhávají při uspokojivém zlepšení generováni aktivních vodicích sloučenin a zvyšování pravděpodobnosti nalezení aktivních sloučenin v dané sadě sloučenin. Navíc tyto známé, běžné techniky nejsou schopné splnit potřebu zvýšeného množství a kvality aktivních a o
vodících sloučenin, které vstupují do vývojového řetezce.
Cílem předkládaného vynálezu je tudíž navrhnout způsob provozování počítačového systému, a také navrhnout odpovídající počítačový systém, pro dosažení zvýšené možnosti objevení nových, biologicky a/nebo chemicky aktivních 25 molekul.
Podstata vynálezu
Uvedený cíl je vyřešen podle předkládaného vynálezu řešeními definovanými v nezávislých patentových nárocích.
*·· · ·· ·· • · · • · · · ·· ·♦
Výhodná provedení vynálezu jsou definována v závislých patentových nárocích.
Jednou výhodou předkládaného vynálezu je to, že jsou navrženy počítačový systém a způsob jeho provozování, které umožňují zvýšení podílu aktivních sloučenin v dané sadě chemických entit, kde u uvedených entit ještě není známo, že mají požadovanou aktivitu. To se provádí aplikací na znalostech založených technik pro identifikaci nových sérií aktivních a vodících sloučenin, zejména prostřednictvím 'θ stavebnicových systémů pro provádění výpočtově realizované objevování či nalézání molekul.
Další výhodou předkládaného vynálezu je to, že prostřednictvím analyzování databáze, kterou je možné prozkoumávat prostřednictvím molekulárních struktur a biologických a/nebo chemických vlastností, jsou vyloučeny nákladné experimenty. Proces objevování podle předkládaného vynálezu tudíž může být racionalizován, což dále povede na méně nákladné nalézání Či objevování léků.
Dále předkládaný vynález výhodně umožňuje provádění procesů objevování či nalézání mnohem rychleji, takže molekuly, mající určité požadované vlastnosti, mohou být identifikovány v kratším čase ve srovnání s postupy podle dosavadního stavu techniky.
25 Navíc je předkládaný vynález obzvláště výhodný v oblasti biochemie. V minulosti analýzy DNA sekvencí, a zejména analýzy sekvencí genomů, vytvořily obsáhlé databáze sekvencí aminokyselin, které mohou být použity jako počáteční bod při realizaci předkládaného vynálezu. Potom předkládaný vynález umožňuje identifikování známých a/nebo samostatných • · * t ··· • 4 · ·· ·· ligandú a/nebo dvojic samostatných ligandů-receptorů prostřednictvím předpovídání peptidové sekvence na základě výsledků získaných se seznamem struktur analyzovaných pro biologicky aktivní chemické determinanty. Po identifikaci v databází a interpretaci mohou být peptidové sekvence testovány biochemickými testy. Předkládaný vynález tudíž výhodně umožňuje odvodit biologické struktury prostřednictvím porovnání se seznamem chemických molekul, pro které již byla stanovena aktivita na určitém terči, a tudíž poskytuje identifikační techniku (zpětná sekvenční analýza).
Předkládaný vynález nyní bude popsán poněkud podrobněji prostřednictvím příkladných provedení ve spojení s odkazy na připojené výkresy.
Přehled obrázků na výkresech
Obr. 1
Obr. 2 znázorňuje blokové schéma ilustrující počítačový systém podle výhodného provedení vynálezu;
znázorňuje vývojový diagram ilustrující hlavní proces provádění diskrétní strukturní analýzy podle výhodného provedení předkládaného vynálezu;
znázorňuje opakovači vynálezu;
schematický náčrtek ilustrující (re-iterační) proces podle
Obr. 4 znázorňuje vývojový diagram ilustrující proces vytváření knihovny fragmentů podle výhodného provedení předkládaného vynálezu;
• · • » · » · » » ··· · · • · · · ·· 9 · ·« ·· t« ·· ··
Obr. 5 znázorňuje graf ilustrující, jak mohou být voleny fragmenty na základě vypočítaných hodnot skóre;
Obr. 6 znázorňuje vývojový diagram ilustrující proces výpočtu hodnoty skóre pro fragment podle výhodného provedení předkládaného vynálezu;
Obr. 7 znázorňuje vývojový diagram ilustrující proces analyzování knihovny fragmentů při provádění opakování (re-iterace) ;
Obr. 8 znázorňuje vývojový diagram ilustrující proces volby nové sloučeniny prostřednictvím využití generických podstruktur;
Obr. 9 znázorňuje vývojový diagram ilustrující proces generování podstruktur pro použití při virtuálním screeningu;
Obr.10 znázorňuje vývojový diagram ilustrující proces analyzování knihovny fragmentů při provádění opakování, aplikováním techniky vázání za zvýšené teploty (slučování annealing) podle výhodného provedení vynálezu;
Obr.11 znázorňuje příklad mapy relativních příspěvků pro ilustraci slučovací techniky aplikované v procesu podle obr. 10;
Obr.12 znázorňuje graf ilustrující účinek sloučeniny na receptorem zprostředkované vytvoření inositoltrifosfátu;
» ”· · ϊ ϊ ’··· · · ·· ··
Obr.13 znázorňuje graf ilustrující účinek sloučeniny na kináze závislé fosforylaci bílkovin;
Obr.14 znázorňuje graf ilustrující účinek sloučeniny na fosfatáze závislé defosforylaci bílkovin;
Obr,15 znázorňuje graf ilustrující informace o relativních příspěvcích vynesením determinantů vzhledem k jejich příslušným hodnotám skóre; a
Obr.lSA až obr. 16H znázorňují další grafy relativního přispění, demonstrující rovnocennost funkcí skóre.
Příklady provedení vynálezu
Předkládaný vynález bude nyní popsán detailněji. Navíc budou diskutována výhodná provedení předkládaného vynálezu ve spojení s odkazy na připojené výkresy. Také bude ještě uvedeno množství příkladů, jak předkládaný vynález může být aplikován v množství oblastí objevování či nalézání sloučenin.
Podle předkládaného vynálezu je provozován počítačový systém pro provádění diskrétní podstrukturní analýzy. Je přistupováno k databázi molekulárních struktur. Tato databáze je prozkoumatelná prostřednictvím molekulárních informací a biologických a/nebo chemických vlastností. Informacemi o molekulární struktuře jsou jakékoliv informace vhodné pro určení molekulární struktury molekuly. Biologické a/nebo chemické vlastnosti zahrnují biochemické, farmakologické, toxikologické, vlastnosti.
pesticidní, herbicidní katalytické
Z ··’··· · ’··· • « · · · · ·
S použitím databáze technika podle předkládaného vynálezu identifikuje podskupinu molekul majících danou biologickou a/nebo chemickou vlastnost. V uvedené podskupině jsou potom stanoveny fragmenty molekul. Termín fragment se týká jakékoliv strukturní podjednotky molekuly, včetně jednoduchých funkčních skupin, dvourozměrných podstruktur a jejich rodin, jednoduchých atomu nebo vazeb, a jakékoliv sestavy strukturních deskriptorů ve dvourozměrném nebo třírozměrném molekulárním prostoru. Osoby v oboru znalé snadno nahlédnou, že fragmentem může být molekulární podstruktura, která nemá žádný známý význam v běžné chemii.
Poté, co molekulární struktury v podskupině jsou rozděleny do fragmentů, je vypočítána hodnota skóre pro každý fragment, která indikuje příspěvek příslušného fragmentu k dané biologické a/nebo chemické vlastnosti. To znamená, že předkládaný vynález umožňuje přidělení hodnot skóre k fragmentům na základe existujících znalostí s ohledem na biologické a/nebo chemické vlastnosti molekul, V následujícím popisu bude molekula, struktura nebo podstruktura označena za
0 aktivní, pokud bude mít danou vlastnost. Molekula, struktura nebo podstruktura, která není aktivní bude označena jako neaktivní. Předkládaný vynález tudíž poskytuje podstrukturní analýzu založenou na diskrétních informacích o biologických a/nebo chemických vlastnostech. Hlavní postup 2 5 podle předkládaného vynálezu je tudíž níže nazýván diskrétní podstrukturní analýzou (DSA).
Protože podle předkládaného vynálezu jsou fragmenty sdružovány s hodnotami skóre, které indikují jejich příspěvek k dané biologické a/nebo chemické vlastnosti, je možné fragmenty považovat za chemické determinanty odpovědné za • φ · · · · · · · · · · «· V · ·· «· ·· daný biologický a/nebo chemický výsledek. Identifikace fragmentů se provádí prostřednictvím sledování sady logických pravidel (algoritmu), která příslušejí vlastnímu procesu DSA. V tomto kontextu hodnota skóre je sama funkcí:
(a) převahy chemického determinantu v podsadě aktivních molekul, a (b) převahy stejného determinantu v celém seznamu uvažovaných sloučenin.
Na základě této definice způsob podle vynálezu potom identifikuje jeden nebo více lokálních extrémů funkce skóre, jejíž odpovídající chemické determinanty reprezentují úplná nebo částečná chemická řešení pro požadovaný biologický výsledek. Nalezení největších možných hodnot, kterých funkce skóre může dosáhnout v jakékoliv dané datové sade, je ekvivalentní identifikování chemických determinantů obsažených v podskupinách nej silněji biologicky aktivních molekul, které mají nejnižší pravděpodobnost výskytu shodou okolností ve stejných podskupinách.
Předkládaný vynález bude nyní popsán ve spojení s odkazy na připojené výkresy a nyní zejména ve spojení s odkazy na obr. 1. Obr. 1 znázorňuje výhodné provedení počítačového systému podle předkládaného vynálezu. Tento počítačový systém zahrnuje základní jednotku 100 (CPU), která může být ovládána prostřednictvím uživatelského rozhraní 105. Základní jednotka 100 a uživatelské rozhraní 105 mohou být součásti jakéhokoliv počítačového systému, jako je pracovní stanice nebo osobní počítač (PC). Výhodně je počítačovým systémem multíprocesorový systém pracující s operačním • » · · · · «»· * * •» · < · * · > »· ·· ·* 4 systémem schopným souběžného zpracování více úloh (multitasking).
Základní jednotka 100 je spojena s programovou pamětí 130, která ukládá proveditelný programový kód včetně instrukcí pro provádění DSA procesu podle předkládaného vynálezu. Tyto instrukce zahrnují funkce 135 fragmentace pro rozdělování molekulárních struktur do fragmentu, funkce 140 výpočet hodnot skóre, funkce 145 zobecnění izomerů) skóre pro (například pro nalezení izomerů) pro lokalizovaní zobecnitelných položek ve strukturách fragmentů a pro náhradu těchto položek zobecněnými výrazy, čímž se vytvářejí generické podstruktury, funkce 150 virtuálního screeningu pro provádění virtuálního screeningu, a funkce 155 slučování (vázání za zvýšené teploty - annealing) pro provádění procesu slučování fragmentů podle předkládaného vynálezu. Detaily o jednotlivých funkcí a procesorech realizovaných prostřednictvím základní jednotky 100 při provádění těchto funkcí budou popsány podrobněji níže.
Základní jednotka 100 je dále spojena s databází 115 aktivity struktur, nebo také se seznamem aktivity sloučenin, pro vyhledávání informací o molekulárních strukturách a informací o biologických a/nebo chemických vlastnostech. Tyto informace mohu být podobně přijímány z jednotky 110 pro vstup dat, která umožňuje přístup k vnějším datovým zdrojům.
Přístupem k jednotce 110 a/nebo k databází 115 může být získána podskupina molekulárních struktur, například z jakéhokoliv dostupného zdroje, jako jsou soukromé nebo veřejné databáze, které jsou prozkoumatelné prostřednictvím podstrukturních a/nebo biologických vlastností. Veřejné databáze zahrnují, ale nejsou omezeny na, databáze dostupné
Index, pod následujícími jmény: MDDR, Pharmaprojects, Merck SciFinder, Derwent. Podskupina molekul může být rovněž získána sestavováním a testováním sloučenin. Molekuly budou obecně zahrnovat úplné sloučeniny, ale mohou rovněž samy být molekulárními fragmenty. Pro jakoukoliv danou biologickou nebo chemickou vlastnost podskupina obsahuje sloučeniny, které nemají tuto vlastnost, například sloučeniny, které nejsou aktivní (nebo spadají pod danou prahovou hodnotu aktivity), a rovněž sloučeniny, které mají tuto vlastnost, například sloučeniny, které vykazují požadovanou aktivitu (to jest mají aktivitu nad danou prahovou hodnotou). Všechny neaktivní sloučeniny jsou relevantní a jsou tudíž analyzovány.
Po přístupu k vnitřním nebo vnějším datům a provedení DSA procesu s využitím funkcí uložených v programové paměti 130 základní jednotka 100 ukládá knihovnu 120 fragmentů, která obsahuje stanovené fragmenty molekul společně s jejich přidruženými hodnotami skóre.
V jednom výhodném provedení podle předkládaného vynálezu je knihovna 120 fragmentu výsledkem hlavního procesu podle vynálezu. Knihovna 120 fragmentů může potom být použita například chemickými nebo biologickými vědci nebo inženýry jako zdroj hodnotných informaci, které jsou využitelné v jakémkoliv následujícím výzkumném procesu.
V jiném výhodném provedení je knihovna 120 fragmentů přechodným výsledkem hlavního procesu podle předkládaného vynálezu a může tudíž být uložena v energeticky závislé (nestálé) paměti a rovněž v energeticky nezávislé (trvalé) paměti. Knihovna 120 fragmentů podle tohoto provedení může být čtena základní jednotkou 100 při provádění dalších funkcí • 4 • · · • · · ·« ·· ·«« · ·· : i · · «4 ·· uložených v programové paměti 130 pro generování souboru 125 sloučenin.
Soubor 125 sloučenin je soubor molekul, které byly nalezeny prostřednictvím procesu podle předkládaného vynálezu a mají nebo nemají požadovanou biologickou a/nebo chemickou vlastnost. Molekuly souboru 125 sloučenin mohou být bud' již známé nebo mohou být hypotetickými strukturami, které předtím ještě nebyly sestaveny. V každém případe jsou molekuly souboru 125 sloučenin výsledkem vyhodnocení hodnot skóre, 10 přidělených fragmentům podle diskrétní podstrukturní analýzy.
Jak může být patrné z obr. 1, základní jednotka 100 je dále spojena s datovou pamětí 160, která ukládá sady 165 sloučenin, sady 170 fragmentů a hodnoty 175 skóre. Datová paměť 160 je vytvořena pro ukládání dat či údajů používaných 15 pro ukládání vstupních parametrů při vyvolávání funkcí 135 až 155 procesu, nebo pro ukládání vrácených hodnot z těchto funkcí.
Jak je patrné na obr. 2, který ilustruje výhodné 20 provedení hlavního DSA procesu, obsluha počítačového systému ilustrovaného na obr. 1 nejprve v kroku 210 vybírá aktivitu. Jak bylo zmiňováno výše, aktivita znamená jakoukoliv biologickou a/nebo chemickou vlastnost, včetně biochemických, farmakologických, toxikologických, pesticidních, herbicidních a katalytických vlastností. Navíc při použití vynálezu pro identifikováni samostatných ligandú může být aktivitou daný účinek na příslušnou bílkovinu (obvykle schopnost vázání vytváření vazby).
V předkládaném popisu odkaz na určitou vlastnost, jako je biologická aktivita, může být, pokud není uvedeno * · * · a t · ··· · · · « ···· ·· ♦ ···· jinak, extrapolován na další typy biologických a/nebo chemických vlastností. Dále pro vyloučení jakýchkoliv pochyb termíny sloučenina, molekula a molekulární struktura mohou všechny zahrnovat molekulární podstruktury a rovněž celé sloučeniny podle daného kontextu.
Poté, co v kroku 210 již byla zvolena aktivita, je v kroku 220 vybrán soubor 125 sloučenin. Zvolený soubor sloučenin je souborem molekul, které mají být zkoumány pro zjištění, které fragmenty přispívají ke zvolené aktivitě. Jak bude podrobněji popsáno níže, soubor sloučenin, zvolený v kroku 220, obsahuje molekuly, o nichž je známo, že jsou aktivní, a molekuly, o nichž je známo, že jsou neaktivní.
Jakmile již byla zvolena aktivita a soubor sloučenin, proces pokračuje v kroku 230 vytvářením knihovny 120 fragmentů. Proces vytváření knihovny fragmentů může být popsán jako proces vážení účinnosti molekulárních fragmentů, uvnitř podskupiny známých struktur, na chemický a/nebo biologický výsledek. Tento proces může být popsán jako sestávající z kroků:
I. identifikování jedné nebo více podskupin molekul majících dané vlastnosti vzhledem k příslušnému chemickému a/nebo biologickému výsledku;
II. vytvoření předběžné knihovny zahrnující fragmenty molekul v uvedené jedné nebo více podskupinách;
III. aplikování algoritmu pro odhad příspěvku uvedených fragmentů ve vztahu k příslušnému chemickému a/nebo biologickému výsledku; a
IV. získání hodnot skóre pro každý uvedený fragment, na který byl aplikován uvedený algoritmus, přičemž • 9 • · 99 9999 9 • ·9 999 999999 • · 9 · 9 · 9 9 tyto hodnoty skóre mohou být seřazeny podle velikosti; přičemž ty fragmenty, které s největší pravděpodobností přispívají k příslušnému chemickému a/nebo biologickému výsledku, jsou sdruženy například s vysoce zařazenými hodnotami skóre.
Jak bylo zmiňováno výše, knihovna 120 fragmentů obsahuje fragmenty a rovněž získané hodnoty skóre fragmentů. Jakmile již byla v kroku 230 vytvořena knihovna 120 fragmentů, proces může nebo nemusí provést krok 240 opakování 0 (re-iterace).
Realizováním DSA procesu opakovacím způsobem mohu být výpočetní zdroje využity velmi efektivně. Například může proces výhodně začínat s malými fragmenty. Protože počet možných fragmentů v molekulárních strukturách se zvyšuje 5 přibližně exponenciálně s maximální velikostí fragmentů, které jsou zkoumány, je tato maximální velikost na začátku nastavena na spíše nízkou hodnotu, takže může být zpracován dokonce velmi vysoký počet molekulárních struktur.
Proces v krocích 210 až 230 odhaluje fragmenty s vysokým příspěvkem k požadované aktivitě. Nalezené fragmenty mohou být potom použity v následujícím kole (nebo cyklu) pro nalezení fragmentů větší velikosti, to jest s vyšší molekulární hmotností. Příklad opakovacího procesu je znázorněn na obr. 3. V prvním kole byl nalezen fragment C=0 jako mající vysoký příspěvek k požadované aktivitě. Tento fragment je potom použit pro zkoumání fragmentů, které mají větší velikost, než výsledný fragment prvního kola, a které obsahují tento fragment. V příkladu podle obr. 3 druhé kolo ukázalo, že vzhledem k požadované aktivitě je nej lepším fragmentem této velikosti fragment N-C=O. Tento opakovači • * « .
• · 4 · · 4 • · · · « * · · 4 4 * *44 4 « * * · · · 4 B proces pak pokračuje, čímž se zvětšuje velikost fragmentů, a může vést na sloučeninu, která pravděpodobně má požadovanou biologickou a/nebo chemickou vlastnost a je vhodná pro požadovanou aplikaci.
Při opětovném popisu procesu podle obr. 2, pokud je v kroku 240 rozhodnuto o provedení dalšího kola nebo cyklu, je v kroku 250 analyzovaná knihovna 120 fragmentů vytvořená v kroku 230 a proces se vrací do kroku 220. Příklady toho, jak je v kroku 250 analyzována knihovna 120 fragmentů, budou podrobněji popsány níže. Jak lze očekávat, opakovači proces umožňuje aplikování pokročilejších funkcí, jako jsou funkce 145 zobecnění a funkce 155 slučování pro další zlepšení procesu objevování s využitím diskrétní podstrukturní analýzy.
Nakonec, když je v kroku 240 rozhodnuto, že již nemá být provedeno žádné další opakování, proces přechází k ukončení, přičemž v kroku 260 se vytváří soubor 125 sloučenin.
Pokud se nyní opět týká kroku 230 vytváření knihovny 120 fragmentů, bude níže ve spojení s odkazy na obr. 4 až obr. 6 popsáno výhodné provedení podkroků tohoto vytvářecího procesu. Nejprve poté, co je přistoupeno k vnitřní databázi 115 a/nebo k vnějšímu datovému zdroji a jsou identifikovány podskupiny molekul, jsou v kroku 410 přijata data aktivity struktur, která se týkají identifikovaných molekul. Potom jsou v kroku 420 stanoveny fragmenty molekul v podskupině.
Molekuly mohou být rozdělovány do fragmentů s využitím množství běžných technik. Například může být použit algoritmus pro nalezení jakékoliv permutace atomů, které jsou • ·· 4 · · · · 4 • · · · · · ··· · · * vzájemně spolu vázány. Funkce 135 fragmentace mohou využívat minimální velikost a maximální velikost fragmentu. Pro poskytnutí jiného příkladu by fragmentační algoritmus mohl být instruován pro přeskočení či vynechání těch fragmentů, které mají atomy organizovány lineárně. Navíc by algoritmus mohl být omezen pro začlenění nebo vyloučení určitých typů vazeb. Existuje množství různých typů aplikace fragmentačních funkcí, se kterými se osoba v oboru znalá může snadno obeznámit.
0 Každá z molekulárních struktur tedy může být koncepčně rozdělena na řady diskrétních podstruktur nebo fragmentů (viz krok 420). Fragmenty mohou být jednoduché funkční skupiny, například NO2, COOH, CHO, CONH2; přesné dvourozměrné podstruktury, například o-nitrofenol; volně 5 definované rodiny podstruktur, například R-OH; jednoduché atomy nebo vazby, nebo jakákoliv sestava strukturních deskriptorů v dvourozměrném nebo třírozměrném chemickém prostoru.
Poté, co v kroku 420 byly molekuly rozděleny do —
fragmentů, jsou v kroku 430 vypočítány skóre fragmentů prostřednictvím výpočtu hodnoty skóre pro každý fragment a sdružení vypočítané hodnoty s fragmentem. Potom jsou stanoveny v kroku 440 fragmenty s nej vyšším skóre a tyto jsou v kroku 450 uloženy.
Příklad toho, jak jsou stanoveny fragmenty s nej vyšším skóre, je znázorněn na obr. 5. V tomto příkladu jsou stanovené hodnoty skóre vyneseny vzhledem k počtu sloučenin, které zahrnují příslušný fragment. V tomto grafu q je každý fragment reprezentován bodem. Použití tohoto grafického znázornění v kroku 440 poskytuje více informací, • · · 4 4 · * » » » • 4 4 4 « 4 4 «·« 4 4 4 * • 4 4 4 44 4 44·· než pouhý výběr fragmentů s nejvyšším skóre porovnáním hodnot skóre, protože graf navíc využívá informace o počtu sloučenin, které obsahují příslušné fragmenty.
Proces nalézání největší možné hodnoty skóre může být povazován za hierarchicky ekvivalentní uspořádaných vytváření fylogenní sítě molekulárních fragmentů, odpovídající dané biologické a/nebo chemické aktivitě. V tomto uspořádání jsou uzly sítě tvořeny samotnými fragmenty a pravděpodobnost, že jakýkoliv jeden fragment je základem biologické aktivity, je dána vzdáleností odpovídejícího uzlu od počátku, to jest základny samotné sítě. Tedy čím větší hodnota skóre je pro jakýkoliv daný fragment, tím dále je odpovídající uzel od počátku mřížky a tím pravděpodobnější je, že tento fragment reprezentuje chemické řešení pro například farmakofor, který je rozpoznáván příslušným daným terčem.
Nyní bude ve spojení s odkazy na obr. 6 podrobněji popsán krok 430 výpočtu skóre fragmentů. Aplikace funkcí 140 skóre odpovídá výše zmiňované soustavě logických pravidel nebo výpočetních kroků. DSA postup podle předkládaného vynálezu zahrnuje ve výhodném provedení krok začlenění proměnných, týkajících se převahy každého fragmentu, do jedné nebo více matematických funkcí, které odhadují hodnotu skóre pro jakýkoliv daný fragment.
Uvedený algoritmus je funkcí:
(a) počtu molekul x v podskupině, které splňují danou prahovou hodnotu vzhledem k požadovanému výsledku a které obsahují daný fragment;
• · ·· φ φ φ φ φ · φ • · · φ · φ · φφ* φ φ φ · • · · φ φφ φ φ · φ · ·· ** ·· ·· φφ φφ (b) počtu molekul y v uvedené podskupině, které obsahují uvedený fragment, ať již splňují čí nesplňují uvedenou prahovou hodnotu;
(c) počtu molekul z v uvedené podskupině, které splňující uvedenou prahovou hodnotu, at již obsahují nebo neobsahují uvedený fragment; a (d) počtu N všech molekul v podskupině.
Výsledkem, zmiňovaným v (a) , muže být jakýkoliv požadovaný parametr týkající se aktivity sloučenin, což zahrnuje, ale není omezeno na, biologickou, biochemickou, farmakologickou a/nebo toxikologickou aktivitu. Každá sloučenina nebo molekula v datovém souboru může potom být analyzována podle toho, zda má požadovaný parametr ve vztahu k dané prahové hodnotě, jako je určitá úroveň aktivity. Prahová hodnota může být nastavena na jakoukoliv požadovanou úroveň. V následujícím popisu je aktivní sloučeninou taková sloučenina, která splňuje požadovanou prahovou hodnotu, a neaktivní sloučeninou je taková sloučenina, která nesplňuje uvedenou prahovou hodnotu. Tyto termíny nejsou určeny pro vyjádření jakékoliv absolutní vlastnosti příslušných sloučenin.
Příspěvek daného fragmentu může být stanoven aplikováním proměnných x, y, z a N, mírou nebo měřítkem asociace nebo funkcí 140 skóre. Jak je dobře známo osobám v oboru znalým, existuje mnoho možných měřítek asociace, která spadají do tří hlavních kategorií:
Odčítací měřítka: např.
Nx-yz;
• 9
9 9 9 999 9 9
Poměrová měřítka: např. Smíšená měřítka; např.
x(N-y-z-x)/(z-x) (y-x) ;
(x/z)-(z-x)/N-z).
5 Mělo by být zcela zřejmé, že může být zvoleno jakékoliv měřítko asociace a osoby v oboru znalé budou snadno schopné provést vhodnou volbu.
Algoritmus aplikovaný v kroku 430 tudíž muže zahrnovat (viz obr. 6):
10 (i) vyhodnocení počtu sloučenin x v podskupině, které splňují danou prahovou hodnotu vzhledem k příslušnému chemickému nebo biologickému výsledku a které obsahují daný chemický determinant (krok 610) ;
(ii) vyhodnocení počtu sloučenin y v uvedené podskupině sloučenin, které obsahují uvedený chemický determinant, aé již splňují nebo nesplňují uvedenou prahovou hodnotu (krok 620);
(iíi) vyhodnocení počtu sloučenin z v uvedené podskupině sloučenin, které splňují uvedenou prahovou hodnotu, ař již obsahují nebo neobsahují uvedený chemický determinant (krok 630);
(iv) vyhodnocení celkového počtu N v podskupině sloučenin (krok 640); a (v) aplikování měřítka asociace na dvě nebo více proměnných x, y, z, a N (krok 650) , výhodně na tři nebo čtyři proměnné a zvláště výhodně na všechny čtyři proměnné x, y, z, a W.
Měřítko asociace muže být aplikováno přímo pro stanovení hodnoty skóre, odpovídající příspěvku daného ··· « · ► · « « •· ·9 • <
• · I ·· ·* fragmentu. Výhodně je ale měřítko asociace rozvinuto do funkce skóre, aby se vyhodnotila pravděpodobnost, že podstruktura přispívá k výsledku. To umožňuje jasnější stanovení seřazení hodnot skóre, získaných pro všechny analyzované fragmenty. Měřítko asociace muže být rozvinuto do funkce skóre prostřednictvím postupů obecně dobře známých v oboru. Tyto postupy mohou být například výhodně zvoleny ze statistických metod, jako je například metoda kritického poměru (z) ; Fisherův přesný test, Personova metoda chi-kvadrátu; Mattel-Haenzelova metoda chi-kvadrátu; a metody založené na, ale neomezené na, provádění odhadů strmosti, a podobně. Mohou být ale použity i c.etody jiné než statistické. Takové metody zahrnují, ale nejsou omezeny na, výpočet a porovnání přesných a přibližných konf idenčních intervalů, korelačních součinitelů, nebo skutečně jakékoliv funkce obsahující měřítka asociace sestávající z kombinace jedné, dvou, tří nebo čtyř z proměnných- x, y, z, a W popisovaných výše.
Příklady matematických vzorců reprezentuj ících měřítka asociace nebo funkce skóre, které mohou být použity v předkládaném vynálezu, zahrnují;
| (O | x/z |
| OD | x/N |
| (!!!) | Nx-yz |
| (IV) | (x/z)—(y/N) |
«V * ·· • ·· • · 4 • « I * *♦ * * · · 4 * · » <
·· ··
| (V) | (x/z)-{z-x)/(N-2) |
| x(N-y-ztx) | |
| (V!) | (z- x)(y-x) |
| Nx-yz | |
| (Vil) | Tz(N-z) y(N-y) |
| J(x/z)-(z-x)/(N-z)] | |
| (Vlil) | |
| (|Nx-yz|-N / 2) N | |
| (IX) | z(N-z) y(N-y) |
| x(N-y-z+x) c_27i?x+i/(y-x>V(z-x)+i/(N-y-2+x) | |
| (X) | (z-x)(y-x) |
| xi(N-y-z1+x1)(z2-x2)(y-x2) | |
| (X!) | x2(N-y-z2 +x2)(z.-x1)(y-xl) |
(XII) (Nx-yz)2N z(N-z) y(N-y)
Zkušený pracovník v oboru snadno rozpozná funkci (VII) skóre jako výsledek součinitele momentové korelace, * · ·· ·*··· * * · · » · * «·« · « • » · · · * * · • Φ φφ ·· ·· odrážející stupeň sdílené odchylky mezi dvěma dichotomickými proměnnými explicitně nevyjádřenými v uvedeném vzorci.
Zkušený pracovník v oboru snadno nahlédne, že funkce (VII) skóre se týká odhadu poměru možných pravděpodobností s 5 využitím strmosti regresní křivky reprezentující stupeň sdílené odchylky, která existuje mezi dvěma dichotomickými proměnnými.
Osoba v oboru znalá snadno rozpozná funkci (IX) skóre jako statistiku na bázi chi-kvadrátu, modifikovanou pro různé 10 omezující faktory. Například výraz N/2 v čitateli druhého kvocientu logaritmicky váženého výsledku je konzervativním nastavením přirozeného přiblížení k binomickému rozdělení, což je využitelnou modifikací pro práci s relativně malými hodnotami x, y, z, a N. Zkušený pracovník v oboru^ snadno nahlédne, že mohou být použita jiná měřítka asociace a/nebo funkce skóre pro stejné účely na místo těch, která byla popsána ve vzorcích (I) a (II), z nichž nejvhodnější z hlediska předkládaného vynálezu obsahují různé kombinace jedné, dvou, tří nebo čtyř z proměnných x, y, z, a 27.
Zkušený pracovník v oboru rozpozná funkci (X) skóre jako způsob pro odhad hodnoty spodní hranice 95% konfidenčního intervalu měřítka (III) s použitím logaritmické transformace pro lepší porovnatelnost rozdělení poměru s normálním rozdělením, a aproximaci Taylorových řad prvního řádu pro odhad odchylky logaritmu stejného uvedeného poměru.
Osoba v oboru znalá nahlédne, že funkce (XI) skóre je způsobem pro porovnání poměrů pravděpodobnosti, umožňující identifikovat chemické determinanty, které s největší i
z; o • 9 99 9 9 9 • 9 99» 9 »99 · 9 · # • 9 « 9 99 9 9999 ·· «9 99 9« 99 99 pravděpodobností budou selektivní pro jeden terč než pro jiný.
Zkušený pracovník v oboru rozpozná funkci (XII) skóre jako způsob pro kombinování množství testů asociace, umožňující identifikovat chemické determinanty, které s největší pravděpodobností mají účinky na dvě nebo více daných vlastnosti současně.
Osoba v oboru znalá rovněž snadno nahlédne, že funkce skóre může být modifikována tak, aby zahrnovala přídavné proměnné vztažené k materiálu molekul, biologickým, chemickým a/nebo fyzikálně-chemickým vlastnostem. Například by takovéto modifikace mohly zahrnovat, ale nijak nejsou omezeny pouze na, nastavení pro mocnost sloučeniny, selektivitu, toxicitu, biologickou dostupnost, stabilitu (metabolickou nebo chemickou), realizovatelnost syntézy (sestavení) , čistotu, komerční dosažitelnost, dostupnost vhodných reagentů pro syntézu, cenu, molekulární hmotnost, molekulární refraktivitu, molekulární objem, logP (vypočítaný nebo stanovený), počet skupin akceptujících vodíkové vazby, počet skupin poskytujících vodíkovou vazbu, náboje (parciální a formální), protonační konstanty, počet molekul obsahujících přídavné chemické klíče nebo deskriptory, počet otočných vazeb indexy flexibility, indexy tvaru molekul, podobnosti seskupení a/nebo objemy překrytí.
Tak například může být funkce (VIII) skóre dále modifikována například pro započtení molekulární hmotnosti každého chemického determinantu při uvažování (MW) následovně:
* · · » a · * ·«« · ΐ · • · · · . . . ··.;
·· ·· ·· ·· ·· *· (H) g[{x/z) - (z-X) / (N-z)]
Podobně může být modifikována funkce (IX) skóre pro začlenění proměnných MW a [S] , které reprezentují molekulární hmotnost příslušného chemického determinantu (MW) respektive počet toho, kolikrát se uvedený chemický determinant objevuje v podskupině aktivních sloučenin x {[S]) , následovně:
x íiNx-ya-N/2j2N Mw'[ší' z(N-z)y(N-y)
Score = Loc aby se tak umožnila identifikace největších možných, ojedinělých, biologicky aktivních chemických determinantů během analýzy.
Výsledky algoritmu z kroku 650 poskytují hodnotu skóre uvažovaného fragmentu. Kroky 610 až 650 algoritmu mohou být opakovány pro každý ze zvolených fragmentů v datech. Když již byly vypočítány hodnoty pro všechny zvolené fragmenty, výsledky poskytují hodnotu skóre odpovídající potenciální účinnosti každého z fragmentů, které byly analyzovány. Uvedené hodnoty skóre mohou být seřazeny podle velikosti; přičemž ty fragmenty, které s největší pravděpodobností přispívají k uvažovanému chemickému a/nebo biologickému výsledku, jsou sdruženy například s vysokými hodnotami skóre. To umožňuje v kroku 440 identifikaci jednoho nebo více lokálních extrémů hodnot funkce skóre, jejíchž odpovídající chemické determinanty reprezentují úplná nebo částečná chemická řešení pro požadovaný chemický nebo biologický • 9 ·
výsledek. Nalezení největších hodnot skóre, které může být dosaženo v jakékoliv dané datové sadě, je ekvivalentní identifikování chemickým determinantům obsaženým v podskupině molekul majících požadované vlastnosti, přičemž tyto chemické determinanty mají nej nižší pravděpodobnost výskytu shodou okolností ve stejných podskupinách. Když požadovanou vlastností je daná biologická aktivita fragmenty nebo chemické determinanty s největším skóre reprezentují biologicky aktivní farmakofor.
θ Opět s přihlédnutím ke znázornění na obr. 2 budou nyní diskutována výhodná provedení kroku 250 analýzy knihovny 120 fragmentů.
Jeden způsob analýzy knihovny 120 fragmentů je znázorněn na obr. 7. Proces začíná výběrem fragmentu v kroku
710 na základě hodnot skóre, stanovených v předcházejícím kole. Potom jsou v kroku 720 vyjmuty z předcházejícího souboru sloučeniny, které obsahují vybraný fragment. Protože v kroku 710 byl vybrán fragment s vysokým příspěvkem k požadované aktivitě, sloučeniny, které jsou vyjmuty v kroku
720, mohou být považovány za aktivní sloučeniny. Potom je vybrán v kroku 730 soubor neaktivních sloučenin, buď z předcházejícího souboru nebo z databází nebo z jakéhokoliv jiného zdroje. Potom jsou aktivní a neaktivní sloučeniny uvedeny dohromady v kroku 740 pro vytvoření nového souboru 5 sloučenin. Tento nový soubor sloučenin je potom vybrán v kroku 220 jako soubor sloučenin pro následující generace opakování, aby se tak pokračovalo s dalším kolem.
Nyní bude ve spojení s obr. 8 popsáno výhodné 0 provedení pro realizací kroku 730. Toto provedení využívá · ·· · · · · ··«· · ···· ·· » «··, ·· ·· ·· «* ,, ,, generické podstruktury pro zvolení nového souboru sloučenin pro následující kolo (opakování) .
Proces podle obr. 8 začíná v kroku 810 analyzováním struktury fragmentu, který byl vybrán v kroku 710. Při využití obecného aspektu vynálezu může být fragment, vybraný v kroku 710, zvolen prostřednictvím vyhodnocení hodnoty skóre, která byla vypočítána v předchozím kole. Navíc může být výběr fragmentu prováděn závisle na dalších faktorech, které ovlivňují vhodnost fragmentu jako počátečního bodu pro zobecnění. Tato vhodnost by mohla být funkcí počtu atomů nebo vazeb, způsobu jakým jsou atomy vázány, trojrozměrné struktury příslušného fragmentu, a tak dále.
Poté, co v kroku 810 již byla analyzována struktura vybraného fragmentu, je v kroku 820 lokalizována zobecnitelná položka ve struktuře fragmentu. Tato položka je potom v kroku 830 nahrazena zobecněným výrazem pro vytvoření generické podstruktury (například pro nalezení bio-isosterů) . Příkladem může být.
o '1
Fragment
X o
[Ar] A,
Generická podstruktura kde v daném vybraném fragmentu byly lokalizovány dvě zobecnitelné položky a nahrazeny zobecněnými výrazy [Ar] a A, reprezentuj e
830 je potom * · ♦ · · * V » 4 4 · 4 4 •4 ·« 4· přičemž [Ar] reprezentuje aromatické jádro a A C, nebo S.
Generická podstruktura vytvořená v kroku v kroku 840 použita pro provedení virtuálního screeningu pro nalezení nových sloučenin odpovídajících generické podstruktuře. Termín virtuální screening označuje jakýkoliv proces třídění, který je prováděn pouze s daty, čímž se vylučuje nutnost sestavovat (synteticky vytvářet) sloučeniny. Nové sloučeniny, které jsou odhaleny prostřednictvím virtuálního screeningu, jsou potem použity pro zkonstruování nového souboru sloučenin v kroku 850, který potom může být použít v následujícím kole opakování.
Jak může být patrné z obr. 9, proces virtuálního screeningu může být rozdělen na modifikace fragmentů vnitřní oblasti a vnější oblasti, vytvořených prostřednictvím použití generických podstruktur. Modifikace vnitřní oblasti, prováděné v kroku 910, zahrnují substituce, vřazování, rušení a inverze atomů fragmentu. Počínajíc od výše zmiňovaného přesného fragmentu a zobecnění tohoto fragmentu na generickou podstrukturu jsou získány tři různé substituce v následujícím příkladu:
o
o
Sloučenina Generická podstruktura
Substituce
Modifikace vnější oblasti, sestávají ze změn v substituentech náhodné, cílené, a tak dále:
o [Arp'N H
Generická podstruktu
O
Sloučenina • · ·· · · v · * · · · · · · »·· « • · · · · · · · v* ·· prováděné v «« • ♦ • · • · * ·· kroku 920, fragmentu. Tyto mohou být o
Nové varianty
Cl o
Soubory cílených sloučenin, jsou sbírky molekul, které jsou založeny na modifikacích jedné nebo více generických podstruktur:
Cl • « ·· » · » · * · · * * · * · >*·«·· · « • · · · ·· · ···· ·· ·· ·· ·· ·· ··
Zatímco na obr. 9 je znázorněno, že kroky provádění modifikací vnitřních oblastí a vnějších oblastí jsou realizovány sériově (po sobě) , mělo by být osobám s běžnými znalostmi v oboru zcela zřejmé, že do rozsahu vynálezu spadá rovněž realizace pouze jednoho z těchto různých typů modifikací, nebo realizace obou modifikací v jiném pořadí nebo dokonce paralelně (současně). Mělo by být také zřejmé, že výsledkem virtuálního screeningu je rozmanitá sbírka sloučenin, které mají vysokou pravděpodobnost, že jsou aktivní, protože jsou bohaté na podstruktury sdružené s aktivitou.
Zatímco v kroku 710 je vybrán fragment, který tvoří základ pro aplikaci funkcí 145 zobecnění pro získáni generické podstruktury, je dalším výhodným provedením podle 15 vynálezu volba většího počtu fragmentu s vysokým skóre pro vytváření generických podstruktur. Například bylo zjištěno, že následující fragmenty mají velké příspěvky k požadované aktivitě a mohou tedy být vybrány v kroku 710 :
Tyto vybrané fragmenty jsou potom redukovány na generické podstruktury s vysokým skóre, jako:
Aro mstíc • 9 • *9 • «9 • 99 9 ·· ♦· • * · · 9 9 9 ·* ·· 99 99
Tyto generické podstruktury jsou potom použity pro virtuální screening komerčních databází
nebo korporativních sbírek sloučenin.
Zatímco byl popsán opakovači proces (proces re-iterace) jako výhodný z výpočetních důvodu, protože je výhodné začínat s malými fragmenty a zvětšovat velikost fragmentů mezi po sobě jdoucími koly opakování, a zatímco bylo dále ukázáno, že výkon objevování může být ještě zvýšen prostřednictvím užití generických Či obecných aspektů v tomto opakovacím procesu, existuje ještě další přístup podle předkládaného vynálezu pro další zlepšení procesu diskrétní podstrukturní analýzy podle vynálezu. Tento další přístup je založen na technice vázání za zvýšené teploty (slučování annealing) a bude v následujícím popisu popsán ve spojení s odkazy na obr. 10.
* · ·· · · * ·* * · · · * · · «·· * * · , * · · · ·· · ···.
·· ·* ·· «« ·« ·«
Ve výhodném provedení podle obr. 10 začíná krok 250 analýzy knihovny fragmentů, která byla vytvořena v předcházej ícím kole, s kroky 1010 a 1020 výběru prvního respektive druhého fragmentu. Oba fragmenty jsou zvoleny na základě vypočítaných hodnot skóre a mohou být považovány za fragmenty s vysokým příspěvkem.
V následujícím kroku 1030 se aplikuje funkce 155 slučování pro spojení prvního a druhého fragmentu. Spojení fragmentů znamená definování molekulární struktury nebo podstruktury obsahující oba fragmenty. Pro tento účel může být použito množství různých funkcí 155 slučování. Tyto funkce slučování se liší v konkrétní realizaci toho, jak jsou určité slučovací parametry vyhodnocovány a použity. Slučováními parametry jsou, například, (předem stanovená) vzdálenost prvního a druhého fragmentu, třírozměrná orientace prvního a druhého fragmentu, počet atomů, které jsou vloženy mezi fragmenty, počet vazeb, které jsou použity pro spojení fragmentů dohromady, typ vazeb a atomů, a tak dále.
Navíc je slučovací proces dále výhodně kombinován s obecným (generickým) aspektem vynálezu, jak bylo popisováno výše. Pokud například v krocích 1010 a 1020 jsou vybrány fragmenty Fl a F2, o nichž je známo, že mají vysoké hodnoty skóre, mohla by slučovací funkce, která je vybrána v kroku 1030 a spuštěna v kroku 1040 vytvoření nového souboru sloučenin, použít pro spojení fragmentů generický výraz:
Fl- [G]-F2 • · · a *· ·· * · · ·· ·4
Kde obecný výraz [G] je synonymum pro molekulární podstruktury daných vlastností a slučovacích parametrů a závisí na použité slučovací funkci.
Jakmile již byly fragmenty zkombinovány 5 prostřednictvím přesných nebo generických výrazů, je v kroku 1040 vytvořen nový soubor sloučenin, které obsahují oba fragmenty. Příklad molekuly nového souboru sloučenin je znázorněn na obr. 11, který je dvourozměrnou mapou relativních příspěvků, ilustrující relativní přispění ve 10 vztahu k lokálním souřadnicím. Jak může být patrné z obr. 11, jsou zde dvě lokální maxima, ilustrující přibližné hodnoty skóre 1,2 a 1,7 pro fragmenty F1 a F2.
Slučovací proces (annealing) je výhodný ze dvou důvodů. První výhodou je to, že spojením dvou fragmentu majících vysoký příspěvek k požadované aktivitě mohou být získány větší molekuly, které využívají skutečnosti, že obsahují více než jeden fragment s vysokým skóre. Výsledné struktury mají tudíž velké naděje k tomu, aby měly dokonce vetší hodnotu skóre, než je největší hodnota skóre těchto 20 dvou fragmentů.
Například ve struktuře podle obr. 11 výsledná sloučenina obsahuje fragmenty mající hodnoty skóre 1,2 a 1,7, ale může dosáhnout celkové hodnoty skóre pro celou strukturu například 2,1. Slučovací technika tudíž umožňuje objevování či nalézání sloučenin s dokonce vyšší aktivitou.
Druhou výhodou je to, že slučovací technika umožňuje vyloučit zablokování výpočetního procesu. Jak může být patrné z obr. 11, hodnoty relativních příspěvků indikují dvě lokální maxima. Při provádění opakovacího procesu ilustrovaného na ··· · · · · · · « • ·» * * · · ··· · · · · ···· · · · ···· ·· I* ·· ·· ·· ·· obr. 3, se začátkem s malými fragmenty a se zvyšováním velikosti fragmentů v každém dalším následujícím kole opakování může dojít k zablokování, když je vybraný fragment v jednom z prostředních kroků umístěn na lokálním maximu.
Například když je na konci druhého kola vybrán fragment N-C=O a tento fragment je umístěn na lokálním maximu, následující kolo opakování nebude úspěšné. Jak bylo popsáno výše, fragmenty následujícího kola jsou výhodně konstruovány z vybraného fragmentu předcházejícího kola prostřednictvím přírůstkového zvětšování velikosti fragmentu. Tudíž, ať je jakýkoliv atom přidán k vybranému fragmentu, následující kolo posune fragment od lokálního maxima. To znamená, že v tomto případě výsledný fragment má nižší hodnotu skóre, než vybraný fragment z předcházejícího kola.
Pro vyloučení tohoto zablokování může být aplikována slučovací technika prostřednictvím výběru dvou dobrých fragmentů z předcházejícího kola, spojením těchto fragmentů, výpočtem hodnoty skóre a pokračováním v procesu. To muže být prováděno periodicky v každém kole, nebo kdykoliv je detekováno zablokování.
Zatímco předkládaný vynález byl popsán s použitím množství výhodných provedení, mělo by být osobám s běžnými znalostmi v oboru zcela zřejmé, že tento vynález není nijak omezen pouze na tato provedení. Například může být změněno pořadí kroků ve vývojovém diagramu způsobu podle vynálezu, nebo kroky, které jsou ilustrovány jako prováděné postupně po sobe, by mohly být dokonce prováděny paralelně (současně), viz. Například kroky 1010 a 1020 procesu ilustrovaného na obr. 10.
• 9
9
Navíc by osobám s běžnými znalostmi a zkušenostmi v oboru mělo být také zcela zřejmé, že ne všechny z ilustrovaných kroků způsobu jsou požadovány v každé realizaci. Například v procesu výpočtu skóre podle obr. 6 není požadováno, aby byly vypočítávány parametry, které nejsou použity funkcí skóre. Navíc by parametry mohly být také vypočítávány paralelně s využitím operačního systému pro souběžné či paralelní zpracovávání více úloh.
Nyní budou prostřednictvím příkladů popsána další 0 provedení předkládaného vynálezu.
Například knihovna fragmentů, vytvořená v kroku 230, může teoreticky obsahovat všechny možné fragmenty a jejich kombinace. To může být dosaženo v praxi tehdy, když je knihovna generována prostřednictvím počítače. Pokud je ale 5 knihovna generována manuálně, bude pravděpodobně obsahovat pouze výběr všech možných fragmentů. Způsob tudíž může být opakován s použitím kombinací fragmentů, zejména kombinací fragmentů, pro které již byly vysoké hodnoty skóre získány v předchozí analýze.
Tudíž následně po počáteční analýze fragmentů ty fragmenty, které s největší pravděpodobností přispívají k příslušnému chemickému a/nebo biologickému výsledku, mohou být kombinovány a může být aplikován algoritmus podle výše 5 uváděného popisu pro odhad příspěvku uvedeného kombinovaného fragmentu ve vztahu k požadovanému chemickému a/nebo biologickému výsledku. Získaná hodnota skóre může být porovnána s hodnotami skóre jednotlivých fragmentů pro ověření, zda tato kombinace má za následek zlepšení příspěvku η k příslušnému chemickému a/nebo biologickému výsledku.
V dalším provedení předkládaného vynálezu je možné vybírat z fragmentů, majících největší příspěvek k příslušnému chemickému a/nebo biologickému výsledku, společnou strukturní část pro identifikování, zda příspěvek uvedené společné části je stejný nebo vyšší než výchozí fragmenty.
Fragmenty s nejvyššími hodnotami skóre reprezentují chemický determinant nebo molekulární otisk mající největší váhu pro přispění k danému chemickému nebo biologickému výsledku.
Po identifikování uvedeného otisku je potom možné vytvořit knihovnu sloučenin obsahujících uvedené chemické determinanty. Sloučeniny mohou být získány prostřednictvím programu syntézy (sestavování) kolem příslušného strukturního znaku. Alternativně mohou být sloučeniny, obsahující chemický determinant, identifikovány z komerčních katalogů a nakupovány od příslušného zdroje. Sloučeniny nemusí být nezbytně připravovány pro farmaceutické účely a mohou být dostupné z nej různějších zdrojů.
Jakmile již byla sestaveny požadovaná knihovna, může být podrobena screeningu proti určeným požadovaným terčům. Výsledky screeningu mohou identifikovat sloučeniny, které jsou dostatečně aktivní pro další vývoj, nebo mohou poskytnou vodící struktury pro program syntézy. DSA metoda podle předkládaného vynálezu umožňuje vytvoření rozmanitých a přitom ještě vysoce cílených knihoven ve vztahu k určitému biologickému nebo farmakologickému terči. Je tedy podstatně zvýšena pravděpodobnost úspěchu při screeningu pro aktivní sloučeniny a/nebo použitelné vodicí struktury.
• 9 · 9 * 999 9 * · 99 9
9 9 « 9
9 9 9 9 » 9
99 99 99 • 9 9 ·
99
V dalším provedení předkládaný vynález navrhuje způsob identifikace molekul, majících určité požadované vlastnosti, jako jsou biologicky aktivní molekuly, přičemž tento způsob zahrnuje:
• vážení příspěvku molekulárních fragmentů, uvnitř podskupiny molekul, pro daný chemický nebo biologický výsledek, jak bylo popisováno výše, • identifikování jednoho nebo více fragmentů s nejvyšší váhou, a • sestavení souboru sloučenin, přičemž tyto sloučenin obsahují jeden nebo více z uvedených fragmentů, a případně • testování uvedených sloučenin na požadované vlastnosti.
Mělo by být zcela zřejmé, že způsob může být stejně tak použit pro identifikování fragmentů, které vedou k nežádoucím vlastnostem, jako jsou například škodlivé biologické vedlejší účinky, a tudíž'pro vyloučení sloučenin, majících takové fragmenty, z úvah o použití.
Způsob podle předkládaného vynálezu tudíž generuje strukturní hypotézy (fragmenty) , u nichž se pravděpodobnost toho, že jsou vysvětlením daného biologického, biochemického, farmakologického nebo toxikologického výsledku, odhaduje výpočtem kvantitativní hodnoty skóre. Uvažování hodnoty skóre pro daný fragment umožňuje osobě pracující na vývoji léků provádět informovaná rozhodnutí o přístupech, které s největší pravděpodobností povedou k dosažení požadovaného cíle, jako je identifikace silněji působících sloučenin, objevení nové řady aktivních sloučenin, identifikace více selektivních nebo více biologicky dostupných sloučenin nebo eliminace toxických účinků.
Způsob podle předkládaného vynálezu se zaměřuje na fragmenty přítomné v podskupině příslušných sloučenin, čímž se eliminuje nutnost provádět nadměrná množství zdlouhavých výpočtů pro pravděpodobněji méně relevantní sektory chemického prostoru. To má za následek redukci počtu výpočetních kroků, které jsou potřebné pro vyřešení daného biologického výsledku, při současném zachování základní úrovně molekulárního významu, který je požadovaná za účelem stanovení existence biologicky aktivních chemických determinantů.
Jak bylo diskutováno výše, proces podle předkládaného vynálezu zahrnuje hledání lokálních extrémů jedné nebo více funkcí, které mohou být snadno zvoleny tak, aby tyto extrémy odpovídaly pravděpodobnostem daným v běžných statistických tabulkách. To poskytuje elegantní způsob vyhodnocení potenciálního příspěvku daného fragmentu k chemickému nebo biologickému výsledku. Není ale nezbytné založit analýzu na statistické teorii za účelem realizace předkládaného vynálezu.
DSA metoda podle předkládaného vynálezu může být využita v širokém aplikací objevování nových léků. Jak bylo popsáno výše, způsob podle vynálezu umožňuje identifikaci farmakoforů, které mají vysokou pravděpodobnost přispívání k dané biologické aktivitě, jako jsou například antagonisty 7-TM receptoru, inhibitory kinázy, inhibitory fosfatázy, blokátory iontových kanálků a inhibitory proteázy a rovněž • « * · ··
♦ ♦ ·» aktivní součásti přirozeně se vyskytujících peptidergních ligandu.
Způsob rovněž umožňuje identifikaci endogenních modulátorů lékových cílů, což umožňuje identifikaci nových směrů farmakologické intervence a rovněž racionální začlenění nových farmakologických vlastností do molekul předtím nemajících tyto uvedené vlastnosti.
Způsob podle vynálezu může být rovněž použit pro identifikování chybně pozitivních a chybně negativních výsledků v datových souborech, například souborech, které jsou odvozeny z vysokovýkonného screeningu. DSA metoda je rovněž použitelná pro předvídání selektivity sloučeniny například prostřednictvím identifikování potenciálně nežádoucích sekundárních účinků.
Způsob může být použit stejným způsobem pro předvídání toxických účinků sloučeniny prostřednictvím identifikování jeho toxikoforních chemických determinantů, což ve spojení s výše uvedeným umožňuje konstruovat databáze chemických determinantů s velkým využitím pro selekci chemických řad. V tomto kontextu způsob podle vynálezu dále umožňuje racionální začlenění nových farmakologických vlastností do chemických sloučenin předtím nemajících takovéto aktivity. Nakonec v důsledku svojí schopnosti identifikovat nejvhodnější úroveň molekulární rozmanitosti, která musí být testována během procesu screeningu, DSA metoda umožňuje efektivní provádění racionálních, do značné míry paralelně realizovaných, automatizovaných a vysoce výkonných procesů screeningu, což je znatelným zlepšením oproti současným strategiím vysoce výkonného objevování.
* · · · · · ·· ·» ··
Mělo by být zřejmé, že ve výše popisovaném způsobu podle předkládaného vynálezu se alespoň jeden krok provádí prostřednictvím počítačem řízeného systému. Tak například hodnoty x, y, za 27, získané z databází, mohou být zadávány do a zpracovávány prostřednictvím vhodně naprogramovaného počítače. Do rozsahu předkládaného vynálezu tudíž rovněž spadají takovéto počítačem řízené nebo počítačem realizované postupy.
Z výše uvedeného popisu je zřejmé, že předkládaný vynález poskytuje nový způsob pro rychlou identifikaci molekul majících určité požadované vlastnosti, jako jsou biologicky aktivní molekuly. Zejména se tento vynález týká způsobu vážení účinnosti molekulárních struktur za účelem identifikování biologicky aktivních součástí molekulárních struktur a využití těchto součástí při konstruování cílených souborů chemických sloučenin pro rychlejší a cenově efektivnější objevování léků.
Způsob je navržen pro zvýšení podílu biologicky aktivních sloučenin v daném souboru chemických entit, přičemž o těchto entitách ještě není známo, že by měly požadovanou biologickou aktivitu. Uvedený způsob zahrnuje aplikaci různých matematických technik pro kvantitativní stanovení vztahů strukturní aktivity (QSAR). Tento nový postup, který může být označen jako diskrétní podstrukturní analýza (DSA) poskytuje řešení například pro problém rozpoznání farmakologického obrazu, to jest problém identifikování chemických determinantů (CD), které jsou odpovědné s ohledem na danou sloučeninu za jakýkoliv daný chemický nebo biologický výsledek, kterým může být například biologická, « ·· 9 9 • *
99« * · * • » ’ «· «· biochemická, farmakologická, chemická a/nebo aktivita.
toxikologická
Způsob podle předkládaného vynálezu má široké využití a není omezen na oblast farmakologie. Pokud se týká biologicky aktivních sloučenin, způsob podle vynálezu může být například využit ve spojení s pesticidy a herbicidy, kde požadovanou biologickou aktivitou je pesticidní respektive herbicidní aktivita. Způsob může být rovněž použit v aplikacích reaktivního modelování, kde požadované vlastnosti jsou spíše chemické než biologické atributy, například tedy při vytváření katalyzátorů.
Mělo by být zcela zřejmé, že technikou podle vynálezu je kombinování v podskupině nebo mezi různými podskupinami těch fragmentů, které s největší pravděpodobností přispívají k příslušnému chemickému a/nebo biologickému výsledku, a aplikování algoritmu pro odhad příspěvku uvedeného kombinovaného fragmentu vzhledem k příslušnému chemickému a/nebo biologickému výsledku, přičemž získaná hodnota skóre může být porovnávána s hodnotami skóre jednotlivých fragmentů pro ověření, zda kombinace má za následek zlepšení příspěvku k příslušnému chemickému a/nebo biologickému výsledku.
Navíc předkládaný vynález umožňuje výběr, z fragmentů majících největší příspěvek k příslušnému chemickému a/nebo biologickému výsledku, společné strukturní části pro identifikování, zda příspěvek uvedené společné části je stejný nebo větší než příspěvek výchozích fragmentů.
Navíc je použito míry nebo měřítka asociace, které je výhodně zvoleno z odčítacích měřítek, poměrových měřítek nebo smíšených měřítek. Měřítko asociace je výhodně začleněno ve • « funkci skóre nebo rozvinuta na funkci skóre. Funkce skóre může být rozvinuta s použitím statistické metody zvolené z metody kritických poměrů, Fisherova testu přesnosti, Personovy metody na bázi chi-kvadrátu, Mantel Haenzelovy metody na bázi chi-kvadrátu, odhadu strmostí a podobně. Dalším výhodným provedením je, že funkce skóre je rozvinuta s použitím metody zvolené z výpočtu a porovnání přesných a přibližných konfidenčních intervalů, koeficientů korelace nebo jakékoliv funkce explicitně obsahující měřítko asociace zahrnující jakoukoliv kombinaci jedné, dvou, tří nebo čtyř z proměnných x, y, za N.
Výhodně se podle předkládaného vynálezu provádí krok výběru molekul, obsahujících fragmenty s nejvyšším skóre, jako potenciálních ligandů a případně následně jejich 15 testování jako modulátorů lékového terče. Způsob podle vynálezu může být výhodně použit pro identifikování chybně pozitivních a/nebo chybně negativních experimentálních výsledků. Dalšími výhodnými aplikacemi je provádění zkoumání podobnosti, analýzy rozmanitosti a/nebo analýzy shody.
20
V následujícím popisu jsou uvedeny ilustrace množství aplikací DSA procesu podle vynálezu. Příklady jsou výhodnými provedeními vynálezu a slouží pro ilustraci vynálezu, ale v žádném případě nemají jakoukoliv omezující funkci pro rozsah vynálezu.
Příklad č. 1 - Racionální identifikace nových a selektivních receptorovych ligandů
Zkouška konkurenčních vazeb byly rozvinuta pro 30 povrchový receptor buněk s využitím rekombinačního *4
4·« »4 *·
444 9 « membránového preparátu a radiově označeného peptidu. Byla sestavena sbírka sloučenin pro testování ve zkoušce a byly identifikováno nové receptorové ligandy způsobem podle předkládaného vynálezu. První krok sestával ze sestavení seznamu 208 struktur antagonistů stejného uvedeného receptoru prozkoumáním současné vědecké literatury. Druhý krok sestával z identifikace biologicky aktivních chemických determinantů obsažených v těchto 208 receptorových ligandech. To znamená, že byl vytvořen další seznam obsahující 101130 struktur popsaných jako majících žádný účinek na uvedený stejný receptor a tento seznam byl přidám k prvnímu. Výsledný seznam 101338 struktur byl potom analyzován na přítomnost biologicky aktivních chemických determinantů prostřednictvím zvolení odčítacího měřítka asociace (I) , kde proměnná x reprezentovala počet aktivních chemických struktur obsahujících příslušný chemický determinant, y reprezentovala celkový počet chemických struktur obsahující stejný chemický determinant, z reprezentovala celkový počet aktivních chemických struktur v souboru N molekul (to jest z = 208), a
N reprezentovala celkový počet chemických struktur podrobených analýze (to jest N = 101338).
(I) Nx - yz
Měřítko asociace (I) potom bylo rozvinuto do funkce skóre (II), která, jak odborník v oboru snadno nahlédne, je nepřímou mírou pravděpodobnosti možného náhodného výskytu, modifikovanou pro různé omezující faktory. Například výraz N/2 v čitateli druhého kvocientu logaritmicky váženého 30 výsledku je konzervativním nastavením přirozeného přiblížení * · 9 9 • 9
9 9 9 k binomickému rozdělení, což je využitelnou modifikací pro práci s relativně malými hodnotami x, y, z, a N. Proměnné MW a [S] , které reprezentují molekulární hmotnost příslušného chemického determinantu (MW) respektive počet, kolikrát se stejný uvedený determinant objevuje v podskupině aktivních sloučenin x ( [S]), byly začleněny do funkce skóre za účelem umožnění identifikace největších možných, samostatných, biologicky aktivních chemických determinantů během analýzy. Zkušený pracovník v oboru snadno nahlédne, že mohou být použita jiná měřítka asociace a/nebo funkce skóre pro stejné účely na místo těch, která byla popsána ve vzorcích (I) a (II) , z nichž nejvhodnější z hlediska předkládaného vynálezu obsahují různé kombinace jedné, dvou, tří nebo Čtyř z proměnných x, y, z, a N.
x (ÍNx-yzl-N/afN''
M W — -—--— [S] z(N-z)y(N-y) /
Osoba v oboru znalá rovněž snadno nahlédne, že funkce skóre (II) by mohla být modifikována tak, aby zahrnovala přídavné proměnné vztažené k materiálu molekul, biologickým, chemickým a/nebo fyzikálně-chemickým vlastnostem. Například by takovéto modifikace mohly zahrnovat, ale nijak nejsou omezeny pouze na, nastavení pro mocnost sloučeniny, selektivitu, toxicitu, biologickou dostupnost, stabilitu (metabolickou nebo chemickou) , realizovatelnost syntézy (sestavení), čistotu, komerční dosažitelnost, dostupnost vhodných reagentů pro syntézu, cenu, molekulární hmotnost, molekulární refraktivitu, molekulární objem, logP (vypočítaný • · · · ··· • · · · nebo stanovený) , převahu dané podstruktury ve sbírce lékových molekul, celkový počet a/nebo typy atomů, celkový počet a/nebo typy chemických vazeb a/nebo orbit, počet skupin akceptujících vodíkové vazby, počet skupin poskytujících vodíkovou vazbu, náboje (parciální a formální), protonační konstanty, počet molekul obsahujících přídavné chemické klíče nebo deskriptory, počet otočných vazeb, indexy flexibility, indexy tvaru molekul, podobnosti seskupení a/nebo objemy překrytí.
0 Analýza 101338 struktur vedla k identifikaci osmi rozdílných chemických determinantů, které měly molekulární hmotnost v rozsahu od 150 do 230 a které měly pravděpodobnost menší než 1 z 10000, že budou obsaženy v podskupině aktivních chemických struktur pouze na základě náhodného výběru (p<0,0001). Těchto osm chemických determinantů tedy bylo akceptováno jako reprezentativních pro jednu nebo více biologicky aktivních částí z 208 receptorových ligandů zjištěných z literatury a bylo sestaveno do čtvrtého seznamu. Výpočty s použitím vzorce (II) potom byly opakovány za účelem 0 zjištění, zda by mohl být identifikován větší chemický determinant vyplývající z kombinace nebo dalšího rozšíření kterýchkoliv z osmi fragmentů. Největší, statisticky významný chemický determinant, nalezený v těchto dalších výpočtech, měl molekulární hmotnost 335 a byl vybrán jako reprezentativní kostra nebo farmakologicky aktivní otisk pro následný výběr a syntézu (sestavení) sloučenin. Třetí krok procesu zahrnoval použiti výše popisované reprezentativní kostry jako šablony pro virtuální screening a výběr sloučenin. Pro tento účel byly provedeny podstrukturní 0 průzkumy v databázi přes 600000 komerčně dostupných sloučenin • · ·· • · · · « · · * »· ·· ·· • ··· s použitím jak vypočítaného otisku tak i jeho fragmentů. Na základě těchto průzkumů bylo získáno celkem 1360 sloučenin a dalších 1280 sloučenin bylo náhodně vybráno a získáno od stejných dodavatelů pro kontrolní účely.
Čtvrtý a pátý krok, tvořící finální fáze procesu, byly provedeny paralelně. Čtvrtý krok zahrnoval testování dvou souborů výše popisovaných sloučenin v testu vázání radioligandů. Z 1360 molekul, vybraných na základě reprezentativní kostry, 205 molekul vykázalo konkurenční aktivitu při testování při koncentracích v rozsahu mezi 1 a 10 μΜ, 21 sloučenin vykázalo aktivitu při testování při koncentracích v rozsahu mezi 0,1 a 1 μΜ a jedna sloučenina, označená jako sloučenina A, vykázala afinitu pro receptor (Ki) při 8,1 + 1,05 nM (n = 12). Každá z 1280 náhodně vybraných sloučenin selhala při demonstrování vlastností vázání receptorů při testování při koncentraci 10 μΜ. Jako takový byl soubor sloučenin, sestavený na základě reprezentativního otisku, alespoň 21 krát účinnější pro poskytnutí aktivních molekul, než byl soubor náhodně vybraných sloučenin (p<0,0001).
Bylo zjištěno, že sloučenina A reprezentuje novou, doposud nepopsanou třídu inhibitoru příslušného receptorů. Obr. 12 ilustruje účinek sloučeniny A na receptorem zprostředkovanou tvorbu inositoltrisfosfátu. Buňky, vyjadřující příslušný receptor, byly předem zatíženy radiově označeným inositolem a vystaveny receptorovému agonistu za přítomnosti zvyšujících se koncentrací sloučeniny A. Tvorba inositoltrisfosfátu (IP3) byla měřena následně po vypláchnutí radiově označených buněčných inositolfosfátů ze slučovací kolony. Sloučenina A vykazovala agonistem indukovanou tvorbu
IP3 s IC50 o hodnotě 22 nM, což je hodnota konzistentní s afinitou sloučeniny pro receptor.
Jak je znázorněno na obr. 12, sloučenina A podstatně snížila receptorem zprostředkovanou tvorbu inositoltrisfosfátu při funkčním testu na bázi buněk (IC50 = 22 nM) , což je zjištění konzistentní jak s afinitou sloučeniny pro receptor tak i s použitím receptorových antagonistů ve výše popisovaných výpočtech. Nakonec byla sloučenina A určena jako vysoce selektivní pro příslušný receptor, neboú selhala při demonstrování značné inhibiční (blokační) aktivity při testování při koncetraci 10 μΜ ve vice než 20 jiných testech vázání receptorových radioligandů.
Pátý krok sestával v použití výše popisované reprezentativní kostry pro přímou koncepční konstrukci a syntézu (sestavení) nových chemických sloučenin, ve smyslu sestavování látky, a z hlediska identifikování nových molekul s aktivitami vázání receptoru. Pro tento účel byl sestaven seznam chemických reaktantú a produktů reakcí, ve kterém byla výše popisovaná biologicky aktivní reprezentativní kostra, nebo její fragmenty, obsažena buď v chemických strukturách reaktantnů nebo ve výsledných produktech reakcí. Bylo zvoleno více než 2000 kombinací reaktantú a byly sestaveny odpovídající reakční produkty pro testování. Testování těchto sloučenin v testu vázání receptorů vedlo k identifikaci nové třídy chemické sloučeniny ve smyslu sestavování látky, z které množství reprezentantů vykázalo IC50 v rozsahu od 50 do 500 nM.
Příklad č. 2 - Racionální identifikace nových a selektivních inhibitorů kinázy • ·· • · • · · • ··· • «
Enzymatický test byl rozvinut pro lidskou kinázu vznikající zánětu, pro kterou doposud v literatuře nebyl popsán žádný inhibitor. Byl sestaven soubor sloučenin pro testování v testu, tyto sloučeniny byly testovány a byly identifikovány nové inhibitory kináz postupem podle předkládaného vynálezu. První krok zahrnoval sestavení seznamu 2367 chemických struktur inhibitorů proteinů vázajících nukleotid purinu z vědecké literatury, včetně struktur sloučenin prokazujících se jako inhinitory pro jiné kinázy, fosfodiesterázy, receptory vázání nukleotidu purinu, a iontové kanálky modulované nukleotidem purinu, dále označované jako náhradní terče. Druhý krok sestával z identifikace biologicky aktivních chemických determinantů obsažených v těchto 2367 chemických strukturách. Pro tento účel byl vytvořen další seznam obsahující 98971 struktur popsaných jako majících nulový účinek na tytéž uvedené náhradní terče a tento seznam byl přidán k prvnímu. Výsledný seznam 101338 struktur byl analyzován na přítomnost biologicky aktivních chemických determinantů prostřednictvím výběru poměrového měřítka (III) asociace, ve kterém x reprezentovalo počet aktivních chemických struktur obsahujících příslušný chemický determinant, y reprezentovalo celkový počet chemických struktur obsahujících stejný uvedený chemický determinant, z reprezentovalo celkový počet aktivních chemických struktur v souboru N molekul (to jest z = 2367), a N reprezentovalo celkový počet chemických struktur podrobených analýze (to jest N = 101338) , (lil) • · · · ♦ · «· ft • · ·· ··· · · » · • ♦ · » · ·· ·· *· x(N-y-z-^x) (z-x)(y-x)
Měřítko (III) asociace potom bylo rozvinuto do funkce (IV) skóre, kterou osoba v oboru znalá snadno identifikuje jako způsob pro odhad hodnoty spodní limity 95% konfidenčního intervalu měřítka (III) s použitím logaritmické transformace pro lepší porovnatelnost rozdělení poměru s normálním rozdělením, a aproximaci Taylorových řad prvního řádu pro odhad odchylky logaritmu stejného uvedeného poměru. V tomto případě ve funkci skóre nebyly použity žádné další proměnné jiné než x, y, za N, ačkoliv osoba v oboru znalá snadno nahlédne, že vzorec (IV) by mohl být také modifikován pro zahrnutí dalších proměnných se vztahem k materiálu molekul, biologickým, chemickým a/nebo fyzíkálne-chemickým vlastnostem, jak bylo zmiňováno v příkladu 1, ale bez omezení na citace uvedené v příkladu 1. Osoba s dobrými znalostmi v oboru rovněž snadno nahlédne, že pro' stejný účel by mohla být použita jiná měřítka asociace a/nebo funkce skóre namísto těch, které byly popsány ve vzorcích (III) a (IV) , z nichž nejvhodnější z hlediska předkládaného vynálezu obsahují různé kombinace dvou, tří nebo čtyř z proměnných x, y, z a N.
(IV)
Score = x(N-y-z-rx) 27i/xVv(v-x)+i/(z-xM(N~y-^x) (z-x)(y-x) ίο ; ;.*·. * ϊ *· · · • · · · · * · ·· ·· ·· « « I ·· ··
Analýza 101338 chemických struktur, katalogizovaných pro různé biologické aktivity, byla provedena skórováním sérií chemických determinantů s užitím vzorce (IV), dokud jedna nebo více skupin determinantů nebylo rozpoznáno jako obsahující prvky mající hodnotu větší než jedna, což odpovídalo pravděpodobnosti méně než 1 z 20 jejich přítomnosti v podskupině biologicky aktivních struktur na základě pouze náhodného výběru (p < 0,05). Tyto chemické determinanty tudíž byly akceptovány jako reprezentativní pro jednu nebo více farmakologicky aktivních částí inhibitorů náhradních terčů, popisovaných v literatuře, a byly sestaveny do čtvrtého seznamu. Na rozdíl od vyhledávání maximálně skórujících kombinací těchto determinantů, jak bylo popsáno v příkladu č. 1, byly tyto struktury přímo použity jako reprezenativní kostry nebo farmakologicky aktivní otisky pro následný výběr a syntézu sloučenin.
Třetí krok zahrnoval použití výše popisovaných reprezentativních koster jako šablon pro virtuální screening a výběr sloučenin.
provedeny komerčně
Pro tento účel byly podstrukturní průzkumy v databázi přes 250000 dosažitelných sloučenin s použitím jak vypočítaných otisků, fragmentů tak i jejich kombinací. Na základě těchto průzkumů bylo získáno celkem 2846 sloučenin, přičemž pro kontrolní účely byl použit stejný soubor 1280 náhodně vybraných sloučenin, jako bylo popsáno v příkladu č. 1.
Čtvrtý a pátý krok, tvořící finální fáze procesu, byly prováděny paralelně. Čtvrtý krok zahrnoval testování získaných sloučenin v enzymatickém testu. Z 2846 molekul, vybraných na základě reprezentativních koster, vykázalo 88 molekul inhibitorní aktivitu při tetsování při koncentraci 5 • ·· » » · * » · «» ♦· • « * • · · · • · ·· μπι. Mezi těmito vykázalo šest molekul hodnotu IC50 v rozsahu 0,2 až 2 gm a jedna sloučenina, označená jako sloučenina B, vykázala hodnotu IC50 164 nm (viz obr. 13) .
Obr. 13 ilustruje účinek sloučeniny B na proteinovou fosforylaci závislou na kináze. Příslušná kináza byla inkubována radiově označeným ATP a peptidovým substrátem za přítomnosti zvyšujících se koncentrací sloučeniny B. Proteinová fosforylace byla měřena s použitím standardních radiometrických technik. Sloučenina B významně inhibovala fosforylaci proteinového substrátu, závislou na kináze, přičemž vykazovala hodnotu IC50 164 nM.
Mezi 1280 náhodně vybranými sloučeninami, testovanými pro kontrolní účely, pouze tři vykázaly inhibitorní aktivitu při testovacím screeningu, z nichž nej silnější vykazovala hodnotu IC50 pouze 7,8 μΜ. Jako takový byl soubor sloučenin, sestavený na základě reprezentativních otisků, 13,2 krát účinnější při dodání aktivních molekul, než byl soubor náhodně vybraných sloučenin (p < 0,0001). Navíc bylo shledáno, že sloučenina B reprezentuje nový, doposud nepopsaný inhibitor ATP-konkureČní kinázy, vykazující více než 250 násobnou selektivitu pro příslušnou kinázu při tetsování v selektivních testech s použitím jak strukturně tak i funkčně alternativních kináz.
Pátý krok sestával v použití jedné nebo více z výše poisovaných reprezentativních koster pro přímou koncepční konstrukci a syntézu nových chemických sloučenin, ve smyslu sestavování látky, a z hlediska identifikování nových molekul s aktivitami inhibitoru kinázy. Pro tento účel byl sestaven seznam chemických reaktantů a produktů reakcí, ve kterém byly výše popisované biologicky aktivní reprezentativní kostry, « · · · · • · · · ·· ·· ··· • 9 • 9 9 • 9 9 9
94 nebo jejich fragmenty, obsaženy buď v chemických strukturách reaktantnú nebo ve výsledných produktech reakcí. Bylo zvoleno více než 4000 kombinací reaktantů a byly sestaveny odpovídající reakční produkty pro testování. Testování těchto sloučenin v testu screeningu vedlo k identifikaci dvou nových tříd chemických sloučenin ve smyslu sestavování látky, z kterých množství reprezentantů vykázalo IC50 v rozsahu od 100 do 500 nM.
0 Příklad č. 3 - Racionální identifikace nových a selektivních blokátorů iontových kanálků
Byl rozvinut test pro inotový kanálek, o kterém se předpokládá, že má úlohu při neurodegeneraci, pro který doposud nebyl v literatuře popsán žádný inhibitor. Byl sestaven soubor sloučenin, který byl testován a byly identifikovány nové inhibitory způsobem podle předkládaného vynálezu. První krok sestával z vytvoření strukturních dat pro identifikování chemických determinantu inhibitorů příslušného kanálku. To bylo provedeno testováním prvních
3680 sloučenin z firemní sbírky předkladatele přihlášky při koncentraci 5 μΜ v testu screeningu a popisem (katalogizací) každé struktury v seznamu pro jejich inhibitorní aktivitu. S použitím hranice 40% inhibice jako prahové hodnoty pro třídění bylo 36 struktur identifikováno jako aktivních a zbývajících 3644 sloučenin bylo kvalifikováno jako neaktivních.
Druhý krok sestával z identifikování biologicky aktivních chemických determinantů obsažených ve strukturách 36 inhibitorů. Pro tento účel bylo 3680 katalogizovaných struktur analyzováno prostřednictvím výběru výše popisovaného • · měřítka (I) asociace, ve kterém x reprezentovalo počet aktivních chemických struktur obsahujících příslušný chemický determinant, y reprezentovalo celkový počet chemických struktur obsahujících stejný uvedený chemický determinant, z reprezentovalo celkový počet aktivních chemických struktur v souboru N molekul (to jest z = 36) , a JV reprezentovalo celkový počet chemických struktur podrobených analýze (to jest N = 3680) . Měřítko (I) asociace potom bylo rozvinuto do funkce (V) skóre, kterou zkušený pracovník v oboru snadno rozpozná jako výskledek součinitele momentové korelace, odrážející stupeň sdílené odchylky mezi dvěma dichotomickými proměnnými explicitně nevyjádřenými v uvedeném vzorci (V) .
(V)
Score =
Nx-yz y'z(N-z)y(N-y)
V tomto případě ve funkci skóre nebyly použity žádné další proměnné jiné než x, y, z a N, ačkoliv osoba v oboru znalá snadno nahlédne, že funkce (V). skóre by mohla být také modifikována pro zahrnutí dalších proměnných se vztahem k materiálu molekul, biologickým, chemickým a/nebo fyzikálně-chemickým vlastnostem, jak bylo zmiňováno v příkladu 1, ale bez omezení na citace uvedené v příkladu 1. Osoba s dobrými znalostmi v oboru rovněž snadno nahlédne, že pro stejný účel by mohla být použita jiná měřítka asociace a/nebo funkce skóre namísto těch, které byly popsány ve vzorcích (I) a (V) zejména proto, že funkce (V) skóre není neměnná při různých změnách pro studijní konstrukce a/nebo rozdělení y, (N-y), z a (N-z). Nejvhodnější z těchto • 9· • · 9
9 ·
99 alternativních postupů z hlediska předkládaného vynálezu obsahují různé kombinace dvou, tří nebo čtyř z proměnných x, y, z a N,
Následující panely ukazují příklady chemických determinantů použitých pro analýzu a vybraných pro další zkoumání. Celkem 3680 struktur katalogizovaných pro aktivitu inhibice kanálku bylo tetsováno na přítomnost biologicky aktivních podstuktur s použitím sady chemických determinantu zahrnujících pět determinantů ilustrovaných na panelu A. Mezi těmito pěti strukturami vykazoval nejvyšší hodnotu skóre determinant č. 4, což indikuje, že měl nejvyšší pravděpodobnost, že je základem pro aktivitu inhibice kanálku. Výpočty tedy byly opakovány pro struktury obsahující determinant č. 4a byla identifikována chemická struktura, znázorněná na panelu B, jako jedna z největších, statisticky vznamných determinantů obsažených v souboru 36 inhibitorů, přičemž tato struktura byla zvolena pro další zkoumání. Symboly: A reprezentuje C, N, 0 nebo S; B reprezentuje H nebo
No. 4 No. 5
Sccre = 0.21 Score = 0.03
Analýza 3680..katalogizovaných struktur byla porvedena vytvořením skóre pro série chemických determinantů se vzorcem (V) a podržením struktur poskytujících největší, nenulové kladné hodnoty. Příklady některých z chemických determinantů, použitých v tomto procesu, jsou znázorněny na panelu A společně s jejich vypočítanými hodnotami skóre. Mezi nimi determinant č. 4 vykazoval nejvyšší skóre a bylo odhadnuto, že má pravděpodobnost menší než 1 ze 100, že bude obsažen v podskupině struktur blokujících kanálek na základě pouze náhodného výběru {p < 0,01). Determinant č. 4 byl tudíž akceptován jako reprezentativní z biologicky aktivní části velkého podílu z 36 inhibitorů a potom byly opakovány výpočty s použitím vzorce (V) pro zjištění, zda by mohly být identifikovány dokonce ještě větší determinanty. Největší, statisticky významný chemický determinant, nalezený v těchto dalších výpočtech, je znázorněn na panelu B. Tato struktura byla vybrána jako reprezentativní kostra nebo farmakologicky aktivní otisk pro následný výběr a syntézu sloučenin.
Třetí krok zahrnoval použiti reprezentativní kostry, popsané v panelu B, jako šablony pro virtuální screening a výběr sloučenin. Pro tento účel byly provedeny podstrukturní průzkumy v databázi přes 400000 komerčně dostupných sloučenin s použitím jak vypočítaného otisku, tak i jeho fragmentů.
| Celkem bylo získáno | 1760 | sloučenin | na | základě | těchto |
| průzkumů, přičemž pro | kontrolní účely | byl | použit | stejný | |
| soubor 1280 náhodně vybraných | sloučenin, | jako | bylo popsáno v | ||
| příkladu č. 1. | |||||
| Čtvrtý a pátý | krok, | tvořící finální | fáze ; | procesu, |
byly prováděny paralelně. Čtvrtý krok zahrnoval testování získaných sloučenin v enzymatickém testu. Z 1760 molekul, vybraných na základě reprezentativních koster, S4 molekul vykazovalo inhibitorní aktivity o hodnotě alespoň 40% při 30 testování při koncentraci 5 μΜ. Mezi nimi 8 molekul • · ·· vykazovalo hodnoty IC50 v podmikromolárním rozsahu a jedna sloučenina, označená jako sloučenina C, vykazovala hodnotu ICS0 400 nM. Dva příklady těchto sloučenin inhibujících (iontový) kanálek jsou znázorněny níže, přičemž oba obsahují právě farmakologicky aktivní otisk znázorněný na panelu B:
13 Tyto dvě kanálek inhibující sloučeniny byly vybrány pro testování s použitím způsobu podle předkládaného vynálezu. Obě molekuly významně inhibovaly příslušný kanálek. Jak je znázorněno silněji vyznačenými podstrukturami, chemické struktury těchto dvou sloučenin obsahují farmakologicky aktivní chemický determinant identifikovaný s použitím způsobu podle předkládaného vynálezu a znázorněný na panelu B výše.
Mezi 1280 náhodné vybranými sloučeninami, testovaným.!
pro kontrolní účely, celkem 33 molekul vykázalo inhibitorní aktivitu o hodnotě alespoň 40% při testu screeningu. Jako takový soubor sloučenin, sestavený na základě reprezentativního otisku ilustrovaného na panelu B, byl 1,8 krát účinnější při poskytnutí aktivních molekul, než byl soubor náhodně vybraných sloučenin (p < 0,005). Soubor sloučenin, sestavený na základě reprezentativního otisku ; · «· · · · · »« ·* • · ··· • « · »© ♦· ·· ·· ilustrovaného na panelu B, byl také 4,9 krát účinnější při poskytnutí aktivních molekul, než bylo prvních 3680 sloučenin firemní sbírky sloučenin (p < 0,0001).
Pátý krok sestával z využití reprezentativní kostry znázorněné na panelu B pro přímou koncepční konstrukci a syntézu nových chemických sloučenin ve smyslu sestavování látky a z hlediska identifikování nových molekul s vlastnostmi inhibice pro (příslušný) kanálek. Pro tento účel jeden ze 120 farmakologicky aktivních inhibitorů, popisovaných výše, byl vybrán pro další zkoumání a byl chemicky modifikován s použitím předtím sestavených kladných a záporných výsledků screeningu jako zdroje informací o aktivitě struktury. To vedlo k syntéze a následné identifikaci nové, doposud nepopsané třídy blokátoru iontového kanálku, ve smyslu sestavování látky, přičemž množství reprezentantů z této třídy vykazovalo hodnoty ICS0 v rozsahu 100 až 500 nM. Testování selektivity indikovalo, že sloučenina byla selektivní pro příslušný kanálek oproti 30 dalším lékovým terčům a navíc inhibovala úmrtí buněk v modelu nervové apoptózy indukované odebráním růstového faktoru.
Příklad č. 4 - Racionální identifikace nových a selektivních inhibitorů proteázy
Byl rozvinut enzymatický test pro proteázu, o které se předpokládá, že má klíčovou roli při ischemickém poškození a poraněni. Příslušná proteáza byla členem rodiny blízce příbuzných enzymů, která sama byla jediným terčem zájmu pro terapeutickou intervenci. Byl sestaven soubor sloučenin pro testování v testu, které hyly testovány, a byly identifikovány nové inhibitory enzymu způsobem podle předkládaného vynálezu. První krok sestával z vytvoření potřebných strukturních dat pro identifikování chemických determinantů inhibitorů enzymu. To bylo provedeno testováním souboru 1680 sloučenin při koncentraci 3 μΜ v testu screeningu a popsáním (katalogizací) každé struktury na inhibitorní aktivitu. S použitím hranice 40% inhibice jako prahové hodnoty pro třídění bylo 17 struktur identifikováno jako aktivních a zbývajících 1663 molekul bylo kvalifikováno jako neaktivních.
Druhý krok sestával z identifikování biologicky aktivních chemických determinantů obsažených ve strukturách 17 inhibitorů. Pro tento účel bylo 1680 katalogizovaných struktur analyzováno prostřednictvím výběru níže ilustrovaného smíšeného měřítka (VI) asociace, ve kterém x reprezentovalo počet aktivních chemických struktur obsahujících příslušný chemický determinant, y reprezentovalo celkový počet chemických struktur obsahujících stejný uvedený chemický determinant, z reprezentovalo celkový počet aktivních chemických struktur v souboru N molekul (to jest z = 17), a N reprezentovalo celkový počet chemických struktur podrobených analýze (to jest N = 1680) . V tomto případě bylo měřítko (VI) asociace přímo použito jako funkce skóre pro identifikování biologicky aktivních chemických determinantů obsažených v příslušných 17 inhibitorech.
Z N
• φ φ φ
V tomto případě ve funkci skóre nebyly použity žádné další proměnné jiné než x, y, z a N, ačkoliv osoba v oboru znalá snadno nahlédne, že vzorec (VI) by mohl být rovněž modifikován pro zahrnutí dalších proměnných se vztahem k materiálu molekul, biologickým, chemickým a/nebo fyzikálně-chemickým vlastnostem, jak bylo zmiňováno v příkladu 1, ale bez omezení na citace uvedené v příkladu 1.
Osoba s dobrými znalostmi v oboru rovněž snadno nahlédne, že pro stejný účel by mohla být použita jiná měřítka asociace a/nebo funkce skóre namísto těch, které byly popsány ve vzorci (VI), zejména proto, že toto měřítko asociace pouze umožňuje relativní odhad pravděpodobnosti, se kterou je daný chemický determinant základem pro biologickou aktivitu. Nejvhodnější z těchto alternativních postupu z hlediska předkládaného vynálezu obsahují různé kombinace dvou, tří nebo čtyř z proměnných x, y, z a N.
Analýza 1680 katalogizovaných struktur byla provedena sérií chemických podržením struktur prostřednictvím zjištění skóre u determinantů s užitím vzorce (VI) a poskytujících největší kladné hodnoty. Příklady některých chemických determinantů, použitých v tomto procesu, jsou znázorněny níže na panelu A společně s jejich vypočítanými hodnotami skóre. Mezi nimi vykázaly determinanty č. 7 ač. 8 nejvyšsí skóre a byly akceptovány jako reprezentativní pro jednu nebo více aktivních částí obsažených v podstatné části ze 17 inhibitorů. Výpočty s použitím vzorce (VI) potom byly opakovány, aby se zjistilo, zda by mohly být identifikovány dokonce ještě větší chemické determinanty, což ale nebyl ten případ při využití dostupného souboru 17 struktur a determinanty č. 7 a č, 8 byly sloučeny dohromady pro * · · 4
44 • · ♦ · 4 4 • ♦ 4 444 · « « • · · 4 4 4 ·· ·· 44 « vytvoření reprezentativní kostry nebo farmakologicky aktivního otisku, jak je znázorněno níže v panelu B. Tato reprezentativní kostra byla následně použita pro výběr a syntézu sloučenin.
No. S
No. 7
No. S _ Single or double bond A II O
No, 9
Score — 0.25 Score - 0.32 Score s 0,2/ Score = 017
Na panelech jsou znázorněny příklady chemických determinantu, použitých pro analýzu a vybraných pro další zkoumání. Celkem 1680 struktur, katalogizovaných pro aktivitu inhibice proteázy, bylo testováno na přítomnost biologicky aktivních podstruktur s použitím souboru chemických determinantu zahrnujících čtyři determinanty ilustrované na panelu A. Mezi těmito čtyřmi strukturami determinanty č. 7a č. 8 vykazovaly nejvyšší hodnoty skóre, což indikovalo, že mají největší pravděpodobnost toho, že tvoří základ aktivity inhibice proteázy. Determinant, sestávající z jednoduchého benzenového kruhu, měl při porovnání skóre 0,02. Protože při opakovaných výpočtech s determinanty č. 7 a č. 8 nebyly identifikovány žádné struktury s větším skóre, byly tyto dvě struktury sloučeny do chemického motivu znázorněného na panelu B, který byl následně použit jako farmakologicky aktivní otisk pro virtuální screening a výběr sloučenin. Symboly: A reprezentuje C nebo S; B reprezentuje H, C, N, O nebo atom jakéhokoliv halogenu.
• Β· • · · · • · · ♦ ·· ·» • B B * • * 99 9
9 B
BB »·
Třetí krok zahrnoval použití reprezentativní kostry, popsané v panelu 3, jako šablony pro virtuální screening a výběr sloučenin. Pro tento účel byly provedeny podstrukturní průzkumy v databázi přes 150000 komerčně dostupných sloučenin s použitím jak vypočítaného otisku tak i jeho fragmentů. Na základě těchto průzkumů bylo získáno celkem 589 sloučenin.
Čtvrtý a poslední krok procesu zahrnoval testování získaných sloučenin v enzymatickém testu. Z 589 sloučenin, vybraných na základě reprezentativní kostry, 52 molekul vykazovalo inhibitorní aktivity s hodnotou alespoň 40% při testování v testu s koncentrací 3 μΜ. Mezi nimi 12 sloučenin vykazovalo hodnoty ICS0 v podmikromolárním rozsahu a jedna sloučenina, označená jako sloučenina D, vykazovala hodnotu ICS0 65 nM, Šest příkladů těchto molekul inhibujících proteázu je znázorněno níže, přičemž všechny tyto molekuly obsahují alespoň jeden výskyt farmakologicky aktivního otisku znázorněného na panelu B:
Br
· ·
Těchto šest sloučenin inhibujících proteázu bylo vybráno pro testování s použitím způsobu podle předkládaného vynálezu. Každá molekula významně inhibovala příslušný protein, přičemž vykazovaly hodnoty ICS0 v rozsahu 0,15 až 15 μιη. Jak je znázorněno prostřednictvím silněji vyznačených podstruktur, struktury každé z těchto šesti sloučenin obsahují farmakologicky aktivní chemický determinant identifikovaný s využitím vynálezu a znázorněný na panelu B výše. Některé z těchto sloučenin vlastně obsahují více než jednu variantu tohoto otisku, jako například tetracyklická struktura znázorněné výše v pravém spodním rohu.
Jako takový byl soubor sloučenin, sestavený na základě reprezentativního otisku znázorněného na panelu B, 8,7 krát účinnější při poskytnutí aktivních molekul, než byl původně testovaný soubor 1680 sloučenin (p < 0,0001). Navíc bylo zjištěno, že 52 racionálně identifikovaných sloučenin je selektivních pro příslušnou proteázu, neboť většina (> 90 %) selhalo při prokazování ínhíbitcrní aktivity při testování při koncentraci 5 μΜ na příbuzné proteáze příslušející ke stejné rodině enzymů a rovněž při testování za stejných podmínek pro 12 dalších lékových terčů.
Příklad Č. 5 - Racionální identifikace nových a selektivních inhibitorů fosfatázy
Byl rozvinut enzymatický test pro fosfatázu, o které se předpokládá, že má dúležztou úlohu při zcitlivění (senzibilaci) a regulaci receptorů. Byl sestaven soubor sloučenin, který byl testován a byly identifikovány nové inhibitory způsobem podle předkládaného vynálezu. První krok sestával z vytvoření potřebných strukturních dat pro ·*· · · identifikování chemických determinantů inhibitorů příslušného enzymu. To bylo provedeno testováním prvních 12160 sloučenin z firemní sbírky předkladatele přihlášky při koncentraci 3 μΜ v testu screeningu a popisem (katalogizací) každé struktury v seznamu pro jejich inhibitorní aktivitu. S použitím hranice 50% inhibice jako prahové hodnoty pro třídění sloučenin bylo celkem 15 chemických struktur identifikováno jako aktivních a zbývajících 12145 molekul bylo kvalifikováno jako neaktivních.
Druhý krok sestával z identifikování biologicky aktivních chemických determinantů obsažených ve strukturách 15 inhibitorů. Pro tento účel bylo 12160 katalogizovaných struktur analyzováno prostřednictvím výběru níže ilustrovaného smíšeného měřítka (VII) asociace, ve kterém x reprezentovalo počet aktivních chemických struktur obsahujících příslušný chemický determinant, y reprezentovalo celkový počet chemických struktur obsahujících stejný uvedený chemický determinant, z reprezentovalo celkový počet aktivních chemických struktur v souboru N molekul (to jest z = 15) , a N reprezentovalo celkový počet chemických struktur podrobených analýze (to jest N = 12145).
(VI,) · „(xk) - íz-x)/(n-2)
Měřítko (VII) asociace potom bylo rozvinuto do funkce (VIII) skóre, přičemž osoba v oboru znalá snadno identifikuje, že tato funkce skóre se týká odhadu poměru možných pravděpodobností s využitím strmosti regresní křivky reprezentující stupeň sdílené odchylky, která existuje mezi • · ·· 9 · « * • ·· ··· 9 9»· • · * » · · 9 dvěma dichotomickýmí proměnnými, která byla dále modifikována pro započtení molekulární hmotnosti každého chemického determinantu při uvažování (MW) .
(Vlil)
Score = MW ''Z
V tomto případě ve funkci skóre nebyly použity žádné další proměnné jiné než x, y, z, N nebo MW, ačkoliv je zjevné, že osoba v oboru znalá snadno nahlédne, že vzorec (VIII) by mohl být také modifikován pro zahrnutí dalších proměnných se vztahem k materiálu molekul, biologickým, chemickým a/nebo fyzikálně-chemickým vlastnostem, jak bylo zmiňováno v příkladu 1, ale bez omezení na citace uvedené v příkladu 1. Osoba s dobrými znalostmi v oboru rovněž snadno nahlédne, že pro stejný účel by mohla být použita jiná měřítka asociace a/nebo funkce skóre namísto těch, které byly popsány ve vzorci (VIII), zejména protože porovnání strmostí nemusí v některých případech umožňovat postačující diskriminaci mezi dvměa blízce ' příbuznými chemickým,i determinanty. Nejvhodnější z těchto funkcí skóre z hlediska předkládaného vynálezu obsahují různé kombinace dvou, tří nebo čtyř z proměnných x, y, z a N.
Analýza 12160 katalogizovaných struktur byla provedena skórováním sérií chemických determinantů s využitím vzorce (VIII) a podržením struktur poskytujících největší kladné hodnoty. To vedlo k identifikaci tří rozdílných chemických determinantů, s molekulární hmotností v rozsahu od 120 do 220, které měly pravděpodobnost menší než 1 z 10, že budou obsaženy v podskupině aktivních chemických struktur • * ♦· ·*·· et φ • · * · · · · ··· · » · · • · · · « · · ··· pouze na základě náhodného výběru {p < 0,1). Tyto tři chemické determinanty tudíž byly akceptovány jako reprezentativní pro jednu nebo více biologicky aktivních částí 15 inhibitorů enzymu, identifikovaných v testu screeningu, a byly sestaveny do čtvrtého seznamu. Potom byly opakovány výpočty s použitím vzorce (VIII) za účelem zjištění, zda by nemohl být identifikován větší chemický determinant vyplývající z kombinace nebo dalšího rozšíření kterýchkoliv ze tří uvedených fragmentů. Největší, statistisky významný chemický determinant, nalezený při těchto dalších výpočtech, měl molekulární hmotnost 255 a byl vybrán jako reprezentativní kostra nebo farmakologicky aktivní otisk pro následný výběr sloučenin.
Třetí krok zahrnoval použití výše popisované reprezentativní kostry jako šablony pro virtuální screemng a výběr sloučenin. Pro tento účel byly provedeny podstrukturní průzkumy v databázi přes 800000 komerčně dostupných a autorizovaných sloučenin s použitím jak vypočítaného otisku tak i jeho fragmentů. Na základě těchto průzkumů bylo získáno
0 celkem 1242 sloučenin pro testování a stejný soubor 1280 náhodně vybraných sloučenin, jako bylo popsáno v příkladu č. 1, byl použit pro kontrolní účely.
Čtvrtý a poslední krok procesu zahrnoval testování získaných sloučenin v enzymatickém testu. Z 1242 sloučenin, vybraných na základě reprezentativní kostry, 34 molekul vykazovalo inhibitorní aktivity s hodnotou alespoň 50% při testování v testu s koncentrací 3 μΜ. Mezi nimi osm sloučenin vykazovalo hodnoty IC50 v podmikromolárním rozsahu a jedna sloučenina, označená jako sloučenina E, vykazovala hodnotu IC50 87 nM (viz obr. 14) .
ΊΟ • 9 • · ·· * · * · I • · * » · · · ··· ft · • · · · ·· ft · ·· ·* ft· ft· ·« ··
Obr. 14 ilustruje účinek sloučeniny na π c* ' x O .
fosfatázi
Příslušná fosfatáze substrátem sloučeniny byla inkubována s fosforylovaným peptidovým za přítomnosti zvyšujících se koncentrací E. Byla zkoumána defosforylace substrátu prostřednictvím měření uvolňování volného fosfátu do reakčního média s malachitovou zelení. Sloučenina E významně inhibovala defosforylaci závislou na fosfatázi, přičemž vykazovala IC50 o hodnotě 87 nM.
Mezi 1280 náhodně vybranými sloučeninami, testovanými pro kontrolní účely, pouze dvě vykázaly inhibitorní aktivitu při testovacím screeningu, z nichž nej silnější vykazovala hodnotu IC50 pouze 1,8 μΜ. Jako takový byl soubor sloučenin, sestavený na základě reprezentativních otisků, 17,5 krát účinnější při poskytování aktivních molekul, než byl soubor náhodně vybraných sloučenin (p < 0,0005), a 22,3 krát účínější než prvních 12160 sloučenin firemní sbírky sloučenin (p < 0,00001).
Navíc nakonec bylo shledáno, že sloučenina E reprezentuje novou, doposud nepopsanou třídu inhibitoru fosfatázy, vykazující více než 20 násobnou selektivitu pro příslušný terč při testování v selektivních testech s použitím jak strukturně tak i funkčně alternativních fosfatáz.
Příklad č. 6 - Zvýšení potence chemických sérií
Předkládaný vynález může být rovněž použit pro zvýšení potence chemických sérií. Pro příkladné znázornění této možnosti byla testována sbírka 1251 sloučenin s » · · · * » · ··· · · • · · ♦ ·· ·· «4 ·· koncentrací 3 μΜ v testu pro proteázu, což poskytlo 25 sloučenin vykazujících inhibitorní aktivity alespoň 4 0 %. Byla provedena analýza struktur tak, jak bylo popsáno v příkladu č. 1, což vedlo na identifikaci množství chemických determinantů, z nichž jeden měl pravděpodobnost menší než 1 z 10000, že se bude vyskytovat mezi 7 z 25 inhibitorů proteázy na základě pouze náhodného výběru (p < 0,0001) . Naneštěstí sedm sloučenin, obsahujících tento determinant, vykazovalo pouze nízké inhibitorní aktivity (střední hodnota ICS0 = 3,4 μΜ ± 1,34 μΜ, n = 7) , což je činilo nekatraktivní pro další chemické zkoumání. Následně byl příslušný determinant akceptován jako reprezenatativní pro biologicky aktivní část příslušných inhibitorů a byl přímo použit jako reprezentativní kostra nebo farmakologicky aktivní otisk pro další výběr sloučenin.
Pro tento účel byl proveden screening v databázi přes 100000 komerčně dostupných molekul na příslušný determinant, přičemž bylo vybráno 142 molekul pro další testování. Mezi těmito 142 sloučeninami 11 vykazovalo inhibitorní aktivity v podmikromolárním rozsahu, přičemž měly střední hodnotu IC50 0,48 μΜ + 0,09 μΜ (η = 11, střední hodnota IC50 podstatně menší než předchozí hodnota při p < 0,05) . Jako takový tedy způsob podle předkládaného vynálezu umožňuje podstatně zvýšit farmakologickou potenci chemických sérií.
Příklad č. 7 - Zvýšení selektivity chemických sérií
Předkládaný, vynález může být rovněž použit pro zvýšení selektivity chemických sérií. Pro příkladné znázornění této možnosti byla testována sbírka 3360 sloučenin s koncentrací 3 μΜ v testu pro kinázu, označeném test pro
99 999 · «99 9*9 9
9999 99 9 9999
99 ·9 99 99 ·· kinázu č. 1, což poskytlo 22 inhibitorní aktivity alesDoň 40 % sloučenin vykazujících Byla provedena analýza těchto struktur tak, jak bylo popsáno v příkladu č. 2, což vedlo na identifikaci množství chemických determinantů, přičemž u jednoho z nich, označeného determinant č. 10, bylo odhadnuto, že má pravděpodobnost menší než 1 z 20, že se bude vyskytovat mezi 3 z 22 inhibitorů kinázy pouze na základě náhodného výběru {p < 0,05). Naneštěstí testy selektivity, prováděné na čtyřech dalších kinázách, odhalily, že determinant č. 10 byl rovněž důležitou složkou inhibitoru jiné kinázy, označené kináza č. 2, což vede k tomu, že selektivní inhibitory kinázy Č. 1 by nemohly být rozvinuty na základě samotného determinantu č. 10. Skutečně byl tři struktury, obsahující determinant č. 10 rovnocenně potentní na dvou kinázách, přičemž dosahovaly středních hodnot IC50 7,2 μΜ ± 3,81 μΜ (n = 3) respektive 21,5 μΜ + 9,29 μΜ (η = 3) pro kinázy č. 1 a č. 2, což představuje poměr selektivity pouze 2,98 ve prospěch kinázy č. 1.
Z tohoto důvodu bylo 3360 sloučenin, testovaných na kinázu č. 1, opětovně testováno při koncentraci 3 μΜ na kinázu č. 2, což poskytlo 92 sloučenin vykazujících inhibitorní aktivity alespoň 40 %. Seznam 3360 struktur byl následně kataglizován (popsán) podle aktivity jak na kinázu č. 1 tak i na kinázu č. 2 a byla provedena analýza způsobem podle předkládaného vynálezu prostřednictvím výběru měřítka (III) asociace a jeho rozvinutí na funkci (IX) skóre, kde xx reprezentuje počet chemických struktur aktivních na kinázu č.
a obsahujících příslušný chemický determinant, x2 reprezentuje počet chemických struktur aktivních na kinázu č.
a obsahujících stejný příslušný chemický determinant, y reprezentuje celkový počet chemických struktur obsahujících uvedený chemický determinant, z1 reprezentuje celkový počet chemických struktur aktivních na kináze č. Iv souboru N molekul (to jest zx = 22) , z2 reprezentuje celkový počet chemických struktur aktivních na kináze č. 2 v souboru N molekul (to jest z2 = 92) , a N reprezentuje celkový počet chemických struktur podrobených analýze (to jest N = 3 3 60) .
(|X)
- xi^N~y~zĎX1 )(z2 -x2)(y-x2
Score =
Osoba v oboru znalá snadno rozpozná funkci (IX) skóre jako způsob pro porovnání relativních pravděpodobností, umožňující identifikovat chemické determinanty, které s největší pravděpodobností budou selektivní pro jednu kinázu oproti druhé. Vtéto souvislosti je rovněž osobě v oboru znalé zřejmé, že vzorec (IX) by mohl být modifikován pro zahrnují dalších proměnných se vztahem k materiálu molekul, biologickým, chemickým a/nebo fyzikálně-chemickým. vlastnostem, jako bylo zmiňováno v příkladu č. 1, ale bez omezení na citace uváděné v příkladu č. 1. Zkušený pracovník v oboru rovněž snadno nahlédne, že mohou být použita jiná měřítka asociace a/nebo funkce skóre pro stejné účely na místo těch, která byla popsána ve vzorcích (III) a (IX) . Například by tak mohlo být ve funkci (II) skóre použito měřítko (I) asociace a výsledné hodnoty skóre pro aktivitu na kinázu č. 2 by mohl být odečteny od hodnot získaných pro aktivitu na kinázu č. 1, nebo obráceně by hodnoty získané pro aktivitu na kinázu č. 1 mohl být děleny hodnotami získanými • · ·♦ « · · · • · · « «9 «· • 9 9 · •9 9 99999 9 *
9 9 9 9 ·«
99 «9 99 pro kinázu č. 2. Rovněž je možných množství dalších přístupů, z nichž nej vno ane i s předkládaného vynálezu využívají funkce skóre, obsahující různé kombinace jedné, dvou, tří nebo čtyř z proměnných x, y, z, a N.
Skórování sérií chemických determinantů s využitím vzorce (IX) vedlo k identifikací množství selektivních chemických determinantů pro kinázu č. 1, z nichž jeden, označený determinant č. 11, sestával z determinantu č. 10 substituovaného s přídavným chemickým motivem. Následně byl determinant č. 11 akceptován jako reprezentující farmakologicky aktivní část selektivních inhibitorů kinázy č. 1 a byl použit jako reprezentativní kostra nebo farmakologicky aktivní otisk pro následný výběr sloučenin. Za tímto účelem byly provedeny podstrukturní průzkumy v databázi přes 400000 komerčně dostupných sloučenin s použitím determinantu č. 11 a jeho fragmentů. Celkem 4 98 sloučenin bylo získáno na základě těchto průzkumů, které po testování ve dvou testech poskytly tři inhibitory obsahující determinant č. 10 sse úředními hodnotami IC50 0,94 μΜ ± 0,52 μΜ (n = 3) respektive 31,6 μΜ + 4,41 μΜ (η = 3) pro testy na kinázu č. 1 a č. 2. Tento výsledek reprezentuje 11 násobné zvýšení poměru selektivity u sérií pro kinázu č. 1 oproti kináze č. 2 (od 2,98 do 33,6, p < 0,05), což demonstruje, že způsob podle předkládaného vynálezu umožňuje zvýšení farmakologické selektivity příslušných chemických sérií.
Příklad č. 8 - Racionální identifikace sérií s vícenásobnými farmakologickými účinky
Byl rozvinut funkční test pro ligandem uzavíraný iontový kanálek, o kterém se předpokládá, že má úlohu při
44 • 4 · 4 · • ··· 4 4 · • · 4 4 4 imunitní reakci. Byl sestaven soubor sloučenin pro testování eniny byly testovány a byly identifikován nové blokátory iontového kanálku způsobm podle předkládaného vynálezu. Zkoumaný kanálek byl popsán jako příslušející k rodině terčů, které byly prostupné pro ionty sodíku, aktivované nukleotidy purinu a inhibované určitými blokátory sodíkových kanálků. Z tohoto důvodu bylo rozhodnuto identifikovat otisky mající duální schopnost napodobení nukleotidů purinu a inhibování sodíkových kanáků současně, s ohledem na zvyšující se možnosti rychlého identifikování inhibitorů příslušného ligandem uzavíraného iontového kanálku.
První krok procesu zahrnoval sestavení dvou seznamů chemických struktur prostřednictvím prozkoumání současné literatury. První seznam obsahoval struktury 79 zdokumentovaných inhinitorů sodíkového kanálku. Druhý seznam obsahoval struktury 2367 inhibitorů proteinů vázajících nukleotid purinu (viz příklad č. 2 pro detaily).
procesu sestával z identifikace biologicky chemických determinantů současně obsažených v obou seznamech chemických struktur. Pro tento účel byl každý seznam doplněn strukturami více než 100000 molekul, které byly popsány jako mající nulový účinek na příslušné náhradní terče, a byla provedena analýza prostřednictvím výběru odečítacího měřítka (I( asociace, jako bylo popsáno v příkladu č. 1, a rozvinutím tohoto měřítka asociace na funkci (X) skóre, přičemž xx reprezentuje počet chemických struktur aktivních v sodíkových kanálcích a obsahujících příslušný chemický determinant, x2 reprezentuje počet chemických struktur aktivních u proteinů vázajících nukleotid purinu a obsahujících stejný uvedený
Druhý krok aktivních
chemický determinant; yl reprezentuje celkový počet struktur obsahujících chemický determinant v seznamu struktur katalogizovaných pro účinky blokování sodíkových kanálků, y2 reprezentuje celkový počet strukour obsahujících chemický determinant v seznamu struktur katalogizovaných pro inhibitorní účinky vázání proteinu s nukleotidem purinu, zx reprezentuje celkový počet strukour inhibujících sodíkové kanálky v souboru molekul (to jest z2 = 79), z2 reprezentuje celkový počet chemických struktu aktivních při vázání proteinů s nukleotidem purinu v souboru N2 molekul (to jest z2 = 2367), a N1 a N2 reprezentují celkový počet chemických struktur podrobených analýze v příslušných seznamech katalogizovaných struktur.
Score =
Zkušený pracovník v oboru snadno nahlédne, že funkce (X) skóre je způsobem pro zkombinování dvou různých testů asociace, který umožňuje identifikovat chemické determinanty, které s největší pravděpodobností mají účinky současně jak na sodíkové kanálky tak i na proteiny vázající nukleotid purinu. V tomto kontextu je osobě v oboru znalé rovněž zcela zřejmé, že vzorec (X) by mohl být modifikován pro zahrnutí dalších proměnných se vztahem k materiálu molekul, biologickým, chemickým a/nebo fyzikálně-chemickým vlastnostem, jak bylo zmiňováno v příkladu č. 1, ale bez omezení na citace uváděné v příkladu č. 1. Je rovněž jasně patrné, že pro stejný účel mohou být použita jiná měřítka asociace a/nebo funkce skóre • · namísto těch, které byly popsány ve vzorcích (I) a (X) , zejména prožoe funkce (X) skóre nebere do úvahy směr rozdílu, existujících mezi podíly dvou datových souboru, přičemž po celou dobu vyžaduje, aby tyto podíly byly srovnatelné a navíc aby hodnota Nx byla srovnatelná s N2 a aby obě tyto hodnoty byly větší než 20. Například je možné požadovat vážení výsledku pro datové soubory, ve kterých jsou velikosti vzorků podstatně odlišné, prostřednictvím použití dunkce skóre, založené na váženém průměru rozdílu mezí podíly (viz příklad
21 níže), Alternativně je možné požadovat začlenění třetí, nebo čtvrté, nebo páté farmakologické vlastnosti do výpočtu, přičemž v tomto případě je zřejmé, že vzorec (X) může býc rozšířen na jeho obecnější podobu (XI), ve které d reprezentuje počet seznamů sloučenin procházejících analýzou a kde výsledné hodnoty skóre mohou být přímo vztahovány k tabulkám standardního normálního rozdělení, aby se stanovila pravděpodobnost nalezení jednoho nebo více chemických determinantů, které jsou základem všech uvažovaných farmakologických vlastností. Je rovněž možných množství další přístupů, z nichž nejvhodnějsi z hlediska předkládaného vynálezu využívají funkce skóre, zahrnující různé kombinace dvou, tří nebo čtyř z proměnných x, y, z a N.
(XI) Scor 1
Vd z(N- z)y(N-y)
Analýza dvou seznamů katalogizovaných struktur byla provedena prostřednictví skórování sérií chemických determinantů s užitím vzorce (X) a podržením struktur • · ·« • · · · · ♦ * · * ·« «· * · « * · · • · ··· · » 4 4 • · * 4 4 4 4 • · 4* «4 ·· poskytujících největší hodnoty větší než 2. To vedlo na identifikaci chemického determinantu majícícho pravděpodobnost menší než 1 z 20 výskytu v obou podskupinách biologicky aktivních struktur pouze na základě náhodného výběru (p < 0,05). Tento chemický determinat, označený determinant č. 12 byl tudíž akceptován jako reprezentativní pro jednu nebo více biologicky aktivních částí, jak pro inhibitory sodíkového kanálku tak i pro inhibitory vázání proteinu s nukleotidem purinu, a byl přímo použit jako reprezentativní kostra nebo farmakologicky aktivní otisk pro následný výběr sloučenin.
Třetí krok zahrnoval použití výše popisované reprezentativní kostry jako šablony pro virtuální screening. Pro tento účel byly provedeny podstrukturní průzkumy v databázi přes 250000 komerčně dostupných sloučenin s použitím determinantu č. 12 í jeho fragmentů. Na základě těchto průzkumů bylo získáno celkem 800 sloučenin pro testování a stejný soubor 1280 náhodně vybraných sloučenin, jako bylo popsáno v příkladu č. 1, byl použit pro kontrolní účely.
Čtvrtý a poslední krok procesu zahrnoval testování získaných sloučenin v testu iontového kanálku. Z 800 molekul, vybraných na základě determinantu č. 12, vykazovalo dvacet tři sloučenin inhibitorní aktivitu alespoň 40 % při testování s koncentrací 3 μΜ. Mezi nimi tří sloučeniny vykazovaly hodnoty ICS0 v podmikromolárním rozsahu a jedna sloučenina, označená jako sloučenina F, vykazovala hodnotu IC50 145 nM + 56 nM (n = 4). Mezi 1280 náhodně vybranými sloučeninami, testovanými pro kontrolní účely, pouze jedna molekula vykazovala významnou inhibitorní aktivitu v nízkém mikromolárním rozsahu a její chemická struktura vlastně • · · · « « obsahovala podstatnou část determinantu č. 12. Překvapivě, když stejný soubor 800 sloučenin byl testován na kinázu, o které se rovněž předpokládá, že má úlohu při imunitní reakci, osm sloučenin vykázalo inhibitorní aktivity alespoň 40 % při testování s koncentrací 5 μΜ, sloučenina F vykázala hodnotu 1C5O 1,2 μΜ a další sloučenina, označená jako sloučenina G, vykázala IC50 137 nm + 48 nM (n = 4) . Bylo rovněž zjištěno, že sloučeniny F, G a množství blízce příbuzných molekul, rovněž obsahujících determinant č. 12 v jejich strukturách, rovněž inhibovaly (blokovaly) sodíkové kanálky, přičemž obvykle vykazovaly 50 až 100 % inhibicí (blokací) při 1 μΜ. V souhrnu tedy tyto výsledky demonstrují, že způsob podle předkládaného vynálezu umožňuje vybrat a/nebo zkonstruovat sloučeniny s množstvím farmakologických vlastností, což může být zajímavé při vývoji léků pro použití při léčeni chorobných stavů ovlivňovaných více faktory, jako je například bez jakéhokoliv omezení zánět. Prostřednictvím analogie může být rovněž zcela jasně zřejmé, že způsob podle předkládaného vynálezu může být použit pro začlenění nových farmakologických vlastností do chemických sérií, které předtím takovéto vlastnosti neměly.
Příklad č. 9 - Sestavování seznamů biologicky aktivních chemických determinantů
Ve výhodném provedení předkládaného vynálezu může být
5 způsob podle vynálezu rovněž použit pro sestavování seznamů biologicky aktivních chemických determinantů, které dále mohou být použity jako referenční databáze pro použití při provádění racionální konstrukce léků, jako například v programech, provádějících počítačově řízená rozhodování, pro použití v lékařské chemii. Pro znázornění příkladem byla • · 9 9 9 t • · 99 · • · · · · · • · · 9 9 9 ·· ·· 99 9* • 9 9 9 «9 prozkoumána vědecká literatura a bylo sestaveno 25 seznamů farmakologicky aktivních molekul, přičemž každý seznam zahrnoval chemické struktury sloučenin vykazujících danou farmakologickou vlastnost, jako například vázání sigma receptoru, agonismus receptoru dopaminu D2 a antagonismus receptoru estrogenu. Každý seznam byl následně analyzován podle předkládaného vynálezu prostřednictvím výběru měřítka (III) asociace, jak bylo popsáno v příkladu č. 2, a jeho rozvinutím do funkce (IV) skóre, která byla použita pro skórování různých chemických determinantů obsažených v jednom nebo více seznamech procházejících analýzou. Tyto výpočty vedly k identifikaci velkého počtu farmakologicky aktivních chemických determinantů, z nichž tři jsou znázorněny v části
Antagonista estrogenu
0.05
0.00
25.17 výsledné matice v následující tabulce:
Sioma Liasnd D- Accnisia
Determinant
No. 13
1.8;
8.12
Na. 14
N,
No. 15 '2.40
0.00
0.91
2.93
Tato tabulka poskytuje referenční seznam farmakologicky aktivních chemických determinantů. Bylo sestaveno dvacet pět seznamů struktur obsahujících molekuly, o kterých bylo popsáno, že mají jednu z dvaceti pěti různých farmakologických vlastností, a tyto seznamy struktur byly
V · • · · · ··· · · analyzovány způsobem podle předkládaného vynálezu s použitím měřítka (III) asociace a funkce (IV) skóre. Uvedených dvacet pět vlastností zahrnovalo například schopnost vázat se. na sigma receptory (sigma ligand), agonismus pro receptor dopaminu Dz (D2 agonist) a antagonismus pro receptor estrogenu (estrogen antagonist). Malá část výsledné matice s 26 sloupci je znázorněna v tabulce výše. Hodnoty větší než 1 indikují, že daný chemický determinant má pravděpodobnost menší než 1 z 20, že se bude vyskytovat při náhodném výběru v souboru molekul sdílejících stejnou farmakologickou vlastnost, což indikuje, že determinant s největší pravděpodobností bude molekulárním základem pro stejnou uvedenou vlastnost. Tabulky, jako je znázorněná tabulka, tvoří archivy či zdroje biologicky aktivních determinantů nebo otisků, které mohou být použity jako referenční seznamy pro provádění informovaných rozhodnutí při objevování a vývoji léků.
Interpretace výsledné tabulky se provádí následovně. Sloučeniny, jejichž chemické struktury obsahují determinant č. 13 s větší pravděpodobností budou vykazovat vlastnosti (Ί agonistu receptoru dopaminu D2 spíš než vlastnosti bud' vázání sigma receptoru nebo antagonistu receptoru estrogenu, protože
8,12 > 1,85 > 0,05. Obráceně tedy determinant Č. 13 je výhodný determinant pro konstruování souborů potenciálních agonistů receptoru dopaminu D2, protože 8,12 > 2,93 > 0,00. 2 5
Stejným způsobem potom sloučeniny, jejichž chemické struktury obsahují determinant č. 14, budou s větší pravděpodobností ligandy sigma receptoru než buď agonisty receptoru dopaminu nebo antagonisty receptoru estrogenu, protože 2,4 > 0,00 =
0,00. Opět je potom determinant č. 14 výhodným determinantem o Π pro sestavování souborů ligandů sigma receptorů, protože 2,40 •· » * · > 1,85 > 0,91, Nakonec sloučeniny, jejichž chemické struktury obsahují determinant č. 15, budou s největší pravděpodobností vykazovat vlastnosti inhibice (blokace) receptorů estrogenu, protože 28,17 > 2,93 > 0,91, přičemž alternativně je determinant č. 15 výhodným otiskem pro sestavování souborů potenciálních antagonistů receptorů estrogenu, protože 28,17 > 0,05 > 0,00.
Osobě v oboru znalé je zjevné, že pro konstruování takovýchto tabulek by mohla být použita jiná měřítka asociace 0 a/nebo funkce skóre namísto těch, které jsou popsány ve vzorcích (III) a (IV). Rovněž je zcela zřejmé, že použitá funkce skóre by mohla zahrnovat další proměnné se vztahem k materiálu struktur, biologickým, chemickým a/nebo fyzikálně-chemickým vlastnostem, jak bylo zmiňováno v příkladu č. 1, ale bez omezení na citace uváděné v příkladu č. 1. Dále je rovněž zcela zjevné, že funkce skóre nebo proces skórování by rovněž mohly být modifikovány pro zahrnutí kroků vážení nebo normalizace za účelem snazšího porovnávání jednotlivých hodnot skóre vzájemně mezi sebou, 0 což je jistě případ výše uvedené' tabulky, kde při její konstrukci byly použity podobně veliké vzorky, ale nemusí to být případ jiných datových souborů. Nakonec je rovněž zcela zřejmé, že stejný postup by mohl být použit pro sestavování referenčních seznamů struktur skórovaných pro jiné uvažované vlastnosti v procesu objevování, jako je například bez jakéhokoliv omezení obecné terapeutické použití, toxicita, absorpce, distribuce, metabolismus, a/nebo vyměšování.
Příklad č. 10 - Předvídání sekundárních farmakologických působení molekuly
Předkládaný vynález může být dále použit pro předvídání sekundář:
působení molekuly. Pro ilustraci této možnosti byla identifikována nová třída blokátorů iontového kanálku, jak je znázorněno v příkladu č. 3. Jak bylo v 5 předcházejícím popsáno pro jiné inhibitory tohoto stejného kanálku, základní chemická struktura této nové chemické série inhibitorů obsahovala chemický determinant znázorněný v panelu B přikladu č. 3, zjevně ve formě determinantu Č. 5 znázorněného v panelu A příkladu č, 3. Porovnáním 10 determinantu č. 5 s determinanty obsaženými ve výše uváděné tabulce bylo odhaleno, že příslušné inhibitory měly velmi vysokou možnost vázání na sigma receptory, zejména proto, že chemická struktura determinantu č. 5 je shodná s chemickou strukturou determinantu č. 14.
kanálku, obsahující determinant č.
vázání sigma σχ a σ2 receptory, a bylo zjištěno, že vykazují podmikromolární afinity pro obě místa. Jako takové tyto výsledky demonstrují, že hodnoty skóre, získané s použitím způsobu podle předkládaného vynálezu, sekundární působení chemických sérií, což užitečné pro sériový postup v lékařské chemii.
Následně byly blokátory 5, tetovány v testech na umožňuj í předvídat je extrémně
Příklad č. 11 - Identifikace a předvídání toxického působení molekuly
Z předcházejících příkladů je zřejmé, že způsob podle předkládaného vynálezu může být rovněž použit pro identifikování toxikoforních chemických determinantů obsažených v pesticidech, herbicidech, insekticidech a podobně, a to jednoduše prostřednictvím analyzování seznamů 30 struktur, které jsou popsány či katalogizovány pro • « · • ··· * 9 • · toxikologické vlastnosti namísto farmakologických. V této souvislosti může být předkládaný vynález přímo aplikován pro identifikaci mocnějších selektivnějších nebo siřeji působících toxických chemických sérií pro použití, například, v programech zemědělské chemie pro ochranu úrody.
Alternativně může být předkládaný vynález použit pro sestavování referenčních seznamů nebo databází toxických chemických determinantů způsobem shodným s postupem popisovaným v příkladu č. 9. Takové seznamy mohou být potom použity pro odhadování pravděpodobnosti, že chemické řady budou vykazovat daný toxický účinek, což například, při screeningu potravinářských chemikálií ovlivňujících životní prostředí.
lze využít, příměsí a
Pro ilustraci možnosti předvídání toxických účinků při nasazení pro farmaceutický výzkum bylo testováno 4480 sloučenin na zainteresovanou buněčnou fosfatázu pro léčení zánětu. Celkem 25 sloučenin vykazovalo inhibitorní aktivity o hodnotě alespoň 40 % při testování v testu s koncentrací 10 μΜ, přičemž všechny vykazovaly mikromolárním rozsahu. Následně předkládaného vynálezu provedena identifikaci dvou molekulárně determinantů, které s největší hodnoty IC50 v nízkém byla způsobem podle analýza, což vedlo na rozdílných chemických pravděpodobností budou základem farmakologické aktivity, přičemž tyto determinanty byly označeny jako determinanty č. 16 a č. 18. Protože tyto dva determinanty byly přítomny v rovnocenných molekulách a oba byly vnímány jako schopné poskytovat chemické série, které by byly rovnocenně přístupné pro další chemické zkoumání, bylo rozhodnuto zvolit mezi těmito dvěma • · φ · ··· φ φ determinanty na základě předvídaných toxických vedlejších ppi τη η η /-i H
Pro tento účel byly struktury determinantů č. 16 a č. 17 porovnávány se strukturami obsaženými v toxikologické databázi a bylo zjištěno, že molekuly, obsahující determinant č. 16 v jejich strukturách, měly podstatně větší pravděpodobnost, že budou cytotoxické, než sloučeniny obsahující pouze determinant č. 17. To indikovalo, že inhibitory fosfatázy, nesoucí determinant č. 16, by byly méně zajímavé pro další postup v důsledku vlastní cytotoxicity farmakologického otisku. Tato hypotéza byla ověřena experimentálně vystavením kultivovaných buněk koncentracím 1 μΜ obou tříd inhibitoru a změřením životaschopnosti buněk s použitím standardního testu MTT, přičemž bylo zjištěno, že všechny sloučeniny, obsahující determinant č. 16, indukovaly smrt buněk během 24 hodin po aplikaci, což nebyl případ u většiny sloučenin nesoucích determinant č. 17. Jako takové tyto výsledky zjevně demonstrují, že způso) předkládaného vynálezu umožňuje identifikovat předvídat chemické série, které s největší pravděpodobností vykazují toxické vlastnosti v daném nasazení. V tomto kontextu je zcela zjevné, že shodné výpočty mohou být prováděny s použitím, například údajů o mutagenicitě (schopnost působit změny dědičných vlastností - mutace) (testy Ames), údajů o inhibování isozymu P4502, nebo údajů odvozených z jakýchkoliv jiných dalších relevantních testů toxicity.
podle a/nebo • * ♦· · · · · > • * · · · · · ·«· · « • ♦ · · 4» · ·
Příklad č. 12 - Identifikace biologicky aktivních částí receptorových ligandů
Receptor buněčného povrchu byl vybrán jako příslušný terč pro řízení jistých endokrinních chorob. Tento receptor byl popsán jako endogenně aktivovaný prostřednictvím hormonu nonapeptidu, vytvářenému podvěskem mozkovým. Byl sestaven seznam chemických struktur, popsaných jako ligandy stejného uvedeného receptoru, prostřednictvím prozkoumání vědecké literatury. Tento seznam byl následně analyzován způsobem podle předkládaného vynálezu s využitím měřítka (III) asociace, funkce (IV) skóre, přičemž seznam chemických determinantů zahrnoval fragmenty dvaceti běžných aminokyselin (glycin, alanin, valin, leucin, isoleucin prolin, serín, theorin, tyrosín, fenylalanin, tryptofan, lysin, arginin, histidin, aspartát, glutamát, asparagin, cystein a methionin), doplněnýé fragmenty struktury hlavního peptidového řetězce (NH-CH-CO-)3. Příklady těchto determinantů jsou ilustrovány níže:
NO. 22
No. 23
Nc. 24
No. 25
No. 26
O
Kostra peptidu
O !
O o o
NO. 27 *44 * · x/M\Z
A N
SI o
No· 28
No. 29 No. 30
N, 'Ν'
No. 31
No. 32
O
II ZBX ZA A Bx II O
No. 33
Toto jsou příklady chemických determinantů odvozených z aminokyselin a hlavního peptidového řetězce a použitých pro analýzu. Seznam receptorových ligandů byl sestaven prostřednictvím prozkoumání vědecké literatury a analyzován způsobem podle předkládaného vynálezu s využitím měřítka (III) asociace, funkce (IV) skóre a seznamu chemických determinantů zahrnujících různé fragmenty dvaceti běžných aminokyselin, doplněné fragmenty struktury hlavního peptidového řetězce (NH-CH-CO-) 3. Příklady některých z determinantů odvozených z trytofanu jsou znázorněny v prvních dvou řádcích. Tyto determinanty byly buď přesnými fragmenty (například determinanty č. 18, č. 19, č. 20, č. 21 a č. 26), sestavami přesných fragmentů (například determinant č. 22), nepřesnými fragmenty (například determinanty č. 23, č. 24 a č. 25), nebo sestavami přesných a nepřesných fragmentů (nejsou ilustrovány). Spodní dvě řady ilustrují příklady determinantů, odvozených ze struktury hlavního peptidového řetězce (NH-CH-CO-)3 a reprezentujících přesné fragmenty
| (determinanty | v c. | 29, | č. 31 a č. 32) a nepřesné fragmenty | ||
| (determinanty | č. | 27, | č. 28, č. 30 a č. 33) | Symboly: | A |
| reprezentuj e | C | nebo | S; B reprezentuje C | nebo N ,· | Ξ |
reprezentuje C, N, O nebo S.
Skórování fragmentů prostřednictvím vzorce (IV) vedlo na identifikaci množství chemických determinantů majících
U t-í • · · · « ··· * · • · ·· * »4 · ··*· · * · · · « · ·* ·· ·· ·♦ *· II hodnoty skóre větší než 1, což indikuje, že odpovídající struktury měly pravděpodobnost menší než 1 z 20, že budou obsaženy v podskupině farmakologicky aktivních sloučenin pouze na základe náhodného výběru (p < 0,05) . Příklady takovýchto determinantu jsou znázorněny níže společně s jejich příslušnými hodnotami skóre:
No. 34 Score = 3.09
No, 26
Score = 1.06
No. 35 Score = 1.17
No. 37 Score = 3.78
No. 3S Score = 2.12
No. 39 Score = 1.18
No. 40
Score =1,92No. 41
Score = 2.83 podle předkládaného výše ilustrovaných
Toto jsou příklady vysoce skórujících chemických determinantů identifikovaných v prvním kole analýzy. Soubor receptorových ligandů byl analyzován vynálezu prostřednictvím skórování chemických determinantů a rovněž množství dalších s využitím funkce (IV) skóre. Hodnoty větší než jedna indikují, že determinant má pravděpodobnost menší než 1 z 20, že se bude vyskytovat v podskupině receptorových ligandů pouze na základě náhodného výběru. Obrázek výše ilustruje některé z ·
99· 9 9 více skórujících chemických determinantů, které byly i ωτί h i i V- roriir h ímé o /i o σ o τη t, j. i. _l j\<? v Clix_y uxnÍL·^ px OCm ·
Tyto determinanty byly tudíž akceptovány jako reprezentativní pro jednu nebo více aminokyselin, obsažených v primární sekvenci peptidového hormonu, a byly sestaveny do druhého seznamu. Potom byly opakovány výpočty s použitím vzorce (IV) za účelem identifikování nejvíce skórujících kombinací těchto nových determinantů, z nichž množství získalo hodnoty skóre větší než 10. Struktura chemického determinantu s nejvyšším skóre, označená jako determinant č. 42, potom byla následně porovnávána se strukturami 8 00 dipeptidů zahrnutých v různých kombinacích 20 aminokyselin, přičemž bylo zjištěno, že pouze jedna dipeptidová sekvence, označená Ax-A2, obsahovala celý determinant Č. 42. Tento výsledek byl uvažován pro indikaci, že příslušný hormon s největší pravděpodobností zahrnuje sekvenci A1-Az někde ve své primární struktuře a navíc, že alespoň jedna z těchto dvou aminokyselin má důležitou úlohu při vázání endogenního ligandu na jeho receptor. Ověření sekvence hormonu odhalilo, že skutečně zahrnuje předvídanou sekvenci Ax-A2, což je skutečnost, která bylo vypočítána, že má pravděpodobnost pouze 0,019 výskytu na základě náhodného výběru. Překvapivě další práce prokázala, že peptidy, obsahující mutaci v poloze A2 sekvence Ax-A2 (například Az-A3 nebo Ax-A4 namísto Ax-A2, kde Ax, A2, A3 a A4 jsou různé aminokyseliny) vykazovaly znatelně nižší afinitu pro receptor, což ilustruje, že alespoň jeden ze dvou předvídaných zbytků, skutečně tvoří důležitou součást, která tvoří základ pro biologickou funkci příslušného hormonu. Souhrnně tedy tyto výsledky demonstrují, že způsob podle předkládaného vynálezu umožňuje identifikovat
9 99 9 9 « · · * «
99 9 · · · 9*· 9 9 · 9
9999 99 9 9999
99 99 99 99 99 biologicky aktivní části peptidových ligandů, což je užitečné v programech lékařské chemie, které se zaměřují na racionální konstruování, například, inhibitorů peptidomimetických enzymů a/nebo receptorových ligandů.
Příklad č. 13 - Předvídání proteinových interakcí
Předkládaný vynález rovněž umožňuje předvídat existenci proteinových interakcí způsobem analogickým k postupu popsanému v předcházejícím příkladu. Pro ilustraci byl realizován screening iontového kanálku tak, jak bylo popsáno v příkladu č. 3, což vedlo na identifikaci více než dvou tuctů molekul vykazujících alespoň 40% inhibici při testování při koncentraci 5 μΜ. Chemické struktury těchto inhibitorů byly sestaveny do seznamu, který byl analyzován podle popisu v příkladu č. 12. To vedlo na identifikaci sérií vysoce skórujících, chemických determinantů odvozených z aminokyselin a peptidového hlavního řetězce, přičemž po další analýze bylo zjištěno, že příslušný kanálek s největší pravděpodobností bude interagovat s inhibitorním peptidem nebo proteinem specificky obsahujícím určitou dipeptidovou sekvenci, označenou A5-A6. Překvapivě tyto inhibitorní proteiny již byly předtím popsány v literatuře, přičemž všechny z nich obsahovaly kanálek inhibující oblast 20 aminokyselin, obsahující přesně předpovězenou dipeptidovou sekvenci As-As. Protože může být stanoveno, že jakákoliv sekvence z 20 aminokyselin má pravděpodobnost pouze 0,046, že bude obsažena v daném sekvenčním uspořádání dvou daných reziduí na základě náhodného výběru, lze odhadnout, že pravděpodobnost správně předpovězené existence dvou rozdílných dipeptidových sekvencí, existujících ve dvou
9 · 9 9 I 9 999 9 9 9 9
99·9 99 « 9·9· nepřibuzných proteinech, na základě náhodného výběru v tomto air “i O man a τ’ πωύ Ί τ 1 Π Q7 Dy*CiGťn
V IvlVlil-* tj ÍC J J. J-IH .X ítX L4U.LA J C HLX_ 11U J. 11X.XJ J_ X-l -L. V ! I X -- V —« %» X» nicméně byly v obou případech provedeny správné odhady, což demonstruje, že předkládaný vynález umožňuje identifikovat a/nebo předvídat existenci určitých typů proteinových interakcí. To může být prováděno jednoduše identifikováním sekvence aminokyselin, obsahující největší možný chemický determinant identifikovaný z podskupiny farmakologicky aktivních struktur, a potom vyhledáváním v sekvenčních databázích proteinů obsahujících příslušnou sekvenci aminokyselin. Popis tohoto procesu je uveden v příkladu č. 14 níže. V této souvislosti je zřejmé osobě v oboru znalé, že uvedený přístup není omezen výhradně na identifikaci dipeptidových sekvencí, protože v závislosti na strukturách 15 farmakologicky aktivních sloučenin procházejících analýzou by mohly být rovněž detekovány tripeptidové nebo dokonce tetrapeptidové sekvence. Je rovněž zcela zjevné, že podobný přístup by rovněž mohl být použit pro ne-peptidové ligandy, to znamená, že způsob by rovněž mohl být upraven pro detekci, 20 například, uhlovodanových sekvencí (to jest cukrů), nukleotidů, a podobně.
Příklad č. 14 - Identifikace párů samostatného ligandu a receptoru
Předkládaný vynález může být dále aplikován pro identifikaci samostatných ligandů a/nebo dvojic samostatných ligandů a receptoru. Proces je zahájen sestavením seznamu chemických struktur majících daný účinek na příslušný protein (obvykle schopnost vázání) , ale pro které v okamžiku výzkumu 30 nejsou známé žádné ligandy. Tyto informace mohou být £, t 99 4 4 * 4 4 4 * • 4 4 4 4 4 4 «44 4 4 · 4 • 4*4 ·· 4 4444 generovány množstvím způsobů, jako je, ale bez omezení na tyto postupy, provedení NMR studií, měření souhlasných změn prostřednictvím kruhového dichroismu, měření interakcí proteinů a ligandú prostřednictvím povrchové plazmové rezonance, nebo v případě samostatného receptoru provedení testu s konstitutivně aktivovanými mutanty příslušného receptoru.
ilustraci tohoto konceptu předpokládejme, že výše popisovaného typu jsou prováděny na receptoru, což poskyouje struktury ilustrované
Pro experimenty samostatném níže: ho
O
Cl
To je hypotetický seznam struktur analyzovaných pro biologicky aktivní chemické determinanty. Devět struktur, »4·· 4444 44 4 • 4 4 4 4 4 4·4 4 4 4 ·
4444 4· 4 4444 *4 44 4« 44 ·· «4 znázorněných výše, bylo analyzováno podle předkládaného vynálezu, jak bylo popsáno v příkladu č. 12, s využitím výše zmiňovaného seznamu chemických determinantů odvozených z aminokyselin a peptidového základního řetězce.
Analýza struktur podle popisu v příkladu č. 12 vedla na indentifikaci množství chemických determinantů odvozených z aminokyselin a peptidového základního řetězce s hodnotami skóre většími než 1. Příklady takovýchto determinantů jsou znázorněny níže společně s odpovídajícími hodnotami jejich skóre.
No. 43 Score = 4.43
Nc. 44
Score = 4.90
Toto jsou příklady vysoce skórujících chemických determinantů identifikovaných v prvním kole analýzy. Soubor hypotetických receptorových ligandů byl analyzován podle vynálezu prostřednictvím skórování chemických determinantů znázorněných v prvním panelu příkladu č. 12 a rovněž množství dalších prostřednictvím funkce (IV) skóre. Hodnoty větší než jedna indikovaly, že determinant měl pravděpodobnost menší než 1 z 20, že se bude vyskytovat v podskupině ligandů pouze na základe náhodného výběru. Výše jsou znázorněny dva chemické determinanty s nejvyšším skóre, které byly identifikovány uvedeným procesem.
* 4
9 94 · · · ·
44 4 4 4 4 449 444 4
4444 44 4 4444
44 44 49 «4 ·4
Z těchto příkladů je zřejmé, že determinanty č. 43 a č. 44 mohou být obsaženy pouze v chemických strukturách aminokyselin fenylalaninu a tyrosinu. Z toho lze tedy usuzovat, že peptidy, které interagují se samostatným receptorem, pravděpodobně obsahují reziduum buď tyrosinu nebo fenylalaninu ve svých sekvencích a že tato rezidua pravděpodobně mají důležitou úlohu buď pří vázání ligandů a/nebo aktivaci receptorů těmito peptidy. Pokud jsou vysoce skórující determinanty č. 43 a č. 44 následně opětovně analyzovány, aby se zjistilo, zda kombinace s fragmenty dalších aminokyselin neposkytují dokonce ještě vyšší hodnoty skóre, mohou být dále identifikovány fragmenty, jako je determinant č. 45 ilustrovaný na následujícím panelu A.
“yr- Gly
Tyto panely znázorňují vysoce skórující chemické determinanty identifikované v druhém kole analýzy. Chemické determinanty, jako jsou výše popsané determinanty, byly opětovně analyzovány podle předkládaného vynálezu pro stanovení, zda kombinace s fragmenty dalších aminokyselin by nevytvořily struktury s ještě vyššími hodnotami skóre. Jedna z nich, označená jako determinant č. 45 (panel A), vykazovala hodnotu skóre větší než 40. Překvapivě celý tento determinant • 9 9· 9 9 9 9 99 9 * 9 9 9 · 9 9 999 9 9 9 9
9999 99 9 >9*9
99 99 99 99 99
č. 45 je obsažen ve struktuře dipeptidové sekvence Tyr-Gly en^i-yri^nn ·ί Ci XI J.-L.
.gand samostatného terče obsahuje dipeptidovou sekvenci Tyr-Gly ve své primární struktuře.
protože je zjevné, že celý determinant č, 45 je obsažen ve struktuře dipeptidu tyrosin-glycin (Tyr-Gly), lze usuzovat, že samostatné ligandy, které hledáme, s největší pravděpodobností obsahují sekvenci Tyr-Gly někde v jejich primárních strukturách. Na základě této informace mohou být podrobeny screeningu databáze sekvencí aminokyselin, aby se tak identifikovaly známé a/nebo samostatné ligandy obsahující předvídanou Tyr-Gly sekvenci, které po selekci a vyjádření mohou být testovány v původním testu biochemického screeningu. Alternativně může být chemický determinant č. 45 přímo použit pro sestavení souborů sloučenin potenciálních mimetik Tyr-Gly.
Nakonec je vhodné uvést, že chemické struktury, použité v tomto příkladu, jsou vlastně agonisty opioidních receptorů, nalezené v literatuře, a že přirozeně se vyskytující agonisty opiodidních receptorů, to jest dynorfin A, β-endorfin, leu-enkefalin a met-enkefalin, všechny obsahují předvídanou sekvenci Tyr-Gly ve svých primárních strukturách. Protože reziduum tyrosinu bylo ilustrováno jako bezvýhradně požadované pro aktivitu opioidního agonistu, tento příklad dále ilustruje schopnost předkládaného vynálezu identifikovat biologicky aktivní části receptorových ligandů. Je rovněž patrné, že výše popisované odhady mohou být zlepšeny prostřednictvím použití alternativních algoritmů využívajících proměnné x, y, z a N, jako je například Fischerův přesný test. Ovšem bylo analyzováno pouze devět • · ftft « · * · ft · · ft ft ft ft ft · ft «·· ft ft · « ftftftft ftft · ftftftft «· ft* ftft ·· ·· ftft struktur s použitím způsobu, pro který nebyla provedena adekvátní korekce pro vzorky malých velikostí, což může vést k tomu, že hodnota skóre 41,96 pro determinant č. 45 může být poněkud nadhodnocena.
Příklad č. 15 - Identifikace endogenních modulátorů lékových terčů
Osobě v oboru znalé je zřejmé, že předkládaný vynález může být rovněž aplikován na identifikaci endogenních modulátorů lékových terčů. Pro uvedení příkladu byl rozvinut funkční test pro příslušný iontový kanálek při léčení neurodegenerace. Soubor sloučenin byl podroben screeningu a výsledný seznam inhibitorů byl analyzován na přítomnost biologicky aktivních chemických determinantů, jak bylo popsáno v příkladu č. 2. To vedlo na identifikaci vysoce skórujícího chemického determinantu, o kterém bylo zjištěno, že je obsažen v podskupině molekul endogenně vytvářených v eukaryotických buňkách. Odpovídající sloučeniny byly následně opatřeny (nakoupeny) a testovány v testu, přičemž bylo zjištěno, že příslušný kanálek je selektivně inhibován (blokován) podmikromolárními koncentracemi určité podtřídy buněčného fosfolipidu, který velmi překvapivě byl již předtím sdružen s neuronální apoptézou prostřednictvím neznámých mechanismů jiných skupin. V souhrnu tedy tyto výsledky demonstrují, že předkládaný vynález umožňuje identifikaci endogenních modulátorů lékových terčů.
···· · · · · * * _ • * · < · · 44« · · « | • · 4 · ·· · a · · β ·♦ *4 44 «4 ··
Příklad č. 16 - Identifikace klamně kladných experimentálních výsledků
Byl rozvinut enzymatický test pro proteinovou kinázu, o které se předpokládá, že má důležitou úlohu při imunitní reakci. Podle předkládaného vynálezu byl sestaven soubor sloučenin pro screening na daný terč, přesněji podle popisu v příkladu č. 2. Sloučeniny souboru potom byly následně testovány v testu s koncentrací 5 μΜ, což vedlo na identifikaci 35 molekul vykazujících inhibitorní aktivitu alespoň 40%. Struktury těchto sloučenin byly analyzovány s použitím zjednodušené varianty vzorce (II) jako funkce skóre, a odpovídající hodnoty skóre byly přímo porovnávány s hodnotami statistické tabulky, což poskytlo odhady pravděpodobností, že se dané chemické determinanty vyskytují mezi podskupinou 35 farmakologicky aktivních sloučenin pouze na základě náhodného výběru.
S použitím prahové hodnoty pro pravděpodobnost náhodného výskytu p < 0,05 bylo stanoveno, že 14 z 35 inhibitorů s největší pravděpodobností reprezentuje klamně kladné výsledky. Následné opětovné testování 14 sloučenin v testu potvrdilo tuto hypotézu, což ilustruje, že předkládaný vynález umožňuje identifikaci klamně kladných experimentálních výsledků.
Příklad Č. 17 - Identifikace klamně záporných experimentálních výsledků
Provedením výpočtů analogických k výpočtům podle popisu v příkladu č. 16 předkládaný vynález dále umožňuje identifikaci klamně záporných experimentálních výsledků. Pro • · ·· • · · · « • · · · ♦· ·· • · · · · • · ··· · · • · a ·· «· uvedení příkladu byly analyzovány chemické struktury sérií inhibitorů fosfatázy na přítomnost farmakologicky aktivních chemických determinantů, jako bylo popsáno v příkladu č. 16. Výsledné, nejvíce skórující chemické determinanty byly použity jako farmakologicky aktivní otisky pro provedení podstrukturních průzkumů v seznamu chemických struktur odpovídajících sloučeninám, které byly původně testovány v testu. To odhalilo množství molekul, které obsahovaly jeden nebo více z výše zmiňovaných chemických determinantů, ale které byly nicméně přesto identifikovány jako negativní v testu screeningu. Odpovídající molekuly byly následně opětovně testovány v testu, přičemž bylo zjištěno, že více než 15 % z nich bylo klamně negativních, přičemž dokonce jedna sloučenina vykazovala podmikromolární inhibitorní aktivitu. Tyto výsledky jasně demonstrují, že způsob podle předkládaného vynálezu umožňuje identifikaci klamně záporných experimentálních výsledků.
Příklad Č. 18 - Provedení konfiguračních a konformačních analýz kvantitativních
V dále zlepšeném provedení předkládaného vynálezu je možné rovněž využít algoritmy zahrnující různé kombinace proměnných x, y, z a N pro kvantitativní konformační a/nebo konfigurační analýzu. Pro ilustrování této možnosti je zřejmé z výsledků, uvedených v příkladu č. 4, že struktura farmakologicky aktivního, proteázu inhibujícího otisku, znázorněná v panelu B příkladu č. 4, není ani konfiguračně ani konformačně definována. Skutečně je nemožné z reprezentace této struktury sdělit, zda je vzhledem ke dvěma karbonylovým nebo sulfonylovým skupinám trans-oid nebo cis-oid konformací verze jednoduché vazby otisku, který je farmakologicky aktivní, nebo navíc zda je (E) nebo (Z) konfigurací otisku, který je aktivní v případě verze dvojité vazby stejné uvedené struktury. Důvodem je to, že výpočty prováděné v příkladu č. 4 byly cíleny na identifikaci chemického determinantu, který s největší pravděpodobností bude základem inhibítorní aktivity pro proteázu, bez uvažování možných konformací a/nebo konfigurací, které takový determinant může mít. Vzhledem ke skutečnosti, že množství farmakologicky aktivních struktur obsahuje dvojité vazby a/nebo kruhové systémy, které slouží pro konformační omezení chemických determinantů omezením jejich celkového počtu otočných vazeb, je možné použít předkládaný vynález pro stanovení toho, které konformace a/nebo konfigurace daného chemického determinantu budou s největší pravděpodobností farmakologicky aktivní.
Pro uvedení názorného příkladu bylo šest (proteázu inhibujících/blokujících) struktur, ilustrovaných v příkladu č. 4, analyzováno prostřednictvím skórování sérií konformačně a konfiguračně definovaných chemických determinantů odvozených ze struktury znázorněné na panelu B příkladu č. 4, přičemž bylo použito funkce (IV) skóre.
? c; O O jednoduchá nebo dvojná vazba j ednoduchá nebo dvojná vazba
No, 46
Score = 36.90
No. 47
Score = 14.10 • 4
100
Tento panel ilustruje konfigurační analýzu proteazu chemického determinantu. Šest příkladu č. 4, bylo analyzováno s použitím seznamu konformačně chemických determinantu.
kvantitativní konformační/ i r?ln í i -ί ·ΐ* π τ* 1-Ί ι·*\ f Ί nlri τί η τ’ Ti Ί \ K/ UL S»» <-* J -L. ' J- / struktur, znázorněných v podle předkládaného vynálezu a konfiguračně definovaných
Chemický determinant č. 46, znázorněný výše společně s méně skórujícím chemickým determinantem č. 47, získal jednu z hodnot s největším skóre, z čehož lze usuzovat, že (Z) konfigurace verze s dvojitou vazbou otisku bude s větší pravděpodobností výhodným uspořádáním obsaženým v chemických strukturách inhibitorů příslušné proteázy. Tato hypotéza byla následně ověřena prostřednictvím dále cíleného vysoce výkonného screeningu, což poskytlo množství inhibitorů proteázy, ve kterých byl farmakologicky aktivní otisk skutečně omezen v (Z) nebo cisoid konfiguraci a pouze v malém množství z nich nebyl takto omezen.
V souhrnu tedy tyto výsledky demonstrují, že způsob podle předkládaného vynálezu umožňuje identifikaci biologicky aktivních konformací a/nebo konfigurací chemických determinantů. Nakonec je zcela zřejmé, že takovéto výpočty mohou být prováděny s množstvím alternativních algoritmů využívajících různé kombinace proměnných x, y, z a N. V této souvislosti je vhodné zmínit, že výše popisované odhady mohou být dále zlepšeny začleněním dalších proměnných do různých funkcí skóre, jako jsou proměnné které berou do úvahy farmakologickou potenci (sílu) chemických struktur, ale samozřejmě bez omezení pouze na tyto proměnné.
χυ χ • · · · · · ·«···· * * *··· · · · *··
Příklad č. 19 - Provádění průzkumů podobnosti
Z předcházejících přikladu je zřejmé, že koncept molekulární podobnosti, jak je nahlížen způsobem podle předkládaného vynálezu, je nápadně rozdílný od toho, co je obecně akceptováno jako význam tohoto termínu. Například sloučeniny v hypotetickém seznamu podle příkladu č. 14 jsou velmi nepodobné, dokud zde není zjevný způsob pro zatřídění těchto devíti molekul do jedné chemické rodiny s použitím klasických shlukovacích technik. Přesto nicméně bylo v příkladu č. 14 ilustrováno, že tyto sloučeniny jsou ve skutečnosti extrémně podobné v té míře, že každá z nich obsahuje alespoň jeden výskyt chemického determinantu, který je reprezentativním fragmentem aminokyseliny tyrosinu; víz následující panel:
HO a · • · · ·«· * ·
102
Toto jsou fragmenty aminokyseliny tyrosin, obsažené ve strukturách devíti agonistů opiodního receptoru. Struktury, znázorněné výše, jsou nepodobné v té míře, že je obtížné je sestavit do jedné chemické rodiny s využitím klasických shlukovacích technik. Tyto struktury jsou ale přesto velmi podobné ve smyslu předkládaného vynálezu v té míře, že všechny obsahují alespoň jeden fragment chemického determinantu definovaného aminokyselinou tyrosin, jehož výskyty jsou zvýrazněny silnějšími čarami.
Jako takový tedy může být předkládaný vynález snadno použit pro měření molekulární podobnosti a/nebo pro porovnáváni podobností, které mohou existovat mezi různými soubory chemických sloučenin. Při stručné ilustraci konceptu je snadno patrné, že jedna nebo více referenčních molekul může být zvoleno ze seznamu chemických struktur a analyzováno na přítomnost určitých chemických determinantů, které po identifikací mohou být použity pro provádění jednoho nebo více podstrukturních průzkumů v jedné nebo více nových molekulách za účelem zjištění, zda tyto jsou podobné prvním. Prostřednictvím skórování odpovídajících chemických determinantů funkcí skóre tak, jak bylo popisováno v předcházejících příkladech, a prostřednictvím skórování nových chemických struktur na základě, například, množství různých determinantů, které tyto struktury mohou obsahovat, je možné přidělovat hodnoty testovaným molekulám, které pak odrážejí stupeň podobnosti s původním souborem referenčních sloučenin. Tento proces je velmi užitečný při konstruování cílených souborů sloučenin pro objevování léků, protože umožňuje výzkumníkovi rychle identifikovat sloučeniny mající
103 \ • » ·· • · I * · · • · ♦·· · velké podíly podobností ve smyslu předkládaného vynálezu s farmakologicky aktivními referenčními sloučeninami.
Příklad č. sloučenin
Analyzování rozmanitosti souborů
Předkládaný vynález může být dále použit pro analyzování rozmanitosti souboru sloučenin způsobem analogickým k tomu, co bylo popsáno v předcházejícím příkladu. V této souvislosti je zjevné osobě v oboru znalé, že koncept chemických determinantů může být snadno využit pro porovnávání daného souboru sloučenin s jakýmkoliv dalším. Například může být vybrán soubor sloučenin pro vysoce výkonný screening prostřednictvím analyzování odpovídajícího seznamu chemických struktur podle předkládaného vynálezu, přičemž jako referenčního souboru lékových molekul se použije referenční soubor chemických struktur, jako jsou chemické struktury obsažené v databázích Merck Index, Derwent, MDDR nebo Pharmaprojects. V tomto případě molekuly, jejichž struktury jsou v podstatě zahrnuty v nízce skórujících chemických determinantech, jsou přítomné ve velké části referenčních struktur. Naproti tomu molekuly, které jsou v podstatě zahrnuty ve vysoce skórujících chemických determinantech, jsou posuzovány jako nelékové, protože stejné determinanty jsou pouze slabě reprezentovány v souboru referenčních sloučenin. Tyto informace jsou velmi užitečné pro konstruování objevovacích experimentů, protože pomáhají výzkumníkovi při identifikování chemických struktur, které by mely být začleněny do nebo vyloučeny ze souboru sloučeniny pro provádění screeningu. V tomto kontextu je zjevné, že pro • ·
104 tento účel může být použito množství algoritmů zahrnujících různé kombinace proměnných x, y, z a N.
Příklad č. 21 - Speciální algoritmy
Je zcela zřejmé, že předcházející příklady neposkytují vyčerpávající seznam všech algoritmů, využívajících různé kombinace proměnných x, y, za N, které mohou být použity pro provádění diskrétní podstrukturní analýzy. V této souvislosti je rovněž zcela zřejmé osobě v oboru znalé, že funkce (XII), (XIII) a (XIV) skóre mohou být rovněž použity pro adresování množství otázek prezentovaných v předcházejících příkladech. V některých příkladech je skutečně dokonce mnohem vhodnější ze statistického hlediska využit jeden z těchto vzorců namísto jednoho ze vzorců explicitně uváděných v příkladech. Protože je ale předkládaný vynález primárně konstruován pro identifikování chemických determinantů obsažených v seznamu chemických struktur, které jsou s největší pravděpodobností základem daného biologického účinku, byl tento popis primárně, zaměřen na relativní skórování a následné roztřídění chemických determinantů. Přesto jsou nicméně níže uvedeny vzorce (XII), (XIII) a (XIV) pro případ, že a) je požadován přesný odhad pravděpodobnosti výskytu při náhodném výběru pro malé soubory vzorků (viz vzorec (XII), kde s odpovídá nejmenší hodnotě mezi proměnnými x, (y-x) , (z-x) a (N-y-z+x)); b) předpokládá se, že poměrně vážený odhad současných příspěvků dvou determinantů je vhodnější pro použití v příkladu č. 8 (viz vzorec (XIII), kde d odpovídá počtu samostatných chemických determinantů); nebo c) považuje se za důležité odhadnou sledované účinky při vyhodnocování současných příspěvků dvou vzájemně propojených
X U J t · · »·* * w » - _ _
9 9 9 9 9 V «««» chemických determinantů (viz vzorec (XIV)). V tomto kontextu jsou definice proměnných x, y, z, a N přesně takové, jak bylo popsáno v předcházejícím popisu.
(XN) (Xl.ll) ..
(Xiv)
Score = X,
Score i-1 y!(N-y)!z!(N-z)!
x! (y-x)! (z-x)[ (N-y-z+x)! N!y re = VÍNx~Yq / ýíz(N-z)y(N-y)
4/ V i=i
Score =
ÍV (N-y-z--2x)
Nakonec je rovněž zjevné osobě v oboru znalé, že 15 použití určitých proměnných ve funkcích skóre a/nebo algoritmech zkonstruovaných pro identifikování biologicky aktivních chemických determinantů, ale ne explicitně popsaných v předcházejících příkladech, může být matematicky ekvivalentní použití různých kombinací proměnných x, y, z a 20
N, Pro názornou ilustraci funkce skóre, využívající proměnou g definovanou jako reprezentující počet neaktivních molekul, jejichž chemické struktury obsahují daný chemický determinant, je ekvivalentní použiti proměnných x a y jako q=y-x. Podobně funkce skóre, využívající proměnnou r definovanou jako reprezentující celkový počet aktivních sloučenin, které neobsahují daný chemický determinant, je algebraicky ekvivalentní použití proměnných x a z, protože může být snadno ukázáno, že r=z-x. Rovněž funkce skóre, využívající proměnnou s definovanou jako reprezentující celkový počet neaktivních sloučenin, které neobsahují daný
106 *
ft ♦· 9 • · ft · ·
chemický determinant, je ekvivalentní použití proměnných x, y, z a N, protože s=N-y-z+x. Nakonec algoritmy využívající proměnné t a u, reprezentující celkový počet molekul, jejichž struktury neobsahují daný determinant (t) , respektive celkový počet neaktivních molekul (u) , jsou ekvivalentní použití proměnných N, y a/nebo z, protože může být snadno ukázáno, že t=N-y a u=N-z.
Příklad č. 22 - Mapování relativních příspěvků
Předkládaný vynález rovněž umožňuje konstruování diagramů relativních příspěvků. To jsou grafické reprezentace chemických struktur, ve kterých jsou indikovány relativní příspěvky různých atomů, vazeb, fragmentů a/nebo podstruktur pro daný biologický výsledek prostřednictvím hodnot skóre, vypočítaných podle popisů v předcházejících příkladech. Ve výhodném provedení způsobu podle vynálezu jsou použity pravděpodobnostní hodnoty skóre, jako jsou ty, které byly vypočítány s použitím vzorce (XII), kde P (A) reprezentuje pravděpodobnost, že daný chemický determinant je obsažen v podskupině biologicky aktivních struktur na základně náhodného výběru, což je vypočítáno s využitím vzorců používajících nej různější kombinace proměnných x, y, z a N, jak bylo popsáno v předcházejícím.
(XII)
Score = H- F(A)] -100%
V tomto kontextu je zcela zřejmé, že množství měřítek asociace a/nebo funkcí skóre je možné použit pro odhad P (A) .
J- v / * ··
4« 4 » · · * « ·«· · ♦ · * *
Dva příklady diagramů relativních příspěvků budou nyní diskutovány poněkud podrobněji. Následující panel
No. 50
Score = 23.3%
Nc. 51
Score = 55.2%
No. 52
Score = 53.0%
No. 53
Score « B2.S%
OH
No. 54
Score = 98.1%
Nc. 5o
Sccre = 12.0%
Nc. 56
Score = 0.3%
Nc. 57
Score = 0.0% ukazuje příslušnou molekulu doplněnou sériemi chemických determinantů sestavených z fragmentů stejné uvedené molekuly, které byly skórovány s použitím vzorce (XII) a modifikací měřítka (I) asociace pro stanovení P (A) . Obr. 15 znázorňuje stejné informace v grafické podobě, kde determinanty jsou vyneseny proti jejich příslušným hodnotám skóre. V tomto kontextu je zjevné, že stejné informace mohu být reprezentovány ve formě pravděpodobnostních obrysových map, jak je znázorněno na následujícím panelu:
108 « 9 · 9 9 9 9 999 « 9 9 9 «999 99 9 999»
Celkově jsou takovéto diagramy velmi užitečné pro konstruování souborů sloučenin, protože pomáhají výzkumníkovi při výběru sloučenin na základě matematických odhadů úspěšnosti náhodného výběru v daném testu, což snižuje potřebu spoléhat se na koncept molekulární rozmanitosti pro identifikování nových, biologicky aktivních chemických sérií. Tyto diagramy jsou rovněž zajímavé v lékařské chemii, protože reprezentace jaká je například znázorněná na panelu výše, jasně indikuje, které části molekuly mohou být přiměřeně modifikovány s minimálním rizikem ztráty farmakologické aktivity. Naproti takovéto grafy upozorňují toxikologa na to, které části toxické sloučeniny musí být modifikovány za účelem eliminováni nežádoucího účinku.
Pro získání mapování relativních příspěvků, znázorněného výše a na obr. 15, byly podle předkládaného vynálezu skórovány chemické determinanty, odpovídající fragmentům biologicky aktivní molekuly, s užitím funkce skóre využívající proměnné x, y, za N, což umožňovalo přímý odhad pravděpodobnosti náhodného výskytu v souboru aktivních molekul (P(A)). Odpovídající hodnoty P(A) byly transformovány s použitím funkce (XII) skóre, poskytující pravděpodobnostní hodnoty skóre pro každý determinant, což odráží relativní
109 :
» *9
9 » · * «9« 9 9 pravděpodobnost, že odpovídající chemická struktura byla základem příslušné biologické aktivity. Hodnoty mohou být ilustrovány jako na obr. 15, který je grafickou reprezentací hodnot skóre pro různé chemické determinanty. Chemický determinant č. 54 odpovídá lokálnímu maximu této série. Nebo mohou být tyto hodnoty ilustrovány jako na výše uvedeném panelu, který je pravděpodobnostní obrysovou mapou indikující, který fragment nebo sektor příslušné chemické struktury s největší pravděpodobností přispívá k biologické aktivitě (determinant č. 54 obsažený v oblasti vymezené 95% obrysovou linií). Další způsob prezentování uvedených hodnot je znázorněn na obr. 11.
Příklad č. 23 - Ekvivalence funkcí skóre
Funkce skóre, použité v předcházejících příkladech jsou všechno způsoby pro identifikování chemických determinantů, které jsou s největší pravděpodobností základem daného biologického, farmakologického a/nebo toxikologického účinku. Zatímco je osobě v oboru znalé zcela zjevné, že určitá měřítka asociace a/nebo funkce skóre jsou nejlépe využita pro adresování pouze určitých typů otázek, při použití ve způsobu podle předkládaného vynálezu podle výše uvedeného popisu každý vzorec umožňuje identifikaci stejného, nejvíce skórujícího chemického determinantu, který s největší 25 pravděpodobností je základem daného biologického účinku. Jako takové vzorce, prezentované v předcházejících příkladech, jsou funkčně ekvivalentní ve smyslu diskrétní podstrukturní analýzy,
3Q Za účelem uvedení názorného příkladu byla provedena analýza chemických struktur 131 agonistů receptoru dopamin D2
110 |«V* * 4 •4 «4 44 • 4 · · <4 osm krát paralelně s využitím osmi měřítek asociace a funkcí skóre, obsahujících různé kombinace proměnných x, y, z a N, jak je znázorněno níže. Studie byla prováděna jako podle předchozího popisu, zejména přidáním chemických struktur 101207 molekul, které byly popsány jako mající nulový účinek na receptor dopamin D2, k prvnímu seznamu 131 molekul a skórováním sérií 19 chemických determinantů, znázorněnými níže, s užitím funkcí (XV) až (XXIII) skóre, přičemž znalý čtenář snadno nahlédne, že tyto funkce reprezentují stejné funkce, které byly použity v množství předcházejících příkladů, a nebo jejich blízce příbuzné varianty.
C
No. 58
No. 70
N
No. 59
No. 71
N
No. 72
No. 61
No. 73
Toto j sou chemické determinanty skórované s osmi různými funkcemi skóre. 19 chemických determinantů, znázorněných výše, bylo skórováno s použitím funkcí (XV) až (XXII) a seznamu chemických struktur katalogizovaných pro
1X1 · · · « « * « » • · · · « v « ··· · « » ♦ ·««* · · · ···· aktivitu agonistu receptoru dopamin D2. Použité funkce jsou následuj ící:
| (XV) | Score = MW -(x/ z) |
| (XVI) | Score = (x/z)-(y/N) |
| (XVII) | Score = Nx-yz |
| (XVII!) | Sccre=X!N-y 2-X) (z-x)(y-x) |
| (XIX) | (|Nx-yzj-N/2)2N Score ---— z(N-z) y(N-y) |
| (XX) Score = | : y z x) ~2,/Í7x?1/(y-x)+1/(z-x)+1/(N-y-z4-x) (z-x)(y-x) |
| (XXI) | Score= Nx-yz ýZ(N-z) y(N-y) |
| (XXII) | Score = el(x/2Hz-xMN-z)J |
Obr. ISA až obr. 16H znázorňují odpovídající diagramy relativních příspěvku. Chemické determinanty, znázorněné v panelu výše, byly skórovány podle předcházejícího popisu a vyneseny proti jejich odpovídajícím hodnotám skóre. Obr. 16A znázorňuje skóre získaná s funkcí (XV), obr. 16B znázorňuje skóre získaná s funkcí (XVI) , obr. 16C znázorňuje skóre získaná s funkcí (XVII), obr. 16D znázorňuje skóre získaná s funkcí (XVIII), obr. 16E znázorňuje skóre získaná s funkcí (XIX), obr. 1SF znázorňuje skóre získaná s funkcí (XX), obr. 16G znázorňuje skóre získaná s funkcí (XXI), a obr. 16H
112 * « · · · * ··* · ♦ « « » · · * · znázorňuje skóre získaná s funkcí (XXII). Každá funkce skóre nezměnitelně zvýrazňuje stejný chemický determinant (č. 73) jako mající největší pravděpodobnost, že je základem biologické aktivity.
Jak je znázorněno diagramy relativních příspěvků, prezentovanými na obr. 16A až obr. 16H, každá z osmi funkcí skóre správně identifikovala chemický determinant č. 73 jako odpovídající lokálnímu maximu, což znamená, že to je chemický motiv s největší pravděpodobností zakládající aktivitu agonistu dopaminu D: v seznamu 13 testovaných determinantů. Překvapivě se různé funkce skóre lišily, pokud se týká ohodnocení méně skóruj ících chemických determinantů, takže například determinant č. 62 byl považován za důležitý pro biologickou aktivitu ohodnocením r.a třetím místě ve výpočtech s použitím funkcí (XV), (XVI) a (XVII) skóre, zatímco s použitím funkce (XXII) skóre byl jako třetí hodnocen determinant č. 63, s použitím funkcí (XIX) a (XXI) skóre byl jako třetí ohodnocen determinant č. 65 a nakonec s použitím funkcí (XVIII) a (XX) skóre byl jako třetí hodnocen determinant č. 66.
celkově tyto drobné rozdíly mají malou důležitost pro úspěšný výsledek metody, protože v každém případě méně skórující determinanty jsou vlastně fragmenty většího, nejvíce skórujícího determinantu č. 73 (viz panel výše). Takto postačuje přímé použití chemického determinantu č. 73 a jeho fragmentů pro zkonstruování souborů sloučenin pro vysoce výkonný screening, protože tyto bude neměnné obsahovat struktury obsahující každý z méně skórujících determinantů. Vzorky typu sloučenin, které by mohly být začleněny do takového souboru jsou znázorněny níže:
X1J ft * 94 · ·
9 9 ·
Tyto vzorky struktur jsou příklady sloučenin, které by mohly být vybrány pro začlenění do souboru sloučenin, zkonstruovaného pro identifikaci agonistu receptorů dopamin D2. Každá ze struktur, znázorněných výše, obsahuje chemický determinant Č. 73 nebo jeho podstatnou část.
Ačkoliv tedy matematické zdůvodnění, které je podkladem konstruování, a použití osmi různých funkcí skóre je v každém případě jiné, všechny tyto postupy identifikují zcela stejný a tentýž chemický determinant, který je s největší pravděpodobností základem biologické aktivity. Jako takové jsou algoritmy, obsahující různé kombinace proměnných x, y, z a N nebo q, r, s, t a u, jak bylo zmiňováno v předcházejícím popisu, funkčně ekvivalentní ve smyslu předkládaného vynálezu.
Příklad č. 24 - Nástroje pro objevování léků na bázi informatiky
Z předcházejících příkladů je zcela zřejmé, že předkládaný vynález může být začleněn do jedné nebo více
114 t · « « · · 4 ··* · * · * « « « · · * · »··« ·» «· · 4* *· ·· sérií procedur, jako jsou, ale bez jakéhokoliv omezení, počítačové programy konstruované pro zvýšení účinností vysoce výkonného screeningu, objevování sloučenin, cílené chemie, rozvoj sloučenin a/nebo optimalizace vodících struktur. Takové procedury nebo programy jsou výhodně konstruovány pro přímé strojové a/nebo robotické systémy, které provádějí screening léků, výběr sloučenin, vytváření souborů a/nebo chemické syntézy kontrolovaným, polo-autonomním nebo plně autonomním způsobem. Takové procedury zahrnují, ale nejsou žádným způsobem na ně omezeny, následující příklady, které představují výhodná provedení předkládaného vynálezu:
• Proces, ve kterém chemické struktury, katalogizované s odpovídajícími experimentálními výsledky, jsou analyzovány a jsou podle předkládaného vynálezu identifikovány biologicky aktivní chemické determinanty.
• Proces, ve kterém jsou biologicky aktivní chemické determinanty, identifikované podle předkládaného vynálezu, použity pro provedení průzkumů v chemických databázích, virtuálních nebo jiných, za účelem identifikování sloučenin, biopreparátů, reakčních činidel, produktů reakcí, přechodných struktur nebo jiných, které s největší pravděpodobností vykazují danou farmakologickou, biochemickou, toxikologickou a/nebo biologickou vlastnost.
• Proces, ve kterém biologicky aktivní chemické determinanty, identifikované podle předkládaného vynálezu, jsou uloženy v registru společně s přidruženými experimentálními údaji a/nebo hodnotami skóre, v elektronické formě nebo jiné, a pravidelně aktualizovaném či nikoliv, který potom slouží jako archiv strukturních informací pro použití v procesu provádějícím rozhodování, automatizovaném » · · »
115 či nikoliv, pro výběr chemických sloučenin, sérií a/nebo koster pro vysoce výkonný screening, lékařskou chemii a/nebo optimalizaci vodících struktur, přičemž uvedené experimentální výsledky a hodnoty skóre se týkají jakékoliv dané farmakologické, biochemické, toxikologické a/nebo biologické vlastnosti.
• Proces, ve kterém je předkládaný vynález, jak je popsán v kterémkoliv z předcházejících příkladu, použit pro identifikování farmakologických modulátorů lékových terčů, jako například, ale bez omezení na, receptorové ligandy, inhibitory kinázy, modulátory iontových kanálků, inhibitory proteázy, inhibitory fosfatázy a ligandy steroidních receptorů.
popsán v chemických sérií, konstruování sloučenin s předvídání potenciálních seru, účinky.
Proces, ve kterém je předkládaný vynález, jak je kterémkoliv z předcházejících příkladů, přímo použit, nebo využit ve zkonstruovaném počítačovém programu, pro analýzu chemických struktur za účelem zvýšení potence zvýšení selektivity chemických více farmakologickými sekundárních farmakologických působení molekuly, předvídání potenciálních toxikologických působení molekuly, identifikování biologicky aktivních částí receptorových ligandů, předvídání potenciálních proteinových interakcí, identifikování párů samostatných ligandů a receptorů a/nebo identifikování endogenních lékových terčů. Poslední využití se vztahují oblasti funkčních genomů a proteomů, ve kterých, například, mohou být vybrány sekvence nukleotidů a/nebo aminokyselin pro průzkumy na základě chemických struktur molekul identifikovaných v testu biochemického screeningu a modulátorů zejména na
116
9 4*4 • 44 4 ·»· 4 V zpracovaných podle vynálezu, jako například pro identifikaci samostatných ligandú.
• Proces, ve kterém je předkládaný vynález buď přímo použit, nebo použit ve zkonstruovaných programech, pro 5 identifikování klamavě kladných a/nebo záporných experimentálních výsledku.
• Proces, ve kterém je předkládaný vynález buď přímo použit, nebo použit ve zkonstruovaných programech, pro předvídání potenciálně nebezpečných účinků molekuly pro 10 člověka, živočichy a/nebo prostředí, jako například při provádění screeningu chemikálií pro použití v potravinářských příměsí nebo jako potravinářských příměsí, v plastech, textiliích, a podobně.
15 · Proces, ve kterém je předkládaný vynález buď přímo použit, nebo použit ve zkonstruovaných programech, pro provádění konfiguračních analýz, konformačních analýz, stereochemických analýz, analýz podobnosti a/nebo analýz rozmanitosti.
· Proces, ve kterém je předkládaný vynález buď přímo použit, nebo použit ve zkonstruovaných programech, pro generování map relativních příspěvků a/nebo grafických reprezentací biologicky aktivních částí nebo chemických struktur.
• Proces, ve kterém je kterýkoliv z výše uvedených procesů použit samostatně nebo buď v sériových a/nebo paralelních kombinacích pro provozování nástroje informatiky, počítačového programu a/nebo expertního systému, určeného pro použiti při provádění objevování léků, herbicidů a/nebo 30 +· a· pesticidu.
117 • ·· ; «· * · · ··· * · · · · · ·· ·· ·· »<
struktur, vytváření screeningu, chemických • Proces, ve kterém je kterýkoliv z výše uvedených qA , σ ΐ F opmnqf· τίλ/ίιΟ Vm τ r ej O η o λ γττ Vi Λ / τΊ ůVřq
O 1^· SJ. -L t- fc_? Ciu Ů \»ΙιΛθΠί1 IíCáJO1 iwf 'wVwt V Ca / x paralelních kombinacích pro řízení funkce zařízení a/nebo prostředků či nástrojů, automatizovaně či nikoliv, autonomně či nikoliv, a pro vytváření aktualizovatelných registrů chemických determinantů, katalogizovaných s hodnotami skóre či nikoliv, pro použití pří racionálním vytváření chemických získávání chemických sloučenin, racionálním experimentálních protokolů a/nebo údajů o a/nebo racionálním výběru výsledků a/nebo struktur v sektoru farmaceutického a/nebo zemědělského výzkumu.
Osoba s běžnými znalostmi v oboru snadno nahlédne další možné procedury využívající principy předkládaného vynálezu.
Zastupuje :
118 ··· » »· * ΐ »· · · * · ··· · · · <
···* · · · · · · <
·· ·« ·· ·· ·· ··
Claims (22)
- přístupu molekulárních prozkoumatelná1. Způsob provozování počítačového systému pro provádění diskrétní podstrukturní analýzy, vyznačující se tím, že zahrnuj e kroky:(210, 220, 410) k databázi (110, 115) struktur, přičemž tato databáze je prostřednictvím informací o molekulárních strukturách a biologických a/nebo chemických vlastností;identifikováni (220) v uvedené databázi podskupiny molekul majících danou biologickou a/nebo chemickou vlastnost;stanovení (230, 420) fragmentů molekul v uvedené podskupině;pro každý fragment vypočítání (230, 430, 610-650) hodnoty skóre, indikující příspěvek příslušného fragmentu k uvedené dané biologické a/nebo chemické vlastnosti; a provedení (240, 250) opakování procesu analyzováním (250) stanovených fragmentů a vypočítaných hodnot skóre, přičemž nejprve se vybere alespoň jeden fragment, který má hodnotu skóre, indikující vysoký příspěvek k uvedené biologické a/nebo chemické vlastnosti, a potom se opakují kroky přístupu, identifikování, stanovení a vypočítání.
- 2. Způsob podle nároku i, vyznačující se tím, že krok vypočítání hodnoty skóre obsahuje krok:vypočítání (610) počtu (x) molekul v uvedené podskupině molekul, které obsahují daný fragment.
- 3. Způsob podle nároků 1 nebo 2, vyznačující se tím, že dále zahrnuje krok:identifikování v uvedené databázi druhé podskupiny119 • · · ♦ · ·· molekul, které nemají uvedenou biologickou a/nebo chemickou vlastnost;přičemž krok vypočítání hodnoty skóre zahrnuje krok: vypočítání (620) počtu (y) molekul v uvedené podskupině5 a uvedené druhé podskupině molekul, které obsahují daný fragment.
- 4. Způsob podle jednoho z nároků 1 až 3, vyznačující se tím, že uvedený krok vypočítání hodnoty skóre zahrnuje krok:vypočítání (630) počtu (z) molekul v uvedené podskupině molekul.
- 5. Způsob podle jednoho z nároků 1 až 4, vyznačující se tím, že dále zahrnuje krok:identifikování v uvedené databázi druhé podskupiny 25 molekul, které nemají uvedenou danou biologickou a/nebo chemickou vlastnost;přičemž uvedený krok vypočítání hodnoty skóre zahrnuje krok:vypočítání (640) celkového počtu (N) molekul v uvedené 2o podskupině a uvedené druhé podskupině molekul.
- 6. Způsob podle jednoho z nároků 1 až 5, vyznačující se tím, že proces opakování se provádí výběrem fragmentů následujícího kola, které mají vyšší molekulární hmotnost, než fragmenty předcházejícího kola.
- 7. Způsob podle jednoho z nároků 1 až 6, vyznačující se tím, že dále zahrnuje kroky:výběru (710) fragmentu na základě vypočítaných hodnot skóre;analyzování (810) struktury vybraného fragmentu; lokalizace (820) zobecněné položky ve struktuře120 « » *· ...- -, ,« · · * · ♦·· · * * · «··· » · · · ·· · fragmentu; a náhrady (830) zobecněné položky zobecněným výrazem pro vytvoření generické podstruktury.
- 8. Způsob podle nároku 7, vyznačující se tím, že dále zahrnuje krok:provedení (840) virtuálního screeningu s použitím generické podstruktury.
- 9. Způsob podle jednoho z nároků 1 až 8, vyznačující se tím, že krok analyzování stanovených fragmentů a vypočítaných hodnot skóre zahrnuje kroky:výběru (1010) prvního fragmentu na základě vypočítaných hodnot skóre;výběru (1020) druhého fragmentu na základě vypočítaných hodnot skóre; a vytvoření (1030) molekulární podstruktury obsahující uvedený první fragment a uvedený druhý fragment prostřednictvím aplikace funkce vázání řetězců.
- 10. Způsob podle jednoho z nároků 1 až 9, vyznačující se tím, že krok analyzování stanovených fragmentů a vypočítaných hodnot skóre zahrnuje kroky:výběru (710) alespoň jednoho fragmentu na základě vypočítaných hodnot skóre;vyjmutí (720) sloučenin z předcházející podskupiny molekul, přičemž vyjmuté sloučeniny obsahují vybraný fragment;výběru (730) sloučenin z předcházející podskupiny molekul, neobsahujících vybraný fragment, nebo sloučenin neobsazených v předcházející podskupině molekul; a121 ·· ·· vytvoření (740) nové podskupiny molekul, obsahující vyjmuté a vybrané sloučeniny.
- 11. Způsob podle jednoho z nároků 1 až 10, vyznačující se tím, že dále zahrnuje krok:vytvoření (230) knihovny (120) fragmentů, obsahující stanovené fragmenty a vypočítané hodnoty skóre.
- 12. Způsob podle jednoho z nároků 1 až 11, vyznačující se tím, že databáze je autorizovaná databáze.10
- 13. Způsob podle jednoho z nároků 1 až 12, vyznačující se tím, že databáze je veřejná databáze.
- 14. Způsob podle jednoho z nároků 1 až 13, vyznačující se tím, že databáze je databází sekvencí aminokyselin a/nebo nukleových kyselin, a uvedená biologická a/nebo chemická vlastnost je daný účinek na příslušný protein.
- 15. Způsob podle jednoho z nároků 1 až 14, vyznačující se tím, že uvedená biologická a/nebo chemická vlastnost je farmakologická vlastnost a způsob se použije pro objevování20 léků.
- 16. Způsob podle jednoho z nároků 1 až 15, vyznačující se tím, že dále zahrnuje krok:sestavení (260) souboru sloučenin, které obsahují alespoň jeden ze stanovených fragmentů.
- 17. Způsob podle nároku 16, vyznačující se tím, že dále zahrnuje krok:testování sloučenin z uvedeného sestaveného souboru na uvedenou danou biologickou a/nebo chemickou vlastnost.122 • 99« • ·9 9 99 ♦♦9* • ··· ·9 ·9 • 9 *♦
- 18. Počítačový programový produkt uspořádaný pro provádění způsobu definovaného podle jednoho z nároků 1 až 17.
- 19. Knihovna fragmentů vytvořená provedením způsobu podle jednoho z nároků 1 až 17.
- 20. Počítačový systém pro provádění diskrétní podstrukturní analýzy, vyznačující se tím, že zahrnuje:prostředky (100, 110, 115) pro přístup k databázi molekulárních struktur, přičemž tato databáze je prozkoumatelná prostřednictvím informací o molekulárních strukturách a biologických a/nebo chemických vlastností;prostředky (100, 130) pro identifikování v uvedené databázi podskupiny molekul majících danou biologickou a/nebo chemickou vlastnost;prostředky (100, 130, 135) pro stanovení fragmentů molekul v uvedené podskupině;prostředky (100, 130, 140) pro vypočítání pro každý fragment hodnoty skóre, indikující příspěvek příslušného fragmentu k uvedené dané biologické a/nebo chemické vlastnosti; a prostředky )100, 130) pro stanovení, zda má být provedeno opakování procesu, a pokud ano pro analyzování stanovených fragmentů a vypočítaných hodnot skóre a pro provedení procesu opakování.
- 21. Počítačový systém podle nároku 20, vyznačující se tím, že je uspořádán pro provedení způsobu podle jednoho z nároků 1 až 17.
- 22. Léková sloučenina získaná sestavením molekuly obsahující alespoň jeden fragment stanovený provedením způsobu podle jednoho z nároků 1 až 17.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP00309114 | 2000-10-17 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CZ20031090A3 true CZ20031090A3 (cs) | 2004-01-14 |
Family
ID=8173320
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CZ20031090A CZ20031090A3 (cs) | 2000-10-17 | 2001-10-16 | Způsob provozování počítačového systému pro provádění diskrétní podstrukturní analýzy |
Country Status (23)
| Country | Link |
|---|---|
| US (1) | US20040083060A1 (cs) |
| EP (1) | EP1366440A2 (cs) |
| JP (2) | JP2004512603A (cs) |
| KR (1) | KR20030059196A (cs) |
| CN (1) | CN1264110C (cs) |
| AU (2) | AU1502802A (cs) |
| BG (1) | BG107717A (cs) |
| BR (1) | BR0114987A (cs) |
| CA (1) | CA2423672A1 (cs) |
| CZ (1) | CZ20031090A3 (cs) |
| EA (1) | EA005286B1 (cs) |
| EE (1) | EE200300150A (cs) |
| HR (1) | HRP20030240A2 (cs) |
| HU (1) | HUP0302507A3 (cs) |
| IL (1) | IL155332A0 (cs) |
| MX (1) | MXPA03003422A (cs) |
| NO (1) | NO20031730D0 (cs) |
| PL (1) | PL364772A1 (cs) |
| SK (1) | SK4682003A3 (cs) |
| UA (1) | UA79231C2 (cs) |
| WO (1) | WO2002033596A2 (cs) |
| YU (1) | YU25603A (cs) |
| ZA (1) | ZA200302395B (cs) |
Families Citing this family (24)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2005069188A1 (ja) * | 2003-12-26 | 2005-07-28 | Dainippon Sumitomo Pharma Co., Ltd. | 化合物および蛋白質間の相互作用を予測するシステム |
| EP1721268A1 (en) * | 2004-03-05 | 2006-11-15 | Applied Research Systems ARS Holding N.V. | Method for fast substructure searching in non-enumerated chemical libraries |
| JP2006090733A (ja) * | 2004-09-21 | 2006-04-06 | Fuji Photo Film Co Ltd | 化合物抽出装置およびプログラム |
| EP1762954B1 (en) * | 2005-08-01 | 2019-08-21 | F.Hoffmann-La Roche Ag | Automated generation of multi-dimensional structure activity and structure property relationships |
| JP5512077B2 (ja) * | 2006-11-22 | 2014-06-04 | 株式会社 資生堂 | 安全性評価方法、安全性評価システム及び安全性評価プログラム |
| CN102282560B (zh) * | 2008-12-05 | 2015-08-19 | 狄克雷佩特公司 | 用于产生马库什结构专利权利要求内的虚拟化合物链接库的方法 |
| CN102043864A (zh) * | 2010-12-30 | 2011-05-04 | 中山大学 | 中药心血管毒性分析的计算机操作方法及其系统 |
| WO2012139421A1 (zh) * | 2011-04-11 | 2012-10-18 | Yan Jingbo | 多维矩阵用于药物分子设计的应用及药物分子设计方法 |
| CN102262715B (zh) * | 2011-06-01 | 2013-09-11 | 山东大学 | Bcl-2蛋白抑制剂三维定量构效关系模型的构建方法及应用 |
| ES2392915B1 (es) * | 2011-06-03 | 2013-09-13 | Univ Sevilla | Compuestos bioactivos polifenolicos conteniendo azufre o selenio y sus usos |
| WO2014047463A2 (en) * | 2012-09-22 | 2014-03-27 | Bioblocks, Inc. | Libraries of compounds having desired properties and methods for making and using them |
| CN103049674A (zh) * | 2013-01-26 | 2013-04-17 | 北京东方灵盾科技有限公司 | 一种化学药物hERG钾离子通道阻断作用的定性预测方法及其系统 |
| US9799006B2 (en) | 2013-10-08 | 2017-10-24 | Baker Hughes Incorporated | Methods, systems and computer program products for chemical hazard evaluation |
| US9424517B2 (en) | 2013-10-08 | 2016-08-23 | Baker Hughes Incorporated | Methods, systems and computer program products for chemical hazard evaluation |
| CN107532192B (zh) * | 2015-05-07 | 2023-07-14 | 肯塔基大学研究基金会 | 用于设计靶向高化学计量复合物从而治疗疾病的化合物和组合物的方法 |
| EP3206145A1 (en) * | 2016-02-09 | 2017-08-16 | InnovativeHealth Group SL | Method for producing a topical dermal formulation for cosmetic use |
| EP3646250A1 (en) * | 2017-05-30 | 2020-05-06 | GTN Ltd | Tensor network machine learning system |
| WO2019079580A1 (en) | 2017-10-19 | 2019-04-25 | Schrodinger, Inc. | PREDICTING AN ACTIVE ASSEMBLY OF COMPOUNDS HAVING ALTERNATIVE HEARTS |
| US12087409B2 (en) | 2018-09-13 | 2024-09-10 | Cyclica Inc. | Method and system for predicting properties of chemical structures |
| JP7191969B2 (ja) * | 2018-09-14 | 2022-12-19 | 富士フイルム株式会社 | 化合物の合成適性の評価方法、化合物の合成適性の評価プログラム及び化合物の合成適性の評価装置 |
| US11580275B1 (en) * | 2018-12-18 | 2023-02-14 | X Development Llc | Experimental discovery processes |
| EP3712897A1 (en) * | 2019-03-22 | 2020-09-23 | Tata Consultancy Services Limited | Automated prediction of biological response of chemical compounds based on chemical information |
| CN110728078B (zh) * | 2019-11-14 | 2022-11-25 | 吉林大学 | 一种基于胶粘剂化学特性的粘接结构在全服役温度区间下的力学性能的预测方法 |
| CN111354424B (zh) * | 2020-02-27 | 2023-06-23 | 北京晶泰科技有限公司 | 一种潜在活性分子的预测方法、装置和计算设备 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6081766A (en) * | 1993-05-21 | 2000-06-27 | Axys Pharmaceuticals, Inc. | Machine-learning approach to modeling biological activity for molecular design and to modeling other characteristics |
| US5463564A (en) * | 1994-09-16 | 1995-10-31 | 3-Dimensional Pharmaceuticals, Inc. | System and method of automatically generating chemical compounds with desired properties |
| WO2000049539A1 (en) * | 1999-02-19 | 2000-08-24 | Bioreason, Inc. | Method and system for artificial intelligence directed lead discovery through multi-domain clustering |
| AU4565600A (en) * | 1999-06-18 | 2001-01-09 | Synt:Em (S.A.) | Identifying active molecules using physico-chemical parameters |
-
2001
- 2001-10-16 ZA ZA200302395A patent/ZA200302395B/en unknown
- 2001-10-16 MX MXPA03003422A patent/MXPA03003422A/es active IP Right Grant
- 2001-10-16 BR BR0114987-3A patent/BR0114987A/pt not_active Application Discontinuation
- 2001-10-16 AU AU1502802A patent/AU1502802A/xx active Pending
- 2001-10-16 CA CA002423672A patent/CA2423672A1/en not_active Abandoned
- 2001-10-16 WO PCT/EP2001/011955 patent/WO2002033596A2/en not_active Ceased
- 2001-10-16 KR KR10-2003-7005331A patent/KR20030059196A/ko not_active Ceased
- 2001-10-16 HR HR20030240A patent/HRP20030240A2/hr not_active Application Discontinuation
- 2001-10-16 JP JP2002536914A patent/JP2004512603A/ja not_active Withdrawn
- 2001-10-16 UA UA2003043420A patent/UA79231C2/uk unknown
- 2001-10-16 IL IL15533201A patent/IL155332A0/xx unknown
- 2001-10-16 US US10/399,329 patent/US20040083060A1/en not_active Abandoned
- 2001-10-16 HU HU0302507A patent/HUP0302507A3/hu unknown
- 2001-10-16 EA EA200300475A patent/EA005286B1/ru not_active IP Right Cessation
- 2001-10-16 EE EEP200300150A patent/EE200300150A/xx unknown
- 2001-10-16 PL PL01364772A patent/PL364772A1/xx not_active Application Discontinuation
- 2001-10-16 SK SK468-2003A patent/SK4682003A3/sk not_active Application Discontinuation
- 2001-10-16 CN CNB018207227A patent/CN1264110C/zh not_active Expired - Fee Related
- 2001-10-16 YU YU25603A patent/YU25603A/sh unknown
- 2001-10-16 AU AU2002215028A patent/AU2002215028B2/en not_active Ceased
- 2001-10-16 CZ CZ20031090A patent/CZ20031090A3/cs unknown
- 2001-10-16 EP EP01983556A patent/EP1366440A2/en not_active Withdrawn
-
2003
- 2003-04-10 BG BG107717A patent/BG107717A/bg unknown
- 2003-04-14 NO NO20031730A patent/NO20031730D0/no not_active Application Discontinuation
-
2006
- 2006-12-04 JP JP2006327405A patent/JP2007137887A/ja active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| US20040083060A1 (en) | 2004-04-29 |
| ZA200302395B (en) | 2004-03-29 |
| EE200300150A (et) | 2003-08-15 |
| HUP0302507A2 (hu) | 2003-11-28 |
| AU2002215028B2 (en) | 2007-11-15 |
| JP2004512603A (ja) | 2004-04-22 |
| CN1493051A (zh) | 2004-04-28 |
| BR0114987A (pt) | 2004-02-03 |
| WO2002033596A2 (en) | 2002-04-25 |
| HRP20030240A2 (en) | 2005-02-28 |
| HK1061911A1 (en) | 2004-10-08 |
| NO20031730L (no) | 2003-04-14 |
| PL364772A1 (en) | 2004-12-13 |
| NO20031730D0 (no) | 2003-04-14 |
| SK4682003A3 (en) | 2003-12-02 |
| AU1502802A (en) | 2002-04-29 |
| EP1366440A2 (en) | 2003-12-03 |
| YU25603A (sh) | 2005-07-19 |
| MXPA03003422A (es) | 2004-05-04 |
| EA005286B1 (ru) | 2004-12-30 |
| HUP0302507A3 (en) | 2004-05-28 |
| CN1264110C (zh) | 2006-07-12 |
| WO2002033596A3 (en) | 2003-10-02 |
| BG107717A (bg) | 2004-01-30 |
| IL155332A0 (en) | 2003-11-23 |
| EA200300475A1 (ru) | 2003-10-30 |
| KR20030059196A (ko) | 2003-07-07 |
| CA2423672A1 (en) | 2002-04-25 |
| JP2007137887A (ja) | 2007-06-07 |
| UA79231C2 (en) | 2007-06-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CZ20031090A3 (cs) | Způsob provozování počítačového systému pro provádění diskrétní podstrukturní analýzy | |
| Basith et al. | Machine intelligence in peptide therapeutics: A next‐generation tool for rapid disease screening | |
| AU2002215028A1 (en) | Method of operating a computer system to perform a discrete substructural analysis | |
| Korb et al. | Potential and limitations of ensemble docking | |
| Oliver et al. | Functional genomics: high-throughput mRNA, protein, and metabolite analyses | |
| Martí-Renom et al. | Comparative protein structure modeling of genes and genomes | |
| Gschwend et al. | Molecular docking towards drug discovery | |
| Yu et al. | Tandem mass spectrometry molecular networking as a powerful and efficient tool for drug metabolism studies | |
| von Korff et al. | Comparison of ligand-and structure-based virtual screening on the DUD data set | |
| US5741653A (en) | Profiling reference panel enriched by non-Ig proteins | |
| Al-Barakati et al. | RF-GlutarySite: a random forest based predictor for glutarylation sites | |
| EP1326177A1 (en) | Method of forming molecular function network | |
| Beroza et al. | Chemoproteomics as a basis for post-genomic drug discovery | |
| US20060106545A1 (en) | Methods of clustering proteins | |
| Gerault et al. | IMPRINTS. CETSA and IMPRINTS. CETSA. app: an R package and a Shiny application for the analysis and interpretation of IMPRINTS-CETSA data | |
| Beroza et al. | Target-related affinity profiling: Telik's lead discovery technology | |
| EP1360560A2 (en) | Receptor selectivity mapping | |
| Liu et al. | An integrated multi-label classifier with chemical-chemical interactions for prediction of chemical toxicity effects | |
| JP4688467B2 (ja) | 受容体−リガンド安定複合体構造探索方法 | |
| Fitriawan et al. | Multi-label classification using deep belief networks for virtual screening of multi-target drug | |
| Young et al. | Pediatric proteomics: an introduction | |
| US20060235624A1 (en) | System reconstruction: integrative analysis of biological data | |
| Laggner et al. | Pharmacophore-based virtual screening in drug discovery | |
| Bradshaw | Proteomics today, proteomics tomorrow | |
| Hsueh et al. | Accelerated ensemble generation for cyclic peptides using a Reservoir-REMD implementation in GROMACS |