JP2022550550A - インシリコで化合物をスクリーニングするためのシステムおよび方法 - Google Patents
インシリコで化合物をスクリーニングするためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2022550550A JP2022550550A JP2022519999A JP2022519999A JP2022550550A JP 2022550550 A JP2022550550 A JP 2022550550A JP 2022519999 A JP2022519999 A JP 2022519999A JP 2022519999 A JP2022519999 A JP 2022519999A JP 2022550550 A JP2022550550 A JP 2022550550A
- Authority
- JP
- Japan
- Prior art keywords
- subjects
- target
- subject
- subset
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 195
- 150000001875 compounds Chemical class 0.000 title claims description 83
- 238000000126 in silico method Methods 0.000 title description 8
- 238000012216 screening Methods 0.000 title description 8
- 230000009467 reduction Effects 0.000 claims abstract description 37
- 239000013598 vector Substances 0.000 claims description 131
- 238000004422 calculation algorithm Methods 0.000 claims description 71
- 229920000642 polymer Polymers 0.000 claims description 57
- 230000006870 function Effects 0.000 claims description 45
- 238000004458 analytical method Methods 0.000 claims description 40
- 238000012549 training Methods 0.000 claims description 37
- 108090000623 proteins and genes Proteins 0.000 claims description 36
- 102000004169 proteins and genes Human genes 0.000 claims description 36
- 230000003993 interaction Effects 0.000 claims description 33
- 238000003032 molecular docking Methods 0.000 claims description 31
- 238000013528 artificial neural network Methods 0.000 claims description 30
- 238000013527 convolutional neural network Methods 0.000 claims description 25
- 238000011156 evaluation Methods 0.000 claims description 22
- 230000001419 dependent effect Effects 0.000 claims description 21
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 20
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 18
- 238000012417 linear regression Methods 0.000 claims description 16
- 238000003860 storage Methods 0.000 claims description 16
- 229920001184 polypeptide Polymers 0.000 claims description 14
- 238000007637 random forest analysis Methods 0.000 claims description 13
- 238000012706 support-vector machine Methods 0.000 claims description 13
- 230000002068 genetic effect Effects 0.000 claims description 12
- 238000003064 k means clustering Methods 0.000 claims description 12
- 238000003066 decision tree Methods 0.000 claims description 11
- 238000007477 logistic regression Methods 0.000 claims description 8
- 238000000513 principal component analysis Methods 0.000 claims description 8
- 239000000654 additive Substances 0.000 claims description 5
- 230000000996 additive effect Effects 0.000 claims description 5
- 150000004676 glycans Chemical class 0.000 claims description 5
- 229920001282 polysaccharide Polymers 0.000 claims description 5
- 239000005017 polysaccharide Substances 0.000 claims description 5
- 238000012614 Monte-Carlo sampling Methods 0.000 claims description 4
- 239000002253 acid Substances 0.000 claims description 4
- 150000007513 acids Chemical class 0.000 claims description 4
- 108091033319 polynucleotide Proteins 0.000 claims description 4
- 102000040430 polynucleotide Human genes 0.000 claims description 4
- 238000002922 simulated annealing Methods 0.000 claims description 4
- 238000005481 NMR spectroscopy Methods 0.000 claims description 3
- 238000001493 electron microscopy Methods 0.000 claims description 3
- 238000001683 neutron diffraction Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims 3
- 239000010410 layer Substances 0.000 description 139
- 125000004429 atom Chemical group 0.000 description 65
- -1 cyclic hydrocarbon radical Chemical class 0.000 description 46
- 230000000694 effects Effects 0.000 description 43
- 230000027455 binding Effects 0.000 description 36
- 239000000126 substance Substances 0.000 description 33
- 235000018102 proteins Nutrition 0.000 description 29
- 125000003118 aryl group Chemical group 0.000 description 28
- 238000012360 testing method Methods 0.000 description 28
- 238000007876 drug discovery Methods 0.000 description 27
- 230000004913 activation Effects 0.000 description 26
- 238000001994 activation Methods 0.000 description 26
- 239000003814 drug Substances 0.000 description 23
- 125000000217 alkyl group Chemical group 0.000 description 22
- 229940079593 drug Drugs 0.000 description 20
- 125000001424 substituent group Chemical group 0.000 description 20
- 125000001072 heteroaryl group Chemical group 0.000 description 18
- 235000001014 amino acid Nutrition 0.000 description 15
- 150000001413 amino acids Chemical class 0.000 description 15
- 238000011176 pooling Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 14
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 12
- 210000004027 cell Anatomy 0.000 description 12
- 239000003446 ligand Substances 0.000 description 12
- 229910052757 nitrogen Inorganic materials 0.000 description 12
- 241000264877 Hippospongia communis Species 0.000 description 11
- 229920001577 copolymer Polymers 0.000 description 11
- 125000004404 heteroalkyl group Chemical group 0.000 description 11
- 125000005842 heteroatom Chemical group 0.000 description 11
- 238000013459 approach Methods 0.000 description 10
- 229910052799 carbon Inorganic materials 0.000 description 10
- 230000007717 exclusion Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 125000000592 heterocycloalkyl group Chemical group 0.000 description 9
- 229910052739 hydrogen Inorganic materials 0.000 description 9
- 238000000329 molecular dynamics simulation Methods 0.000 description 9
- 229910052760 oxygen Inorganic materials 0.000 description 9
- 230000004044 response Effects 0.000 description 9
- 239000004094 surface-active agent Substances 0.000 description 9
- 238000013526 transfer learning Methods 0.000 description 9
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 8
- 238000013461 design Methods 0.000 description 8
- 239000001257 hydrogen Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 229910052717 sulfur Inorganic materials 0.000 description 8
- 125000004432 carbon atom Chemical group C* 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 238000011049 filling Methods 0.000 description 7
- 229910052736 halogen Inorganic materials 0.000 description 7
- 150000002390 heteroarenes Chemical group 0.000 description 7
- 210000002569 neuron Anatomy 0.000 description 7
- 238000005070 sampling Methods 0.000 description 7
- 231100000419 toxicity Toxicity 0.000 description 7
- 230000001988 toxicity Effects 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- 125000002947 alkylene group Chemical group 0.000 description 6
- 229910052801 chlorine Inorganic materials 0.000 description 6
- 125000004122 cyclic group Chemical group 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 150000002367 halogens Chemical class 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 150000003254 radicals Chemical class 0.000 description 6
- 229910052710 silicon Inorganic materials 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 125000000753 cycloalkyl group Chemical group 0.000 description 5
- 125000004474 heteroalkylene group Chemical group 0.000 description 5
- 238000011312 in silico drug discovery Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000002085 persistent effect Effects 0.000 description 5
- 239000000575 pesticide Substances 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 229910052725 zinc Inorganic materials 0.000 description 5
- 239000011701 zinc Substances 0.000 description 5
- XMWRBQBLMFGWIX-UHFFFAOYSA-N C60 fullerene Chemical group C12=C3C(C4=C56)=C7C8=C5C5=C9C%10=C6C6=C4C1=C1C4=C6C6=C%10C%10=C9C9=C%11C5=C8C5=C8C7=C3C3=C7C2=C1C1=C2C4=C6C4=C%10C6=C9C9=C%11C5=C5C8=C3C3=C7C1=C1C2=C4C6=C2C9=C5C3=C12 XMWRBQBLMFGWIX-UHFFFAOYSA-N 0.000 description 4
- 239000012491 analyte Substances 0.000 description 4
- 239000000460 chlorine Substances 0.000 description 4
- 125000001309 chloro group Chemical group Cl* 0.000 description 4
- 238000000205 computational method Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 229940000406 drug candidate Drugs 0.000 description 4
- 229910003472 fullerene Inorganic materials 0.000 description 4
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 4
- 239000003112 inhibitor Substances 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 239000002547 new drug Substances 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 239000003921 oil Substances 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 238000005192 partition Methods 0.000 description 4
- 229910052698 phosphorus Inorganic materials 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 229920006395 saturated elastomer Polymers 0.000 description 4
- 238000003041 virtual screening Methods 0.000 description 4
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 3
- 125000002252 acyl group Chemical group 0.000 description 3
- 230000002411 adverse Effects 0.000 description 3
- 125000003545 alkoxy group Chemical group 0.000 description 3
- 230000002547 anomalous effect Effects 0.000 description 3
- 125000003710 aryl alkyl group Chemical group 0.000 description 3
- 125000004104 aryloxy group Chemical group 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 208000018747 cerebellar ataxia with neuropathy and bilateral vestibular areflexia syndrome Diseases 0.000 description 3
- 238000007418 data mining Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 239000010931 gold Substances 0.000 description 3
- 229910052737 gold Inorganic materials 0.000 description 3
- 125000005843 halogen group Chemical group 0.000 description 3
- 229920001519 homopolymer Polymers 0.000 description 3
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 3
- 150000002611 lead compounds Chemical class 0.000 description 3
- 125000005647 linker group Chemical group 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 238000007620 mathematical function Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000001537 neural effect Effects 0.000 description 3
- 125000004433 nitrogen atom Chemical group N* 0.000 description 3
- 150000002894 organic compounds Chemical group 0.000 description 3
- 125000002524 organometallic group Chemical group 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 125000004430 oxygen atom Chemical group O* 0.000 description 3
- 238000003909 pattern recognition Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 150000003384 small molecules Chemical class 0.000 description 3
- 238000003033 structure based virtual screening Methods 0.000 description 3
- 125000004434 sulfur atom Chemical group 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- OGNSCSPNOLGXSM-UHFFFAOYSA-N (+/-)-DABA Natural products NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 2
- FDKWRPBBCBCIGA-REOHCLBHSA-N (2r)-2-azaniumyl-3-$l^{1}-selanylpropanoate Chemical compound [Se]C[C@H](N)C(O)=O FDKWRPBBCBCIGA-REOHCLBHSA-N 0.000 description 2
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 2
- VSKJLJHPAFKHBX-UHFFFAOYSA-N 2-methylbuta-1,3-diene;styrene Chemical compound CC(=C)C=C.C=CC1=CC=CC=C1.C=CC1=CC=CC=C1 VSKJLJHPAFKHBX-UHFFFAOYSA-N 0.000 description 2
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 2
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 description 2
- ZAKOWWREFLAJOT-CEFNRUSXSA-N D-alpha-tocopherylacetate Chemical compound CC(=O)OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C ZAKOWWREFLAJOT-CEFNRUSXSA-N 0.000 description 2
- UQBOJOOOTLPNST-UHFFFAOYSA-N Dehydroalanine Chemical compound NC(=C)C(O)=O UQBOJOOOTLPNST-UHFFFAOYSA-N 0.000 description 2
- 108091005942 ECFP Proteins 0.000 description 2
- 241001115402 Ebolavirus Species 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 2
- SIKJAQJRHWYJAI-UHFFFAOYSA-N Indole Chemical compound C1=CC=C2NC=CC2=C1 SIKJAQJRHWYJAI-UHFFFAOYSA-N 0.000 description 2
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- RHGKLRLOHDJJDR-BYPYZUCNSA-N L-citrulline Chemical compound NC(=O)NCCC[C@H]([NH3+])C([O-])=O RHGKLRLOHDJJDR-BYPYZUCNSA-N 0.000 description 2
- FFFHZYDWPBMWHY-VKHMYHEASA-N L-homocysteine Chemical compound OC(=O)[C@@H](N)CCS FFFHZYDWPBMWHY-VKHMYHEASA-N 0.000 description 2
- DWPCPZJAHOETAG-IMJSIDKUSA-N L-lanthionine Chemical compound OC(=O)[C@@H](N)CSC[C@H](N)C(O)=O DWPCPZJAHOETAG-IMJSIDKUSA-N 0.000 description 2
- 238000000342 Monte Carlo simulation Methods 0.000 description 2
- UFWIBTONFRDIAS-UHFFFAOYSA-N Naphthalene Chemical compound C1=CC=CC2=CC=CC=C21 UFWIBTONFRDIAS-UHFFFAOYSA-N 0.000 description 2
- RHGKLRLOHDJJDR-UHFFFAOYSA-N Ndelta-carbamoyl-DL-ornithine Natural products OC(=O)C(N)CCCNC(N)=O RHGKLRLOHDJJDR-UHFFFAOYSA-N 0.000 description 2
- 102000015636 Oligopeptides Human genes 0.000 description 2
- 108010038807 Oligopeptides Proteins 0.000 description 2
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 2
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 102100029212 Putative tetratricopeptide repeat protein 41 Human genes 0.000 description 2
- SMWDFEZZVXVKRB-UHFFFAOYSA-N Quinoline Chemical compound N1=CC=CC2=CC=CC=C21 SMWDFEZZVXVKRB-UHFFFAOYSA-N 0.000 description 2
- 101500010382 Zika virus RNA-directed RNA polymerase NS5 Proteins 0.000 description 2
- 239000000370 acceptor Substances 0.000 description 2
- 125000003282 alkyl amino group Chemical group 0.000 description 2
- 125000004414 alkyl thio group Chemical group 0.000 description 2
- 239000008346 aqueous phase Substances 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 230000000712 assembly Effects 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 230000000975 bioactive effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 229920001400 block copolymer Polymers 0.000 description 2
- 229910052796 boron Inorganic materials 0.000 description 2
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Chemical compound BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 2
- 229910052794 bromium Inorganic materials 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 229960002173 citrulline Drugs 0.000 description 2
- 235000013477 citrulline Nutrition 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 2
- 239000000412 dendrimer Substances 0.000 description 2
- 229920000736 dendritic polymer Polymers 0.000 description 2
- 238000004807 desolvation Methods 0.000 description 2
- 230000000368 destabilizing effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 2
- 238000009509 drug development Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 229930003935 flavonoid Natural products 0.000 description 2
- 150000002215 flavonoids Chemical class 0.000 description 2
- 235000017173 flavonoids Nutrition 0.000 description 2
- 229910052731 fluorine Inorganic materials 0.000 description 2
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 125000001188 haloalkyl group Chemical group 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 125000005553 heteroaryloxy group Chemical group 0.000 description 2
- 125000001165 hydrophobic group Chemical group 0.000 description 2
- 229960002591 hydroxyproline Drugs 0.000 description 2
- 125000001841 imino group Chemical group [H]N=* 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 229910052740 iodine Inorganic materials 0.000 description 2
- 239000002563 ionic surfactant Substances 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- DWPCPZJAHOETAG-UHFFFAOYSA-N meso-lanthionine Natural products OC(=O)C(N)CSCC(N)C(O)=O DWPCPZJAHOETAG-UHFFFAOYSA-N 0.000 description 2
- 229910021645 metal ion Inorganic materials 0.000 description 2
- 239000000693 micelle Substances 0.000 description 2
- 230000009149 molecular binding Effects 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 2
- 229920005615 natural polymer Polymers 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 229960003104 ornithine Drugs 0.000 description 2
- 239000000816 peptidomimetic Substances 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000010287 polarization Effects 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 230000004850 protein–protein interaction Effects 0.000 description 2
- 230000005588 protonation Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 description 2
- 229940055619 selenocysteine Drugs 0.000 description 2
- 235000016491 selenocysteine Nutrition 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000000087 stabilizing effect Effects 0.000 description 2
- 125000005309 thioalkoxy group Chemical group 0.000 description 2
- 238000012876 topography Methods 0.000 description 2
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000001742 trypanosomicidal effect Effects 0.000 description 2
- 125000004417 unsaturated alkyl group Chemical group 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 238000002424 x-ray crystallography Methods 0.000 description 2
- 125000004178 (C1-C4) alkyl group Chemical group 0.000 description 1
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 1
- 125000001637 1-naphthyl group Chemical group [H]C1=C([H])C([H])=C2C(*)=C([H])C([H])=C([H])C2=C1[H] 0.000 description 1
- 125000004214 1-pyrrolidinyl group Chemical group [H]C1([H])N(*)C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 125000001462 1-pyrrolyl group Chemical group [*]N1C([H])=C([H])C([H])=C1[H] 0.000 description 1
- KJUGUADJHNHALS-UHFFFAOYSA-N 1H-tetrazole Substances C=1N=NNN=1 KJUGUADJHNHALS-UHFFFAOYSA-N 0.000 description 1
- 125000004206 2,2,2-trifluoroethyl group Chemical group [H]C([H])(*)C(F)(F)F 0.000 description 1
- 125000004174 2-benzimidazolyl group Chemical group [H]N1C(*)=NC2=C([H])C([H])=C([H])C([H])=C12 0.000 description 1
- 125000002941 2-furyl group Chemical group O1C([*])=C([H])C([H])=C1[H] 0.000 description 1
- 125000001622 2-naphthyl group Chemical group [H]C1=C([H])C([H])=C2C([H])=C(*)C([H])=C([H])C2=C1[H] 0.000 description 1
- 125000000094 2-phenylethyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- 125000004105 2-pyridyl group Chemical group N1=C([*])C([H])=C([H])C([H])=C1[H] 0.000 description 1
- 125000000389 2-pyrrolyl group Chemical group [H]N1C([*])=C([H])C([H])=C1[H] 0.000 description 1
- 125000000175 2-thienyl group Chemical group S1C([*])=C([H])C([H])=C1[H] 0.000 description 1
- 125000000474 3-butynyl group Chemical group [H]C#CC([H])([H])C([H])([H])* 0.000 description 1
- 125000003682 3-furyl group Chemical group O1C([H])=C([*])C([H])=C1[H] 0.000 description 1
- 125000003349 3-pyridyl group Chemical group N1=C([H])C([*])=C([H])C([H])=C1[H] 0.000 description 1
- 125000001397 3-pyrrolyl group Chemical group [H]N1C([H])=C([*])C([H])=C1[H] 0.000 description 1
- 125000001541 3-thienyl group Chemical group S1C([H])=C([*])C([H])=C1[H] 0.000 description 1
- KDDQRKBRJSGMQE-UHFFFAOYSA-N 4-thiazolyl Chemical group [C]1=CSC=N1 KDDQRKBRJSGMQE-UHFFFAOYSA-N 0.000 description 1
- ODHCTXKNWHHXJC-VKHMYHEASA-N 5-oxo-L-proline Chemical compound OC(=O)[C@@H]1CCC(=O)N1 ODHCTXKNWHHXJC-VKHMYHEASA-N 0.000 description 1
- CWDWFSXUQODZGW-UHFFFAOYSA-N 5-thiazolyl Chemical group [C]1=CN=CS1 CWDWFSXUQODZGW-UHFFFAOYSA-N 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical group [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- 230000035502 ADME Effects 0.000 description 1
- 241000256837 Apidae Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 229920001342 Bakelite® Polymers 0.000 description 1
- 241000219495 Betulaceae Species 0.000 description 1
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- KZBUYRJDOAKODT-UHFFFAOYSA-N Chlorine Chemical compound ClCl KZBUYRJDOAKODT-UHFFFAOYSA-N 0.000 description 1
- 241000254171 Curculionidae Species 0.000 description 1
- 102000002004 Cytochrome P-450 Enzyme System Human genes 0.000 description 1
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 1
- 101000650134 Homo sapiens WAS/WASL-interacting protein family member 2 Proteins 0.000 description 1
- 241000534431 Hygrocybe pratensis Species 0.000 description 1
- 230000006133 ISGylation Effects 0.000 description 1
- 238000006165 Knowles reaction Methods 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 102000005741 Metalloproteases Human genes 0.000 description 1
- 108010006035 Metalloproteases Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 229920000459 Nitrile rubber Polymers 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 229910003849 O-Si Inorganic materials 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- CBENFWSGALASAD-UHFFFAOYSA-N Ozone Chemical compound [O-][O+]=O CBENFWSGALASAD-UHFFFAOYSA-N 0.000 description 1
- 229910003872 O—Si Inorganic materials 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- ODHCTXKNWHHXJC-GSVOUGTGSA-N Pyroglutamic acid Natural products OC(=O)[C@H]1CCC(=O)N1 ODHCTXKNWHHXJC-GSVOUGTGSA-N 0.000 description 1
- 208000027066 STING-associated vasculopathy with onset in infancy Diseases 0.000 description 1
- 241000555745 Sciuridae Species 0.000 description 1
- 229920001800 Shellac Polymers 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 206010047281 Ventricular arrhythmia Diseases 0.000 description 1
- 102100027540 WAS/WASL-interacting protein family member 2 Human genes 0.000 description 1
- 208000020329 Zika virus infectious disease Diseases 0.000 description 1
- 238000000367 ab initio method Methods 0.000 description 1
- ODHCTXKNWHHXJC-UHFFFAOYSA-N acide pyroglutamique Natural products OC(=O)C1CCC(=O)N1 ODHCTXKNWHHXJC-UHFFFAOYSA-N 0.000 description 1
- 229920000122 acrylonitrile butadiene styrene Polymers 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 239000003905 agrochemical Substances 0.000 description 1
- 150000001335 aliphatic alkanes Chemical class 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 230000029936 alkylation Effects 0.000 description 1
- 238000005804 alkylation reaction Methods 0.000 description 1
- 125000005237 alkyleneamino group Chemical group 0.000 description 1
- 125000005238 alkylenediamino group Chemical group 0.000 description 1
- 125000005530 alkylenedioxy group Chemical group 0.000 description 1
- 125000005529 alkyleneoxy group Chemical group 0.000 description 1
- 125000000304 alkynyl group Chemical group 0.000 description 1
- HSFWRNGVRCDJHI-UHFFFAOYSA-N alpha-acetylene Natural products C#C HSFWRNGVRCDJHI-UHFFFAOYSA-N 0.000 description 1
- 229920005603 alternating copolymer Polymers 0.000 description 1
- 229920002892 amber Polymers 0.000 description 1
- 239000004855 amber Substances 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 239000003945 anionic surfactant Substances 0.000 description 1
- 230000010516 arginylation Effects 0.000 description 1
- 125000005165 aryl thioxy group Chemical group 0.000 description 1
- 239000004637 bakelite Substances 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008236 biological pathway Effects 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000006287 biotinylation Effects 0.000 description 1
- 238000007413 biotinylation Methods 0.000 description 1
- 125000000319 biphenyl-4-yl group Chemical group [H]C1=C([H])C([H])=C([H])C([H])=C1C1=C([H])C([H])=C([*])C([H])=C1[H] 0.000 description 1
- DQXBYHZEEUGOBF-UHFFFAOYSA-N but-3-enoic acid;ethene Chemical compound C=C.OC(=O)CC=C DQXBYHZEEUGOBF-UHFFFAOYSA-N 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 150000001721 carbon Chemical group 0.000 description 1
- 239000002041 carbon nanotube Substances 0.000 description 1
- 229910021393 carbon nanotube Inorganic materials 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 150000001735 carboxylic acids Chemical class 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003093 cationic surfactant Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- QZHPTGXQGDFGEN-UHFFFAOYSA-N chromene Chemical compound C1=CC=C2C=C[CH]OC2=C1 QZHPTGXQGDFGEN-UHFFFAOYSA-N 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007334 copolymerization reaction Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 125000000392 cycloalkenyl group Chemical group 0.000 description 1
- 125000000582 cycloheptyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 1
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000004186 cyclopropylmethyl group Chemical group [H]C([H])(*)C1([H])C([H])([H])C1([H])[H] 0.000 description 1
- 238000011157 data evaluation Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 230000006240 deamidation Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000005595 deprotonation Effects 0.000 description 1
- 238000010537 deprotonation reaction Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 125000005331 diazinyl group Chemical group N1=NC(=CC=C1)* 0.000 description 1
- 229920000359 diblock copolymer Polymers 0.000 description 1
- 238000002050 diffraction method Methods 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 238000012912 drug discovery process Methods 0.000 description 1
- 230000008406 drug-drug interaction Effects 0.000 description 1
- 229920001971 elastomer Polymers 0.000 description 1
- 239000000806 elastomer Substances 0.000 description 1
- 238000004836 empirical method Methods 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 150000002081 enamines Chemical class 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 239000005038 ethylene vinyl acetate Substances 0.000 description 1
- 125000002534 ethynyl group Chemical group [H]C#C* 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 239000011737 fluorine Substances 0.000 description 1
- 239000004088 foaming agent Substances 0.000 description 1
- 230000022244 formylation Effects 0.000 description 1
- 238000006170 formylation reaction Methods 0.000 description 1
- 230000006251 gamma-carboxylation Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000006237 glutamylation Effects 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 230000006238 glycylation Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 229910002804 graphite Inorganic materials 0.000 description 1
- 239000010439 graphite Substances 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 125000004366 heterocycloalkenyl group Chemical group 0.000 description 1
- 229920000140 heteropolymer Polymers 0.000 description 1
- 150000002430 hydrocarbons Chemical group 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 230000003116 impacting effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- PZOUSPYUWWUPPK-UHFFFAOYSA-N indole Natural products CC1=CC=CC2=C1C=CN2 PZOUSPYUWWUPPK-UHFFFAOYSA-N 0.000 description 1
- RKJUIXBNRJVNHR-UHFFFAOYSA-N indolenine Natural products C1=CC=C2CC=NC2=C1 RKJUIXBNRJVNHR-UHFFFAOYSA-N 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000003970 interatomic potential Methods 0.000 description 1
- 230000009878 intermolecular interaction Effects 0.000 description 1
- 230000026045 iodination Effects 0.000 description 1
- 238000006192 iodination reaction Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000006122 isoprenylation Effects 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000006144 lipoylation Effects 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- HRDXJKGNWSUIBT-UHFFFAOYSA-N methoxybenzene Chemical group [CH2]OC1=CC=CC=C1 HRDXJKGNWSUIBT-UHFFFAOYSA-N 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 125000001570 methylene group Chemical group [H]C([H])([*:1])[*:2] 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000000324 molecular mechanic Methods 0.000 description 1
- 239000002062 molecular scaffold Substances 0.000 description 1
- 125000002950 monocyclic group Chemical group 0.000 description 1
- 125000006682 monohaloalkyl group Chemical group 0.000 description 1
- 125000004572 morpholin-3-yl group Chemical group N1C(COCC1)* 0.000 description 1
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000003136 n-heptyl group Chemical class [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000001280 n-hexyl group Chemical class C(CCCCC)* 0.000 description 1
- 125000000740 n-pentyl group Chemical class [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000004123 n-propyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 229920003052 natural elastomer Polymers 0.000 description 1
- 239000005445 natural material Substances 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 229920001194 natural rubber Polymers 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 125000006574 non-aromatic ring group Chemical group 0.000 description 1
- 230000009022 nonlinear effect Effects 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- HGASFNYMVGEKTF-UHFFFAOYSA-N octan-1-ol;hydrate Chemical compound O.CCCCCCCCO HGASFNYMVGEKTF-UHFFFAOYSA-N 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 125000002811 oleoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])/C([H])=C([H])\C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 150000002902 organometallic compounds Chemical class 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000006320 pegylation Effects 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- 150000003905 phosphatidylinositols Chemical class 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 125000000587 piperidin-1-yl group Chemical group [H]C1([H])N(*)C([H])([H])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 125000004483 piperidin-3-yl group Chemical group N1CC(CCC1)* 0.000 description 1
- 229920001200 poly(ethylene-vinyl acetate) Polymers 0.000 description 1
- 229920002239 polyacrylonitrile Polymers 0.000 description 1
- 125000003367 polycyclic group Chemical group 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 125000006684 polyhaloalkyl group Polymers 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 238000005381 potential energy Methods 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- SCUZVMOVTVSBLE-UHFFFAOYSA-N prop-2-enenitrile;styrene Chemical compound C=CC#N.C=CC1=CC=CC=C1 SCUZVMOVTVSBLE-UHFFFAOYSA-N 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 1
- 125000003373 pyrazinyl group Chemical group 0.000 description 1
- 125000004076 pyridyl group Chemical group 0.000 description 1
- 125000005344 pyridylmethyl group Chemical group [H]C1=C([H])C([H])=C([H])C(=N1)C([H])([H])* 0.000 description 1
- 230000006340 racemization Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 229930195734 saturated hydrocarbon Natural products 0.000 description 1
- 238000009738 saturating Methods 0.000 description 1
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- ZLGIYFNHBLSMPS-ATJNOEHPSA-N shellac Chemical compound OCCCCCC(O)C(O)CCCCCCCC(O)=O.C1C23[C@H](C(O)=O)CCC2[C@](C)(CO)[C@@H]1C(C(O)=O)=C[C@@H]3O ZLGIYFNHBLSMPS-ATJNOEHPSA-N 0.000 description 1
- 239000004208 shellac Substances 0.000 description 1
- 229940113147 shellac Drugs 0.000 description 1
- 235000013874 shellac Nutrition 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 229920006301 statistical copolymer Polymers 0.000 description 1
- 150000003431 steroids Chemical group 0.000 description 1
- 229920000638 styrene acrylonitrile Polymers 0.000 description 1
- 229920003048 styrene butadiene rubber Polymers 0.000 description 1
- 125000000547 substituted alkyl group Chemical group 0.000 description 1
- 125000003107 substituted aryl group Chemical group 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 230000010741 sumoylation Effects 0.000 description 1
- 229920003051 synthetic elastomer Polymers 0.000 description 1
- 229920002994 synthetic fiber Polymers 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 239000005061 synthetic rubber Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 125000004192 tetrahydrofuran-2-yl group Chemical group [H]C1([H])OC([H])(*)C([H])([H])C1([H])[H] 0.000 description 1
- 150000003536 tetrazoles Chemical class 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 231100000027 toxicology Toxicity 0.000 description 1
- 229940043263 traditional drug Drugs 0.000 description 1
- 125000004306 triazinyl group Chemical group 0.000 description 1
- 229920000428 triblock copolymer Polymers 0.000 description 1
- 125000002023 trifluoromethyl group Chemical group FC(F)(F)* 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 231100000402 unacceptable toxicity Toxicity 0.000 description 1
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 229910052727 yttrium Inorganic materials 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/10—Geometric effects
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
- G16B35/20—Screening of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
- G16B5/20—Probabilistic models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/40—Searching chemical structures or physicochemical data
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
- G16C20/62—Design of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- General Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Pathology (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Toxicology (AREA)
- Probability & Statistics with Applications (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Bioethics (AREA)
Abstract
Description
本出願は、2019年10月3日に出願された、「Systems and Methods for Screening Compounds In Silico」という名称の米国仮特許出願第62/910,068号の優先権を主張し、参照により本明細書に組み込まれる。
本明細書で言及されるすべての刊行物、特許、および特許出願は、それぞれの個々の刊行物、特許、または特許出願が、参照により組み込まれるように具体的かつ個別に示されているかのように、それらの全体が、参照により本明細書に組み込まれる。本明細書における用語と組み込まれた参照文献における用語との間に矛盾が生じた場合、本明細書における用語が律する。
本明細書で使用される場合、「クラスタリング」という用語は、データポイントの1つ以上のセット(例えば、クラスタ)へのグループ化を最適化する様々な方法を指し、それぞれのセットの各データポイントは、それぞれのセットにないデータポイントに対するよりも、それぞれのセットの他のあらゆるデータポイントに対するより高い程度の類似性を含む。異なるタイプのデータを評価するのに好適である多種多様なクラスタリングアルゴリズムがある。これらのアルゴリズムとして、階層モデル、重心モデル、分布モデル、密度ベースのモデル、部分空間モデル、グラフベースのモデル、およびニューラルモデルが挙げられる。これらの異なるモデルは各々、別々の計算要件(例えば、複雑さ)を有し、異なるデータタイプに好適である。同じデータセットに2つの別個のクラスタリングモデルを適用することは、2つの異なるデータグループ化をもたらすことが多い。いくつかの実施形態では、データセットへのクラスタリングモデルの繰り返しの適用は、毎回異なるデータグループ化をもたらす。
ここで、例示的なシステムの詳細が、図1と併せて記載される。図1は、いくつかの実装態様によるシステム100を例示するブロック図である。いくつかの実装態様でのシステム100は、少なくとも1つ以上の処理ユニットCPU102(プロセッサとも称される)、1つ以上のネットワークインターフェース104、任意選択のユーザインターフェース108(例えば、ディスプレイ106、入力デバイス110などを有する)メモリ111、およびこれらのコンポーネントを相互接続するための1つ以上の通信バス114を含む。1つ以上の通信バス114は、任意選択で、システムコンポーネント間の通信を相互接続し、制御する回路機構(チップセットと呼ばれることもある)を含む。
●オペレーティングシステム116(例えば、iOS、ANDROID、DARWIN、RTXC、LINUX、UNIX、OS X、WINDOWS、またはVxWorksなどの組み込みオペレーティングシステム)と関連付けられた命令、プログラム、データ、または情報であって、一般的なシステムタスク(例えば、メモリ管理、記憶装置デバイス制御、電力管理)を制御し、管理するための様々なソフトウェアコンポーネントおよび/またはドライバを含み、様々なハードウェアコンポーネントとソフトウェアコンポーネントとの間の通信を容易にする、命令、プログラム、データ、または情報、
●システム100を他のデバイスと、かつ/または通信ネットワークに接続するための、任意選択のネットワーク通信モジュール(または命令)118と関連付けられた命令、プログラム、データ、または情報、
●少なくとも1つの標的対象122であって、いくつかの実施形態では、標的対象は、ポリマーを含む、少なくとも1つの標的対象122、
●複数の被験対象124(例えば、被験対象124-1、…、124-X)を含む被験対象データベース122であって、複数の被験対象124から被験対象のサブセット130(例えば、被験対象124-A、...、124-B)が、標的モデル150による分析のために選択され、複数の被験対象124から、任意選択で、被験対象の1つ以上の追加のサブセット(例えば、140-1、...、140-Y)が選択されて、その後にサブセット130に追加され、サブセット130の各被験対象124は、対応する標的結果132および対応する予測結果134を有する、被験対象データベース122、
●第1の計算複雑性152を有する標的モデル150であって、被験対象のサブセット130への標的モデルの適用は、被験対象サブセット130の各被験対象124に対するそれぞれの標的結果132をもたらす、標的モデル150、および
●第2の計算複雑性162を有する予測モデル160であって、最初の訓練されていない状態164または更新された訓練されていない状態166のいずれかの予測モデルを被験対象サブセット130に適用して、被験対象サブセット130の各被験対象132に対するそれぞれの予測結果136を取得する、予測モデル160。
以下は、本発明のいくつかの実施形態のいくつかの用途について記載する例示的な目的のみで提供されるサンプル使用例である。他の用途が考慮されてもよく、以下に提供される例は、非限定的であり、変形、省略に供されてもよいし、追加の要素を含んでもよい。
単一のインスタンスとして本明細書に記載される構成要素、動作、または構造について、複数のインスタンスが提供されてもよい。最終的に、様々な構成要素、動作、およびデータストア間の境界は、ある程度恣意的であり、特定の動作が、特定の例示的構成の文脈において例示される。機能性の他の割り当てが想定され、実装態様の範囲内にあり得る。一般に、例示的な構成の別個の構成要素として提示された構造および機能性を、組み合わされた構造または構成要素として実施してもよい。同様に、単一の構成要素として提示された構造および機能性を、別個の構成要素として実施してもよい。これらのおよび他の変形、修正、追加、および改善は、実装態様の範囲内にある。
Claims (56)
- 被験対象データセットにおける複数の被験対象中の被験対象の数を削減する方法であって、
A)電子形式で、前記被験対象データセットを取得することと、
B)前記複数の被験対象からの被験対象のサブセットの各それぞれの被験対象について、前記それぞれの被験対象および少なくとも1つの標的対象に標的モデルを適用して、対応する標的結果を取得し、それによって、標的結果の対応するサブセットを取得することと、
C)少なくともi)前記被験対象のサブセットを独立変数として、かつii)前記標的結果の対応するサブセットを従属変数として使用して、初期の訓練された状態の予測モデルを訓練し、それによって、前記予測モデルを更新された訓練された状態に更新することと、
D)更新された訓練された状態の前記予測モデルを前記複数の被験対象に適用し、それによって、複数の予測結果のインスタンスを取得することと、
E)前記複数の予測結果の前記インスタンスに少なくとも部分的に基づいて、前記複数の被験対象から前記被験対象の一部分を排除することと、
F)1つ以上の事前定義された削減基準が満たされているかどうかを判定することであって、前記1つ以上の事前定義された削減基準が満たされない場合、前記方法が、
(i)前記複数の被験対象からの被験対象の追加のサブセットの各それぞれの被験対象について、前記標的モデルを前記それぞれの被験対象および前記少なくとも1つの標的対象に適用して、対応する標的結果を取得し、それによって、標的結果の追加のサブセットを取得することであって、前記被験対象の追加のサブセットが、少なくとも部分的に前記複数の予測結果の前記インスタンス上で選択される、取得することと、
(ii)前記被験対象のサブセットに前記被験対象の追加のサブセットを組み込むことによって、前記被験対象のサブセットを更新することと、
(iii)前記標的結果のサブセットに前記標的結果の追加のサブセットを組み込むことによって、前記標的結果のサブセットを更新することと、
(iv)前記更新すること(ii)および前記更新すること(iii)の後に、前記予測モデルを、少なくとも1)前記予測モデルの複数の独立変数としての前記被験対象のサブセット、および2)前記予測モデルの対応する複数の従属変数としての前記標的結果の対応するサブセットに適用することによって、前記予測モデルを修正し、それによって、更新された訓練された状態の前記予測モデルを提供することと、
(v)前記適用すること(D)、排除すること(E)、および判定すること(F)を繰り返すことであって、前記複数の被験対象が、前記排除することE)のインスタンスの適用前に、少なくとも1億個の被験対象を含む、繰り返すことと、をさらに含む、判定することと、を含む、方法。 - 前記標的モデルが、第1の計算複雑性を呈し、
前記予測モデルが、第2の計算複雑性を呈し、
前記第2の計算複雑性が、前記第1の計算複雑性よりも小さい、請求項1に記載の方法。 - 前記被験対象データセットが、複数の特徴ベクトルを含み、各特徴ベクトルが、前記複数の被験対象中のそれぞれの被験対象のためのものである、請求項1または2に記載の方法。
- 前記適用することB)が、前記複数の被験対象から1つ以上の被験対象をランダムに選択して、前記被験対象のサブセットを形成することをさらに含む、請求項1~3のいずれか一項に記載の方法。
- 前記適用することB)が、前記複数の特徴ベクトルから選択された1つ以上の特徴の評価に基づいて、前記被験対象のサブセットの前記複数の被験対象から1つ以上の被験対象を選択することをさらに含む、請求項3に記載の方法。
- 前記複数の特徴ベクトル中の各特徴ベクトルが、一次元ベクトルである、請求項3に記載の方法。
- 前記適用することF)(i)が、前記複数の特徴ベクトルから選択された1つ以上の特徴の評価に基づいて、前記複数の被験対象から1つ以上の被験対象を選択することによって、前記被験対象の追加のサブセットを形成することをさらに含む、請求項3または4に記載の方法。
- 前記1つ以上の事前定義された削減基準を満たすことが、前記複数の予測結果中の各予測結果を、前記標的結果のサブセットからの対応する標的結果と比較することを含む、請求項1~7のいずれか一項に記載の方法。
- 前記1つ以上の事前定義された削減基準を満たすことは、前記複数の被験対象中の前記被験対象の数が、対象の閾値数を下回ったことを判定することを含む、請求項1~7のいずれか一項に記載の方法。
- 前記標的モデルが、畳み込みニューラルネットワークである、請求項1~9のいずれか一項に記載の方法。
- 前記予測モデルが、ランダム・フォレスト・ツリー、複数の多重加法的決定木を含むランダムフォレスト、ニューラルネットワーク、グラフ・ニューラル・ネットワーク、密なニューラルネットワーク、主成分分析、最近傍分析、線形判別分析、二次判別分析、サポート・ベクタ・マシン、進化的手法、射影追跡、線形回帰、ナイーブ・ベイズ・アルゴリズム、多カテゴリ論理回帰アルゴリズム、またはそれらのアンサンブルを含む、請求項1~9のいずれか一項に記載の方法。
- 前記少なくとも1つの標的対象が、単一の対象であり、
前記単一の対象が、ポリマーである、請求項1~11のいずれか一項に記載の方法。 - 前記ポリマーが、活性部位を含む、請求項12に記載の方法。
- 前記ポリマーが、タンパク質、ポリペプチド、ポリ核酸、ポリリボ核酸、多糖、またはそれらの任意の組み合わせのアセンブリである、請求項12または13に記載の方法。
- 前記ポリマーが、2.5Å以上の分解能で分解された前記ポリマーの結晶構造の三次元座標のセット{x1,...,xN}に基づいて、前記標的モデルに適用される、請求項12に記載の方法。
- 前記ポリマーが、3.3Å以上の分解能で分解された前記ポリマーの結晶構造の三次元座標のセット{x1,...,xN}に基づいて、前記標的モデルに適用される、請求項12に記載の方法。
- 前記ポリマーが、核磁気共鳴、中性子回折、または低温電子顕微鏡法によって判定された前記ポリマーの三次元座標のアンサンブルである空間座標に基づいて、前記標的モデルに適用される、請求項12に記載の方法。
- 前記複数の被験対象が、前記排除することE)のインスタンスの適用前に、少なくとも5億個の被験対象、少なくとも10億個の被験対象、少なくとも20億個の被験対象、少なくとも30億個の被験対象、少なくとも40億個の被験対象、少なくとも50億個の被験対象、少なくとも60億個の被験対象、少なくとも70億個の被験対象、少なくとも80億個の被験対象、少なくとも90億個の被験対象、少なくとも100億個の被験対象、少なくとも110億個の被験対象、少なくとも150億個の被験対象、少なくとも200億個の被験対象、少なくとも300億個の被験対象、少なくとも400億個の被験対象、少なくとも500億個の被験対象、少なくとも600億個の被験対象、少なくとも700億個の被験対象、少なくとも800億個の被験対象、少なくとも900億個の被験対象、少なくとも1000億個の被験対象、または少なくとも1100億個の被験対象を含む、請求項1~19のいずれか一項に記載の方法。
- 前記1つ以上の事前定義された削減基準は、前記複数の被験対象が、30個以下の被験対象、40個以下の被験対象、50個以下の被験対象、60個以下の被験対象、70個以下の被験対象、90個以下の被験対象、100個以下の被験対象、200個以下の被験対象、300個以下の被験対象、400個以下の被験対象、500個以下の被験対象、600個以下の被験対象、700個以下の被験対象、800個以下の被験対象、900個以下の被験対象、または1000個以下の被験対象を有することを必要とする、請求項0に記載の方法。
- 前記複数の被験対象中の各被験対象が、化学化合物を表す、請求項1~19のいずれか一項に記載の方法。
- 前記初期の訓練された状態の前記予測モデルが、訓練されていないか、または部分的に訓練された分類子を含む、請求項1~20のいずれか一項に記載の方法。
- 前記更新された訓練された状態の前記予測モデルが、前記初期の訓練された状態の前記予測モデルとは別のものである、訓練されていないか、または部分的に訓練された分類子を含む、請求項1~21のいずれか一項に記載の方法。
- 前記被験対象のサブセットが、少なくとも1,000個の被験対象、少なくとも5,000個の被験対象、少なくとも10,000個の被験対象、少なくとも25,000個の被験対象、少なくとも50,000個の被験対象、少なくとも75,000個の被験対象、少なくとも100,000個の被験対象、少なくとも250,000個の被験対象、少なくとも500,000個の被験対象、少なくとも750,000個の被験対象、少なくとも100万個の被験対象、少なくとも200万個の被験対象、少なくとも300万個の被験対象、少なくとも400万個の被験対象、少なくとも500万個の被験対象、少なくとも600万個の被験対象、少なくとも700万個の被験対象、少なくとも800万個の被験対象、少なくとも900万個の被験対象、または少なくとも1,000万個の被験対象を含む、請求項1~22のいずれか一項に記載の方法。
- 前記被験対象の追加のサブセットが、少なくとも1,000個の被験対象、少なくとも5,000個の被験対象、少なくとも10,000個の被験対象、少なくとも25,000個の被験対象、少なくとも50,000個の被験対象、少なくとも75,000個の被験対象、少なくとも100,000個の被験対象、少なくとも250,000個の被験対象、少なくとも500,000個の被験対象、少なくとも750,000個の被験対象、少なくとも100万個の被験対象、少なくとも200万個の被験対象、少なくとも300万個の被験対象、少なくとも400万個の被験対象、少なくとも500万個の被験対象、少なくとも600万個の被験対象、少なくとも700万個の被験対象、少なくとも800万個の被験対象、少なくとも900万個の被験対象、または少なくとも1,000万個の被験対象を含む、請求項1~23のいずれか一項に記載の方法。
- 前記被験対象の追加のサブセットが、前記被験対象のサブセットとは別のものである、請求項23または24に記載の方法。
- 前記F)前記予測モデルを修正すること(iv)が、前記予測モデルを再訓練することを含む、請求項1に記載の方法。
- 前記訓練すること(C)が、前記少なくとも、i)前記被験対象のサブセットを前記予測モデルの複数の独立変数として、かつii)前記標的結果の対応するサブセットを前記予測モデルの複数の従属変数として使用することに加えて、iii)前記少なくとも1つの標的対象を前記予測モデルの独立変数として使用することをさらに含む、請求項1に記載の方法。
- 前記少なくとも1つの標的対象が、少なくとも2つの標的対象、少なくとも3つの標的対象、少なくとも4つの標的対象、少なくとも5つの標的対象、または少なくとも6つの標的対象を含む、請求項1または27に記載の方法。
- 前記複数の予測結果の前記インスタンスが、前記複数の被験対象中の各被験対象に対するそれぞれの予測結果を含む、請求項1に記載の方法。
- 前記修正することF)(iv)が、少なくとも1)前記被験対象のサブセットを独立変数として、かつ2)前記標的結果の対応するサブセットを前記予測モデルの対応する従属変数として使用することに加えて、3)前記少なくとも1つの標的対象を独立変数として使用することをさらに含む、請求項1~29のいずれか一項に記載の方法。
- 前記1つ以上の事前定義された削減基準が満たされている場合、前記方法が、
i)前記複数の被験対象をクラスタ化し、それによって、前記複数の被験対象中の各被験対象を複数のクラスタ中のクラスタに割り当てることと、
ii)少なくとも部分的に前記複数のクラスタ中の個々のクラスタの被験対象の冗長性に基づいて、前記複数の被験対象から1つ以上の被験対象を排除することと、をさらに含む、請求項1~30のいずれか一項に記載の方法。 - 前記方法が、
i)前記複数の被験対象をクラスタ化し、それによって、前記複数の被験対象中の各被験対象を複数のクラスタ中のそれぞれのクラスタに割り当てることと、
ii)少なくとも部分的に前記複数のクラスタ中の個々のクラスタの被験対象の冗長性に基づいて、前記複数の被験対象から前記被験対象のサブセットを選択することと、によって、前記複数の被験対象から前記被験対象のサブセットを選択することをさらに含む、請求項1~30のいずれか一項に記載の方法。 - 前記1つ以上の事前定義された削減基準が満たされている場合、前記方法が、前記予測モデルを前記複数の被験対象および前記少なくとも1つの標的対象に適用し、それによって、前記予測モデルに、前記複数の被験対象中の各被験対象に対するそれぞれの相互作用スコアを提供させることをさらに含む、請求項1~32のいずれか一項に記載の方法。
- 各それぞれの相互作用スコアが、それぞれの被験対象と前記少なくとも1つの標的対象との間の相互作用に対応する、請求項33に記載の方法。
- 各それぞれの相互作用スコアを使用して、前記少なくとも1つの標的対象を特徴付ける、請求項33または34に記載の方法。
- 前記排除すること(E)が、
i)前記複数の被験対象をクラスタ化し、それによって、前記複数の被験対象中の各被験対象を複数のクラスタ中のそれぞれのクラスタに割り当てることと、
ii)少なくとも部分的に前記複数のクラスタ中の個々のクラスタの被験対象の冗長性に基づいて、前記複数の被験対象から被験対象のサブセットを排除することと、を含む、請求項1に記載の方法。 - 前記複数の被験対象をクラスタリングすることが、密度ベースの空間クラスタリングアルゴリズム、分割クラスタリングアルゴリズム、凝集クラスタリングアルゴリズム、k平均クラスタリングアルゴリズム、教師ありクラスタリングアルゴリズム、またはそれらのアンサンブルを使用して実行される、請求項31、32、または36に記載の方法。
- 前記排除すること(E)が、
前記複数の予測結果の前記インスタンスに基づいて、前記複数の被験対象をランク付けすることと、
前記複数の被験対象から、閾値カットオフを満たす対応する予測結果を有するに至らない前記複数の被験対象中のそれらの被験対象を削除することと、を含む、請求項1に記載の方法。 - 前記閾値カットオフが、上位閾値パーセンテージである、請求項38に記載の方法。
- 前記上位閾値パーセンテージが、前記複数の予測結果の上位90パーセント、上位80パーセント、上位75パーセント、上位60パーセント、または上位50パーセントである、請求項39に記載の方法。
- 前記排除すること(E)の各インスタンスが、前記複数の被験対象中の前記被験対象の10分の1~10分の9を排除する、請求項1~40のいずれか一項に記載の方法。
- 前記排除すること(E)の各インスタンスが、前記複数の被験対象中の前記被験対象の4分の1~4分の3を排除する、請求項1~40のいずれか一項に記載の方法。
- 前記少なくとも1つの標的対象が、単一の標的対象であり、前記複数の被験対象からの被験対象のサブセット中の各それぞれの被験対象について、前記それぞれの被験対象および標的対象に適用して、対応する標的結果B)を取得することが、
i)前記標的対象の空間座標を取得することと、
ii)複数の異なるポーズ中の各ポーズの前記標的対象で前記それぞれの被験対象をモデル化し、それによって、複数のボクセルマップを作成することであって、前記複数のボクセルマップ中の各それぞれのボクセルマップが、前記複数の異なるポーズ中のそれぞれのポーズの前記被験対象を含む、作成することと、
iii)前記複数のボクセルマップ中の各ボクセルマップを対応するベクトルに展開し、それによって、複数のベクトルを作成することであって、前記複数のベクトル中の各ベクトルが、同じサイズである、展開することと、
iv)前記複数のベクトル中の各それぞれのベクトルを前記標的モデルに入力することであって、前記標的モデルが、(a)前記複数のベクトルを順次受け取るための入力層、(b)複数の畳み込み層、および(c)スコアラを含み、
前記複数の畳み込み層が、初期畳み込み層および最終畳み込み層を含み、
前記複数の畳み込み層中の各層が、重みの異なるセットと関連付けられ、
前記複数のベクトル中のそれぞれのベクトルの入力に応答して、前記入力層が、前記それぞれのベクトルの値の第1の関数として、第1の複数の値を前記初期畳み込み層に供給し、
前記最終畳み込み層以外の各それぞれの畳み込み層が、中間値を、(a)前記それぞれの畳み込み層と関連付けられた前記重みの異なるセットと、(b)前記それぞれの畳み込み層によって受け取られた入力値と、のそれぞれの第2の関数として、前記複数の畳み込み層中の別の畳み込み層に供給し、
前記最終畳み込み層が、最終値を、(a)前記最終畳み込み層と関連付けられた前記重みの異なるセットと、(b)前記最終畳み込み層によって受け取られた入力値と、の第3の関数として、前記スコアラに供給する、入力することと、
v)前記スコアラから対応する複数のスコアを取得することであって、前記対応する複数のスコア中の各スコアが、前記複数のベクトル中のベクトルの、前記入力層への前記入力に対応する、取得することと、
vi)前記複数のスコアを使用して、前記対応する標的結果を計算することと、を含む、請求項1~42のいずれか一項に記載の方法。 - 前記スコアラが、複数の全結合層および評価層を含み、前記複数の全結合層中の全結合層が、前記評価層に供給する、請求項43に記載の方法。
- 前記スコアラが、決定木、多重加法的回帰木、クラスタリングアルゴリズム、主成分分析、最近傍分析、線形判別分析、二次判別分析、サポート・ベクタ・マシン、進化的手法、射影追跡、およびそれらのアンサンブルを含む、請求項43に記載の方法。
- 前記複数のベクトル中の各ベクトルが、一次元ベクトルである、請求項43に記載の方法。
- 前記複数の異なるポーズが、2以上のポーズ、10以上のポーズ、100以上のポーズ、または1000以上のポーズを含む、請求項43に記載の方法。
- 前記複数の異なるポーズが、マークアップ・チェーン・モンテ・カルロ・サンプリング、模擬アニーリング、ラマルク遺伝的アルゴリズム、または遺伝的アルゴリズムのうちの1つにおけるドッキングスコアリング関数を使用して取得される、請求項43に記載の方法。
- 前記複数の異なるポーズが、貪欲アルゴリズムを使用して逐次検索によって取得される、請求項43に記載の方法。
- 前記複数のスコアを前記使用して前記対応する標的結果を計算することが、前記複数のスコアの中心傾向の尺度を測ることを含む、請求項43に記載の方法。
- 前記複数のスコアを前記使用して前記対応する標的結果を計算することが、前記複数のスコアを使用して前記それぞれの被験対象を特徴付けることが前記複数のスコアの加重平均を取ることを含む、請求項43に記載の方法。
- 前記複数の畳み込み層中のそれぞれの畳み込み層が、複数のフィルタを有し、前記複数のフィルタ中の各フィルタが、N3の立方体入力空間をストライドYで畳み込み、Nが、2以上の整数であり、Yが、正の整数である、請求項43に記載の方法。
- 前記それぞれの畳み込み層と関連付けられた前記重みの異なるセットが、前記複数のフィルタ中のそれぞれのフィルタと関連付けられる、請求項52に記載の方法。
- 前記スコアラが、複数の全結合層およびロジスティック回帰コスト層を含み、前記複数の全結合層中の全結合層が、前記ロジスティック回帰コスト層に供給する、請求項43に記載の方法。
- 被験対象データセットにおける複数の被験対象中の被験対象の数を削減するためのコンピュータシステムであって、
1つ以上のプロセッサと、
メモリと、
1つ以上のプログラムと、を含み、前記1つ以上のプログラムが、前記メモリに記憶されており、前記1つ以上のプロセッサによって実行されるように構成されており、前記1つ以上のプログラムが、
A)電子形式で、前記被験対象データセットを取得することと、
B)前記複数の被験対象からの被験対象のサブセットの各それぞれの被験対象について、前記それぞれの被験対象および少なくとも1つの標的対象に標的モデルを適用して、対応する標的結果を取得し、それによって、標的結果の対応するサブセットを取得することと、
C)少なくともi)前記被験対象のサブセットを独立変数として、かつii)前記標的結果の対応するサブセットを従属変数として使用して、初期の訓練された状態の予測モデルを訓練し、それによって、前記予測モデルを更新された訓練された状態に更新することと、
D)更新された訓練された状態の前記予測モデルを前記複数の被験対象に適用し、それによって、複数の予測結果のインスタンスを取得することと、
E)少なくとも部分的に前記複数の予測結果の前記インスタンスに基づいて、前記複数の被験対象から前記被験対象の一部分を排除することと、
F)1つ以上の事前定義された削減基準が満たされているかどうかを判定することとであって、前記1つ以上の事前定義された削減基準が満たされない場合、前記方法が、
(i)前記複数の被験対象からの被験対象の追加のサブセットの各それぞれの被験対象について、前記標的モデルを前記それぞれの被験対象および少なくとも1つの標的対象に適用して、対応する標的結果を取得し、それによって、標的結果の追加のサブセットを取得することであって、前記被験対象の追加のサブセットが、少なくとも部分的に前記複数の予測結果の前記インスタンス上で選択される、取得することと、
(ii)前記被験対象のサブセットに前記被験対象の追加のサブセットを組み込むことによって、前記被験対象のサブセットを更新することと、
(iii)前記標的結果のサブセットに前記標的結果の追加のサブセットを組み込むことによって、前記標的結果のサブセットを更新することと、
(iv)前記更新すること(ii)および前記更新すること(iii)の後に、前記予測モデルを、少なくとも1)前記予測モデルの複数の独立変数としての前記被験対象のサブセット、および2)前記予測モデルの対応する複数の従属変数としての前記標的結果の対応するサブセットに適用することによって、前記予測モデルを修正し、それによって、更新された訓練された状態の前記予測モデルを提供することと、
(v)前記適用すること(D)、排除すること(E)、および判定すること(F)を繰り返すことであって、前記複数の被験対象が、前記排除することE)のインスタンスの適用前に、少なくとも1億個の被験対象を含む、繰り返すことと、をさらに含む、判定することと、のための命令を含む、コンピュータシステム。 - 非一時的コンピュータ可読記憶媒体およびそれに埋め込まれた1つ以上のコンピュータプログラムであって、前記1つ以上のコンピュータプログラムが、コンピュータシステムによって実行されたとき、前記コンピュータシステムに、被験対象データセットにおける複数の被験対象中の被験対象の数を削減する方法を実行させる命令を含み、前記方法が、
A)電子形式で、前記被験対象データセットを取得することと、
B)前記複数の被験対象からの被験対象のサブセットの各それぞれの被験対象について、前記それぞれの被験対象および少なくとも1つの標的対象に標的モデルを適用して、対応する標的結果を取得し、それによって、標的結果の対応するサブセットを取得することと、
C)少なくともi)前記被験対象のサブセットを独立変数として、かつii)前記標的結果の対応するサブセットを従属変数として使用して、初期の訓練された状態の予測モデルを訓練し、それによって、前記予測モデルを更新された訓練された状態に更新することと、
D)更新された訓練された状態の前記予測モデルを前記複数の被験対象に適用し、それによって、複数の予測結果のインスタンスを取得することと、
E)少なくとも部分的に前記複数の予測結果の前記インスタンスに基づいて、前記複数の被験対象から前記被験対象の一部分を排除することと、
F)1つ以上の事前定義された削減基準が満たされているかどうかを判定することであって、前記1つ以上の事前定義された削減基準が満たされない場合、前記方法が、
(i)前記複数の被験対象からの被験対象の追加のサブセットの各それぞれの被験対象について、前記標的モデルを前記それぞれの被験対象および少なくとも1つの標的対象に適用して、対応する標的結果を取得し、それによって、標的結果の追加のサブセットを取得することであって、前記被験対象の追加のサブセットが、少なくとも部分的に前記複数の予測結果の前記インスタンス上で選択される、取得することと、
(ii)前記被験対象のサブセットに前記被験対象の追加のサブセットを組み込むことによって、前記被験対象のサブセットを更新することと、
(iii)前記標的結果のサブセットに前記標的結果の追加のサブセットを組み込むことによって、前記標的結果のサブセットを更新することと、
(iv)前記更新すること(ii)および前記更新すること(iii)の後に、前記予測モデルを、少なくとも1)前記予測モデルの複数の独立変数としての前記被験対象のサブセット、および2)前記予測モデルの対応する複数の従属変数としての前記標的結果の対応するサブセットに適用することによって、前記予測モデルを修正し、それによって、更新された訓練された状態の前記予測モデルを提供することと、
(v)前記適用すること(D)、排除すること(E)、および判定すること(F)を繰り返すことであって、前記複数の被験対象が、前記排除すること(E)のインスタンスの適用前に、少なくとも1億個の被験対象を含む、繰り返すことと、をさらに含む、判定することと、を含む、非一時的コンピュータ可読記憶媒体およびそれに埋め込まれた1つ以上のコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962910068P | 2019-10-03 | 2019-10-03 | |
US62/910,068 | 2019-10-03 | ||
PCT/US2020/053477 WO2021067399A1 (en) | 2019-10-03 | 2020-09-30 | Systems and methods for screening compounds in silico |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022550550A true JP2022550550A (ja) | 2022-12-02 |
JPWO2021067399A5 JPWO2021067399A5 (ja) | 2023-10-24 |
Family
ID=75274370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022519999A Pending JP2022550550A (ja) | 2019-10-03 | 2020-09-30 | インシリコで化合物をスクリーニングするためのシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210104331A1 (ja) |
EP (1) | EP4038555A4 (ja) |
JP (1) | JP2022550550A (ja) |
CN (1) | CN114730397A (ja) |
WO (1) | WO2021067399A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11709917B2 (en) * | 2020-05-05 | 2023-07-25 | Nanjing University | Point-set kernel clustering |
US20220171750A1 (en) * | 2020-11-30 | 2022-06-02 | Getac Technology Corporation | Content management system for trained machine learning models |
KR102457159B1 (ko) * | 2021-01-28 | 2022-10-20 | 전남대학교 산학협력단 | 딥러닝 기반 화합물 의약 효과 예측 방법 |
US20220336054A1 (en) * | 2021-04-15 | 2022-10-20 | Illumina, Inc. | Deep Convolutional Neural Networks to Predict Variant Pathogenicity using Three-Dimensional (3D) Protein Structures |
CN113850801B (zh) * | 2021-10-18 | 2024-09-13 | 深圳晶泰科技有限公司 | 晶型预测方法、装置及电子设备 |
WO2023212463A1 (en) * | 2022-04-29 | 2023-11-02 | Atomwise Inc. | Characterization of interactions between compounds and polymers using pose ensembles |
CN116153390A (zh) * | 2022-07-15 | 2023-05-23 | 上海图灵智算量子科技有限公司 | 基于量子卷积神经网络的药物结合能预测方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7451065B2 (en) * | 2002-03-11 | 2008-11-11 | International Business Machines Corporation | Method for constructing segmentation-based predictive models |
US9373059B1 (en) * | 2014-05-05 | 2016-06-21 | Atomwise Inc. | Systems and methods for applying a convolutional network to spatial data |
-
2020
- 2020-09-30 EP EP20871111.9A patent/EP4038555A4/en active Pending
- 2020-09-30 JP JP2022519999A patent/JP2022550550A/ja active Pending
- 2020-09-30 US US17/038,473 patent/US20210104331A1/en active Pending
- 2020-09-30 CN CN202080078963.7A patent/CN114730397A/zh active Pending
- 2020-09-30 WO PCT/US2020/053477 patent/WO2021067399A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
US20210104331A1 (en) | 2021-04-08 |
WO2021067399A1 (en) | 2021-04-08 |
EP4038555A4 (en) | 2023-10-25 |
CN114730397A (zh) | 2022-07-08 |
EP4038555A1 (en) | 2022-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109964278B (zh) | 通过并行评估分类器输出校正第一分类器中的误差 | |
US11080570B2 (en) | Systems and methods for applying a convolutional network to spatial data | |
JP2022550550A (ja) | インシリコで化合物をスクリーニングするためのシステムおよび方法 | |
Crampon et al. | Machine-learning methods for ligand–protein molecular docking | |
JP7495124B2 (ja) | 薬物発見および分子シミュレーションへの適用を伴う空間グラフ畳み込みのためのシステムおよび方法 | |
CN108140131B (zh) | 用于将卷积网络应用于空间数据的系统和方法 | |
Ragoza et al. | Protein–ligand scoring with convolutional neural networks | |
Reutlinger et al. | Nonlinear dimensionality reduction and mapping of compound libraries for drug discovery | |
Griffiths et al. | Optimal alignment of structures for finite and periodic systems | |
Aguiar-Pulido et al. | Evolutionary computation and QSAR research | |
US20230154561A1 (en) | Deep learning systems and methods for predicting structural aspects of protein-related complexes | |
JP2024537793A (ja) | 負のポーズデータ及びモデルコンディショニングを使用した化合物とポリマーとの間の相互作用の特徴付け | |
WO2023212463A1 (en) | Characterization of interactions between compounds and polymers using pose ensembles | |
Bouvier | Protein–Protein Interface Topology as a Predictor of Secondary Structure and Molecular Function Using Convolutional Deep Learning | |
Ozkan et al. | Baseline Comparisons of Complementary Sampling Methods for Assembly Driven by Short-Ranged Pair Potentials toward Fast and Flexible Hybridization | |
US20240177012A1 (en) | Molecular Docking-Enabled Modeling of DNA-Encoded Libraries | |
Singh | Surface similarity-based molecular query-retrieval | |
Singh | Reasoning about molecular similarity and properties | |
Azencott | Statistical machine learning and data mining for chemoinformatics and drug discovery | |
Zhang | Multi-task and Multi-view Learning for Predicting Adverse Drug Reactions | |
Creighton et al. | Informatics Tools for Functional Pathway Analysis Using Genomics and Proteomics | |
Yoldaş | Predicting the effect of hydrophobicity surface on binding affinity of pcp-like compounds using machine learning methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230925 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230925 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231013 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240925 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240927 |