JP2004500614A - Receptor selectivity mapping - Google Patents
Receptor selectivity mapping Download PDFInfo
- Publication number
- JP2004500614A JP2004500614A JP2000614100A JP2000614100A JP2004500614A JP 2004500614 A JP2004500614 A JP 2004500614A JP 2000614100 A JP2000614100 A JP 2000614100A JP 2000614100 A JP2000614100 A JP 2000614100A JP 2004500614 A JP2004500614 A JP 2004500614A
- Authority
- JP
- Japan
- Prior art keywords
- database
- compound
- compounds
- computer system
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013507 mapping Methods 0.000 title description 12
- 150000001875 compounds Chemical class 0.000 claims abstract description 216
- 238000012360 testing method Methods 0.000 claims abstract description 40
- 230000000694 effects Effects 0.000 claims abstract description 32
- 230000003993 interaction Effects 0.000 claims abstract description 32
- 230000027455 binding Effects 0.000 claims abstract description 30
- 238000009739 binding Methods 0.000 claims abstract description 30
- 241001465754 Metazoa Species 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims description 38
- 239000003814 drug Substances 0.000 claims description 31
- 229940079593 drug Drugs 0.000 claims description 30
- 239000000126 substance Substances 0.000 claims description 28
- 102000004190 Enzymes Human genes 0.000 claims description 26
- 108090000790 Enzymes Proteins 0.000 claims description 26
- 108090000623 proteins and genes Proteins 0.000 claims description 24
- 230000004071 biological effect Effects 0.000 claims description 13
- 231100000419 toxicity Toxicity 0.000 claims description 8
- 230000001988 toxicity Effects 0.000 claims description 8
- 230000009471 action Effects 0.000 claims description 7
- 239000003795 chemical substances by application Substances 0.000 claims description 7
- 230000000144 pharmacologic effect Effects 0.000 claims description 6
- 239000005445 natural material Substances 0.000 claims description 5
- 230000002401 inhibitory effect Effects 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 claims description 3
- 150000001720 carbohydrates Chemical class 0.000 claims description 2
- 230000001747 exhibiting effect Effects 0.000 claims description 2
- -1 molecular targets Chemical class 0.000 claims description 2
- 230000035772 mutation Effects 0.000 claims description 2
- 108020004707 nucleic acids Proteins 0.000 claims description 2
- 102000039446 nucleic acids Human genes 0.000 claims description 2
- 150000007523 nucleic acids Chemical class 0.000 claims description 2
- 229940121657 clinical drug Drugs 0.000 claims 1
- 238000012544 monitoring process Methods 0.000 claims 1
- 230000009257 reactivity Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 abstract description 2
- 102000005962 receptors Human genes 0.000 description 86
- 108020003175 receptors Proteins 0.000 description 86
- 238000012216 screening Methods 0.000 description 34
- 239000002547 new drug Substances 0.000 description 22
- 238000007876 drug discovery Methods 0.000 description 20
- 238000003556 assay Methods 0.000 description 19
- 238000009509 drug development Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 16
- VYFYYTLLBUKUHU-UHFFFAOYSA-N dopamine Chemical compound NCCC1=CC=C(O)C(O)=C1 VYFYYTLLBUKUHU-UHFFFAOYSA-N 0.000 description 12
- 238000011161 development Methods 0.000 description 10
- 229940000406 drug candidate Drugs 0.000 description 10
- 201000010099 disease Diseases 0.000 description 9
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 9
- 238000010521 absorption reaction Methods 0.000 description 7
- 102000004169 proteins and genes Human genes 0.000 description 7
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 6
- 125000003275 alpha amino acid group Chemical group 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 229960003638 dopamine Drugs 0.000 description 6
- 239000000820 nonprescription drug Substances 0.000 description 5
- 230000036961 partial effect Effects 0.000 description 5
- 230000008827 biological function Effects 0.000 description 4
- 238000007418 data mining Methods 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 230000000975 bioactive effect Effects 0.000 description 3
- 239000003054 catalyst Substances 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000009510 drug design Methods 0.000 description 3
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000000099 in vitro assay Methods 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000004060 metabolic process Effects 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 239000002287 radioligand Substances 0.000 description 3
- 238000001525 receptor binding assay Methods 0.000 description 3
- 238000012827 research and development Methods 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 108020004414 DNA Proteins 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000001952 enzyme assay Methods 0.000 description 2
- 230000029142 excretion Effects 0.000 description 2
- 238000012921 fluorescence analysis Methods 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000009149 molecular binding Effects 0.000 description 2
- 230000004001 molecular interaction Effects 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 230000010807 negative regulation of binding Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000002821 scintillation proximity assay Methods 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 239000011550 stock solution Substances 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- UUUHXMGGBIUAPW-UHFFFAOYSA-N 1-[1-[2-[[5-amino-2-[[1-[5-(diaminomethylideneamino)-2-[[1-[3-(1h-indol-3-yl)-2-[(5-oxopyrrolidine-2-carbonyl)amino]propanoyl]pyrrolidine-2-carbonyl]amino]pentanoyl]pyrrolidine-2-carbonyl]amino]-5-oxopentanoyl]amino]-3-methylpentanoyl]pyrrolidine-2-carbon Chemical compound C1CCC(C(=O)N2C(CCC2)C(O)=O)N1C(=O)C(C(C)CC)NC(=O)C(CCC(N)=O)NC(=O)C1CCCN1C(=O)C(CCCN=C(N)N)NC(=O)C1CCCN1C(=O)C(CC=1C2=CC=CC=C2NC=1)NC(=O)C1CCC(=O)N1 UUUHXMGGBIUAPW-UHFFFAOYSA-N 0.000 description 1
- SVUOLADPCWQTTE-UHFFFAOYSA-N 1h-1,2-benzodiazepine Chemical compound N1N=CC=CC2=CC=CC=C12 SVUOLADPCWQTTE-UHFFFAOYSA-N 0.000 description 1
- 102000040125 5-hydroxytryptamine receptor family Human genes 0.000 description 1
- 108091032151 5-hydroxytryptamine receptor family Proteins 0.000 description 1
- 102000009346 Adenosine receptors Human genes 0.000 description 1
- 108050000203 Adenosine receptors Proteins 0.000 description 1
- 108060003345 Adrenergic Receptor Proteins 0.000 description 1
- 102000017910 Adrenergic receptor Human genes 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 102000004506 Blood Proteins Human genes 0.000 description 1
- 108010017384 Blood Proteins Proteins 0.000 description 1
- OKTJSMMVPCPJKN-NJFSPNSNSA-N Carbon-14 Chemical compound [14C] OKTJSMMVPCPJKN-NJFSPNSNSA-N 0.000 description 1
- 241000819038 Chichester Species 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 102000015554 Dopamine receptor Human genes 0.000 description 1
- 108050004812 Dopamine receptor Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108091006027 G proteins Proteins 0.000 description 1
- 102000030782 GTP binding Human genes 0.000 description 1
- 108091000058 GTP-Binding Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 241000764238 Isis Species 0.000 description 1
- 102000014415 Muscarinic acetylcholine receptor Human genes 0.000 description 1
- 108050003473 Muscarinic acetylcholine receptor Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- 102000003840 Opioid Receptors Human genes 0.000 description 1
- 108090000137 Opioid Receptors Proteins 0.000 description 1
- 102000016978 Orphan receptors Human genes 0.000 description 1
- 108070000031 Orphan receptors Proteins 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 102000004270 Peptidyl-Dipeptidase A Human genes 0.000 description 1
- 108090000882 Peptidyl-Dipeptidase A Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 238000004617 QSAR study Methods 0.000 description 1
- 230000010799 Receptor Interactions Effects 0.000 description 1
- 108090001109 Thermolysin Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- YZCKVEUIGOORGS-NJFSPNSNSA-N Tritium Chemical compound [3H] YZCKVEUIGOORGS-NJFSPNSNSA-N 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000002820 assay format Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229940049706 benzodiazepine Drugs 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000008499 blood brain barrier function Effects 0.000 description 1
- 210000001218 blood-brain barrier Anatomy 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 108010089934 carbohydrase Proteins 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 230000009084 cardiovascular function Effects 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 208000015114 central nervous system disease Diseases 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000004737 colorimetric analysis Methods 0.000 description 1
- 230000006854 communication Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003107 drug analog Substances 0.000 description 1
- 238000012445 drug development testing Methods 0.000 description 1
- 210000000750 endocrine system Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000002060 fluorescence correlation spectroscopy Methods 0.000 description 1
- 238000002875 fluorescence polarization Methods 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000002169 hydrotherapy Methods 0.000 description 1
- 208000026278 immune system disease Diseases 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- XMBWDFGMSWQBCA-YPZZEJLDSA-N iodane Chemical compound [125IH] XMBWDFGMSWQBCA-YPZZEJLDSA-N 0.000 description 1
- 229940044173 iodine-125 Drugs 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000007860 molecular communication Effects 0.000 description 1
- 238000012900 molecular simulation Methods 0.000 description 1
- 108020004017 nuclear receptors Proteins 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000036407 pain Effects 0.000 description 1
- 238000012910 preclinical development Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000000163 radioactive labelling Methods 0.000 description 1
- 239000000700 radioactive tracer Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000005556 structure-activity relationship Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 230000008280 toxic mechanism Effects 0.000 description 1
- 231100000027 toxicology Toxicity 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 102000027257 transmembrane receptors Human genes 0.000 description 1
- 108091008578 transmembrane receptors Proteins 0.000 description 1
- 229910052722 tritium Inorganic materials 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/90—Programming languages; Computing architectures; Database systems; Data warehousing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/10—Ontologies; Annotations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Databases & Information Systems (AREA)
- Pharmacology & Pharmacy (AREA)
- Computing Systems (AREA)
- Bioethics (AREA)
- Medicinal Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
【解決手段】化合物に関する記録及び該化合物の人間及び動物の生物学的システム上の作用に関する記録を含む第1データベースと、分子ターゲットに関する記録を含む第2データベースとからなるコンピュータシステム。該システムはさらに、第1データベースの化合物と第2データベースの分子ターゲットとの間の結合、反応性その他の相互作用テストに関する記録を含む第3データベースを含む。上記テストには、第2データベース中の特定分子ターゲット及びこれと相互作用することが知られた化合物間の相互作用において、前記化合物が有する作用効果に関する情報が含まれている。前記テストの閾値を設定する手段、及び前記相互作用テスト閾値を満たす化合物を選択する手段もまた、前記システムに含まれている。第1、第2及び第3データベースの情報を、ユーザが閲覧、操作又は分析することができるユーザインタフェースが設けられている。
【選択図】図5A computer system comprising a first database containing records about compounds and the effects of the compounds on biological systems of humans and animals, and a second database containing records about molecular targets. The system further includes a third database containing records relating to binding, reactivity and other interaction tests between the compounds of the first database and the molecular targets of the second database. The test includes information on the effects of the compound in the interaction between the specific molecular target in the second database and the compound known to interact with the specific molecular target. Means for setting the test threshold and for selecting compounds that meet the interaction test threshold are also included in the system. A user interface is provided that allows a user to browse, operate, or analyze information in the first, second, and third databases.
[Selection diagram] FIG.
Description
【0001】
【発明の属する技術分野】
本発明は、一般的に、化学インフォマティクス及びバイオインフォマティクスと、化学分子ターゲットの相互作用に関するデータとの組み合わせにより、多次元データベースを構築する技術に関する。特に、本発明は、化合物、分子ターゲット、及び生物学的又は臨床的情報を含むデータベースに関するものであり、該データベースにおいて、化合物及び分子ターゲット間の相互作用のパターン又は関係性が決定され、データベース内の他の情報と比較されることにより、薬物の発見及び開発、並びに関連領域において有用となる結論が得られるようになっている。
【0002】
【従来の技術】
世界規模の製薬業界では、研究開発に年間300億ドルが費やされており、このうちおよそ3分の1は、前臨床開発及び臨床開発のための薬物候補を選択するまでの期間である発見段階及び初期開発段階に費やされている。薬物発見に重要な臨床的ステップは、以下のステップからなる。(1) ヒトゲノムのセグメントを含むDNAのシーケンス、(2) 特定の病気又は生物学的機能と関連するゲノムを有する遺伝子の同定、(3) 該機能的遺伝子に関連し、又は該機能的遺伝子によりエンコードされ、後に薬物発見のための生物学的ターゲット又は分子ターゲットとなるレセプタ又は酵素などのタンパク質の生成、(4) 分子ターゲットに対して活性を化合物ライブラリーからスクリーニング、(5) 他の生物学的ターゲットに対して最も活性の高い化合物をスクリーニングして、目的の生物学的/分子ターゲットに対する該化合物の選択性又は特異性について評価し、また他のターゲットに対する活性により望ましくない副作用が起こる可能性について評価、(6) 毒性、吸収性、分布、代謝、排出等の特性を検定するための一定範囲のアッセイにおいて、最も作用が強く選択性の高い化合物を評定、(7) 上記の情報を用いた経験的判断に基づいて最も有望な化合物を評定し、該情報を化学合成グループに送り初期活性化合物の類似体を生成、(8) 該化学的類似体をステップ(4)、(5)及び(6)において再テスト後、最適な誘導化合物又は化合物群が同定されるまでステップ(7)を繰り返す、(9) この最適な誘導化合物を更なる前臨床試験及び臨床試験に使用する。
【0003】
この発見及び開発のプロセスにおいて、狭いフィルターを通過した化合物は、より高価な前臨床開発及び臨床開発ようとして選別される。残念ながら、この選別プロセスに続く前臨床開発及び臨床開発において、化合物がこれらの段階をクリアできず、商品化にまでたどり着かないことがしばしばある。これらの失敗のため、1つの新薬を開発し発売するための平均コストは3億ドルを超えると推定されている。しかしながら、もし、発見及び開発プロセスの初期段階で最適な薬物候補を正確に同定することができ、該薬物が前臨床試験及び臨床試験をクリアすることができれば、開発コストは75%も低減することができる。明らかに、製薬の研究開発(R&D)における主要目的は、上記のような薬物開発初期段階のテストの予測可能性を向上させることにある。
【0004】
バイオテクノロジーにおける技術革新と、実験プロセスの多くを自動化できる器具の発達により、製薬R&Dに重大な影響を与える2つの主要なトレンドが生まれている。第一に、ヒトゲノムのシーケンスにおける進歩により、新薬発見スクリーニングプログラムに使用できる(新規レセプタ及び酵素などの)分子ターゲットの数は、急激に増加し続けている。約400個の分子ターゲットが新薬発見のために調査されており、ヒトゲノム計画により解明されるであろう潜在的分子ターゲットの数は数千から1万以上と推測されている。第二に、自動化及び組み合わせ化学(combinational chemistry)などの新技術により、新薬発見スクリーニングプログラムに用いることができる化合物ライブラリーのサイズは、およそ10倍(多くの製薬企業が有する100万種以上の化合物)に膨張している。これらの2つの要因は新薬発見に大きな見込みを与えるが、一方では、新薬開発のコスト面において望ましくない結果をもたらす重大な潜在的問題をも生み出している。さらに多くのターゲット及び化合物が更なる生物活性化合物の発見につながり、その結果、前臨床試験に進むための最適な薬物候補の選択において大きな困難が生まれ、また、より多くの化合物が前臨床試験及び臨床試験に進むことによりこれらの段階でより多くの失敗が生まれるため、開発コストは増大するであろう。
【0005】
これらの要因により、誘導化合物の選別、最適化及び検認においては、迅速かつ低コストな(「試験管」又はマイクロプレートベースの)インビトロ・アッセイがますます必要となる。このような迅速なアッセイは、後の高価な新薬開発段階に移行する前に、これらの活性化合物のうち最も有望なものを同定するのに役立つであろう。これらの要因により、さらに、遺伝子及び遺伝子生成物(分子ターゲット)、化学的構造、及びスクリーニング結果に関する膨大なデータを管理し解釈するためのより効果的な方法が必要となる。
【0006】
製薬R&Dにおいて重要性が増しているインビトロ・アッセイの応用の一つは、「プロファイリング」である。この特許出願の権利者は、1980年代後半にプロファイリングの概念を開拓した。製薬企業は、新薬として開発される化合物の薬物学的活性及び潜在的副作用の特徴付けのためのインビトロ・アッセイの膨大なアレイを有している。現在、中枢神経系障害、免疫病、痛み及び炎症、感染病、癌、代謝又は成長因子、心臓血管機能、及び内分泌系に関わる病気を含む、広範囲の人間の病気において重要な役割を果たす分子ターゲット、必要なレセプタ及び酵素に基づいて、日常的に行われる200以上の異なるアッセイが存在する。薬品は、細胞レセプタとの相互作用により、世界市場機能の半分以上をしめている。さらに、多くの薬品の副作用は、そのレセプタ及び酵素との相互作用により緩和されるようになっている。
【0007】
プロファイリングにおいて、ある製薬企業の、一般的には前臨床開発段階に入っている誘導化合物は、レセプタ及び酵素アッセイ装置によりテストされる。プロファイリングプロセスで得られる、この企業の化合物と特定のレセプタとの相互作用に関する情報は、誘導化合物の最適化及び選別において重要であり、また化合物の副作用又は第2の効能の可能性についての示唆ともなる。この知識により、この製薬企業は、該化合物の前臨床及び/又は臨床開発にかかる時間と費用数百万ドル分を潜在的に節約することができる。
【0008】
長年、プロファイリングサービスが行われてきたが、製薬企業は一般的に、これらのテストから得られるデータを経験則的に使用していた。多くの薬物は、選択性の高い薬物も含めて、数多くのレセプタ又は他の分子ターゲットと相互作用する。したがって、プロファイリングにより生成されるデータの解釈は、製薬企業の研究者が、経験及び知識に基づき、化合物の化学的構造及び化合物と特定のレセプタとの結合作用の両方のデータを参酌して行うものである。残念ながら、最も経験を積んだ薬理学者でさえ、様々な薬物と、新薬開発に関連した広範囲のレセプタとの相互作用についての知識は完全ではない。
【0009】
遺伝子及び遺伝子生成物(分子ターゲット)、化学的構造、及びスクリーニング結果に関する膨大なデータを管理し、照合し、解釈し、及び活用するためのより効果的な方法の必要性から、バイオ情報学及び化学情報学、又は生物学的及び科学的データの管理における新たな機会が創造されている。新薬発見のための情報の膨大なプールを作り出す諸段階は、以下の各段階からなる。(1) DNAシーケンス(細胞が遺伝子生成物又はタンパク質を生成するための設計図となる遺伝的物質又は遺伝子のコーディング)、(2) 機能的ゲノミクス(特に薬物又は生物学的機能の変化に応じて、mRNA生成物を介して、DNAシーケンスを、関連する遺伝子生成物又はタンパク質に転換するプロセス)、(3) プロテオミクス(アミノ酸シーケンス、及び/又は、遺伝子にコーディングされているレセプタなどの遺伝子生成物又はタンパク質の3次元構造の同定)、(4) 微量分子の薬理学/毒物学(レセプタなどの遺伝子生成物と、薬物となり得る微小有機化合物との分子結合性又は相互作用)、(5) 化学的構造(微小分子、薬物類似化合物について)。
【0010】
DNAシーケンスのためのデータベース(グループ1)は確立されており、Genbank、ゲノムセンターなどを含む。同様に、化学的構造のデータベース(グループ5)もまたよく知られており、MDL(Isis)やOxford Molecularなどのベンダーにより提供されている。プロテオミクスのデータベース(グループ3)、例えばSWISS−PROT、ProLink及びPDBなども、また、構築されている。これらのデータベースは、構造情報を含んでおり、その1次元において、あるいは構造情報又はシーケンス情報の1コンポーネントにおいてパターンを決定するのに用いることができるので、それぞれを1個のコンポーネントとして考えることができる。グループ2及び4のデータベースはまだよく構築されていないが、新薬発見及び開発のための情報プールの貴重な追加情報となるだろう。これら後者2つの形式のデータベースは、遺伝子対タンパク質(グループ2)及びタンパク質対化合物(グループ4)などのように、2つの構造間の相互作用に関するデータを含んでいるので、2個の構成部品からなり、2次元的である。このようなデータベースの関係性は、1構成部品からなるデータベースに比べて、複雑さのレベルが追加されたものである。
【0011】
グループ4のタンパク質対化合物の関係性のための部分的データベース又は複数のデータベースが現在構築されている。例えば、本願権利者がクライアントに提供している、広範囲のレセプタターゲットに対する単一化合物の結合プロファイルは、グループ4タイプのデータベースの部分的データセットである。同様に、化学的構造データベース(グループ5)に含まれているような数千から数十万種の化合物を、特定のレセプタターゲット(グループ3内の単一点)に対する活性によりスクリーニングするような高度処理スクリーニングプロジェクトによって生成されたデータは、グループ4のデータベースの一部となるであろう。このような部分的グループ4データベースは新薬発見及び開発において役に立つであろうが、これらには2つの主要な欠点がある。第一に、これらは、単一化合物又は限られた化合物セットの、一定範囲のレセプタ(プロファイル)又は1個のレセプタターゲットにおける多数の化合物に対する結合選択性などのような、特定の2個コンポーネントの分析に関するものである(高度処理スクリーニングプロジェクト)。いずれのケースにおいても、複数のレセプタターゲットと複数の化学的構造との間の統計学的相関関係を扱えるほどデータセットの幅は十分に大きくはない。第二に、重要なことであるが、これらの部分的データセットは、構造的新規性、すなわち特に新薬としてのポテンシャルに基づいて選択された化合物に関して生成されるものである。これらは新規な化合物であるから、動物又は人間の体内における活性についての生物学的情報は全く存在しない。したがって、このようなアプローチは、上記のように、プロファイルのデータを経験的に解釈しようとする薬理学者と同じ限界に苦しめられることになる。
【0012】
【発明が解決しようとする課題】
したがって、本発明の目的は、新薬発見及び開発に関連したデータ分析のためのシステム及び方法を提供することにより、上記の必要を満たすことである。多数の化合物の多数の分子ターゲットに対するテスト結果から得られるポジティブデータ及びネガティブデータを含む、全分類スクリーニングデータベースが提供される。化合物及び分子ターゲットの組み合わせ数は、統計学的手法又は他のデータマイニング方法の分野において通常の知識を有する者が、このスクリーニングデータベースと、関連する化合物データベース及び分子ターゲットデータベースとを用いることにより、どの化合物が臨床試験に適しており、安全かつ効果的な薬物となる高い見込みがあるかについて、信頼性の高い予測をすることができる程度に大きくなくてはならない。
【0013】
【課題を解決するための手段】
本発明は、特に、上記要求を満たすようなシステム及び方法をここに開示する。このシステムには、複数の化合物に関連する記録及び該複数の化合物の人間及び動物の生物学的システム上の作用に関連する記録を有する第1のデータベースと、複数の分子ターゲットに関連する記録を有する第2のデータベースとからなるコンピュータシステムが含まれる。このコンピュータシステムは、さらに、第1のデータベース中の化合物と第2のデータベース中の分子ターゲットとの間の結合性、反応性、その他の相互作用に関するテストに関連する記録を有する第3のデータベースを含む。上記テストには、第2のデータベース中の複数の分子ターゲットから選択された、特定の分子ターゲットと相互作用することが知られている化合物(例えば、対照剤又は対照基準)との相互作用において、第1のデータベース中の複数の化合物から選択された化合物が有する作用効果についての情報が含まれており、また上記テストは、第2のデータベース中の複数の分子ターゲットに対して行われるようになっている。前記副作用に関連する相互作用テストの閾値を設定するための手段、及び化合物、化合物セット、及び/又は作用効果テストの結果が前記相互作用テスト閾値に合致するときのこれら化合物に関する情報を選択するための手段もまた、前記コンピュータシステムに含まれている。第1のデータベース及び第2のデータベース中の情報、並びに、第1のデータベース中の1以上の化合物の記録と、及び/又は第2のデータベース中の1以上の分子ターゲットの記録とに関連する第3のデータベース中の情報を、特に前記相互作用テスト閾値に合致する結果に関連した化合物、分子ターゲット、その他のデータベース記録に関して、ユーザが閲覧し及び操作し、又は分析することができるよう、ユーザインタフェースが設けられている。
【0014】
さらに、本発明は、統計学的手法及びその他のデータマイニング手法をこれらの多次元データベースに応用して、新薬発見及び開発に関連する相関関係又はパターンを決定することにも関連している。
【0015】
上記の一般的記述及び以下の詳細な記述は、ともに、実施例と説明を提供するだけであり、これらの記述により本発明の特許請求の範囲が制限されるべきものではない。
【0016】
本明細書の一部として含まれる添付図面は、本発明の実施形態を示すものであり、また、本明細書の記述と合わせて、本発明の利点と原理を説明するためのものである。
【0017】
【発明の実施の形態】
本発明の好ましい実施形態を説明するが、その実施例は添付図面に示されており、また本発明の詳細な説明からも明らかとなるであろう。異なる図面における同一の参照番号は、可能な限り、同一又は同類の要素を示すものとする。
【0018】
本発明に一貫するシステム及び方法により、新薬発見及び開発に関連したデータを分析して、例えば、新規化合物が安全又は効果的な新薬となる可能性が高く、全臨床試験及び臨床試験の段階に進むべきかどうかを予測することが可能となる。以下の記載では、本発明のシステム及び方法を、複数のメインテーブルを含むリレーショナルデータベースに関連して、また、化合物及び分子ターゲット間の結合性をこれら2者間の相互作用の測定基準として使用する用法に関連して説明する。この説明はまた、一般的に、複数のメインコンポーネントを有する他のデータベース構造や、化合物及び分子ターゲット間の他の相互作用の測定にも適用され得るものである。
【0019】
本発明は、化合物、分子ターゲット、特にタンパク質、その他の高分子、及びこれら化合物の生物活性に関する情報豊富なデータベースの新規な設計、構造、及び応用に関するものである。本発明はさらに、全臨床試験又は臨床試験を通過しなかった既知の薬物及び薬物候補を、これらの化合物の副作用、反応機構その他の医学的データを含む前臨床データ及び臨床データとともに、データベースの化合物ライブラリーの情報源として使用する方法にも関する。本発明はまた、データベース中の化合物と分子ターゲットとの結合その他の相互作用を決定し、また、関係性分析法及びデータマイニング手法を用いて、これらの相互作用パターンと、新薬発見及び開発に関連した特定の生物反応との、又はこのような相互作用をする化合物の特定の化学的構造、下部構造、その他の特徴との、又はこのような相互作用をする分子ターゲットの生化学的特徴、構造、その他の特徴との相関関係を決定する。このようなデータマイニング技術の例として、以下を参照することができる。これらの参照資料は全て本発明に含まれるものとする。
a) Chen et al.、3次元デスクリプタを用いた大規模構造−活性データセットの再帰的分割分析(Recursive Partitioning Analysis of a Large Structure−Activity Data Set Using Three−Dimensional Descriptors)、Journal of Chemical Information and Computer Sciences、1998年10月;
b) Hawkins et al. 、再帰的分割を用いた大規模構造−活性データセットの分析 (Analysis of a Large Structure−Activity Data Set Using Recursive Partitioning)、Quant. Struct.−Act. Relat.、16:296−302(1997年);
c) DePriest et al.、アンギオテンシン転換酵素及びサーモリシン阻害剤の3D−QSAR;演繹的、経験的に決定される活性部位ジオメトリックスに基づくCoMFAモデルの比較 (3D−QSAR of angiotension−converting enzyme and thermolysin inhibitors; a comparison of CoMFA models based on deduced and experimentally determined active site geometrics)、J. Am. Chem. Soc. 115:5372−84(1993年);
d) Good et al. 、コンピュータ化学におけるレビュー (in Reviews in Computational Chemistry); Lipkowitz, K. B.、Boyd, D. B. (des.)、VCH, Newyork, Vol. 7. pp 67−117(1996年);
e) Marshal et al. コンピュータ利用製薬設計(Computer−Assisted Drug Design) ACS Symposium Scrica 112; American Chemistry Society: Washington, DC, 1979年; pp 205−226;
f) Molec et al.、3次元構造活性の関係性及び生物学的レセプタのマッピング (A three−dimensional structure activity of relationship and biological receptor mapping)、Mathematics and Computational Concepts in Chemistry; Ellis Horwood; Chichester, 1985年; pp 225−251;
g) Mayer et al.、構造活性研究に一致するアンギテオシン転換酵素の活性部位の特異的ジオメトリ (A unique geometry of the active site of angiotensen−converting enzyme consistent with structure activity studies) J. Comput. Aided Mol. Des., 1:3−16.(1987年);
h) Sheridan et al.、ディスタンスジオメトリ法に対するアンサンブルアプローチ (The ensemble approach to distance geometry):application to the nicotinic pharmacophone, j. med chem.. 29: 899−906 (1986年);
i) Martin et al.、Pharmacophoneマッピングに対する高速で新しいアプローチ及びそのドーパミン及びベンゾジアゼピン拮抗薬への応用 (A fast new approach to pharmacophone mapping and its application to dopaminergic and benzodiazepine agonists) J. Comput. Aided Mol. Des., 7;83−102(1993年);
j) Catalyst/Hypo Tutorial, version 2.0, BioCAD Corp. Mountain View, CA, 1993年;
k) Sprague, P. W., 化学的仮説の自動的生成及び触媒によるデータベース検索(Automated chemical hypothesis generation and database searching with Catalyst), Perspect. Drug Discov. Des., 3:1−20(1995年);
l) Barnum et al. (Identification of common functional configurations among molecules)、J. Chem. Inf. Comput. Sci., 1996, 36:563−71(1996年);
m) HipHop Tutorial, version 2.3; Molecular Simulation Inc.; Sunnyvale, CA, 1995年;
n) Davies, K. 及び Upinn, R., 3D pharmacophore searching, net. Sci., (http://www.org/Science/Cheminform/feature02.html);
o) Golender, V. 及び Vesterman, B.、薬物設計のためのAPEX 3Dエキスパートシステム (APEX 3D expert system for drug design)、Net. Sci. (http://awod.com/netsci/science/compchem/feature09.html);
p) Van Drie, J.、pharmacophoreの3Dデータベースクエリー決定のための戦略 (Strategies for the determination of pharmacophoric 3D database queries)、J. Comput. Aided Mol. Des., 11:39−52 (1997年)
q) Van Dire, J. 及び Nugent, R.、組み合わせ化学が提起する問題への取り組み (Addressing the challenges posed by combination chemistry):3D databases, pharmacophon; recognition and beyond, SAR QSAR Environ. Res., 9:1−21(1998年);
r) Finn et al.、帰納論理学プログラミングprogolを用いたPharmacophonreの発見 (Pharmacophonre discovery using the inductive logic programming progol) Machine Learning, Special Issue on Applications and Knowledge Discovery, Kluwer Academic Publishers: Boston, 1998, pp 1−33;
s) Jain et al.、製薬設計のための形状に基づく機械学習ツール (Compass: a shape−based machine learning tool for drug design)、J. Comput. Aided Mol. Des., 8:635−52(1994年)。
【0020】
製薬業界における標準的操作手順とは違って、グループ4データベースは2個より多いコンポーネントからなるデータベースとして構築されなければならず、また、レセプタ又は酵素ターゲットと化合物との両方において相当な範囲をカバーするものでなければならないと、バックグラウンドセクションは示唆している。例として、3コンポーネントからなるデータベースを構築するには、まず、新薬発見及び開発に直接関連する情報を豊富に含んだ広範囲の化合物セットを選択する。最も関連性の高い情報は、人体については臨床試験及び/又は市販後調査において、動物については前臨床試験において、このような化合物をテストした実際の経験から得られることが多い。他の関連する生物学的情報は、1以上の生物活性を示す自然物質や、レセプタの生物学的特徴を研究する当業界で使用されている化学的参照基準から得ることができる。したがって、このようなグループ4のデータベースのために選択される情報豊富な化合物の一実施形態には、市販の薬品、臨床試験又は前臨床試験をクリアしなかった薬物、生物活性な自然物質又は自然抽出物、及びレセプタ結合アッセイに用いられる対照剤などが含まれる。
【0021】
このようなデータベースは、科学文献から得られるスクリーニングデータを用いて構築することができる。このアプローチでは部分的データセットを生成することができるであろうが、限界がある。第一に、文献参照によって得られるのは、一的に、ポジティブな情報(例えば、特定の化合物と特定のレセプタとの結合の阻害についてのレポート)だけである。有用な情報の比較を行うためには、ネガティブデータもポジティブデータと同様に重要である。さらに、ポジティブ及びネガティブの両データが揃っていないデータセットには、ある種の統計学的分析は適用できないだろう。第二に、それぞれ個別の、1の化合物の1のレセプタに対する結合性データに関する記事の定量的レポートと、他の化合物の同レセプタに対する結合性データに関する別のレポートとでは、アッセイの行われる方法が異なるため、比較することができない。したがって、グループ4の3コンポーネントデータベースを生成するための一実施形態は、広範囲のレセプタ又は酵素ターゲットについて、広範囲の化合物アレイをスクリーニングすることにより、一貫性のある比較結果を得て、ポジティブ及びネガティブの両データを確保するものとなるであろう。
【0022】
化合物コンポーネント:化合物ライブラリーの選択及び化合物データの包括
本発明は、薬学研究開発に関連した生物活性が知られている化合物を1個のコンポーネントとして含むデータベースに関する。生物活性に関する情報は、化合物のデータベース又はテーブルに含むことができる。
【0023】
例えば、これらの情報豊富な化合物には以下のものが含まれる。
(a) 未知の化合物と、レセプタ又は酵素など特定の分子ターゲットとの間の相互作用又は分子結合を測定するための薬理学的対照剤又は対照基準である化合物。このような対照剤化合物の例には、試験化合物とレセプタ又は酵素を含む分子ターゲットとの間の結合作用を特徴付けるために用いる化合物が含まれる。他の対照剤には、Sigma Aldrich Corp.の1団体であるResearch Biochemicals Inc. (RBI)のカタログや、その他の当業界に知られた情報源から選択された化合物が含まれ得る。これらの薬理学対照剤化合物は、事前にテストされるか、及び/又は薬品として市販されているか、あるいは生物活性の高い自然物質であるため、以下の3カテゴリーと重複する可能性がある。
(b) 現在又は過去に医療用として市販され、また相当量の生物学的情報が利用可能な既知の薬物である化合物。これらの化合物はよく知られており、連邦食品医薬品局(FDA)などの米国政府官庁より入手可能な刊行物や、また民間企業又は非営利団体が発行する刊行物に掲載されている。非営利団体から発行されているこのような刊行物の一つは、米国薬局方会議(United States Pharmacopeial Convention Inc.)によるUSP DI Seriesであり、この中の、第I章.医療業者のための薬物情報 (Volume I. Drug Information for the Health Care Professional)は、USP DI Updateにより毎月更新されている。販売許可された新薬は、このカテゴリーに属することとなる。市販の薬品、又はFDA又はこれと同等の外国の規制団体に認可された薬物は、公開された記録となるので、通常の知識を有する当業者はこのカテゴリーに属するような化合物を容易に同定することができるだろう。
(c) 新薬となる見込みがあるとしてIND(治験薬:Investigational New Drug)ステータスを与えられたが、FDAからの認可を得るための臨床試験において十分な効能又は安全性を達成できなかった化合物、あるいは市販薬品としてのステータスを得るには至らなかった化合物などの、人体でのテストを許可された化合物。このカテゴリーの化合物には、FDAに販売認可されたが、後に市場から撤退したような化合物も含まれ得る。これらの化合物もまた、相当量の有用な生物学的情報を含んでおり、特に本発明の目的のために有用となるであろう。失敗した薬物の識別情報は、製薬企業又はバイオテクノロジー企業からの公式発表、“Pink Sheets”などの刊行物、及びFDAが保有しているリストなど、多くの情報源から得ることができる。
(d) 植物、微生物、動物等の自然資源から得られる生物活性を示す化合物。これらの自然物質には、新薬発見及び開発に関連する情報を与える、毒物、抗菌剤、行動調整剤(behavioral modifier)、防衛剤、その他のカテゴリーの化合物が含まれるであろう。自然物質の識別情報は、RBIやSigma Aldrichの化合物カタログなどの多くの刊行物から得ることができるが、これらに限られるわけではない。
【0024】
このデータベースに含まれる化合物のそれぞれについて、化学的構造、化学式、物理化学的特性、化学的空間配置、その他の空間化学情報(例えば、Smiles codes)、可溶性、その他の関連データが、利用可能な範囲で、データベースのフィールドに収録されている。通常の知識を有する者は、その他の収録可能なパラメータを認識することができるだろう。データベース中の化学構造の関係性から、又は他の関係性から、化合物を構築することができる。
【0025】
図1Aは、リレーショナルデータベースの化合物テーブル300を示す。テーブル300には複数の化合物がリストされており、複数の化合物Nの記録(行1 ̄N)を含んでいる。各化合物について、該化合物に関する情報を含む列301 ̄307がある。例えば、図1Aにおいて、列301は化合物名を、列302は化合物の種類(例えば、人体での試験を許可された化合物など)を、列303は化学的構造に関する情報、例えば、構造図を含むスクリーンを呼び出すためのハイパーリンク(図1Bのスナップショット310を参照)を、列304は化合物の化学式を、列305は化合物の物理化学的特性に関する情報を、列306は化合物の空間配置を、列307は化合物の可溶性に関する情報を含んでいる。
【0026】
テーブル300にリストされた各化合物301に関するその他の関連データを含めることができるように、さらに列を追加してもよい。これらの追加された列に化合物の生物活性を含めることにより、化合物データベースを2コンポーネントのデータベースにすることもできる(データベース500を参照)。
【0027】
図1Bは、テーブル300中の記録に関連する情報を含むスナップショット310を示す。例えば、化合物の化学式304を、化合物の構造303とともに、スナップショットに含めることができる。
【0028】
分子ターゲットコンポーネント:レセプタ、酵素、その他の分子ターゲットの選択及び分子ターゲットデータの包括
本発明のデータベースの第2のコンポーネントには、分子ターゲットとして、新薬発見及び開発に関連するレセプタ、酵素、その他のタンパク質、核酸、炭水化物、その他の高分子化合物などが含まれる。本発明の1実施形態では、レセプタ及び酵素が主要な分子ターゲットである。レセプタは、体内の細胞及び器官における分子レベルのコミュニケーションの大部分を緩和する。酵素は、例えば、2次的メッセンジャシステム及び細胞シグナル経路によって、このようなコミュニケーションを増大させることが多い。
【0029】
レセプタには、ドーパミンレセプタ、セロトニンレセプタ、アヘン剤レセプタ、ムスカリン性レセプタ、アドレナリン作用性レセプタ、アデノシンレセプタ等の典型的なレセプタ群が含まれる。これらのレセプタ群には、レセプタタイプのサブタイプ(ドーパミン−1、ドーパミン−2、ドーパミン−3、ドーパミン−4及びドーパミン−5レセプタなど)が含まれる。あるサブタイプは、さらなるバリエーション(ドーパミン4.2、ドーパミン4.4及びドーパミン4.7など)を有し、又は異なる形状(ドーパミン2 short及びドーパミン2 longなど)を持つものもある。特定のレセプタをエンコーディングする遺伝子の変異が起こることにより、薬物その他の化合物に対する結合性が通常のレセプタとはわずかに異なるレセプタ群のサブセットが誘導される可能性があり、レセプタのスプライス変形が出現する可能性もある。レセプタは、ファミリ、スーパーファミリ、又はサブファミリにより分類することができる。G−タンパク質結合レセプタ、膜貫通型レセプタ、核レセプタ等の分類法がある。関連遺伝子のDNAシーケンスの類似性の程度によって、レセプタを分類することができる。また、アミノ酸シーケンス及びこれに関連する3次元配位によっても、レセプタを分類することができる。組織内のレセプタ出現位置によって、又は異なる細胞種にわたって、レセプタを分類することができる。
【0030】
酵素には、プロテアーゼ、カルボヒドラーゼ、キナーゼ、ホスホターゼ、DNA修飾酵素、トランスフェラーゼ、P450、その他の当業者に知られた酵素が含まれる。
【0031】
本出願人は、他のレセプタ、レセプタ供給源、及びこれに関するアッセイを常時開発して、データベースコンテンツに追加している。追加されるレセプタ及びレセプタアッセイは、当業者によく知られたものである。新薬発見及び開発に関連するレセプタについてのリスト及び記述は、当業者に知られている多くの刊行物から得ることができる。これらの刊行物には、RBIレセプタ分類ハンドブック(RBI Handbook of Receptor Classification)及びIUPHARレセプタ分類書(IUPHAR receptor classification book)が含まれる。さらに、新規のレセプタ及びレセプタサブタイプが発見されると、これらもデータベースコンテンツに追加される。
【0032】
酵素及び酵素アッセイは当業者によく知られている。新薬発見及び開発に関連するレセプタについてのリスト及び記述は、当業者に知られている多くの刊行物から得ることができる。
【0033】
図2は、分子ターゲット情報にアクセスするために使用できるリレーショナルデータベースシステムの部分を構成するテーブル400、410及び420を示す。テーブル400にはターゲットがリストされており、複数のターゲットMの記録(行1〜M)を含んでいる。列401にはターゲット名がリストされており、列402には各ターゲット名についてターゲットのタイプが特定されている。
【0034】
テーブル構造は、列402に特定されるターゲットのタイプにより変化させてもよい。テーブル410には、レセプタとして分類されテーブル400にリストされたターゲットに関する情報が含まれている。特定のレセプタ名についてデータベースをクエリーすることにより、テーブル410の記録にアクセスすることができる。テーブル410のレセプタ名は、列402の“レセプタ(Receptor)”と示されているターゲット名についてテーブル400をクエリーすることにより、アクセスが可能である。
【0035】
テーブル410の列411にはレセプタ名が含まれているが、このレセプタ名はテーブル400の列401のターゲット名にもなっている。列412はレセプタのファミリ情報を含み、列413はレセプタのスーパーファミリ情報を含み、列414はレセプタのサブファミリ情報を含み、列415は関連遺伝子のDNAシーケンスの類似性の程度に関する情報を含み、列416はアミノ酸シーケンスに関する情報を含んでいる。アミノ酸シーケンスは、データベースに含まれている多数の分子デスクリプタの1つである。他の分子デスクリプタ417には、例えば、アミノ酸シーケンスに関連した水治療法プロットが含まれていてもよい。テーブル400、410及び420に示す分子ターゲットデータベースにはターゲット情報が含まれており、ターゲットに関連する生物学的情報もまたデータベースに含まれているため(テーブル600)、このデータベースは2コンポーネントからなると考えられる。ここに示した列は、データベースに含まれ得る情報のタイプを示すものであり、本発明を限定するものと解釈されるべきではない。
【0036】
テーブル420には、テーブル400に酵素として分類されているターゲットの情報が含まれている。特定の酵素名についてデータベースをクエリーすることにより、テーブル420の記録にアクセスすることができる。テーブル420の酵素名は、列402に“酵素(Enzyme)”と示されているターゲット名についてテーブル400をクエリーすることによりアクセスできる。
【0037】
テーブル420の列421には酵素名が含まれているが、この酵素名はテーブル400の列401のターゲット名にも含まれている。列422は酵素のタイプに関する情報を含んでいる。列423は“その他の関連情報”とされており、ユーザがアミノ酸シーケンス及び分子デスクリプタを含む他の酵素情報にアクセスしたい場合などに応じて、さらなる列がテーブル420に追加される可能性があることを示している。
【0038】
ターゲットのタイプによる分子ターゲット情報へのアクセスを説明するために、テーブル410及び420のみを示したが、このリレーショナルデータベースシステムには、データベースに使用可能な分子ターゲットターゲットのタイプの数に応じて、さらなるテーブルを追加することができる。
【0039】
生物学的情報コンポーネント:生物学的/化学的情報のパラメータ
データベースの一部を構成する生物学的情報には、例えば、副作用、薬理作用のメカニズム、薬物による代謝、毒性、吸収性、分布及び排出などに関する事項が含まれている。これらの情報は、市販薬のFDA認可ラベルから、又は臨床試験をクリアしなかった薬物に関する文献及び刊行物から得ることができる。パラメータの具体例として、毒性、LD50、LD50/ED50、催奇性、毒性メカニズム、毒性のターゲットとなる器官、インビトロ毒性バッテリー、アポトーシス誘発性、生物学的利用性(バイオアベイラビリティ)、吸収性、血液脳関門、経口吸収性、粘膜吸収性、吸収率%、分布、限界血液タンパク質、半減期、作用の発現、作用の持続性、血液内濃度のピーク、代謝、主要経路、非主要経路、活性代謝物質、排出、第1排出様式、第2排出様式、インビトロ効用、治療法の指示、動物行動での作用、副作用、既知の主要なターゲット、その他のターゲット器官/システム、及び既知のレセプタ相互作用があげられる。
【0040】
図3は、上記のうちいくつかの生物学的情報パラメータを含むテーブル500を示す。テーブル500は、第1のデータベース内に存在し得る全ての化合物に関連するN個の行(1〜N)からなる。列501には化合物名が含まれ、列502には(市販薬又は試験をクリアしなかった薬物についての)治療法の指示が含まれ、列503には毒性に関する情報が含まれ、列504には副作用に関する情報が含まれ、列505には薬物の作用メカニズムに関する情報が含まれている。例えば、テーブル500をテーブル300と関連付けることにより、化合物及び生物活性の2コンポーネントテーブルを構成することができる。
【0041】
図3はまた、データベース内の分子ターゲットに関連した生物学的情報パラメータを含むテーブル600を示す。第2のデータベース内に存在し得る全てのターゲットに関連するテーブル600は、P個の行(1〜P)からなる。列601にはターゲット名が含まれ、列602には(市販薬又は試験をクリアしなかった薬物についての)治療法の指示が含まれ、列603には毒性に関する情報が含まれ、列604には副作用に関する情報が含まれている。上記同様に、例えば、テーブル600をテーブル400と関連付けることにより、分子ターゲット及び生物活性の2コンポーネントテーブルを構成することができる。テーブル500及び600はともに、分子ターゲット情報、化合物情報、及び各分子ターゲット及び各化合物に関連した生物活性情報を含む全分類データベース(例えば、リレーショナルデータベースシステム内に存在し得る化合物及び分子ターゲットの全組み合わせを含むもの)とすることができ、また、多次元データベースとみなすことができる。本発明の範囲を逸脱することなく、テーブル500及び600に追加の列を加えることができる。
【0042】
結合性情報の決定
本発明の主要な特徴は、化合物、分子ターゲット及び生物学的情報からなる複数の情報コンポーネントの構成と、化合物及び分子ターゲット間の結合性、反応性、その他の相互作用についての評価である。この結合性又は反応性に関する情報を再度既知の生物学的情報に関連付けることにより、新薬発見及び開発に使用できるパターン又は関係性を選別することができる。本発明の重要な側面は、化合物及び分子ターゲット間の広範囲かつ一貫した結合性又は反応性データを生成することにより、必要なパターン又は関係性を特定するための可能な限り完全なデータセットを提供し、また、ポジティブ及びネガティブ両方の結合性又は反応性情報を提供することである。本発明の1実施例では、例えば、特定の分子ターゲット又は分子ターゲットセットに対して閾値セットを満たすか満たさないかを示す数値デスクリプタとして、結合性データを構成する。この数値デスクリプタは、生物学的システム又は生物学的情報セットに適する閾値にほぼ近い濃度において評価された、各化合物及び各レセプタ、その他の分子ターゲットに対する反応性の有無に関連付けることもできる。例えば、ある化合物について、レセプタ及びこれに対応する特異化合物間の結合阻害を、濃度10−5M(10マイクロモル)、閾値30%でテストすることができる。この他に、初期濃度又は阻害率閾値を設定することができる。また、本発明の1実施形態においては、この最初のイエス/ノーテストにおいて閾値を超える結合阻害を起こす化合物について、結合阻害能をさらにテストする。これらの活性化合物について、例えば、10−5〜10−9Mの範囲内の7〜14の異なる濃度を含む一連の濃度条件でテストを行い、特定のレセプタにおける活性化合物のIC50及び/又はKiの値を決定する。この決定をするための濃度条件の数はこれよりも多くとも少なくともよく、また、10−5〜10−9Mより高い又は低い濃度範囲を使用することが必要となることもあるだろう。これらのデータから、各分子ターゲットに対する各活性化合物の相対的活性度又は相対的効能のマトリクスが得られる。
【0043】
これらのスクリーニングデータを生成するために、まず、化合物を適当な溶媒系において可溶化する。溶媒系は、例えば4%DMSOなどを用いることができるが、その他の濃度のDMSO又は他の溶媒を用いることもできる。次に、これらの化合物のストック溶液を適当な濃度に希釈して、貯蔵溶液(repository)として利用できるようにする。化合物及び分子ターゲット間の相互作用を測定するための各アッセイごとに、用いる試薬及び手順は異なったものとなる。このような各アッセイを特徴づけ、ルーチン化して一貫性のあるものにする必要がある。アッセイを行うごとに、適当な対照試験を行う必要がある。所望のタイプ及び正確さを持つ情報を生成することができるあらゆるアッセイフォーマットを使用することができる。放射性標識、蛍光分析、蛍光偏光分析、時間分解蛍光分析、蛍光相関性分光分析、化学ルミネセンス、UV吸光、比色分析など、数多くのアッセイ検出システムを使用することができる。
【0044】
本発明の1実施例では、レセプタ結合アッセイ又は酵素活性アッセイを用いて分子相互作用に関するデータを生成する。例えば、レセプタ結合アッセイでは、貯蔵溶液の化合物を、レセプタと該レセプタ用に選択された参照剤との間の結合相互作用の阻害能についてテストする。レセプタは、動物又は人間の組織などから得ることができ、あるいは、レセプタ用の遺伝子を含むようトランスフェクションされた細胞株からも得ることができる。アッセイのレセプタ源を、例えば、レセプタを含む細胞フラクションとして用意することができる。レセプタは、また、部分的に精製されていてもよい。参照用の化合物又はリガンドは、特定のレセプタに対する潜在的な及び/又は特定の結合に基づいて選択されるのが好ましく、また、ヨウ素125、トリチウム、炭素14、その他の放射性トレーサを含むことにより、結合したリガンドと結合していないリガンドとを識別可能にすることができる。データベースに含まれるべき化合物の結合性データの試験と並行して、ポジティブ及びネガティブの対照試験を行い、参照(放射性)リガンドの様々な濃度での参照曲線により、行われたアッセイの質を保証する。
【0045】
多数の方法及びシステムにより、ターゲット及び化合物間の相互作用を測定することができることを、当業者は理解できるだろう。結合反応を平衡状態に到達させるために、放射性リガンド、レセプタ調製溶液、及び試験化合物を、適当な時間、適当な緩衝溶液中、適当な温度下で培養する。結合放射性リガンドの非結合放射性リガンドに対する量は、ろ過や、SPA(scintillation proximity assay)などの方法を用いた分離ステップにより決定され、液体シンチレーション又はガンマ計数により測定される。次に、試験化合物のアッセイ結果とポジティブ及びネガティブ対照試験とを比較することにより、試験化合物の特定の結合数を決定する。これらのデータから試験化合物の阻害パーセントが計算される。
【0046】
図4には、スクリーニング結果及びアッセイデータベースを表すテーブル200が示されており、データベース300(1〜Nの化合物からなる)に含まれる化合物は、データベース400に含まれる分子ターゲットに対する作用についてテストされるようになっている。テーブル200は数多くの形式を取ることができる。例えば、テーブル210においては、複数の分子ターゲットの各々に対してテストされた複数の化合物の各々のスクリーニング結果が、各測定セットについて選択されたテスト結果閾値を超えるか下回るかに基づいて、スクリーニング結果を“イエス”又は“ノー”のエントリーとして入力することができる。
【0047】
他の例では、スクリーニング結果は、複数の分子ターゲットの各々に対してテストされた複数の化合物の各々について、結合その他の作用の効能又は程度(例えば、化合物−レセプタ相互作用のKi)を特定する数値デスクリプタとして、テーブル220に入力される。好ましい実施形態では、テーブル210及び220において、このような“化合物”דターゲット”の全てのマトリクスポイントが決定され、全種類データベースが生成される。また、スクリーニング結果及びアッセイデータベース200は、他の化合物−ターゲット相互作用の測定結果を含んでいてもよく、この測定結果には、スクリーニング結果の生データ及びこの生データから得られる測定結果、アッセイの手順及び特徴、その他の関連情報が含まれる。
【0048】
図5A及び5Bは、ここではレセプタ選択性でとして例示してある、データベース100をスクリーニングプロセスの一部として使用することにより、更なる開発の対象となるべき新薬候補としての新規化合物を発見し選別すること(図5A)、又は、特定の病気検出のための新薬候補を発見するために使用する潜在的有効ターゲットとしての新規ターゲットを発見し選別すること(図5B)を示している。データベース100は化合物コンポーネント300、分子ターゲットコンポーネント400、生物学的情報コンポーネント500及び600、及びスクリーニング結果及びアッセイデータベース200を含むことができる。
【0049】
新規化合物又は化合物セットをスクリーニングプロセス102に導入して、これらが特定の化合物(例えば、参照剤)及び分子ターゲットに対する結合阻害能を有するかどうかを決定する(図5A参照)。スクリーニングプロセスでは、分子ターゲットコンポーネント400から得られるターゲット情報を使用することができる。
【0050】
スクリーニングプロセス102の結果は、中間データベースに記憶し、又はレセプタ選択性データベース100のスクリーニング結果及びアッセイデータベース200に入力することができる。また、この結果を特定のパラメータ(例えば、細胞毒性など)として、生物学的情報データベース500に記憶し、又は化合物データベース300に(例えば、化合物名として)記憶することもできる。
【0051】
スクリーニングプロセス102から得られる結果の完全なセットを、スクリーニング結果及びアッセイデータベース200に記憶することができる。化合物及び分子ターゲット間の結合に対して阻害能を示す新規化合物(例えば、参照剤)について、このデータベース200をクエリーすることにより、これらの新規化合物をさらにテストすることができる。
【0052】
これに代わって、例えば、「オーファン(orphan)」レセプタなどの新規分子ターゲットをスクリーニングプロセスに導入して、化合物データベース300の化合物に対するテストを行うこともできる(図5B参照)。オーファンレセプタについては、その構造は知られているが、機能及び病気との関連性は知られていない。新規分子ターゲットと相互作用する化合物の識別情報を含むスクリーニングプロセスの結果は、スクリーニング結果データベース200に組み入れられる。データベース100内をクエリーして、新規分子ターゲットの機能を特定し、及び/又は新規分子ターゲットの病気との関連性を確認する。
【0053】
図6Aは、データベース100を使用した新規化合物の薬物としてのポテンシャルの予想を示す。テーブル710は、化合物(300)、分子ターゲット(400)、生物学的情報(500及び600)、及びスクリーニング結果(200)のデータベースの情報に依存している。ユーザが新規化合物に関する情報をデータベース100に与えると、自動クエリースクリプトを実行してこの情報を取得することにより、テーブル710にはこれらのうち1以上のデータベース(又はテーブル)からの情報が含まれるようになっている。
【0054】
このテーブル710を生成するためのクエリースクリプトは、新規化合物の情報を与えられると、化合物を化合物データベース300から選択することができるようになっている。この選択は、新規化合物と、データベース300に既に含まれている化合物との間の、化学的構造その他の特性の類似性に基づいて行うことができる。
【0055】
化合物の選択後、クエリースクリプトは、選択された化合物と反応(結合)することが知られているターゲットをターゲットデータベース400から選択する。最後に、選択された化合物及び分子ターゲットを用いて、生物学的情報データベース500及び600をクエリーし、化合物−分子ターゲットの対に関する生物学的情報をテーブル710に挿入する。これに代わって、ユーザが興味のある特定の生物学的情報カテゴリー(例えば毒性)を入力することにより、テーブル710に含まれる生物学的情報をこのカテゴリーに限定することもできる。
【0056】
ユーザは、テーブル710をクエリーして、新規化合物の薬物として使用のポテンシャルの予測に関連した情報を得ることができる。この例としては、該新規化合物に関連した化合物と反応することが知られている分子ターゲットのクエリー、及びこの分子ターゲットが該化合物とともに引き起こすことが知られている副作用のクエリーが挙げられる。
【0057】
図6Bは、データベース100の使用をして、新規化合物の薬物ポテンシャルの予測と同様なアプローチにより、図6Bに示すデータ入力及びクエリーを用いて、新規分子ターゲットの病気との関連性及び/又は生物学的機能を確認する方法を示す。
【0058】
本明細書で言及した全ての特許、特許出願及び刊行物は、参照資料として本発明に含まれる。
【0059】
上記の本発明の実施形態の記述は、例示及び説明のためのものであり、網羅的なものではなく、また本発明をここに開示した形態に限定するものではない。上記の開示内容に照らして、又は本発明の実施に際して、本発明の修正や変更を行うことが可能であろう。
【図面の簡単な説明】
【図1】
図1Aは、本発明の1実施形態におけるレセプタ選択性マッピングデータベースの化合物テーブルを示す。
図1Bは、本発明の1実施形態におけるレセプタ選択性マッピングデータベースの化合物の空間配置を含む化合物記録のスナップショットを示す。
【図2】
本発明の1実施形態におけるレセプタ選択性マッピングデータベースの、分子ターゲット情報へのアクセスに使用可能な数個の論理テーブルを示す。
【図3】
本発明の1実施形態におけるレセプタ選択性マッピングデータベースの生物学的情報のテーブルを示す。
【図4】
本発明の1実施形態におけるレセプタ選択性マッピングデータベースをスクリーニングプロセスの一部として使用する方法を示す。
【図5】
図5Aは、レセプタ選択性マッピングデータベースをスクリーニングプロセスの一部として使用することにより、新薬候補となる新規化合物を発見し選別する方法を示す。
図5Bは、レセプタ選択性マッピングデータベースをスクリーニングプロセスの一部として使用することにより、特定の病気に対する新薬候補を発見するためのターゲット候補となる新規ターゲットを同定する方法を示す。
【図6】
図6Aは、新規化合物の薬物としての可能性を予測するためのデータベースの使用法を示す。
図6Bは、新規分子ターゲットの病気との関連性及び/又は生物学的機能を確認するためのデータベースの使用法を示す。[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention generally relates to a technique for constructing a multidimensional database by combining chemical informatics and bioinformatics with data on the interaction of chemical molecular targets. In particular, the present invention relates to a database containing compounds, molecular targets, and biological or clinical information, in which patterns or relationships of interactions between the compounds and molecular targets are determined and stored in a database. Comparisons with other information have led to conclusions that will be useful in drug discovery and development and related areas.
[0002]
[Prior art]
The global pharmaceutical industry spends $ 30 billion a year on research and development, of which approximately one-third is the time it takes to select drug candidates for preclinical and clinical development. Spent during the early stages of development. The important clinical steps for drug discovery consist of the following steps. (1) a sequence of DNA containing a segment of the human genome, (2) identification of a gene having a genome associated with a particular disease or biological function, (3) associated with or by the functional gene. Generation of proteins such as receptors or enzymes that are encoded and later become biological or molecular targets for drug discovery, (4) screening from compound libraries for activity against molecular targets, (5) other biology To screen for compounds that are most active against a specific target, assess the selectivity or specificity of the compound for the biological / molecular target of interest, and the potential for unwanted side effects due to activity against other targets (6) To test characteristics such as toxicity, absorption, distribution, metabolism, and excretion (7) The most promising compound is evaluated based on empirical judgment using the above information, and the information is sent to the chemical synthesis group. (8) After retesting the chemical analogs in steps (4), (5) and (6) until the optimal derivative or group of compounds is identified (8) Repeat 7), (9) Use this optimal derivative for further preclinical and clinical trials.
[0003]
In this discovery and development process, compounds that pass through narrow filters are screened for more expensive preclinical and clinical development. Unfortunately, in preclinical and clinical development that follows this screening process, compounds often fail to pass these stages and do not reach commercialization. Due to these failures, the average cost of developing and launching one new drug is estimated to be over $ 300 million. However, if the best drug candidates can be accurately identified early in the discovery and development process, and if the drug clears preclinical and clinical trials, development costs can be reduced by as much as 75%. Can be. Clearly, a major objective in pharmaceutical research and development (R & D) is to improve the predictability of such early drug development tests.
[0004]
Innovations in biotechnology and the development of instruments that can automate many of the experimental processes have created two major trends that have a significant impact on pharmaceutical R & D. First, due to advances in the sequencing of the human genome, the number of molecular targets (such as new receptors and enzymes) that can be used in new drug discovery screening programs continues to increase rapidly. Approximately 400 molecular targets are being investigated for new drug discovery, and the number of potential molecular targets that may be elucidated by the human genome project is estimated to be in the thousands to more than 10,000. Second, new technologies such as automation and combinatorial chemistry have increased the size of compound libraries that can be used in new drug discovery screening programs by approximately 10-fold (more than one million compounds found in many pharmaceutical companies). ) Is expanding. While these two factors offer great promise for new drug discovery, they also create significant potential problems with undesirable cost consequences for new drug development. More targets and compounds lead to the discovery of additional bioactive compounds, resulting in greater difficulties in selecting the best drug candidate to proceed to preclinical trials, and more compounds are needed for preclinical trials and Development costs will increase as going to clinical trials creates more failures at these stages.
[0005]
These factors increasingly require rapid and low cost ("tube" or microplate-based) in vitro assays in the selection, optimization and detection of derived compounds. Such a rapid assay would help identify the most promising of these active compounds before moving on to later expensive drug development stages. These factors further require more effective methods for managing and interpreting vast amounts of data on genes and gene products (molecular targets), chemical structures, and screening results.
[0006]
One application of in vitro assays, which has become increasingly important in pharmaceutical R & D, is "profiling." The patentee of this patent application pioneered the concept of profiling in the late 1980s. Pharmaceutical companies have a vast array of in vitro assays to characterize the pharmacological activity and potential side effects of compounds developed as new drugs. Currently, molecular targets play important roles in a wide range of human diseases, including diseases involving central nervous system disorders, immune diseases, pain and inflammation, infectious diseases, cancer, metabolic or growth factors, cardiovascular function, and endocrine system There are over 200 different assays that are routinely performed, based on the required receptors and enzymes. Drugs account for more than half of the global market function due to their interaction with cell receptors. In addition, the side effects of many drugs have been mitigated by their interaction with receptors and enzymes.
[0007]
In profiling, derived compounds of a pharmaceutical company, which are generally in the preclinical development phase, are tested with receptors and enzyme assay devices. Information on the interaction of this company's compounds with specific receptors, obtained from the profiling process, is important in the optimization and selection of derived compounds and suggests any side effects or potential second effects of the compounds. Become. With this knowledge, the pharmaceutical company can potentially save millions of dollars in the time and cost of preclinical and / or clinical development of the compound.
[0008]
Although profiling services have been available for many years, pharmaceutical companies have typically used data from these tests empirically. Many drugs interact with many receptors or other molecular targets, including highly selective drugs. Therefore, the data generated by profiling should be interpreted by researchers at the pharmaceutical company based on experience and knowledge, taking into account both the data on the chemical structure of the compound and the binding activity of the compound to a particular receptor. It is. Unfortunately, even the most experienced pharmacologists have incomplete knowledge of the interaction of various drugs with a wide range of receptors associated with new drug development.
[0009]
The need for more effective methods to manage, collate, interpret and utilize vast amounts of data on genes and gene products (molecular targets), chemical structures, and screening results has led to bioinformatics and New opportunities have been created in chemical informatics or the management of biological and scientific data. The steps to creating a vast pool of information for new drug discovery consist of the following steps: (1) DNA sequencing (coding of genetic material or gene that serves as a blueprint for cells to produce gene products or proteins), (2) Functional genomics (particularly in response to changes in drug or biological function) , The process of converting a DNA sequence into the relevant gene product or protein via the mRNA product), (3) proteomics (amino acid sequence and / or gene product such as a receptor encoded in the gene or (4) Identification of three-dimensional structure of protein), (4) Pharmacology / toxicology of trace molecules (molecular binding or interaction between gene products such as receptors and small organic compounds that can be drugs), (5) Chemical Structure (for micromolecules, drug analogs).
[0010]
Databases for DNA sequencing (Group 1) have been established and include Genbank, Genome Center and others. Similarly, chemical structure databases (Group 5) are also well known and are provided by vendors such as MDL (Isis) and Oxford Molecular. Proteomics databases (Group 3), such as SWISS-PROT, ProLink and PDB, have also been constructed. These databases contain structural information and can be used to determine patterns in one dimension or in one component of structural or sequence information, so each can be considered as one component. . The databases of
[0011]
Partial databases or multiple databases for Group 4 protein-to-compound relationships are currently being constructed. For example, the binding profile of a single compound to a wide range of receptor targets provided by the assignee to the client is a partial dataset of a group 4 type database. Similarly, advanced processing such as screening thousands to hundreds of thousands of compounds, such as those contained in a chemical structure database (Group 5), for activity against a particular receptor target (a single point in Group 3) The data generated by the screening project will be part of the Group 4 database. While such partial group 4 databases would be useful in new drug discovery and development, they have two major drawbacks. First, they are specific components of two components, such as the binding selectivity of a single compound or a limited set of compounds to a range of receptors (profiles) or multiple compounds on a single receptor target. It is about analysis (advanced processing screening project). In each case, the width of the dataset is not large enough to handle the statistical correlation between the receptor targets and the chemical structures. Second, and importantly, these partial datasets are generated for compounds selected based on structural novelty, ie, potential as a new drug. Because these are new compounds, there is no biological information about their activity in the animal or human body. Thus, such an approach suffers from the same limitations as pharmacologists who attempt to interpret profile data empirically, as described above.
[0012]
[Problems to be solved by the invention]
Accordingly, it is an object of the present invention to meet the above needs by providing systems and methods for data analysis related to drug discovery and development. A full classification screening database is provided that includes positive and negative data from test results for multiple compounds and multiple molecular targets. The number of combinations of compounds and molecular targets can be determined by one of ordinary skill in the field of statistical techniques or other data mining methods by using this screening database and the associated compound and molecular target databases. It must be large enough to make reliable predictions about whether a compound is suitable for clinical trials and has a high likelihood of being a safe and effective drug.
[0013]
[Means for Solving the Problems]
The present invention discloses, inter alia, systems and methods that meet the above needs. The system includes a first database having records relating to the plurality of compounds and records relating to the effects of the plurality of compounds on human and animal biological systems, and a record relating to the plurality of molecular targets. And a second database having a second database. The computer system further includes a third database having records associated with tests for binding, reactivity, and other interactions between the compounds in the first database and the molecular targets in the second database. Including. The test includes selecting from a plurality of molecular targets in the second database and interacting with a compound known to interact with a particular molecular target (eg, a control agent or control standard). Information about the effects of a compound selected from the plurality of compounds in the first database is included, and the test is performed on a plurality of molecular targets in the second database. ing. Means for setting thresholds for interaction tests associated with said side effects, and selecting information on compounds, compound sets, and / or compounds when the results of said effect test meet said interaction test thresholds. Means are also included in the computer system. Information in the first and second databases and a record associated with one or more compounds in the first database and / or one or more molecular targets in the second database; A user interface to allow the user to view and manipulate or analyze the information in the database of Step 3, especially for compounds, molecular targets and other database records related to results meeting said interaction test threshold. Is provided.
[0014]
In addition, the invention relates to applying statistical and other data mining techniques to these multidimensional databases to determine correlations or patterns related to new drug discovery and development.
[0015]
Both the foregoing general description and the following detailed description provide examples and explanations, but are not intended to limit the scope of the invention.
[0016]
The accompanying drawings, which are incorporated in and constitute a part of this specification, illustrate embodiments of the invention and, together with the description, explain the advantages and principles of the invention.
[0017]
BEST MODE FOR CARRYING OUT THE INVENTION
BRIEF DESCRIPTION OF THE DRAWINGS Preferred embodiments of the present invention will be described, examples of which are illustrated in the accompanying drawings and will be apparent from the detailed description of the invention. The same reference numbers in different drawings shall identify the same or similar elements wherever possible.
[0018]
The systems and methods consistent with the present invention analyze data related to new drug discovery and development, e.g., the potential for new compounds to be safe or effective new drugs, and It is possible to predict whether to proceed. In the following description, the system and method of the present invention will be used in relation to a relational database containing a plurality of main tables, and the binding between a compound and a molecular target will be used as a metric for the interaction between the two. Explanation will be given in relation to usage. This description may also generally apply to other database structures having multiple main components, and to measuring other interactions between compounds and molecular targets.
[0019]
The present invention relates to novel designs, structures, and applications of information-rich databases on compounds, molecular targets, particularly proteins, other macromolecules, and the biological activities of these compounds. The present invention further provides for the identification of known drugs and drug candidates that have not passed all clinical trials or clinical trials, along with preclinical and clinical data, including side effects, reaction mechanisms, and other medical data, of these compounds in a database. It also relates to the method used as a source of information for the library. The present invention also determines the binding and other interactions between compounds in the database and molecular targets, and uses relationship analysis and data mining techniques to relate these interaction patterns to new drug discovery and development. The specific chemical structure, substructure, or other characteristic of a compound that interacts with a particular biological reaction, or the biochemical characteristics or structure of a molecular target that interacts with such , And its correlation with other features. The following can be referred to as an example of such a data mining technique. All of these references are included in the present invention.
a) Chen et al. Recursive Partitioning Analysis of a Large Structure Structure-Activity Data Consulting Monthly Review of a Three-dimensional Descriptor of a Large-Scale Structure-Activity Dataset Using a Three-Dimensional Descriptor. ;
b) Hawkins et al. , Analysis of Large Structure-Activity Data Set Using Recursive Partitioning using Quantum., "Analysis of a Large Structure-Activity Data Set Using Recursive Partitioning." Struct. -Act. Relat. 16: 296-302 (1997);
c) DePriest et al. 3D-QSAR of angiotensin converting enzyme and a thermolysin inhibitor; comparison of CoMFA models based on a priori, empirically determined active site geometry based on reduced and experimentally determined active site geometries), J. Am. Am. Chem. Soc. 115: 5372-84 (1993);
d) Good et al. Lipkowitz, K., in Reviews in Computational Chemistry; B. Boyd, D .; B. (Des.), VCH, New York, Vol. 7. pp 67-117 (1996);
e) Marshall et al. Computer-Assisted Drug Design ACS Symposium Scrica 112; American Chemistry Society: Washington, DC, 1979; pp 205-226;
f) Molec et al. , 3-dimensional structure activity relationships and biological receptor mapping (A three-dimensional structure activity of relationship and biological receptor mapping), Mathematics and Computational Concepts in Chemistry; Ellis Horwood; Chichester, 1985 years; pp 225-251;
g) Mayer et al. , A unique geometry of the active site of angiotensen-converting enzyme continuance activity structure. Comput. Aided Mol. Des. , 1: 3-16. (1987);
h) Sheridan et al. , An ensemble approach to distance geometry method: application to the nicotinic pharmacophone, j. med chem. . 29: 899-906 (1986);
i) Martin et al. , A fast new approach to pharmacophone mapping and its application to dopamine and benzodiazepine antagonists (A fast new approach to pharmacophone mapping and it's application to dopaminegic edz. Comput. Aided Mol. Des. , 7; 83-102 (1993);
j) Catalyst / Hypo Tutorial, version 2.0, BioCAD Corp. Mountain View, CA, 1993;
k) Sprague, P .; W. Automated generation of chemical hypotheses and database search by catalyst (Automated chemical generation and database searching with Catalyst), Perspect. Drug Discov. Des. , 3: 1-20 (1995);
l) Barnum et al. (Identification of common functionals ammonium molecules), J. Am. Chem. Inf. Comput. Sci. , 1996, 36: 563-71 (1996);
m) Hiphop Tutorial, version 2.3; Molecular Simulation Inc. Sunnyvale, CA, 1995;
n) Davies, K .; And Uppin, R .; , 3D pharmacophore searching, net. Sci. , (Http://www.org/Science/Cheminform/feature02.html);
o) Goldener, V.A. And Vesterman, B .; , APEX 3D expert system for drug design, Net. Sci. (Http://awod.com/netsci/science/compchem/feature09.html);
p) Van Drie, J. et al. Strategies for the determination of pharmaceutical 3D database queries, J. Pharmacophore, 3D database queries. Comput. Aided Mol. Des. , 11: 39-52 (1997).
q) Van Dire, J .; And Nugent, R .; , Addressing the challenges presented by combination chemistry: 3D databases, pharmacophon; recognition and beyond, SAR QS RNAR. Res. , 9: 1-21 (1998);
r) Finn et al. , The discovery of Pharmacophonre using Inductive Logic Programming progol (Pharmacophonre discovery using the inductive logic programming progol) Machine Learning, Special Issue on Applications and Knowledge Discovery, Kluwer Academic Publishers: Boston, 1998, pp 1-33;
s) Jain et al. J., a shape-based machine learning tool for drug design, Comp. Comput. Aided Mol. Des. , 8: 635-52 (1994).
[0020]
Unlike standard operating procedures in the pharmaceutical industry, Group 4 databases must be constructed as databases consisting of more than two components and cover a considerable range in both receptors or enzyme targets and compounds. The background section suggests it must be. As an example, to build a three-component database, one first selects a broad set of compounds that contains a wealth of information directly relevant to drug discovery and development. The most relevant information is often obtained from the actual experience of testing such compounds in humans in clinical trials and / or post-marketing surveillance and in animals in preclinical trials. Other relevant biological information can be obtained from natural substances that exhibit one or more biological activities, or from chemical reference standards used in the art to study the biological characteristics of receptors. Thus, one embodiment of an information-rich compound selected for such a Group 4 database includes over-the-counter drugs, drugs that failed clinical or preclinical studies, natural bioactive substances or natural Extracts and control agents used in receptor binding assays.
[0021]
Such a database can be constructed using screening data obtained from the scientific literature. This approach could produce a partial dataset, but has limitations. First, literature references provide only one piece of positive information (eg, a report on the inhibition of binding of a particular compound to a particular receptor). Negative data is as important as positive data in order to compare useful information. In addition, certain statistical analyzes may not be applicable to datasets that do not have both positive and negative data. Second, a separate quantitative report of an article on the binding data of one compound to one receptor and a separate report on the binding data of another compound for the same receptor describe how the assay is performed. Because they are different, they cannot be compared. Thus, one embodiment for generating a Group 4 three-component database is to screen a wide range of compound arrays for a wide range of receptors or enzyme targets to obtain consistent comparisons and to obtain positive and negative results. It will secure both data.
[0022]
Compound components: selection of compound libraries and inclusion of compound data
The present invention relates to a database containing, as one component, compounds having known biological activities related to pharmaceutical research and development. Information about biological activity can be included in a database or table of compounds.
[0023]
For example, these information-rich compounds include:
(A) A pharmacological control or reference compound for measuring the interaction or molecular binding between an unknown compound and a particular molecular target such as a receptor or enzyme. Examples of such control compounds include compounds used to characterize the binding effect between a test compound and a molecular target, including a receptor or an enzyme. Other control agents include Sigma Aldrich Corp. Research Biochemicals Inc., a group of Compounds selected from catalogs of (RBI) and other sources known in the art may be included. Because these pharmacological control compounds are pre-tested and / or marketed as medicaments or are highly bioactive natural substances, they may overlap with the following three categories:
(B) Compounds that are known drugs that are currently or previously marketed for medical use and for which substantial amounts of biological information are available. These compounds are well known and appear in publications available from U.S. government agencies such as the Federal Food and Drug Administration (FDA), as well as in publications issued by private companies or nonprofits. One such publication, issued by a non-profit organization, is the USP DI Series by the United States Pharmacopeial Convention Inc., in which Chapter I. Drug Information for Healthcare Providers (Volume I. Drug Information for the Health Care Professional) is updated monthly by the USP DI Update. New drugs that have been licensed will fall into this category. Over-the-counter drugs or drugs approved by the FDA or equivalent foreign regulatory bodies are public records, so those of ordinary skill in the art will readily identify such compounds as belonging to this category. I can do it.
(C) Compounds given IND (Investigational New Drug) status as potential new drugs, but failing to achieve sufficient efficacy or safety in clinical trials to obtain FDA approval; Compounds that have been approved for human testing, such as compounds that did not achieve commercial status. This category of compounds may also include those compounds that have been approved for marketing by the FDA but have subsequently withdrawn from the market. These compounds also contain significant amounts of useful biological information and will be particularly useful for the purposes of the present invention. The identity of the failed drug can be obtained from a number of sources, including official publications from pharmaceutical or biotechnology companies, publications such as "Pink Sheets", and lists maintained by the FDA.
(D) Compounds exhibiting biological activity obtained from natural resources such as plants, microorganisms and animals. These natural substances may include toxins, antibacterials, behavioral modifiers, defenses, and other categories of compounds that provide information relevant to new drug discovery and development. Identification of natural substances can be obtained from many publications such as, but not limited to, RBI and Sigma Aldrich's Compound Catalog.
[0024]
For each of the compounds included in this database, the chemical structure, chemical formula, physicochemical properties, chemical spatial configuration, other spatial chemistry information (eg, Smiles codes), solubility, and other relevant data are available. In the database field. Those of ordinary skill will be able to recognize other recordable parameters. Compounds can be constructed from relationships of chemical structures in the database or from other relationships.
[0025]
FIG. 1A shows a compound table 300 of a relational database. The table 300 lists a plurality of compounds and includes a record of a plurality of compounds N (
[0026]
Additional columns may be added so that other relevant data for each compound 301 listed in table 300 can be included. By including the biological activity of the compounds in these added columns, the compound database can also be a two-component database (see database 500).
[0027]
FIG. 1B shows a
[0028]
Molecular target components: selection of receptors, enzymes, and other molecular targets and inclusion of molecular target data
The second component of the database of the present invention includes, as molecular targets, receptors, enzymes, other proteins, nucleic acids, carbohydrates, other high molecular compounds, etc. related to drug discovery and development. In one embodiment of the invention, receptors and enzymes are the primary molecular targets. Receptors alleviate most of the molecular communication in cells and organs in the body. Enzymes often enhance such communication, for example, through secondary messenger systems and cellular signaling pathways.
[0029]
Receptors include typical receptors such as dopamine receptors, serotonin receptors, opiate receptors, muscarinic receptors, adrenergic receptors, adenosine receptors, and the like. These receptor groups include receptor type subtypes (such as dopamine-1, dopamine-2, dopamine-3, dopamine-4 and dopamine-5 receptors). Certain subtypes have additional variations (such as dopamine 4.2, dopamine 4.4 and dopamine 4.7), or some have different shapes (such as
[0030]
Enzymes include proteases, carbohydrases, kinases, phosphotases, DNA modifying enzymes, transferases, P450s, and other enzymes known to those skilled in the art.
[0031]
Applicants are constantly developing other receptors, receptor sources, and assays related thereto and adding them to the database content. Additional receptors and receptor assays are well known to those skilled in the art. Lists and descriptions of receptors relevant to drug discovery and development can be obtained from many publications known to those skilled in the art. These publications include the RBI Handbook of Receptor Classification and the IUPHA Receptor Classification Book. Further, as new receptors and receptor subtypes are discovered, they are also added to the database content.
[0032]
Enzymes and enzyme assays are well known to those skilled in the art. Lists and descriptions of receptors relevant to drug discovery and development can be obtained from many publications known to those skilled in the art.
[0033]
FIG. 2 shows tables 400, 410 and 420 that form part of a relational database system that can be used to access molecular target information. Table 400 lists the targets and includes a record of multiple targets M (lines 1-M).
[0034]
The table structure may vary depending on the type of target identified in
[0035]
The
[0036]
The table 420 includes information on targets classified as enzymes in the table 400. By querying the database for a particular enzyme name, the records in table 420 can be accessed. The enzyme names in table 420 can be accessed by querying table 400 for the target name indicated in
[0037]
The enzyme name is included in the
[0038]
Although only tables 410 and 420 are shown to illustrate access to molecular target information by type of target, the relational database system provides additional information depending on the number of types of molecular target targets available in the database. Tables can be added.
[0039]
Biological Information Component: Biological / Chemical Information Parameters
Biological information that forms part of the database includes, for example, items related to side effects, mechanisms of pharmacological actions, metabolism by drugs, toxicity, absorption, distribution, and elimination. This information can be obtained from FDA-approved labels for over-the-counter drugs or from the literature and publications on drugs that failed clinical trials. Specific examples of parameters include toxicity, LD50, LD50/ ED50Teratogenicity, toxic mechanism, toxic target organ, in vitro toxic battery, apoptosis inducing, bioavailability, absorption, blood-brain barrier, oral absorption, mucosal absorption,% absorption , Distribution, critical blood protein, half-life, onset of action, duration of action, peak in blood concentration, metabolism, major pathway, minor pathway, active metabolite, excretion, first elimination mode, second elimination mode, These include in vitro utilities, therapeutic indications, effects on animal behavior, side effects, known key targets, other target organs / systems, and known receptor interactions.
[0040]
FIG. 3 shows a table 500 containing some of the biological information parameters described above. Table 500 consists of N rows (1-N) relating to all compounds that may be present in the first database.
[0041]
FIG. 3 also shows a table 600 containing biological information parameters associated with molecular targets in the database. The table 600 relating to all possible targets in the second database consists of P rows (1 to P).
[0042]
Determination of connectivity information
A key feature of the present invention is the composition of multiple information components consisting of compounds, molecular targets, and biological information, and the evaluation of the binding, reactivity, and other interactions between the compounds and molecular targets. By reassociating this binding or reactivity information with known biological information, patterns or relationships that can be used for drug discovery and development can be screened. An important aspect of the present invention is to generate as extensive and consistent binding or reactivity data between compounds and molecular targets as possible to provide as complete a dataset as possible to identify the required patterns or relationships. And provide both positive and negative binding or reactivity information. In one embodiment of the present invention, for example, the binding data is configured as a numerical descriptor indicating whether or not a threshold set is satisfied for a specific molecular target or molecular target set. This numerical descriptor can also be associated with the presence or absence of reactivity for each compound and each receptor, and other molecular targets, evaluated at a concentration near a threshold suitable for the biological system or set of biological information. For example, for some compounds, the inhibition of binding between the receptor and the corresponding-5M (10 micromolar), can be tested at a threshold of 30%. In addition, an initial concentration or an inhibition rate threshold can be set. Also, in one embodiment of the present invention, compounds that cause binding inhibition above the threshold in this first yes / no test are further tested for their ability to inhibit binding. For these active compounds, for example, 10-5-10-9The test was performed in a series of concentration conditions, including 7-14 different concentrations within the range of M, and the IC of the active compound at a particular receptor was tested.50And / or determine the value of Ki. The number of concentration conditions for making this determination is at least better, at least-5-10-9It may be necessary to use a concentration range higher or lower than M. From these data, a matrix of relative activity or relative potency of each active compound for each molecular target is obtained.
[0043]
To generate these screening data, the compounds are first solubilized in a suitable solvent system. As the solvent system, for example, 4% DMSO or the like can be used, but other concentrations of DMSO or another solvent can also be used. The stock solutions of these compounds are then diluted to an appropriate concentration to make them available as a repository. Each assay for measuring the interaction between a compound and a molecular target will use different reagents and procedures. Each such assay needs to be characterized and routinely made consistent. An appropriate control test must be performed each time the assay is run. Any assay format that can produce information of the type and accuracy desired can be used. Numerous assay detection systems can be used, such as radiolabeling, fluorescence analysis, fluorescence polarization analysis, time-resolved fluorescence analysis, fluorescence correlation spectroscopy, chemiluminescence, UV absorption, colorimetry, and the like.
[0044]
In one embodiment of the invention, data regarding molecular interactions is generated using a receptor binding assay or an enzymatic activity assay. For example, in a receptor binding assay, compounds in a stock solution are tested for their ability to inhibit the binding interaction between the receptor and a reference agent selected for the receptor. The receptor can be obtained from animal or human tissues or the like, or can be obtained from a cell line transfected to contain the gene for the receptor. The receptor source for the assay can be provided, for example, as a cell fraction containing the receptor. The receptor may also be partially purified. A reference compound or ligand is preferably selected based on potential and / or specific binding to a particular receptor, and by including iodine 125, tritium, carbon-14, and other radioactive tracers, Bound and unbound ligands can be distinguished. Positive and negative control tests are performed in parallel with the testing of the binding data of the compounds to be included in the database, and reference curves at various concentrations of the reference (radioactive) ligand ensure the quality of the assay performed. .
[0045]
One of skill in the art will appreciate that numerous methods and systems allow the interaction between a target and a compound to be measured. To reach an equilibrium state in the binding reaction, the radioligand, the receptor preparation solution, and the test compound are cultured for an appropriate time in an appropriate buffer solution and at an appropriate temperature. The amount of bound radioligand relative to unbound radioligand is determined by filtration and separation steps using methods such as SPA (scintillation proximity assay) and is measured by liquid scintillation or gamma counting. The specific binding number of the test compound is then determined by comparing the test compound assay results with the positive and negative control tests. From these data, the percent inhibition of the test compound is calculated.
[0046]
FIG. 4 shows a table 200 representing a screening result and an assay database, wherein compounds contained in database 300 (comprising 1 to N compounds) are tested for action on molecular targets contained in
[0047]
In other examples, the screening results identify the potency or degree of binding or other effect (eg, the Ki of the compound-receptor interaction) for each of the plurality of compounds tested against each of the plurality of molecular targets. It is input to the table 220 as a numerical descriptor. In a preferred embodiment, all such "compound" x "target" matrix points are determined in tables 210 and 220, and an all-kind database is generated. In addition, the screening result and
[0048]
FIGS. 5A and 5B illustrate the use of the
[0049]
New compounds or sets of compounds are introduced into the
[0050]
The results of the
[0051]
The complete set of results from the
[0052]
Alternatively, new molecular targets, such as, for example, "orphan" receptors, can be introduced into the screening process to test for compounds in the compound database 300 (see FIG. 5B). Regarding the orphan receptor, its structure is known, but its function and its relation to disease are not known. The results of the screening process, including the identification of compounds that interact with the new molecular target, are incorporated into the
[0053]
FIG. 6A shows the prediction of the potential of a new compound as a drug using the
[0054]
A query script for generating the table 710 can select a compound from the
[0055]
After selecting the compound, the query script selects from the
[0056]
The user can query table 710 to obtain information related to predicting the potential of a new compound to be used as a drug. Examples include queries for molecular targets that are known to react with compounds related to the novel compound, and queries for side effects that the molecular targets are known to cause with the compound.
[0057]
FIG. 6B shows the association of novel molecular targets with diseases and / or organisms using the data entry and query shown in FIG. 6B, using an approach similar to predicting the drug potential of new
[0058]
All patents, patent applications and publications mentioned herein are hereby incorporated by reference.
[0059]
The above description of the embodiments of the present invention is for the purpose of illustration and description, is not exhaustive, and does not limit the invention to the forms disclosed herein. Modifications and changes may be made to the invention in light of the above disclosure or upon practicing the invention.
[Brief description of the drawings]
FIG.
FIG. 1A shows a compound table of a receptor selectivity mapping database in one embodiment of the present invention.
FIG. 1B shows a snapshot of a compound record including the spatial arrangement of compounds in a receptor selectivity mapping database in one embodiment of the present invention.
FIG. 2
FIG. 4 illustrates several logical tables of a receptor selectivity mapping database that can be used to access molecular target information in one embodiment of the invention.
FIG. 3
4 shows a table of biological information in a receptor selectivity mapping database in one embodiment of the present invention.
FIG. 4
FIG. 4 illustrates a method of using a receptor selectivity mapping database as part of a screening process in one embodiment of the present invention.
FIG. 5
FIG. 5A shows how to use the receptor selectivity mapping database as part of the screening process to find and select new compounds that are new drug candidates.
FIG. 5B shows how a receptor selectivity mapping database is used as part of the screening process to identify new targets that are candidate targets for finding new drug candidates for a particular disease.
FIG. 6
FIG. 6A shows the use of a database to predict the potential of a new compound as a drug.
FIG. 6B illustrates the use of a database to identify disease relevance and / or biological function of novel molecular targets.
Claims (26)
複数の分子ターゲットに関連する記録を含む第2のデータベースと、
第1のデータベースの化合物と第2のデータベースの分子ターゲットとの間の相互作用のテストであって、前記複数の分子ターゲットと相互作用することが知られている化合物及び前記分子ターゲットの間の相互作用に対して、前記複数の化合物中の1化合物が有する作用の情報を含むテストに関連する記録を含む第3のデータベースと、
ユーザが、選択された化合物を閲覧し、第1のデータベースの化合物データの記録、又は第2のデータベースの分子ターゲットの記録との関連に応じて、第1のデータベース、第2のデータベース及び第3のデータベースから選択的に情報を閲覧することができるようになっているユーザインタフェースと、
からなるコンピュータシステム。A first database comprising records relating to the plurality of compounds and records relating to biological information regarding the effects of the compounds on the biological system;
A second database containing records relating to the plurality of molecular targets;
A test of an interaction between a compound of a first database and a molecular target of a second database, wherein the interaction between the compound and the molecular target known to interact with the plurality of molecular targets is performed. A third database comprising a record relating to the test for the action, the information including information of the action of one of the plurality of compounds;
A user browses the selected compound and, depending on its association with the record of compound data in the first database or the record of molecular targets in the second database, the first database, the second database and the third database. A user interface that can selectively browse information from the database of
Computer system consisting of
複数の分子ターゲットに関連する記録を含む第2のデータベースから分子ターゲットを選択するステップと、
前記選択された化合物のそれぞれと前記選択された分子ターゲットのそれぞれとの間の相互作用に関連する情報を生成するステップと、
化合物の生物学的ターゲットに対する作用に関する生物学的情報に関連する記録を含む第3のデータベースから生物活性を選択するステップと、
前記生成された情報を用いて、化合物及び分子ターゲット間の相互作用のパターンを、前記選択された生物活性と関連付けるステップとからなる新薬発見及び開発に関連するデータを分析するための方法。Selecting a compound from a first database containing records related to the plurality of compounds;
Selecting a molecular target from a second database containing records relating to the plurality of molecular targets;
Generating information related to an interaction between each of the selected compounds and each of the selected molecular targets;
Selecting a biological activity from a third database containing records relating to biological information regarding the effect of the compound on the biological target;
Using the generated information to associate a pattern of interaction between a compound and a molecular target with the selected biological activity.
前記選択された化合物のそれぞれと前記選択された分子ターゲットのそれぞれとの間の結合性に関する結合データを、未知の化合物が該結合に対して有する阻害作用をモニタすることにより、生成するステップと、
前記阻害作用に関する結合テストの閾値を設定するステップと、
未知の化合物、分子ターゲット、及び前記結合テストの閾値を満たす又は満たさない化合物の組み合わせに関する情報を生成するステップとを含むことを特徴とする請求項24に記載の方法。The step of generating the information includes:
Generating binding data for the binding between each of the selected compounds and each of the selected molecular targets by monitoring the inhibitory effect of the unknown compound on the binding;
Setting a binding test threshold for the inhibitory effect,
Generating information about combinations of unknown compounds, molecular targets, and compounds that meet or do not meet the binding test thresholds.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13099299P | 1999-04-26 | 1999-04-26 | |
PCT/US2000/011073 WO2000065421A2 (en) | 1999-04-26 | 2000-04-26 | Receptor selectivity mapping |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004500614A true JP2004500614A (en) | 2004-01-08 |
Family
ID=22447376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000614100A Pending JP2004500614A (en) | 1999-04-26 | 2000-04-26 | Receptor selectivity mapping |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP1360560A4 (en) |
JP (1) | JP2004500614A (en) |
AU (1) | AU4661300A (en) |
CA (1) | CA2371093A1 (en) |
WO (1) | WO2000065421A2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001264309A (en) * | 2000-03-15 | 2001-09-26 | Fumiaki Otani | Catalyst searching method |
US7094572B2 (en) | 2003-03-14 | 2006-08-22 | Bristol-Myers Squibb | Polynucleotide encoding a novel human G-protein coupled receptor variant of HM74, HGPRBMY74 |
JP2021174473A (en) * | 2020-04-30 | 2021-11-01 | 株式会社日立製作所 | System for determining material to be proposed to user |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002031704A1 (en) | 2000-10-12 | 2002-04-18 | Iconix Pharmaceuticals, Inc. | Interactive correlation of compound information and genomic information |
US20030120430A1 (en) * | 2001-12-03 | 2003-06-26 | Icagen, Inc. | Method for producing chemical libraries enhanced with biologically active molecules |
WO2004097408A1 (en) * | 2003-03-24 | 2004-11-11 | Novascreen Biosciences Corporation | Drug discovery method and apparatus |
US7588892B2 (en) | 2004-07-19 | 2009-09-15 | Entelos, Inc. | Reagent sets and gene signatures for renal tubule injury |
US7467118B2 (en) | 2006-01-12 | 2008-12-16 | Entelos Inc. | Adjusted sparse linear programming method for classifying multi-dimensional biological data |
CN111696623B (en) * | 2020-05-28 | 2023-06-13 | 上海药明康德新药开发有限公司 | Laboratory information management system based on DNA coding compound library |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434796A (en) * | 1993-06-30 | 1995-07-18 | Daylight Chemical Information Systems, Inc. | Method and apparatus for designing molecules with desired properties by evolving successive populations |
US5463564A (en) * | 1994-09-16 | 1995-10-31 | 3-Dimensional Pharmaceuticals, Inc. | System and method of automatically generating chemical compounds with desired properties |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5025388A (en) * | 1988-08-26 | 1991-06-18 | Cramer Richard D Iii | Comparative molecular field analysis (CoMFA) |
-
2000
- 2000-04-26 AU AU46613/00A patent/AU4661300A/en not_active Abandoned
- 2000-04-26 CA CA002371093A patent/CA2371093A1/en not_active Abandoned
- 2000-04-26 WO PCT/US2000/011073 patent/WO2000065421A2/en active Application Filing
- 2000-04-26 JP JP2000614100A patent/JP2004500614A/en active Pending
- 2000-04-26 EP EP00928364A patent/EP1360560A4/en not_active Withdrawn
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434796A (en) * | 1993-06-30 | 1995-07-18 | Daylight Chemical Information Systems, Inc. | Method and apparatus for designing molecules with desired properties by evolving successive populations |
US5463564A (en) * | 1994-09-16 | 1995-10-31 | 3-Dimensional Pharmaceuticals, Inc. | System and method of automatically generating chemical compounds with desired properties |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001264309A (en) * | 2000-03-15 | 2001-09-26 | Fumiaki Otani | Catalyst searching method |
JP4553443B2 (en) * | 2000-03-15 | 2010-09-29 | 文章 大谷 | Catalyst search method |
US7094572B2 (en) | 2003-03-14 | 2006-08-22 | Bristol-Myers Squibb | Polynucleotide encoding a novel human G-protein coupled receptor variant of HM74, HGPRBMY74 |
US7371822B2 (en) | 2003-03-14 | 2008-05-13 | Bristol-Myers Squibb Company | Human G-protein coupled receptor variant of HM74, HGPRBMY74 |
JP2021174473A (en) * | 2020-04-30 | 2021-11-01 | 株式会社日立製作所 | System for determining material to be proposed to user |
WO2021220777A1 (en) * | 2020-04-30 | 2021-11-04 | 株式会社日立製作所 | System for determining material to be proposed to user |
JP7398334B2 (en) | 2020-04-30 | 2023-12-14 | 株式会社日立製作所 | System for determining materials to suggest to users |
Also Published As
Publication number | Publication date |
---|---|
WO2000065421A2 (en) | 2000-11-02 |
AU4661300A (en) | 2000-11-10 |
EP1360560A2 (en) | 2003-11-12 |
EP1360560A4 (en) | 2007-07-18 |
CA2371093A1 (en) | 2000-11-02 |
WO2000065421A3 (en) | 2003-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Vatansever et al. | Artificial intelligence and machine learning‐aided drug discovery in central nervous system diseases: State‐of‐the‐arts and future directions | |
Huang et al. | Therapeutics data commons: Machine learning datasets and tasks for drug discovery and development | |
Rao et al. | Novel computational approach to predict off-target interactions for small molecules | |
Joseph-McCarthy et al. | Fragment-based lead discovery and design | |
Sheng et al. | Fragment informatics and computational fragment‐based drug design: an overview and update | |
Merlot et al. | Chemical substructures in drug discovery | |
Kortagere et al. | The importance of discerning shape in molecular pharmacology | |
Baldi | Computational approaches for drug design and discovery: An overview | |
von Korff et al. | Comparison of ligand-and structure-based virtual screening on the DUD data set | |
Neamati | New paradigms in drug design and discovery | |
Bajorath | Computational analysis of ligand relationships within target families | |
Hu et al. | Molecular scaffolds with high propensity to form multi-target activity cliffs | |
AU2002215028B2 (en) | Method of operating a computer system to perform a discrete substructural analysis | |
Mannhold et al. | Advanced computer-assisted techniques in drug discovery | |
JP2003529843A (en) | Chemical resource database | |
Chopra et al. | Application of artificial intelligence in drug discovery | |
JP2004500614A (en) | Receptor selectivity mapping | |
Dutta et al. | Computer-aided drug design-a new approach in drug design and discovery | |
Wang et al. | Combinatorial QSAR modeling of specificity and subtype selectivity of ligands binding to serotonin receptors 5HT1E and 5HT1F | |
Melancon et al. | Targeting ion channels with ultra-large library screening for hit discovery | |
Hu et al. | Combining horizontal and vertical substructure relationships in scaffold hierarchies for activity prediction | |
Jacoby | Computational chemogenomics | |
Habeeba | Use of artificial intelligence in drug discovery and its application in drug development | |
Lumley | Compound selection and filtering in library design | |
Rollinger et al. | Computational approaches for the discovery of natural lead structures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091208 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100302 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100309 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101005 |