JP5075362B2 - 化合物の生理活性の定量的予測方法 - Google Patents
化合物の生理活性の定量的予測方法 Download PDFInfo
- Publication number
- JP5075362B2 JP5075362B2 JP2006167002A JP2006167002A JP5075362B2 JP 5075362 B2 JP5075362 B2 JP 5075362B2 JP 2006167002 A JP2006167002 A JP 2006167002A JP 2006167002 A JP2006167002 A JP 2006167002A JP 5075362 B2 JP5075362 B2 JP 5075362B2
- Authority
- JP
- Japan
- Prior art keywords
- physiological activity
- chemical fragmentation
- compound
- compounds
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 150000001875 compounds Chemical class 0.000 title claims description 73
- 230000001766 physiological effect Effects 0.000 title claims description 46
- 238000000034 method Methods 0.000 title claims description 30
- 239000000126 substance Substances 0.000 claims description 49
- 238000013467 fragmentation Methods 0.000 claims description 41
- 238000006062 fragmentation reaction Methods 0.000 claims description 41
- 238000006243 chemical reaction Methods 0.000 claims description 20
- 238000004220 aggregation Methods 0.000 claims description 8
- 230000002776 aggregation Effects 0.000 claims description 8
- 230000000875 corresponding effect Effects 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims description 7
- 230000002596 correlated effect Effects 0.000 claims description 6
- 230000000704 physical effect Effects 0.000 description 18
- 230000000694 effects Effects 0.000 description 10
- 239000000758 substrate Substances 0.000 description 8
- 238000012549 training Methods 0.000 description 8
- 239000003814 drug Substances 0.000 description 7
- 102100033350 ATP-dependent translocase ABCB1 Human genes 0.000 description 6
- 108010047230 Member 1 Subfamily B ATP Binding Cassette Transporter Proteins 0.000 description 6
- 238000004617 QSAR study Methods 0.000 description 6
- 229940079593 drug Drugs 0.000 description 5
- 125000001424 substituent group Chemical group 0.000 description 5
- 108091006112 ATPases Proteins 0.000 description 4
- 102000057290 Adenosine Triphosphatases Human genes 0.000 description 4
- 238000005556 structure-activity relationship Methods 0.000 description 4
- SGTNSNPWRIOYBX-UHFFFAOYSA-N 2-(3,4-dimethoxyphenyl)-5-{[2-(3,4-dimethoxyphenyl)ethyl](methyl)amino}-2-(propan-2-yl)pentanenitrile Chemical compound C1=C(OC)C(OC)=CC=C1CCN(C)CCCC(C#N)(C(C)C)C1=CC=C(OC)C(OC)=C1 SGTNSNPWRIOYBX-UHFFFAOYSA-N 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000010219 correlation analysis Methods 0.000 description 3
- 125000005842 heteroatom Chemical group 0.000 description 3
- 230000009897 systematic effect Effects 0.000 description 3
- 229960001722 verapamil Drugs 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 108010078791 Carrier Proteins Proteins 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 125000005843 halogen group Chemical group 0.000 description 2
- 125000000623 heterocyclic group Chemical group 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- -1 IUPAC nomenclature) Chemical class 0.000 description 1
- 239000005517 L01XE01 - Imatinib Substances 0.000 description 1
- 238000003646 Spearman's rank correlation coefficient Methods 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 239000003905 agrochemical Substances 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 229940080856 gleevec Drugs 0.000 description 1
- KTUFNOKKBVMGRW-UHFFFAOYSA-N imatinib Chemical compound C1CN(C)CCN1CC1=CC=C(C(=O)NC=2C=C(NC=3N=C(C=CN=3)C=3C=NC=CC=3)C(C)=CC=2)C=C1 KTUFNOKKBVMGRW-UHFFFAOYSA-N 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
Landscapes
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
次に、当該トレーニングセットの各化合物に対して検索システムが使用している化合物の系統的命名法(IUPAC命名法など)や、部分構造のキーワード、また部分構造ごとに系統的に分類されたコード(ケミカルフラグメンテーションコード、CPIマニュアルコードなど)等を使用して部分構造インデックスの付与(インデキシング)を行う(INDEXステップ)。付与するためのルールは公表されているインデキシングガイドを用いることで可能である。ケミカルフラグメンテーションコードと CPIマニュアルコードのインデキシングルールはThomson Derwent社、Thomson Scientific社の下記ホームページで公開されている。
http://thomsonderwent.com/media/support/userguides/chemindguide.pdf
http://www.thomsonscientific.jp/support/code/mc/cpi/index.shtml
化合物の系統的命名法としては、名称からその構造や組成がわかるような方式として国際純正および応用化学連合(IUPAC)の規則が定められており、解説書 (裳華房 化学新シリーズ 化合物命名法 中原勝儼・稲本直樹 共著など)が数多くある。
化合物構造をグラフィカルに入力すると上述のインデキシングを自動的に行うソフトウェアも使用できる。ケミカルフラグメンテーションコードは市販されているソフトウェアであるMarkush Topfragを用いることができる(http://thomsonscientific.jp/products/mtf/index.shtml)、命名法についてはChembridgeSoft社のChemDraw Ultraを用いることができる。
ケミカルフラグメンテーションコードを例として階層的なものでは、上位のコードとしてハロゲン原子C0があり、下位には個々のハロゲン原子種のコードがある。
医薬品の創製、開発において薬物動態は重要な位置をしめる。薬物動態に影響する生体内分子として薬物輸送を行うトランスポーターが注目されており、薬物動態に優れた医薬品を創製するためには薬物トランスポーターの基質特異性を知る事が重要である。市販されている医薬品から構造が多様な36化合物をトレーニングセット化合物として選択し、P−糖蛋白質の基質特異性をATPaseスクリーニング法で解析した。
まず、その構造式のケミカルフラグメンテーションコードをインデキシングルールに従い次のとおり付与した。
ケミカルフラグメンテーションコードと CPIマニュアルコードのインデキシングルールは前記のようにホームページで公開されている。
さらにこの変換表に基づき記述子を作成するパーソナルコンピュータ上のプログラムを作成した。ケミカルフラグメンテーションコードの集計の結果137個の記述子が作成され、記述子相互の相関性をスピアマンの順位相関係数で計算し、相関性の高いもの同士を重回帰モデルに含まれないよう除いた。また、化合物数の6%である3個以下の発生頻度の少ない記述子を除き、計算に使用する126個の候補記述子を得た。薬物濃度10μMにおけるATPaseの相対的活性(verapamilに対する比活性)を目的変数とし、線形重回帰を行い、下記表6のモデル式が得られた。数値的な指定のケミカルフラグメンテーションの集計によって創出された記述子を用いて、トレーニングセット化合物のP−糖蛋白質基質性を良い相関性で識別するモデル式が作成された。
医薬品の創薬段階では、既に合成された多様な構造の化合物ライブラリーを使用している。市販されている化合物ライブラリーから多様な構造の60化合物をトレーニングセット化合物として選択し、P−糖蛋白質の基質特異性をATPaseスクリーニング法で解析した。解析に使用する記述子には階層的に整理されたケミカルフラグメンテーションコードを用い、上位の構造成分ことに、下位のケミカルフラグメンテーションコードを集計する方法を用いた、このための変換表を作成した。ケミカルフラグメンテーションコードの付与と記述子の発生は実施例1と同じ操作を行った。階層的に集計した記述子を作成し、相関性の高い記述子を同時に使用する条件を除いた159個の候補記述子として解析を行った。
薬物濃度10μMにおけるATPaseの相対的活性(verapamilに対する比活性)を目的変数とし、線形重回帰を行い、下記表7のモデル式が得られた。階層的な指定のケミカルフラグメンテーションの集計によって創出された記述子を用いて、トレーニングセット化合物のP−糖蛋白質基質性を良い相関性で識別するモデル式が作成された。
P−糖蛋白質の基質性としてverapamilに対する相対的活性110%以上の検索式として
S L1(NOTP) (H103 or H600 or H601 or H602 or H603 or H604 or H641 or L910 or M113 or M142)/M2,M3,M4
を得た。
Claims (3)
- 化合物の構造や一般式構造を登録したデータベースから生理活性を定量的に予測する方法であって、
化学構造とその生理活性測定値が示された一群の化合物の各化合物に、部分構造インデックスとしてケミカルフラグメンテーションコードを付与するステップと、
当該付与されたケミカルフラグメンテーションコードが、構造特性成分で階層化されている場合、当該構造特性成分について、それぞれ上位の構造特性成分を集計項目とすると共に、当該集計項目に属する下位のケミカルフラグメンテーションコードごとに集計数値として1を設定したコード・数値の変換表をそれぞれ作成し、当該変換表を用いて、各化合物について当該集計項目に含まれるケミカルフラグメンテーションコードの集計数値の集計を行ない、それぞれその総集計値を当該階層化されている構造特性成分の情報を表わす記述子とするステップと、
当該記述子の中から当該一群の化合物数の1/5〜1/10の数の記述子を選択し、その選択した記述子と当該化合物の生理活性測定値をそれぞれ重回帰法により相関解析して、当該生理活性の推算値を表わす下記の式(1)で示されるモデル式を得るステップと、
前記変換表を用いて、当該モデル式中の記述子に対応する集計項目からケミカルフラグメンテーションコードを選択変換すると共に、検索の目的とする生理活性の閾値を設定し、当該閾値以上又は閾値以下の化合物を検索するために、当該変換したケミカルフラグメンテーションコードに対応する集計数値とモデル式中の係数の積を寄与結果とし、当該寄与結果とモデル式中の定数項の総和を前記閾値と比較することにより、当該閾値以上又は閾値以下の条件に合致しているケミカルフラグメンテーションコードをキーワードとして選択組み合せて、定量的に生理活性を予測した検索結果を得るための検索式を組み立てるステップを
含むことを特徴とする化合物の生理活性の定量的予測方法。
式(1):生理活性(物質)=Σ(係数×記述子)+定数項 - 化合物の構造や一般式構造を登録したデータベースから生理活性を定量的に予測する方法であって、
化学構造とその生理活性測定値が示された一群の化合物の各化合物に、部分構造インデックスとしてケミカルフラグメンテーションコードを付与するステップと、
当該付与されたケミカルフラグメンテーションコードが、階層化されている構造特性成分以外の構造特性成分で階層化が可能な場合、階層化を行ない、それぞれ上位の構造特性成分を集計項目とすると共に、当該集計項目に属する下位のケミカルフラグメンテーションコードごとに集計数値として1を設定したコード・数値の変換表をそれぞれ作成し、当該変換表を用いて、各化合物について当該集計項目に含まれるケミカルフラグメンテーションの集計数値の集計を行ない、それぞれその総集計値を当該階層化されている構造特性成分の情報を表わす記述子とするステップと、
当該記述子の中から当該一群の化合物数の1/5〜1/10の数の記述子を選択し、その選択した記述子と当該化合物の生理活性測定値をそれぞれ重回帰法により相関解析して、当該生理活性の推算値を表わす下記の式(1)で示されるモデル式を得るステップと、
前記変換表を用いて、当該モデル式中の記述子に対応する集計項目からケミカルフラグメンテーションコードを選択変換すると共に、検索の目的とする生理活性の閾値を設定し、当該閾値以上又は閾値以下の化合物を検索するために、当該変換したケミカルフラグメンテーションコードに対応する集計数値とモデル式中の係数の積を寄与結果とし、当該寄与結果とモデル式中の定数項の総和を前記閾値と比較することにより、当該閾値以上又は閾値以下の条件に合致しているケミカルフラグメンテーションコードをキーワードとして選択組み合せて、定量的に生理活性を予測した検索結果を得るための検索式を組み立てるステップを
含むことを特徴とする化合物の生理活性の定量的予測方法。
式(1):生理活性(物質)=Σ(係数×記述子)+定数項 - 化合物の構造や一般式構造を登録したデータベースから生理活性を定量的に予測する方法であって、
化学構造とその生理活性測定値が示された一群の化合物の各化合物に、部分構造インデックスとしてケミカルフラグメンテーションコードを付与するステップと、
当該付与されたケミカルフラグメンテーションコードが数値的な指定をしている場合、当該数値的な指定をしている部分構造に対応する構造特性成分を集計項目とすると共に、当該集計項目に属するケミカルフラグメンテーションコードごとに当該指定された数値に基づき集計数値を設定したコード・数値の変換表をそれぞれ作成し、当該変換表を用いて、各化合物について当該集計項目に含まれるケミカルフラグメンテーションの集計数値の集計を行ない、それぞれその総集計値を当該階層化されている構造特性成分の情報を表わす記述子とするステップと、
当該記述子の中から当該一群の化合物の数1/5〜1/10の数の記述子を選択し、その選択した記述子と当該化合物の生理活性測定値をそれぞれ重回帰法により相関解析して、当該生理活性の推算値を表わす下記の式(1)で示されるモデル式をそれぞれ得るステップと、
前記変換表を用いて、当該モデル式中の記述子に対応する集計項目からケミカルフラグメンテーションコードを選択変換すると共に、検索の目的とする生理活性の閾値を設定し、当該閾値以上又は閾値以下の化合物を検索するために、当該変換したケミカルフラグメンテーションコードに対応する集計数値とモデル式中の係数の積を寄与結果とし、当該寄与結果とモデル式中の定数項の総和を前記閾値と比較することにより、当該閾値以上又は閾値以下の条件に合致しているケミカルフラグメンテーションコードをキーワードとして選択組み合せて、定量的に生理活性を予測した検索結果を得るための検索式を組み立てるステップを
含むことを特徴とする化合物の生理活性の定量的予測方法。
式(1):生理活性(物質)=Σ(係数×記述子)+定数項
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006167002A JP5075362B2 (ja) | 2005-07-05 | 2006-06-16 | 化合物の生理活性の定量的予測方法 |
PCT/JP2006/313076 WO2007004546A1 (ja) | 2005-07-05 | 2006-06-30 | 化合物の生理活性の定量的予測方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005196168 | 2005-07-05 | ||
JP2005196168 | 2005-07-05 | ||
JP2006167002A JP5075362B2 (ja) | 2005-07-05 | 2006-06-16 | 化合物の生理活性の定量的予測方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007039437A JP2007039437A (ja) | 2007-02-15 |
JP5075362B2 true JP5075362B2 (ja) | 2012-11-21 |
Family
ID=37604411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006167002A Expired - Fee Related JP5075362B2 (ja) | 2005-07-05 | 2006-06-16 | 化合物の生理活性の定量的予測方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5075362B2 (ja) |
WO (1) | WO2007004546A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020031671A1 (ja) | 2018-08-08 | 2020-02-13 | パナソニックIpマネジメント株式会社 | 材料記述子生成方法、材料記述子生成装置、材料記述子生成プログラム、予測モデル構築方法、予測モデル構築装置及び予測モデル構築プログラム |
WO2020166486A1 (ja) * | 2019-02-12 | 2020-08-20 | Jsr株式会社 | データ処理方法、データ処理装置及びデータ処理システム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MXPA01003448A (es) * | 1998-10-05 | 2002-09-18 | Specs And Biospecs Bv | Sistema para la clasificacion y generacion de compuestos quimicos. |
EP1167969A2 (en) * | 2000-06-14 | 2002-01-02 | Pfizer Inc. | Method and system for predicting pharmacokinetic properties |
GB0106441D0 (en) * | 2001-03-15 | 2001-05-02 | Bayer Ag | Method for generating a hierarchical topological tree of 2D or 3D-structural formulas of chemical compounds for property optimization of chemical compounds |
JP2003028857A (ja) * | 2001-03-21 | 2003-01-29 | Sumitomo Pharmaceut Co Ltd | ドーパミン受容体リガンドモデル |
-
2006
- 2006-06-16 JP JP2006167002A patent/JP5075362B2/ja not_active Expired - Fee Related
- 2006-06-30 WO PCT/JP2006/313076 patent/WO2007004546A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2007004546A1 (ja) | 2007-01-11 |
JP2007039437A (ja) | 2007-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Patlewicz et al. | A chemical category-based prioritization approach for selecting 75 per-and polyfluoroalkyl substances (PFAS) for tiered toxicity and toxicokinetic testing | |
Kausar et al. | An automated framework for QSAR model building | |
Bystrzanowska et al. | How can analysts use multicriteria decision analysis? | |
Ponzoni et al. | Hybridizing feature selection and feature learning approaches in QSAR modeling for drug discovery | |
Warr | Representation of chemical structures | |
Deng et al. | Structural interaction fingerprint (SIFt): a novel method for analyzing three-dimensional protein− ligand binding interactions | |
Hussain et al. | Computationally efficient algorithm to identify matched molecular pairs (MMPs) in large data sets | |
Zhang et al. | Random forest prediction of mutagenicity from empirical physicochemical descriptors | |
Zang et al. | Binary classification of a large collection of environmental chemicals from estrogen receptor assays by quantitative structure–activity relationship and machine learning methods | |
Ghafourian et al. | The impact of variable selection on the modelling of oestrogenicity | |
Ripphausen et al. | Analysis of structure-based virtual screening studies and characterization of identified active compounds | |
Zhou et al. | Fractional counting of citations in research evaluation: A cross-and interdisciplinary assessment of the Tsinghua University in Beijing | |
Servien et al. | TyPol–a new methodology for organic compounds clustering based on their molecular characteristics and environmental behavior | |
Strempel et al. | Using conditional inference trees and random forests to predict the bioaccumulation potential of organic chemicals | |
JP6211182B2 (ja) | 仮想スクリーニング用の演算による炭素及びプロトンnmr化学シフトベースのバイナリフィンガープリント | |
Gadaleta et al. | Automated integration of structural, biological and metabolic similarities to improve read-across | |
Wester et al. | Scaffold topologies. 2. Analysis of chemical databases | |
Gleeson et al. | Strategies for the generation, validation and application of in silico ADMET models in lead generation and optimization | |
Lowe et al. | Predicting compound amenability with liquid chromatography-mass spectrometry to improve non-targeted analysis | |
Deng et al. | Describe molecules by a heterogeneous graph neural network with transformer-like attention for supervised property predictions | |
JP5075362B2 (ja) | 化合物の生理活性の定量的予測方法 | |
Combes | Challenges for computational structure–activity modelling for predicting chemical toxicity: future improvements? | |
Wang et al. | Chemical data mining of the NCI human tumor cell line database | |
Gough et al. | Modeling the toxicity of amide herbicides using the electrotopological state | |
Nilakantan et al. | A family of ring system-based structural fragments for use in Structure− Activity studies: Database mining and recursive partitioning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090413 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120821 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120827 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5075362 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150831 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |