JP2880710B2 - 化学構造検査方式 - Google Patents
化学構造検査方式Info
- Publication number
- JP2880710B2 JP2880710B2 JP62129929A JP12992987A JP2880710B2 JP 2880710 B2 JP2880710 B2 JP 2880710B2 JP 62129929 A JP62129929 A JP 62129929A JP 12992987 A JP12992987 A JP 12992987A JP 2880710 B2 JP2880710 B2 JP 2880710B2
- Authority
- JP
- Japan
- Prior art keywords
- central atom
- atom
- structural formula
- chemical structural
- partial structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Testing Or Calibration Of Command Recording Devices (AREA)
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、化学構造式における部分的な形あるいは意
味を指すフラグメントコードが登録されたフラグメント
コード辞書ファイルを用いて、検査対象の化学構造式が
フラグメントコードにより示される部分構造を含むか否
かを検査する方式に関するもので、特に数百種類にもな
る部分構造についての検査を高速に行う検査方式に関す
る。なお、以下では、検査対象の化学構造式がフラグメ
ントコードにより示される部分構造を含むか否かの検査
を、「フラグメントコードの抽出」と呼ぶことにする。 〔従来の技術〕 従来,この種のフラグメント抽出では,化学構造式中
の全原子とフラグメントコードの部分構造中の全原子と
の対応を調べている。そして,このようなフラグメント
抽出方式として,従来原子結合追跡法(atom−by−atom
topological Technique)が知られている。 〔発明が解決しようとする問題点〕 ところが,上述した従来の抽出方式の場合,化学構造
式中の全ての原子を対象にしてフラグメントコードの部
分構造中の全原子との対応を調べるので,部分構造を指
すフラグメントコードが数百種類にもなると,抽出時間
が長くなるという問題点がある。 〔問題点を解決するための手段〕 本発明の化学構造検査方式は、フラグメントコード辞
書ファイルに登録されたフラグメントコードにより示さ
れる、化学構造式の部分構造の情報から、該部分構造に
おける中心原子の種別及び結合状態を抽出する中心原子
抽出部と、検査対象の化学構造式を読み込み、前記中心
原子抽出部が抽出した中心原子と種別及び結合状態が同
一である原子が該検査対象の化学構造式に存在するかを
探索する中心原子探索部と、前記検査対象の化学構造式
に前記中心原子抽出部が抽出した中心原子と種別及び結
合状態が同一である原子が存在することが前記中心原子
探索部によって判定された場合にのみ、前記部分構造の
全原子を対象として前記検査対象の化学構造式と前記部
分構造との比較を行うことにより、前記検査対象の化学
構造式が前記部分構造を含むか否かを検査する全原子比
較部を有することを特徴とする。 〔実施例〕 以下本発明について実施例によって説明する。 第1図を参照して,本発明によるフラグメントコード
抽出方式は中心原子抽出部1,中心原子探索部2,及び全原
子比較部3を備えている。中心原子抽出部1はフラグメ
ントコード辞書ファイル4からフラグメントコードを読
み込み,おのおののフラグメントコードにおいて中心と
なる原子の種別及び結合状態等を取り出す。中心原子探
索部2は中心原子抽出部1で抽出された原子の種別及び
結合状態等の情報を受けるとともに,さらに,化学構造
式ファイル5から化学構造式を読み込み,上記の原子の
種別及び結合状態等が同一である原子を化学構造式ファ
イル5から読み込んだ抽出対象の化学構造式から探す。
全原子比較部3は中心原子探索部2からの探索結果情報
を受け,抽出対象化学構造式に中心原子が存在すると,
化学構造式とフラグメントコードの全原子を対象として
両者を比較して,フラグメントコードを抽出し,抽出し
たフラグメントコードファイル6へ格納する。 中心原子抽出部では中心原子として,炭素(C),酸
素(O),窒素(N),リン(P),及びイオウ(S)
等に限定して,原子の種別及び結合状態等を取り出し,
一方、C,O,N,P,及びSを含まないフラグメントコードの
場合,このフラグメントコードは直接全原子比較部3で
処理される。また,中心原子探索部2では上述のように
C,O,N,P,及びS等に限定して,化学構造式ファイル5か
ら読み込んだ抽出対象の化学構造式から中心原子を探
す。 ここで、中心原子抽出部で抽出される項目についてあ
げると, 原子の種別(C,O,N,P,S等に限定する),原子
の電荷とラジカル(遊離基),立体異性(R体,S体
等),同位体の質量数,鎖部分と環原子の区分,
結合状態(−x, 等,なおxは中心原子を示す),結合相手(x−O,x
=O,x−N,x=N,x≡N,等,なおxは中心原子を示す),
結合水素の数,である。 中心原子探索部は上述の〜の条件(項目)が同じ
である原子を化学構造式ファイル5から読み込んだ化学
構造式から探索する。その結果,同一条件の原子がみつ
からなければ,中心原子抽出部1は別のフラグメントコ
ードの中心原子を取り出す。 第2図にフラグメントコードの一部を示す。この場
合,第2図に波線を付した原子が中心原子であり,CO,CO
O,NH,NH2,及びCNの場合,中心原子の探索のみで十分で
あるから,全原子比較部での比較処理を行うことなく,
抽出が完了する。 〔発明の効果〕 以上説明したように本発明では,部分構造(フラグメ
ントコード)において,中心となる原子を定め,この中
心原子のみについて化学構造式の探索を全原子を比較す
る前に行うようにしたから,従来に比べて高速な抽出処
理ができるという効果がある。
味を指すフラグメントコードが登録されたフラグメント
コード辞書ファイルを用いて、検査対象の化学構造式が
フラグメントコードにより示される部分構造を含むか否
かを検査する方式に関するもので、特に数百種類にもな
る部分構造についての検査を高速に行う検査方式に関す
る。なお、以下では、検査対象の化学構造式がフラグメ
ントコードにより示される部分構造を含むか否かの検査
を、「フラグメントコードの抽出」と呼ぶことにする。 〔従来の技術〕 従来,この種のフラグメント抽出では,化学構造式中
の全原子とフラグメントコードの部分構造中の全原子と
の対応を調べている。そして,このようなフラグメント
抽出方式として,従来原子結合追跡法(atom−by−atom
topological Technique)が知られている。 〔発明が解決しようとする問題点〕 ところが,上述した従来の抽出方式の場合,化学構造
式中の全ての原子を対象にしてフラグメントコードの部
分構造中の全原子との対応を調べるので,部分構造を指
すフラグメントコードが数百種類にもなると,抽出時間
が長くなるという問題点がある。 〔問題点を解決するための手段〕 本発明の化学構造検査方式は、フラグメントコード辞
書ファイルに登録されたフラグメントコードにより示さ
れる、化学構造式の部分構造の情報から、該部分構造に
おける中心原子の種別及び結合状態を抽出する中心原子
抽出部と、検査対象の化学構造式を読み込み、前記中心
原子抽出部が抽出した中心原子と種別及び結合状態が同
一である原子が該検査対象の化学構造式に存在するかを
探索する中心原子探索部と、前記検査対象の化学構造式
に前記中心原子抽出部が抽出した中心原子と種別及び結
合状態が同一である原子が存在することが前記中心原子
探索部によって判定された場合にのみ、前記部分構造の
全原子を対象として前記検査対象の化学構造式と前記部
分構造との比較を行うことにより、前記検査対象の化学
構造式が前記部分構造を含むか否かを検査する全原子比
較部を有することを特徴とする。 〔実施例〕 以下本発明について実施例によって説明する。 第1図を参照して,本発明によるフラグメントコード
抽出方式は中心原子抽出部1,中心原子探索部2,及び全原
子比較部3を備えている。中心原子抽出部1はフラグメ
ントコード辞書ファイル4からフラグメントコードを読
み込み,おのおののフラグメントコードにおいて中心と
なる原子の種別及び結合状態等を取り出す。中心原子探
索部2は中心原子抽出部1で抽出された原子の種別及び
結合状態等の情報を受けるとともに,さらに,化学構造
式ファイル5から化学構造式を読み込み,上記の原子の
種別及び結合状態等が同一である原子を化学構造式ファ
イル5から読み込んだ抽出対象の化学構造式から探す。
全原子比較部3は中心原子探索部2からの探索結果情報
を受け,抽出対象化学構造式に中心原子が存在すると,
化学構造式とフラグメントコードの全原子を対象として
両者を比較して,フラグメントコードを抽出し,抽出し
たフラグメントコードファイル6へ格納する。 中心原子抽出部では中心原子として,炭素(C),酸
素(O),窒素(N),リン(P),及びイオウ(S)
等に限定して,原子の種別及び結合状態等を取り出し,
一方、C,O,N,P,及びSを含まないフラグメントコードの
場合,このフラグメントコードは直接全原子比較部3で
処理される。また,中心原子探索部2では上述のように
C,O,N,P,及びS等に限定して,化学構造式ファイル5か
ら読み込んだ抽出対象の化学構造式から中心原子を探
す。 ここで、中心原子抽出部で抽出される項目についてあ
げると, 原子の種別(C,O,N,P,S等に限定する),原子
の電荷とラジカル(遊離基),立体異性(R体,S体
等),同位体の質量数,鎖部分と環原子の区分,
結合状態(−x, 等,なおxは中心原子を示す),結合相手(x−O,x
=O,x−N,x=N,x≡N,等,なおxは中心原子を示す),
結合水素の数,である。 中心原子探索部は上述の〜の条件(項目)が同じ
である原子を化学構造式ファイル5から読み込んだ化学
構造式から探索する。その結果,同一条件の原子がみつ
からなければ,中心原子抽出部1は別のフラグメントコ
ードの中心原子を取り出す。 第2図にフラグメントコードの一部を示す。この場
合,第2図に波線を付した原子が中心原子であり,CO,CO
O,NH,NH2,及びCNの場合,中心原子の探索のみで十分で
あるから,全原子比較部での比較処理を行うことなく,
抽出が完了する。 〔発明の効果〕 以上説明したように本発明では,部分構造(フラグメ
ントコード)において,中心となる原子を定め,この中
心原子のみについて化学構造式の探索を全原子を比較す
る前に行うようにしたから,従来に比べて高速な抽出処
理ができるという効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例を示す図,第2図はフラグメ
ントコードと部分構造の一例を示す図である。 1……中心原子抽出部,2……中心原子探索部,3……全原
子比較部,4……フラグメントコード辞書ファイル,5……
化学構造式ファイル,6……抽出したフラグメントコード
ファイル。
ントコードと部分構造の一例を示す図である。 1……中心原子抽出部,2……中心原子探索部,3……全原
子比較部,4……フラグメントコード辞書ファイル,5……
化学構造式ファイル,6……抽出したフラグメントコード
ファイル。
─────────────────────────────────────────────────────
フロントページの続き
(72)発明者 ▲吉▼田 元二
大阪市東区北浜5丁目15番地 住友化学
工業株式会社内
(56)参考文献 特開 昭62−145417(JP,A)
情報処理学会第30回(昭60年前期)全
国大会講演論文集,p.941−942
NEC技報,Vol.37,No.12,
p.114−120
情報科学技術研究集会発表論文集,19
号,p.1−7(1983)
有機合成化学協会誌,42巻,8号,
p.743−750(1984)
Claims (1)
- (57)【特許請求の範囲】 1.フラグメントコード辞書ファイルに登録されたフラ
グメントコードにより示される、化学構造式の部分構造
の情報から、該部分構造における中心原子の種別及び結
合状態を抽出する中心原子抽出部と、 検査対象の化学構造式を読み込み、前記中心原子抽出部
が抽出した中心原子と種別及び結合状態が同一である原
子が該検査対象の化学構造式に存在するかを探索する中
心原子探索部と、 前記検査対象の化学構造式に前記中心原子抽出部が抽出
した中心原子と種別及び結合状態が同一である原子が存
在することが前記中心原子探索部によって判定された場
合にのみ、前記部分構造の全原子を対象として前記検査
対象の化学構造式と前記部分構造との比較を行うことに
より、前記検査対象の化学構造式が前記部分構造を含む
か否かを検査する全原子比較部を有することを特徴とす
る化学構造検査方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62129929A JP2880710B2 (ja) | 1987-05-28 | 1987-05-28 | 化学構造検査方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62129929A JP2880710B2 (ja) | 1987-05-28 | 1987-05-28 | 化学構造検査方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63296172A JPS63296172A (ja) | 1988-12-02 |
JP2880710B2 true JP2880710B2 (ja) | 1999-04-12 |
Family
ID=15021910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62129929A Expired - Lifetime JP2880710B2 (ja) | 1987-05-28 | 1987-05-28 | 化学構造検査方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2880710B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06203071A (ja) * | 1992-12-28 | 1994-07-22 | Toshiba Corp | パターン探索装置 |
-
1987
- 1987-05-28 JP JP62129929A patent/JP2880710B2/ja not_active Expired - Lifetime
Non-Patent Citations (4)
Title |
---|
NEC技報,Vol.37,No.12,p.114−120 |
情報処理学会第30回(昭60年前期)全国大会講演論文集,p.941−942 |
情報科学技術研究集会発表論文集,19号,p.1−7(1983) |
有機合成化学協会誌,42巻,8号,p.743−750(1984) |
Also Published As
Publication number | Publication date |
---|---|
JPS63296172A (ja) | 1988-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2460538A1 (en) | Information analyzing method and apparatus | |
Petruzzelli et al. | Serum antibodies to benzo (a) pyrene diol epoxide-DNA adducts in the general population: effects of air pollution, tobacco smoking, and family history of lung diseases | |
ATE192248T1 (de) | Suchvorgang innerhalb einer datenbasis durch komprimierte präfixassoziation | |
CN106469049B (zh) | 一种文件扫描的方法及装置 | |
EP1345181A3 (en) | Method and system for mail detection and tracking of categorized mail pieces | |
Plow et al. | Neoantigenic expressions engendered by plasmin cleavage of fibrinogen | |
CN112786102A (zh) | 一种基于宏基因组学分析精准识别水体中未知微生物群落的方法 | |
CN114398069A (zh) | 一种基于交叉指纹分析的公共组件库精确版本识别方法及系统 | |
US9424340B1 (en) | Detection of proxy pad sites | |
CN101872325A (zh) | 一种基于谓词执行序列的软件动态缺陷定位方法 | |
Massignani et al. | hmSEEKER: Identification of hmSILAC doublets in MaxQuant output data | |
JP2880710B2 (ja) | 化学構造検査方式 | |
CN114647853B (zh) | 提高分布式应用程序漏洞检测准确性的方法及系统 | |
CN1345426A (zh) | 用于提取索引关键字数据字段的系统和方法 | |
CN1129070C (zh) | 程序设计中内存操作错误的识别方法 | |
JPH02130673A (ja) | データ検索方式 | |
KR102068605B1 (ko) | 함수 실행 순서를 이용한 악성코드 분류 방법 및 이를 사용한 장치 | |
CN114995880B (zh) | 一种基于SimHash的二进制代码相似性比对方法 | |
CN113962218A (zh) | 一种违规应用识别方法、装置、设备及可读存储介质 | |
JP2758609B2 (ja) | 化学構造式の完全一致検索方式 | |
JPH0218652A (ja) | データ集信方式 | |
CN106203076B (zh) | 一种利用ebp判断恶意文件的方法 | |
US7152225B2 (en) | Identifying a kernel structure using an element and a variable offset of the structure from debugging | |
CN111324380A (zh) | 一种高效的多版本跨项目软件代码克隆检测方法 | |
Muratsugu et al. | Evaluation of fluorescence polarization immunoassay for serum thyroxine determination |