JP7444261B2 - 化合物置換プログラム、方法、装置 - Google Patents
化合物置換プログラム、方法、装置 Download PDFInfo
- Publication number
- JP7444261B2 JP7444261B2 JP2022539946A JP2022539946A JP7444261B2 JP 7444261 B2 JP7444261 B2 JP 7444261B2 JP 2022539946 A JP2022539946 A JP 2022539946A JP 2022539946 A JP2022539946 A JP 2022539946A JP 7444261 B2 JP7444261 B2 JP 7444261B2
- Authority
- JP
- Japan
- Prior art keywords
- partial structure
- compound
- partial
- score
- information indicating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 150000001875 compounds Chemical group 0.000 title claims description 160
- 238000006467 substitution reaction Methods 0.000 title claims description 33
- 238000000034 method Methods 0.000 title claims description 31
- 230000008569 process Effects 0.000 claims description 21
- IISBACLAFKSPIT-UHFFFAOYSA-N bisphenol A Chemical compound C=1C=C(O)C=CC=1C(C)(C)C1=CC=C(O)C=C1 IISBACLAFKSPIT-UHFFFAOYSA-N 0.000 description 26
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 22
- 238000006243 chemical reaction Methods 0.000 description 17
- 125000000217 alkyl group Chemical group 0.000 description 15
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 15
- 238000000605 extraction Methods 0.000 description 14
- 230000002776 aggregation Effects 0.000 description 13
- 238000004220 aggregation Methods 0.000 description 13
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 125000001147 pentyl group Chemical group C(CCCC)* 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- ATUOYWHBWRKTHZ-UHFFFAOYSA-N Propane Chemical group CCC ATUOYWHBWRKTHZ-UHFFFAOYSA-N 0.000 description 8
- 239000000284 extract Substances 0.000 description 8
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 239000000126 substance Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- OFBQJSOFQDEBGM-UHFFFAOYSA-N n-pentane Natural products CCCCC OFBQJSOFQDEBGM-UHFFFAOYSA-N 0.000 description 4
- 239000001294 propane Substances 0.000 description 4
- 125000001424 substituent group Chemical group 0.000 description 4
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 3
- HTVITOHKHWFJKO-UHFFFAOYSA-N Bisphenol B Chemical compound C=1C=C(O)C=CC=1C(C)(CC)C1=CC=C(O)C=C1 HTVITOHKHWFJKO-UHFFFAOYSA-N 0.000 description 2
- 239000001273 butane Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- IJDNQMDRQITEOD-UHFFFAOYSA-N n-butane Chemical compound CCCC IJDNQMDRQITEOD-UHFFFAOYSA-N 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 125000004178 (C1-C4) alkyl group Chemical group 0.000 description 1
- WCUDAIJOADOKAW-UHFFFAOYSA-N 4-[2-(4-hydroxyphenyl)pentan-2-yl]phenol Chemical compound C=1C=C(O)C=CC=1C(C)(CCC)C1=CC=C(O)C=C1 WCUDAIJOADOKAW-UHFFFAOYSA-N 0.000 description 1
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/40—Searching chemical structures or physicochemical data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
下位概念1と下位概念2の置換可能度合い=上位概念と下位概念1と下位概念2の組の出現頻度/(下位概念1の出現頻度と下位概念2の出現頻度の総和/2) …(1)
101 抽出部
102 頻度集計部
103 スコア算出部
104 解析部
105 変換部
106 上位概念探索部
107 下位概念探索部
108 選択部
109 逆変換部
110 置換部
111 化合物名生成部
121 検索部
151 ナレッジグラフ
152 スコア情報
153 部品化ルール
154 文書DB
Claims (7)
- 第1の化合物に含まれる第1の部分構造を特定し、
複数の部分構造間の関係を示す情報を参照し、前記第1の部分構造に関連する第2の部分構造を選択し、
複数のテキストデータにおける前記第1の部分構造と第2の部分構造とを含むグループの出現状況に基づいて算出されたスコアが閾値以上であるか判定し、
前記スコアが前記閾値以上であると判定された場合、前記第1の化合物の前記第1の部分構造を前記第2の部分構造に置き換えることにより得られる第2の化合物を示す情報を生成する、
処理をコンピュータに実行させることを特徴とする化合物置換プログラム。 - 前記選択する処理は、前記複数の部分構造間の関係を示す情報に示される、部分構造間の上位概念と下位概念の関係に基づき、前記第1の部分構造と同じ上位概念に属する下位概念に相当する部分構造を前記第2の部分構造として選択する処理を含む、
ことを特徴とする請求項1に記載の化合物置換プログラム。 - 前記第1の化合物を示す情報を入力として受け付け、前記生成する処理によって生成された前記第2の化合物を示す情報に関連する文書を、文書群から抽出する、
処理を前記コンピュータに実行させることを特徴とする請求項1に記載の化合物置換プログラム。 - 前記スコアは、前記第1の部分構造と第2の部分構造とが、前記複数のテキストデータに含まれる同一のテキストデータ内に出現する頻度が大きいほど大きくなるスコアである、
ことを特徴とする請求項1に記載の化合物置換プログラム。 - 前記選択する処理は、前記複数の部分構造間の関係を示す情報に示される、部分構造間の上位概念と下位概念の関係に基づき、前記第1の部分構造と同じ上位概念に属する下位概念に相当する複数の部分構造を前記第2の部分構造として選択する処理を含み、
前記生成する処理は、前記第1の化合物の前記第1の部分構造を、前記複数の部分構造のうち、前記スコアが前記閾値以上であると判定された特定の部分構造に置き換えることにより得られる前記第2の化合物を示す情報を生成する処理を含む、
ことを特徴とする請求項1に記載の化合物置換プログラム。 - 第1の化合物に含まれる第1の部分構造を特定し、
複数の部分構造間の関係を示す情報を参照し、前記第1の部分構造に関連する第2の部分構造を選択し、
複数のテキストデータにおける前記第1の部分構造と第2の部分構造とを含むグループの出現状況に基づいて算出されたスコアが閾値以上であるか判定し、
前記スコアが前記閾値以上であると判定された場合、前記第1の化合物の前記第1の部分構造を前記第2の部分構造に置き換えることにより得られる第2の化合物を示す情報を生成する、
処理をコンピュータが実行することを特徴とする化合物置換方法。 - 第1の化合物に含まれる第1の部分構造を特定し、
複数の部分構造間の関係を示す情報を参照し、前記第1の部分構造に関連する第2の部分構造を選択し、
複数のテキストデータにおける前記第1の部分構造と第2の部分構造とを含むグループの出現状況に基づいて算出されたスコアが閾値以上であるか判定し、
前記スコアが前記閾値以上であると判定された場合、前記第1の化合物の前記第1の部分構造を前記第2の部分構造に置き換えることにより得られる第2の化合物を示す情報を生成する、
制御部を含むことを特徴とする化合物置換装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/029451 WO2022024349A1 (ja) | 2020-07-31 | 2020-07-31 | 化合物置換プログラム、方法、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2022024349A1 JPWO2022024349A1 (ja) | 2022-02-03 |
JP7444261B2 true JP7444261B2 (ja) | 2024-03-06 |
Family
ID=80035313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022539946A Active JP7444261B2 (ja) | 2020-07-31 | 2020-07-31 | 化合物置換プログラム、方法、装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230115396A1 (ja) |
JP (1) | JP7444261B2 (ja) |
WO (1) | WO2022024349A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018147374A (ja) | 2017-03-08 | 2018-09-20 | 富士通株式会社 | 生成プログラム、生成方法、および生成装置 |
JP2020035172A (ja) | 2018-08-30 | 2020-03-05 | 富士通株式会社 | 生成方法、生成プログラム、および生成装置 |
-
2020
- 2020-07-31 JP JP2022539946A patent/JP7444261B2/ja active Active
- 2020-07-31 WO PCT/JP2020/029451 patent/WO2022024349A1/ja active Application Filing
-
2022
- 2022-12-13 US US18/065,443 patent/US20230115396A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018147374A (ja) | 2017-03-08 | 2018-09-20 | 富士通株式会社 | 生成プログラム、生成方法、および生成装置 |
JP2020035172A (ja) | 2018-08-30 | 2020-03-05 | 富士通株式会社 | 生成方法、生成プログラム、および生成装置 |
Also Published As
Publication number | Publication date |
---|---|
US20230115396A1 (en) | 2023-04-13 |
WO2022024349A1 (ja) | 2022-02-03 |
JPWO2022024349A1 (ja) | 2022-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5338238B2 (ja) | ワードの類似性を用いたオントロジーの自動生成 | |
JP5078173B2 (ja) | 多義性解消方法とそのシステム | |
JP4930153B2 (ja) | 文書検索システム、文書番号部分列取得装置、および文書検索方法 | |
KR20080049804A (ko) | 클릭 간격 결정 | |
JP2012093927A (ja) | ファイル管理装置及びファイル管理方法 | |
JP5497105B2 (ja) | 文書検索装置および方法 | |
JP2019082931A (ja) | 検索装置、類似度算出方法、およびプログラム | |
JP2020126360A (ja) | 学習データ拡張装置、学習装置、翻訳装置、およびプログラム | |
Kılınç et al. | Multi‐level reranking approach for bug localization | |
Agarwal et al. | Towards effective paraphrasing for information disguise | |
JP7444261B2 (ja) | 化合物置換プログラム、方法、装置 | |
JP5869948B2 (ja) | パッセージ分割方法、装置、及びプログラム | |
Brandsen et al. | Labelling the past: data set creation and multi-label classification of Dutch archaeological excavation reports | |
JP2007334388A (ja) | クラスタリング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
Leturia et al. | Morphological query expansion and language-filtering words for improving Basque web retrieval | |
JP6615420B1 (ja) | エッジシステム、情報処理方法及び情報処理プログラム | |
JP2011227749A (ja) | 略語完全語復元装置とその方法と、プログラム | |
JP7122773B2 (ja) | 辞書構築装置、辞書の生産方法、およびプログラム | |
JP6805927B2 (ja) | インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法 | |
CN1627289B (zh) | 用于分析汉语的装置和方法 | |
JPWO2020157887A1 (ja) | 文構造ベクトル化装置、文構造ベクトル化方法、及び文構造ベクトル化プログラム | |
JP2007200252A (ja) | 省略語生成・妥当性評価方法、同義語データベース生成・更新方法、省略語生成・妥当性評価装置、同義語データベース生成・更新装置、プログラム、記録媒体 | |
Robertson | A Contrastive Evaluation of Word Sense Disambiguation Systems for Finnish | |
JP5393392B2 (ja) | 時間表現抽出装置、時間表現抽出方法および時間表現抽出プログラム | |
JP6625087B2 (ja) | 違法コンテンツ探索装置及び違法コンテンツ探索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231031 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7444261 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |