JP2021093227A - 化学情報を含む文書の検索および索引付けのためのシステムおよび方法 - Google Patents
化学情報を含む文書の検索および索引付けのためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2021093227A JP2021093227A JP2021047466A JP2021047466A JP2021093227A JP 2021093227 A JP2021093227 A JP 2021093227A JP 2021047466 A JP2021047466 A JP 2021047466A JP 2021047466 A JP2021047466 A JP 2021047466A JP 2021093227 A JP2021093227 A JP 2021093227A
- Authority
- JP
- Japan
- Prior art keywords
- data
- text
- processor
- chemical structure
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000126 substance Substances 0.000 title claims abstract description 417
- 238000000034 method Methods 0.000 title claims abstract description 218
- 230000000875 corresponding effect Effects 0.000 claims description 72
- 230000002596 correlated effect Effects 0.000 claims description 6
- 238000000547 structure data Methods 0.000 abstract description 191
- 238000013459 approach Methods 0.000 abstract description 4
- 238000012216 screening Methods 0.000 description 76
- 239000000470 constituent Substances 0.000 description 45
- 230000002085 persistent effect Effects 0.000 description 27
- 238000003860 storage Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 17
- 239000000284 extract Substances 0.000 description 14
- 230000003190 augmentative effect Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 description 9
- 230000003993 interaction Effects 0.000 description 8
- 230000003014 reinforcing effect Effects 0.000 description 8
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 6
- 125000004429 atom Chemical group 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000009877 rendering Methods 0.000 description 5
- 101100503241 Caenorhabditis elegans folt-1 gene Proteins 0.000 description 4
- 238000010845 search algorithm Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 3
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 2
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 229910052801 chlorine Inorganic materials 0.000 description 2
- 239000000460 chlorine Substances 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 125000005842 heteroatom Chemical group 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000009257 reactivity Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000012152 algorithmic method Methods 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 150000002576 ketones Chemical class 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2425—Iterative querying; Query formulation based on the results of a preceding query
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/40—Searching chemical structures or physicochemical data
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/90—Programming languages; Computing architectures; Database systems; Data warehousing
Abstract
Description
本出願は、2017年3月3日に出願された「Systems and Methods for Searching and Indexing Documents Comprising Chemical Information」というタイトルの米国仮特許出願第62/466,764号に対する優先権および利益を主張し、その内容が参照により全体として本明細書に組み込まれる。
本発明は一般に、化学情報を含む文書を効率的に検索および索引付けするためのシステムおよび方法に関する。
例えば、本願は以下の項目を提供する。
(項目1)
化学情報を含む文書のセットを検索するための方法であって、
(a)コンピューティング装置のプロセッサによって、ユーザー入力された化学構造データおよびテキストデータを含むユーザークエリーを受信するステップであって、
前記テキストデータおよび前記ユーザー入力された化学構造データは少なくとも1つの化学構造に対応する、ステップと、
(b)前記プロセッサによって、ビットスクリーニングデータおよび関係データを前記ユーザー入力された化学構造データから識別または抽出するステップであって、前記ビットスクリーニングデータは前記少なくとも1つの化学構造の1つまたは複数の構成元素に対応し、かつ前記関係データは複数の前記1つまたは複数の構成元素間の1つまたは複数の関係に対応する、ステップと、
(c)前記プロセッサによって、前記ユーザークエリーを、前記ビットスクリーニングデータの少なくとも一部に基づいて1つまたは複数の文字列タグを生成することにより補強するステップであって、前記補強されたユーザークエリーは前記1つまたは複数の文字列タグを含むようになり、
前記1つまたは複数の文字列タグは前記少なくとも1つの化学構造を記述するための英数字文字のシーケンスを含む、ステップと、
(d)テキストベース検索方法を使用して、前記プロセッサによって、文書の前記セットに対応する文書データを含むデータベースに問い合わせを行うステップであって、問い合わせを行うステップは、前記補強されたユーザークエリーの少なくとも一部を前記文書データと相関させて、1つまたは複数のテキストベース検索結果を生成する、ステップを含むことと、
(e)任意選択として、前記プロセッサにより、前記1つまたは複数のテキストベース検索結果を出力するステップと
を含む、方法。
(項目2)
前記プロセッサによって、前記ビットスクリーニングデータおよび前記関係データを1つまたは複数の文字列に変換する
ステップをさらに含む、項目1に記載の方法。
(項目3)
(f)構造ベース検索方法を使用して、前記問い合わせを行うステップの後に、前記プロセッサにより、前記ユーザー入力された化学構造データの少なくとも一部を前記1つまたは複数のテキストベース検索結果の関連のある化学構造データと相関させることによって前記1つまたは複数のテキストベース検索結果を検索するステップと、1つまたは複数の精緻化された検索結果を生成するステップであって、前記1つまたは複数のテキストベース検索結果は前記関連のある化学構造データを含むフィルタ処理された文書データに対応する、ステップと、
(g)前記プロセッサによって、前記1つまたは複数の精緻化された検索結果を出力するステップと
をさらに含む、項目1または項目2に記載の方法。
(項目4)
前記構造ベース検索方法は、文字列データを入力として使用する、項目3に記載の方法。
(項目5)
前記1つまたは複数の文字列タグの少なくとも1つは、自然言語テキストを含む、先行する項目のいずれか1項に記載の方法。
(項目6)
前記構造ベース検索は原子ごとの検索を含む、項目3〜項目5のいずれか1項に記載の方法。
(項目7)
前記問い合わせを行うステップ(d)は、前記プロセッサにより、関連性検索を使用して、前記1つまたは複数のテキストベース検索結果を生成することを含む、先行する項目のいずれか1項に記載の方法。
(項目8)
前記関連性検索はヒットスコアリング検索である、項目7に記載の方法。
(項目9)
ステップ(f)は、
前記プロセッサによって、前記1つまたは複数のテキストベース検索結果の前記関連のある化学構造データを最小スパニング木にまとめるステップと、
前記プロセッサによって、前記最小スパニング木を持続性コンピュータ可読媒体上に格納するステップと、
前記プロセッサによって、前記最小スパニング木を検索する、ステップと
を含む、項目3〜項目8のいずれか1項に記載の方法。
(項目10)
前記ユーザー入力された化学構造データは、前記少なくとも1つの化学構造の部分構造または完全な構造に対応する、先行する項目のいずれか1項に記載の方法。
(項目11)
文書の前記セットに対応する前記文書データは、1つまたは複数の索引付け文字列タグを含むように補強されている、先行する項目のいずれか1項に記載の方法。
(項目12)
前記問い合わせを行うステップは、前記補強されたユーザークエリーの前記少なくとも一部を前記1つまたは複数の索引付け文字列タグの少なくとも1つと相関させることを含む、項目11に記載の方法。
(項目13)
化学情報を含む文書のセットを検索するための方法であって、
(a)コンピューティング装置のプロセッサによって、ユーザー入力された化学構造データを含むユーザークエリーを受信するステップと、
前記ユーザー入力された化学構造データは少なくとも1つの化学構造に対応することと、
(b)前記プロセッサによって、ビットスクリーニングデータおよび関係データを前記ユーザー入力された化学構造データから識別または抽出するステップであって、前記ビットスクリーニングデータは前記少なくとも1つの化学構造の1つまたは複数の構成元素に対応し、かつ前記関係データは複数の前記1つまたは複数の構成元素間の1つまたは複数の関係に対応するステップと、
(c)前記プロセッサによって、前記ユーザークエリーを、前記ビットスクリーニングデータの少なくとも一部に基づいて1つまたは複数の文字列タグを生成し、任意選択として、前記関係データの少なくとも一部に基づいて1つまたは複数の符号化文字列を生成することにより補強するステップであって、前記補強されたユーザークエリーが前記1つまたは複数の文字列タグを含むようになり、
前記1つまたは複数の文字列タグは前記少なくとも1つの化学構造を記述するための英数字文字のシーケンスを含む、ステップと、
(d)テキストベース検索方法を使用して、前記プロセッサによって、文書の前記セットに対応する文書データを含むデータベースに問い合わせを行うステップであって、問い合わせを行うステップは、前記補強されたユーザークエリーの少なくとも一部を前記文書データと相関させて、1つまたは複数のテキストベース検索結果を生成するステップを含むことと、
(e)任意選択として、前記プロセッサにより、前記1つまたは複数のテキストベース検索結果を出力する、ステップと
を含む、方法。
(項目14)
前記プロセッサによって、前記ビットスクリーニングデータおよび前記関係データを1つまたは複数の文字列に変換する
ステップをさらに含む、項目13に記載の方法。
(項目15)
(f)構造ベース検索方法を使用して、前記問い合わせを行うステップの後に、前記プロセッサにより、前記ユーザー入力された化学構造データの少なくとも一部を前記1つまたは複数のテキストベース検索結果の関連のある化学構造データと相関させることによって前記1つまたは複数のテキストベース検索結果を検索して、1つまたは複数の精緻化された検索結果を生成するステップであって、前記1つまたは複数のテキストベース検索結果は前記関連のある化学構造データを含むフィルタ処理された文書データに対応するステップと、
(g)前記プロセッサによって、前記1つまたは複数の精緻化された検索結果を出力する、ステップと
をさらに含む、項目13または項目14に記載の方法。
(項目16)
前記構造ベース検索方法は、文字列データを入力として使用する、項目15に記載の方法。
(項目17)
前記1つまたは複数の文字列タグの少なくとも1つは、自然言語テキストを含む、項目13〜項目16のいずれか1項に記載の方法。
(項目18)
前記構造ベース検索は原子ごとの検索を含む、項目15〜項目17のいずれか1項に記載の方法。
(項目19)
前記問い合わせを行うステップ(d)は、前記プロセッサにより、関連性検索を使用して、前記1つまたは複数のテキストベース検索結果を生成することを含む、項目13〜項目18のいずれか1項に記載の方法。
(項目20)
前記関連性検索はヒットスコアリング検索である、項目19に記載の方法。
(項目21)
ステップ(f)は、
前記プロセッサによって、前記1つまたは複数のテキストベース検索結果の前記関連のある化学構造データを最小スパニング木にまとめることと、
前記プロセッサによって、前記最小スパニング木を持続性コンピュータ可読媒体上に格納することと、
前記プロセッサによって、前記最小スパニング木を検索することと
を含む、項目15〜項目20のいずれか1項に記載の方法。
(項目22)
前記ユーザー入力された化学構造データは、前記少なくとも1つの化学構造の部分構造または完全な構造に対応する、項目13〜項目21のいずれか1項に記載の方法。
(項目23)
文書の前記セットに対応する前記文書データは、1つまたは複数の索引付け文字列タグを含むように補強されている、項目13〜項目22のいずれか1項に記載の方法。
(項目24)
前記問い合わせを行うステップは、前記補強されたユーザークエリーの前記少なくとも一部を前記1つまたは複数の索引付け文字列タグの少なくとも1つと相関させることを含む、項目23に記載の方法。
(項目25)
化学情報を含む索引付けされた文書のセットのテキストベース検索のための方法であって、
(a)コンピューティング装置のプロセッサによって、テキストデータを含むユーザークエリーを受信するステップであって、前記テキストデータは少なくとも1つの化学構造を記述する英数字文字のシーケンスを含むステップと、
(b)テキストベース検索方法を使用して、前記プロセッサによって、索引付けされた文書の前記セットに対応する文書データを含むデータベースに問い合わせを行うステップであって、前記文書データは1つまたは複数の索引文字列タグを含むように補強されており、問い合わせを行うことは、前記ユーザークエリーの前記テキストデータの少なくとも一部を前記1つまたは複数の索引文字列タグと相関させて1つまたは複数のテキストベース検索結果を生成するステップを含み、
前記1つまたは複数の索引文字列タグは、前記少なくとも1つの化学構造を記述するための英数字文字のシーケンスを含むステップと、
(c)前記プロセッサにより、前記1つまたは複数のテキストベース検索結果を出力する、ステップと
を含む、方法。
(項目26)
前記1つまたは複数の索引文字列タグは、自然言語テキストを含む、項目25に記載の方法。
(項目27)
前記問い合わせを行うステップは、前記プロセッサにより、関連性検索を使用して、前記1つまたは複数のテキストベース検索結果を生成するステップを含む、項目25または項目26に記載の方法。
(項目28)
前記関連性検索はヒットスコアリング検索である、項目26または項目27に記載の方法。
(項目29)
化学構造検索を容易にするために文書を索引付けするための方法であって、
コンピューティング装置のプロセッサによって、前記文書に対応する文書データを受信するステップであって、前記文書データは化学構造に対応する化学構造データを含むステップと、
前記プロセッサによって、前記化学構造データ内のビットスクリーニングデータおよび関係データを識別または抽出するステップであって、
前記ビットスクリーニングデータは前記化学構造の1つまたは複数の構成元素に対応し、かつ
前記関係データは前記1つまたは複数の構成元素間の関係に対応するステップと、
前記プロセッサによって、前記識別されたビットスクリーニングデータの少なくとも一部に基づいて文字列タグを生成するステップであって、前記文字列タグは、前記化学構造データに対応する前記化学構造を記述するための英数字値を含むステップと、
任意選択として、前記プロセッサにより、前記関係データの少なくとも一部に基づいて符号化文字列を生成するステップと、
前記プロセッサによって、前記文字列タグを前記化学構造データまたは前記文書データと関連付けるステップと、
前記プロセッサにより、前記文字列タグを出力する、ステップと
を含む、方法。
(項目30)
前記プロセッサによって、前記ビットスクリーニングデータおよび前記関係データを1つまたは複数の文字列に変換する
ステップを含む、項目29に記載の方法。
(項目31)
前記文字列タグは、自然言語テキストを含む、項目29または項目30に記載の方法。
(項目32)
前記プロセッサによって、前記文書データを補強するステップを含み、前記補強された文書データは前記文字列タグを含む、項目29〜項目31のいずれか1項に記載の方法。
(項目33)
前記プロセッサによって、前記文字列タグを第2の持続性コンピュータ可読媒体上に格納するステップを含む、項目29〜項目32のいずれか1項に記載の方法。
(項目34)
前記文字列タグを索引付けすることを含む、項目29〜項目33のいずれか1項に記載の方法。
(項目35)
前記文書データはメタデータを含む、項目29〜項目34のいずれか1項に記載の方法。
(項目36)
前記メタデータは一意のIDおよびバケットIDを含む、項目35に記載の方法。
(項目37)
前記プロセッサによって、前記メタデータを持続する
ステップを含む、項目35または項目36に記載の方法。
(項目38)
前記関係データを1つまたは複数の符号化文字列に変換することを含む、項目29〜項目37のいずれか1項に記載の方法。
(項目39)
前記関係データは格納されるが、索引付けはされない、項目29〜項目38のいずれか1項に記載の方法。
(項目40)
化学情報を含む索引付けされた文書のセットを、連続的な検索を使用して検索するための方法であって、
(a)コンピューティング装置のプロセッサによって、ユーザー入力された化学構造データおよびテキストデータを含むユーザークエリーを受信するステップと、
(b)テキストベース検索方法を使用して、前記プロセッサによって、索引付けされた文書の前記セットに対応する文書データを含むデータベースに問い合わせを行うステップであって、問い合わせを行うステップは、前記ユーザー入力された化学構造データの少なくとも一部を前記文書データと、および前記ユーザークエリーの前記テキストデータの少なくとも一部を前記文書データと相関させてフィルタ処理された文書データを生成することを含むステップと、
(c)構造ベース検索方法を使用して、前記問い合わせを行うステップの後に、前記プロセッサにより、前記フィルタ処理された文書データを検索するステップであって、検索するステップは、ユーザー入力された化学構造データの少なくとも一部を前記フィルタ処理された文書データ内の関連のあるフィルタ処理された化学構造データと相関させて1つまたは複数の検索結果を生成するステップを含むことと、
(d)前記プロセッサによって、前記1つまたは複数の検索結果を出力する
ステップと
を含む、方法。
(項目41)
前記プロセッサによって、前記化学構造データを1つまたは複数の文字列に変換する
ステップを含む、項目40に記載の方法。
(項目42)
前記構造ベース検索方法は、文字列データを入力として使用する、項目41に記載の方法。
(項目43)
ステップ(b)の前に、前記プロセッサによって、前記ユーザークエリーを、1つまたは複数の文字列タグを生成することにより補強するステップと、前記補強されたユーザークエリーが前記1つまたは複数の文字列タグを含むようになるステップを含み、前記1つまたは複数のクエリー文字列タグは化学構造を記述する、
項目40〜項目42のいずれか1項に記載の方法。
(項目44)
ステップ(b)は、前記1つまたは複数の文字列タグの少なくとも1つを前記文書データと相関させることを含む、項目43に記載の方法。
(項目45)
前記文書データは1つまたは複数の索引文字列タグを含む、項目40〜項目44のいずれか1項に記載の方法。
(項目46)
ステップ(b)は、前記テキストデータの少なくとも一部を前記1つまたは複数の索引文字列タグと相関させることを含む、項目45に記載の方法。
(項目47)
化学情報を含む文書のセットを検索するためのシステムであって、前記システムは、
プロセッサと、
命令をその上に格納している持続性コンピュータ可読媒体であって、前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
(a)前記プロセッサによって、ユーザー入力された化学構造データおよびテキストデータを含むユーザークエリーを受信することであって、
前記テキストデータおよび前記ユーザー入力された化学構造データは少なくとも1つの化学構造に対応することと、
(b)前記プロセッサによって、ビットスクリーニングデータおよび関係データを前記ユーザー入力された化学構造データから識別することであって、前記ビットスクリーニングデータは前記少なくとも1つの化学構造の1つまたは複数の構成元素に対応し、かつ前記関係データは複数の前記1つまたは複数の構成元素間の1つまたは複数の関係に対応することと、
(c)前記プロセッサによって、前記ユーザークエリーを、前記ビットスクリーニングデータの少なくとも一部に基づいて1つまたは複数の文字列タグを生成することにより補強し、そのため前記補強されたユーザークエリーは前記1つまたは複数の文字列タグを含むようになることであって、
前記1つまたは複数の文字列タグは前記少なくとも1つの化学構造を記述するための英数字文字のシーケンスを含むことと、
(d)テキストベース検索方法を使用して、前記プロセッサによって、文書の前記セットに対応する文書データを含むデータベースに問い合わせを行うことであって、問い合わせを行うことは、前記補強されたユーザークエリーの少なくとも一部を前記文書データと相関させて、1つまたは複数のテキストベース検索結果を生成することを含むことと、
(e)任意選択として、前記プロセッサにより、前記1つまたは複数のテキストベース検索結果を出力することと
を行わせる、持続性コンピュータ可読媒体と
を備える、システム。
(項目48)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
前記プロセッサによって、前記ビットスクリーニングデータおよび前記関係データを1つまたは複数の文字列に変換させる、項目47に記載のシステム。
(項目49)
前記命令は、前記プロセッサによって実行される場合に、さらに前記プロセッサに、
(f)構造ベース検索方法を使用して、前記問い合わせを行うステップの後に、前記プロセッサにより、前記ユーザー入力された化学構造データの少なくとも一部を前記1つまたは複数のテキストベース検索結果の関連のある化学構造データと相関させることによって前記1つまたは複数のテキストベース検索結果を検索して、1つまたは複数の精緻化された検索結果を生成することであって、前記1つまたは複数のテキストベース検索結果は前記関連のある化学構造データを含むフィルタ処理された文書データに対応することと、(g)前記プロセッサによって、前記1つまたは複数の精緻化された検索結果を出力することと
を行わせる、項目47または項目48に記載のシステム。
(項目50)
前記構造ベース検索方法は、文字列データを入力として使用する、項目49に記載のシステム。
(項目51)
前記1つまたは複数の文字列タグの少なくとも1つは、自然言語テキストを含む、項目47〜項目50のいずれか1項に記載のシステム。
(項目52)
前記構造ベース検索は原子ごとの検索を含む、項目49〜項目51のいずれか1項に記載のシステム。
(項目53)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、前記プロセッサにより、関連性検索を使用して、前記1つまたは複数のテキストベース検索結果を生成させる、項目47〜項目52のいずれか1項に記載のシステム。
(項目54)
前記関連性検索はヒットスコアリング検索である、項目53に記載のシステム。
(項目55)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
前記プロセッサによって、前記1つまたは複数のテキストベース検索結果の前記関連のある化学構造データを最小スパニング木にまとめることと、
前記プロセッサによって、前記最小スパニング木を持続性コンピュータ可読媒体上に格納することと、
前記プロセッサによって、前記最小スパニング木を検索することと
を行わせる、項目49〜項目54のいずれか1項に記載のシステム。
(項目56)
前記ユーザー入力された化学構造データは、前記少なくとも1つの化学構造の部分構造または完全な構造に対応する、項目47〜項目55のいずれか1項に記載のシステム。
(項目57)
文書の前記セットに対応する前記文書データは、1つまたは複数の索引付け文字列タグを含むように補強されている、項目47〜項目56のいずれか1項に記載のシステム。
(項目58)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、前記プロセッサによって、前記補強されたユーザークエリーの前記少なくとも一部を前記1つまたは複数の索引付け文字列タグの少なくとも1つと相関させる、項目57に記載のシステム。
(項目59)
化学情報を含む文書のセットを検索するためのシステムであって、前記システムは、
プロセッサと、
命令をその上に格納している持続性コンピュータ可読媒体であって、前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
(a)前記プロセッサによって、ユーザー入力された化学構造データを含むユーザークエリーを受信するステップであって、
前記ユーザー入力された化学構造データは少なくとも1つの化学構造に対応することと、
(b)前記プロセッサによって、ビットスクリーニングデータおよび関係データを前記ユーザー入力された化学構造データから識別または抽出することであって、前記ビットスクリーニングデータは前記少なくとも1つの化学構造の1つまたは複数の構成元素に対応し、前記関係データは複数の前記1つまたは複数の構成元素間の1つまたは複数の関係に対応するステップと、
(c)前記プロセッサによって、前記ユーザークエリーを、前記ビットスクリーニングデータの少なくとも一部に基づいて1つまたは複数の文字列タグを生成し、任意選択として、前記関係データの少なくとも一部に基づいて1つまたは複数の符号化文字列を生成することにより補強するステップであって、前記補強されたユーザークエリーが前記1つまたは複数の文字列タグを含むようになるステップであって、
前記1つまたは複数の文字列タグは前記少なくとも1つの化学構造を記述するための英数字文字のシーケンスを含むステップと、
(d)テキストベース検索方法を使用して、前記プロセッサによって、文書の前記セットに対応する文書データを含むデータベースに問い合わせを行うことであって、問い合わせを行うことは、前記補強されたユーザークエリーの少なくとも一部を前記文書データと相関させて、1つまたは複数のテキストベース検索結果を生成することを含むステップと、
(e)任意選択として、前記プロセッサにより、前記1つまたは複数のテキストベース検索結果を出力する、ステップと
を行わせる、持続性コンピュータ可読媒体と
を備える、システム。
(項目60)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
前記プロセッサによって、前記ビットスクリーニングデータおよび前記関係データを1つまたは複数の文字列に変換させる、項目59に記載のシステム。
(項目61)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
(f)構造ベース検索方法を使用して、前記問い合わせを行うステップの後に、前記プロセッサにより、前記ユーザー入力された化学構造データの少なくとも一部を前記1つまたは複数のテキストベース検索結果の関連のある化学構造データと相関させることによって前記1つまたは複数のテキストベース検索結果を検索して、1つまたは複数の精緻化された検索結果を生成することであって、前記1つまたは複数のテキストベース検索結果は前記関連のある化学構造データを含むフィルタ処理された文書データに対応することと、
(g)前記プロセッサによって、前記1つまたは複数の精緻化された検索結果を出力することと
を行わせる、項目59または項目60に記載のシステム。
(項目62)
前記構造ベース検索方法は、文字列データを入力として使用する、項目61に記載のシステム。
(項目63)
前記1つまたは複数の文字列タグの少なくとも1つは、自然言語テキストを含む、項目59〜項目62のいずれか1項に記載のシステム。
(項目64)
前記構造ベース検索は原子ごとの検索を含む、項目61〜項目63のいずれか1項に記載のシステム。
(項目65)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、前記プロセッサにより、関連性検索を使用して、前記1つまたは複数のテキストベース検索結果を生成させる、項目59〜項目64のいずれか1項に記載のシステム。
(項目66)
前記関連性検索はヒットスコアリング検索である、項目65に記載のシステム。
(項目67)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
前記プロセッサによって、前記1つまたは複数のテキストベース検索結果の前記関連のある化学構造データを最小スパニング木にまとめることと、
前記プロセッサによって、前記最小スパニング木を持続性コンピュータ可読媒体上に格納することと、
前記プロセッサによって、前記最小スパニング木を検索することと
を行わせる、項目61〜項目66のいずれか1項に記載のシステム。
(項目68)
前記ユーザー入力された化学構造データは、前記少なくとも1つの化学構造の部分構造または完全な構造に対応する、項目59〜項目67のいずれか1項に記載のシステム。
(項目69)
文書の前記セットに対応する前記文書データは、1つまたは複数の索引付け文字列タグを含むように補強されている、項目59〜項目68のいずれか1項に記載のシステム。
(項目70)
前記問い合わせを行うステップは、前記プロセッサによって、前記補強されたユーザークエリーの前記少なくとも一部を前記1つまたは複数の索引付け文字列タグの少なくとも1つと相関させる命令を含む、項目69に記載のシステム。
(項目71)
化学情報を含む索引付けされた文書のセットのテキストベース検索のためのシステムであって、前記システムは、
プロセッサと、
命令をその上に格納している持続性コンピュータ可読媒体であって、前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
(a)前記プロセッサによって、テキストデータを含むユーザークエリーを受信することであって、前記テキストデータは少なくとも1つの化学構造を記述する英数字文字のシーケンスを含むことと、
(b)テキストベース検索方法を使用して、前記プロセッサによって、索引付けされた文書の前記セットに対応する文書データを含むデータベースに問い合わせを行うことであって、前記文書データは1つまたは複数の索引文字列タグを含むように補強されており、問い合わせを行うことは、前記ユーザークエリーの前記テキストデータの少なくとも一部を前記1つまたは複数の索引文字列タグと相関させて1つまたは複数のテキストベース検索結果を生成することを含み、
前記1つまたは複数の索引文字列タグは、前記少なくとも1つの化学構造を記述するための英数字文字のシーケンスを含むことと、
(c)前記プロセッサにより、前記1つまたは複数のテキストベース検索結果を出力することと
を行わせる、持続性コンピュータ可読媒体と
を備える、システム。
(項目72)
前記1つまたは複数の索引文字列タグは、自然言語テキストを含む、項目71に記載のシステム。
(項目73)
前記問い合わせを行うステップは、前記プロセッサにより、関連性検索を使用して、前記1つまたは複数のテキストベース検索結果を生成する命令を含む、項目71または項目72に記載のシステム。
(項目74)
前記関連性検索はヒットスコアリング検索である、項目72または項目73に記載のシステム。
(項目75)
化学構造検索を容易にするために文書を索引付けするためのシステムであって、前記システムは、
プロセッサと、
命令をその上に格納している持続性コンピュータ可読媒体であって、前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
コンピューティング装置のプロセッサによって、前記文書に対応する文書データを受信することであって、前記文書データは化学構造に対応する化学構造データを含むことと、
前記プロセッサによって、前記化学構造データ内のビットスクリーニングデータおよび関係データを識別または抽出することであって、
前記ビットスクリーニングデータは前記化学構造の1つまたは複数の構成元素に対応し、かつ
前記関係データは前記1つまたは複数の構成元素間の関係に対応することと、
前記プロセッサによって、前記識別されたビットスクリーニングデータの少なくとも一部に基づいて文字列タグを生成することであって、前記文字列タグは、前記化学構造データに対応する前記化学構造を記述するための英数字値を含むことと、
前記プロセッサによって、前記文字列タグを前記化学構造データまたは前記文書データと関連付けることと、
前記プロセッサにより、前記文字列タグを出力することと
を行わせる、持続性コンピュータ可読媒体と
を備える、システム。
(項目76)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
前記プロセッサによって、前記ビットスクリーニングデータおよび前記関係データを1つまたは複数の文字列に変換させる、
項目75に記載のシステム。
(項目77)
前記文字列タグは、自然言語テキストを含む、項目75または項目76に記載のシステム。
(項目78)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
前記プロセッサによって、前記文書データを補強させ、前記補強された文書データは前記文字列タグを含む、
項目75〜項目77のいずれか1項に記載のシステム。
(項目79)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
前記プロセッサによって、前記文字列タグを第2の持続性コンピュータ可読媒体上に格納させる、
項目75〜項目78のいずれか1項に記載のシステム。
(項目80)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、前記文字列タグを索引付けさせる、項目75〜項目79のいずれか1項に記載のシステム。
(項目81)
前記文書データはメタデータを含む、項目75〜項目80のいずれか1項に記載のシステム。
(項目82)
前記メタデータは一意のIDおよびバケットIDを含む、項目81に記載のシステム。
(項目83)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
前記プロセッサによって、前記メタデータを持続させる、
項目81または項目82に記載のシステム。
(項目84)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、前記関係データを1つまたは複数の符号化文字列に変換させる、項目75〜項目83のいずれか1項に記載のシステム。
(項目85)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、前記関係データを格納させるが、索引付けはさせない、項目75〜項目84のいずれか1項に記載のシステム。
(項目86)
化学情報を含む索引付けされた文書のセットを、連続的な検索を使用して検索するためのシステムであって、前記システムは、
プロセッサと、
命令をその上に格納している持続性コンピュータ可読媒体であって、前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
(a)前記プロセッサによって、ユーザー入力された化学構造データおよびテキストデータを含むユーザークエリーを受信することと、
(b)テキストベース検索方法を使用して、前記プロセッサによって、索引付けされた文書の前記セットに対応する文書データを含むデータベースに問い合わせを行うことであって、問い合わせを行うことは、前記ユーザー入力された化学構造データの少なくとも一部を前記文書データと、および前記ユーザークエリーの前記テキストデータの少なくとも一部を前記文書データと相関させてフィルタ処理された文書データを生成することを含むことと、
(c)構造ベース検索方法を使用して、前記問い合わせを行うステップの後に、前記プロセッサにより、前記フィルタ処理された文書データを検索することであって、検索することは、ユーザー入力された化学構造データの少なくとも一部を前記フィルタ処理された文書データ内の関連のあるフィルタ処理された化学構造データと相関させて1つまたは複数の検索結果を生成することを含むことと、
(d)前記プロセッサによって、前記1つまたは複数の検索結果を出力する、スことと
を行わせる、持続性コンピュータ可読媒体と
を備える、システム。
(項目87)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
前記プロセッサによって、前記化学構造データを1つまたは複数の文字列に変換させる、項目86に記載のシステム。
(項目88)
前記構造ベース検索方法は、文字列データを入力として使用する、項目87に記載のシステム。
(項目89)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、
ステップ(b)の前に、前記プロセッサによって、前記ユーザークエリーを、1つまたは複数の文字列タグを生成することにより補強させ、そのため前記補強されたユーザークエリーが前記1つまたは複数の文字列タグを含むようになり、前記1つまたは複数のクエリー文字列タグは化学構造を記述する、
項目86〜項目88のいずれか1項に記載のシステム。
(項目90)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、前記プロセッサによって、前記1つまたは複数の文字列タグの少なくとも1つを前記文書データと相関させる、項目89に記載のシステム。
(項目91)
前記文書データは1つまたは複数の索引文字列タグを含む、項目86〜項目90のいずれか1項に記載のシステム。
(項目92)
前記命令は、前記プロセッサによって実行される場合に、前記プロセッサに、前記プロセッサによって、前記テキストデータの少なくとも一部を前記1つまたは複数の索引文字列タグと相関させる、項目91に記載のシステム。
本開示をより容易に理解するために、本明細書で使用されるある用語は以下のように定義される。以下の用語および他の用語に対する追加の定義は本明細書を通して説明される。
クレームされた発明のシステム、装置、方法、およびプロセスは、本明細書で説明する実施形態からの情報を使用して展開された変形および適応を包含すると考えられる。本明細書で説明するシステム、装置、方法、およびプロセスの適応および/または修正は、当業者によって実行され得る。
Claims (8)
- 化学情報を含む索引付けされた文書のセットのテキストベース検索のための方法であって、
(a)コンピューティング装置のプロセッサが、テキストデータを含むユーザークエリーを受信するステップであって、前記テキストデータは、少なくとも1つの化学構造を記述する英数字文字のシーケンスを含む、ステップと、
(b)前記プロセッサが、テキストベース検索方法を使用して、索引付けされた文書の前記セットに対応する文書データを含むデータベースに問い合わせを行うステップであって、前記文書データは、1つまたは複数の索引文字列タグを含むように補強されており、索引付けされた文書の前記セットは、前記少なくとも1つの化学構造の少なくとも1つの図式表現を含み、前記1つまたは複数の索引文字列タグは、索引付けされた文書の前記セット内の前記少なくとも1つの化学構造の前記少なくとも1つの図式表現に基づいて生成される少なくとも1つの索引文字列タグを含み、前記少なくとも1つの索引文字列タグは、前記少なくとも1つの化学構造の前記少なくとも1つの図式表現を記述するための英数字文字のシーケンスを含み、前記問い合わせを行うことは、前記ユーザークエリーの前記テキストデータの少なくとも一部を前記1つまたは複数の索引文字列タグと相関させることにより、1つまたは複数のテキストベース検索結果を生成することを含む、ステップと、
(c)前記プロセッサが、前記1つまたは複数のテキストベース検索結果を出力するステップと
を含む、方法。 - 前記1つまたは複数の索引文字列タグは、自然言語テキストを含む、請求項1に記載の方法。
- 前記問い合わせを行うことは、前記プロセッサが、関連性検索を使用して、前記1つまたは複数のテキストベース検索結果を生成することを含む、請求項1または請求項2に記載の方法。
- 前記関連性検索はヒットスコアリング検索である、請求項3に記載の方法。
- 化学情報を含む索引付けされた文書のセットのテキストベース検索のためのシステムであって、前記システムは、
プロセッサと、
命令が格納されている非一時的なコンピュータ読み取り可能な媒体と
を備え、
前記命令は、前記プロセッサによって実行されると、
(a)前記プロセッサが、テキストデータを含むユーザークエリーを受信することであって、前記テキストデータは、少なくとも1つの化学構造を記述する英数字文字のシーケンスを含む、ことと、
(b)前記プロセッサが、テキストベース検索方法を使用して、索引付けされた文書の前記セットに対応する文書データを含むデータベースに問い合わせを行うことであって、前記文書データは、1つまたは複数の索引文字列タグを含むように補強されており、索引付けされた文書の前記セットは、前記少なくとも1つの化学構造の少なくとも1つの図式表現を含み、前記1つまたは複数の索引文字列タグは、索引付けされた文書の前記セット内の前記少なくとも1つの化学構造の前記少なくとも1つの図式表現に基づいて生成される少なくとも1つの索引文字列タグを含み、前記少なくとも1つの索引文字列タグは、前記少なくとも1つの化学構造の前記少なくとも1つの図式表現を記述するための英数字文字のシーケンスを含み、前記問い合わせを行うことは、前記ユーザークエリーの前記テキストデータの少なくとも一部を前記1つまたは複数の索引文字列タグと相関させることにより、1つまたは複数のテキストベース検索結果を生成することを含む、ことと、
(c)前記プロセッサが、前記1つまたは複数のテキストベース検索結果を出力することと
を前記プロセッサに行わせる、システム。 - 前記1つまたは複数の索引文字列タグは、自然言語テキストを含む、請求項5に記載のシステム。
- 前記問い合わせを行うステップは、前記プロセッサが、関連性検索を使用して、前記1つまたは複数のテキストベース検索結果を生成するための命令を含む、請求項5または請求項6に記載のシステム。
- 前記関連性検索は、ヒットスコアリング検索である、請求項7に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762466764P | 2017-03-03 | 2017-03-03 | |
US62/466,764 | 2017-03-03 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019569655A Division JP6883120B2 (ja) | 2017-03-03 | 2017-03-30 | 化学情報を含む文書の検索および索引付けのためのシステムおよび方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021093227A true JP2021093227A (ja) | 2021-06-17 |
JP7170772B2 JP7170772B2 (ja) | 2022-11-14 |
Family
ID=58503780
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019569655A Active JP6883120B2 (ja) | 2017-03-03 | 2017-03-30 | 化学情報を含む文書の検索および索引付けのためのシステムおよび方法 |
JP2021047466A Active JP7170772B2 (ja) | 2017-03-03 | 2021-03-22 | 化学情報を含む文書の検索および索引付けのためのシステムおよび方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019569655A Active JP6883120B2 (ja) | 2017-03-03 | 2017-03-30 | 化学情報を含む文書の検索および索引付けのためのシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (2) | US10572545B2 (ja) |
EP (1) | EP3590056A1 (ja) |
JP (2) | JP6883120B2 (ja) |
CA (1) | CA3055172C (ja) |
WO (1) | WO2018160205A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019173444A1 (en) * | 2018-03-07 | 2019-09-12 | Elsevier, Inc. | Methods, systems, and storage media for automatically identifying relevant chemical compounds in patent documents |
KR20210044003A (ko) | 2019-10-14 | 2021-04-22 | 삼성전자주식회사 | 단어 임베딩 방법 및 장치와 단어 검색 방법 |
JP7363914B2 (ja) * | 2019-10-31 | 2023-10-18 | 富士通株式会社 | 検索方法、検索プログラム及び検索装置 |
EP3937106A1 (en) | 2020-07-08 | 2022-01-12 | Tata Consultancy Services Limited | System and method of extraction of information and graphical representation for design of formulated products |
CN112133379A (zh) * | 2020-09-18 | 2020-12-25 | 武汉智化科技有限公司 | 一种化学反应搜索方法、装置及系统、图形处理器 |
CN115796120B (zh) * | 2023-02-08 | 2023-05-02 | 药融云数字科技(成都)有限公司 | 一种化学结构式绘制方法、键盘及终端 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06215038A (ja) * | 1993-01-13 | 1994-08-05 | Techno Res Kk | データベース検索装置 |
JP2007323182A (ja) * | 2006-05-30 | 2007-12-13 | Riron Soyaku Kenkyusho:Kk | 大規模化学構造データベースから高速に化学構造を検索するシステム及び方法 |
US20080140616A1 (en) * | 2005-09-21 | 2008-06-12 | Nicolas Encina | Document processing |
US20110066632A1 (en) * | 2009-09-16 | 2011-03-17 | International Business Machines Corporation | Molecular level similarity search and computer aided drug discovery process |
Family Cites Families (125)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4967372A (en) | 1986-05-16 | 1990-10-30 | The United States Of America As Represented By The Department Of Health And Human Services | Automatic orientation and interactive addressing of display |
US5008831A (en) | 1989-01-12 | 1991-04-16 | The United States Of America As Represented By The Department Of Health And Human Services | Method for producing high quality chemical structure diagrams |
US5249137A (en) | 1990-03-23 | 1993-09-28 | Xerox Corporation | Computer-aided chemical illustration system |
US5434971A (en) | 1991-06-28 | 1995-07-18 | Digital Equipment Corp. | System for constructing a table data structure based on an associated configuration data structure and loading it with chemical sample physical data |
US5386507A (en) | 1991-07-18 | 1995-01-31 | Teig; Steven L. | Computer graphics system for selectively modelling molecules and investigating the chemical and physical properties thereof |
US5461580A (en) | 1993-04-30 | 1995-10-24 | Xerox Corporation | Computer-aided chemical illustration system |
US5577239A (en) | 1994-08-10 | 1996-11-19 | Moore; Jeffrey | Chemical structure storage, searching and retrieval system |
US5463564A (en) | 1994-09-16 | 1995-10-31 | 3-Dimensional Pharmaceuticals, Inc. | System and method of automatically generating chemical compounds with desired properties |
US6017390A (en) | 1996-07-24 | 2000-01-25 | The Regents Of The University Of California | Growth of oriented crystals at polymerized membranes |
US7663607B2 (en) | 2004-05-06 | 2010-02-16 | Apple Inc. | Multipoint touchscreen |
US9292111B2 (en) | 1998-01-26 | 2016-03-22 | Apple Inc. | Gesturing with a multipoint sensing device |
US8479122B2 (en) | 2004-07-30 | 2013-07-02 | Apple Inc. | Gestures for touch sensitive input devices |
US7840912B2 (en) | 2006-01-30 | 2010-11-23 | Apple Inc. | Multi-touch gesture dictionary |
EP1053255A4 (en) | 1998-02-06 | 2003-01-02 | Ilexus Pty Ltd | THREE-DIMENSIONAL STRUCTURES AND MODELS OF Fc RECEPTORS, AND USES THEREOF |
US7912689B1 (en) | 1999-02-11 | 2011-03-22 | Cambridgesoft Corporation | Enhancing structure diagram generation through use of symmetry |
US6582233B1 (en) | 1999-05-14 | 2003-06-24 | Accelrys Inc. | Apparatus and method for monitoring the validity of a molecular model |
AU6233800A (en) * | 1999-07-23 | 2001-02-13 | Merck & Co., Inc. | Text influenced molecular indexing system and computer-implemented and/or computer-assisted method for same |
CA2396740A1 (en) | 2000-02-03 | 2001-08-09 | Nanoscale Combinatorial Synthesis, Inc. | Nonredundant split/pool synthesis of combinatorial libraries |
US20020049548A1 (en) | 2000-04-03 | 2002-04-25 | Libraria, Inc. | Chemistry resource database |
US20040024493A1 (en) | 2000-05-08 | 2004-02-05 | Magnus Fagrell | Method, system, and sub-system, for processing a chemical reaction |
US6741986B2 (en) | 2000-12-08 | 2004-05-25 | Ingenuity Systems, Inc. | Method and system for performing information extraction and quality control for a knowledgebase |
US8086672B2 (en) | 2000-06-17 | 2011-12-27 | Microsoft Corporation | When-free messaging |
US20020161599A1 (en) | 2000-09-05 | 2002-10-31 | Faerman Carlos H. | Electronic database of enzyme substrate and enzyme inhibitor structures |
US7085773B2 (en) | 2001-01-05 | 2006-08-01 | Symyx Technologies, Inc. | Laboratory database system and methods for combinatorial materials research |
US7250950B2 (en) | 2001-01-29 | 2007-07-31 | Symyx Technologies, Inc. | Systems, methods and computer program products for determining parameters for chemical synthesis |
US7043415B1 (en) | 2001-01-31 | 2006-05-09 | Pharsight Corporation | Interactive graphical environment for drug model generation |
US7030861B1 (en) | 2001-02-10 | 2006-04-18 | Wayne Carl Westerman | System and method for packing multi-touch gestures onto a hand |
GB0106441D0 (en) | 2001-03-15 | 2001-05-02 | Bayer Ag | Method for generating a hierarchical topological tree of 2D or 3D-structural formulas of chemical compounds for property optimization of chemical compounds |
US20030023584A1 (en) * | 2001-04-27 | 2003-01-30 | Brandin Christopher Lockton | Universal information base system |
US8865347B2 (en) | 2001-09-28 | 2014-10-21 | Siluria Technologies, Inc. | Digital alloys and methods for forming the same |
US20050010603A1 (en) | 2001-10-31 | 2005-01-13 | Berks Andrew H. | Display for Markush chemical structures |
US20040171062A1 (en) | 2002-02-28 | 2004-09-02 | Plexxikon, Inc. | Methods for the design of molecular scaffolds and ligands |
US7650327B2 (en) | 2002-03-01 | 2010-01-19 | Marine Biological Laboratory | Managing taxonomic information |
IL163921A0 (en) | 2002-03-22 | 2005-12-18 | Morphochem Ag Komb Chemie | A method for the identification and synthesis of chemical compounds |
US7805437B1 (en) | 2002-05-15 | 2010-09-28 | Spotfire Ab | Interactive SAR table |
CA2486528C (en) | 2002-05-20 | 2010-04-27 | Tata Infotech Ltd. | Document structure identifier |
US20040006559A1 (en) * | 2002-05-29 | 2004-01-08 | Gange David M. | System, apparatus, and method for user tunable and selectable searching of a database using a weigthted quantized feature vector |
AU2003247452A1 (en) | 2002-05-31 | 2004-07-14 | University Of Utah Research Foundation | System and method for visual annotation and knowledge representation |
JP3685404B2 (ja) | 2002-11-07 | 2005-08-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 分子情報提供システム、分子情報提供装置、分子情報提供方法、情報処理装置を分子情報提供装置として制御するための方法、該方法を情報処理装置に実行させるためのプログラム、該プログラムが記録された機械可読な記憶媒体および分子軌道計算のグリッド・コンピューティング支援装置 |
US20040122641A1 (en) | 2002-12-20 | 2004-06-24 | Lab2Plant, Inc. (An Indiana Corporation) | System and method for chemical process scale-up and preliminary design and analysis |
US20050102313A1 (en) | 2003-04-08 | 2005-05-12 | Newriver, Inc. | System for locating data elements within originating data sources |
US8832577B2 (en) | 2010-10-01 | 2014-09-09 | Z124 | Universal clipboard |
US20040249791A1 (en) | 2003-06-03 | 2004-12-09 | Waters Michael D. | Method and system for developing and querying a sequence driven contextual knowledge base |
ES2328924T3 (es) | 2003-10-15 | 2009-11-19 | Canon Kabushiki Kaisha | Previsualizacion y revision selectiva de documentos o esquemas que contienen datos variables. |
US7567987B2 (en) | 2003-10-24 | 2009-07-28 | Microsoft Corporation | File sharing in P2P group shared spaces |
WO2005050395A2 (en) | 2003-11-18 | 2005-06-02 | Gh Llc | Content communication system and methods |
US20050123993A1 (en) | 2003-12-09 | 2005-06-09 | Stephan Brunner | Methods of determining ligand residue binding affinity |
US20050131894A1 (en) | 2003-12-11 | 2005-06-16 | Vuong Chau M. | System and method for providing identification and search information |
WO2005086039A2 (de) * | 2004-03-04 | 2005-09-15 | Bayer Business Services Gmbh | Verfahren zur bereitstellung mit strukturierter information bespielter, beliebiger speichermedien |
US20070260583A1 (en) | 2004-03-05 | 2007-11-08 | Applied Research Systems Ars Holding N.V. | Method for fast substructure searching in non-enumerated chemical libraries |
US7899827B2 (en) | 2004-03-09 | 2011-03-01 | International Business Machines Corporation | System and method for the indexing of organic chemical structures mined from text documents |
US7176887B2 (en) | 2004-03-23 | 2007-02-13 | Fujitsu Limited | Environmental modeling for motion controlled handheld devices |
US7869647B2 (en) | 2004-04-02 | 2011-01-11 | Agilent Technologies, Inc. | System and method for processing training data for a statistical application |
EP1628234A1 (en) | 2004-06-07 | 2006-02-22 | Universita' Degli Studi di Milano-Bicocca | Method of construction and selection of virtual libraries in combinatorial chemistry |
US20070276636A1 (en) | 2004-06-26 | 2007-11-29 | Wythoff Barry J | System for visualization and analysis of numerical and chemical information |
US8838795B2 (en) | 2004-12-03 | 2014-09-16 | At&T Intellectual Property I, L.P. | System, method, apparatus, and product for resource sharing |
US20060241864A1 (en) | 2005-04-22 | 2006-10-26 | Outland Research, Llc | Method and apparatus for point-and-send data transfer within an ubiquitous computing environment |
WO2007011748A2 (en) | 2005-07-14 | 2007-01-25 | Molsoft, Llc | Structured documents for displaying and interaction with three dimensional objects |
US7613574B2 (en) | 2005-10-28 | 2009-11-03 | S-Matrix | System and method for automating scientific and engineering experimentation for deriving surrogate response data |
US7924270B2 (en) | 2006-02-06 | 2011-04-12 | Abacalab, Inc. | Apparatus and method for mobile graphical cheminformatic |
JP4956757B2 (ja) * | 2006-03-15 | 2012-06-20 | 国立大学法人大阪大学 | 数式記述構造化言語オブジェクト検索システムおよび検索方法 |
US20090278806A1 (en) | 2008-05-06 | 2009-11-12 | Matias Gonzalo Duarte | Extended touch-sensitive control area for electronic device |
US8543337B2 (en) | 2006-04-21 | 2013-09-24 | The Mathworks, Inc. | Block diagram explorer in a method and apparatus for integrated modeling, simulation and analysis of chemical and biological systems |
JP2007331906A (ja) * | 2006-06-16 | 2007-12-27 | Murata Mach Ltd | 天井走行車システム |
US8140267B2 (en) | 2006-06-30 | 2012-03-20 | International Business Machines Corporation | System and method for identifying similar molecules |
US7916002B2 (en) | 2006-06-30 | 2011-03-29 | Nokia Corporation | Haptic operative user interface input apparatus |
JP4189416B2 (ja) * | 2006-08-28 | 2008-12-03 | 株式会社東芝 | 構造化文書管理システム及びプログラム |
US7692629B2 (en) | 2006-12-07 | 2010-04-06 | Microsoft Corporation | Operating touch screen interfaces |
US7924271B2 (en) | 2007-01-05 | 2011-04-12 | Apple Inc. | Detecting gestures on multi-event sensitive devices |
US20090171975A1 (en) | 2007-03-06 | 2009-07-02 | Mcconnell Robert S | Method and system for tracking carbon credits and other carbon valuation units |
US20080228774A1 (en) | 2007-03-15 | 2008-09-18 | Accenture Global Services Gmbh | Collaboration system |
US8468001B2 (en) | 2007-03-22 | 2013-06-18 | Infosys Limited | Ligand identification and matching software tools |
WO2008119037A1 (en) | 2007-03-27 | 2008-10-02 | Slc Consultants, Inc. | Strategic business management system |
US8681104B2 (en) | 2007-06-13 | 2014-03-25 | Apple Inc. | Pinch-throw and translation gestures |
GB2453318A (en) | 2007-09-03 | 2009-04-08 | Idan Zuta | Method and system for authoring a patent application |
US8201090B2 (en) | 2007-11-13 | 2012-06-12 | The Board Of Trustees Of The University Of Arkansas | User interface for software applications |
JP5376163B2 (ja) * | 2007-11-15 | 2013-12-25 | 日本電気株式会社 | 文書管理・検索システムおよび文書の管理・検索方法 |
US8077157B2 (en) | 2008-03-31 | 2011-12-13 | Intel Corporation | Device, system, and method of wireless transfer of files |
US8526767B2 (en) | 2008-05-01 | 2013-09-03 | Atmel Corporation | Gesture recognition |
US8296670B2 (en) | 2008-05-19 | 2012-10-23 | Microsoft Corporation | Accessing a menu utilizing a drag-operation |
US20100060588A1 (en) | 2008-09-09 | 2010-03-11 | Microsoft Corporation | Temporally separate touch input |
US8427424B2 (en) | 2008-09-30 | 2013-04-23 | Microsoft Corporation | Using physical objects in conjunction with an interactive surface |
KR101544475B1 (ko) | 2008-11-28 | 2015-08-13 | 엘지전자 주식회사 | 터치를 통한 입출력 제어 |
US8547342B2 (en) | 2008-12-22 | 2013-10-01 | Verizon Patent And Licensing Inc. | Gesture-based delivery from mobile device |
EP2224389A1 (en) | 2009-02-27 | 2010-09-01 | Research In Motion Limited | System and method for improved address entry |
US20100257457A1 (en) | 2009-04-07 | 2010-10-07 | De Goes John A | Real-time content collaboration |
US9047267B2 (en) * | 2009-04-29 | 2015-06-02 | Nokia Technologies Oy | Method, apparatus, and computer program product for written mathematical expression analysis |
US8499239B2 (en) | 2009-08-28 | 2013-07-30 | Microsoft Corporation | Globe container |
US8407578B2 (en) | 2009-09-23 | 2013-03-26 | International Business Machines Corporation | Chemical web browser |
US8312392B2 (en) | 2009-10-02 | 2012-11-13 | Qualcomm Incorporated | User interface gestures and methods for providing file sharing functionality |
US20120019488A1 (en) | 2009-12-14 | 2012-01-26 | Mccarthy John P | Stylus for a touchscreen display |
US20110163944A1 (en) | 2010-01-05 | 2011-07-07 | Apple Inc. | Intuitive, gesture-based communications with physics metaphors |
AU2011220382A1 (en) | 2010-02-28 | 2012-10-18 | Microsoft Corporation | Local advertising content on an interactive head-mounted eyepiece |
CA2798294C (en) | 2010-05-03 | 2019-05-28 | Cambridgesoft Corporation | Method and apparatus for processing documents to identify chemical structures |
US8538983B2 (en) | 2010-09-21 | 2013-09-17 | Cambridgesoft Corporation | Systems, methods, and apparatus for facilitating chemical analyses |
US20120154440A1 (en) | 2010-11-11 | 2012-06-21 | Openeye Scientific Software, Inc. | Augmented 2d representation of molecular structures |
US10303357B2 (en) | 2010-11-19 | 2019-05-28 | TIVO SOLUTIONS lNC. | Flick to send or display content |
KR102113439B1 (ko) | 2010-12-31 | 2020-06-02 | 이베이 인크. | 간단한 커맨드로 복수의 네트워크화된 디바이스에 콘텐츠를 디스플레이하기 위한 방법 및 시스템 |
US20120173622A1 (en) | 2011-01-04 | 2012-07-05 | Samsung Electronics Co., Ltd. | Social screen casting |
TW201235928A (en) | 2011-02-22 | 2012-09-01 | Acer Inc | Handheld devices, electronic devices, and data transmission methods and computer program products thereof |
US8468162B2 (en) * | 2011-03-08 | 2013-06-18 | The Regents Of The University Of California | String matching in hardware using the FM-index |
US20120246228A1 (en) | 2011-03-21 | 2012-09-27 | Microsoft Corporation | Sharing channels |
US20120284638A1 (en) | 2011-05-06 | 2012-11-08 | Kibits Corp. | System and method for social interaction, sharing and collaboration |
US20120311038A1 (en) | 2011-06-06 | 2012-12-06 | Trinh Trung Tim | Proximity Session Mobility Extension |
US8788947B2 (en) | 2011-06-14 | 2014-07-22 | LogMeln, Inc. | Object transfer method using gesture-based computing device |
US9754085B2 (en) | 2011-08-17 | 2017-09-05 | Integrated Chemistry Design, Inc. | Systems and methods of editing a chemical structure on a touch-screen |
US9285592B2 (en) | 2011-08-18 | 2016-03-15 | Google Inc. | Wearable device with input and output structures |
US9558403B2 (en) | 2011-08-26 | 2017-01-31 | Council Of Scientific And Industrial Research | Chemical structure recognition tool |
HUE053258T2 (hu) | 2012-02-24 | 2021-06-28 | Perkinelmer Informatics Inc | Rendszer, eljárás és berendezés kémiai szerkezet rajzolásához érintés és gesztus alkalmazásával |
US9977876B2 (en) | 2012-02-24 | 2018-05-22 | Perkinelmer Informatics, Inc. | Systems, methods, and apparatus for drawing chemical structures using touch and gestures |
EP2828779B1 (en) | 2012-03-21 | 2019-05-08 | Zymeworks Inc. | Systems and methods for making two dimensional graphs of macromolecules |
US9619587B2 (en) | 2012-04-09 | 2017-04-11 | Autodesk, Inc. | Decomposition of 3D geometry into developable surface patches and 2D cut patterns |
EP2850514A4 (en) | 2012-05-18 | 2016-03-02 | Univ Georgetown | METHOD AND SYSTEMS FOR FACILITATING AND SEARCHING A DATABASE OF INFORMATION ON MEDICINAL PRODUCTS |
CN102693322B (zh) * | 2012-06-01 | 2014-10-22 | 杭州海康威视数字技术股份有限公司 | 支持多国语言的网页处理方法、网页加载方法及其系统 |
US9421716B2 (en) | 2012-08-08 | 2016-08-23 | Makerbot Industries, Llc | Photo booth for three-dimensional images |
US20140089328A1 (en) | 2012-09-27 | 2014-03-27 | International Business Machines Corporation | Association of data to a biological sequence |
US9535583B2 (en) | 2012-12-13 | 2017-01-03 | Perkinelmer Informatics, Inc. | Draw-ahead feature for chemical structure drawing applications |
US20140173476A1 (en) | 2012-12-13 | 2014-06-19 | Cambridgesoft Corporation | Draw-ahead feature for biological sequence drawing applications |
US8854361B1 (en) | 2013-03-13 | 2014-10-07 | Cambridgesoft Corporation | Visually augmenting a graphical rendering of a chemical structure representation or biological sequence representation with multi-dimensional information |
CA2895567C (en) | 2013-03-13 | 2023-10-10 | Perkinelmer Informatics, Inc. | Systems and methods for gesture-based sharing of data between separate electronic devices |
US9430127B2 (en) | 2013-05-08 | 2016-08-30 | Cambridgesoft Corporation | Systems and methods for providing feedback cues for touch screen interface interaction with chemical and biological structure drawing applications |
US9751294B2 (en) | 2013-05-09 | 2017-09-05 | Perkinelmer Informatics, Inc. | Systems and methods for translating three dimensional graphic molecular models to computer aided design format |
JP6215038B2 (ja) | 2013-12-20 | 2017-10-18 | キヤノンファインテックニスカ株式会社 | 接着剤塗布装置及びこれを備えるシート処理装置並びにこれを備える画像形成装置。 |
US9582864B2 (en) | 2014-01-10 | 2017-02-28 | Perkinelmer Cellular Technologies Germany Gmbh | Method and system for image correction using a quasiperiodic grid |
US11200217B2 (en) * | 2016-05-26 | 2021-12-14 | Perfect Search Corporation | Structured document indexing and searching |
-
2017
- 2017-03-30 CA CA3055172A patent/CA3055172C/en active Active
- 2017-03-30 EP EP17716427.4A patent/EP3590056A1/en not_active Ceased
- 2017-03-30 JP JP2019569655A patent/JP6883120B2/ja active Active
- 2017-03-30 US US15/474,865 patent/US10572545B2/en active Active
- 2017-03-30 WO PCT/US2017/025126 patent/WO2018160205A1/en unknown
-
2020
- 2020-01-10 US US16/739,799 patent/US11301518B2/en active Active
-
2021
- 2021-03-22 JP JP2021047466A patent/JP7170772B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06215038A (ja) * | 1993-01-13 | 1994-08-05 | Techno Res Kk | データベース検索装置 |
US20080140616A1 (en) * | 2005-09-21 | 2008-06-12 | Nicolas Encina | Document processing |
JP2007323182A (ja) * | 2006-05-30 | 2007-12-13 | Riron Soyaku Kenkyusho:Kk | 大規模化学構造データベースから高速に化学構造を検索するシステム及び方法 |
US20110066632A1 (en) * | 2009-09-16 | 2011-03-17 | International Business Machines Corporation | Molecular level similarity search and computer aided drug discovery process |
Also Published As
Publication number | Publication date |
---|---|
US10572545B2 (en) | 2020-02-25 |
JP2020509519A (ja) | 2020-03-26 |
US20180253426A1 (en) | 2018-09-06 |
JP6883120B2 (ja) | 2021-06-09 |
CA3055172C (en) | 2022-03-01 |
WO2018160205A1 (en) | 2018-09-07 |
JP7170772B2 (ja) | 2022-11-14 |
CA3055172A1 (en) | 2018-09-07 |
US11301518B2 (en) | 2022-04-12 |
US20200151221A1 (en) | 2020-05-14 |
EP3590056A1 (en) | 2020-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6883120B2 (ja) | 化学情報を含む文書の検索および索引付けのためのシステムおよび方法 | |
US10521479B2 (en) | Evaluating semantic interpretations of a search query | |
US10073840B2 (en) | Unsupervised relation detection model training | |
US9251237B2 (en) | User-specific synthetic context object matching | |
US10474719B2 (en) | Auto-completion of widely shared search queries | |
US9619580B2 (en) | Generation of synthetic context objects | |
US9684713B2 (en) | Methods and systems for retrieval of experts based on user customizable search and ranking parameters | |
US8620958B1 (en) | Dimensionally constrained synthetic context objects database | |
US20060179039A1 (en) | Method and system for performing secondary search actions based on primary search result attributes | |
WO2012083540A1 (en) | Method and apparatus for providing token-based classification of device information | |
US11030242B1 (en) | Indexing and querying semi-structured documents using a key-value store | |
US10545955B2 (en) | Methods and systems for generating, by a visual query builder, a query of a genomic data store | |
EP2686783A2 (en) | Keyword extraction from uniform resource locators (urls) | |
CN107832324B (zh) | 提供场境事实 | |
US11620282B2 (en) | Automated information retrieval system and semantic parsing | |
US20170270127A1 (en) | Category-based full-text searching | |
US20170270195A1 (en) | Providing token-based classification of device information | |
GB2520993A (en) | Indexing presentation slides | |
CN103646034A (zh) | 一种基于内容可信的Web搜索引擎系统及搜索方法 | |
US9122748B2 (en) | Matching documents against monitors | |
US9230013B1 (en) | Suffix searching on documents | |
CN117235014A (zh) | 基于自然语言搜索文件的方法、系统及计算设备 | |
WO2011094927A1 (en) | Method and apparatus for automated mashup tool |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210322 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220311 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221005 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7170772 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |