JP2019153271A5 - - Google Patents

Download PDF

Info

Publication number
JP2019153271A5
JP2019153271A5 JP2018166457A JP2018166457A JP2019153271A5 JP 2019153271 A5 JP2019153271 A5 JP 2019153271A5 JP 2018166457 A JP2018166457 A JP 2018166457A JP 2018166457 A JP2018166457 A JP 2018166457A JP 2019153271 A5 JP2019153271 A5 JP 2019153271A5
Authority
JP
Japan
Prior art keywords
predetermined
phrase
resource
search
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018166457A
Other languages
English (en)
Other versions
JP7240662B2 (ja
JP2019153271A (ja
Filing date
Publication date
Application filed filed Critical
Publication of JP2019153271A publication Critical patent/JP2019153271A/ja
Publication of JP2019153271A5 publication Critical patent/JP2019153271A5/ja
Application granted granted Critical
Publication of JP7240662B2 publication Critical patent/JP7240662B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

図1は、本発明の一実施形態に係る情報検索システムの概略構成を示すブロックダイアグラムである。 図2は、本発明の一実施形態に係る検索エンジンにおけるデータベースの一例を説明するための図である。 図3は、本発明の一実施形態に係る検索エンジンにおける辞書の一例を説明するための図である。 図4は、本発明の一実施形態に係る検索エンジンのインデクサの概略的構成を示すブロックダイアグラムである。 図5は、本発明の一実施形態に係る検索エンジンのテキスト処理部に入力されるテキスト文の一例を示す図である。 図6は、本発明の一実施形態に係る検索エンジンによるインデックスの作成処理を説明するためのフローチャートである。 図7は、本発明の一実施形態に係る検索エンジンにより生成された初期有向グラフの一部の例を示している 図8は、本発明の一実施形態に係る検索エンジンによる有向グラフの探索・更新処理を説明するためのフローチャートである。 図9は、本発明の一実施形態に係る検索エンジンにより有向グラフの一部が展開される処理過程の一例を示す図である。 図10は、本発明の一実施形態に係る検索エンジンによる検索処理を説明するためのフローチャートである。 図11は、本発明の一実施形態に係る検索エンジンによる検索処理を説明するためのフローチャートである。 図12Aは、本発明の一実施形態に係る検索エンジンにより検索されたリソースの有向グラフから検索根拠を特定するための処理過程の一例を説明するための図である。 図12Bは、本発明の一実施形態に係る検索エンジンにより検索されたリソースの有向グラフから検索根拠を特定するための処理過程の一例を説明するための図である。 図13Aは、本発明の一実施形態に係る情報検索システムにおけるクライアント上に表示される検索結果画面の一例を示す図である。 図13Bは、本発明の一実施形態に係る情報検索システムにおけるクライアント上に表示される検索結果画面の一例を示す図である。 図13Cは、本発明の一実施形態に係る情報検索システムにおけるクライアント上に表示される検索結果画面の一例を示す図である。 図14は、本発明の一実施形態に係る検索エンジンにおける辞書の他の例を説明するための図である。 図15は、本発明の一実施形態に係る検索エンジンにおけるトライ木の一例を説明するための図である。 図16Aは、本発明の一実施形態に係る検索エンジンによる有向グラフの探索・更新処理の他の例を説明するためのフローチャートである。 図16Bは、本発明の一実施形態に係る検索エンジンによる有向グラフの探索・更新処理の他の例を説明するためのフローチャートである。 図17は、本発明の一実施形態に係る検索エンジンにより有向グラフの一部が展開される処理過程の他の例を示す図である。 図18は、本発明の一実施形態に係る検索エンジンのハードウェア構成の一例を示すブロックダイアグラムである。
図10に示すように、検索エンジン20は、クライアント30から検索クエリを受信する(S1001)。例えば、クライアント30は、ユーザが、ウェブブラウザ(図示せず)上に表示された検索画面に検索クエリを入力することにより、検索エンジン20に検索クエリを送信する。検索エンジンは、受信した検索クエリに対して所定の解析処理を行う(S1002)。例えば、クエリサーバ25は、クライアント30から受信した検索クエリに対して、N−gramの検索式を作成する。本実施形態では、N=3を最大値とするが、これに限られない。したがって、検索クエリが4つ以上の単語を含む場合には、クエリサーバ25は、3−gramの単語を抽出して、これらのAND検索を行う。例えば、検索クエリが‘platinum and parp inhibitor’である場合、検索式は、‘(platinum and parp) AND (and parp inhibitor)’となる。

Claims (12)

  1. クライアントから送信される検索クエリに対して、所定の検索結果を前記クライアントに送信する検索エンジンであって、
    複数のパスが存在する有向グラフに基づいて作成されたインデックスと、
    前記インデックスに関連付けられたリソースに関するリソース情報ファイルと、
    前記検索クエリに基づいて前記インデックスを検索することにより、前記リソース情報ファイルから少なくとも1つのリソースを特定し、前記特定された少なくとも1つのリソースを示す前記所定の検索結果を出力するクエリサーバと、を備え、
    前記クエリサーバは、
    前記少なくとも1つのリソースが特定された根拠となった、該少なくとも1つのリソースに含まれる所定のフレーズに関連する所定の関連フレーズを特定し、
    前記所定の検索結果に従って、前記クライアントの検索結果画面に、前記所定のフレーズと前記所定の関連フレーズとを関連付けて表示させる、
    検索エンジン。
  2. 前記有向グラフは、
    前記リソースのテキスト文から切り出された複数のトークン及び該トークンに関連付けられた少なくとも1つのフレーズに基づいて追加されたトークンの接続関係を表現したデータ構造であり、
    前記リソースに含まれるテキスト文から切り出された前記複数のトークンの接続関係を示す元のパスと、該元のパスに対して並列的に接続された、前記追加されたトークンの接続関係を示す少なくとも1つの追加のパスとを含む、
    請求項1に記載の検索エンジン。
  3. 前記クエリサーバは、前記有向グラフを探索し、前記検索クエリが顕出した前記有向グラフにおける箇所を特定し、
    前記特定された箇所を含む前記追加のパスにおけるフレーズを前記所定の関連フレーズとして特定する、
    請求項2に記載の検索エンジン。
  4. 前記クエリサーバは、前記特定された箇所を含む前記追加のパスが接続された前記元のパス上のノード間におけるフレーズを、前記少なくとも1つのリソースに含まれる前記所定のフレーズとして特定する、
    請求項3に記載の検索エンジン。
  5. 前記検索結果画面は、前記特定された少なくとも1つのリソースを表示するための第1の表示領域と、前記所定のフレーズと前記所定の関連フレーズとを関連付けて表示するための第2の表示領域とを含む、
    請求項1に記載の検索エンジン。
  6. 前記検索結果画面は、前記クライアントのユーザが前記所定の関連フレーズを表示させるか否かを選択可能である、
    請求項1に記載の検索エンジン。
  7. 前記検索結果画面は、前記クライアントのユーザが前記所定のフレーズを指し示した場合に、前記所定の関連フレーズを表示させる、
    請求項1に記載の検索エンジン。
  8. 検索エンジンに対して検索クエリを送信し、該検索エンジンから送信される所定の検索結果を表示するクライアントであって、
    前記所定の検索結果は、前記検索エンジンが、前記検索クエリに従って、複数のパスが存在する有向グラフに基づいて作成されたインデックスを検索することにより特定した少なくとも1つのリソース、及び該少なくとも1つのリソースを特定した根拠となった、該少なくとも1つのリソースに含まれる所定のフレーズに関連する所定の関連フレーズを含み、
    前記所定の検索結果に従って、前記所定のフレーズと前記所定の関連フレーズとを関連付けて検索結果画面を表示する、
    クライアント。
  9. 前記検索結果画面は、前記特定された少なくとも1つのリソースを表示するための第1の表示領域と、前記所定のフレーズと前記所定の関連フレーズとを関連付けて表示するための第2の表示領域とを含む、
    請求項8に記載のクライアント。
  10. 前記検索結果画面は、前記クライアントのユーザが前記所定の関連フレーズを表示させるか否かを選択可能である、
    請求項8に記載のクライアント。
  11. 前記検索結果画面は、前記クライアントのユーザが前記所定のフレーズを指し示した場合に、前記所定の関連フレーズを表示する、
    請求項8に記載のクライアント。
  12. クライアントから送信される検索クエリに対する所定の検索結果を前記クライアントに表示させる検索エンジンによる検索方法であって、
    複数のパスが存在する有向グラフに基づいて作成されたインデックスと、該インデックスに関連付けられたリソースに関するリソース情報ファイルとを格納することと、
    前記検索クエリに基づいて前記インデックスを検索することにより、前記リソース情報ファイルから少なくとも1つのリソースを特定することと、
    前記少なくとも1つのリソースが特定された根拠となった、該少なくとも1つのリソースに含まれる所定のフレーズに関連する所定の関連フレーズを特定することと、
    前記特定された少なくとも1つのリソースを示す前記所定の検索結果を前記クライアントに送信することと、を含み、
    前記所定の検索結果は、前記クライアントの検索結果画面に、前記所定のフレーズと前記所定の関連フレーズとを関連付けて表示させる、
    検索方法。
JP2018166457A 2018-03-05 2018-09-05 検索システム及び検索システムの動作方法 Active JP7240662B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018039167 2018-03-05
JP2018039167 2018-03-05

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018133752A Division JP6435467B1 (ja) 2018-03-05 2018-07-13 検索システム及び検索システムの動作方法

Publications (3)

Publication Number Publication Date
JP2019153271A JP2019153271A (ja) 2019-09-12
JP2019153271A5 true JP2019153271A5 (ja) 2021-08-26
JP7240662B2 JP7240662B2 (ja) 2023-03-16

Family

ID=64655859

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018133752A Active JP6435467B1 (ja) 2018-03-05 2018-07-13 検索システム及び検索システムの動作方法
JP2018166457A Active JP7240662B2 (ja) 2018-03-05 2018-09-05 検索システム及び検索システムの動作方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2018133752A Active JP6435467B1 (ja) 2018-03-05 2018-07-13 検索システム及び検索システムの動作方法

Country Status (7)

Country Link
US (2) US11755833B2 (ja)
EP (1) EP3764240B1 (ja)
JP (2) JP6435467B1 (ja)
KR (1) KR102453183B1 (ja)
CN (1) CN111699485A (ja)
SG (1) SG11202008506RA (ja)
WO (1) WO2019172153A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112559926B (zh) * 2020-12-22 2023-10-03 北京百度网讯科技有限公司 搜索展示条目的上线处理方法、装置、设备、介质及产品
JP2022128934A (ja) * 2021-02-24 2022-09-05 富士通株式会社 データ特定プログラム、装置、及び方法
WO2022226549A2 (en) * 2021-04-23 2022-10-27 Iqvia Inc. Matching service requester with service providers
US11636110B1 (en) * 2021-10-29 2023-04-25 Snowflake Inc. Metadata search via N-Gram index
CN114637839A (zh) * 2022-03-15 2022-06-17 平安国际智慧城市科技股份有限公司 文本高亮显示方法、装置、设备及存储介质
WO2024157438A1 (ja) * 2023-01-27 2024-08-02 日本電気株式会社 情報処理装置、情報処理方法、及び、記録媒体

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL107482A (en) * 1992-11-04 1998-10-30 Conquest Software Inc A method for solving questions in natural language from databases of full texts
US5715468A (en) * 1994-09-30 1998-02-03 Budzinski; Robert Lucius Memory system for storing and retrieving experience and knowledge with natural language
JP2001290843A (ja) * 2000-02-04 2001-10-19 Fujitsu Ltd 文書検索装置及びその方法並びに文書検索プログラム及びそのプログラムを記録した記録媒体
US7165058B2 (en) * 2001-12-27 2007-01-16 The Boeing Company Database analysis tool
US20040186705A1 (en) * 2003-03-18 2004-09-23 Morgan Alexander P. Concept word management
JP2004295301A (ja) * 2003-03-26 2004-10-21 Oki Electric Ind Co Ltd 文書検索装置
US7406459B2 (en) * 2003-05-01 2008-07-29 Microsoft Corporation Concept network
US8014997B2 (en) * 2003-09-20 2011-09-06 International Business Machines Corporation Method of search content enhancement
US20050283473A1 (en) * 2004-06-17 2005-12-22 Armand Rousso Apparatus, method and system of artificial intelligence for data searching applications
US7584175B2 (en) * 2004-07-26 2009-09-01 Google Inc. Phrase-based generation of document descriptions
JP2008537225A (ja) * 2005-04-11 2008-09-11 テキストディガー,インコーポレイテッド クエリについての検索システムおよび方法
JP4803709B2 (ja) * 2005-07-12 2011-10-26 独立行政法人情報通信研究機構 単語用法差異情報取得プログラム及び同装置
US20070106499A1 (en) * 2005-08-09 2007-05-10 Kathleen Dahlgren Natural language search system
US7805392B1 (en) * 2005-11-29 2010-09-28 Tilera Corporation Pattern matching in a multiprocessor environment with finite state automaton transitions based on an order of vectors in a state transition table
US20070162481A1 (en) * 2006-01-10 2007-07-12 Millett Ronald P Pattern index
RU2618375C2 (ru) * 2015-07-02 2017-05-03 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Расширение возможностей информационного поиска
CA2675216A1 (en) * 2007-01-10 2008-07-17 Nick Koudas Method and system for information discovery and text analysis
JP2009223781A (ja) * 2008-03-18 2009-10-01 Nec Corp 情報推薦装置、情報推薦システム、情報推薦方法、プログラム及び記録媒体
US9361365B2 (en) * 2008-05-01 2016-06-07 Primal Fusion Inc. Methods and apparatus for searching of content using semantic synthesis
US10025855B2 (en) 2008-07-28 2018-07-17 Excalibur Ip, Llc Federated community search
JP5110201B2 (ja) 2009-03-17 2012-12-26 富士通株式会社 検索処理方法及び装置
JP2011180823A (ja) 2010-03-01 2011-09-15 National Institute Of Information & Communication Technology 機械翻訳装置、機械翻訳方法、およびプログラム
US9379971B2 (en) * 2012-05-11 2016-06-28 Simula Inovation AS Method and apparatus for determining paths between source/destination pairs
US9594872B2 (en) * 2012-10-25 2017-03-14 Intelligent Medical Objects, Inc. Method and system for concept-based terminology management
US20140278362A1 (en) * 2013-03-15 2014-09-18 International Business Machines Corporation Entity Recognition in Natural Language Processing Systems
EP3039578A1 (en) * 2013-08-30 2016-07-06 Unsilo A/S Method and system for identifying and evaluating semantic patterns in written language
CN104462084B (zh) * 2013-09-13 2019-08-16 Sap欧洲公司 基于多个查询提供搜索细化建议
JP6176017B2 (ja) 2013-09-17 2017-08-09 富士通株式会社 検索装置、検索方法、およびプログラム
US9390196B2 (en) * 2014-06-03 2016-07-12 International Business Machines Corporation Adjusting ranges of directed graph ontologies across multiple dimensions
US9864741B2 (en) * 2014-09-23 2018-01-09 Prysm, Inc. Automated collective term and phrase index
US10509814B2 (en) * 2014-12-19 2019-12-17 Universidad Nacional De Educacion A Distancia (Uned) System and method for the indexing and retrieval of semantically annotated data using an ontology-based information retrieval model
US11030402B2 (en) * 2019-05-03 2021-06-08 International Business Machines Corporation Dictionary expansion using neural language models

Similar Documents

Publication Publication Date Title
JP2019153271A5 (ja)
TWI524193B (zh) 用於搜尋結果之語義目錄的電腦可讀取媒體及電腦實現方法
JP4767694B2 (ja) 不正ハイパーリンク検出装置及びその方法
KR20160124742A (ko) 비정형 텍스트내의 특징들의 중의성을 해소하는 방법
US9251274B2 (en) Grouping search results into a profile page
JP5185402B2 (ja) 文書検索装置、文書検索方法、及び文書検索プログラム
WO2016121048A1 (ja) 文章生成装置及び方法
US11797617B2 (en) Method and apparatus for collecting information regarding dark web
US11681732B2 (en) Tuning query generation patterns
JP2009037501A (ja) 情報検索装置、情報検索方法およびプログラム
US11182441B2 (en) Hypotheses generation using searchable unstructured data corpus
WO2015084757A1 (en) Systems and methods for processing data stored in a database
US8245127B2 (en) Method and apparatus for a document annotation service
Annamalai et al. Accessing the data efficiently using prediction of dynamic data algorithm
Hindle Stopping duplicate bug reports before they start with Continuous Querying for bug reports
US9558269B2 (en) Extracting and mining of quote data across multiple languages
JP5228529B2 (ja) データ検索プログラム、データ検索装置およびデータ検索方法
JP2009093581A (ja) 類義語検索管理システム
KR20190000061A (ko) 키워드 속성을 기준으로 관련 있는 키워드를 제공하는 방법 및 시스템
US11176312B2 (en) Managing content of an online information system
POSEDARU et al. Natural Learning Processing based on Machine Learning Model for automatic analysis of Online Reviews related to Hotels and Resorts.
JP6882372B2 (ja) 決定装置、決定方法、および決定プログラム
JP6655981B2 (ja) キーワード抽出装置、キーワード抽出方法、およびプログラム
KR101541297B1 (ko) 사용자 디스크립션에 기반한 다국어 관계망 생성 방법 및 장치
JP5378109B2 (ja) タスクモデル生成装置およびタスクモデル生成方法