JP2017504105A5 - - Google Patents

Download PDF

Info

Publication number
JP2017504105A5
JP2017504105A5 JP2016536900A JP2016536900A JP2017504105A5 JP 2017504105 A5 JP2017504105 A5 JP 2017504105A5 JP 2016536900 A JP2016536900 A JP 2016536900A JP 2016536900 A JP2016536900 A JP 2016536900A JP 2017504105 A5 JP2017504105 A5 JP 2017504105A5
Authority
JP
Japan
Prior art keywords
entity
computer
search
search query
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2016536900A
Other languages
Japanese (ja)
Other versions
JP2017504105A (en
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/US2014/067997 external-priority patent/WO2015084759A1/en
Publication of JP2017504105A publication Critical patent/JP2017504105A/en
Publication of JP2017504105A5 publication Critical patent/JP2017504105A5/ja
Ceased legal-status Critical Current

Links

Claims (12)

エンティティ抽出コンピュータにより、ユーザインターフェイスからサーチ質問パラメータのユーザ入力を受け取り、前記ユーザインターフェイスはユーザコンピュータにおいて提示され、
エンティティ抽出コンピュータにより、サーチ質問データがユーザコンピュータによって要求されたときに、リアルタイムで、サーチ質問パラメータを、電子データコーパスにおける1つ以上のエンティティの共起のインスタンスを有するエンティティ共起データベースと比較し、そしてサーチ質問パラメータにおいて1つ以上のエンティティに対応する少なくとも1つのエンティティ形式を識別することにより、サーチ質問パラメータから1つ以上のエンティティを抽出し、
曖昧スコアマッチングコンピュータにより、サーチ質問データがユーザコンピュータによって要求されたときに、リアルタイムで、サーチ質問パラメータに関連した1つ以上のレコードを識別するためにエンティティ共起データベースをサーチする曖昧マッチングアルゴリズムを選択し、その曖昧マッチングアルゴリズムは、少なくとも1つの識別されたエンティティ形式に対応するものであり、前記エンティティ抽出コンピュータ及び前記曖昧スコアマッチングコンピュータの少なくとも1つは前記エンティティ共起データベースを含むインメモリデータベースをホストするメインメモリを含み、前記インメモリデータベースは構造化データによってインデックスされた複数のレコードを含み、前記構造化データはエンティティ対エンティティのインデックス、エンティティ対トピックスのインデックス及びエンティティ対ファクトのインデックスのうちの少なくとも1つを含み、
曖昧スコアマッチングコンピュータにより、前記ユーザコンピュータによって前記サーチ質問データが要求されたときに、リアルタイムで、その選択された曖昧マッチングアルゴリズムを使用してエンティティ共起データベースをサーチし、そしてそのサーチに基づき1つ以上のレコードから1つ以上の示唆されたサーチ質問パラメータを形成し、前記1つ以上の示唆されたサーチ質問パラメータは、複数の示唆されたサーチ質問パラメータを含み、
曖昧スコアマッチングコンピュータにより、ユーザインターフェイスへ1つ以上の示唆されたサーチ質問パラメータを提示し、及び、
前記曖昧スコアマッチングコンピュータにより、前記複数の示唆されたサーチ質問パラメータをユーザ入力におけるサーチ質問パラメータへの一致の接近性に基づいて降下順に分類する、
ことを含む方法。
An entity extraction computer receives user input of search query parameters from a user interface, wherein the user interface is presented at the user computer;
Comparing search query parameters with an entity co-occurrence database having co-occurrence instances of one or more entities in an electronic data corpus in real time when search query data is requested by a user computer by an entity extraction computer; And extracting one or more entities from the search question parameter by identifying at least one entity type corresponding to the one or more entities in the search question parameter;
The fuzzy score matching computer selects an fuzzy matching algorithm that searches the entity co-occurrence database to identify one or more records related to the search query parameter in real time when search query data is requested by the user computer And the fuzzy matching algorithm corresponds to at least one identified entity type, and at least one of the entity extraction computer and the fuzzy score matching computer hosts an in-memory database including the entity co-occurrence database. The in-memory database includes a plurality of records indexed by structured data, and the structured data is an entity-to-entity Wherein I index, at least one of the indices and entity pairs facts index entity pair Topics,
An ambiguity score matching computer searches the entity co-occurrence database in real time using the selected ambiguity matching algorithm when the search query data is requested by the user computer, and one based on the search Forming one or more suggested search question parameters from the records, wherein the one or more suggested search question parameters include a plurality of suggested search question parameters;
An ambiguous score matching computer presents one or more suggested search query parameters to the user interface; and
The ambiguous score matching computer classifies the plurality of suggested search question parameters in descending order based on accessibility of matches to search question parameters in user input.
A method involving that.
曖昧スコアマッチングコンピュータにより、ユーザ入力が終了する前にその選択された曖昧マッチングアルゴリズムを使用してエンティティ共起データベースをサーチすることを更に含む、請求項1に記載の方法。   The method of claim 1, further comprising: searching the entity co-occurrence database by the fuzzy score matching computer using the selected fuzzy matching algorithm before user input ends. 前記サーチ質問パラメータに関連した1つ以上のレコードは、概念的特徴を含む、請求項1に記載の方法。   The method of claim 1, wherein the one or more records associated with the search query parameter include a conceptual feature. 前記曖昧スコアマッチングコンピュータは、前記分類された複数の示唆されたサーチ質問パラメータをドロップダウンリストにおいてユーザインターフェイスを経て提示する、請求項1に記載の方法。   The method of claim 1, wherein the fuzzy score matching computer presents the classified suggested search query parameters in a drop-down list via a user interface. 前記エンティティ共起データベースはインデックスされる、請求項1に記載の方法。   The method of claim 1, wherein the entity co-occurrence database is indexed. 複数のコンピュータモジュールに対するコンピュータ読み取り可能なインストラクションを実行する1つ以上のプロセッサを有する1つ以上のサーバーコンピュータを備え、これは、
ユーザインターフェイスからサーチ質問パラメータのユーザ入力を受け取るように構成されたエンティティ抽出モジュールを含み、前記ユーザインターフェイスはユーザコンピュータにおいて提示され、このエンティティ抽出モジュールは、更に、
サーチ質問パラメータを、サーチ質問データがユーザコンピュータによって要求されたときに、リアルタイムで、電子データコーパスにおける1つ以上のエンティティの共起のインスタンスを有するエンティティ共起データベースと比較し、そしてサーチ質問パラメータにおいて1つ以上のエンティティに対応する少なくとも1つのエンティティ形式を識別することにより、サーチ質問パラメータから1つ以上のエンティティを抽出する、ように更に構成され、前記1つ以上のサーバーコンピュータは前記エンティティ共起データベースを含むインメモリデータベースをホストするメインメモリを含み、前記インメモリデータベースは構造化データによってインデックスされた複数のレコードを含み、前記構造化データはエンティティ対エンティティのインデックス、エンティティ対トピックスのインデックス及びエンティティ対ファクトのインデックスのうちの少なくとも1つを含み、更に、
サーチ質問データがユーザコンピュータによって要求されたときに、リアルタイムで、サーチ質問パラメータに関連した1つ以上のレコードを識別するためにエンティティ共起データベースをサーチする曖昧マッチングアルゴリズムを選択するよう構成された曖昧スコアマッチングモジュール、
を備え、その曖昧マッチングモジュールは、少なくとも1つの識別されたエンティティ形式に対応するものであり、その曖昧スコアマッチングモジュールは、更に、
サーチ質問データがユーザコンピュータによって要求されたときに、リアルタイムで、その選択された曖昧マッチングアルゴリズムを使用してエンティティ共起データベースをサーチし、そしてそのサーチに基づき1つ以上のレコードから1つ以上の示唆されたサーチ質問パラメータを形成し、及び
ユーザインターフェイスへ1つ以上の示唆されたサーチ質問パラメータを提示する、ように構成され、
前記1つ以上の示唆されたサーチ質問パラメータは、複数の示唆されたサーチ質問パラメータを含み、前記曖昧スコアマッチングモジュールは、その複数の示唆されたサーチ質問パラメータをユーザ入力におけるサーチ質問パラメータへの一致の接近性に基づいて降下順に分類するように構成される、システム。
Comprising one or more server computers having one or more processors executing computer readable instructions for a plurality of computer modules, comprising:
An entity extraction module configured to receive user input of search query parameters from a user interface, wherein the user interface is presented at a user computer, the entity extraction module further comprising:
Compare search query parameters to an entity co-occurrence database having co-occurrence instances of one or more entities in the electronic data corpus in real time when search query data is requested by the user computer, and in the search query parameters The one or more server computers are further configured to extract one or more entities from a search query parameter by identifying at least one entity type corresponding to the one or more entities, A main memory that hosts an in-memory database including a database, the in-memory database including a plurality of records indexed by structured data, the structured data Index Iti, include at least one of the index of indices and entity pairs facts entity pairs topics, further,
An ambiguity configured to select an ambiguity matching algorithm that searches an entity co-occurrence database to identify one or more records associated with a search query parameter in real time when search query data is requested by a user computer Score matching module,
And the ambiguity matching module corresponds to at least one identified entity type, the ambiguity score matching module further comprising:
When the search query data is requested by the user computer, search the entity co-occurrence database using the selected fuzzy matching algorithm in real time and based on the search, one or more records from one or more records Configured to form suggested search query parameters and present one or more suggested search query parameters to a user interface;
The one or more suggested search question parameters include a plurality of suggested search question parameters, and the fuzzy score matching module matches the plurality of suggested search question parameters to the search question parameters in user input. A system configured to sort in descending order based on accessibility.
前記曖昧スコアマッチングモジュールは、更に、ユーザ入力が終了する前にその選択された曖昧マッチングアルゴリズムを使用してエンティティ共起データベースをサーチするように構成される、請求項6に記載のシステム。   The system of claim 6, wherein the fuzzy score matching module is further configured to search an entity co-occurrence database using the selected fuzzy matching algorithm before user input ends. サーチ質問パラメータに関連した1つ以上のレコードは、概念的特徴を含む、請求項6に記載のシステム。   The system of claim 6, wherein the one or more records associated with the search query parameter include conceptual features. 前記曖昧スコアマッチングコンピュータは、前記分類された複数の示唆されたサーチ質問パラメータをドロップダウンリストにおいてユーザインターフェイスを経て提示するように構成される、請求項6に記載のシステム。   The system of claim 6, wherein the fuzzy score matching computer is configured to present the classified suggested search query parameters in a drop-down list via a user interface. 前記エンティティ共起データベースはインデックスされる、請求項6に記載のシステム。   The system of claim 6, wherein the entity co-occurrence database is indexed. コンピュータにより、1つ以上のデータストリングを含むサーチ質問をサーチエンジンから受け取り、
コンピュータにより、エンティティデータベース及びトレンドデータベースに記憶されたレコードのセットに対して1つ以上のエンティティを比較することに基づき1つ以上のデータストリングにおいて1つ以上のエンティティを識別し、
コンピュータにより、少なくとも1つのエンティティに対応するものとして識別されない1つ以上のデータストリングにおいて1つ以上の特徴を識別し、
コンピュータにより、1つ以上の特徴の各々を、マッチングアルゴリズムに基づき1つ以上のエンティティの少なくとも1つに指定し、
コンピュータにより、各エンティティに指定された各々の特徴に指定されたスコアに基づき各々のエンティティに抽出スコアを指定し、
コンピュータにより、各々のエンティティの抽出スコアからスレッシュホールド距離内にあるスコアを有する1つ以上のエンティティを含む第1のサーチリストをエンティティデータベースから受け取り、
コンピュータにより、各々のエンティティの抽出スコアからスレッシュホールド距離内にあるスコアを有する1つ以上のエンティティを含む第2のサーチリストをトレンドデータベースから受け取り、
コンピュータにより、第1のサーチリスト及び第2のサーチリストを含む総計リストを発生し、その総計リストのエンティティは、各々の総計リストのスコアに従ってランク付けされ、及び
コンピュータにより、その総計リストに従って示唆されるサーチを与える、
ことを含む、コンピュータで実施される方法。
A computer receives a search query including one or more data strings from a search engine;
Identifying one or more entities in one or more data strings based on comparing one or more entities against a set of records stored in an entity database and a trend database by a computer;
Identifying one or more features in one or more data strings not identified by the computer as corresponding to at least one entity;
The computer assigns each of the one or more features to at least one of the one or more entities based on a matching algorithm;
The computer specifies an extraction score for each entity based on the score specified for each feature specified for each entity,
A computer receives a first search list from an entity database that includes one or more entities having a score that is within a threshold distance from an extraction score for each entity;
A computer receives a second search list from the trend database that includes one or more entities having a score that is within a threshold distance from the extracted score of each entity;
A computer generates a grand total list including a first search list and a second search list, and the entities of the total list are ranked according to the score of each total list, and are suggested according to the total list by the computer. Give a search,
A computer-implemented method comprising:
前記エンティティデータベース及び前記トレンドデータベースの少なくとも1つはインメモリデータベースである、請求項11に記載のコンピュータで実施される方法。   The computer-implemented method of claim 11, wherein at least one of the entity database and the trend database is an in-memory database.
JP2016536900A 2013-12-02 2014-12-02 System and method for in-memory database search Ceased JP2017504105A (en)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201361910905P 2013-12-02 2013-12-02
US201361910907P 2013-12-02 2013-12-02
US201361910894P 2013-12-02 2013-12-02
US201361910900P 2013-12-02 2013-12-02
US61/910,900 2013-12-02
US61/910,894 2013-12-02
US61/910,907 2013-12-02
US61/910,905 2013-12-02
US201461947652P 2014-03-04 2014-03-04
US61/947,652 2014-03-04
PCT/US2014/067997 WO2015084759A1 (en) 2013-12-02 2014-12-02 Systems and methods for in-memory database search

Publications (2)

Publication Number Publication Date
JP2017504105A JP2017504105A (en) 2017-02-02
JP2017504105A5 true JP2017504105A5 (en) 2018-01-11

Family

ID=53274014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016536900A Ceased JP2017504105A (en) 2013-12-02 2014-12-02 System and method for in-memory database search

Country Status (6)

Country Link
EP (1) EP3077918A4 (en)
JP (1) JP2017504105A (en)
KR (1) KR20160124079A (en)
CN (1) CN106164889A (en)
CA (1) CA2932401A1 (en)
WO (1) WO2015084759A1 (en)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10296627B2 (en) 2015-08-18 2019-05-21 Fiserv, Inc. Generating integrated data records by correlating source data records from disparate data sources
JP7106077B2 (en) 2016-09-22 2022-07-26 エヌフェレンス,インコーポレイテッド Systems, methods, and computer-readable media for visualization of semantic information and inference of temporal signals that indicate salient associations between life science entities
CN106599547A (en) * 2016-11-23 2017-04-26 中山健康医疗信息技术有限公司 Intelligent medical knowledge base management system based on tags
CN106991181B (en) * 2017-04-07 2020-04-21 广州视源电子科技股份有限公司 Method and device for extracting spoken sentences
CN108932248B (en) * 2017-05-24 2022-01-28 苏宁易购集团股份有限公司 Search implementation method and system
JP6971104B2 (en) * 2017-09-20 2021-11-24 ヤフー株式会社 Information processing equipment, information processing methods, and programs
CN107643835A (en) * 2017-10-19 2018-01-30 北京京东尚科信息技术有限公司 Drop-down word determines method, apparatus, electronic equipment and storage medium
CN107832459B (en) * 2017-11-27 2021-09-24 公安部交通管理科学研究所 System and method for learning content sharing in knowledge base based on distributed network environment
US10810457B2 (en) * 2018-05-09 2020-10-20 Fuji Xerox Co., Ltd. System for searching documents and people based on detecting documents and people around a table
WO2019235103A1 (en) * 2018-06-07 2019-12-12 日本電信電話株式会社 Question generation device, question generation method, and program
WO2020057175A1 (en) * 2018-09-20 2020-03-26 Huawei Technologies Co., Ltd. Knowledge-based management of recognition models in artificial intelligence systems
CN109753517A (en) * 2018-12-06 2019-05-14 北京明略软件系统有限公司 A kind of method, apparatus, computer storage medium and the terminal of information inquiry
US11487902B2 (en) 2019-06-21 2022-11-01 nference, inc. Systems and methods for computing with private healthcare data
CN110347699B (en) * 2019-06-26 2022-01-28 北京明略软件系统有限公司 Method and device for determining activity of entity related to identity card
CN110245357B (en) * 2019-06-26 2023-05-02 北京百度网讯科技有限公司 Main entity identification method and device
CN112487214A (en) * 2020-12-23 2021-03-12 中译语通科技股份有限公司 Knowledge graph relation extraction method and system based on entity co-occurrence matrix
US11496373B2 (en) * 2021-01-26 2022-11-08 Juniper Networks, Inc. Enhanced conversation interface for network management

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6965900B2 (en) * 2001-12-19 2005-11-15 X-Labs Holdings, Llc Method and apparatus for electronically extracting application specific multidimensional information from documents selected from a set of documents electronically extracted from a library of electronically searchable documents
US8438142B2 (en) * 2005-05-04 2013-05-07 Google Inc. Suggesting and refining user input based on original user input
US7593940B2 (en) * 2006-05-26 2009-09-22 International Business Machines Corporation System and method for creation, representation, and delivery of document corpus entity co-occurrence information
JP4922692B2 (en) * 2006-07-28 2012-04-25 富士通株式会社 Search query creation device
US8195655B2 (en) * 2007-06-05 2012-06-05 Microsoft Corporation Finding related entity results for search queries
US20090313227A1 (en) * 2008-06-14 2009-12-17 Veoh Networks, Inc. Searching Using Patterns of Usage
US20090327223A1 (en) * 2008-06-26 2009-12-31 Microsoft Corporation Query-driven web portals
US8631004B2 (en) * 2009-12-28 2014-01-14 Yahoo! Inc. Search suggestion clustering and presentation
JP5256273B2 (en) * 2010-11-24 2013-08-07 ヤフー株式会社 Intention extraction apparatus, method and program
US20120143875A1 (en) * 2010-12-01 2012-06-07 Yahoo! Inc. Method and system for discovering dynamic relations among entities
JP5426526B2 (en) * 2010-12-21 2014-02-26 日本電信電話株式会社 Probabilistic information search processing device, probabilistic information search processing method, and probabilistic information search processing program
WO2013108073A2 (en) * 2011-12-06 2013-07-25 Perception Partners, Inc. Text mining analysis and output system
CN103186556B (en) * 2011-12-28 2016-09-07 北京百度网讯科技有限公司 Obtain the method with searching structure semantic knowledge and corresponding intrument
WO2013170343A1 (en) * 2012-05-15 2013-11-21 Whyz Technologies Limited Method and system relating to salient content extraction for electronic content

Similar Documents

Publication Publication Date Title
JP2017504105A5 (en)
Li et al. A unified graph model for sentence-based opinion retrieval
Ritze et al. Matching web tables to dbpedia-a feature utility study
US11176124B2 (en) Managing a search
US20170161375A1 (en) Clustering documents based on textual content
US8370361B2 (en) Extracting and normalizing organization names from text
Pattaniyil et al. Combining TF-IDF Text Retrieval with an Inverted Index over Symbol Pairs in Math Expressions: The Tangent Math Search Engine at NTCIR 2014.
KR20160124742A (en) Method for disambiguating features in unstructured text
BR112015030417B1 (en) COMPUTER SYSTEM, COMPUTER IMPLEMENTED METHOD AND SYSTEM FOR NATURAL LANGUAGE SEARCH RESULTS FOR INTENT QUERIES
US8825620B1 (en) Behavioral word segmentation for use in processing search queries
US20240160626A1 (en) System and method for automatic creation of ontological databases and semantic searching
JP2013531289A5 (en)
US9251289B2 (en) Matching target strings to known strings
BR112012026345A2 (en) imputation of actionable attributes to data that describe a personal identity
McNamee HLTCOE Efforts in Entity Linking at TAC KBP 2010.
US10565188B2 (en) System and method for performing a pattern matching search
Quix et al. Automatic selection of background knowledge for ontology matching
Zaki et al. A Hybrid Method N-Grams-TFIDF with radial basis for indexing and classification of Arabic documents
Dangre et al. System for Marathi news clustering
JP5486667B2 (en) Method and apparatus for diversifying query results
RU2013132622A (en) SYSTEM AND SEMANTIC SEARCH METHOD
Wang et al. Understanding the Query: THCIB and THUIS at NTCIR-10 Intent Task.
US9507855B2 (en) System and method for searching index content data using multiple proximity keyword searches
US8706753B2 (en) Search result ranking with search string certainty weighting
Zhang Learning with partial data for semantic table interpretation