JP2017504105A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2017504105A5 JP2017504105A5 JP2016536900A JP2016536900A JP2017504105A5 JP 2017504105 A5 JP2017504105 A5 JP 2017504105A5 JP 2016536900 A JP2016536900 A JP 2016536900A JP 2016536900 A JP2016536900 A JP 2016536900A JP 2017504105 A5 JP2017504105 A5 JP 2017504105A5
- Authority
- JP
- Japan
- Prior art keywords
- entity
- computer
- search
- search query
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 238000000605 extraction Methods 0.000 claims 7
- 238000000034 method Methods 0.000 claims 7
Claims (12)
エンティティ抽出コンピュータにより、サーチ質問データがユーザコンピュータによって要求されたときに、リアルタイムで、サーチ質問パラメータを、電子データコーパスにおける1つ以上のエンティティの共起のインスタンスを有するエンティティ共起データベースと比較し、そしてサーチ質問パラメータにおいて1つ以上のエンティティに対応する少なくとも1つのエンティティ形式を識別することにより、サーチ質問パラメータから1つ以上のエンティティを抽出し、
曖昧スコアマッチングコンピュータにより、サーチ質問データがユーザコンピュータによって要求されたときに、リアルタイムで、サーチ質問パラメータに関連した1つ以上のレコードを識別するためにエンティティ共起データベースをサーチする曖昧マッチングアルゴリズムを選択し、その曖昧マッチングアルゴリズムは、少なくとも1つの識別されたエンティティ形式に対応するものであり、前記エンティティ抽出コンピュータ及び前記曖昧スコアマッチングコンピュータの少なくとも1つは前記エンティティ共起データベースを含むインメモリデータベースをホストするメインメモリを含み、前記インメモリデータベースは構造化データによってインデックスされた複数のレコードを含み、前記構造化データはエンティティ対エンティティのインデックス、エンティティ対トピックスのインデックス及びエンティティ対ファクトのインデックスのうちの少なくとも1つを含み、
曖昧スコアマッチングコンピュータにより、前記ユーザコンピュータによって前記サーチ質問データが要求されたときに、リアルタイムで、その選択された曖昧マッチングアルゴリズムを使用してエンティティ共起データベースをサーチし、そしてそのサーチに基づき1つ以上のレコードから1つ以上の示唆されたサーチ質問パラメータを形成し、前記1つ以上の示唆されたサーチ質問パラメータは、複数の示唆されたサーチ質問パラメータを含み、
曖昧スコアマッチングコンピュータにより、ユーザインターフェイスへ1つ以上の示唆されたサーチ質問パラメータを提示し、及び、
前記曖昧スコアマッチングコンピュータにより、前記複数の示唆されたサーチ質問パラメータをユーザ入力におけるサーチ質問パラメータへの一致の接近性に基づいて降下順に分類する、
ことを含む方法。 An entity extraction computer receives user input of search query parameters from a user interface, wherein the user interface is presented at the user computer;
Comparing search query parameters with an entity co-occurrence database having co-occurrence instances of one or more entities in an electronic data corpus in real time when search query data is requested by a user computer by an entity extraction computer; And extracting one or more entities from the search question parameter by identifying at least one entity type corresponding to the one or more entities in the search question parameter;
The fuzzy score matching computer selects an fuzzy matching algorithm that searches the entity co-occurrence database to identify one or more records related to the search query parameter in real time when search query data is requested by the user computer And the fuzzy matching algorithm corresponds to at least one identified entity type, and at least one of the entity extraction computer and the fuzzy score matching computer hosts an in-memory database including the entity co-occurrence database. The in-memory database includes a plurality of records indexed by structured data, and the structured data is an entity-to-entity Wherein I index, at least one of the indices and entity pairs facts index entity pair Topics,
An ambiguity score matching computer searches the entity co-occurrence database in real time using the selected ambiguity matching algorithm when the search query data is requested by the user computer, and one based on the search Forming one or more suggested search question parameters from the records, wherein the one or more suggested search question parameters include a plurality of suggested search question parameters;
An ambiguous score matching computer presents one or more suggested search query parameters to the user interface; and
The ambiguous score matching computer classifies the plurality of suggested search question parameters in descending order based on accessibility of matches to search question parameters in user input.
A method involving that.
ユーザインターフェイスからサーチ質問パラメータのユーザ入力を受け取るように構成されたエンティティ抽出モジュールを含み、前記ユーザインターフェイスはユーザコンピュータにおいて提示され、このエンティティ抽出モジュールは、更に、
サーチ質問パラメータを、サーチ質問データがユーザコンピュータによって要求されたときに、リアルタイムで、電子データコーパスにおける1つ以上のエンティティの共起のインスタンスを有するエンティティ共起データベースと比較し、そしてサーチ質問パラメータにおいて1つ以上のエンティティに対応する少なくとも1つのエンティティ形式を識別することにより、サーチ質問パラメータから1つ以上のエンティティを抽出する、ように更に構成され、前記1つ以上のサーバーコンピュータは前記エンティティ共起データベースを含むインメモリデータベースをホストするメインメモリを含み、前記インメモリデータベースは構造化データによってインデックスされた複数のレコードを含み、前記構造化データはエンティティ対エンティティのインデックス、エンティティ対トピックスのインデックス及びエンティティ対ファクトのインデックスのうちの少なくとも1つを含み、更に、
サーチ質問データがユーザコンピュータによって要求されたときに、リアルタイムで、サーチ質問パラメータに関連した1つ以上のレコードを識別するためにエンティティ共起データベースをサーチする曖昧マッチングアルゴリズムを選択するよう構成された曖昧スコアマッチングモジュール、
を備え、その曖昧マッチングモジュールは、少なくとも1つの識別されたエンティティ形式に対応するものであり、その曖昧スコアマッチングモジュールは、更に、
サーチ質問データがユーザコンピュータによって要求されたときに、リアルタイムで、その選択された曖昧マッチングアルゴリズムを使用してエンティティ共起データベースをサーチし、そしてそのサーチに基づき1つ以上のレコードから1つ以上の示唆されたサーチ質問パラメータを形成し、及び
ユーザインターフェイスへ1つ以上の示唆されたサーチ質問パラメータを提示する、ように構成され、
前記1つ以上の示唆されたサーチ質問パラメータは、複数の示唆されたサーチ質問パラメータを含み、前記曖昧スコアマッチングモジュールは、その複数の示唆されたサーチ質問パラメータをユーザ入力におけるサーチ質問パラメータへの一致の接近性に基づいて降下順に分類するように構成される、システム。 Comprising one or more server computers having one or more processors executing computer readable instructions for a plurality of computer modules, comprising:
An entity extraction module configured to receive user input of search query parameters from a user interface, wherein the user interface is presented at a user computer, the entity extraction module further comprising:
Compare search query parameters to an entity co-occurrence database having co-occurrence instances of one or more entities in the electronic data corpus in real time when search query data is requested by the user computer, and in the search query parameters The one or more server computers are further configured to extract one or more entities from a search query parameter by identifying at least one entity type corresponding to the one or more entities, A main memory that hosts an in-memory database including a database, the in-memory database including a plurality of records indexed by structured data, the structured data Index Iti, include at least one of the index of indices and entity pairs facts entity pairs topics, further,
An ambiguity configured to select an ambiguity matching algorithm that searches an entity co-occurrence database to identify one or more records associated with a search query parameter in real time when search query data is requested by a user computer Score matching module,
And the ambiguity matching module corresponds to at least one identified entity type, the ambiguity score matching module further comprising:
When the search query data is requested by the user computer, search the entity co-occurrence database using the selected fuzzy matching algorithm in real time and based on the search, one or more records from one or more records Configured to form suggested search query parameters and present one or more suggested search query parameters to a user interface;
The one or more suggested search question parameters include a plurality of suggested search question parameters, and the fuzzy score matching module matches the plurality of suggested search question parameters to the search question parameters in user input. A system configured to sort in descending order based on accessibility.
コンピュータにより、エンティティデータベース及びトレンドデータベースに記憶されたレコードのセットに対して1つ以上のエンティティを比較することに基づき1つ以上のデータストリングにおいて1つ以上のエンティティを識別し、
コンピュータにより、少なくとも1つのエンティティに対応するものとして識別されない1つ以上のデータストリングにおいて1つ以上の特徴を識別し、
コンピュータにより、1つ以上の特徴の各々を、マッチングアルゴリズムに基づき1つ以上のエンティティの少なくとも1つに指定し、
コンピュータにより、各エンティティに指定された各々の特徴に指定されたスコアに基づき各々のエンティティに抽出スコアを指定し、
コンピュータにより、各々のエンティティの抽出スコアからスレッシュホールド距離内にあるスコアを有する1つ以上のエンティティを含む第1のサーチリストをエンティティデータベースから受け取り、
コンピュータにより、各々のエンティティの抽出スコアからスレッシュホールド距離内にあるスコアを有する1つ以上のエンティティを含む第2のサーチリストをトレンドデータベースから受け取り、
コンピュータにより、第1のサーチリスト及び第2のサーチリストを含む総計リストを発生し、その総計リストのエンティティは、各々の総計リストのスコアに従ってランク付けされ、及び
コンピュータにより、その総計リストに従って示唆されるサーチを与える、
ことを含む、コンピュータで実施される方法。 A computer receives a search query including one or more data strings from a search engine;
Identifying one or more entities in one or more data strings based on comparing one or more entities against a set of records stored in an entity database and a trend database by a computer;
Identifying one or more features in one or more data strings not identified by the computer as corresponding to at least one entity;
The computer assigns each of the one or more features to at least one of the one or more entities based on a matching algorithm;
The computer specifies an extraction score for each entity based on the score specified for each feature specified for each entity,
A computer receives a first search list from an entity database that includes one or more entities having a score that is within a threshold distance from an extraction score for each entity;
A computer receives a second search list from the trend database that includes one or more entities having a score that is within a threshold distance from the extracted score of each entity;
A computer generates a grand total list including a first search list and a second search list, and the entities of the total list are ranked according to the score of each total list, and are suggested according to the total list by the computer. Give a search,
A computer-implemented method comprising:
Applications Claiming Priority (11)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361910905P | 2013-12-02 | 2013-12-02 | |
US201361910907P | 2013-12-02 | 2013-12-02 | |
US201361910894P | 2013-12-02 | 2013-12-02 | |
US201361910900P | 2013-12-02 | 2013-12-02 | |
US61/910,900 | 2013-12-02 | ||
US61/910,894 | 2013-12-02 | ||
US61/910,907 | 2013-12-02 | ||
US61/910,905 | 2013-12-02 | ||
US201461947652P | 2014-03-04 | 2014-03-04 | |
US61/947,652 | 2014-03-04 | ||
PCT/US2014/067997 WO2015084759A1 (en) | 2013-12-02 | 2014-12-02 | Systems and methods for in-memory database search |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017504105A JP2017504105A (en) | 2017-02-02 |
JP2017504105A5 true JP2017504105A5 (en) | 2018-01-11 |
Family
ID=53274014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016536900A Ceased JP2017504105A (en) | 2013-12-02 | 2014-12-02 | System and method for in-memory database search |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP3077918A4 (en) |
JP (1) | JP2017504105A (en) |
KR (1) | KR20160124079A (en) |
CN (1) | CN106164889A (en) |
CA (1) | CA2932401A1 (en) |
WO (1) | WO2015084759A1 (en) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10296627B2 (en) | 2015-08-18 | 2019-05-21 | Fiserv, Inc. | Generating integrated data records by correlating source data records from disparate data sources |
JP7106077B2 (en) | 2016-09-22 | 2022-07-26 | エヌフェレンス,インコーポレイテッド | Systems, methods, and computer-readable media for visualization of semantic information and inference of temporal signals that indicate salient associations between life science entities |
CN106599547A (en) * | 2016-11-23 | 2017-04-26 | 中山健康医疗信息技术有限公司 | Intelligent medical knowledge base management system based on tags |
CN106991181B (en) * | 2017-04-07 | 2020-04-21 | 广州视源电子科技股份有限公司 | Method and device for extracting spoken sentences |
CN108932248B (en) * | 2017-05-24 | 2022-01-28 | 苏宁易购集团股份有限公司 | Search implementation method and system |
JP6971104B2 (en) * | 2017-09-20 | 2021-11-24 | ヤフー株式会社 | Information processing equipment, information processing methods, and programs |
CN107643835A (en) * | 2017-10-19 | 2018-01-30 | 北京京东尚科信息技术有限公司 | Drop-down word determines method, apparatus, electronic equipment and storage medium |
CN107832459B (en) * | 2017-11-27 | 2021-09-24 | 公安部交通管理科学研究所 | System and method for learning content sharing in knowledge base based on distributed network environment |
US10810457B2 (en) * | 2018-05-09 | 2020-10-20 | Fuji Xerox Co., Ltd. | System for searching documents and people based on detecting documents and people around a table |
WO2019235103A1 (en) * | 2018-06-07 | 2019-12-12 | 日本電信電話株式会社 | Question generation device, question generation method, and program |
WO2020057175A1 (en) * | 2018-09-20 | 2020-03-26 | Huawei Technologies Co., Ltd. | Knowledge-based management of recognition models in artificial intelligence systems |
CN109753517A (en) * | 2018-12-06 | 2019-05-14 | 北京明略软件系统有限公司 | A kind of method, apparatus, computer storage medium and the terminal of information inquiry |
US11487902B2 (en) | 2019-06-21 | 2022-11-01 | nference, inc. | Systems and methods for computing with private healthcare data |
CN110347699B (en) * | 2019-06-26 | 2022-01-28 | 北京明略软件系统有限公司 | Method and device for determining activity of entity related to identity card |
CN110245357B (en) * | 2019-06-26 | 2023-05-02 | 北京百度网讯科技有限公司 | Main entity identification method and device |
CN112487214A (en) * | 2020-12-23 | 2021-03-12 | 中译语通科技股份有限公司 | Knowledge graph relation extraction method and system based on entity co-occurrence matrix |
US11496373B2 (en) * | 2021-01-26 | 2022-11-08 | Juniper Networks, Inc. | Enhanced conversation interface for network management |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6965900B2 (en) * | 2001-12-19 | 2005-11-15 | X-Labs Holdings, Llc | Method and apparatus for electronically extracting application specific multidimensional information from documents selected from a set of documents electronically extracted from a library of electronically searchable documents |
US8438142B2 (en) * | 2005-05-04 | 2013-05-07 | Google Inc. | Suggesting and refining user input based on original user input |
US7593940B2 (en) * | 2006-05-26 | 2009-09-22 | International Business Machines Corporation | System and method for creation, representation, and delivery of document corpus entity co-occurrence information |
JP4922692B2 (en) * | 2006-07-28 | 2012-04-25 | 富士通株式会社 | Search query creation device |
US8195655B2 (en) * | 2007-06-05 | 2012-06-05 | Microsoft Corporation | Finding related entity results for search queries |
US20090313227A1 (en) * | 2008-06-14 | 2009-12-17 | Veoh Networks, Inc. | Searching Using Patterns of Usage |
US20090327223A1 (en) * | 2008-06-26 | 2009-12-31 | Microsoft Corporation | Query-driven web portals |
US8631004B2 (en) * | 2009-12-28 | 2014-01-14 | Yahoo! Inc. | Search suggestion clustering and presentation |
JP5256273B2 (en) * | 2010-11-24 | 2013-08-07 | ヤフー株式会社 | Intention extraction apparatus, method and program |
US20120143875A1 (en) * | 2010-12-01 | 2012-06-07 | Yahoo! Inc. | Method and system for discovering dynamic relations among entities |
JP5426526B2 (en) * | 2010-12-21 | 2014-02-26 | 日本電信電話株式会社 | Probabilistic information search processing device, probabilistic information search processing method, and probabilistic information search processing program |
WO2013108073A2 (en) * | 2011-12-06 | 2013-07-25 | Perception Partners, Inc. | Text mining analysis and output system |
CN103186556B (en) * | 2011-12-28 | 2016-09-07 | 北京百度网讯科技有限公司 | Obtain the method with searching structure semantic knowledge and corresponding intrument |
WO2013170343A1 (en) * | 2012-05-15 | 2013-11-21 | Whyz Technologies Limited | Method and system relating to salient content extraction for electronic content |
-
2014
- 2014-12-02 KR KR1020167017516A patent/KR20160124079A/en not_active Application Discontinuation
- 2014-12-02 CN CN201480072953.7A patent/CN106164889A/en active Pending
- 2014-12-02 JP JP2016536900A patent/JP2017504105A/en not_active Ceased
- 2014-12-02 CA CA2932401A patent/CA2932401A1/en not_active Abandoned
- 2014-12-02 WO PCT/US2014/067997 patent/WO2015084759A1/en active Application Filing
- 2014-12-02 EP EP14867913.7A patent/EP3077918A4/en not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2017504105A5 (en) | ||
Li et al. | A unified graph model for sentence-based opinion retrieval | |
Ritze et al. | Matching web tables to dbpedia-a feature utility study | |
US11176124B2 (en) | Managing a search | |
US20170161375A1 (en) | Clustering documents based on textual content | |
US8370361B2 (en) | Extracting and normalizing organization names from text | |
Pattaniyil et al. | Combining TF-IDF Text Retrieval with an Inverted Index over Symbol Pairs in Math Expressions: The Tangent Math Search Engine at NTCIR 2014. | |
KR20160124742A (en) | Method for disambiguating features in unstructured text | |
BR112015030417B1 (en) | COMPUTER SYSTEM, COMPUTER IMPLEMENTED METHOD AND SYSTEM FOR NATURAL LANGUAGE SEARCH RESULTS FOR INTENT QUERIES | |
US8825620B1 (en) | Behavioral word segmentation for use in processing search queries | |
US20240160626A1 (en) | System and method for automatic creation of ontological databases and semantic searching | |
JP2013531289A5 (en) | ||
US9251289B2 (en) | Matching target strings to known strings | |
BR112012026345A2 (en) | imputation of actionable attributes to data that describe a personal identity | |
McNamee | HLTCOE Efforts in Entity Linking at TAC KBP 2010. | |
US10565188B2 (en) | System and method for performing a pattern matching search | |
Quix et al. | Automatic selection of background knowledge for ontology matching | |
Zaki et al. | A Hybrid Method N-Grams-TFIDF with radial basis for indexing and classification of Arabic documents | |
Dangre et al. | System for Marathi news clustering | |
JP5486667B2 (en) | Method and apparatus for diversifying query results | |
RU2013132622A (en) | SYSTEM AND SEMANTIC SEARCH METHOD | |
Wang et al. | Understanding the Query: THCIB and THUIS at NTCIR-10 Intent Task. | |
US9507855B2 (en) | System and method for searching index content data using multiple proximity keyword searches | |
US8706753B2 (en) | Search result ranking with search string certainty weighting | |
Zhang | Learning with partial data for semantic table interpretation |