JPWO2020201875A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2020201875A5
JPWO2020201875A5 JP2021557224A JP2021557224A JPWO2020201875A5 JP WO2020201875 A5 JPWO2020201875 A5 JP WO2020201875A5 JP 2021557224 A JP2021557224 A JP 2021557224A JP 2021557224 A JP2021557224 A JP 2021557224A JP WO2020201875 A5 JPWO2020201875 A5 JP WO2020201875A5
Authority
JP
Japan
Prior art keywords
results
attributes
search
engine
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021557224A
Other languages
Japanese (ja)
Other versions
JP2022526931A (en
Publication date
Application filed filed Critical
Priority claimed from PCT/IB2020/052498 external-priority patent/WO2020201875A1/en
Publication of JP2022526931A publication Critical patent/JP2022526931A/en
Publication of JPWO2020201875A5 publication Critical patent/JPWO2020201875A5/ja
Pending legal-status Critical Current

Links

Claims (20)

マスタ・データ管理システムのデータ記録にアクセスするための方法であって、前記データ記録は複数の属性を含み、前記方法は、
前記データ記録へのアクセスを可能にするための1つ以上のサーチ・エンジンによって前記マスタ・データ管理システムを強化するステップ、
前記マスタ・データ管理システムにおいてデータの要求を受信するステップ、
前記受信した要求において参照されている前記複数の属性のうちの1つ以上の属性のセットを識別するステップ、
前記マスタ・データ管理システムの前記サーチ・エンジンのうち、前記属性のセットの少なくとも一部の値をサーチするためのパフォーマンスが現行の選択ルールを満たすような1つ以上のサーチ・エンジンの組み合わせを選択するステップ、
前記サーチ・エンジンの組み合わせを用いて前記要求を処理するステップ、および
前記処理の結果の少なくとも一部を提供するステップ
を含む、方法。
A method for accessing data records of a master data management system, said data records comprising a plurality of attributes, said method comprising:
augmenting said master data management system with one or more search engines for enabling access to said data records;
receiving a request for data at the master data management system;
identifying a set of one or more attributes of the plurality of attributes referenced in the received request;
selecting a combination of one or more of said search engines of said master data management system whose performance for searching for values of at least a portion of said set of attributes satisfies current selection rules; step to
A method comprising: processing said request using said combination of search engines; and providing at least some of the results of said processing.
前記提供された結果に対するユーザ動作に基づいて前記選択ルールを更新するステップであって、前記更新された選択ルールは前記現行の選択ルールとなる、前記更新するステップと、データの別の要求を受信した際に、前記現行の選択ルールを用いて前記識別、選択、処理、および提供のステップを反復するステップとをさらに含む、請求項1に記載の方法。 receiving another request for data; updating the selection rule based on user action on the provided results, wherein the updated selection rule becomes the current selection rule; and repeating the identifying, selecting, processing, and providing steps using the current selection rule when the selection rule is selected. 前記結果は、前記サーチ・エンジンのスコアリング・エンジンによって得られたそれぞれのマッチング・スコアに関連する前記マスタ・データ管理システムのデータ記録を含み、前記方法はさらに、前記結果の提供に関与したコンポーネントのパフォーマンスに従って前記マッチング・スコアを重み付けするステップを含み、前記コンポーネントは方法ステップ、前記結果を提供するために用いられたエレメント、および前記結果の少なくとも一部を含み、前記提供された結果は、予め定められたスコア閾値よりも高い重み付きマッチング・スコアを有する非重複データ記録を含む、請求項1または2に記載の方法。 said results comprising data records in said master data management system associated with each matching score obtained by a scoring engine of said search engine, said method further comprising: wherein said components include method steps, elements used to provide said results, and at least a portion of said results, said provided results being pre- 3. The method of claim 1 or 2, comprising non-duplicate data records having a weighted matching score higher than a defined score threshold. 前記結果の提供に関与するコンポーネントは前記サーチ・エンジンと、前記識別ステップと、前記結果とを含み、前記方法はさらに、
前記サーチ・エンジンの各サーチ・エンジンにエンジン重みを割り当てるステップ、
前記属性のセットに属性重みを割り当てるステップであって、属性の前記属性重みは前記属性が識別されるときの信頼性レベルを示す、前記割り当てるステップ、
前記結果の各データ記録に、前記データ記録の完全性を示す完全性重みと、前記データ記録の鮮度を示す鮮度重みとを割り当てるステップ、
前記結果の各データ記録に対する前記それぞれのエンジン重み、属性重み、完全性重み、および鮮度重みを組み合わせるステップ、および前記組み合わされた重みによって前記データ記録の前記スコアを重み付けするステップ
を含む、請求項に記載の方法。
The components involved in providing the results include the search engine, the identifying step, and the results, the method further comprising:
assigning an engine weight to each search engine of said search engines;
assigning an attribute weight to said set of attributes, said assigning step wherein said attribute weight of an attribute indicates a level of confidence with which said attribute is identified;
assigning to each data record of said results a completeness weight indicating the completeness of said data record and a freshness weight indicating freshness of said data record;
combining said respective engine weight, attribute weight, completeness weight and freshness weight for each data record of said results; and weighting said score of said data record by said combined weight. The method described in .
ユーザ動作を定量化するユーザ・パラメータを提供するステップと、
前記コンポーネントの少なくとも一部の各コンポーネントに対して、前記ユーザ・パラメータの値と、前記コンポーネントを記述するコンポーネント・パラメータの関連する値とを定めるステップと、前記コンポーネントに割り当てられた前記重みを更新するために前記定められた関連を用いるステップと
をさらに含む、請求項3または4に記載の方法。
providing user parameters that quantify user behavior;
determining, for each component of at least some of said components, values of said user parameters and associated values of component parameters describing said component; and updating said weights assigned to said components. 5. A method according to claim 3 or 4, further comprising: using said defined association for
前記ユーザ・パラメータの値と前記コンポーネント・パラメータの前記値とを関連付けるルックアップ・テーブルを提供するステップと、前記コンポーネントに割り当てられた前記重みを更新するために前記ルックアップ・テーブルを用いるステップとをさらに含む、請求項に記載の方法。 providing a lookup table that associates values of the user parameter with the values of the component parameters; and using the lookup table to update the weights assigned to the components. 6. The method of claim 5 , further comprising: 予め定められたモデルを用いて前記コンポーネント・パラメータの前記値によって前記ユーザ・パラメータの値の前記変動をモデリングするステップと、前記コンポーネントの更新重みを定めるために前記モデルを用いるステップと、前記コンポーネントに割り当てられた前記重みを更新するために前記更新重みを用いるステップとをさらに含む、請求項に記載の方法。 modeling the variation in the value of the user parameter with the value of the component parameter using a predetermined model; using the model to define update weights for the component; and using the updated weights to update the assigned weights . 前記ユーザ動作のうちのあるユーザ動作は結果の選択の指示を含み、前記指示は前記提供された結果のうちの表示された結果に対するマウス・クリックを含み、前記ユーザ・パラメータは前記クリックの数、前記クリックの頻度、および前記結果のうちの所与の結果にアクセスする持続時間のうちの少なくとも1つを含む、請求項2~7のいずれか一項に記載の方法。 a user action of the user actions includes an indication of selection of a result, the indication includes a mouse click on a displayed result of the provided results, the user parameter is the number of the clicks; A method according to any one of claims 2 to 7, comprising at least one of the frequency of said clicks and the duration of accessing a given one of said results. 前記属性のセットの各属性に対して、前記選択ルールは、
前記サーチ・エンジンの各サーチ・エンジンに対して、前記属性の値をサーチするための前記サーチ・エンジンの前記パフォーマンスを示すパフォーマンス・パラメータの値を定めるステップ、
予め定められたパフォーマンス閾値よりも高いパフォーマンス・パラメータ値を有する前記サーチ・エンジンを選択するステップ
を含む、請求項1~のいずれか一項に記載の方法。
For each attribute of the set of attributes, the selection rule includes:
determining, for each search engine of said search engines, a value of a performance parameter indicative of said performance of said search engine for searching for values of said attribute;
A method according to any one of claims 1 to 8 , comprising selecting said search engine having a performance parameter value higher than a predetermined performance threshold.
前記パフォーマンス・パラメータは、前記結果の数、および期待値に対する前記結果のマッチングのレベルの少なくとも一方を含む、請求項に記載の方法。 10. The method of claim 9 , wherein the performance parameters include at least one of the number of results and the level of matching of the results to expected values. 前記選択ルールは属性と対応するサーチ・エンジンとを関連付けるテーブルを使用し、前記選択ルールの前記更新は、
前記サーチ・エンジンの前記組み合わせの各サーチ・エンジンの提供された結果に対する前記ユーザ動作を定量化するユーザ・パラメータの前記値を定めるステップと、
予め定められた閾値よりも小さい前記ユーザ・パラメータの前記値を識別するために、前記サーチ・エンジンの前記組み合わせの各サーチ・エンジンに関連して前記定められた値を用いるステップと、前記ユーザ・パラメータの各々の識別された値に対して、前記属性のセットのうちの前記属性および前記識別された値に関連する前記サーチ・エンジンを定めるステップと、前記定められた属性およびサーチ・エンジンを用いて前記テーブルを更新するステップと
を含む、請求項または10に記載の方法。
The selection rule uses a table that associates attributes with corresponding search engines, and the updating of the selection rule includes:
determining said value of a user parameter that quantifies said user action on the provided results of each search engine of said combination of said search engines;
using said determined value associated with each search engine of said combination of said search engines to identify said value of said user parameter that is less than a predetermined threshold; for each identified value of a parameter, defining said search engine associated with said attribute of said set of attributes and said identified value; 11. A method according to claim 9 or 10 , comprising updating said table with
前記要求の前記処理は、前記サーチ・エンジンの前記組み合わせによって並行して行われる、請求項1~11のいずれか一項に記載の方法。 A method according to any preceding claim, wherein said processing of said requests is performed in parallel by said combination of said search engines. 前記サーチ・エンジンの組み合わせはサーチ・エンジンのランク付きリストであり、前記要求の前記処理は、結果の最低数を超えるまで前記ランク付きリストに従って連続的に行われる、請求項1~11のいずれか一項に記載の方法。 12. Any of claims 1-11 , wherein said combination of search engines is a ranked list of search engines, and said processing of said requests is performed sequentially according to said ranked list until a minimum number of results is exceeded. The method according to item 1. 前記属性のセットを識別するステップは、前記受信した要求を予め定められた機械学習モデルに入力するステップと、前記機械学習モデルから前記要求の分類を受信するステップとを含み、前記分類は前記属性のセットを示す、請求項1~13のいずれか一項に記載の方法。 Identifying the set of attributes includes inputting the received request into a predetermined machine learning model and receiving a classification of the request from the machine learning model, the classification being the attribute A method according to any one of claims 1 to 13 , wherein the set of 前記属性のセットを予め定められた機械学習モデルに入力するステップと、前記機械学習モデルから前記属性のセットをサーチするために用いられ得る1つ以上のサーチ・エンジンを受信するステップとをさらに含む、請求項1~14のいずれか一項に記載の方法。 further comprising inputting said set of attributes into a predetermined machine learning model; and receiving one or more search engines that may be used to search said set of attributes from said machine learning model. , the method according to any one of claims 1 to 14 . 1つ以上のトレーニング属性の異なるセットを示すトレーニング・セットを受信するステップであって、トレーニング属性の各セットは、前記トレーニング属性のセットの前記サーチを行うために好適なサーチ・エンジンを示すようにラベル付けされている、前記受信するステップと、前記トレーニング・セットを用いて予め定められた機械学習アルゴリズムをトレーニングすることによって前記機械学習モデルを生成するステップとをさらに含む、請求項15に記載の方法。 receiving a training set indicating a different set of one or more training attributes, each set of training attributes indicating a suitable search engine for conducting said search of said set of training attributes; 16. The method of claim 15 , further comprising the steps of receiving, labeled, and generating the machine learning model by training a predetermined machine learning algorithm using the training set. Method. 前記提供された結果は、前記要求の送信者に依存してフィルタリングされるデータ記録を含む、請求項1~16のいずれか一項に記載の方法。 A method according to any one of the preceding claims, wherein said provided results comprise data records filtered depending on the sender of said request. プロセッサに、請求項1~17のいずれか一項に記載の方法の各ステップを実行させる、コンピュータ・プログラム。A computer program causing a processor to perform the steps of the method according to any one of claims 1-17. データ記録へのアクセスを可能にするためのコンピュータ・システムであって、前記データ記録は複数の属性を含み、前記コンピュータ・システムは、前記データ記録へのアクセスを可能にするための複数のサーチ・エンジン、データの要求を受信するために構成されたユーザ・インターフェース、前記受信した要求において参照されている前記複数の属性のうちの1つ以上の属性のセットを識別するために構成されたエンティティ識別子、前記サーチ・エンジンのうち、前記属性のセットの少なくとも一部の値をサーチするためのパフォーマンスが現行の選択ルールを満たすような1つ以上のサーチ・エンジンの組み合わせを選択するために構成されたエンジン・セレクタであって、前記サーチ・エンジンは前記要求を処理するために構成される、前記エンジン・セレクタ、前記処理の前記結果の少なくとも一部を提供するために構成された結果プロバイダを含む、コンピュータ・システム。 A computer system for enabling access to a data record, said data record comprising a plurality of attributes, said computer system comprising a plurality of search parameters for enabling access to said data record. an engine, a user interface configured to receive a request for data, an entity identifier configured to identify a set of one or more attributes of the plurality of attributes referenced in the received request. , configured for selecting a combination of one or more of said search engines whose performance for searching for values of at least some of said set of attributes satisfies current selection rules. an engine selector, said search engine configured to process said request, said engine selector comprising a result provider configured to provide at least a portion of said results of said processing; computer system. 前記結果は、前記サーチ・エンジンのスコアリング・エンジンによって得られたそれぞれのマッチング・スコアに関連する前記コンピュータ・システムのデータ記録を含み、前記コンピュータ・システムはさらに、前記結果の提供に関与したコンポーネントのパフォーマンスに従って前記マッチング・スコアを重み付けするために構成された重みプロバイダを含み、前記コンポーネントは前記結果を提供するために用いられた方法ステップおよびエレメントならびに前記結果の少なくとも一部を含み、前記提供された結果は、予め定められたスコア閾値よりも高い重み付きマッチング・スコアを有する非重複データ記録を含む、請求項19に記載のコンピュータ・システム。 said results comprising data records of said computer system associated with each matching score obtained by a scoring engine of said search engine, said computer system further comprising a component responsible for providing said results; a weight provider configured to weight the matching scores according to the performance of the provided 20. The computer system of claim 19 , wherein the results obtained include non-duplicate data records having weighted matching scores higher than a predetermined score threshold.
JP2021557224A 2019-04-02 2020-03-19 How to access the data records of a master data management system Pending JP2022526931A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19166696 2019-04-02
EP19166696.5 2019-04-02
PCT/IB2020/052498 WO2020201875A1 (en) 2019-04-02 2020-03-19 Method for accessing data records of a master data management system

Publications (2)

Publication Number Publication Date
JP2022526931A JP2022526931A (en) 2022-05-27
JPWO2020201875A5 true JPWO2020201875A5 (en) 2022-08-19

Family

ID=66091890

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021557224A Pending JP2022526931A (en) 2019-04-02 2020-03-19 How to access the data records of a master data management system

Country Status (5)

Country Link
JP (1) JP2022526931A (en)
CN (1) CN113661488A (en)
DE (1) DE112020000554T5 (en)
GB (1) GB2596741A (en)
WO (1) WO2020201875A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114780528B (en) * 2022-04-22 2024-07-09 深圳计算科学研究院 Data entity identification method, device, computer equipment and storage medium

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002007418A (en) * 2000-06-16 2002-01-11 Jisedai Joho Hoso System Kenkyusho:Kk Multimedia information retrieving device, multimedia information retrieving method and computer readable recording medium in which program to make computer execute its method is recorded
US7831438B2 (en) * 2004-12-30 2010-11-09 Google Inc. Local item extraction
JP5418493B2 (en) * 2008-02-27 2014-02-19 日本電気株式会社 Search system, search method and program
US20110213771A1 (en) * 2008-11-18 2011-09-01 Kyota Kanno Hybrid search system, hybrid search method, and hybrid search program
JP2010267075A (en) * 2009-05-14 2010-11-25 Canon Inc Apparatus and method for processing information, program, and storage medium
CN101930447A (en) * 2009-12-31 2010-12-29 北京中加国道科技有限公司 Retrieval system for network academic resources
CN102043833B (en) * 2010-11-25 2013-12-25 北京搜狗科技发展有限公司 Search method and device based on query word
CN103164454B (en) * 2011-12-15 2016-03-23 百度在线网络技术(北京)有限公司 Keyword group technology and system
US20160063052A1 (en) * 2014-08-29 2016-03-03 Accenture Global Services Limited Method and system for validating information
WO2017123785A1 (en) * 2016-01-12 2017-07-20 Veritone, Inc. User interface for multivariate searching
CN106383984A (en) * 2016-08-30 2017-02-08 南京邮电大学 Big data quality effective evaluation method based on MMTD

Similar Documents

Publication Publication Date Title
CN109240901B (en) Performance analysis method, performance analysis device, storage medium, and electronic apparatus
US9201931B2 (en) Method for obtaining search suggestions from fuzzy score matching and population frequencies
JP5351182B2 (en) Determining relevant information about the area of interest
US8341159B2 (en) Creating taxonomies and training data for document categorization
CN105808590B (en) Search engine implementation method, searching method and device
US10860565B2 (en) Database update and analytics system
JP2011258235A (en) System and method for ranking result of search by using click distance
KR20120030389A (en) Merging search results
CN101196905A (en) Intelligent pattern searching method
CN110716950A (en) Method, device and equipment for establishing aperture system and computer storage medium
US20240127575A1 (en) Artificial intelligence system with iterative two-phase active learning
Shchekotykhin et al. xCrawl: a high-recall crawling method for Web mining
JP5324677B2 (en) Similar document search support device and similar document search support program
CN110347821A (en) A kind of method, electronic equipment and the readable storage medium storing program for executing of text categories mark
GB2596741A (en) Method for accessing data records of a master data management system
JP2016038667A (en) Information provision device, information provision method and information provision program
CN109213830A (en) The document retrieval system of professional technical documentation
JP2020071678A (en) Information processing device, control method, and program
JPWO2011070979A1 (en) Dictionary creation device, word collection method, and program
JPWO2020201875A5 (en)
TWM623755U (en) System for generating creative materials
JP5310328B2 (en) Classification system revision support program, classification system revision support device, and classification system revision support method
JP5211000B2 (en) Ranking function generation device, ranking function generation method, ranking function generation program
JP5310196B2 (en) Classification system revision support program, classification system revision support device, and classification system revision support method
JP5368900B2 (en) Information presenting apparatus, information presenting method, and program