JP2010507857A5 - - Google Patents

Download PDF

Info

Publication number
JP2010507857A5
JP2010507857A5 JP2009533937A JP2009533937A JP2010507857A5 JP 2010507857 A5 JP2010507857 A5 JP 2010507857A5 JP 2009533937 A JP2009533937 A JP 2009533937A JP 2009533937 A JP2009533937 A JP 2009533937A JP 2010507857 A5 JP2010507857 A5 JP 2010507857A5
Authority
JP
Japan
Prior art keywords
record
registered
list
characteristic
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009533937A
Other languages
Japanese (ja)
Other versions
JP2010507857A (en
Filing date
Publication date
Priority claimed from US11/585,365 external-priority patent/US20080097992A1/en
Application filed filed Critical
Publication of JP2010507857A publication Critical patent/JP2010507857A/en
Publication of JP2010507857A5 publication Critical patent/JP2010507857A5/ja
Pending legal-status Critical Current

Links

Claims (9)

外部サンプルを表すサンプルレコードと、コンピュータデータベース(16)に記憶されている複数の登録されているレコード(18)との間で一致を識別するコンピュータ実現される方法において、
前記コンピュータデータベース(16)に記憶されることになるレコードに対するレコード特性(26)の組を規定することと、
前記コンピュータデータベース(16)へと複数のレコードを登録することと、
外部サンプルを表すサンプルレコードから特性(26)を抽出することと、
前記抽出された特性から、前記外部サンプルとの一致であるとして、ある登録されているレコードを識別することと
を含み、
前記方法は、
各登録に対して、前記登録されているレコードの識別子を、複数の出現リスト(28)のうちの1つ以上へと追加し、各出現リストは、特定の特性に関係付けられており、前記特定の特性を表示する登録されているレコードの識別子を含んでいることと、
前記レコード特性の組は、特性リスト(24)を含み、前記特性リスト中の各エントリは、ポインタ(27)に関係付けられており、前記ポインタは、前記対応する特性を表示する記憶されているレコードを含む出現リスト(28)に対して、前記エントリをリンク付けすることと、
前記抽出された特性から、対応する抽出ポインタと、対応する抽出出現リストとを決定し、ある登録されているレコードが、要求される数の抽出出現リスト中で発生するとき、前記登録されているレコードを一致であるとして識別することと
によって特徴付けられる方法。
A sample record that represents an external sample, in the methods computer implemented that identifies a match between a record (18) which has a plurality of entries stored in a computer database (16),
Defining a set of record characteristics (26) for records to be stored in the computer database (16);
Registering a plurality of records in the computer database (16);
Extracting the characteristic (26) from the sample record representing the external sample ;
Identifying a registered record from the extracted characteristics as being a match with the external sample ,
The method
For each registration, add an identifier of the registered record to one or more of a plurality of occurrence lists (28), each occurrence list being associated with a particular characteristic, Contains an identifier for a registered record that displays certain characteristics;
The set of record characteristics includes a characteristic list (24), and each entry in the characteristic list is associated with a pointer (27), and the pointer is stored indicating the corresponding characteristic. Linking the entry to an occurrence list (28) containing records;
From the extracted characteristics, a corresponding extraction pointer and a corresponding extracted appearance list are determined, and when a registered record occurs in the required number of extracted appearance lists, the registered characteristics are registered. Identifying the record as a match and
A method characterized by :
前記特性リスト(24)は、前記複数の登録されているレコードによって表示される特性空間内のすべての特性を規定する、請求項1記載の方法。 The method of claim 1, wherein the property list (24) defines all properties in a property space displayed by the plurality of registered records. 前記特性リスト(24)は、あるサンプルレコードによって表示することができる特性空間内のすべての可能性ある特性を規定する、請求項1記載の方法。 The method of claim 1, wherein the property list (24) defines all possible properties in a property space that can be displayed by a sample record. 前記特性リストは、暗黙的なものであり、独立した実体として記憶されない、請求項記載の方法。 The characteristic list are those implicit, not stored as a separate entity, the process of claim 1. 前記抽出ステップは、複数の並列プロセッサ(36)の間で分けられ、それぞれが関係付けの結果をコンソリデータ(38)に送り、前記コンソリデータは、前記関係付けの結果に依存して、可能性ある一致として、登録されているレコードを識別する、請求項1記載の方法。 The extraction step is divided among a plurality of parallel processors (36) , each sending the result of the association to a consolidator (38) , the consolidator depending on the result of the association and possibly The method of claim 1, wherein a registered record is identified as a match. 外部サンプルを表すサンプルレコードと、コンピュータデータベースに記憶されている複数の登録されているレコードとの間で一致を識別するシステムにおいて、
コンピュータおよびコンピュータデータベースと、
前記コンピュータデータベース(16)に記憶されることになるレコードに対するレコード特性(26)の組と、
前記コンピュータデータベース(16)へと複数のレコードを登録するプロセッサと、
前記外部サンプルを表すサンプルレコードから特性(26)を抽出するプロセッサと、
前記抽出された特性から、前記外部サンプルとの一致であるとして、ある登録されているレコードを識別するプロセッサと
を具備し、
前記システムは、
各登録に対して、前記登録されているレコードの識別子を、複数の出現リスト(28)のうちの1つ以上へと追加する手段であって、各出現リストは、特定の特性に関係付けられており、前記特定の特性を表示する登録されているレコードの識別子を含んでいる手段と、
前記レコード特性の組は、特性リスト(24)を含み、前記特性リスト中の各エントリは、ポインタ(27)に関係付けられており、前記ポインタは、前記対応する特性を表示する記憶されているレコードを含む出現リスト(28)に対して、前記エントリをリンク付けすることと、
前記抽出された特性から、対応する抽出ポインタと、対応する抽出出現リストとを決定し、ある登録されているレコードが、要求される数の抽出出現リスト中で発生するとき、前記登録されているレコードを一致であるとして識別する手段と
によって特徴付けられるシステム。
A sample record that represents an external sample, the system for identifying a match between a record has a plurality of entries stored in a computer database,
A computer and a computer database;
A set of record characteristics (26) for records to be stored in the computer database (16);
A processor for registering a plurality of records in the computer database (16);
A processor that extracts characteristics (26) from a sample record representing the external sample ;
A processor for identifying a registered record as being a match with the external sample from the extracted characteristics ;
The system
Means for adding, for each registration, an identifier of the registered record to one or more of a plurality of occurrence lists (28), each occurrence list being associated with a particular characteristic; Means comprising an identifier of a registered record displaying said specific characteristic;
The set of record characteristics includes a characteristic list (24), and each entry in the characteristic list is associated with a pointer (27), and the pointer is stored indicating the corresponding characteristic. Linking the entry to an occurrence list (28) containing records;
From the extracted characteristics, a corresponding extraction pointer and a corresponding extracted appearance list are determined, and when a registered record occurs in the required number of extracted appearance lists, the registered characteristics are registered. Means to identify the record as a match, and
System characterized by.
前記抽出するプロセッサと、前記識別するプロセッサとは、共通のプロセッサからなる、請求項記載のシステム。 The system according to claim 6 , wherein the extracting processor and the identifying processor comprise a common processor. 前記抽出するプロセッサは、前記識別するプロセッサから離れている、請求項記載のシステム。 The system of claim 6 , wherein the extracting processor is remote from the identifying processor. 前記抽出するプロセッサは、複数の並列プロセッサを備え、それぞれが関係付けの結果をコンソリデータに送り、前記コンソリデータは、前記関係付けされた結果に依存して、可能性ある一致として、記憶されているレコードを識別する、請求項記載のシステム。 Processor said extracting comprises a plurality of parallel processors, each sends the result of the relationship with the consolidator, the consolidator, depending on the relationship-ordered results, as a match that possibility, stored 7. The system of claim 6 , wherein the system identifies a record that is present.
JP2009533937A 2006-10-23 2007-10-23 Fast database matching Pending JP2010507857A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/585,365 US20080097992A1 (en) 2006-10-23 2006-10-23 Fast database matching
PCT/GB2007/004037 WO2008050108A1 (en) 2006-10-23 2007-10-23 Fast database matching

Publications (2)

Publication Number Publication Date
JP2010507857A JP2010507857A (en) 2010-03-11
JP2010507857A5 true JP2010507857A5 (en) 2010-12-16

Family

ID=39106480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009533937A Pending JP2010507857A (en) 2006-10-23 2007-10-23 Fast database matching

Country Status (4)

Country Link
US (1) US20080097992A1 (en)
EP (1) EP2084623A1 (en)
JP (1) JP2010507857A (en)
WO (1) WO2008050108A1 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7809747B2 (en) * 2006-10-23 2010-10-05 Donald Martin Monro Fuzzy database matching
US9846739B2 (en) 2006-10-23 2017-12-19 Fotonation Limited Fast database matching
US20110143325A1 (en) * 2009-12-15 2011-06-16 Awad Al-Khalaf Automatic Integrity Checking of Quran Script
US8577094B2 (en) 2010-04-09 2013-11-05 Donald Martin Monro Image template masking
BR112014011646A2 (en) * 2011-11-14 2017-05-02 Brainstorm Int Services Ltd method of identifying matches between a sample data record and a plurality of registrant data records; and identification system of possible correspondences
US8719236B2 (en) * 2012-08-23 2014-05-06 Microsoft Corporation Selecting candidate rows for deduplication

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4896363A (en) * 1987-05-28 1990-01-23 Thumbscan, Inc. Apparatus and method for matching image characteristics such as fingerprint minutiae
US5291560A (en) * 1991-07-15 1994-03-01 Iri Scan Incorporated Biometric personal identification system based on iris analysis
US5251131A (en) * 1991-07-31 1993-10-05 Thinking Machines Corporation Classification of data records by comparison of records to a training database using probability weights
JPH09198409A (en) * 1996-01-19 1997-07-31 Hitachi Ltd Extremely similar docuemtn extraction method
US5924094A (en) * 1996-11-01 1999-07-13 Current Network Technologies Corporation Independent distributed database system
US5873074A (en) * 1997-04-18 1999-02-16 Informix Software, Inc. Applying distinct hash-join distributions of operators to both even and uneven database records
US6018739A (en) * 1997-05-15 2000-01-25 Raytheon Company Biometric personnel identification system
US6505193B1 (en) * 1999-12-01 2003-01-07 Iridian Technologies, Inc. System and method of fast biometric database searching using digital certificates
WO2001073672A2 (en) * 2000-03-28 2001-10-04 Paradigm Genetics, Inc. Methods, systems and computer program products for dynamic scheduling and matrix collecting of data about samples
GB0009750D0 (en) * 2000-04-19 2000-06-07 Erecruitment Limited Method and apparatus for data object and matching,computer readable storage medium,a program for performing the method,
US7203343B2 (en) * 2001-09-21 2007-04-10 Hewlett-Packard Development Company, L.P. System and method for determining likely identity in a biometric database
US20030086617A1 (en) * 2001-10-25 2003-05-08 Jer-Chuan Huang Triangle automatic matching method
US6879718B2 (en) * 2001-11-06 2005-04-12 Microsoft Corp. Efficient method and system for determining parameters in computerized recognition
JP2004192546A (en) * 2002-12-13 2004-07-08 Nippon Telegr & Teleph Corp <Ntt> Information retrieval method, device, program, and recording medium
US7492928B2 (en) * 2003-02-25 2009-02-17 Activcard Ireland Limited Method and apparatus for biometric verification with data packet transmission prioritization
EP1676217B1 (en) * 2003-09-15 2011-07-06 Ab Initio Technology LLC Data profiling
US7415456B2 (en) * 2003-10-30 2008-08-19 Lucent Technologies Inc. Network support for caller identification based on biometric measurement
US20050193016A1 (en) * 2004-02-17 2005-09-01 Nicholas Seet Generation of a media content database by correlating repeating media content in media streams
US7325013B2 (en) * 2004-04-15 2008-01-29 Id3Man, Inc. Database with efficient fuzzy matching
US7302426B2 (en) * 2004-06-29 2007-11-27 Xerox Corporation Expanding a partially-correct list of category elements using an indexed document collection
US7523098B2 (en) * 2004-09-15 2009-04-21 International Business Machines Corporation Systems and methods for efficient data searching, storage and reduction

Similar Documents

Publication Publication Date Title
O’Donnell et al. DNA sequence-based identification of Fusarium: current status and future directions
JP2013502653A5 (en)
JP2010507857A5 (en)
Bebber et al. Herbaria are a major frontier for species discovery
JP5382599B2 (en) Confidential address matching processing system
JP2010522883A5 (en)
JP2013511097A5 (en)
JP2014524090A5 (en)
JP2014503874A5 (en)
JP2011523731A5 (en)
CN109165316A (en) A kind of method for processing video frequency, video index method, device and terminal device
US20150213066A1 (en) System and method for creating data models from complex raw log files
EP2649512A2 (en) Place-based image organization
WO2012030848A3 (en) User list generation and identification
RU2015152415A (en) MULTIMODAL SEARCH RESPONSE
JP2008109290A5 (en)
JP2006215659A5 (en)
Xing et al. LTMap: a web server for assessing the potential liver toxicity by genome‐wide transcriptional expression data
JP4957796B2 (en) Difference calculation program, difference calculation device, and difference calculation method
JP2008109289A5 (en)
US20110219001A1 (en) Emerging topic discovery
JP2013033473A5 (en)
WO2023207451A1 (en) Search result display method and device, and search request processing method and device
CN107908724B (en) Data model matching method, device, equipment and storage medium
JP2021096788A5 (en)