KR100877461B1 - 실시간 데이터 웨어하우징 - Google Patents
실시간 데이터 웨어하우징 Download PDFInfo
- Publication number
- KR100877461B1 KR100877461B1 KR1020077024459A KR20077024459A KR100877461B1 KR 100877461 B1 KR100877461 B1 KR 100877461B1 KR 1020077024459 A KR1020077024459 A KR 1020077024459A KR 20077024459 A KR20077024459 A KR 20077024459A KR 100877461 B1 KR100877461 B1 KR 100877461B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- record
- relationship
- database
- records
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000012545 processing Methods 0.000 claims abstract description 19
- 238000000926 separation method Methods 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 15
- 230000002085 persistent effect Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013479 data entry Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000011840 criminal investigation Methods 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 238000010926 purge Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 238000001612 separation test Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/40—Data acquisition and logging
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
데이터베이스(16)으로 들어가는 데이터와 데이터베이스 내의 데이터를 처리하고, 처리된 데이터를 검색하기 위한 방법 및 시스템이 개싱되었다. 데이터는 복수의 실체(18)를 포함한다. 이러한 방법 및 시스템은, (a) 데이터베이스(16)으로 들어가는 데이터와 데이터베이스 내의 데이터를 처리하는 단계와, (b) 데이터베이스(16)에 저장하기 전에 수신된 데이터(20)를 강화하는 단계와, (c) 데이터 손실이 없이 남아 있는 수신 데이터(20) 내의 기록 사이의 관계에 기초하여 기록을 결정 및 매칭하는 단계와, (d) 사용자 정의 경보 규칙 및 관계에 기초한 경보를 인에이블시키는 단계와, (e) 기록을 매칭하기 위해 사용된 식별자가 이후에 실체를 통해 공통이고 일반적으로 한 실체의 특유한 것이 아니라고 결정되었을 때, 부가적인 매칭을 자동으로 중단하고, 이전의 매칭을 분리시키는 단계와, (f) 데이터베이스(16) 내에 저장된 처리된 데이터를 검색하기 위하여 데이터 조회(46)를 수신하는 단계와, (g) 조회(46)를 처리하기 위하여 동일한 알고리즘을 사용하는 단계와, (h) 처리된 데이터를 동일한 알고리즘을 사용하는 다른 데이터베이스에 전달하는 단계를 포함한다.
Description
본 발명은 2001년 12월 28일 출원된 미국 가특허출원 제60/344,067호의 이익을 청구한다.
본 발명은 일반적으로 데이터 웨어하우스(data warehouse) 내에서 데이터를 처리하고 검색하기 위한 방법, 프로그램 및 시스템에 관한 것으로, 보다 상세하게는, 데이터 웨어하우스 내의 데이터 및 들어가는 데이터의 처리를 위한 방법, 프로그램 및 시스템, 그리고 데이터 웨어하우스 내에서 데이터의 조회, 및 데이터 웨어하우스 내의 데이터의 분석에 관한 것이다.
데이터 웨어하우스는 기록을 저장하고, 일반적으로 다수의 소스로부터의 조회에 응답하도록 설계된 컴퓨터에 기초한 데이터베이스이다. 이러한 기록은 개인(individuals), 단체(organization) 및 재산(property)과 같은 실체와 교신한다. 각 기록은 예컨대, 이름, 주소 및 개인에 대한 계정 정보와 같은 실체의 식별자를 포함한다.
불행히도, 현재의 데이터 웨어하우스 시스템의 효과성은, 일정한 데이터의 품질, 보전 및 성능 문제를 생성, 영속 및/또는 증가시키는 소정의 한계점 때문에, 줄어들었다. 이러한 한계점은 또한 상기 시스템을 실행하고, 정정하며 보전하기 위해 필요한 위험, 경비 및 시간을 증가시킨다.
이러한 문제점 및 한계점은 한정하는 것은 아니지만, 다음 사항을 포함한다. 즉, (a) 다양한 소스의 데이터로부터 유출되는 다르거나 또는 충돌을 일으키는 포맷에 관련된 과제, (b) 수신할 때 정보의 분실에 기초한 불완전한 데이터, (c) (간혹 사소한) 불일치 또는 틀린 철자로 인해 동일한 실체를 반영하는 입력된 다수의 기록, d) 다수의 기록이 동일한 실체를 반영하는 지 및/또는 다수의 기록 사이에 어떤 관계가 존재하는 지를 식별하는데 불충분한 성능, (e) 동일한 실체를 반영하는 두 개의 기록이 병합되거나 하나의 데이터가 버려질 때 손실된 데이터, (f) 병합된 데이터가 두 개의 다른 실체를 반영하는 것으로 이후에 결정되었을 때 사후에 기록을 분리하는데 있어서 불충분한 성능, (g) 사용자 정의 경보 규칙에 기초한 경보를 실시간으로 발행하는데 있어서 불충분한 성능, (h) 수신된 데이터를 처리하기 위해 사용된 알고리즘 또는 변환 처리와 다른 알고리즘 또는 변환 처리를 사용하는 조회로부터의 부적절한 결과, 및 (i) 일정한 시간 기간 동안과 같이 미리 정해진 표준에 따른 영속적인 조회를 유지하는데 있어서의 무능력.
예컨대, 개인의 식별자가 수신되어 데이터베이스에 저장될 때: (a) 하나의 소스로부터의 기록은 콤마로 구별된 포맷으로 사용될 수 있고, 반면에 다른 소스로부터의 기록은 다른 데이터 포맷으로 수신될 수 있다; (b) 전화번호, 주소 또는 일부 다른 식별 정보와 같은 다양한 기록으로부터의 데이터는 손실될 수 있다; 또는 (c) 왜냐하면 하나의 기록이 현재의 이름에 대응하고, 다른 기록은 처녀 때의 성에 대응하여, 동일한 개인을 반영하는 두 개의 기록이 모르고 수신될 수 있다. 후자의 경우, 시스템은 두 개의 기록이 병합되거나, 또는 (아마도 덜 신뢰성 있는 소스로부터 유출된) 하나의 기록이 버려지도록 결정할 수 있다. 그러나, 병합 처리에 있어서, 현재의 시스템은 전형적으로 데이터를 버리는데, 이는 기록이 두 개의 별도의 실체를 반영한다고 결정된다면, 두 개의 기록을 이 후에 분리시키는 능력을 부정하는 것이다.
또한, 식별자가 수신되어 데이터베이스에 저장될 때, 컴퓨터는 데이터를 데이터베이스에 로딩하기에 앞서 변환 및 강화 처리를 수행할 수 있다. 그러나, 현재 시스템의 조회 도구는 수신된 데이터를 수신하고 처리하는데 사용되는 변환 및 강화 처리가 있다 하더라도 거의 사용하지 않아, 이러한 조회의 임의의 결과가 모순되게, 따라서 부적절하고, 불충분하며 잠재적으로 잘못되게 한다.
마찬가지로, 현재의 데이터 웨어하우징 시스템은, 실체 사이의 관계를 완전히 식별하거나, 또는 이러한 실체가 동일한 실체를 반영하는 지를 실시간으로 결정하는데 필요한 도구를 가지고 있지 않다. 예컨대, 한 개인이 제 2의 개인과 동일한 주소를 가질 수 있고, 제 2의 개인은 제 3의 개인과 동일한 전화번호를 가질 수 있다. 이러한 경우, 제 1 개인이 제 3의 개인과 일정한 관계를 갖는 가능성을 특히 실시간으로 결정하는 것이 유리할 수 있다.
더욱이, 현재의 데이터 웨어하우징 시스템은 실체 사이의 부적절하거나 충돌이 있는 관계를 식별하고, 사용자 정의 경보 규칙에 기초하여 실시간으로 경보를 제공하는데 있어서 제한된 능력을 갖는다. 이러한 제한된 능력은, 제한 없이 상술한 관계를 효율적으로 식별하는데 있어서의 무능력을 포함하는 몇 가지 요인에 기초한다.
더욱이, 현재의 데이터 웨어하우징 시스템은 미리 정해진 기간에 걸쳐 먼저 기록을 변환 및 강화시킬 수 없고, 그 후 영속적인 조회를 유지할 수 없다. 영속적인 조회는, 제한 없이 사람의 이름이 범죄 수사에서 식별되는 경우를 포함하여 다양한 경우에 유익하다. 그 사람과 어울리는 임의의 매칭(matches)을 식별하기 위한 조회는 초기에는 아무 결과도 도출하지 못할 수 있고, 현재의 시스템 내에서 조회된 데이터는 필연적으로 버려진다. 그러나, 조회를 수신된 데이터와 동일한 방식으로 로딩하는 것이 유익할 수 있는데, 여기에서 조회된 데이터는 다른 수신 데이터 또는 조회에 대해 부합시키고, 결과를 위한 양호한 기초를 제공하기 위하여 사용할 수 있다.
그것만으로, 현재의 데이터 웨어하우스 시스템의 임의의 또는 모든 문제 및 한계점(여기에서 식별되었든 안되었든)은 데이터 웨어하우스의 정확성, 신뢰성 및 적시성을 떨어뜨리고, 성능을 극적으로 방해한다. 실제, 이러한 문제점을 가지고 사용하는 것은 이러한 결과에 기초한 부적절한 결과 및 부정확한 결정을 야기할 수 있다.
본 발명은 이들 및 다른 문제점을 다루기 위하여 제공된다.
본 발명의 목적은 데이터 웨어하우스 내의 데이터 및 들어가는 데이터의 처리를 위한 방법, 프로그램 및 시스템을 제공하기 위한 것이다. 본 발명은 바람직하게 (a) 복수의 실체를 위한 데이터를 수신하는 단계, (b) 수신된 데이터를 처리하기 위해 알고리즘을 사용하는 단계, (c) 처리된 데이터를 데이터 베이스 내에 저장하는 단계, (d) 데이터 베이스 내에 저장된 데이터를 검색하기 위해 데이터 조회를 수신하는 단계, 및 (e) 조회를 처리하기 위하여 동일한 알고리즘을 사용하는 단계를 포함한다.
데이터는 하나 이상의 실체를 나타내는 하나 이상의 식별자를 갖는 하나 이상의 기록을 포함한다. 실체는 데이터를 식별함으로써 표현될 수 있는 개인, 재산, 단체, 단백질 또는 다른 것이 될 수 있다.
알고리즘은 표준화된 메시지 포맷으로 변환된 수신 데이터를 포함하고, 소스 시스템과 같은 식별자의 속성, 식별자, 조회 시스템 및/또는 사용자를 위한 소스 시스템의 고유한 값을 보유한다.
알고리즘 처리는 데이터 베이스 내에서 저장 또는 조회에 앞서 데이터를 분석하는 것을 포함하는데, 여기에서 이러한 분석 단계는, (a) 하나 이상의 식별자를 데이터베이스, 목록 또는 다른 전자 포맷에서의 사용자 정의 표준 또는 하나 이상의 데이터 세트와 비교하는 단계, (b) 사용자 정의 표준에 따라 식별자를 포맷팅하는 단계, (c) 수신된 데이터를 임의의 부가적인 식별자로 보완하기 위한 부가적인 식별자에 대한 다른 데이터베이스(제 1 데이터베이스와 동일한 알고리즘을 가질 수 있고 단계적인 방법으로 검색을 지속할 수 있는) 또는 목록 내에서 하나 이상의 데이터 세트를 조회함으로써 저장 또는 조회에 앞서 데이터를 강화하는 단계, (d) 식별자용 해시키(hash keys)를 생성하는 단계와, (d) 처리된 조회를 지정된 시간의 기간과 같은 사용자 정의 표준에 기초하여 저장하는 단계를 포함한다.
방법, 프로그램 및 시스템은, (a) 데이터를 처리하고 기록을 매칭하기 위하여 알고리즘을 사용하는 단계와 (b) 매칭된 기록을 데이터베이스 내에 저장하는 단계를 포함하는 것을 고려할 수 있는데, 여기에서 알고리즘 처리는, (i) 수신된 데이터 내의 식별자와 유사한 식별자를 포함하는 한 그룹의 기록을 데이터베이스로부터 검색하고, (ii) 수신된 데이터에 대한 매칭을 위하여 검색된 그룹의 기록을 분석하고, (iii) 동일한 실체를 반영하기 위하여 결정된 검색된 기록에 대하여 수신된 데이터를 매칭하고, (iv) 임의의 새로운 식별자가 임의의 매칭된 기록에 부가되었는 지의 여부를 분석하고, (v) 임의의 매칭된 기록에 대해 매칭하기 위하여 검색된 그룹의 기록의 다른 기록을 재검색할 수 있다. 부가적으로, 알고리즘은 (a) 매칭된 기록 내에서 식별자와 유사한 식별자를 포함하는 부가적인 그룹의 기록을 데이터베이스로부터 검색하는 것과, (b) 기록을 검색하는 단계, 매칭을 위한 분석 단계, 동일한 실체 기록을 매칭하는 단계, 새로운 식별자를 분석하는 단계, 및 부가적인 매칭이 더 이상 발견되지 않을 때까지 검색된 기록을 재검색하는 단계를 반복하는 것과, (c) 영속하는 키를 기록에 할당하는 것을 포함할 수 있다. 이러한 처리는 일괄적으로 또는 실시간으로 수행될 수 있다.
방법, 프로그램 및 시스템이, 특정 식별자가 실체를 통해 공통이거나 또는 하나의 실체에 대해 특유한 지를 결정하는 것과, 기록을 매칭하기 위하여 사용된 특정 식별자가 실체를 통해 공통이고 한 실체에 대해 특유하지 않다고 이후에 결정되면, 이전에 매칭된 기록을 분리하는 것을 포함하는 것을 추가로 고려할 수 있다. 이러한 결정 단계와 분리 단계는 실시간으로 또는 일괄로 수행될 수 있다. 결정 단계와 분리 단계는, 실체를 통해 공통이고 한 실체에 대해 일반적으로 특유하지 않다고 결정된 식별자를 기초하여 임의의 부가적인 매칭을 중단시키는 단계와, 임의의 분리된 기록을 재처리하는 단계를 포함할 수 있다.
실체 사이의 관계의 존재를 결정하기 위하여 수신된 데이터는 이전에 저장된 적어도 하나의 다른 기록과 비교되는 것과, 관계가 존재하는 매 두 개의 실체에 대해 관계 기록이 생성되는 것을 추가로 고려할 수 있다. 관계 기록은 두 실체 사이의 관계의 가능성 또는 두 실체가 동일할 가능성을 나타내는 신뢰 척도(confidence indicator)를 포함할 수 있다. 관계 기록은 수신된 데이터에 포함되었거나 할당된 실체의 역할을 참조할 수도 있다. 이전에 알지 못한 임의의 관련 기록의 존재를 결정하기 위하여, 사용자 정의 표준에 기초하여 관계 기록이 분석될 수 있다. 관계 기록은 제 1 분리도를 반영할 수 있는데, 이러한 제 1 분리도는 분리도 시험의 최대 수 또는 관계 및/또는 유사 신뢰 척도의 최소 레벨과 같은 미리 정해진 표준에 부합하는 기록들만을 포함하도록 분석되고 네비게이션될 수 있다. 사용자 정의 경보 규칙에 기초하여 관련 기록의 그룹을 식별하는 하나의 경보가 발령될 수 있다. 경보는 전자 우편 메시지, 전화 호출, 개인휴대용 단말기(PDA : personal digial assistant), 또는 무선호출기 메시지와 같은 다양한 전자 통신 수단을 통하여 전달될 수 있다.
방법이 (a) 관계 기록을 하나 이상의 데이터베이스에 복제하는 단계, (b) 수신된 데이터를 작업 부하 기준(criteria)에 기초한 분석을 위하여 하나 이상의 추가 데이터베이스에 분산시키는 단계, 및 (c) 추가적인 데이터베이스로부터 임의의 경고를 발하는 단계를 포함하는 것도 추가로 고려할 수 있다.
방법 및 시스템이 저장된 데이터를 제 1 데이터베이스와 동일한 알고리즘을 사용하는 다른 데이터베이스에 전달하는 것을 포함하는 것도 추가로 고려할 수 있다. 처리 및 전달 단계는, 실시간으로 또는 일괄로 수행될 수 있다.
본 발명의 이들 및 다른 양상 및 속성 다음의 도면과 첨부된 설명서를 참조하여 논의될 것이다.
종래의 소프트웨어 코드는 상술한 방법, 프로그램, 및 시스템의 기능적인 양상을 실행하는데 사용될 수 있다. 이러한 코드는 단일 컴퓨터 또는 인터넷과 같은 컴퓨터의 분산 네트워크에 의한 사용을 위하여 임의의 컴퓨터 판독 가능한 매체에 위치할 수 있다.
본 발명이 많은 다른 형태의 실시예를 구현 가능하지만, 본 설명이 본 발명 원리의 예시로서 간주되어야 하고, 본 발명을 설명된 특정 실시예에 국한하려 하지 않음을 이해하면서, 본 발명의 특정 실시예가 도면에 도시되고 본 명세서에서 상세 하게 기술된다.
데이터베이스 내의 데이터 및 들어가는 데이터를 처리하고, 처리 데이터를 검색하기 위한 데이터 처리 시스템(10)이 도 1 내지 도 4b에 도시되었다. 시스템(10)은 적어도 하나의 프로세서(14)와 메모리(16)를 구비하는 종래의 컴퓨터(12)를 포함한다. 메모리(16)는 시스템(10)을 동작시키기 위한 실행가능한 소프트웨어의 저장장치, 또한 데이터베이스 내의 데이터의 저장장치와 랜덤 액세스 메모리로 사용된다. 그러나, 소프트웨어는 CD, DVD 또는 플로피디스크와 같은 컴퓨터 판독 가능한 임의의 다른 기록매체에 저장 또는 제공될 수 있다. 컴퓨터(12)는 복수의 소스(181 내지 18n)로부터의 입력을 수신할 수 있다.
데이터는 하나 이상의 실체를 나타내는 하나 이상의 식별자를 구비하는 하나 이상의 기록을 포함한다. 실체는, 개인, 단체, 재산, 단백질, 화학 또는 유기 화합물, 생체인식 또는 원자 구조, 또는 데이터를 식별함으로써 표현될 수 있는 다른 것이 될 수 있다. 개인 형태의 실체에 대한 식별자는 개인의 이름, 주소, 전화번호, 신용카드 번호, 사회 보장 번호, 고용 정보, 항공사 상용고객 또는 다른 충성도 프로그램, 또는 계정 정보를 포함할 수 있다. 일반적으로, 특유 식별자는 한 개인 실체를 위한 사회 보장 번호와 같은 특정 실체에 특유한 것이다.
시스템(10)은 복수의 소스(181 내지 18n)로부터 데이터를 수신하고, 수신된 데이터(20)를 처리하기 위해 알고리즘(22)을 사용한다. 알고리즘은 메모리(16)에 저장되고, 프로세서(14)에 의해 처리되거나 수행된다.
제한 없이 수신된 데이터의 속성(예, 소스 시스템 인증)을 포함하는 수신된 데이터(20)는 많은 데이터 포맷으로 수신될 것이다. 알고리즘(22)에 의해 처리되기 전에, 수신된 데이터(20)는 범용 메시지 포맷(Universal Message Format)과 같은 표준화된 메시지 포맷(24)으로 변환된다.
이후, 도 3a 내지 도 3c에 도시된 바와 같이, 알고리즘(22)은 (a) 제한 없이 (i) 이름 표준화(30)(예, 루트 이름 목록과 비교), (ii) 주소 예방조치(32)(예, 우편 배달 번호와 비교), (iii) 필드 시험 또는 변환(34)(예, 남성/여성을 확인하기 위해 성 필드를 비교 또는 "Male"을 "M"으로 변환, 등), (iv) 사용자 정의 포맷팅(36)(예, 모든 사회 보장 번호를 999-99-9999 포맷으로 포맷팅)을 포함하는 몇 가지 기능을 수행하기 위하여 수신된 데이터(26)를 사용자 정의 표준 또는 규칙과 비교하고, (b) {수신된 데이터(20)로서 제공될 수 있는} 부가적인 정보를 검색하기 위하여 시스템(10)으로 하여금 {제 1 데이터베이스와 동일한 알고리즘을 포함할 수 있고, 따라서 시스템(10)으로 하여금 단계적인 방법으로 부가적인 데이터베이스를 액세스하게 하는} 하나 이상의 데이터베이스(40)를 액세스하게 함으로써 데이터(38)를 강화하고, (c) 분석된 데이터(44)의 해시키를 구축함으로써, 표준화된 데이터(26)를 수신하고, 데이터베이스에 저장 또는 조회에 앞서 수신된 데이터(26)를 분석한다(28). 변경되거나 강화된 임의의 새로운 데이터는 원래 데이터의 보전을 유지하기 위하여 새로 생성된 필드에 저장될 수 있다. 예컨대, "Bobby Smith"라는 이름이 표준화된 포맷(26)으로 수신되면, 이름 "Bobby"는 루트 이름 목록(30)과 비교되고, 이름 "Robert"로 표준화되어, 표준 이름을 위해 새로 생성된 필드에 저장 된다. 부가적으로, Bobby Smith에 대한 이름과 주소가 수신되면(26), 시스템(10)은 Bobby Smith의 전화번호를 획득하기 위하여 종래의 인터넷에 기초한 인명 검색 데이터베이스(40)를 액세스할 수 있고, 상기 전화번호는 사용자 정의 표준(36)에 기초한 표준 방식으로 포맷될 수 있다. 더욱이, 주소 필드는 주소 목록(32)과 비교될 수 있어서, 표준화된 주소의 마지막에 추가되는 문자 "Street"(가)를 초래한다. 이후 강화된 데이터에 기초하여 해시키가 생성되어(44), 새로 생성된 필드에 저장된다.
시스템(10)은 복수의 소스(181 내지 18n)로부터 조회를 수신하고(46), 수신된 조회(46)를 분석 및 처리하기 위하여 동일한 알고리즘(22)을 사용한다. 예컨대, "Bobby Smith"에 대한 조회가 수신되면(46), 수신된 이름 "Bobby"를 이름 "Robert"로 표준화한 동일한 알고리즘(22)은 조회된 이름 "Bobby"를 조회된 이름 "Robert"로 표준화할 것이다. 실제, 시스템(10)은 수신된 데이터(20)와 동일하게 수신된 조회(46) 로드시키고 저장하여, 조회 시스템 및 사용자의 온전한 속성을 유지시킨다. 그것만으로, 시스템(10)이 수신된 조회(46)를 처리하기 때문에, 알고리즘(22)은 손실 정보를 찾기 위하여 공공의 기록 데이터베이스와 같은 다른 데이터베이스(40)를 검색할 수 있다. 조회 결과(94)는 정확한 매칭보다 범위가 더 넓을 수 있고, 관계의 매칭을 포함할 수 있다. 예컨대, 조회가 "Bobby Smith"에 대한 것이라면, 조회 결과(94)는 Bobby Smith의 신용카드를 사용해왔거나 Bobby Smith의 주소에서 살아온 사람의 기록을 포함할 수 있다.
알고리즘(22)은 또한 임의의 수신 데이터(26)를 수신할 때 (a) 이러한 수신 데이터에 대응하 실체를 매칭하는 데이터베이스 내의 기존 기록이 있는 지의 여부를 결정하고, (b) 만약 있다면 수신된 데이터를 기존 기록에 대해 매칭하기 위한 기능을 수행한다. 예컨대, 알고리즘은 가능한 후보를 위하여 데이터베이스로부터 기록의 그룹(48)(수신된 데이터 내의 식별자와 유사한 식별자를 포함)을 검색하고, 특유한 식별자(52)에 기초하여 검색된 데이터에 대응하는 기존 저장된 기록을 식별하는 매칭용 검색된 기록 그룹(50)을 일반적으로 분석한다. 매칭이 식별되면(54), 알고리즘은 매칭된 기록이 새롭거나 이전에 알지 못한 임의의 식별자를 포함하는 지를 분석한다(56). 새롭거나 이전에 알지 못한 임의의 식별자(56)가 존재한다면, 알고리즘(22)은 새롭거나 이전에 알지 못한 식별자를 분석하고(58), 매칭된 기록 내의 새롭거나 이전에 알지 못한 식별자에 기초하여 후보 목록/관계 기록(70)을 추가하거나 갱신하고, 임의의 추가 매칭(50)이 존재하는 지를 결정한다. 이러한 처리는 더 이상의 추가 매칭이 인식되지 않을 때까지 반복된다. 그 후 매칭 처리는 모든 매칭된 기록에 동일한 영속 키를 할당한다(60). 더욱이, 임의의 기록에 대해 매칭이 이루어지지 않으면, 매칭되지 않은 기록에는 자신의 영속 키가 할당된다(62). 기록은 데이터의 전체 속성을 보유하고, 매칭 처리는 병합, 정화 또는 제거 기능을 통해 어떠한 데이터도 잃지 않는다.
예컨대, 만약 기록 #1이 개인의 이름, 전화번호 및 주소를 갖고, 기록 #2는 동일한 이름과 신용카드 번호를 갖는다고 가정하자. 이들이 동일한 개인인지를 알 수 없으므로, 기록은 별도로 유지되어야 한다. 그 후, 개인의 이름(기록#1과 동일 ), 주소(기록#1과 동일), 전화번호(기록#1과 동일) 및 신용카드 번호를 포함하는, 기록 #3을 위한 데이터가 수신된다. #1 및 #3에 대한 이름, 전화번호 및 주소가 일치하므로, 시스템(10)은 #1과 #3이 동일한 개인을 기술하고 있다고 결정할 수 있어서, 알고리즘은 #3 데이터에 대해 기록 #1을 매칭한다. 그 후, 시스템(10)은 알고리즘을 다시 실행시켜, 매칭된 기록 #1을, 매칭된 기록과 유사한 식별자를 포함하는, 후보 목록의 다른 기록 또는 부가적인 기록과 비교한다. 매칭된 기록 #1의 이름과 신용카드 번호가 기록 #2의 이름과 신용카드 번호와 일치하므로, 이들 두 기록 또한 매칭된다. 이러한 매칭 기록은 그 후, 더 이상의 매칭이 획득될 수 없을 때까지 매칭(54)을 찾으면서, 후보 목록 또는 검색된 추가 기록에 대해 다시 실행된다.
이따금, 시스템(10)은 두 개의 기록이 부정확하게 매칭되었다고 결정할 수 있다. 예컨대, 사회 보장 번호는 일반적으로 개인에 대해 특유한 식별자로 간주되고, 따라서 기록들은 간혹 동일한 사회 보장 번호에 기초하여 매칭된다. 그러나, 이러한 번호 일정한 환경 하에서 이 후에 한 실체의 일반적으로 특유한 것이 아닌 실체를 통해 공통인 것으로 결정되는 것이 가능하다. 예컨대, 데이터 입력 동작이 요구되는 필드로서 사회 보장 번호를 위한 기록 필드를 갖지만, 개인의 사회 보장 번호를 알지 못하는 데이터 입력 조작자가 각 개인을 위해 단순히 번호 "123-45-6789"를 입력하는 것을 생각해 볼 수 있다.
이러한 경우, 사회 보장 번호는 이러한 개인 형태의 실체를 통해 공통이 되고, 일반적으로 더 이상 이들 개인에 대한 특유한 식별자가 아니다.
따라서, (a) 알려진 공통 식별자는 공통의 식별자 목록에 부가되고, 장래의 모든 처리는 후보를 위해 기록을 검색하거나 알려진 공통 식별자에 기초하여 관계 기록을 생성하거나(70) 하지 않을 것이어서, 장래의 임의의 매칭을 중단시키며(64), (b) 잘못된 사회 보장 번호에 기초하여 매칭된 임의의 기록이 매칭에 앞선 데이터를 반영하기 위하여 분할될 필요가 있어서, 미리 데이터의 손실을 야기하지 않는다. 후자의 목적을 달성하기 위하여, 시스템(10)은 부정확한 가정에 기초하여 발생된(66) 임의의 매칭을 데이터의 완전한 속성을 따라, 데이터의 어떠한 손실도 없이 부정확한 가정에 앞선 시점으로 분리시킨다. 따라서, 만약 "Bobby Smith"에 대한 기록 #1("Robert Smith"로 표준화되었던)이 "Robert Smith"에 대한 기록#2에 대해 매칭되었고, 이후 이들은 두 개의 다른 개인이라고 결정되어, 이들이 원래의 기록 #1 및 #2로 분리될 필요가 있다면, 알고리즘은 기록 #1의 표준화된 "Robert Smith"가 "Bobby"로 알려졌는 지를 식별한다. 더욱이, 결정단계와 분리하는 단계는 실시간으로 또는 일괄로 수행될 수 있다. 더욱이, 별도의 기록은 시스템 내에서 처리될 수신된 새로운 데이터로서 재 공급될 수 있다.
더 이상 명확하지 않은 관계의 평가(68)가 필요할 때가 있다. 예컨대, 개인 #1 및 #2가 단체 #3과 각각 관계를 가질 수 있다. 따라서 개인 #1과 #2 사이의 관계가 존재할 가능성이 있고, 아마도 그러할 것이다. 관계는 몇가지 분리도로 확장될 수 있다. 따라서, 시스템(10)은 수신된 모든 데이터를 저장된 데이터 내의 모든 기록과 비교하고, 각 실체 사이의 일정한 관계가 있는 모든 기록 쌍에 대해 관계 기록(70)을 생성한다. 관계 기록(70)은 관계 형태(예, 아버지, 모의 친구), 신뢰 척도(두 실체의 관계 강도를 나타내는 점수)(72) 및 할당된 영속 키(60 또는 62)를 포함할 수 있다. 예컨대 신뢰 척도(72)는 관계 점수와 유사성 점수를 포함할 수 있다. 관계 점수는 개인 #1과 개인 #2 사이에 관계가 있는 유사성을 나타내는 1과 10 사이의 숫자와 같은 척도일 수 있다. 유사성 점수는 개인 #1이 개인 #2와 동일한 사람인 것에 대한 1과 10 사이의 숫자와 같은 척도이다. 신뢰 척도(72)는 상술한 매칭 처리 도중에 식별될 수 있다.
시스템(10)은 또한, 두 실체 사이의 부적절한 관계와 같은, 또는 미리 결정된 값보다 더 큰 신뢰 척도를 갖거나 및/또는 분리도의 미리 정해진 수보다 적은 관계 기록을 갖는 관계 기록에 기초한 활동의 일정한 패턴과 같은, 사용자 정의 경보 규칙(74)의 표준에 일치하는 조건의 존재를 결정하기 위하여, 수신된 데이터(20)와 조회(46)를 분석한다. 예컨대, 시스템(10)은 수신된 임의의 데이터 또는 임의의 조회가 부정 신용카드 번호 목록 중에 있는 신용카드 번호를 포함하는 지를 결정하기 위하여 부정 신용카드 번호 목록을 포함할 수 있다. 부가적으로, 사용자 정의 경보 규칙(74)은 수신된 데이터 및 조회가 보고될 수 있게 할 수 있다. 예컨대, 새로운 판매자의 데이터를 입력할 때, 새로운 판매자가 현재의 고용인과 동일한 주소를 갖는 다고 결정되어, 아마도 사용자가 조사하기를 희망할 판매자와 사용자 사이의 관계를 나타내었다면, 경보 규칙이 존재할 수 있다. 사용자 정의 경보 규칙을 트리거할 상황의 결정 시, 시스템(10)은 전자우편(e-mail)을 통한 메시지와 같은 다양한 매체를 통해 전달되거나, 또는 문자-숫자 무선호출기, PDA 또는 전화와 같은 휴대형 통신 디바이스에 전달될 수 있는 경보(74)를 발할 수 있다.
예컨대, 최대 6의 분리도(78)에 대한 7보다 큰 관계 신뢰 척도의 유사성을 갖는 모든 기록에 대한 사용자 정의 경보 규칙에 기초하여, 시스템(10)은 (a) 개인 #1에서 시작하고, (b) 7보다 큰 신뢰 척도를 갖는 #1에 관련된 모든 다른 개인(80)을 찾고(76), (c) 제 1 분리도의 개인(80) 모두를 분석하여, 7보다 큰 신뢰 척도를 갖는 제 1 분리도의 개인(80)에 관련된 모든 개인(82)을 결정하고(84), (d) 6의 분리도 파라미터에 일치할 때까지 프로세서를 반복한다(78). 시스템은 해당 개인 또는 추가 동작을 가능케 하는 별도의 시스템에 경보(74)(사용자 정의 표준에 기초한 모든 최종 기록을 포함할 수 있는)를 전자적으로 전달할 수 있다.
더욱이, 관계 기록(70)은 수가지 데이터베이스에 대해 복제될 수 있다. 수신 데이터(20)의 수신 시, 시스템은 다른 데이터베이스 각각의 작업 부하의 특성을 체계적으로 평가하고, 저장된 분석 기록(68)을 가장 효율적으로 분석하기 위하여 매칭/관련/분석된 기록을 데이터베이스에 분산시킬 수 있다. 임의의 경보(74)는 다른 데이터베이스로부터 유출되는 임의의 결과로부터 발령될 수 있다.
최종적으로, 처리된 데이터는 동일한 알고리즘(92)을 사용할 수 있는 단계적인 웨어하우스 출판 목록(86)에 기초한 부가적인 데이터베이스에 실시간 또는 일괄 처리로 전달될 수 있다. 이러한 방식으로, 전달된 데이터(88)는, 이러한 데이터의 관계, 매칭 또는 처리를 식별하기 위하여, 부가적인 데이터베이스 및 임의의 후속하는 데이터베이스 내의 데이터(다른 데이터를 포함하는)에 대해 매칭하기 위하여 사용될 수 있다. 예컨대, 로컬 데이터베이스 내의 신뢰 척도에 기초하여 매칭된 기록은 동일한 알고리즘(92)을 사용하는 데이터에 대해 비교되어 매칭될 영역 데이터 베이스에 전달될 수 있다(88). 이 후, 영역 데이터베이스로부터 나오는 처리된 데이터는 국가 기관에 전달될 수 있다(88). 각 단계에서 처리된 데이터 특히 실시간으로 결합함으로써, 단체 또는 시스템 사용자는 추가 동작을 촉구하는 부적절하거나 충돌이 있는 데이터를 결정할 수 있다.
상술한 설명으로부터, 본 발명의 사상과 범주로부터 벗어남이 없이 다양한 변형 및 변경이 이루어질 수 있음을 알 수 있을 것이다. 본 명세서에서 설명된 특정한 장치에 대해서는 어떠한 제한도 의도되거나 암시되어서는 안됨을 이해해야 한다. 물론, 청구범위의 범주에 드는 이러한 모든 변형은 청구범위로서 보호하려 한다.
도 1은 본 발명에 따른 시스템의 블록도.
도 2는 도 1의 시스템 블록 내에서 데이터 처리를 위한 흐름도.
도 3a 내지 도 3c는 도 2 내의 처리 알고리즘 블록의 흐름도.
도 4a 내지 도 4b는 도 3 내의 저장된 분석 기록의 추정 블록의 흐름도.
Claims (10)
- 데이터베이스 내에서 데이터를 처리하는 방법으로서,적어도 하나의 식별자를 구비하는 적어도 하나의 기록을 포함하는 데이터를 수신하는 단계로서, 각 기록은 복수의 실체 중 적어도 하나를 나타내는 것인, 상기 데이터 수신 단계와,실시간으로 관계의 존재를 결정하기 위하여 상기 수신된 데이터를 데이터베이스 내에 저장된 적어도 하나의 기록과 비교하는 단계와,수신된 데이터의 적어도 일부와의 관계를 실시간으로 반영한다고 결정된, 데이터베이스 내의 저장된 각 기록에 대해 관계 기록을 생성하는 단계와,각 관계 기록을 상기 데이터베이스 내에 저장하는 단계를 포함하는, 데이터베이스 내의 데이터 처리 방법.
- 제 1항에 있어서, 각 관계 기록에 대해 적어도 하나의 신뢰 척도(confidence indicator)를 실시간으로 생성하는 단계를 더 포함하는, 데이터베이스 내의 데이터 처리 방법.
- 제 2항에 있어서, 상기 적어도 하나의 신뢰 척도는,상기 수신된 데이터의 상기 일부와 관계를 갖는 특정 기록에 의해 나타내어지는 실체와,상기 수신된 데이터의 상기 일부에 의해 나타내어지는 실체 사이의 관계의 가능성을 나타내는 것인, 데이터베이스 내의 데이터 처리 방법.
- 제 2항에 있어서, 상기 적어도 하나의 신뢰 척도는,상기 수신된 데이터의 상기 일부와 관계를 갖는 특정 기록에 의해 나타내어지는 실체와,상기 수신된 데이터의 상기 일부에 의해 나타내어지는 실체가 동일할 가능성을 나타내는 것인, 데이터베이스 내의 데이터 처리 방법.
- 제 1항에 있어서, 상기 관계 기록들이 이전에 결정되지 않은 적어도 하나의 관계를 반영하는지를 판정하기 위하여 상기 관계 기록들을 분석하는 단계를 더 포함하는, 데이터베이스 내의 데이터 처리 방법.
- 제 5항에 있어서, 상기 관계 기록들을 분석하는 상기 단계는, 적어도 하나의 레벨의 분리도를 반영하는 관계 기록들을 분석하는 것을 포함하는 것인, 데이터베이스 내의 데이터 처리 방법.
- 제 6항에 있어서, 적어도 하나의 레벨의 분리도를 반영하는 관계 기록들을 분석하는 상기 단계는, 적어도 하나의 사용자 정의 표준(criterion)을 충족시키는 관계 기록을 분석하는 것을 포함하는 것인, 데이터베이스 내의 데이터 처리 방법.
- 제 5항에 있어서, 적어도 하나의 사용자 정의 경보 규칙에 기초한 경보를 발하는 단계를 더 포함하는, 데이터베이스 내의 데이터 처리 방법.
- 제 8항에 있어서, 적어도 하나의 사용자 정의 경보 규칙에 기초한 경보를 발하는 상기 단계는, 상기 경보를 전자 통신 수단을 통하여 전달되도록 하는 것을 포함하는 것인, 데이터베이스 내의 데이터 처리 방법.
- 컴퓨터에서 청구항 제1항 내지 제9항 중 어느 한 항에 기재한 방법의 각 단계를 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US34406701P | 2001-12-28 | 2001-12-28 | |
US60/344,067 | 2001-12-28 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020047010275A Division KR100850255B1 (ko) | 2001-12-28 | 2002-12-27 | 실시간 데이터 웨어하우징 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070112423A KR20070112423A (ko) | 2007-11-23 |
KR100877461B1 true KR100877461B1 (ko) | 2009-01-07 |
Family
ID=23348900
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077024457A KR100856771B1 (ko) | 2001-12-28 | 2002-12-27 | 실시간 데이터 웨어하우징 |
KR1020047010275A KR100850255B1 (ko) | 2001-12-28 | 2002-12-27 | 실시간 데이터 웨어하우징 |
KR1020077024459A KR100877461B1 (ko) | 2001-12-28 | 2002-12-27 | 실시간 데이터 웨어하우징 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077024457A KR100856771B1 (ko) | 2001-12-28 | 2002-12-27 | 실시간 데이터 웨어하우징 |
KR1020047010275A KR100850255B1 (ko) | 2001-12-28 | 2002-12-27 | 실시간 데이터 웨어하우징 |
Country Status (14)
Country | Link |
---|---|
US (2) | US8452787B2 (ko) |
EP (1) | EP1470475A4 (ko) |
JP (3) | JP2006501529A (ko) |
KR (3) | KR100856771B1 (ko) |
CN (2) | CN101324902A (ko) |
AU (1) | AU2002367376A1 (ko) |
BR (1) | BR0215411A (ko) |
CA (1) | CA2471940C (ko) |
EA (1) | EA200400873A1 (ko) |
IL (1) | IL162746A0 (ko) |
MX (1) | MXPA04006390A (ko) |
PL (1) | PL374305A1 (ko) |
WO (1) | WO2003058427A1 (ko) |
ZA (1) | ZA200405141B (ko) |
Families Citing this family (159)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL374305A1 (en) | 2001-12-28 | 2005-10-03 | Jeffrey James Jonas | Real time data warehousing |
US7200619B2 (en) * | 2002-05-31 | 2007-04-03 | International Business Machines Corporation | Method and process to optimize correlation of replicated with extracted data from disparate data sources |
US7900052B2 (en) | 2002-11-06 | 2011-03-01 | International Business Machines Corporation | Confidential data sharing and anonymous entity resolution |
US7346927B2 (en) | 2002-12-12 | 2008-03-18 | Access Business Group International Llc | System and method for storing and accessing secure data |
US8620937B2 (en) * | 2002-12-27 | 2013-12-31 | International Business Machines Corporation | Real time data warehousing |
JP2006512864A (ja) | 2002-12-31 | 2006-04-13 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 許可された匿名の認証 |
US7962757B2 (en) * | 2003-03-24 | 2011-06-14 | International Business Machines Corporation | Secure coordinate identification method, system and program |
US7069308B2 (en) * | 2003-06-16 | 2006-06-27 | Friendster, Inc. | System, method and apparatus for connecting users in an online computer system based on their relationships within social networks |
US7747638B1 (en) * | 2003-11-20 | 2010-06-29 | Yahoo! Inc. | Techniques for selectively performing searches against data and providing search results |
AU2005204147A1 (en) * | 2003-12-31 | 2005-07-21 | Thomson Reuters Global Resources | Systems, methods, interfaces and software for automated collection and integration of entity data into online databases and professional directories |
US8572221B2 (en) | 2004-05-26 | 2013-10-29 | Facebook, Inc. | System and method for managing an online social network |
US8010458B2 (en) * | 2004-05-26 | 2011-08-30 | Facebook, Inc. | System and method for managing information flow between members of an online social network |
US10373173B2 (en) * | 2004-06-14 | 2019-08-06 | Facebook, Inc. | Online content delivery based on information from social networks |
US7478078B2 (en) * | 2004-06-14 | 2009-01-13 | Friendster, Inc. | Method for sharing relationship information stored in a social network database with third party databases |
US7788260B2 (en) | 2004-06-14 | 2010-08-31 | Facebook, Inc. | Ranking search results based on the frequency of clicks on the search results by members of a social network who are within a predetermined degree of separation |
US8161184B2 (en) * | 2004-06-25 | 2012-04-17 | Apple Inc. | Method and apparatus for facilitating long-lived DNS queries |
US8302164B2 (en) | 2004-07-22 | 2012-10-30 | Facebook, Inc. | Authorization and authentication based on an individual's social network |
US7606687B2 (en) | 2004-09-14 | 2009-10-20 | Friendster, Inc. | Proximity search methods using tiles to represent geographical zones |
US20060085373A1 (en) * | 2004-09-30 | 2006-04-20 | Dhillion Jasjit S | Method and apparatus for creating relationships over a network |
US7451161B2 (en) | 2005-04-28 | 2008-11-11 | Friendster, Inc. | Compatibility scoring of users in a social network |
US9792351B2 (en) * | 2005-06-10 | 2017-10-17 | International Business Machines Corporation | Tolerant and extensible discovery of relationships in data using structural information and data analysis |
US20080232558A1 (en) * | 2005-09-09 | 2008-09-25 | Robert Howe Pinckney | Dynamic Voice File Creation and Organization for Leaving Messages in the Event of a Catastrophe |
CN100396002C (zh) * | 2005-11-23 | 2008-06-18 | 华为技术有限公司 | 一种利用关联查询进行鉴权的系统及其方法 |
US8204831B2 (en) | 2006-11-13 | 2012-06-19 | International Business Machines Corporation | Post-anonymous fuzzy comparisons without the use of pre-anonymization variants |
US10452763B2 (en) * | 2007-03-08 | 2019-10-22 | Oath Inc. | Autocomplete for integrating diverse methods of electronic communication |
US9372909B2 (en) | 2007-05-15 | 2016-06-21 | Paypal, Inc. | Defining a set of data across mutiple databases using variables and functions |
US8156158B2 (en) * | 2007-07-18 | 2012-04-10 | Famillion Ltd. | Method and system for use of a database of personal data records |
DE102007057248A1 (de) * | 2007-11-16 | 2009-05-20 | T-Mobile International Ag | Verbindungsschicht für Datenbanken |
US10733223B2 (en) * | 2008-01-08 | 2020-08-04 | International Business Machines Corporation | Term-driven records file plan and thesaurus design |
CN101277272B (zh) * | 2008-05-16 | 2010-12-15 | 北京航空航天大学 | 一种海量广播数据入库的实现方法 |
JP5389186B2 (ja) * | 2008-12-02 | 2014-01-15 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | エンティティをマッチングするシステム及び方法 |
US8359337B2 (en) * | 2008-12-09 | 2013-01-22 | Ingenix, Inc. | Apparatus, system and method for member matching |
US9910875B2 (en) * | 2008-12-22 | 2018-03-06 | International Business Machines Corporation | Best-value determination rules for an entity resolution system |
US8732176B2 (en) * | 2009-04-28 | 2014-05-20 | Palo Alto Research Center Incorporated | Web-based tool for detecting bias in reviews |
US9727842B2 (en) | 2009-08-21 | 2017-08-08 | International Business Machines Corporation | Determining entity relevance by relationships to other relevant entities |
US8423525B2 (en) * | 2010-03-30 | 2013-04-16 | International Business Machines Corporation | Life arcs as an entity resolution feature |
US9110968B2 (en) | 2010-04-14 | 2015-08-18 | At&T Intellectual Property I, L.P. | Removal of invisible data packages in data warehouses |
US8918418B2 (en) | 2010-04-19 | 2014-12-23 | Facebook, Inc. | Default structured search queries on online social networks |
US9092485B2 (en) | 2010-04-19 | 2015-07-28 | Facebook, Inc. | Dynamic suggested search queries on online social networks |
US8732208B2 (en) | 2010-04-19 | 2014-05-20 | Facebook, Inc. | Structured search queries based on social-graph information |
US9275101B2 (en) | 2010-04-19 | 2016-03-01 | Facebook, Inc. | Search queries with previews of search results on online social networks |
US9633121B2 (en) | 2010-04-19 | 2017-04-25 | Facebook, Inc. | Personalizing default search queries on online social networks |
US8185558B1 (en) | 2010-04-19 | 2012-05-22 | Facebook, Inc. | Automatically generating nodes and edges in an integrated social graph |
US10402419B1 (en) | 2010-04-19 | 2019-09-03 | Facebook, Inc. | Search queries with previews of search results on online social networks |
US9262482B2 (en) | 2010-04-19 | 2016-02-16 | Facebook, Inc. | Generating default search queries on online social networks |
US9275119B2 (en) | 2010-04-19 | 2016-03-01 | Facebook, Inc. | Sharing search queries on online social network |
US8751521B2 (en) | 2010-04-19 | 2014-06-10 | Facebook, Inc. | Personalized structured search queries for online social networks |
US9223838B2 (en) | 2010-04-19 | 2015-12-29 | Facebook, Inc. | Sponsored search queries on online social networks |
US8782080B2 (en) | 2010-04-19 | 2014-07-15 | Facebook, Inc. | Detecting social graph elements for structured search queries |
US8180804B1 (en) | 2010-04-19 | 2012-05-15 | Facebook, Inc. | Dynamically generating recommendations based on social graph information |
US8868603B2 (en) | 2010-04-19 | 2014-10-21 | Facebook, Inc. | Ambiguous structured search queries on online social networks |
US8572129B1 (en) | 2010-04-19 | 2013-10-29 | Facebook, Inc. | Automatically generating nodes and edges in an integrated social graph |
CN102314460B (zh) * | 2010-07-07 | 2014-05-14 | 阿里巴巴集团控股有限公司 | 数据分析方法、系统及服务器 |
US8468119B2 (en) * | 2010-07-14 | 2013-06-18 | Business Objects Software Ltd. | Matching data from disparate sources |
CN102214228B (zh) * | 2011-06-24 | 2013-03-13 | 国电南瑞科技股份有限公司 | 大电网分布式实时数据库系统的数据管理方法 |
US8965848B2 (en) * | 2011-08-24 | 2015-02-24 | International Business Machines Corporation | Entity resolution based on relationships to a common entity |
US8943059B2 (en) * | 2011-12-21 | 2015-01-27 | Sap Se | Systems and methods for merging source records in accordance with survivorship rules |
US8812542B1 (en) * | 2012-03-30 | 2014-08-19 | Emc Corporation | On-the-fly determining of alert relationships in a distributed system |
US20130339186A1 (en) * | 2012-06-15 | 2013-12-19 | Eventbrite, Inc. | Identifying Fraudulent Users Based on Relational Information |
US8935255B2 (en) | 2012-07-27 | 2015-01-13 | Facebook, Inc. | Social static ranking for search |
US9398104B2 (en) | 2012-12-20 | 2016-07-19 | Facebook, Inc. | Ranking test framework for search results on an online social network |
US9223826B2 (en) | 2013-02-25 | 2015-12-29 | Facebook, Inc. | Pushing suggested search queries to mobile devices |
US9910887B2 (en) | 2013-04-25 | 2018-03-06 | Facebook, Inc. | Variable search query vertical access |
US9223898B2 (en) | 2013-05-08 | 2015-12-29 | Facebook, Inc. | Filtering suggested structured queries on online social networks |
US9330183B2 (en) | 2013-05-08 | 2016-05-03 | Facebook, Inc. | Approximate privacy indexing for search queries on online social networks |
US9305322B2 (en) | 2013-07-23 | 2016-04-05 | Facebook, Inc. | Native application testing |
US9514230B2 (en) | 2013-07-30 | 2016-12-06 | Facebook, Inc. | Rewriting search queries on online social networks |
US9317614B2 (en) | 2013-07-30 | 2016-04-19 | Facebook, Inc. | Static rankings for search queries on online social networks |
US9367629B2 (en) | 2013-12-19 | 2016-06-14 | Facebook, Inc. | Grouping recommended search queries on online social networks |
US9336300B2 (en) | 2014-01-17 | 2016-05-10 | Facebook, Inc. | Client-side search templates for online social networks |
US9477760B2 (en) | 2014-02-12 | 2016-10-25 | Facebook, Inc. | Query construction on online social networks |
US9794359B1 (en) | 2014-03-31 | 2017-10-17 | Facebook, Inc. | Implicit contacts in an online social network |
US9798832B1 (en) | 2014-03-31 | 2017-10-24 | Facebook, Inc. | Dynamic ranking of user cards |
US11169773B2 (en) | 2014-04-01 | 2021-11-09 | TekWear, LLC | Systems, methods, and apparatuses for agricultural data collection, analysis, and management via a mobile device |
WO2015153779A1 (en) * | 2014-04-01 | 2015-10-08 | TekWear, LLC | Systems, methods, and apparatuses for agricultural data collection, analysis, and management via a mobile device |
US9646055B2 (en) | 2014-04-03 | 2017-05-09 | Facebook, Inc. | Blending search results on online social networks |
US9679078B2 (en) | 2014-05-21 | 2017-06-13 | Facebook, Inc. | Search client context on online social networks |
US10268763B2 (en) | 2014-07-25 | 2019-04-23 | Facebook, Inc. | Ranking external content on online social networks |
US9871714B2 (en) | 2014-08-01 | 2018-01-16 | Facebook, Inc. | Identifying user biases for search results on online social networks |
US10255244B2 (en) | 2014-08-01 | 2019-04-09 | Facebook, Inc. | Search results based on user biases on online social networks |
US9792364B2 (en) | 2014-08-08 | 2017-10-17 | Facebook, Inc. | Blending search results on online social networks |
US10120909B2 (en) | 2014-08-22 | 2018-11-06 | Facebook, Inc. | Generating cards in response to user actions on online social networks |
US9703859B2 (en) | 2014-08-27 | 2017-07-11 | Facebook, Inc. | Keyword search queries on online social networks |
US9754037B2 (en) | 2014-08-27 | 2017-09-05 | Facebook, Inc. | Blending by query classification on online social networks |
US10255365B2 (en) | 2014-08-29 | 2019-04-09 | Facebook, Inc. | Priming search results on online social networks |
US10740412B2 (en) | 2014-09-05 | 2020-08-11 | Facebook, Inc. | Pivoting search results on online social networks |
US9507876B2 (en) | 2014-10-06 | 2016-11-29 | Facebook, Inc. | Constructing queries using query filters on online social networks |
US9703870B2 (en) | 2014-11-05 | 2017-07-11 | Facebook, Inc. | Social-based optimization of web crawling for online social networks |
US10409873B2 (en) | 2014-11-26 | 2019-09-10 | Facebook, Inc. | Searching for content by key-authors on online social networks |
US10552759B2 (en) | 2014-12-01 | 2020-02-04 | Facebook, Inc. | Iterative classifier training on online social networks |
US9679024B2 (en) | 2014-12-01 | 2017-06-13 | Facebook, Inc. | Social-based spelling correction for online social networks |
US9990441B2 (en) | 2014-12-05 | 2018-06-05 | Facebook, Inc. | Suggested keywords for searching content on online social networks |
US10102273B2 (en) | 2014-12-30 | 2018-10-16 | Facebook, Inc. | Suggested queries for locating posts on online social networks |
US10061856B2 (en) * | 2015-01-29 | 2018-08-28 | Facebook, Inc. | Multimedia search using reshare text on online social networks |
US20160224993A1 (en) * | 2015-02-03 | 2016-08-04 | Bank Of America Corporation | System for determining relationships between entities |
US10997257B2 (en) | 2015-02-06 | 2021-05-04 | Facebook, Inc. | Aggregating news events on online social networks |
US10049099B2 (en) | 2015-04-10 | 2018-08-14 | Facebook, Inc. | Spell correction with hidden markov models on online social networks |
US10095683B2 (en) | 2015-04-10 | 2018-10-09 | Facebook, Inc. | Contextual speller models on online social networks |
US10628636B2 (en) | 2015-04-24 | 2020-04-21 | Facebook, Inc. | Live-conversation modules on online social networks |
US10298535B2 (en) | 2015-05-19 | 2019-05-21 | Facebook, Inc. | Civic issues platforms on online social networks |
US10397167B2 (en) | 2015-06-19 | 2019-08-27 | Facebook, Inc. | Live social modules on online social networks |
US10509832B2 (en) | 2015-07-13 | 2019-12-17 | Facebook, Inc. | Generating snippet modules on online social networks |
US10268664B2 (en) | 2015-08-25 | 2019-04-23 | Facebook, Inc. | Embedding links in user-created content on online social networks |
US10810217B2 (en) | 2015-10-07 | 2020-10-20 | Facebook, Inc. | Optionalization and fuzzy search on online social networks |
US10795936B2 (en) | 2015-11-06 | 2020-10-06 | Facebook, Inc. | Suppressing entity suggestions on online social networks |
US9602965B1 (en) | 2015-11-06 | 2017-03-21 | Facebook, Inc. | Location-based place determination using online social networks |
US10270868B2 (en) | 2015-11-06 | 2019-04-23 | Facebook, Inc. | Ranking of place-entities on online social networks |
US10534814B2 (en) | 2015-11-11 | 2020-01-14 | Facebook, Inc. | Generating snippets on online social networks |
US10387511B2 (en) | 2015-11-25 | 2019-08-20 | Facebook, Inc. | Text-to-media indexes on online social networks |
CN106817390B (zh) | 2015-12-01 | 2020-04-24 | 阿里巴巴集团控股有限公司 | 一种用户数据共享的方法和设备 |
US10740368B2 (en) | 2015-12-29 | 2020-08-11 | Facebook, Inc. | Query-composition platforms on online social networks |
US10282434B2 (en) | 2016-01-11 | 2019-05-07 | Facebook, Inc. | Suppression and deduplication of place-entities on online social networks |
US10262039B1 (en) | 2016-01-15 | 2019-04-16 | Facebook, Inc. | Proximity-based searching on online social networks |
US10162899B2 (en) | 2016-01-15 | 2018-12-25 | Facebook, Inc. | Typeahead intent icons and snippets on online social networks |
US10740375B2 (en) | 2016-01-20 | 2020-08-11 | Facebook, Inc. | Generating answers to questions using information posted by users on online social networks |
US10242074B2 (en) | 2016-02-03 | 2019-03-26 | Facebook, Inc. | Search-results interfaces for content-item-specific modules on online social networks |
US10270882B2 (en) | 2016-02-03 | 2019-04-23 | Facebook, Inc. | Mentions-modules on online social networks |
US10157224B2 (en) | 2016-02-03 | 2018-12-18 | Facebook, Inc. | Quotations-modules on online social networks |
US10216850B2 (en) | 2016-02-03 | 2019-02-26 | Facebook, Inc. | Sentiment-modules on online social networks |
US10452671B2 (en) | 2016-04-26 | 2019-10-22 | Facebook, Inc. | Recommendations from comments on online social networks |
US10659299B1 (en) | 2016-06-30 | 2020-05-19 | Facebook, Inc. | Managing privacy settings for content on online social networks |
US10635661B2 (en) | 2016-07-11 | 2020-04-28 | Facebook, Inc. | Keyboard-based corrections for search queries on online social networks |
US10282483B2 (en) | 2016-08-04 | 2019-05-07 | Facebook, Inc. | Client-side caching of search keywords for online social networks |
US10223464B2 (en) | 2016-08-04 | 2019-03-05 | Facebook, Inc. | Suggesting filters for search on online social networks |
US10726022B2 (en) | 2016-08-26 | 2020-07-28 | Facebook, Inc. | Classifying search queries on online social networks |
US10534815B2 (en) | 2016-08-30 | 2020-01-14 | Facebook, Inc. | Customized keyword query suggestions on online social networks |
US10102255B2 (en) | 2016-09-08 | 2018-10-16 | Facebook, Inc. | Categorizing objects for queries on online social networks |
US10645142B2 (en) | 2016-09-20 | 2020-05-05 | Facebook, Inc. | Video keyframes display on online social networks |
US10026021B2 (en) | 2016-09-27 | 2018-07-17 | Facebook, Inc. | Training image-recognition systems using a joint embedding model on online social networks |
US10083379B2 (en) | 2016-09-27 | 2018-09-25 | Facebook, Inc. | Training image-recognition systems based on search queries on online social networks |
US10579688B2 (en) | 2016-10-05 | 2020-03-03 | Facebook, Inc. | Search ranking and recommendations for online social networks based on reconstructed embeddings |
US10311117B2 (en) | 2016-11-18 | 2019-06-04 | Facebook, Inc. | Entity linking to query terms on online social networks |
US10650009B2 (en) | 2016-11-22 | 2020-05-12 | Facebook, Inc. | Generating news headlines on online social networks |
US10235469B2 (en) | 2016-11-30 | 2019-03-19 | Facebook, Inc. | Searching for posts by related entities on online social networks |
US10162886B2 (en) | 2016-11-30 | 2018-12-25 | Facebook, Inc. | Embedding-based parsing of search queries on online social networks |
US10313456B2 (en) | 2016-11-30 | 2019-06-04 | Facebook, Inc. | Multi-stage filtering for recommended user connections on online social networks |
US10185763B2 (en) | 2016-11-30 | 2019-01-22 | Facebook, Inc. | Syntactic models for parsing search queries on online social networks |
US10607148B1 (en) | 2016-12-21 | 2020-03-31 | Facebook, Inc. | User identification with voiceprints on online social networks |
US11223699B1 (en) | 2016-12-21 | 2022-01-11 | Facebook, Inc. | Multiple user recognition with voiceprints on online social networks |
US10535106B2 (en) | 2016-12-28 | 2020-01-14 | Facebook, Inc. | Selecting user posts related to trending topics on online social networks |
US10489472B2 (en) | 2017-02-13 | 2019-11-26 | Facebook, Inc. | Context-based search suggestions on online social networks |
US10614141B2 (en) | 2017-03-15 | 2020-04-07 | Facebook, Inc. | Vital author snippets on online social networks |
US10769222B2 (en) | 2017-03-20 | 2020-09-08 | Facebook, Inc. | Search result ranking based on post classifiers on online social networks |
US11379861B2 (en) | 2017-05-16 | 2022-07-05 | Meta Platforms, Inc. | Classifying post types on online social networks |
US10248645B2 (en) | 2017-05-30 | 2019-04-02 | Facebook, Inc. | Measuring phrase association on online social networks |
US10268646B2 (en) | 2017-06-06 | 2019-04-23 | Facebook, Inc. | Tensor-based deep relevance model for search on online social networks |
US10489468B2 (en) | 2017-08-22 | 2019-11-26 | Facebook, Inc. | Similarity search using progressive inner products and bounds |
US10776437B2 (en) | 2017-09-12 | 2020-09-15 | Facebook, Inc. | Time-window counters for search results on online social networks |
US10678786B2 (en) | 2017-10-09 | 2020-06-09 | Facebook, Inc. | Translating search queries on online social networks |
US10810214B2 (en) | 2017-11-22 | 2020-10-20 | Facebook, Inc. | Determining related query terms through query-post associations on online social networks |
US10963514B2 (en) | 2017-11-30 | 2021-03-30 | Facebook, Inc. | Using related mentions to enhance link probability on online social networks |
US11604968B2 (en) | 2017-12-11 | 2023-03-14 | Meta Platforms, Inc. | Prediction of next place visits on online social networks |
US10129705B1 (en) | 2017-12-11 | 2018-11-13 | Facebook, Inc. | Location prediction using wireless signals on online social networks |
CN110019274B (zh) | 2017-12-29 | 2023-09-26 | 阿里巴巴集团控股有限公司 | 一种数据库系统以及查询数据库的方法和装置 |
CN108509182A (zh) * | 2018-02-27 | 2018-09-07 | 北京航空航天大学 | 将非结构化大数据进行结构化处理并融合的软件技术 |
CN109086574B (zh) * | 2018-08-16 | 2022-01-07 | 国家卫生健康委科学技术研究所 | 疾病相关蛋白数据库 |
SG11202010724PA (en) * | 2019-11-06 | 2020-11-27 | Alipay Hangzhou Inf Tech Co Ltd | Consenus of shared blockchain data storage based on error correction code |
US12031228B2 (en) | 2021-07-21 | 2024-07-09 | Meta Platforms Technologies, Llc | Organic solid crystal—method and structure |
CN114969041B (zh) * | 2022-05-27 | 2023-06-30 | 河北省科学技术情报研究院(河北省科技创新战略研究院) | 一种多源主附实体同一性甄别及数据自补的处理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US579424A (en) * | 1897-03-23 | Edwakd c | ||
US599175A (en) * | 1898-02-15 | Washing-machine | ||
US6272495B1 (en) * | 1997-04-22 | 2001-08-07 | Greg Hetherington | Method and apparatus for processing free-format data |
JP2001522495A (ja) * | 1997-04-30 | 2001-11-13 | インフォーマティカ、コーポレーション | 動的に増加しているデータベース・データ・セットの増加集計方法 |
Family Cites Families (107)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1261167A (en) * | 1917-10-25 | 1918-04-02 | Robert C Russell | Index. |
US3659085A (en) * | 1970-04-30 | 1972-04-25 | Sierra Research Corp | Computer determining the location of objects in a coordinate system |
US4232313A (en) * | 1972-09-22 | 1980-11-04 | The United States Of America As Represented By The Secretary Of The Navy | Tactical nagivation and communication system |
US5010478A (en) * | 1986-04-11 | 1991-04-23 | Deran Roger L | Entity-attribute value database system with inverse attribute for selectively relating two different entities |
JPS63282838A (ja) | 1987-05-14 | 1988-11-18 | Fujitsu Ltd | 名寄せ処理方式 |
JPH0212563A (ja) | 1988-06-30 | 1990-01-17 | Nec Corp | 情報管理方式 |
US5345587A (en) * | 1988-09-14 | 1994-09-06 | Digital Equipment Corporation | Extensible entity management system including a dispatching kernel and modules which independently interpret and execute commands |
JPH0317792A (ja) | 1989-06-14 | 1991-01-25 | Mitsubishi Plastics Ind Ltd | カードの記録方法 |
JPH03177972A (ja) * | 1989-12-07 | 1991-08-01 | Nec Corp | データベースシステム |
US4981370A (en) * | 1990-01-29 | 1991-01-01 | Dziewit Halina S | Document authentication apparatus |
US5555409A (en) * | 1990-12-04 | 1996-09-10 | Applied Technical Sysytem, Inc. | Data management systems and methods including creation of composite views of data |
JPH04237373A (ja) * | 1991-01-22 | 1992-08-25 | Toshiba Corp | キーワード入力方式 |
US5560006A (en) * | 1991-05-15 | 1996-09-24 | Automated Technology Associates, Inc. | Entity-relation database |
US5229764A (en) * | 1991-06-20 | 1993-07-20 | Matchett Noel D | Continuous biometric authentication matrix |
JP2922347B2 (ja) * | 1991-11-07 | 1999-07-19 | 富士通株式会社 | 異種データベース間のデータ結合装置及びデータ結合方法 |
JPH05250416A (ja) * | 1992-03-06 | 1993-09-28 | Toshiba Eng Co Ltd | データベースの登録・検索装置 |
EP0581421B1 (en) * | 1992-07-20 | 2003-01-15 | Compaq Computer Corporation | Method and system for certificate based alias detection |
US5403639A (en) * | 1992-09-02 | 1995-04-04 | Storage Technology Corporation | File server having snapshot application data groups |
US5454101A (en) * | 1992-09-15 | 1995-09-26 | Universal Firmware Industries, Ltd. | Data storage system with set lists which contain elements associated with parents for defining a logical hierarchy and general record pointers identifying specific data sets |
US5742806A (en) * | 1994-01-31 | 1998-04-21 | Sun Microsystems, Inc. | Apparatus and method for decomposing database queries for database management system including multiprocessor digital data processing system |
US5764977A (en) * | 1994-03-30 | 1998-06-09 | Siemens Stromberg-Carlson | Distributed database architecture and distributed database management system for open network evolution |
US5848373A (en) * | 1994-06-24 | 1998-12-08 | Delorme Publishing Company | Computer aided map location system |
JPH0863382A (ja) * | 1994-08-19 | 1996-03-08 | Fujitsu Ltd | 分散システムにおけるデータ整合性確認方法及びデータ整合性確認装置 |
US5675785A (en) * | 1994-10-04 | 1997-10-07 | Hewlett-Packard Company | Data warehouse which is accessed by a user using a schema of virtual tables |
US5873093A (en) * | 1994-12-07 | 1999-02-16 | Next Software, Inc. | Method and apparatus for mapping objects to a data source |
US5799309A (en) * | 1994-12-29 | 1998-08-25 | International Business Machines Corporation | Generating an optimized set of relational queries fetching data in an object-relational database |
JPH08305662A (ja) * | 1995-05-02 | 1996-11-22 | Fujitsu Ltd | クライアント認証システムおよび方法 |
US5659731A (en) * | 1995-06-19 | 1997-08-19 | Dun & Bradstreet, Inc. | Method for rating a match for a given entity found in a list of entities |
US5758343A (en) * | 1995-12-08 | 1998-05-26 | Ncr Corporation | Apparatus and method for integrating multiple delegate directory service agents |
US6035300A (en) * | 1995-12-15 | 2000-03-07 | International Business Machines Corporation | Method and apparatus for generating a user interface from the entity/attribute/relationship model of a database |
US5991733A (en) * | 1996-03-22 | 1999-11-23 | Hartford Fire Insurance Company | Method and computerized system for managing insurance receivable accounts |
US5878416A (en) * | 1996-06-14 | 1999-03-02 | Electronic Data Systems Corporation | Automated system and method for matching an item of business property to a recipient |
US5778375A (en) * | 1996-06-27 | 1998-07-07 | Microsoft Corporation | Database normalizing system |
US6052693A (en) * | 1996-07-02 | 2000-04-18 | Harlequin Group Plc | System for assembling large databases through information extracted from text sources |
US5819263A (en) * | 1996-07-19 | 1998-10-06 | American Express Financial Corporation | Financial planning system incorporating relationship and group management |
US5781911A (en) * | 1996-09-10 | 1998-07-14 | D2K, Incorporated | Integrated system and method of data warehousing and delivery |
US5892828A (en) * | 1996-10-23 | 1999-04-06 | Novell, Inc. | User presence verification with single password across applications |
US6076167A (en) * | 1996-12-04 | 2000-06-13 | Dew Engineering And Development Limited | Method and system for improving security in network applications |
US5845285A (en) * | 1997-01-07 | 1998-12-01 | Klein; Laurence C. | Computer system and method of data analysis |
JP4268690B2 (ja) * | 1997-03-26 | 2009-05-27 | ソニー株式会社 | 認証システムおよび方法、並びに認証方法 |
JP4027455B2 (ja) * | 1997-03-31 | 2007-12-26 | 富士通株式会社 | データベース管理システム |
WO1998047083A1 (en) * | 1997-04-16 | 1998-10-22 | British Telecommunications Public Limited Company | Data summariser |
US6032158A (en) * | 1997-05-02 | 2000-02-29 | Informatica Corporation | Apparatus and method for capturing and propagating changes from an operational database to data marts |
US5991765A (en) * | 1997-05-06 | 1999-11-23 | Birdstep Technology As | System and method for storing and manipulating data in an information handling system |
US6202151B1 (en) * | 1997-05-09 | 2001-03-13 | Gte Service Corporation | System and method for authenticating electronic transactions using biometric certificates |
US5991408A (en) * | 1997-05-16 | 1999-11-23 | Veridicom, Inc. | Identification and security using biometric measurements |
JP3547069B2 (ja) * | 1997-05-22 | 2004-07-28 | 日本電信電話株式会社 | 情報関連づけ装置およびその方法 |
US5991758A (en) * | 1997-06-06 | 1999-11-23 | Madison Information Technologies, Inc. | System and method for indexing information about entities from different information sources |
US6122757A (en) * | 1997-06-27 | 2000-09-19 | Agilent Technologies, Inc | Code generating system for improved pattern matching in a protocol analyzer |
US6092199A (en) * | 1997-07-07 | 2000-07-18 | International Business Machines Corporation | Dynamic creation of a user account in a client following authentication from a non-native server domain |
US6523041B1 (en) * | 1997-07-29 | 2003-02-18 | Acxiom Corporation | Data linking system and method using tokens |
US6073140A (en) * | 1997-07-29 | 2000-06-06 | Acxiom Corporation | Method and system for the creation, enhancement and update of remote data using persistent keys |
US5995973A (en) * | 1997-08-29 | 1999-11-30 | International Business Machines Corporation | Storing relationship tables identifying object relationships |
US6044378A (en) * | 1997-09-29 | 2000-03-28 | International Business Machines Corporation | Method and system for a federated digital library by managing links |
US6357004B1 (en) * | 1997-09-30 | 2002-03-12 | Intel Corporation | System and method for ensuring integrity throughout post-processing |
US6014670A (en) * | 1997-11-07 | 2000-01-11 | Informatica Corporation | Apparatus and method for performing data transformations in data warehousing |
US6339775B1 (en) * | 1997-11-07 | 2002-01-15 | Informatica Corporation | Apparatus and method for performing data transformations in data warehousing |
US6035306A (en) * | 1997-11-24 | 2000-03-07 | Terascape Software Inc. | Method for improving performance of large databases |
US6041410A (en) * | 1997-12-22 | 2000-03-21 | Trw Inc. | Personal identification fob |
US6263446B1 (en) * | 1997-12-23 | 2001-07-17 | Arcot Systems, Inc. | Method and apparatus for secure distribution of authentication credentials to roaming users |
JPH11184884A (ja) | 1997-12-24 | 1999-07-09 | Ntt Data Corp | 同一人判定システムおよび方法 |
US5933831A (en) * | 1998-01-09 | 1999-08-03 | Lsi Logic Corporation | Viewing entity relationship diagrams using hyperlinks |
US6418450B2 (en) * | 1998-01-26 | 2002-07-09 | International Business Machines Corporation | Data warehouse programs architecture |
US6845453B2 (en) * | 1998-02-13 | 2005-01-18 | Tecsec, Inc. | Multiple factor-based user identification and authentication |
US6049805A (en) * | 1998-02-24 | 2000-04-11 | Microsoft Corporation | Dynamic event mechanism for objects with associational relationships |
GB2336007B (en) * | 1998-04-01 | 2003-01-29 | Mitel Corp | Agent-based data mining and warehousing |
JP3437441B2 (ja) * | 1998-04-08 | 2003-08-18 | 日本電信電話株式会社 | 検索方法、検索装置、および検索プログラムを記録した記録媒体 |
US6167517A (en) * | 1998-04-09 | 2000-12-26 | Oracle Corporation | Trusted biometric client authentication |
US6160903A (en) * | 1998-04-24 | 2000-12-12 | Dew Engineering And Development Limited | Method of providing secure user access |
US6684334B1 (en) * | 1998-05-27 | 2004-01-27 | Trusted Security Solutions, Inc. | Secure establishment of cryptographic keys using persistent key component |
US6208990B1 (en) * | 1998-07-15 | 2001-03-27 | Informatica Corporation | Method and architecture for automated optimization of ETL throughput in data warehousing applications |
US6185557B1 (en) * | 1998-07-31 | 2001-02-06 | Unisys Corporation | Merge join process |
US6743022B1 (en) * | 1998-12-03 | 2004-06-01 | Oded Sarel | System and method for automated self measurement of alertness equilibrium and coordination and for ventification of the identify of the person performing tasks |
US6931392B1 (en) * | 1998-12-07 | 2005-08-16 | Vitria Technology, Inc. | Real-time decision support system |
US6819797B1 (en) * | 1999-01-29 | 2004-11-16 | International Business Machines Corporation | Method and apparatus for classifying and querying temporal and spatial information in video |
US6317834B1 (en) * | 1999-01-29 | 2001-11-13 | International Business Machines Corporation | Biometric authentication system with encrypted models |
AU2523300A (en) | 1999-04-07 | 2000-10-12 | Reclaim Technologies And Sservices, Ltd. | A system for identification of selectively related database records |
US20020038308A1 (en) * | 1999-05-27 | 2002-03-28 | Michael Cappi | System and method for creating a virtual data warehouse |
US6697947B1 (en) * | 1999-06-17 | 2004-02-24 | International Business Machines Corporation | Biometric based multi-party authentication |
US6385604B1 (en) * | 1999-08-04 | 2002-05-07 | Hyperroll, Israel Limited | Relational database management system having integrated non-relational multi-dimensional data store of aggregated data elements |
JP2001118103A (ja) * | 1999-10-15 | 2001-04-27 | Oki Electric Ind Co Ltd | ゲート管理装置 |
AU2117501A (en) * | 1999-10-19 | 2001-04-30 | Stamps.Com | Address matching system and method |
JP2001117940A (ja) | 1999-10-20 | 2001-04-27 | Just Syst Corp | 情報検索装置、情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US7003560B1 (en) * | 1999-11-03 | 2006-02-21 | Accenture Llp | Data warehouse computing system |
NZ543166A (en) * | 2000-04-07 | 2006-12-22 | Procter & Gamble | Monitoring the effective velocity of items through a store or warehouse for predicting stock levels |
JP2001325425A (ja) | 2000-05-15 | 2001-11-22 | Fujitsu Ltd | 名寄せ処理システム |
GB2366160B (en) * | 2000-08-09 | 2004-03-17 | Michaelhouse Man Ltd | Information routing |
US7302582B2 (en) * | 2000-08-21 | 2007-11-27 | United States Postal Service | Delivery point validation system |
US6675476B2 (en) * | 2000-12-05 | 2004-01-13 | Hewlett-Packard Development Company, L.P. | Slotted substrates and techniques for forming same |
US6954757B2 (en) * | 2001-02-02 | 2005-10-11 | Hewlett-Packard Development Company, L.P. | Framework, architecture, method and system for reducing latency of business operations of an enterprise |
US6886747B2 (en) * | 2001-03-22 | 2005-05-03 | United States Postal Service | System and method for standardizing a mailing address |
US7856420B2 (en) * | 2001-04-19 | 2010-12-21 | Hewlett-Packard Development Company, L.P. | Zero latency enterprise enriched publish/subscribe |
US7092951B1 (en) * | 2001-07-06 | 2006-08-15 | Ncr Corporation | Auxiliary relation for materialized view |
US20030030733A1 (en) * | 2001-08-08 | 2003-02-13 | Seaman Mark D. | System and method for synchronization of media data |
US6912549B2 (en) | 2001-09-05 | 2005-06-28 | Siemens Medical Solutions Health Services Corporation | System for processing and consolidating records |
US7370044B2 (en) * | 2001-11-19 | 2008-05-06 | Equifax, Inc. | System and method for managing and updating information relating to economic entities |
PL374305A1 (en) * | 2001-12-28 | 2005-10-03 | Jeffrey James Jonas | Real time data warehousing |
US7590544B2 (en) * | 2002-03-06 | 2009-09-15 | United States Postal Service | Method for correcting a mailing address |
WO2003081440A1 (en) * | 2002-03-21 | 2003-10-02 | Snapp Robert F | Method and system for storing and retrieving data using hash-accessed multiple data stores |
US7096213B2 (en) * | 2002-04-08 | 2006-08-22 | Oracle International Corporation | Persistent key-value repository with a pluggable architecture to abstract physical storage |
US6968338B1 (en) | 2002-08-29 | 2005-11-22 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Extensible database framework for management of unstructured and semi-structured documents |
US7159119B2 (en) * | 2002-09-06 | 2007-01-02 | United States Postal Service | Method and system for efficiently retrieving secured data by securely pre-processing provided access information |
US7900052B2 (en) * | 2002-11-06 | 2011-03-01 | International Business Machines Corporation | Confidential data sharing and anonymous entity resolution |
US20040099313A1 (en) * | 2002-11-26 | 2004-05-27 | Gotthelf Jeffrey Bryan | Fluid flow pressure regulator |
JP2006512864A (ja) * | 2002-12-31 | 2006-04-13 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 許可された匿名の認証 |
US7200602B2 (en) * | 2003-02-07 | 2007-04-03 | International Business Machines Corporation | Data set comparison and net change processing |
US7962757B2 (en) | 2003-03-24 | 2011-06-14 | International Business Machines Corporation | Secure coordinate identification method, system and program |
-
2002
- 2002-12-27 PL PL02374305A patent/PL374305A1/xx unknown
- 2002-12-27 CN CNA200810137940XA patent/CN101324902A/zh active Pending
- 2002-12-27 BR BR0215411-0A patent/BR0215411A/pt not_active Application Discontinuation
- 2002-12-27 AU AU2002367376A patent/AU2002367376A1/en not_active Abandoned
- 2002-12-27 CA CA2471940A patent/CA2471940C/en not_active Expired - Lifetime
- 2002-12-27 MX MXPA04006390A patent/MXPA04006390A/es unknown
- 2002-12-27 KR KR1020077024457A patent/KR100856771B1/ko not_active IP Right Cessation
- 2002-12-27 CN CNB028283759A patent/CN100483333C/zh not_active Expired - Lifetime
- 2002-12-27 EA EA200400873A patent/EA200400873A1/ru unknown
- 2002-12-27 KR KR1020047010275A patent/KR100850255B1/ko not_active IP Right Cessation
- 2002-12-27 US US10/331,068 patent/US8452787B2/en active Active
- 2002-12-27 JP JP2003558673A patent/JP2006501529A/ja active Pending
- 2002-12-27 WO PCT/US2002/041630 patent/WO2003058427A1/en active Application Filing
- 2002-12-27 KR KR1020077024459A patent/KR100877461B1/ko not_active IP Right Cessation
- 2002-12-27 IL IL16274602A patent/IL162746A0/xx unknown
- 2002-12-27 EP EP02806260A patent/EP1470475A4/en not_active Withdrawn
-
2004
- 2004-06-28 ZA ZA200405141A patent/ZA200405141B/xx unknown
-
2005
- 2005-09-08 US US11/221,622 patent/US8615521B2/en active Active
-
2008
- 2008-09-16 JP JP2008237042A patent/JP4366433B2/ja not_active Expired - Lifetime
- 2008-09-16 JP JP2008237101A patent/JP4456646B2/ja not_active Expired - Lifetime
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US579424A (en) * | 1897-03-23 | Edwakd c | ||
US599175A (en) * | 1898-02-15 | Washing-machine | ||
US6272495B1 (en) * | 1997-04-22 | 2001-08-07 | Greg Hetherington | Method and apparatus for processing free-format data |
JP2001522495A (ja) * | 1997-04-30 | 2001-11-13 | インフォーマティカ、コーポレーション | 動的に増加しているデータベース・データ・セットの増加集計方法 |
Also Published As
Publication number | Publication date |
---|---|
IL162746A0 (en) | 2005-11-20 |
KR20070112423A (ko) | 2007-11-23 |
BR0215411A (pt) | 2005-09-06 |
JP4456646B2 (ja) | 2010-04-28 |
CN1656442A (zh) | 2005-08-17 |
EP1470475A1 (en) | 2004-10-27 |
US8452787B2 (en) | 2013-05-28 |
JP4366433B2 (ja) | 2009-11-18 |
ZA200405141B (en) | 2005-11-21 |
CN100483333C (zh) | 2009-04-29 |
WO2003058427A1 (en) | 2003-07-17 |
KR100850255B1 (ko) | 2008-08-19 |
PL374305A1 (en) | 2005-10-03 |
AU2002367376A1 (en) | 2003-07-24 |
US20030154194A1 (en) | 2003-08-14 |
CA2471940A1 (en) | 2003-07-17 |
WO2003058427A8 (en) | 2005-06-02 |
MXPA04006390A (es) | 2005-06-08 |
US20060010119A1 (en) | 2006-01-12 |
KR20070112422A (ko) | 2007-11-23 |
EA200400873A1 (ru) | 2005-12-29 |
US8615521B2 (en) | 2013-12-24 |
JP2009059371A (ja) | 2009-03-19 |
KR20040088036A (ko) | 2004-10-15 |
JP2006501529A (ja) | 2006-01-12 |
EP1470475A4 (en) | 2009-04-22 |
KR100856771B1 (ko) | 2008-09-05 |
CN101324902A (zh) | 2008-12-17 |
CA2471940C (en) | 2019-03-05 |
JP2009059372A (ja) | 2009-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100877461B1 (ko) | 실시간 데이터 웨어하우징 | |
US8620937B2 (en) | Real time data warehousing | |
US8768914B2 (en) | System and method for searching and matching databases | |
US11442694B1 (en) | Merging database tables by classifying comparison signatures | |
JP5328808B2 (ja) | データをクラスタリングする方法、システム、装置およびその方法を適用するためのコンピュータ・プログラム | |
US8150813B2 (en) | Using relationships in candidate discovery | |
WO2013013942A1 (en) | Entity resolution | |
CN114969819A (zh) | 数据资产风险发现方法和装置 | |
CN112559871A (zh) | 一种信息查询方法及其系统、服务器设备 | |
CN111680110A (zh) | 数据处理方法、装置、bi系统及介质 | |
CN110399431A (zh) | 一种关联关系构建方法、装置及设备 | |
CN112612817A (zh) | 数据处理方法、装置、终端设备及计算机可读存储介质 | |
CN115033416B (zh) | 确定异常信息的方法、装置、电子设备及存储介质 | |
WO2022129605A1 (en) | Method of processing data from a data source, apparatus and computer program | |
KR20050092959A (ko) | 물품목록정보 관리시스템 | |
CN116738023A (zh) | 油田技术服务数据管控方法、系统、存储介质和电子设备 | |
CN117493466A (zh) | 财务数据同步方法及系统 | |
CN118626603A (zh) | 一种大语言模型数据安全管理方法、装置和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |