KR20120139695A - 전문 기관 데이터의 상업용 데이터 컨텐트와의 통합 및 연관을 위한 시스템 및 방법 - Google Patents
전문 기관 데이터의 상업용 데이터 컨텐트와의 통합 및 연관을 위한 시스템 및 방법 Download PDFInfo
- Publication number
- KR20120139695A KR20120139695A KR1020127021333A KR20127021333A KR20120139695A KR 20120139695 A KR20120139695 A KR 20120139695A KR 1020127021333 A KR1020127021333 A KR 1020127021333A KR 20127021333 A KR20127021333 A KR 20127021333A KR 20120139695 A KR20120139695 A KR 20120139695A
- Authority
- KR
- South Korea
- Prior art keywords
- record
- business
- data
- unique
- identifier
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/40—Data acquisition and logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/912—Applications of a database
- Y10S707/923—Intellectual property
- Y10S707/924—Patent procedure
- Y10S707/927—Validation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Storage Device Security (AREA)
Abstract
(i) 개인의 아이덴터티, 사업체의 이름, 및 사업체에서의 개인의 역할을 포함하는 제1 레코드를 수신하는 단계; (ii) 제1 레코드를 사업체에 대한 고유 사업체 식별자를 제공하는 데이터에 매칭시키는 단계; (iii) 제1 레코드를 개인에 대한 고유 개인 식별자를 제공하는 데이터에 매칭시키는 단계; (iii) 제1 레코드에 (a) 고유 사업체 식별자, (b) 고유 개인 식별자, 및 (c) 사업체에서의 개인의 역할에 대한 고유 역할 식별자를 첨부하는 단계; (iv) 제1 레코드를 고유 사업체 식별자, 고유 개인 식별자, 및 고유 역할 식별자에 기초하여 제2 레코드에 매칭시키는 단계; 및 (v) 제1 및 제2 레코드들을 얻어진 레코드에 통합하는 단계를 포함하는 방법이 제공된다.
Description
특허 개시내용은 개인들 및 사업체에 관한 정보의 하나 이상의 소스들을 종합, 사전-자격부여 및 통합하여, 전문가 프로파일을 생성하고, 전문가 프로파일을 다른 시스템들에 의해 액세스될 수 있는 관리 데이터 저장소에 저장 및 유지하는 처리를 수행하는 시스템에 관한 것이고, 여기서 개인은 사업체의 엔티티들과 연계된다.
이 절에 기재된 접근방법들은 수행될 수 있는 접근방법들이지만 필연적으로 미리 생각되거나 수행된 접근방법들은 아니다. 그러므로, 달리 표시되지 않는다면, 이 절에 기재된 접근방법들은 이 출원에서 청구항들에 대한 종래 기술이 아닐 수 있고 이 절에 포함시키는 것에 의해 종래 기술로 인정되지 않는다.
본 문헌의 목적을 위해, 용어 "전문가(professional)"는 사업체 엔티티로서 또는 사업체 엔티티에 관한 것으로, 또는 미국 노동부 노동 통계청(US Department of Labor, the Bureau of Labor Statistics) 또는 임의의 다른 인정된 기관에 의해 나열된 임의의 역할 또는 직위에 관한 것으로 정의된다.
현재 시장에서 이용 가능한 전문가 프로파일 제품들이 있다. 그러나, 이들 제품들은 일반적으로 개인이 사업체 엔티티와 갖는 관계의 속성에 대해서 또는 개인이 전문 관계들을 가진 사업체 엔티티에 대해서보다 개인에 관한 데이터에 대해 더 많이 집중하고 있다. 이들 전문가 프로파일 제품들은 개인들에 의해 직접 제공되는 정보를 포함하는 다수의 소스들에 의존한다. 그러나, 이들 전문가 프로파일 제품들은 개인, 사업체 엔티티, 또는 개인과 사업체 또는 다수의 사업체 간의 관계들의 강인한 매칭 처리를 채용하여 개인 또는 사업체 엔티티를 고유하게 식별하지 않는다.
이들 전문가 프로파일 제품들은 전문가 프로파일들을 구축하기 위해 다양한 소스들을 액세스하지만, 다양한 소스들 각각으로부터 최상의 품질 정보를 구하기 위해 이들 소스들로부터의 데이터에 자격을 부여하기 위한 처리들을 포함하지 않는다. 몇몇 경우들에 있어서, 예를 들어 이들은 전문가 프로파일들로 적절히 유효화되고 통합될 이메일 주소들 및 직통-다이얼 전화 번호들과 같은 개인과 관련된 고급 데이터 요소들을 허용하지 않는 기술을 채용한다.
현재의 전문가 프로파일 제품들이 갖는 기술적 결함은, 비록 이들이 사업 환경에서 개인에 대한 데이터 또는 복수의 소스들로부터의 사업체와 관련된 데이터를 합병하고, 합병된 데이터를 데이터베이스에 저장할 수 있지만, 이들은 개개의 사람에 대해 하나 이상의 레코드를 우연히 생성할 수 있다는 것이다. 본 발명은 복수의 소스들로부터의 데이터를 각 개인 및 관련 사업체에 대한 고유 식별자들을 제공하는 저장소 데이터베이스들에 있는 데이터와 매칭하고, 이후 개인에 대한 데이터를 단일 레코드로 보내기 위해 고유 식별자들을 이용하는 것을 포함하는 처리에 의해 이러한 결함을 극복한다.
(i) 개인의 아이덴터티, 사업체의 이름, 및 상기 사업체에서의 상기 개인의 역할을 포함하는 제1 레코드를 수신하는 단계, (ii) 상기 제1 레코드를 상기 사업체에 대한 고유 사업체 식별자를 제공하는 데이터에 매칭시키는 단계, (iii) 상기 제1 레코드를 상기 개인에 대한 고유 개인 식별자를 제공하는 데이터에 매칭시키는 단계, (iii) 상기 제1 레코드에 (a) 상기 고유 사업체 식별자, (b) 상기 고유 개인 식별자, 및 (c) 상기 사업체에서의 상기 개인의 상기 역할에 대한 고유 역할 식별자를 첨부하는 단계, (iv) 상기 제1 레코드를 상기 고유 사업체 식별자, 상기 고유 개인 식별자, 및 상기 고유 역할 식별자에 기초하여 제2 레코드에 매칭시키는 단계, 및 (v) 상기 제1 및 제2 레코드들을 얻어진 레코드에 통합하는 단계를 포함하는 방법이 제공된다.
본 발명은 현재의 전문가 프로파일 제품들의 다양한 문제점들을 극복하고자 한다. 즉, 본 발명은 전문가가 하거나 해왔던 다수의 현재 및 과거의 역할들을 하나 이상의 사업체 엔티티들과 관련지어 전문가 프로파일들을 개인 전문가의 하나의 통일된 프로파일을 생성하고자 한다. 그것은 또한 데이터 완성도, 정확도 및 적시성(timeliness)을 보장하는 규칙적으로 실행되는 자동화 처리들의 사용을 통해 전문가 접촉 데이터 처리를 개선하고자 한다. 더욱이, 본 발명은 처리될 수 있는 접촉 레코드들의 유형 및 번호에 대한 어떠한 제한들을 제거하고자 한다. 또한, 본 발명은 데이터를 개개인에 대해 생성된 통합된 프로파일로 개인, 예컨대 전문가 이메일 주소 및 직통 전화 번호들에 관련짓고자 한다.
본 발명이 기준 기술에 비해 가지는 이점은 데이터에 대한 정확도의 고신뢰도로 전문가 프로파일들을 구축하기 위해 개인들 및 사업체에 관한 데이터의 참조 데이터베이스들에 대해 고품질 매칭 서비스들의 사용이다.
본 발명은 현재 및 이전의 전문 기관(professional affiliation) 및 접촉 정보의 다수의 소스들을 식별하고, 자격부여하고, 통합하는 작용들을 포함한다. 본 발명은 양 개인들 및 사업체 엔티티들과 관련된 소스 데이터를 유효화하고, 개인 및 관련 아이덴터티 및 개인이 가지는 역할을 포함하는 사업체 엔티티에 대한 접촉 데이터를 사업체 엔티티에 관련짓기 위한 처리들을 포함하고, 얻어진 정보는 데이터 저장소에 대한 액세스가 제공된 개인들 또는 사업체에 의해 나중 사용을 위해 데이터 저장소에 공개되거나 저장된다.
처리는 개인들 및 사업체 엔티티들에 관한 정보를 가진 확립된 데이터 저장소들에 대한 다중-소스 정보를 비교하기 위해 사용되는 매칭 처리들을 구비한다.
본 발명은 각 사업체 엔티티 및 각 개개인에 대한 고유 식별자를 포함하는 미리 유효화된 사업체 엔티티 정보를 취하고, 각 개인에 대한 고유 식별자, 및 개인이 주어진 관련 사업체 엔티티 내에서 갖는 각각의 역할에 대한 고유 식별자를 포함하는 각 역할에 대한 고유 식별자를 포함하는 미리 유효화된 개인 정보를 갖는 상기 정보를 따른다. 따라서, 처리는 사업체 엔티티, 개인 식별자, 및 역할의 각 고유값에 적용되는 고유 식별자들을 갖는 전문가 프로파일을 생성한다.
전문가 프로파일은 다른 시스템들 및 제품들에 의해 액세스될 수 있는 광범위한 데이터 저장소(comprehensive data repository)에 배치된다. 따라서 광범위한 데이터 저장소는 개인들과 사업체 엔티티들 간의 현재 및 이전의 전문 기관 및 관계들, 및 이들 관계들에 관한 특정 역할들 및 직위들에 관한 데이터를 포함한다. 또한, 광범위한 데이터 저장소는 개인들 및 사업체 엔티티들에 대한 식별, 접촉, 및 다른 유사한 데이터, 각 개인, 사업체 엔티티의 고유 식별자들, 및 이들 사이의 관계들을 포함한다. 본 발명은 다수의 데이터 소스들에 대한 광범위한 데이터 저장소 및 데이터가 완전하고, 정확하고, 현재인 것을 보장하기 위한 다른 데이터 저장소들을 평가하기 위한 처리들을 포함한다.
본 개시내용의 시스템 및 방법은:
(a) 적어도 하나의 데이터 소스로부터 개인들 및 사업체 엔티티들에 관한 복수의 데이터를 조립하고 이와 같은 조립된 데이터를 저장소에 제공하고;
(b) 데이터를 제거, 분류(parsing) 및 표준화하고, 조립된 데이터 내의 개인들 및 사업체 엔티티들에 관한 정보에 대한 데이터 유효화를 실행하고;
(c) 소스 레코드 위의 사업체 엔티티 데이터와 가장 유사한 후보 사업체 엔티티를 검색, 평가 및 선택하고, 따라서 사업체 엔티티들에 관한 데이터를 유지하는 미리 개발된 데이터 저장소로부터 사업체 엔티티 매치를 생성하고, 사업체 엔티티 매치의 품질에 대한 정보를 유지하고;
(d) 소스 레코드 위의 개인에 대해 가장 유사한 후보 개인을 검색, 평가, 및 선택하고, 따라서 개인들에 관한 데이터를 유지하는 미리 개발된 데이터 저장소로부터 개인 매치를 생성하고 개인 매치의 품질에 대한 정보를 유지하고;
(e) 한 사람의 개인이 사업체 엔티티와 관련된 전문가 프로파일들로 소스 데이터 레코드들을 그룹화하고;
(f) 소스 데이터 레코드들을 각 개인에 대한 사업체 엔티티들에 유지된 채용 역할들(employment roles)로 그룹화하고;
(g) 각각의 프로파일 및 그것의 관련 역할 레코드들로 하나 이상의 소스 레코드들로부터 소스 데이터의 우선순위를 매기고 통합하고;
(h) 개인들, 사업체 엔티티들, 개인들과 사업체 엔티티들 간의 관계들, 관련 소스 식별자들, 및 처리일자들에 관한 데이터를 데이터 저장소에 공개하거나 저장하는 것을 포함한다.
도 1은 하나 이상의 소스들로부터 개인들 및 이들의 관련 사업체 엔티티들 및 사업체 관계들을 식별하는 통합된 정보로 데이터를 변환하는 방법의 기능 블록도.
도 2는 도 1에 도시된 제거 및 사전-자격부여 처리의 기능 블록도.
도 3은 도 1에 도시된 사업체 엔티티 처리 및 개인 아이덴터티 매칭 처리(125)에 의해 수행되는 동작들의 기능 블록도.
도 4는 도 1의 방법을 수행하기 위한 시스템의 블록도.
도 2는 도 1에 도시된 제거 및 사전-자격부여 처리의 기능 블록도.
도 3은 도 1에 도시된 사업체 엔티티 처리 및 개인 아이덴터티 매칭 처리(125)에 의해 수행되는 동작들의 기능 블록도.
도 4는 도 1의 방법을 수행하기 위한 시스템의 블록도.
하나 이상의 도면에 공통인 구성요소 또는 특징은 도면들 각각에 동일한 참조 번호로 표시된다.
도 1은 하나 이상의 소스들로부터의 데이터를 개인들 및 이들의 관련 사업체 엔티티들 및 사업체 관계들을 식별하는 통합된 정보로 변환하는 방법(100)의 기능 블록도이다. 방법(100)은 3개의 일반적인 동작 단계들, 즉 (1) 어셈블리, 클리닝 및 사전-자격부여 단계(101), (2) 검색, 평가, 선택 및 매칭 단계(110), 및 (3) 프리젠테이션 및 유지 단계(134)를 구비한다.
어셈블리, 클리닝 및 사전-자격부여 단계(101)는 소스들(105)로부터 데이터를 수집하는 단계, 및 제거 및 사전-자격부여 처리(115)를 수행하는 단계를 포함한다. 검색, 평가, 선택 및 매칭 단계(110)는 사업체 엔티티 매칭 처리(120), 개인 아이덴터티 매칭 처리(125), 역할 식별 처리(127), 및 통합 처리(130)를 포함한다. 프리젠테이션 및 유지 단계(134)는 관리 데이터 저장소(135)와 관련된 동작들을 포함한다.
소스들(105)은 개인, 즉, 사람, 및 개인이 소속된 사업체에 대한 데이터의 소스들이다. 즉, 소스들(105)은 정보 예컨대 개인 아이덴터티 데이터, 사업체 엔티티 데이터, 또는 이들의 조합을 포함한다. 데이터는 개인의 이름, 사업체 이름, 사업체 주소, 직위, 및 전화 번호와 같은 정보를 구비할 수 있다. 데이터는 외생 활동들(exogenous activities)을 통해, 예를 들어 데이터를 구매하여, 또는 내생 활동들(endogenous activities)을 통해, 예컨대 내부 파일들을 액세스하여 얻어질 수 있다. 소스들(105)은 복수의 소스들, 예컨대, 소스 1 내지 소스 N을 포함한다. 소스 1은 레코드(106)를 포함하고, 소스 2는 레코드(107)를 포함한다. 도 1에서, 소스들(105)은 복수의 소스들을 포함하지만, 방법(100)은 단일 데이터 구조, 예컨대, 단일 레코드를 포함하는 단일 소스로부터의 데이터에 대해 동작할 수 있는 것으로서 고려된다.
간단히, 방법(100)은 소스들(105)로부터 개인들 및 사업체 엔티티들과 관련된 복수의 데이터를 어셈블리하고, 사업체 엔티티들 및 사업체 관계들의 정황에서 독특하게 관련된 개인들을 식별하는 프로파일들을 생성한다. 프로파일들은 관리 데이터 저장소(135)에 프로파일들(140)로서 저장된다.
도 2는 제거 및 사전-자격부여 처리(115)의 기능 블록도이다. 제거 및 사전-자격부여 처리(115)는 하나 이상의 데이터 요소들 또는 레코드들 또는 레코드들의 형태로 소스들(105)로부터 데이터를 얻고, 표준화 처리(205), 제거 처리(210) 및 유효화 처리(215)를 수행한다. 표준화 처리(205) 및 제거 처리(210)는 각각, 사업체 이름, 어드레스, 및 사업체 전화 번호를 포함하지만 이에 한정되지 않는 인입 소스 레코드 각각에 있는 데이터 요소들을 표준화 및 제거하기 위해 이용된다. 표준화 처리(205) 및 제거 처리(210)를 실행함에 있어서, 미리 정의된 허용 기준을 충족시키는 레코드들만이 추가 처리를 위해 수용된다. 미리 정의된 허용 기준은 데이터가 추가의 처리를 위해 적합한지의 여부를 결정하기 위한 임의의 원하는 기준, 예컨대 미국 전화 번호가 10자리를 가져야한다는 임의의 원하는 기준일 수 있다.
표준화 처리(205)는 레코드에 포함된 데이터 요소들을 표준화한다. 예를 들어, 표준화 처리(205)는 (a) 물리적 어드레스 데이터 요소가 이용 가능하지 않은 경우들에 메일링 어드레스에 대한 물리적 어드레스를 확립하는 것, (b) 적절한 국가 코드들을 소스들(105)로부터의 데이터에 식별하고 할당하는 것, 또는 (c) 소스들(105)로부터의 데이터로 표현되는 주어진 개인이 갖는 사업체 역할을 식별하는 표준화된 숫자 코드를 발생 및 할당하는 것 중 하나 이상을 행할 수 있다.
제거 처리(210)는 원치 않는, 불필요(superfluous) 또는 무관한 데이터를 제거한다. 예를 들어, 제거 처리(210)는, (a) 셀 전화 번호들 및 팩스 번호들을 검색 및 제거하는 것, (b) 비표준 성 이름 접미사들을 식별 및 제거하는 것, 또는 (c) 사용할 수 없는 도메인들을 갖는 이메일 주소를 식별하고 제거하는 것 중 하나 이상을 행할 수 있다.
유효화 처리(215)는 레코드에 있는 다양한 데이터 요소들을 유효화한다. 예를 들어 유효화 처리(215)는, (a) 소스들(105)로부터 얻은 주어진 사업체 내의 주어진 개인의 현재의 역할 및 전화 번호를 확인하는 것, 또는 (b) 소스들(105)로부터의 데이터에 있는 이메일 주소들에 대해 서버 대 서버 이메일 어드레스 검증을 실행하는 것 중 하나 이상을 행할 수 있다.
따라서, 제거 처리(210) 및 유효화 처리(215)는 무효인 소스들(105)로부터 데이터 및 레코드들을 식별하고 그것이 더 처리되지 않도록 무효 데이터 및 레코드들을 제거한다.
도 3은 사업체 엔티티 매칭 처리(120) 및 개인 아이덴터티 매칭 처리(125)에 의해 수행되는 동작들의 기능 블록도이다. 예시적인 목적을 위해, 레코드(106)가 처리되는 것으로 가정한다.
사업체 엔티티 매칭 처리(120) 및 개인 아이덴터티 매칭 처리(125)는 소스 레코드(106)에 있는 데이터와 가장 유사한 이전에 개발된 데이터 저장소들로부터 사업체 엔티티 및 개인 아이덴터티 정보를 검색, 평가 및 선택한다.
사업체 엔티티 매칭 처리(120)는 제거 및 사전-자격부여 처리(115)에 의해 조장된 것들로부터 레코드(106)를 검색하고, 특정 사업체 엔티티와 관련된 레코드(106)에 있는 데이터를 식별하고, 상기 특정 사업체 엔티티에 대한 추가 정보에 대한 사업체 엔티티 데이터 저장소(305)를 질문한다. 사업체 엔티티 매칭 처리(120)는 소스 레코드(106)와 관련된 적절한 사업체를 식별하고 매치가 식별된 때 고유 식별자, 매치 등급 스트링, 매치 데이터 프로파일, 및 확신 코드를 적용한다(본원에 전체가 참조로서 포함되는 미국 특허 제 7,392,240 호(Scriffignano 등)를 참조).
고유 식별자는 주제가 모든 다른 주제들로부터 구별될 수 있도록 주제를 식별하는 다문자 코드이다. 주어진 고유 식별자는 단지 한번 이용될 수 있다. 바람직하게는, 고유 식별자는 지속적이고, 즉, 그것은 단지 일회 할당되고 결코 재사용되지 않는다. 그와 같은 것으로서, 일단 고유 식별자가 주제에 할당되면, 그 고유 식별자는 단지 그 특별한 주제를 식별할 것이다. 데이터 유니버설 넘버링 시스템(DUNS; Data Universal Numbering System) 번호는 그와 같은 고유 식별자로서 기능할 수 있다.
매치 등급 스트링은 레코드의 데이터 필드들에 대한 매치 품질을 표시하는 등급의 스트링이다. 예를 들어, 레코드(106)는 2개의 필드들을 포함하고, 사업체 엔티티 매칭 처리(120)는 2개의 필드들을 사업체 엔티티 데이터 저장소(305)에 있는 레코드에 매칭시키려 시도하는 것으로 가정한다. 또한, 제1 필드에 있는 데이터가 정확한 매치이고, 제2 필드에 있는 데이터는 단지 부분 매치인 것으로 가정한다. 그와 같은 것으로서, 제1 필드의 매치는 제2 필드의 매치보다 더 양호한 매치 등급을 받을 만한 것으로 가정한다.
매치 데이터 프로파일은 2개의 레코드들의 특별한 요소들이 2개의 레코드들의 매치의 결정에 사용되었다는 것을 표시하는 코드이다. 예를 들어, 우리는 2개의 레코드들의 각각이 동일한 회사 사장, 또는 동일한 상호, 또는 동일한 전 사업체명을 표시하는 것으로 인식함으로써, ABC 컴퍼니에 대한 제2 레코드에 매칭되는 ABC 컴퍼니에 관한 제1 레코드를 가지는 것으로 가정한다. 따라서, 매치 데이터 프로파일은 매치가 사장, 또는 상호, 또는 전 사업체명의 매치에 기초하여 만들어진 것을 표시할 수 있다.
확신 코드는 정확한 매치의 확실성도를 표시한다.
사업체 엔티티 데이터 저장소(305)는 정확도에 대해 이전에 개발되고 확인된 사업체에 대한 정보의 데이터베이스이다. 사업체 엔티티 데이터 저장소(305) 내에 포함된 사업체 정보의 예들은 사업체의 법적 이름, 상호들, 메일링 어드레스, 물리적 어드레스, 및 주 전화 번호를 포함할 수 있다. 사업체 엔티티 데이터 저장소(305)는, 사업체 엔티티 매칭 처리(120)로부터의 질문에 응답하여, 사업체 엔티티 매칭 처리(120)가 레코드(106)에 식별된 사업체와 매칭된 것으로서 간주되는 사업체 데이터를 복귀시킨다. 사업체 엔티티 데이터 저장소(305)로부터의 사업체 데이터는 또한 사업체에 대한 고유 식별자, 예컨대 DUNS 번호, 즉 고유 사업체 식별자를 포함한다.
따라서, 사업체 엔티티 매칭 처리(120)는 레코드(106)에 있는 대응하는 데이터에 가장 가까운 매치인 데이터의 세트를 선택한다. 예를 들어, 사업체 엔티티 매칭 처리(120)는 사업체 데이터 레코드(106)와 사업체 엔티티 데이터 저장소(305)에 있는 데이터 간의 최선의 매치를 발견한다. 이 후 사업체 엔티티 매칭 처리(120)는 레코드(106)에 고유 사업체 식별자, 및 이후 통합 처리(130)에 사용되는 다른 정보(매치 등급 스트링, 매치 데이터 프로파일, 및 확신 코드와 유사한)를 첨부한다. 이후 사업체 엔티티 매칭 처리(120)는 레코드(106)를 개인 아이덴터티 매칭 처리(125)로 전송한다.
개인 아이덴터티 매칭 처리(125)는 레코드(106)를 수신하고 특정 개인 아이덴터티, 즉 특정 사람과 관련된 속성들인 레코드(106)에 있는 데이터를 식별하고, 그 특정 사람에 대한 더 많은 정보를 개인 아이덴터티 데이터 저장소(310)에 질의한다. 개인 아이덴터티 매칭 처리(125)는 레코드(106)와 가장 가능성 있게 관련된(most likely associated) 개인을 식별하기 위해 사업체 엔티티 매칭 처리(120)에 의해 이용되는 것과 유사한 매치 처리를 이용한다.
개인 아이덴터티 데이터 저장소(310)는 정확도에 대해 이전에 개발되고 확인된 개인들에 대한 정보의 데이터베이스이다. 개인 아이덴터티 데이터 저장소(310)에 포함된 개인 아이덴터티 정보의 예들은 이름, 두번째 이름, 성, 생월(birth month), 생일, 생년, 거주시, 및 거주주(state of residence)를 포함한다. 개인 아이덴터티 데이터 저장소(310)는, 개인 아이덴터티 매칭 처리(125)로부터의 질의에 응답하여, 개인 아이덴터티 매칭 처리(125)가 레코드(106)에서 식별된 개인에 매칭된 것으로 간주된 개인 아이덴터티 데이터를 복귀시킨다. 개인 아이덴터티 데이터 저장소(310)로부터의 개인 아이덴터티 데이터는 또한 개인에 대한 고유 식별자, 즉 고유 개인 식별자를 포함한다.
따라서, 개인 아이덴터티 매칭 처리(125)는 레코드(106)에 있는 대응하는 데이터에 가장 가까운 매치인 데이터를 선택한다. 예를 들어, 개인 아이덴터티 매칭 처리(125)는 레코드(106)에 있는 개인에 대한 데이터와 개인 아이덴터티 데이터 저장소(310)에 있는 데이터 간의 최선의 매치를 발견한다. 이후 개인 아이덴터티 매칭 처리(125)는 레코드(106)에 이후 통합 처리(130)에 이용되는 고유 개인 식별자, 매치 등급 스트링, 매치 데이터 프로파일, 및 확신 코드를 첨부한다. 이후 개인 아이덴터티 매칭 처리(125)는 레코드(106)를 역할 식별 처리(127)에 전송한다.
도 1를 다시 참조하라.
역할 식별 처리(127)는 레코드(106)에 고유 역할 식별자를 할당한다. 고유 역할 식별자는 특별한 사업체에서 특별한 사람의 특별한 역할을 식별하는 고유 식별자이다. 고유 역할 식별자는 표준화 처리(205)에 할당된 역할 코드, 및 개인 아이덴터티 매칭 처리(125)에 할당된 고유 개인 식별자에 기초한다.
레코드(107)는 레코드(106)와 같은 종류의 개인에 관한 데이터를 포함하지만, 레코드(107)에 있는 데이터는 레코드(106)에 있었던 데이터와 동일하지 않다고 가정한다. 레코드(107)는 레코드(106)에서와 같은 사업체 데이터를 포함할 수 있거나 포함하지 않을 수 있다. 방법(100)은 레코드(106)의 것과 유사한 방식으로 레코드(107)를 보유하고, 이와 같은 것으로, 레코드(107)에 동일한 개인 아이덴터티 정보 및 개인에 대한 고유 식별자를 첨부하고, 또한 사업체 정보, 고유 사업체 식별자, 및 레코드(107)에 있는 사업체 정보에 적당한 고유 역할 식별자를 첨부하고, 이것은 레코드(106)에 있는 사업체에 대한 사업체 정보 및 고유 사업체 식별자와 동일하거나 동일하지 않을 수 있다. 이후 방법(100)은 레코드(107)를 잠정 스토리지(interim storage), 즉, 잠정 저장소(145)에 저장한다.
통합 처리(130)는 사업체 엔티티 매칭 처리(120), 개인 아이덴터티 매칭 처리(125), 및 역할 식별 처리(127)에 의해 처리된 레코드들을 그룹으로 나누고, 우선권을 부여하고 종합하고, 주어진 개인 사업체 역할, 관계들 및 하나 이상의 사업체 엔티티들과의 연관성들의 복합 뷰(composite view)을 제공하는 복합 레코드를 구축한다. 통합 처리(130)는 잠정 저장소(145)로부터 레코드들(106, 107)을 얻고, 사업체 엔티티 매칭 처리(120), 개인 아이덴터티 매칭 처리(125), 및 역할 식별 처리(127)에 의해 처리된 다른 레코드들과 관련하여 레코드들(106, 107)을 컴파일하고 순위를 매긴다(rank). 그러나, 본 논의를 위해, 우리는 레코드들(106, 107)의 고려로 우리의 논의를 한정할 것이다.
통합 처리(130)는 사업체 엔티티 매칭 처리(120)에 의해 할당된 고유 사업체 식별자, 개인 아이덴터티 매칭 처리(125)에 의해 할당된 고유 개인 식별자, 및 역할 식별 처리(127)에 의해 할당된 고유 역할 식별자에 기초하여 동일한 고유 개인에 속하는 것으로서 레코드들(106, 107)을 식별하여, 프로파일(132)을 생성한다.
통합 처리(130)는 역할, 직위, 및 프로파일(132)과 관련된 사업체의 위치들과 같은 전문 속성들을 그룹으로 나누고, 사업체 엔티티 매칭 처리(120) 및 개인 아이덴터티 매칭 처리(125) 동안 식별되는, 데이터의 소스(예컨대, 소스 1 대 소스 2), 데이터의 나이, 또는 매치 품질, 예컨대, 매치 등급 스트링과 같은 데이터 특징들에 기초하여 프로파일(132) 내의 속성들의 순위를 매기고 구성한다. 따라서, 프로파일(132)은 상기 개인의 복합 뷰 및 개인이 하나 이상의 사업체 엔티티들 내에서 갖는 역할 또는 역할들을 제공하는 주어진 고유 개인에 대한 컴파일링된 레코드이다.
관리 데이터 저장소(135)는 통합 처리(130)로부터 프로파일(132)을 수신하고, 그것을 프로파일(142)로서 저장한다. 관리 데이터 저장소(135)는 복수의 프로파일들(140)을 보유한다. 프로파일(142)은 복수의 프로파일들(140) 중 하나이다.
검사로, 방법(100)은 (i) 개인의 아이덴터티, 사업체의 이름, 및 사업체에서의 개인의 역할을 포함하는 레코드를 수신하고, (ii) 레코드(106)를 사업체에 대한 고유 사업체 식별자를 제공하는 사업체 엔티티 데이터 저장소(305)에 있는 데이터에 매칭시키고, (iii) 레코드(106)를 개인에 대한 고유 개인 식별자를 제공하는 개인 아이덴터티 데이터 저장소(310)에 있는 데이터에 매칭시키고, (iii) 레코드(106)에 (a) 고유 사업체 식별자, (b) 고유 개인 식별자, 및 (c) 사업체에서의 개인의 역할에 대한 고유 역할 식별자를 첨부하고, (iv) 레코드(106)를 고유 사업체 식별자, 고유 개인 식별자, 및 고유 역할 식별자에 기초하여 레코드(106)를 레코드(107)에 매칭시키고, (v) 레코드들(106, 107)을 얻어진 레코드, 즉, 프로파일(132)로 통합한다.
방법(100)에 있어서, 사업체 엔티티 매칭 처리(120) 및 개인 아이덴터티 매칭 처리(125)는 사업체 엔티티 매칭 처리(120)에 이은 개인 아이덴터티 매칭 처리(125)의 순서로 실행된다. 그러나, 이들 2개의 처리는 개인 아이덴터티 매칭 처리(125)에 이은 사업체 엔티티 매칭 처리(120)의 순서로 실행되고, 또는 서로 동시에 실행될 수 있다. 또, 방법(100)은 제2 레코드를 처리하기 전 제1 레코드의 처리를 반드시 완성할 필요는 없지만, 대신, 복수의 레코드들을 동시에 처리할 수 있다.
도 4는 방법(100)을 수행하기 위해 시스템(400)의 블록도이다. 시스템(400)은 네트워크(425), 예컨대, 인터넷에 결합된 컴퓨터(405), 예컨대 서버를 구비한다.
컴퓨터(405)는 프로세서(410), 및 메모리(415)를 구비한다. 비록 컴퓨터(405)가 독립 장치(standalone device)로서 본원에 표현되지만, 그와 같은 것에 한정되지 않지만, 대신 분산 처리 시스템 내의 다른 장치들(도시하지 않음)에 결합될 수 있다.
프로세서(410)는 명령들에 응답하고 실행하는 로직 회로(logic circuitry)로 구성되는 전자 장치이다.
메모리(415)는 프로세서(410)에 의해 판독 가능하고 실행 가능한 데이터 및 명령들 및 따라서 프로세서(410)의 제어 동작들을 포함하는 장치이다. 메모리(415)는 랜덤 액세스 메모리(RAM), 하드 드라이브, 판독 전용 메모리(ROM), 또는 이들의 조합으로 구현될 수 있다. 메모리(415)의 구성요소들 중 하나는 프로그램 모듈(420)이다.
프로그램 모듈(420)은 프로세서(410)로 하여금 본원에 기재된 방법들을 실행하게 하는 명령들을 포함한다. 예를 들어, 프로그램 모듈(420)의 제어 하에서, 프로세서(410)는 제거 및 사전-자격부여 처리(115), 사업체 엔티티 매칭 처리(120), 개인 아이덴터티 매칭 처리(125), 역할 식별 처리(127), 및 통합 처리(130)의 동작들을 수행한다.
본원에서 용어 "모듈(module)"은 독립 구성요소로서 또는 복수의 종속 구성요소들의 통합 구성으로서 구현될 수 있는 기능 동작을 나타내기 위해 사용된다. 따라서, 프로그램 모듈(420)은 단일 모듈로서 또는 서로 협력하여 동작하는 복수의 모듈들로서 구현될 수 있다. 따라서, 제거 및 사전-자격부여 처리(115), 사업체 엔티티 매칭 처리(120), 개인 아이덴터티 매칭 처리(125), 역할 식별 처리(127), 및 통합 처리(130) 각각은 독립 처리 또는 종속 처리의 계층(hierarchy)으로서 구성될 수 있다.
게다가, 비록 프로그램 모듈(420)은 본원에 메모리(415)에 설치되는 것으로, 그러므로 소프트웨어로 구현되는 것으로서 기재되지만, 그것은 하드웨어(예컨대, 전자 회로), 팜웨어(firmware), 소프트웨어, 또는 이들의 조합 중 어느 하나로 구현될 수 있다.
네트워크(425)를 통해, 프로세서(410)는 소스들(105), 사업체 엔티티 데이터 저장소(305), 개인 아이덴터티 데이터 저장소(310), 잠정 저장소(145), 및 관리 데이터 저장소(135)의 각각과 통신한다. 예를 들어, 프로세서(410)는 소스들(105)로부터 데이터를 판독하고, 질의하고 사업체 엔티티 데이터 저장소(305) 및 개인 아이덴터티 데이터 저장소(310)로부터 데이터를 수신하고, 프로파일(132)을 관리 데이터 저장소(135)에 출력한다. 비록 사업체 엔티티 데이터 저장소(305), 개인 아이덴터티 데이터 저장소(310), 잠정 저장소(145), 및 관리 데이터 저장소(135)는 이산 데이터베이스들인 것으로 도 4에 표현되지만, 이들은 단일 데이터베이스 시스템으로 구현될 수 있거나 복수의 데이터베이스 시스템들에 걸쳐 분포될 수 있다.
프로그램 모듈(420)이 메모리(415)에 이미 로딩된 것으로 나타내지만, 그것은 메모리(415)로의 후속 로딩을 위해 저장 매체(430) 위에 구성될 수 있다. 저장 매체(430)는 또한 컴퓨터 프로그램으로 인코딩되는 컴퓨터-판독 가능 매체이고, 유형(tangible form)으로 저장 매체 위에 프로그램 모듈(420)을 저장하는 임의의 통상의 저장 매체일 수 있다. 저장 매체(430)의 예는 플로피 디스크, 컴팩트 디스크, 자기 테이프, 판독 전용 메모리, 광 스토리지 매체(optical storage media), 유니버설 시리얼 버스(universal serial bus; USB) 플래쉬 드라이브, 디지털 버서타일 디스크(digital versatile disc), 또는 짚 드라이브(zip drive)를 구비한다. 대안으로, 저장 매체(430)는 원격 스토리지 시스템에 배치되고 네트워크(425)를 통해 컴퓨터(405)에 결합되는 랜덤 액세스 메모리, 또는 다른 유형의 전자 스토리지일 수 있다.
이하의 표 1은 레코드들(106, 107)을 처리하는 방법(100)의 예를 제공한다. 이 예에서, 방법(100)은 레코드들(106, 107)을 동시에 처리하는 것으로 가정한다. 레코드들(106, 107)에 있는 데이터의 수정들은 볼드체(bold font)로 나타낸다. 비록 표 1은 제거 및 사전-자격부여 처리(115), 사업체 엔티티 매칭 처리(120), 개인 아이덴터티 매칭 처리(125), 역할 식별 처리(127), 및 통합 처리(130)가 특정 동작들을 수행하는 것을 나타내지만, 실제로, 동작들은 프로세서(410)에 의해 수행된다.
처리 단계 | 활동 | 레코드의 상태/프로파일 | |
1 | 레코드(106)는 소스들(105)에 있음 | 제거 & 사전 자격부여 처리(115)로 들어가기 위해 대기 | (레코드 106) 존 스미스 사장 ABC(주) 350 5번가 수이트7712 뉴욕, NY 10118 (917) 555-5555 jsmith@abcine.com 생월 01 생일 27 생년 1975 마지막 4자리 SSN: |
2 | 레코드(107)는 소스들(105)에 있음 | 제거 & 사전 자격부여 처리(115)로 들어가기 위해 대기 | (레코드 107) 조나단 알. 스미스 II 제작자 DEF(주) 160 콜럼버스 애비뉴 뉴욕, NY 10023 (212) 555-1100 jsmith@defllc.com 생월 01 생일 27 생년 1975 마지막 4자리 SSN: |
3 | 제거 & 사전-자격부여 처리(115) | 제거 & 사전-자격부여 처리(115)는 레코드(106)로부터 셀 전화번호를 식별하고 제거한다. 주소는 표준화된다. 이메일은 유효하다. "사장"의 직위에 기초한 역할 코드가 첨부된다. 레코드(106)로 이행한다. |
(레코드 106) 존 스미스 사장 ABC(주) 350 5번가 수이트7712 뉴욕, NY 10018 jsmith@abcine.com 생월 01 생일 27 생년 1975 마지막 4자리 SSN: 역할 코드: 400 |
4 | 제거 & 사전-자격부여 처리(115) | 제거 & 사전-자격부여 처리(115)는 레코드(107)로부터 이름 접미사를 제거한다. 주소는 표준화된다. 이메일은 유효하다. "제작자"의 직위에 기초한 역할 코드가 첨부된다. 레코드(107)로 이행한다. | (레코드 107) 조나단 알. 스미스 제작자 DEF(주) 160 콜럼버스 애비뉴 뉴욕, NY 10023 (212) 555-1100 jsmith@defllc.com |
5 | 사업체 엔티티 매칭 처리(120) | 사업체 엔티티 매칭 처리(120)는 레코드(106)에 있는 사업체 데이터와 가장 가깝게 매치하는 데이터에 대해 사업체 엔티티 데이터 저장소(305)에 질의한다. 사업체 엔티티 데이터 저장소(305)는 응답을 복귀시킨다. 레코드(106)에 있는 사업체 데이터는 사업체 엔티티 데이터 저장소(305)에 의해 공급되는 유효 데이터로 재기록되고 고유 사업체 식별자(예컨대 DUNS 번호)가 할당된다. | (레코드 106) 존 스미스 사장 아비드 베이스볼 카드(주) 350 5번가 수이트7700 뉴욕, NY 10118 (212) 555-1010 jsmith@abcine.com 생월 01 생일 27 생년 1975 마지막 4자리 SSN: 역할 코드: 400 고유 사업체 식별자: |
6 | 사업체 엔티티 매칭 처리(120) | 사업체 엔티티 매칭 처리(120)는 레코드(107)에 있는 사업체 데이터와 가장 가깝게 매치하는 데이터에 대해 사업체 엔티티 데이터 저장소(305)에 질의한다. 사업체 엔티티 데이터 저장소(305)는 응답을 복귀시킨다. 레코드(107)에 있는 사업체 데이터는 사업체 엔티티 데이터 저장소(305)에 의해 공급되는 유효 데이터로 재기록되고 고유 사업체 식별자(예컨대 DUNS 번호)가 할당된다. | (레코드 107) 조나단 알. 스미스 제작자 다안 익사이팅 풋볼 엘엘시 1600 브로드웨이 뉴욕, NY 10023 (212) 555-1100 jsmith@abcine.com 생월 01 생일 27 생년 1975 마지막 4자리 SSN: 역할 코드: 300 고유 사업체 식별자: 234567890 |
7 | 개인 아이덴터티 매칭 처리(125) | 개인 아이덴터티자 매칭 처리(125)는 레코드(106)에 있는 개인 아이덴터티 데이터와 가장 가깝게 매치하는 데이터에 대해 개인 아이덴터티 데이터 저장소(310)에 질의한다. 개인 아이덴터티 데이터 자장소(310)는 응답을 복귀시킨다. 레코드(106)에 있는 개인 아이덴터티 데이터는 개인 아이덴터티 데이터 저장소(310)에 의해 공급된 유효 데이터로 재기입되고 고유 개인 식별자가 할당된다. | (레코드 106) 조나단 알. 스미스 사장 아비드 베이스볼 카드(주) 350 5번가 수이트7700 뉴욕, NY 10118 (212) 555-1010 jsmith@abcine.com 생월 01 생일 27 생년 1975 마지막 4자리 SSN: 0101 처음 3자리 SSN: 057 역할 코드: 400 고유 사업체 식별자: 123456789 고유 개인 식별자: 3456789012345 |
8 | 개인 아이덴터티 매칭 처리(125) | 개인 식별자 매칭 처리(125)는 레코드(107)에 있는 개인 아이덴터티 데이터와 가장 가깝게 매치하는 데이터에 대해 개인 아이덴터티 데이터 저장소(310)에 질의한다. 개인 아이덴터티 데이터 자장소(310)는 응답을 복귀시킨다. 레코드(107)에 있는 개인 아이덴터티 데이터는 개인 아이덴터티 데이터 저장소(310)에 의해 공급된 유효 데이터로 재기입되고 고유 개인 식별자가 할당된다. | (레코드 107) 조나단 알. 스미스 제작자 다안 익사이팅 풋볼 엘엘시 1600 브로드웨이 뉴욕, NY 10023 (212) 555-1100 jsmith@defllc.com 생월 01 생일 27 생년 1975 마지막 4자리 SSN: 0101 처음 3자리 SSN: 057 역할 코드: 300 고유 사업체 식별자: 234567890 고유 개인 식별자: 3456789012345 |
9 | 역할 식별 처리(127) | 역할 식별 처리(127)는, 레코드(106)에, 표준화 처리(205)에서 할당된 역할 코드에 기초한 고유 역할 식별자, 사업체 엔티티 매칭 처리(120)에서 할당된 고유 사업체 식별자, 및 개인 아이덴터티 매칭 처리(125)에서 할당된 고유 개인 식별자를 할당한다. | (레코드 106) 조나단 알. 스미스 사장 아비드 베이스볼 카드(주) 350 5번가 수이트7700 뉴욕, NY 10118 (212) 555-1010 jsmith@abcine.com 생월 01 생일 27 생년 1975 마지막 4자리 SSN: 0101 처음 3자리 SSN: 057 역할 코드: 400 고유 사업체 식별자: 123456789 고유 개인 식별자: 3456789012345 고유 역할 식별자: 4567890123456 |
10 | 역할 식별 처리(127) | 역할 식별 처리(127)는, 레코드(106)에, 표준화 처리(205)에서 할당된 역할 코드에 기초한 고유 역할 식별자, 사업체 엔티티 매칭 처리(120)에서 할당된 고유 사업체 식별자, 및 개인 아이덴터티 매칭 처리(125)에서 할당된 고유 개인 식별자를 할당한다. | (레코드 107) 조나단 알. 스미스 제작자 다안 익사이팅 풋볼 엘엘시 1600 브로드웨이 뉴욕, NY 10023 (212) 555-1100 jsmith@defllc.com 생월 01 생일 27 생년 1975 마지막 4자리 SSN: 0101 처음 3자리 SSN: 057 역할 코드: 300 고유 사업체 식별자: 234567890 고유 개인 식별자: 3456789012345 고유 역할 식별자: 5678901234567 |
11 | 통합 처리(127) | 통합 처리(130)는 레코드들(106, 107)을 수신하고, 상이한 사업체 정황들에서 동일한 사람일 것 같은 레코드들(106, 107)을 식별한다. 통합 처리(130)는 다수의 사업체 정황들에서 고유 개인 존 스미스를 반영하는 컴파일링된 뷰를 생성하기 위해 양 레코드들에 있는 정보를 그룹화하고 순위를 매기고 프로파일(132)을 관리 데이터 저장소(135)에 제공한다. | (프로파일 132) 조나단 알. 스미스 사장 아비드 베이스볼 카드(주) 350 5번가 수이트7700 뉴욕, NY 10118 (212) 555-1010 jsmith@abcine.com 생월 01 생일 27 생년 1975 마지막 4자리 SSN: 0101 처음 3자리 SSN: 057 역할 코드: 400 고유 사업체 식별자: 123456789 고유 개인 식별자: 3456789012345 고유 역할 식별자: 4567890123456 조나단 알. 스미스 제작자 다안 익사이팅 풋볼 엘엘시 1600 브로드웨이 뉴욕, NY 10023 (212) 555-1100 jsmith@defllc.com 생월 01 생일 27 생년 1975 마지막 4자리 SSN: 0101 처음 3자리 SSN: 442 역할 코드: 300 고유 사업체 식별자: 234567890 고유 개인 식별자: 3456789012345 고유 역할 식별자: 5678901234567 |
12 | 관리 데이터 저장소(135) | 관리 데이터 저장소(135)는 프로파일(132)을 수신하고, 그것을 프로파일(142)로서 저장한다. 관린 데이터 저장소(135)는 액세스의 다양한 방법들 및 다양한 사업체 요구들에 대한 프로파일들(140)을 유지한다. | (프로파일 XXX ) 조나단 알. 스미스 고유 개인 식별자: 3456789012345 사장 아비드 베이스볼 카드(주) 350 5번가 수이트7700 뉴욕, NY 10118 (212) 555-1010 jsmith@abcine.com 역할 코드: 400 고유 사업체 식별자: 123456789 고유 역할 식별자: 4567890123456 제작자 다안 익사이팅 풋볼 엘엘시 1600 브로드웨이 뉴욕, NY 10023 (212) 555-1100 역할 코드: 300 고유 사업체 식별자: 234567890 고유 역할 식별자: 5678901234567 |
본원에 기재된 기술들은 예시이고, 본 개시내용에 대해 어떤 특별한 제한을 부여하는 것으로 해석되지 않아야 한다. 다양한 대안들, 조합들 및 변경들이 이 기술 분야에서 숙련된 사람들에 의해 생각될 수 있다는 것이 이해되어야 한다. 예를 들어, 본원에 기재된 프로세스와 관련된 단계들은, 달리 단계들 자신들에 의해 특정되거나 지시되지 않는다면 임의의 순서로 수행될 수 있다. 본 개시내용은 첨부된 청구항들의 범위 내에 속하는 모든 이와 같은 대안들, 수정들 및 변형들 모두 포함하도록 의도된다.
용어 "포함한다(comprises)" 또는 "포함하는(comprising)"은 기술된 특징들, 완전체들(integers), 단계들 또는 구성요소들의 존재를 특정하는 것으로서 해석되는 것이지만 하나 이상의 다른 특징들, 완전체들, 단계들 또는 구성요소들 또는 이들의 그룹들의 존재를 배제하지 않는다.
Claims (12)
- 개인의 아이덴터티, 사업체의 이름, 및 상기 사업체에서의 상기 개인의 역할을 포함하는 제1 레코드를 수신하는 단계;
상기 제1 레코드를 상기 사업체에 대한 고유 사업체 식별자를 제공하는 데이터에 매칭시키는 단계;
상기 제1 레코드를 상기 개인에 대한 고유 개인 식별자를 제공하는 데이터에 매칭시키는 단계;
상기 제1 레코드에 (a) 상기 고유 사업체 식별자, (b) 상기 고유 개인 식별자, 및 (c) 상기 사업체에서의 상기 개인의 상기 역할에 대한 고유 역할 식별자를 첨부하는 단계;
상기 제1 레코드를 상기 고유 사업체 식별자, 상기 고유 개인 식별자, 및 상기 고유 역할 식별자에 기초하여 제2 레코드에 매칭시키는 단계; 및
상기 제1 및 제2 레코드들을 얻어진 레코드에 통합하는 단계;를 포함하는 것을 특징으로 하는 방법. - 제1항에 있어서,
상기 고유 사업체 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키는 단계는 상기 제1 레코드에 있는 사업체 데이터와 데이터베이스에 있는 데이터 간의 최선의 매치를 발견하는 단계를 포함하는 것을 특징으로 하는 방법. - 제1항에 있어서,
상기 고유 개인 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키는 단계는 상기 제1 레코드에 있는 상기 개인에 대한 데이터와 데이터베이스에 있는 데이터 간의 최선의 매치를 발견하는 단계를 포함하는 것을 특징으로 하는 방법. - 제1항에 있어서,
상기 고유 사업체 식별자는 데이터 유니버설 넘버링 시스템(DUNS) 번호를 포함하는 것을 특징으로 하는 방법. - 프로세서; 및
상기 프로세서에 의해 판독 가능하고 상기 프로세서에 의해 판독될 때, 상기 프로세서로 하여금:
개인의 아이덴터티, 사업체의 이름, 및 상기 사업체에서의 상기 개인의 역할을 포함하는 제1 레코드를 수신하고;
상기 사업체에 대한 고유 사업체 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키고;
상기 개인에 대한 고유 개인 식별자를 제공하는 데이터를 상기 제1 레코드에 매칭시키고;
상기 제1 레코드에 (a) 상기 고유 사업체 식별자, (b) 상기 고유 개인 식별자, 및 (c) 상기 사업체에서의 상기 개인의 역할에 대한 고유 역할 식별자를 첨부하고;
상기 고유 사업체 식별자, 상기 고유 개인 식별자, 및 상기 고유 역할 식별자에 기초하여 상기 제1 레코드를 제2 레코드에 매칭시키고;
상기 제1 및 제2 레코드들을 얻어진 레코드에 통합하게 하는 명령들을 포함하는 메모리를 포함하는 것을 특징으로 하는 시스템. - 제5항에 있어서,
상기 프로세서로 하여금 상기 고유 사업체 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키게 하는 상기 명령들은 상기 프로세서로 하여금 상기 제1 레코드에 있는 사업체 데이터와 데이터베이스에 있는 데이터 간의 최선의 매치를 발견하게 하는 명령들을 포함하는 것을 특징으로 하는 시스템. - 제5항에 있어서,
상기 프로세서로 하여금 상기 고유 개인 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키게 하는 상기 명령들은 상기 프로세서로 하여금 상기 제1 레코드에 있는 상기 개인에 대한 데이터와 데이터 베이스에 있는 데이터 간의 최선의 매치를 발견하게 하는 명령들을 포함하는 것을 특징으로 하는 시스템. - 제5항에 있어서,
상기 고유 사업체 식별자는 데이터 유니버설 넘버링 시스템(DUNS) 번호를 포함하는 것을 특징으로 하는 시스템. - 컴퓨터-판독 가능 저장 매체로서, 상기 컴퓨터-판독 가능 저장 매체는, 프로세서에 의해 판독 가능하고 상기 프로세서에 의해 판독될 때, 상기 프로세서로 하여금:
개인의 아이덴터티, 사업체의 이름, 및 상기 사업체에서의 상기 개인의 역할을 포함하는 제1 레코드를 수신하고;
상기 사업체에 대한 고유 사업체 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키고;
상기 개인에 대한 고유 개인 식별자를 제공하는 데이터를 상기 제1 레코드에 매칭시키고;
상기 제1 레코드에 (a) 상기 고유 사업체 식별자, (b) 상기 고유 개인 식별자, 및 (c) 상기 사업체에서의 상기 개인의 역할에 대한 고유 역할 식별자를 첨부하고;
상기 고유 사업체 식별자, 상기 고유 개인 식별자, 및 상기 고유 역할 식별자에 기초하여 상기 제1 레코드를 제2 레코드에 매칭시키고;
상기 제1 및 제2 레코드들을 얻어진 레코드에 통합하게 하는 명령들을 포함하는 것을 특징으로 하는 컴퓨터-판독 가능 저장 매체. - 제9항에 있어서,
상기 프로세서로 하여금 상기 고유 사업체 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키게 하는 상기 명령들은 상기 프로세서로 하여금 상기 제1 레코드에 있는 사업체 데이터와 데이터베이스에 있는 데이터 간의 최선의 매치를 발견하게 하는 명령들을 포함하는 것을 특징으로 하는 컴퓨터-판독 가능 저장 매체. - 제9항에 있어서,
상기 프로세서로 하여금 상기 고유 개인 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키게 하는 상기 명령들은 상기 프로세서로 하여금 상기 제1 레코드에 있는 상기 개인에 대한 데이터와 데이터 베이스에 있는 데이터 간의 최선의 매치를 발견하게 하는 명령들을 포함하는 것을 특징으로 하는 컴퓨터-판독 가능 저장 매체. - 제9항에 있어서,
상기 고유 사업체 식별자는 데이터 유니버설 넘버링 시스템(DUNS) 번호를 포함하는 것을 특징으로 하는 컴퓨터-판독 가능 저장 매체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US29980210P | 2010-01-29 | 2010-01-29 | |
US61/299,802 | 2010-01-29 | ||
PCT/US2011/023069 WO2011094647A1 (en) | 2010-01-29 | 2011-01-28 | System and method for aggregation and association of professional affiliation data with commercial data content |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120139695A true KR20120139695A (ko) | 2012-12-27 |
KR101469642B1 KR101469642B1 (ko) | 2014-12-08 |
Family
ID=44319836
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127021333A KR101469642B1 (ko) | 2010-01-29 | 2011-01-28 | 전문 기관 데이터의 상업용 데이터 컨텐트와의 통합 및 연관을 위한 시스템 및 방법 |
Country Status (11)
Country | Link |
---|---|
US (1) | US8930383B2 (ko) |
EP (1) | EP2529298A4 (ko) |
JP (1) | JP5753197B2 (ko) |
KR (1) | KR101469642B1 (ko) |
CN (1) | CN102782642B (ko) |
AU (1) | AU2011210597B2 (ko) |
BR (1) | BR112012018653B1 (ko) |
CA (1) | CA2787593C (ko) |
MX (1) | MX2012008714A (ko) |
RU (1) | RU2546317C2 (ko) |
WO (1) | WO2011094647A1 (ko) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8732004B1 (en) | 2004-09-22 | 2014-05-20 | Experian Information Solutions, Inc. | Automated analysis of data to generate prospect notifications based on trigger events |
US9690820B1 (en) | 2007-09-27 | 2017-06-27 | Experian Information Solutions, Inc. | Database system for triggering event notifications based on updates to database records |
US20100174638A1 (en) | 2009-01-06 | 2010-07-08 | ConsumerInfo.com | Report existence monitoring |
MX2012003721A (es) | 2009-09-30 | 2012-06-28 | Evan V Chrapko | Sistemas y metodos para analitica de datos graficos sociales para determinar conectividad dentro de una comunidad. |
US20110099164A1 (en) | 2009-10-23 | 2011-04-28 | Haim Zvi Melman | Apparatus and method for search and retrieval of documents and advertising targeting |
US9026552B2 (en) * | 2010-01-18 | 2015-05-05 | Salesforce.Com, Inc. | System and method for linking contact records to company locations |
US9836773B2 (en) * | 2011-05-22 | 2017-12-05 | Ariba, Inc. | Evaluation and selection of quotes of a commerce network |
US9990634B2 (en) | 2011-05-22 | 2018-06-05 | Ariba, Inc. | Managing an experience of a member organization of a collaborative commerce community through a network |
US8862543B2 (en) * | 2011-06-13 | 2014-10-14 | Business Objects Software Limited | Synchronizing primary and secondary repositories |
EP2752778B1 (en) * | 2013-01-08 | 2018-11-28 | Tata Consultancy Services Limited | Method and system for creating and maintaining unique data repository |
US20150142638A1 (en) * | 2013-05-02 | 2015-05-21 | The Dun & Bradstreet Corporation | Calculating a probability of a business being delinquent |
CN103699645A (zh) * | 2013-12-26 | 2014-04-02 | 中国人民银行征信中心 | 企业关联关系识别系统及其识别方法 |
CN106164896B (zh) * | 2013-12-30 | 2020-03-03 | 邓白氏公司 | 用于发现对手方关系的多维递归方法及系统 |
US9578043B2 (en) | 2015-03-20 | 2017-02-21 | Ashif Mawji | Calculating a trust score |
US11410230B1 (en) | 2015-11-17 | 2022-08-09 | Consumerinfo.Com, Inc. | Realtime access and control of secure regulated data |
US20170235792A1 (en) | 2016-02-17 | 2017-08-17 | Www.Trustscience.Com Inc. | Searching for entities based on trust score and geography |
US9679254B1 (en) | 2016-02-29 | 2017-06-13 | Www.Trustscience.Com Inc. | Extrapolating trends in trust scores |
US9721296B1 (en) | 2016-03-24 | 2017-08-01 | Www.Trustscience.Com Inc. | Learning an entity's trust model and risk tolerance to calculate a risk score |
JP6664007B2 (ja) * | 2016-04-20 | 2020-03-13 | エーエスエムエル ネザーランズ ビー.ブイ. | レコードを整合させる方法、保守のスケジュールを作成する方法、および装置 |
US20200074100A1 (en) | 2018-09-05 | 2020-03-05 | Consumerinfo.Com, Inc. | Estimating changes to user risk indicators based on modeling of similarly categorized users |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2003135A (en) | 1934-10-26 | 1935-05-28 | Bowman Products Inc | Bottle crate |
US5287648A (en) * | 1986-10-02 | 1994-02-22 | Hand Herbert H | Electrical support structure and method and apparatus for preventing crawling insects or other crawling pests from entering electrical devices mounted on support structures above ground |
US5446885A (en) * | 1992-05-15 | 1995-08-29 | International Business Machines Corporation | Event driven management information system with rule-based applications structure stored in a relational database |
GB2296147B (en) * | 1994-11-29 | 1999-06-16 | Marconi Gec Ltd | A signal processor |
US5557087A (en) * | 1995-04-13 | 1996-09-17 | Duyck; Margaret | Multiple-merchant credit card terminal |
US5664109A (en) * | 1995-06-07 | 1997-09-02 | E-Systems, Inc. | Method for extracting pre-defined data items from medical service records generated by health care providers |
US5745900A (en) * | 1996-08-09 | 1998-04-28 | Digital Equipment Corporation | Method for indexing duplicate database records using a full-record fingerprint |
US6105100A (en) * | 1998-07-17 | 2000-08-15 | International Business Machines Corporation | Method and apparatus for detecting and initializing the addition of a new client machine in a network |
US6473741B1 (en) * | 1998-10-26 | 2002-10-29 | Samuel R. Baker | Method and system for aggregation and exchange of electronic tax information |
AU3477500A (en) * | 1999-02-02 | 2000-09-04 | Smithkline Beecham Corporation | Apparatus and method for depersonalizing information |
US6625657B1 (en) * | 1999-03-25 | 2003-09-23 | Nortel Networks Limited | System for requesting missing network accounting records if there is a break in sequence numbers while the records are transmitting from a source device |
US6751663B1 (en) * | 1999-03-25 | 2004-06-15 | Nortel Networks Limited | System wide flow aggregation process for aggregating network activity records |
US6252946B1 (en) * | 1999-06-08 | 2001-06-26 | David A. Glowny | System and method for integrating call record information |
US6539396B1 (en) * | 1999-08-31 | 2003-03-25 | Accenture Llp | Multi-object identifier system and method for information service pattern environment |
US7886221B1 (en) * | 1999-11-05 | 2011-02-08 | Decentrix, Inc. | Method and apparatus for storing web site data by web site dimensions and generating a web site having complementary elements |
US6697825B1 (en) * | 1999-11-05 | 2004-02-24 | Decentrix Inc. | Method and apparatus for generating and modifying multiple instances of element of a web site |
US20020007284A1 (en) * | 1999-12-01 | 2002-01-17 | Schurenberg Kurt B. | System and method for implementing a global master patient index |
US7328233B2 (en) * | 2000-01-19 | 2008-02-05 | Corybant, Inc. | Method and apparatus for implementing an active information model |
US20020073138A1 (en) * | 2000-12-08 | 2002-06-13 | Gilbert Eric S. | De-identification and linkage of data records |
US7171400B2 (en) * | 2001-10-04 | 2007-01-30 | Sun Microsystems, Inc. | Inheritance and relationship to directory information in an e-commerce application |
US7333966B2 (en) * | 2001-12-21 | 2008-02-19 | Thomson Global Resources | Systems, methods, and software for hyperlinking names |
CN101110021A (zh) * | 2002-03-25 | 2008-01-23 | 数据质量解决公司 | 对过程指令集进行可视化编程的方法 |
US20040078316A1 (en) * | 2002-10-16 | 2004-04-22 | E2Open Llc, A Corporation | Network directory for business process integration of trading partners |
EP1567956A4 (en) * | 2002-11-08 | 2007-12-05 | Dun & Bradstreet Inc | SYSTEM AND METHOD FOR BROWSING AND COMPARING DATA BANKS |
JP2005011049A (ja) | 2003-06-19 | 2005-01-13 | Nec Soft Ltd | データベース統合装置 |
US20060129452A1 (en) * | 2004-12-15 | 2006-06-15 | Sbc Knowledge Ventures, Lp | System and method for utilizing a multifaceted entity profile |
US7801808B1 (en) * | 2005-03-24 | 2010-09-21 | Morgan Stanley | Database structure for financial products with unique, consistent identifier for parties that assume roles with respect to the products and methods of using the database structure |
US7565489B2 (en) * | 2005-07-01 | 2009-07-21 | Microsoft Corporation | Identifying relevant data to cache |
US20070239714A1 (en) * | 2006-03-31 | 2007-10-11 | Sap Ag | System and method for identifying new business partner |
JP4881059B2 (ja) * | 2006-05-12 | 2012-02-22 | 株式会社東芝 | 個人情報管理システム及び個人情報管理プログラム |
JP2009199277A (ja) * | 2008-02-20 | 2009-09-03 | Satoshi Sagawa | 事業活動支援システム |
-
2011
- 2011-01-28 BR BR112012018653-1A patent/BR112012018653B1/pt active IP Right Grant
- 2011-01-28 KR KR1020127021333A patent/KR101469642B1/ko active IP Right Grant
- 2011-01-28 MX MX2012008714A patent/MX2012008714A/es not_active Application Discontinuation
- 2011-01-28 US US13/016,934 patent/US8930383B2/en active Active
- 2011-01-28 AU AU2011210597A patent/AU2011210597B2/en active Active
- 2011-01-28 JP JP2012551357A patent/JP5753197B2/ja active Active
- 2011-01-28 CN CN201180011500.XA patent/CN102782642B/zh active Active
- 2011-01-28 CA CA2787593A patent/CA2787593C/en active Active
- 2011-01-28 RU RU2012136829/08A patent/RU2546317C2/ru active
- 2011-01-28 WO PCT/US2011/023069 patent/WO2011094647A1/en active Application Filing
- 2011-01-28 EP EP11737798.6A patent/EP2529298A4/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
CA2787593C (en) | 2018-05-08 |
RU2546317C2 (ru) | 2015-04-10 |
CN102782642A (zh) | 2012-11-14 |
EP2529298A4 (en) | 2013-10-23 |
JP5753197B2 (ja) | 2015-07-22 |
BR112012018653B1 (pt) | 2020-12-22 |
MX2012008714A (es) | 2013-03-12 |
BR112012018653A2 (pt) | 2018-02-27 |
RU2012136829A (ru) | 2014-03-10 |
AU2011210597A1 (en) | 2012-08-09 |
US20110219034A1 (en) | 2011-09-08 |
EP2529298A1 (en) | 2012-12-05 |
JP2013518357A (ja) | 2013-05-20 |
KR101469642B1 (ko) | 2014-12-08 |
AU2011210597B2 (en) | 2014-12-04 |
US8930383B2 (en) | 2015-01-06 |
CN102782642B (zh) | 2016-02-24 |
CA2787593A1 (en) | 2011-08-04 |
WO2011094647A1 (en) | 2011-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101469642B1 (ko) | 전문 기관 데이터의 상업용 데이터 컨텐트와의 통합 및 연관을 위한 시스템 및 방법 | |
US9792324B2 (en) | Method and system for uniquely identifying a person to the exclusion of all others | |
US10025904B2 (en) | Systems and methods for managing a master patient index including duplicate record detection | |
US20180075138A1 (en) | Electronic document management using classification taxonomy | |
US10572461B2 (en) | Systems and methods for managing a master patient index including duplicate record detection | |
JP5547747B2 (ja) | 異種トラスト・モデルを備えた分散及び自律医療環境における改良されたレコード・リンケージのための自動化されたアサーション再使用 | |
CN111459985B (zh) | 标识信息处理方法及装置 | |
US8032494B2 (en) | Archiving engine | |
US20140074801A1 (en) | Data de-duplication system | |
US8832068B2 (en) | Indirect data searching on the internet | |
KR20050115238A (ko) | 데이터 통합 방법 | |
US11636078B2 (en) | Personally identifiable information storage detection by searching a metadata source | |
CN110502529B (zh) | 数据处理方法、装置、服务器及存储介质 | |
Eberle et al. | Record linkage of the linked employer-employee survey of the socio-economic panel study (SOEP-LEE) and the establishment history panel (BHP) | |
US8832067B2 (en) | Indirect data searching on the internet | |
US20130318064A1 (en) | Indirect data searching on the internet | |
JP2020035276A (ja) | 情報処理装置及び情報処理方法 | |
US20240176786A1 (en) | Context-based search of document management system | |
JP2013118498A (ja) | 電話帳管理装置及び電話帳管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20171124 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20181204 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20191126 Year of fee payment: 6 |