KR20120139695A - 전문 기관 데이터의 상업용 데이터 컨텐트와의 통합 및 연관을 위한 시스템 및 방법 - Google Patents

전문 기관 데이터의 상업용 데이터 컨텐트와의 통합 및 연관을 위한 시스템 및 방법 Download PDF

Info

Publication number
KR20120139695A
KR20120139695A KR1020127021333A KR20127021333A KR20120139695A KR 20120139695 A KR20120139695 A KR 20120139695A KR 1020127021333 A KR1020127021333 A KR 1020127021333A KR 20127021333 A KR20127021333 A KR 20127021333A KR 20120139695 A KR20120139695 A KR 20120139695A
Authority
KR
South Korea
Prior art keywords
record
business
data
unique
identifier
Prior art date
Application number
KR1020127021333A
Other languages
English (en)
Other versions
KR101469642B1 (ko
Inventor
베타니 데커
존 니코데모
킴 라운즈
안토니 스크리피냐노
카르마 하라
마이클 클레인
데이비드 하누샤크
Original Assignee
던 & 브래드스트리트, 아이엔씨.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 던 & 브래드스트리트, 아이엔씨. filed Critical 던 & 브래드스트리트, 아이엔씨.
Publication of KR20120139695A publication Critical patent/KR20120139695A/ko
Application granted granted Critical
Publication of KR101469642B1 publication Critical patent/KR101469642B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/923Intellectual property
    • Y10S707/924Patent procedure
    • Y10S707/927Validation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Abstract

(i) 개인의 아이덴터티, 사업체의 이름, 및 사업체에서의 개인의 역할을 포함하는 제1 레코드를 수신하는 단계; (ii) 제1 레코드를 사업체에 대한 고유 사업체 식별자를 제공하는 데이터에 매칭시키는 단계; (iii) 제1 레코드를 개인에 대한 고유 개인 식별자를 제공하는 데이터에 매칭시키는 단계; (iii) 제1 레코드에 (a) 고유 사업체 식별자, (b) 고유 개인 식별자, 및 (c) 사업체에서의 개인의 역할에 대한 고유 역할 식별자를 첨부하는 단계; (iv) 제1 레코드를 고유 사업체 식별자, 고유 개인 식별자, 및 고유 역할 식별자에 기초하여 제2 레코드에 매칭시키는 단계; 및 (v) 제1 및 제2 레코드들을 얻어진 레코드에 통합하는 단계를 포함하는 방법이 제공된다.

Description

전문 기관 데이터의 상업용 데이터 컨텐트와의 통합 및 연관을 위한 시스템 및 방법{SYSTEM AND METHOD FOR AGGREGATION AND ASSOCIATION OF PROFESSIONAL AFFILIATION DATA WITH COMMERCIAL DATA CONTENT}
특허 개시내용은 개인들 및 사업체에 관한 정보의 하나 이상의 소스들을 종합, 사전-자격부여 및 통합하여, 전문가 프로파일을 생성하고, 전문가 프로파일을 다른 시스템들에 의해 액세스될 수 있는 관리 데이터 저장소에 저장 및 유지하는 처리를 수행하는 시스템에 관한 것이고, 여기서 개인은 사업체의 엔티티들과 연계된다.
이 절에 기재된 접근방법들은 수행될 수 있는 접근방법들이지만 필연적으로 미리 생각되거나 수행된 접근방법들은 아니다. 그러므로, 달리 표시되지 않는다면, 이 절에 기재된 접근방법들은 이 출원에서 청구항들에 대한 종래 기술이 아닐 수 있고 이 절에 포함시키는 것에 의해 종래 기술로 인정되지 않는다.
본 문헌의 목적을 위해, 용어 "전문가(professional)"는 사업체 엔티티로서 또는 사업체 엔티티에 관한 것으로, 또는 미국 노동부 노동 통계청(US Department of Labor, the Bureau of Labor Statistics) 또는 임의의 다른 인정된 기관에 의해 나열된 임의의 역할 또는 직위에 관한 것으로 정의된다.
현재 시장에서 이용 가능한 전문가 프로파일 제품들이 있다. 그러나, 이들 제품들은 일반적으로 개인이 사업체 엔티티와 갖는 관계의 속성에 대해서 또는 개인이 전문 관계들을 가진 사업체 엔티티에 대해서보다 개인에 관한 데이터에 대해 더 많이 집중하고 있다. 이들 전문가 프로파일 제품들은 개인들에 의해 직접 제공되는 정보를 포함하는 다수의 소스들에 의존한다. 그러나, 이들 전문가 프로파일 제품들은 개인, 사업체 엔티티, 또는 개인과 사업체 또는 다수의 사업체 간의 관계들의 강인한 매칭 처리를 채용하여 개인 또는 사업체 엔티티를 고유하게 식별하지 않는다.
이들 전문가 프로파일 제품들은 전문가 프로파일들을 구축하기 위해 다양한 소스들을 액세스하지만, 다양한 소스들 각각으로부터 최상의 품질 정보를 구하기 위해 이들 소스들로부터의 데이터에 자격을 부여하기 위한 처리들을 포함하지 않는다. 몇몇 경우들에 있어서, 예를 들어 이들은 전문가 프로파일들로 적절히 유효화되고 통합될 이메일 주소들 및 직통-다이얼 전화 번호들과 같은 개인과 관련된 고급 데이터 요소들을 허용하지 않는 기술을 채용한다.
현재의 전문가 프로파일 제품들이 갖는 기술적 결함은, 비록 이들이 사업 환경에서 개인에 대한 데이터 또는 복수의 소스들로부터의 사업체와 관련된 데이터를 합병하고, 합병된 데이터를 데이터베이스에 저장할 수 있지만, 이들은 개개의 사람에 대해 하나 이상의 레코드를 우연히 생성할 수 있다는 것이다. 본 발명은 복수의 소스들로부터의 데이터를 각 개인 및 관련 사업체에 대한 고유 식별자들을 제공하는 저장소 데이터베이스들에 있는 데이터와 매칭하고, 이후 개인에 대한 데이터를 단일 레코드로 보내기 위해 고유 식별자들을 이용하는 것을 포함하는 처리에 의해 이러한 결함을 극복한다.
(i) 개인의 아이덴터티, 사업체의 이름, 및 상기 사업체에서의 상기 개인의 역할을 포함하는 제1 레코드를 수신하는 단계, (ii) 상기 제1 레코드를 상기 사업체에 대한 고유 사업체 식별자를 제공하는 데이터에 매칭시키는 단계, (iii) 상기 제1 레코드를 상기 개인에 대한 고유 개인 식별자를 제공하는 데이터에 매칭시키는 단계, (iii) 상기 제1 레코드에 (a) 상기 고유 사업체 식별자, (b) 상기 고유 개인 식별자, 및 (c) 상기 사업체에서의 상기 개인의 상기 역할에 대한 고유 역할 식별자를 첨부하는 단계, (iv) 상기 제1 레코드를 상기 고유 사업체 식별자, 상기 고유 개인 식별자, 및 상기 고유 역할 식별자에 기초하여 제2 레코드에 매칭시키는 단계, 및 (v) 상기 제1 및 제2 레코드들을 얻어진 레코드에 통합하는 단계를 포함하는 방법이 제공된다.
본 발명은 현재의 전문가 프로파일 제품들의 다양한 문제점들을 극복하고자 한다. 즉, 본 발명은 전문가가 하거나 해왔던 다수의 현재 및 과거의 역할들을 하나 이상의 사업체 엔티티들과 관련지어 전문가 프로파일들을 개인 전문가의 하나의 통일된 프로파일을 생성하고자 한다. 그것은 또한 데이터 완성도, 정확도 및 적시성(timeliness)을 보장하는 규칙적으로 실행되는 자동화 처리들의 사용을 통해 전문가 접촉 데이터 처리를 개선하고자 한다. 더욱이, 본 발명은 처리될 수 있는 접촉 레코드들의 유형 및 번호에 대한 어떠한 제한들을 제거하고자 한다. 또한, 본 발명은 데이터를 개개인에 대해 생성된 통합된 프로파일로 개인, 예컨대 전문가 이메일 주소 및 직통 전화 번호들에 관련짓고자 한다.
본 발명이 기준 기술에 비해 가지는 이점은 데이터에 대한 정확도의 고신뢰도로 전문가 프로파일들을 구축하기 위해 개인들 및 사업체에 관한 데이터의 참조 데이터베이스들에 대해 고품질 매칭 서비스들의 사용이다.
본 발명은 현재 및 이전의 전문 기관(professional affiliation) 및 접촉 정보의 다수의 소스들을 식별하고, 자격부여하고, 통합하는 작용들을 포함한다. 본 발명은 양 개인들 및 사업체 엔티티들과 관련된 소스 데이터를 유효화하고, 개인 및 관련 아이덴터티 및 개인이 가지는 역할을 포함하는 사업체 엔티티에 대한 접촉 데이터를 사업체 엔티티에 관련짓기 위한 처리들을 포함하고, 얻어진 정보는 데이터 저장소에 대한 액세스가 제공된 개인들 또는 사업체에 의해 나중 사용을 위해 데이터 저장소에 공개되거나 저장된다.
처리는 개인들 및 사업체 엔티티들에 관한 정보를 가진 확립된 데이터 저장소들에 대한 다중-소스 정보를 비교하기 위해 사용되는 매칭 처리들을 구비한다.
본 발명은 각 사업체 엔티티 및 각 개개인에 대한 고유 식별자를 포함하는 미리 유효화된 사업체 엔티티 정보를 취하고, 각 개인에 대한 고유 식별자, 및 개인이 주어진 관련 사업체 엔티티 내에서 갖는 각각의 역할에 대한 고유 식별자를 포함하는 각 역할에 대한 고유 식별자를 포함하는 미리 유효화된 개인 정보를 갖는 상기 정보를 따른다. 따라서, 처리는 사업체 엔티티, 개인 식별자, 및 역할의 각 고유값에 적용되는 고유 식별자들을 갖는 전문가 프로파일을 생성한다.
전문가 프로파일은 다른 시스템들 및 제품들에 의해 액세스될 수 있는 광범위한 데이터 저장소(comprehensive data repository)에 배치된다. 따라서 광범위한 데이터 저장소는 개인들과 사업체 엔티티들 간의 현재 및 이전의 전문 기관 및 관계들, 및 이들 관계들에 관한 특정 역할들 및 직위들에 관한 데이터를 포함한다. 또한, 광범위한 데이터 저장소는 개인들 및 사업체 엔티티들에 대한 식별, 접촉, 및 다른 유사한 데이터, 각 개인, 사업체 엔티티의 고유 식별자들, 및 이들 사이의 관계들을 포함한다. 본 발명은 다수의 데이터 소스들에 대한 광범위한 데이터 저장소 및 데이터가 완전하고, 정확하고, 현재인 것을 보장하기 위한 다른 데이터 저장소들을 평가하기 위한 처리들을 포함한다.
본 개시내용의 시스템 및 방법은:
(a) 적어도 하나의 데이터 소스로부터 개인들 및 사업체 엔티티들에 관한 복수의 데이터를 조립하고 이와 같은 조립된 데이터를 저장소에 제공하고;
(b) 데이터를 제거, 분류(parsing) 및 표준화하고, 조립된 데이터 내의 개인들 및 사업체 엔티티들에 관한 정보에 대한 데이터 유효화를 실행하고;
(c) 소스 레코드 위의 사업체 엔티티 데이터와 가장 유사한 후보 사업체 엔티티를 검색, 평가 및 선택하고, 따라서 사업체 엔티티들에 관한 데이터를 유지하는 미리 개발된 데이터 저장소로부터 사업체 엔티티 매치를 생성하고, 사업체 엔티티 매치의 품질에 대한 정보를 유지하고;
(d) 소스 레코드 위의 개인에 대해 가장 유사한 후보 개인을 검색, 평가, 및 선택하고, 따라서 개인들에 관한 데이터를 유지하는 미리 개발된 데이터 저장소로부터 개인 매치를 생성하고 개인 매치의 품질에 대한 정보를 유지하고;
(e) 한 사람의 개인이 사업체 엔티티와 관련된 전문가 프로파일들로 소스 데이터 레코드들을 그룹화하고;
(f) 소스 데이터 레코드들을 각 개인에 대한 사업체 엔티티들에 유지된 채용 역할들(employment roles)로 그룹화하고;
(g) 각각의 프로파일 및 그것의 관련 역할 레코드들로 하나 이상의 소스 레코드들로부터 소스 데이터의 우선순위를 매기고 통합하고;
(h) 개인들, 사업체 엔티티들, 개인들과 사업체 엔티티들 간의 관계들, 관련 소스 식별자들, 및 처리일자들에 관한 데이터를 데이터 저장소에 공개하거나 저장하는 것을 포함한다.
도 1은 하나 이상의 소스들로부터 개인들 및 이들의 관련 사업체 엔티티들 및 사업체 관계들을 식별하는 통합된 정보로 데이터를 변환하는 방법의 기능 블록도.
도 2는 도 1에 도시된 제거 및 사전-자격부여 처리의 기능 블록도.
도 3은 도 1에 도시된 사업체 엔티티 처리 및 개인 아이덴터티 매칭 처리(125)에 의해 수행되는 동작들의 기능 블록도.
도 4는 도 1의 방법을 수행하기 위한 시스템의 블록도.
하나 이상의 도면에 공통인 구성요소 또는 특징은 도면들 각각에 동일한 참조 번호로 표시된다.
도 1은 하나 이상의 소스들로부터의 데이터를 개인들 및 이들의 관련 사업체 엔티티들 및 사업체 관계들을 식별하는 통합된 정보로 변환하는 방법(100)의 기능 블록도이다. 방법(100)은 3개의 일반적인 동작 단계들, 즉 (1) 어셈블리, 클리닝 및 사전-자격부여 단계(101), (2) 검색, 평가, 선택 및 매칭 단계(110), 및 (3) 프리젠테이션 및 유지 단계(134)를 구비한다.
어셈블리, 클리닝 및 사전-자격부여 단계(101)는 소스들(105)로부터 데이터를 수집하는 단계, 및 제거 및 사전-자격부여 처리(115)를 수행하는 단계를 포함한다. 검색, 평가, 선택 및 매칭 단계(110)는 사업체 엔티티 매칭 처리(120), 개인 아이덴터티 매칭 처리(125), 역할 식별 처리(127), 및 통합 처리(130)를 포함한다. 프리젠테이션 및 유지 단계(134)는 관리 데이터 저장소(135)와 관련된 동작들을 포함한다.
소스들(105)은 개인, 즉, 사람, 및 개인이 소속된 사업체에 대한 데이터의 소스들이다. 즉, 소스들(105)은 정보 예컨대 개인 아이덴터티 데이터, 사업체 엔티티 데이터, 또는 이들의 조합을 포함한다. 데이터는 개인의 이름, 사업체 이름, 사업체 주소, 직위, 및 전화 번호와 같은 정보를 구비할 수 있다. 데이터는 외생 활동들(exogenous activities)을 통해, 예를 들어 데이터를 구매하여, 또는 내생 활동들(endogenous activities)을 통해, 예컨대 내부 파일들을 액세스하여 얻어질 수 있다. 소스들(105)은 복수의 소스들, 예컨대, 소스 1 내지 소스 N을 포함한다. 소스 1은 레코드(106)를 포함하고, 소스 2는 레코드(107)를 포함한다. 도 1에서, 소스들(105)은 복수의 소스들을 포함하지만, 방법(100)은 단일 데이터 구조, 예컨대, 단일 레코드를 포함하는 단일 소스로부터의 데이터에 대해 동작할 수 있는 것으로서 고려된다.
간단히, 방법(100)은 소스들(105)로부터 개인들 및 사업체 엔티티들과 관련된 복수의 데이터를 어셈블리하고, 사업체 엔티티들 및 사업체 관계들의 정황에서 독특하게 관련된 개인들을 식별하는 프로파일들을 생성한다. 프로파일들은 관리 데이터 저장소(135)에 프로파일들(140)로서 저장된다.
도 2는 제거 및 사전-자격부여 처리(115)의 기능 블록도이다. 제거 및 사전-자격부여 처리(115)는 하나 이상의 데이터 요소들 또는 레코드들 또는 레코드들의 형태로 소스들(105)로부터 데이터를 얻고, 표준화 처리(205), 제거 처리(210) 및 유효화 처리(215)를 수행한다. 표준화 처리(205) 및 제거 처리(210)는 각각, 사업체 이름, 어드레스, 및 사업체 전화 번호를 포함하지만 이에 한정되지 않는 인입 소스 레코드 각각에 있는 데이터 요소들을 표준화 및 제거하기 위해 이용된다. 표준화 처리(205) 및 제거 처리(210)를 실행함에 있어서, 미리 정의된 허용 기준을 충족시키는 레코드들만이 추가 처리를 위해 수용된다. 미리 정의된 허용 기준은 데이터가 추가의 처리를 위해 적합한지의 여부를 결정하기 위한 임의의 원하는 기준, 예컨대 미국 전화 번호가 10자리를 가져야한다는 임의의 원하는 기준일 수 있다.
표준화 처리(205)는 레코드에 포함된 데이터 요소들을 표준화한다. 예를 들어, 표준화 처리(205)는 (a) 물리적 어드레스 데이터 요소가 이용 가능하지 않은 경우들에 메일링 어드레스에 대한 물리적 어드레스를 확립하는 것, (b) 적절한 국가 코드들을 소스들(105)로부터의 데이터에 식별하고 할당하는 것, 또는 (c) 소스들(105)로부터의 데이터로 표현되는 주어진 개인이 갖는 사업체 역할을 식별하는 표준화된 숫자 코드를 발생 및 할당하는 것 중 하나 이상을 행할 수 있다.
제거 처리(210)는 원치 않는, 불필요(superfluous) 또는 무관한 데이터를 제거한다. 예를 들어, 제거 처리(210)는, (a) 셀 전화 번호들 및 팩스 번호들을 검색 및 제거하는 것, (b) 비표준 성 이름 접미사들을 식별 및 제거하는 것, 또는 (c) 사용할 수 없는 도메인들을 갖는 이메일 주소를 식별하고 제거하는 것 중 하나 이상을 행할 수 있다.
유효화 처리(215)는 레코드에 있는 다양한 데이터 요소들을 유효화한다. 예를 들어 유효화 처리(215)는, (a) 소스들(105)로부터 얻은 주어진 사업체 내의 주어진 개인의 현재의 역할 및 전화 번호를 확인하는 것, 또는 (b) 소스들(105)로부터의 데이터에 있는 이메일 주소들에 대해 서버 대 서버 이메일 어드레스 검증을 실행하는 것 중 하나 이상을 행할 수 있다.
따라서, 제거 처리(210) 및 유효화 처리(215)는 무효인 소스들(105)로부터 데이터 및 레코드들을 식별하고 그것이 더 처리되지 않도록 무효 데이터 및 레코드들을 제거한다.
도 3은 사업체 엔티티 매칭 처리(120) 및 개인 아이덴터티 매칭 처리(125)에 의해 수행되는 동작들의 기능 블록도이다. 예시적인 목적을 위해, 레코드(106)가 처리되는 것으로 가정한다.
사업체 엔티티 매칭 처리(120) 및 개인 아이덴터티 매칭 처리(125)는 소스 레코드(106)에 있는 데이터와 가장 유사한 이전에 개발된 데이터 저장소들로부터 사업체 엔티티 및 개인 아이덴터티 정보를 검색, 평가 및 선택한다.
사업체 엔티티 매칭 처리(120)는 제거 및 사전-자격부여 처리(115)에 의해 조장된 것들로부터 레코드(106)를 검색하고, 특정 사업체 엔티티와 관련된 레코드(106)에 있는 데이터를 식별하고, 상기 특정 사업체 엔티티에 대한 추가 정보에 대한 사업체 엔티티 데이터 저장소(305)를 질문한다. 사업체 엔티티 매칭 처리(120)는 소스 레코드(106)와 관련된 적절한 사업체를 식별하고 매치가 식별된 때 고유 식별자, 매치 등급 스트링, 매치 데이터 프로파일, 및 확신 코드를 적용한다(본원에 전체가 참조로서 포함되는 미국 특허 제 7,392,240 호(Scriffignano 등)를 참조).
고유 식별자는 주제가 모든 다른 주제들로부터 구별될 수 있도록 주제를 식별하는 다문자 코드이다. 주어진 고유 식별자는 단지 한번 이용될 수 있다. 바람직하게는, 고유 식별자는 지속적이고, 즉, 그것은 단지 일회 할당되고 결코 재사용되지 않는다. 그와 같은 것으로서, 일단 고유 식별자가 주제에 할당되면, 그 고유 식별자는 단지 그 특별한 주제를 식별할 것이다. 데이터 유니버설 넘버링 시스템(DUNS; Data Universal Numbering System) 번호는 그와 같은 고유 식별자로서 기능할 수 있다.
매치 등급 스트링은 레코드의 데이터 필드들에 대한 매치 품질을 표시하는 등급의 스트링이다. 예를 들어, 레코드(106)는 2개의 필드들을 포함하고, 사업체 엔티티 매칭 처리(120)는 2개의 필드들을 사업체 엔티티 데이터 저장소(305)에 있는 레코드에 매칭시키려 시도하는 것으로 가정한다. 또한, 제1 필드에 있는 데이터가 정확한 매치이고, 제2 필드에 있는 데이터는 단지 부분 매치인 것으로 가정한다. 그와 같은 것으로서, 제1 필드의 매치는 제2 필드의 매치보다 더 양호한 매치 등급을 받을 만한 것으로 가정한다.
매치 데이터 프로파일은 2개의 레코드들의 특별한 요소들이 2개의 레코드들의 매치의 결정에 사용되었다는 것을 표시하는 코드이다. 예를 들어, 우리는 2개의 레코드들의 각각이 동일한 회사 사장, 또는 동일한 상호, 또는 동일한 전 사업체명을 표시하는 것으로 인식함으로써, ABC 컴퍼니에 대한 제2 레코드에 매칭되는 ABC 컴퍼니에 관한 제1 레코드를 가지는 것으로 가정한다. 따라서, 매치 데이터 프로파일은 매치가 사장, 또는 상호, 또는 전 사업체명의 매치에 기초하여 만들어진 것을 표시할 수 있다.
확신 코드는 정확한 매치의 확실성도를 표시한다.
사업체 엔티티 데이터 저장소(305)는 정확도에 대해 이전에 개발되고 확인된 사업체에 대한 정보의 데이터베이스이다. 사업체 엔티티 데이터 저장소(305) 내에 포함된 사업체 정보의 예들은 사업체의 법적 이름, 상호들, 메일링 어드레스, 물리적 어드레스, 및 주 전화 번호를 포함할 수 있다. 사업체 엔티티 데이터 저장소(305)는, 사업체 엔티티 매칭 처리(120)로부터의 질문에 응답하여, 사업체 엔티티 매칭 처리(120)가 레코드(106)에 식별된 사업체와 매칭된 것으로서 간주되는 사업체 데이터를 복귀시킨다. 사업체 엔티티 데이터 저장소(305)로부터의 사업체 데이터는 또한 사업체에 대한 고유 식별자, 예컨대 DUNS 번호, 즉 고유 사업체 식별자를 포함한다.
따라서, 사업체 엔티티 매칭 처리(120)는 레코드(106)에 있는 대응하는 데이터에 가장 가까운 매치인 데이터의 세트를 선택한다. 예를 들어, 사업체 엔티티 매칭 처리(120)는 사업체 데이터 레코드(106)와 사업체 엔티티 데이터 저장소(305)에 있는 데이터 간의 최선의 매치를 발견한다. 이 후 사업체 엔티티 매칭 처리(120)는 레코드(106)에 고유 사업체 식별자, 및 이후 통합 처리(130)에 사용되는 다른 정보(매치 등급 스트링, 매치 데이터 프로파일, 및 확신 코드와 유사한)를 첨부한다. 이후 사업체 엔티티 매칭 처리(120)는 레코드(106)를 개인 아이덴터티 매칭 처리(125)로 전송한다.
개인 아이덴터티 매칭 처리(125)는 레코드(106)를 수신하고 특정 개인 아이덴터티, 즉 특정 사람과 관련된 속성들인 레코드(106)에 있는 데이터를 식별하고, 그 특정 사람에 대한 더 많은 정보를 개인 아이덴터티 데이터 저장소(310)에 질의한다. 개인 아이덴터티 매칭 처리(125)는 레코드(106)와 가장 가능성 있게 관련된(most likely associated) 개인을 식별하기 위해 사업체 엔티티 매칭 처리(120)에 의해 이용되는 것과 유사한 매치 처리를 이용한다.
개인 아이덴터티 데이터 저장소(310)는 정확도에 대해 이전에 개발되고 확인된 개인들에 대한 정보의 데이터베이스이다. 개인 아이덴터티 데이터 저장소(310)에 포함된 개인 아이덴터티 정보의 예들은 이름, 두번째 이름, 성, 생월(birth month), 생일, 생년, 거주시, 및 거주주(state of residence)를 포함한다. 개인 아이덴터티 데이터 저장소(310)는, 개인 아이덴터티 매칭 처리(125)로부터의 질의에 응답하여, 개인 아이덴터티 매칭 처리(125)가 레코드(106)에서 식별된 개인에 매칭된 것으로 간주된 개인 아이덴터티 데이터를 복귀시킨다. 개인 아이덴터티 데이터 저장소(310)로부터의 개인 아이덴터티 데이터는 또한 개인에 대한 고유 식별자, 즉 고유 개인 식별자를 포함한다.
따라서, 개인 아이덴터티 매칭 처리(125)는 레코드(106)에 있는 대응하는 데이터에 가장 가까운 매치인 데이터를 선택한다. 예를 들어, 개인 아이덴터티 매칭 처리(125)는 레코드(106)에 있는 개인에 대한 데이터와 개인 아이덴터티 데이터 저장소(310)에 있는 데이터 간의 최선의 매치를 발견한다. 이후 개인 아이덴터티 매칭 처리(125)는 레코드(106)에 이후 통합 처리(130)에 이용되는 고유 개인 식별자, 매치 등급 스트링, 매치 데이터 프로파일, 및 확신 코드를 첨부한다. 이후 개인 아이덴터티 매칭 처리(125)는 레코드(106)를 역할 식별 처리(127)에 전송한다.
도 1를 다시 참조하라.
역할 식별 처리(127)는 레코드(106)에 고유 역할 식별자를 할당한다. 고유 역할 식별자는 특별한 사업체에서 특별한 사람의 특별한 역할을 식별하는 고유 식별자이다. 고유 역할 식별자는 표준화 처리(205)에 할당된 역할 코드, 및 개인 아이덴터티 매칭 처리(125)에 할당된 고유 개인 식별자에 기초한다.
레코드(107)는 레코드(106)와 같은 종류의 개인에 관한 데이터를 포함하지만, 레코드(107)에 있는 데이터는 레코드(106)에 있었던 데이터와 동일하지 않다고 가정한다. 레코드(107)는 레코드(106)에서와 같은 사업체 데이터를 포함할 수 있거나 포함하지 않을 수 있다. 방법(100)은 레코드(106)의 것과 유사한 방식으로 레코드(107)를 보유하고, 이와 같은 것으로, 레코드(107)에 동일한 개인 아이덴터티 정보 및 개인에 대한 고유 식별자를 첨부하고, 또한 사업체 정보, 고유 사업체 식별자, 및 레코드(107)에 있는 사업체 정보에 적당한 고유 역할 식별자를 첨부하고, 이것은 레코드(106)에 있는 사업체에 대한 사업체 정보 및 고유 사업체 식별자와 동일하거나 동일하지 않을 수 있다. 이후 방법(100)은 레코드(107)를 잠정 스토리지(interim storage), 즉, 잠정 저장소(145)에 저장한다.
통합 처리(130)는 사업체 엔티티 매칭 처리(120), 개인 아이덴터티 매칭 처리(125), 및 역할 식별 처리(127)에 의해 처리된 레코드들을 그룹으로 나누고, 우선권을 부여하고 종합하고, 주어진 개인 사업체 역할, 관계들 및 하나 이상의 사업체 엔티티들과의 연관성들의 복합 뷰(composite view)을 제공하는 복합 레코드를 구축한다. 통합 처리(130)는 잠정 저장소(145)로부터 레코드들(106, 107)을 얻고, 사업체 엔티티 매칭 처리(120), 개인 아이덴터티 매칭 처리(125), 및 역할 식별 처리(127)에 의해 처리된 다른 레코드들과 관련하여 레코드들(106, 107)을 컴파일하고 순위를 매긴다(rank). 그러나, 본 논의를 위해, 우리는 레코드들(106, 107)의 고려로 우리의 논의를 한정할 것이다.
통합 처리(130)는 사업체 엔티티 매칭 처리(120)에 의해 할당된 고유 사업체 식별자, 개인 아이덴터티 매칭 처리(125)에 의해 할당된 고유 개인 식별자, 및 역할 식별 처리(127)에 의해 할당된 고유 역할 식별자에 기초하여 동일한 고유 개인에 속하는 것으로서 레코드들(106, 107)을 식별하여, 프로파일(132)을 생성한다.
통합 처리(130)는 역할, 직위, 및 프로파일(132)과 관련된 사업체의 위치들과 같은 전문 속성들을 그룹으로 나누고, 사업체 엔티티 매칭 처리(120) 및 개인 아이덴터티 매칭 처리(125) 동안 식별되는, 데이터의 소스(예컨대, 소스 1 대 소스 2), 데이터의 나이, 또는 매치 품질, 예컨대, 매치 등급 스트링과 같은 데이터 특징들에 기초하여 프로파일(132) 내의 속성들의 순위를 매기고 구성한다. 따라서, 프로파일(132)은 상기 개인의 복합 뷰 및 개인이 하나 이상의 사업체 엔티티들 내에서 갖는 역할 또는 역할들을 제공하는 주어진 고유 개인에 대한 컴파일링된 레코드이다.
관리 데이터 저장소(135)는 통합 처리(130)로부터 프로파일(132)을 수신하고, 그것을 프로파일(142)로서 저장한다. 관리 데이터 저장소(135)는 복수의 프로파일들(140)을 보유한다. 프로파일(142)은 복수의 프로파일들(140) 중 하나이다.
검사로, 방법(100)은 (i) 개인의 아이덴터티, 사업체의 이름, 및 사업체에서의 개인의 역할을 포함하는 레코드를 수신하고, (ii) 레코드(106)를 사업체에 대한 고유 사업체 식별자를 제공하는 사업체 엔티티 데이터 저장소(305)에 있는 데이터에 매칭시키고, (iii) 레코드(106)를 개인에 대한 고유 개인 식별자를 제공하는 개인 아이덴터티 데이터 저장소(310)에 있는 데이터에 매칭시키고, (iii) 레코드(106)에 (a) 고유 사업체 식별자, (b) 고유 개인 식별자, 및 (c) 사업체에서의 개인의 역할에 대한 고유 역할 식별자를 첨부하고, (iv) 레코드(106)를 고유 사업체 식별자, 고유 개인 식별자, 및 고유 역할 식별자에 기초하여 레코드(106)를 레코드(107)에 매칭시키고, (v) 레코드들(106, 107)을 얻어진 레코드, 즉, 프로파일(132)로 통합한다.
방법(100)에 있어서, 사업체 엔티티 매칭 처리(120) 및 개인 아이덴터티 매칭 처리(125)는 사업체 엔티티 매칭 처리(120)에 이은 개인 아이덴터티 매칭 처리(125)의 순서로 실행된다. 그러나, 이들 2개의 처리는 개인 아이덴터티 매칭 처리(125)에 이은 사업체 엔티티 매칭 처리(120)의 순서로 실행되고, 또는 서로 동시에 실행될 수 있다. 또, 방법(100)은 제2 레코드를 처리하기 전 제1 레코드의 처리를 반드시 완성할 필요는 없지만, 대신, 복수의 레코드들을 동시에 처리할 수 있다.
도 4는 방법(100)을 수행하기 위해 시스템(400)의 블록도이다. 시스템(400)은 네트워크(425), 예컨대, 인터넷에 결합된 컴퓨터(405), 예컨대 서버를 구비한다.
컴퓨터(405)는 프로세서(410), 및 메모리(415)를 구비한다. 비록 컴퓨터(405)가 독립 장치(standalone device)로서 본원에 표현되지만, 그와 같은 것에 한정되지 않지만, 대신 분산 처리 시스템 내의 다른 장치들(도시하지 않음)에 결합될 수 있다.
프로세서(410)는 명령들에 응답하고 실행하는 로직 회로(logic circuitry)로 구성되는 전자 장치이다.
메모리(415)는 프로세서(410)에 의해 판독 가능하고 실행 가능한 데이터 및 명령들 및 따라서 프로세서(410)의 제어 동작들을 포함하는 장치이다. 메모리(415)는 랜덤 액세스 메모리(RAM), 하드 드라이브, 판독 전용 메모리(ROM), 또는 이들의 조합으로 구현될 수 있다. 메모리(415)의 구성요소들 중 하나는 프로그램 모듈(420)이다.
프로그램 모듈(420)은 프로세서(410)로 하여금 본원에 기재된 방법들을 실행하게 하는 명령들을 포함한다. 예를 들어, 프로그램 모듈(420)의 제어 하에서, 프로세서(410)는 제거 및 사전-자격부여 처리(115), 사업체 엔티티 매칭 처리(120), 개인 아이덴터티 매칭 처리(125), 역할 식별 처리(127), 및 통합 처리(130)의 동작들을 수행한다.
본원에서 용어 "모듈(module)"은 독립 구성요소로서 또는 복수의 종속 구성요소들의 통합 구성으로서 구현될 수 있는 기능 동작을 나타내기 위해 사용된다. 따라서, 프로그램 모듈(420)은 단일 모듈로서 또는 서로 협력하여 동작하는 복수의 모듈들로서 구현될 수 있다. 따라서, 제거 및 사전-자격부여 처리(115), 사업체 엔티티 매칭 처리(120), 개인 아이덴터티 매칭 처리(125), 역할 식별 처리(127), 및 통합 처리(130) 각각은 독립 처리 또는 종속 처리의 계층(hierarchy)으로서 구성될 수 있다.
게다가, 비록 프로그램 모듈(420)은 본원에 메모리(415)에 설치되는 것으로, 그러므로 소프트웨어로 구현되는 것으로서 기재되지만, 그것은 하드웨어(예컨대, 전자 회로), 팜웨어(firmware), 소프트웨어, 또는 이들의 조합 중 어느 하나로 구현될 수 있다.
네트워크(425)를 통해, 프로세서(410)는 소스들(105), 사업체 엔티티 데이터 저장소(305), 개인 아이덴터티 데이터 저장소(310), 잠정 저장소(145), 및 관리 데이터 저장소(135)의 각각과 통신한다. 예를 들어, 프로세서(410)는 소스들(105)로부터 데이터를 판독하고, 질의하고 사업체 엔티티 데이터 저장소(305) 및 개인 아이덴터티 데이터 저장소(310)로부터 데이터를 수신하고, 프로파일(132)을 관리 데이터 저장소(135)에 출력한다. 비록 사업체 엔티티 데이터 저장소(305), 개인 아이덴터티 데이터 저장소(310), 잠정 저장소(145), 및 관리 데이터 저장소(135)는 이산 데이터베이스들인 것으로 도 4에 표현되지만, 이들은 단일 데이터베이스 시스템으로 구현될 수 있거나 복수의 데이터베이스 시스템들에 걸쳐 분포될 수 있다.
프로그램 모듈(420)이 메모리(415)에 이미 로딩된 것으로 나타내지만, 그것은 메모리(415)로의 후속 로딩을 위해 저장 매체(430) 위에 구성될 수 있다. 저장 매체(430)는 또한 컴퓨터 프로그램으로 인코딩되는 컴퓨터-판독 가능 매체이고, 유형(tangible form)으로 저장 매체 위에 프로그램 모듈(420)을 저장하는 임의의 통상의 저장 매체일 수 있다. 저장 매체(430)의 예는 플로피 디스크, 컴팩트 디스크, 자기 테이프, 판독 전용 메모리, 광 스토리지 매체(optical storage media), 유니버설 시리얼 버스(universal serial bus; USB) 플래쉬 드라이브, 디지털 버서타일 디스크(digital versatile disc), 또는 짚 드라이브(zip drive)를 구비한다. 대안으로, 저장 매체(430)는 원격 스토리지 시스템에 배치되고 네트워크(425)를 통해 컴퓨터(405)에 결합되는 랜덤 액세스 메모리, 또는 다른 유형의 전자 스토리지일 수 있다.
이하의 표 1은 레코드들(106, 107)을 처리하는 방법(100)의 예를 제공한다. 이 예에서, 방법(100)은 레코드들(106, 107)을 동시에 처리하는 것으로 가정한다. 레코드들(106, 107)에 있는 데이터의 수정들은 볼드체(bold font)로 나타낸다. 비록 표 1은 제거 및 사전-자격부여 처리(115), 사업체 엔티티 매칭 처리(120), 개인 아이덴터티 매칭 처리(125), 역할 식별 처리(127), 및 통합 처리(130)가 특정 동작들을 수행하는 것을 나타내지만, 실제로, 동작들은 프로세서(410)에 의해 수행된다.
처리 단계 활동 레코드의 상태/프로파일
1 레코드(106)는 소스들(105)에 있음 제거 & 사전 자격부여 처리(115)로 들어가기 위해 대기 (레코드 106)
존 스미스
사장
ABC(주)
350 5번가 수이트7712
뉴욕, NY 10118
(917) 555-5555
jsmith@abcine.com
생월 01
생일 27
생년 1975
마지막 4자리 SSN:
2 레코드(107)는 소스들(105)에 있음 제거 & 사전 자격부여 처리(115)로 들어가기 위해 대기 (레코드 107)
조나단 알. 스미스 II
제작자
DEF(주)
160 콜럼버스 애비뉴
뉴욕, NY 10023
(212) 555-1100
jsmith@defllc.com
생월 01
생일 27
생년 1975
마지막 4자리 SSN:
3 제거 & 사전-자격부여 처리(115) 제거 & 사전-자격부여 처리(115)는 레코드(106)로부터 셀 전화번호를 식별하고 제거한다. 주소는 표준화된다. 이메일은 유효하다. "사장"의 직위에 기초한 역할 코드가 첨부된다. 레코드(106)로 이행한다.
(레코드 106)
존 스미스
사장
ABC(주)
350 5번가 수이트7712
뉴욕, NY 10018

jsmith@abcine.com
생월 01
생일 27
생년 1975
마지막 4자리 SSN:
역할 코드: 400
4 제거 & 사전-자격부여 처리(115) 제거 & 사전-자격부여 처리(115)는 레코드(107)로부터 이름 접미사를 제거한다. 주소는 표준화된다. 이메일은 유효하다. "제작자"의 직위에 기초한 역할 코드가 첨부된다. 레코드(107)로 이행한다. (레코드 107)
조나단 알. 스미스
제작자
DEF(주)
160 콜럼버스 애비뉴
뉴욕, NY 10023
(212) 555-1100
jsmith@defllc.com
5 사업체 엔티티 매칭 처리(120) 사업체 엔티티 매칭 처리(120)는 레코드(106)에 있는 사업체 데이터와 가장 가깝게 매치하는 데이터에 대해 사업체 엔티티 데이터 저장소(305)에 질의한다. 사업체 엔티티 데이터 저장소(305)는 응답을 복귀시킨다. 레코드(106)에 있는 사업체 데이터는 사업체 엔티티 데이터 저장소(305)에 의해 공급되는 유효 데이터로 재기록되고 고유 사업체 식별자(예컨대 DUNS 번호)가 할당된다. (레코드 106)
존 스미스
사장
아비드 베이스볼 카드(주)
350 5번가 수이트7700
뉴욕, NY 10118
(212) 555-1010
jsmith@abcine.com
생월 01
생일 27
생년 1975
마지막 4자리 SSN:
역할 코드: 400
고유 사업체 식별자:
6 사업체 엔티티 매칭 처리(120) 사업체 엔티티 매칭 처리(120)는 레코드(107)에 있는 사업체 데이터와 가장 가깝게 매치하는 데이터에 대해 사업체 엔티티 데이터 저장소(305)에 질의한다. 사업체 엔티티 데이터 저장소(305)는 응답을 복귀시킨다. 레코드(107)에 있는 사업체 데이터는 사업체 엔티티 데이터 저장소(305)에 의해 공급되는 유효 데이터로 재기록되고 고유 사업체 식별자(예컨대 DUNS 번호)가 할당된다. (레코드 107)
조나단 알. 스미스
제작자
다안 익사이팅 풋볼 엘엘시
1600 브로드웨이
뉴욕, NY 10023
(212) 555-1100
jsmith@abcine.com
생월 01
생일 27
생년 1975
마지막 4자리 SSN:
역할 코드: 300
고유 사업체 식별자:
234567890
7 개인 아이덴터티 매칭 처리(125) 개인 아이덴터티자 매칭 처리(125)는 레코드(106)에 있는 개인 아이덴터티 데이터와 가장 가깝게 매치하는 데이터에 대해 개인 아이덴터티 데이터 저장소(310)에 질의한다. 개인 아이덴터티 데이터 자장소(310)는 응답을 복귀시킨다. 레코드(106)에 있는 개인 아이덴터티 데이터는 개인 아이덴터티 데이터 저장소(310)에 의해 공급된 유효 데이터로 재기입되고 고유 개인 식별자가 할당된다. (레코드 106)
조나단 알. 스미스

사장
아비드 베이스볼 카드(주)
350 5번가 수이트7700
뉴욕, NY 10118
(212) 555-1010
jsmith@abcine.com
생월 01
생일 27
생년 1975
마지막 4자리 SSN: 0101
처음 3자리 SSN: 057
역할 코드: 400
고유 사업체 식별자:
123456789
고유 개인 식별자:
3456789012345
8 개인 아이덴터티 매칭 처리(125) 개인 식별자 매칭 처리(125)는 레코드(107)에 있는 개인 아이덴터티 데이터와 가장 가깝게 매치하는 데이터에 대해 개인 아이덴터티 데이터 저장소(310)에 질의한다. 개인 아이덴터티 데이터 자장소(310)는 응답을 복귀시킨다. 레코드(107)에 있는 개인 아이덴터티 데이터는 개인 아이덴터티 데이터 저장소(310)에 의해 공급된 유효 데이터로 재기입되고 고유 개인 식별자가 할당된다. (레코드 107)
조나단 알. 스미스
제작자
다안 익사이팅 풋볼 엘엘시
1600 브로드웨이
뉴욕, NY 10023
(212) 555-1100
jsmith@defllc.com
생월 01
생일 27
생년 1975
마지막 4자리 SSN: 0101
처음 3자리 SSN: 057
역할 코드: 300
고유 사업체 식별자:
234567890
고유 개인 식별자:
3456789012345
9 역할 식별 처리(127) 역할 식별 처리(127)는, 레코드(106)에, 표준화 처리(205)에서 할당된 역할 코드에 기초한 고유 역할 식별자, 사업체 엔티티 매칭 처리(120)에서 할당된 고유 사업체 식별자, 및 개인 아이덴터티 매칭 처리(125)에서 할당된 고유 개인 식별자를 할당한다. (레코드 106)
조나단 알. 스미스
사장
아비드 베이스볼 카드(주)
350 5번가 수이트7700
뉴욕, NY 10118
(212) 555-1010
jsmith@abcine.com
생월 01
생일 27
생년 1975
마지막 4자리 SSN: 0101
처음 3자리 SSN: 057
역할 코드: 400
고유 사업체 식별자:
123456789
고유 개인 식별자:
3456789012345
고유 역할 식별자:
4567890123456
10 역할 식별 처리(127) 역할 식별 처리(127)는, 레코드(106)에, 표준화 처리(205)에서 할당된 역할 코드에 기초한 고유 역할 식별자, 사업체 엔티티 매칭 처리(120)에서 할당된 고유 사업체 식별자, 및 개인 아이덴터티 매칭 처리(125)에서 할당된 고유 개인 식별자를 할당한다. (레코드 107)
조나단 알. 스미스
제작자
다안 익사이팅 풋볼 엘엘시
1600 브로드웨이
뉴욕, NY 10023
(212) 555-1100
jsmith@defllc.com
생월 01
생일 27
생년 1975
마지막 4자리 SSN: 0101
처음 3자리 SSN: 057
역할 코드: 300
고유 사업체 식별자:
234567890
고유 개인 식별자:
3456789012345
고유 역할 식별자:
5678901234567
11 통합 처리(127) 통합 처리(130)는 레코드들(106, 107)을 수신하고, 상이한 사업체 정황들에서 동일한 사람일 것 같은 레코드들(106, 107)을 식별한다. 통합 처리(130)는 다수의 사업체 정황들에서 고유 개인 존 스미스를 반영하는 컴파일링된 뷰를 생성하기 위해 양 레코드들에 있는 정보를 그룹화하고 순위를 매기고 프로파일(132)을 관리 데이터 저장소(135)에 제공한다. (프로파일 132)
조나단 알. 스미스
사장
아비드 베이스볼 카드(주)
350 5번가 수이트7700
뉴욕, NY 10118
(212) 555-1010
jsmith@abcine.com
생월 01
생일 27
생년 1975
마지막 4자리 SSN: 0101
처음 3자리 SSN: 057
역할 코드: 400
고유 사업체 식별자:
123456789
고유 개인 식별자:
3456789012345
고유 역할 식별자:
4567890123456
조나단 알. 스미스
제작자

다안 익사이팅 풋볼 엘엘시
1600 브로드웨이
뉴욕, NY 10023
(212) 555-1100
jsmith@defllc.com
생월 01
생일 27
생년 1975
마지막 4자리 SSN: 0101
처음 3자리 SSN: 442
역할 코드: 300
고유 사업체 식별자:
234567890
고유 개인 식별자:
3456789012345
고유 역할 식별자:
5678901234567
12 관리 데이터 저장소(135) 관리 데이터 저장소(135)는 프로파일(132)을 수신하고, 그것을 프로파일(142)로서 저장한다. 관린 데이터 저장소(135)는 액세스의 다양한 방법들 및 다양한 사업체 요구들에 대한 프로파일들(140)을 유지한다. (프로파일 XXX )
조나단 알. 스미스
고유 개인 식별자:
3456789012345
사장
아비드 베이스볼 카드(주)
350 5번가 수이트7700
뉴욕, NY 10118
(212) 555-1010
jsmith@abcine.com
역할 코드: 400
고유 사업체 식별자:
123456789
고유 역할 식별자:
4567890123456

제작자
다안 익사이팅 풋볼 엘엘시
1600 브로드웨이
뉴욕, NY 10023
(212) 555-1100
역할 코드: 300
고유 사업체 식별자:
234567890
고유 역할 식별자:
5678901234567
본원에 기재된 기술들은 예시이고, 본 개시내용에 대해 어떤 특별한 제한을 부여하는 것으로 해석되지 않아야 한다. 다양한 대안들, 조합들 및 변경들이 이 기술 분야에서 숙련된 사람들에 의해 생각될 수 있다는 것이 이해되어야 한다. 예를 들어, 본원에 기재된 프로세스와 관련된 단계들은, 달리 단계들 자신들에 의해 특정되거나 지시되지 않는다면 임의의 순서로 수행될 수 있다. 본 개시내용은 첨부된 청구항들의 범위 내에 속하는 모든 이와 같은 대안들, 수정들 및 변형들 모두 포함하도록 의도된다.
용어 "포함한다(comprises)" 또는 "포함하는(comprising)"은 기술된 특징들, 완전체들(integers), 단계들 또는 구성요소들의 존재를 특정하는 것으로서 해석되는 것이지만 하나 이상의 다른 특징들, 완전체들, 단계들 또는 구성요소들 또는 이들의 그룹들의 존재를 배제하지 않는다.

Claims (12)

  1. 개인의 아이덴터티, 사업체의 이름, 및 상기 사업체에서의 상기 개인의 역할을 포함하는 제1 레코드를 수신하는 단계;
    상기 제1 레코드를 상기 사업체에 대한 고유 사업체 식별자를 제공하는 데이터에 매칭시키는 단계;
    상기 제1 레코드를 상기 개인에 대한 고유 개인 식별자를 제공하는 데이터에 매칭시키는 단계;
    상기 제1 레코드에 (a) 상기 고유 사업체 식별자, (b) 상기 고유 개인 식별자, 및 (c) 상기 사업체에서의 상기 개인의 상기 역할에 대한 고유 역할 식별자를 첨부하는 단계;
    상기 제1 레코드를 상기 고유 사업체 식별자, 상기 고유 개인 식별자, 및 상기 고유 역할 식별자에 기초하여 제2 레코드에 매칭시키는 단계; 및
    상기 제1 및 제2 레코드들을 얻어진 레코드에 통합하는 단계;를 포함하는 것을 특징으로 하는 방법.
  2. 제1항에 있어서,
    상기 고유 사업체 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키는 단계는 상기 제1 레코드에 있는 사업체 데이터와 데이터베이스에 있는 데이터 간의 최선의 매치를 발견하는 단계를 포함하는 것을 특징으로 하는 방법.
  3. 제1항에 있어서,
    상기 고유 개인 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키는 단계는 상기 제1 레코드에 있는 상기 개인에 대한 데이터와 데이터베이스에 있는 데이터 간의 최선의 매치를 발견하는 단계를 포함하는 것을 특징으로 하는 방법.
  4. 제1항에 있어서,
    상기 고유 사업체 식별자는 데이터 유니버설 넘버링 시스템(DUNS) 번호를 포함하는 것을 특징으로 하는 방법.
  5. 프로세서; 및
    상기 프로세서에 의해 판독 가능하고 상기 프로세서에 의해 판독될 때, 상기 프로세서로 하여금:
    개인의 아이덴터티, 사업체의 이름, 및 상기 사업체에서의 상기 개인의 역할을 포함하는 제1 레코드를 수신하고;
    상기 사업체에 대한 고유 사업체 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키고;
    상기 개인에 대한 고유 개인 식별자를 제공하는 데이터를 상기 제1 레코드에 매칭시키고;
    상기 제1 레코드에 (a) 상기 고유 사업체 식별자, (b) 상기 고유 개인 식별자, 및 (c) 상기 사업체에서의 상기 개인의 역할에 대한 고유 역할 식별자를 첨부하고;
    상기 고유 사업체 식별자, 상기 고유 개인 식별자, 및 상기 고유 역할 식별자에 기초하여 상기 제1 레코드를 제2 레코드에 매칭시키고;
    상기 제1 및 제2 레코드들을 얻어진 레코드에 통합하게 하는 명령들을 포함하는 메모리를 포함하는 것을 특징으로 하는 시스템.
  6. 제5항에 있어서,
    상기 프로세서로 하여금 상기 고유 사업체 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키게 하는 상기 명령들은 상기 프로세서로 하여금 상기 제1 레코드에 있는 사업체 데이터와 데이터베이스에 있는 데이터 간의 최선의 매치를 발견하게 하는 명령들을 포함하는 것을 특징으로 하는 시스템.
  7. 제5항에 있어서,
    상기 프로세서로 하여금 상기 고유 개인 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키게 하는 상기 명령들은 상기 프로세서로 하여금 상기 제1 레코드에 있는 상기 개인에 대한 데이터와 데이터 베이스에 있는 데이터 간의 최선의 매치를 발견하게 하는 명령들을 포함하는 것을 특징으로 하는 시스템.
  8. 제5항에 있어서,
    상기 고유 사업체 식별자는 데이터 유니버설 넘버링 시스템(DUNS) 번호를 포함하는 것을 특징으로 하는 시스템.
  9. 컴퓨터-판독 가능 저장 매체로서, 상기 컴퓨터-판독 가능 저장 매체는, 프로세서에 의해 판독 가능하고 상기 프로세서에 의해 판독될 때, 상기 프로세서로 하여금:
    개인의 아이덴터티, 사업체의 이름, 및 상기 사업체에서의 상기 개인의 역할을 포함하는 제1 레코드를 수신하고;
    상기 사업체에 대한 고유 사업체 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키고;
    상기 개인에 대한 고유 개인 식별자를 제공하는 데이터를 상기 제1 레코드에 매칭시키고;
    상기 제1 레코드에 (a) 상기 고유 사업체 식별자, (b) 상기 고유 개인 식별자, 및 (c) 상기 사업체에서의 상기 개인의 역할에 대한 고유 역할 식별자를 첨부하고;
    상기 고유 사업체 식별자, 상기 고유 개인 식별자, 및 상기 고유 역할 식별자에 기초하여 상기 제1 레코드를 제2 레코드에 매칭시키고;
    상기 제1 및 제2 레코드들을 얻어진 레코드에 통합하게 하는 명령들을 포함하는 것을 특징으로 하는 컴퓨터-판독 가능 저장 매체.
  10. 제9항에 있어서,
    상기 프로세서로 하여금 상기 고유 사업체 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키게 하는 상기 명령들은 상기 프로세서로 하여금 상기 제1 레코드에 있는 사업체 데이터와 데이터베이스에 있는 데이터 간의 최선의 매치를 발견하게 하는 명령들을 포함하는 것을 특징으로 하는 컴퓨터-판독 가능 저장 매체.
  11. 제9항에 있어서,
    상기 프로세서로 하여금 상기 고유 개인 식별자를 제공하는 데이터에 상기 제1 레코드를 매칭시키게 하는 상기 명령들은 상기 프로세서로 하여금 상기 제1 레코드에 있는 상기 개인에 대한 데이터와 데이터 베이스에 있는 데이터 간의 최선의 매치를 발견하게 하는 명령들을 포함하는 것을 특징으로 하는 컴퓨터-판독 가능 저장 매체.
  12. 제9항에 있어서,
    상기 고유 사업체 식별자는 데이터 유니버설 넘버링 시스템(DUNS) 번호를 포함하는 것을 특징으로 하는 컴퓨터-판독 가능 저장 매체.
KR1020127021333A 2010-01-29 2011-01-28 전문 기관 데이터의 상업용 데이터 컨텐트와의 통합 및 연관을 위한 시스템 및 방법 KR101469642B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US29980210P 2010-01-29 2010-01-29
US61/299,802 2010-01-29
PCT/US2011/023069 WO2011094647A1 (en) 2010-01-29 2011-01-28 System and method for aggregation and association of professional affiliation data with commercial data content

Publications (2)

Publication Number Publication Date
KR20120139695A true KR20120139695A (ko) 2012-12-27
KR101469642B1 KR101469642B1 (ko) 2014-12-08

Family

ID=44319836

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127021333A KR101469642B1 (ko) 2010-01-29 2011-01-28 전문 기관 데이터의 상업용 데이터 컨텐트와의 통합 및 연관을 위한 시스템 및 방법

Country Status (11)

Country Link
US (1) US8930383B2 (ko)
EP (1) EP2529298A4 (ko)
JP (1) JP5753197B2 (ko)
KR (1) KR101469642B1 (ko)
CN (1) CN102782642B (ko)
AU (1) AU2011210597B2 (ko)
BR (1) BR112012018653B1 (ko)
CA (1) CA2787593C (ko)
MX (1) MX2012008714A (ko)
RU (1) RU2546317C2 (ko)
WO (1) WO2011094647A1 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8732004B1 (en) 2004-09-22 2014-05-20 Experian Information Solutions, Inc. Automated analysis of data to generate prospect notifications based on trigger events
US9690820B1 (en) 2007-09-27 2017-06-27 Experian Information Solutions, Inc. Database system for triggering event notifications based on updates to database records
US20100174638A1 (en) 2009-01-06 2010-07-08 ConsumerInfo.com Report existence monitoring
MX2012003721A (es) 2009-09-30 2012-06-28 Evan V Chrapko Sistemas y metodos para analitica de datos graficos sociales para determinar conectividad dentro de una comunidad.
US20110099164A1 (en) 2009-10-23 2011-04-28 Haim Zvi Melman Apparatus and method for search and retrieval of documents and advertising targeting
US9026552B2 (en) * 2010-01-18 2015-05-05 Salesforce.Com, Inc. System and method for linking contact records to company locations
US9836773B2 (en) * 2011-05-22 2017-12-05 Ariba, Inc. Evaluation and selection of quotes of a commerce network
US9990634B2 (en) 2011-05-22 2018-06-05 Ariba, Inc. Managing an experience of a member organization of a collaborative commerce community through a network
US8862543B2 (en) * 2011-06-13 2014-10-14 Business Objects Software Limited Synchronizing primary and secondary repositories
EP2752778B1 (en) * 2013-01-08 2018-11-28 Tata Consultancy Services Limited Method and system for creating and maintaining unique data repository
US20150142638A1 (en) * 2013-05-02 2015-05-21 The Dun & Bradstreet Corporation Calculating a probability of a business being delinquent
CN103699645A (zh) * 2013-12-26 2014-04-02 中国人民银行征信中心 企业关联关系识别系统及其识别方法
CN106164896B (zh) * 2013-12-30 2020-03-03 邓白氏公司 用于发现对手方关系的多维递归方法及系统
US9578043B2 (en) 2015-03-20 2017-02-21 Ashif Mawji Calculating a trust score
US11410230B1 (en) 2015-11-17 2022-08-09 Consumerinfo.Com, Inc. Realtime access and control of secure regulated data
US20170235792A1 (en) 2016-02-17 2017-08-17 Www.Trustscience.Com Inc. Searching for entities based on trust score and geography
US9679254B1 (en) 2016-02-29 2017-06-13 Www.Trustscience.Com Inc. Extrapolating trends in trust scores
US9721296B1 (en) 2016-03-24 2017-08-01 Www.Trustscience.Com Inc. Learning an entity's trust model and risk tolerance to calculate a risk score
JP6664007B2 (ja) * 2016-04-20 2020-03-13 エーエスエムエル ネザーランズ ビー.ブイ. レコードを整合させる方法、保守のスケジュールを作成する方法、および装置
US20200074100A1 (en) 2018-09-05 2020-03-05 Consumerinfo.Com, Inc. Estimating changes to user risk indicators based on modeling of similarly categorized users

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2003135A (en) 1934-10-26 1935-05-28 Bowman Products Inc Bottle crate
US5287648A (en) * 1986-10-02 1994-02-22 Hand Herbert H Electrical support structure and method and apparatus for preventing crawling insects or other crawling pests from entering electrical devices mounted on support structures above ground
US5446885A (en) * 1992-05-15 1995-08-29 International Business Machines Corporation Event driven management information system with rule-based applications structure stored in a relational database
GB2296147B (en) * 1994-11-29 1999-06-16 Marconi Gec Ltd A signal processor
US5557087A (en) * 1995-04-13 1996-09-17 Duyck; Margaret Multiple-merchant credit card terminal
US5664109A (en) * 1995-06-07 1997-09-02 E-Systems, Inc. Method for extracting pre-defined data items from medical service records generated by health care providers
US5745900A (en) * 1996-08-09 1998-04-28 Digital Equipment Corporation Method for indexing duplicate database records using a full-record fingerprint
US6105100A (en) * 1998-07-17 2000-08-15 International Business Machines Corporation Method and apparatus for detecting and initializing the addition of a new client machine in a network
US6473741B1 (en) * 1998-10-26 2002-10-29 Samuel R. Baker Method and system for aggregation and exchange of electronic tax information
AU3477500A (en) * 1999-02-02 2000-09-04 Smithkline Beecham Corporation Apparatus and method for depersonalizing information
US6625657B1 (en) * 1999-03-25 2003-09-23 Nortel Networks Limited System for requesting missing network accounting records if there is a break in sequence numbers while the records are transmitting from a source device
US6751663B1 (en) * 1999-03-25 2004-06-15 Nortel Networks Limited System wide flow aggregation process for aggregating network activity records
US6252946B1 (en) * 1999-06-08 2001-06-26 David A. Glowny System and method for integrating call record information
US6539396B1 (en) * 1999-08-31 2003-03-25 Accenture Llp Multi-object identifier system and method for information service pattern environment
US7886221B1 (en) * 1999-11-05 2011-02-08 Decentrix, Inc. Method and apparatus for storing web site data by web site dimensions and generating a web site having complementary elements
US6697825B1 (en) * 1999-11-05 2004-02-24 Decentrix Inc. Method and apparatus for generating and modifying multiple instances of element of a web site
US20020007284A1 (en) * 1999-12-01 2002-01-17 Schurenberg Kurt B. System and method for implementing a global master patient index
US7328233B2 (en) * 2000-01-19 2008-02-05 Corybant, Inc. Method and apparatus for implementing an active information model
US20020073138A1 (en) * 2000-12-08 2002-06-13 Gilbert Eric S. De-identification and linkage of data records
US7171400B2 (en) * 2001-10-04 2007-01-30 Sun Microsystems, Inc. Inheritance and relationship to directory information in an e-commerce application
US7333966B2 (en) * 2001-12-21 2008-02-19 Thomson Global Resources Systems, methods, and software for hyperlinking names
CN101110021A (zh) * 2002-03-25 2008-01-23 数据质量解决公司 对过程指令集进行可视化编程的方法
US20040078316A1 (en) * 2002-10-16 2004-04-22 E2Open Llc, A Corporation Network directory for business process integration of trading partners
EP1567956A4 (en) * 2002-11-08 2007-12-05 Dun & Bradstreet Inc SYSTEM AND METHOD FOR BROWSING AND COMPARING DATA BANKS
JP2005011049A (ja) 2003-06-19 2005-01-13 Nec Soft Ltd データベース統合装置
US20060129452A1 (en) * 2004-12-15 2006-06-15 Sbc Knowledge Ventures, Lp System and method for utilizing a multifaceted entity profile
US7801808B1 (en) * 2005-03-24 2010-09-21 Morgan Stanley Database structure for financial products with unique, consistent identifier for parties that assume roles with respect to the products and methods of using the database structure
US7565489B2 (en) * 2005-07-01 2009-07-21 Microsoft Corporation Identifying relevant data to cache
US20070239714A1 (en) * 2006-03-31 2007-10-11 Sap Ag System and method for identifying new business partner
JP4881059B2 (ja) * 2006-05-12 2012-02-22 株式会社東芝 個人情報管理システム及び個人情報管理プログラム
JP2009199277A (ja) * 2008-02-20 2009-09-03 Satoshi Sagawa 事業活動支援システム

Also Published As

Publication number Publication date
CA2787593C (en) 2018-05-08
RU2546317C2 (ru) 2015-04-10
CN102782642A (zh) 2012-11-14
EP2529298A4 (en) 2013-10-23
JP5753197B2 (ja) 2015-07-22
BR112012018653B1 (pt) 2020-12-22
MX2012008714A (es) 2013-03-12
BR112012018653A2 (pt) 2018-02-27
RU2012136829A (ru) 2014-03-10
AU2011210597A1 (en) 2012-08-09
US20110219034A1 (en) 2011-09-08
EP2529298A1 (en) 2012-12-05
JP2013518357A (ja) 2013-05-20
KR101469642B1 (ko) 2014-12-08
AU2011210597B2 (en) 2014-12-04
US8930383B2 (en) 2015-01-06
CN102782642B (zh) 2016-02-24
CA2787593A1 (en) 2011-08-04
WO2011094647A1 (en) 2011-08-04

Similar Documents

Publication Publication Date Title
KR101469642B1 (ko) 전문 기관 데이터의 상업용 데이터 컨텐트와의 통합 및 연관을 위한 시스템 및 방법
US9792324B2 (en) Method and system for uniquely identifying a person to the exclusion of all others
US10025904B2 (en) Systems and methods for managing a master patient index including duplicate record detection
US20180075138A1 (en) Electronic document management using classification taxonomy
US10572461B2 (en) Systems and methods for managing a master patient index including duplicate record detection
JP5547747B2 (ja) 異種トラスト・モデルを備えた分散及び自律医療環境における改良されたレコード・リンケージのための自動化されたアサーション再使用
CN111459985B (zh) 标识信息处理方法及装置
US8032494B2 (en) Archiving engine
US20140074801A1 (en) Data de-duplication system
US8832068B2 (en) Indirect data searching on the internet
KR20050115238A (ko) 데이터 통합 방법
US11636078B2 (en) Personally identifiable information storage detection by searching a metadata source
CN110502529B (zh) 数据处理方法、装置、服务器及存储介质
Eberle et al. Record linkage of the linked employer-employee survey of the socio-economic panel study (SOEP-LEE) and the establishment history panel (BHP)
US8832067B2 (en) Indirect data searching on the internet
US20130318064A1 (en) Indirect data searching on the internet
JP2020035276A (ja) 情報処理装置及び情報処理方法
US20240176786A1 (en) Context-based search of document management system
JP2013118498A (ja) 電話帳管理装置及び電話帳管理方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20171124

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20181204

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20191126

Year of fee payment: 6