KR101006889B1 - 데이터 통합 방법 - Google Patents

데이터 통합 방법 Download PDF

Info

Publication number
KR101006889B1
KR101006889B1 KR1020057015204A KR20057015204A KR101006889B1 KR 101006889 B1 KR101006889 B1 KR 101006889B1 KR 1020057015204 A KR1020057015204 A KR 1020057015204A KR 20057015204 A KR20057015204 A KR 20057015204A KR 101006889 B1 KR101006889 B1 KR 101006889B1
Authority
KR
South Korea
Prior art keywords
data
primary data
primary
threshold condition
processing
Prior art date
Application number
KR1020057015204A
Other languages
English (en)
Other versions
KR20050115238A (ko
Inventor
산드라 엘. 스토커
어매드 타릭 샤리프
마이클 이. 프레보즈낙
크리스토퍼 존 루카스
찰스 알. 벤크
마리아 피. 세클러
알렌 덕워쓰
Original Assignee
던 & 브래드스트리트, 아이엔씨.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 던 & 브래드스트리트, 아이엔씨. filed Critical 던 & 브래드스트리트, 아이엔씨.
Publication of KR20050115238A publication Critical patent/KR20050115238A/ko
Application granted granted Critical
Publication of KR101006889B1 publication Critical patent/KR101006889B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

데이터 통합 방법은 사업체 판정이 가능하도록 매우 유용하고 매우 정확한 정보를 생성하기 위해 로 비지니스 데이터(raw business data)를 수집하고 그것을 처리하는 독특한 방법을 포함한다. 이러한 처리는 글로벌 데이터 수집, 엔터티 매칭, 식별 번호의 적용, 회사 링키지의 수행, 및 예측 표시기들의 제공을 포함한다. 이들 처리 단계들은 로 비즈니스 데이터를 필터링하고 구성하기 위해 연속하여 작용하고 보고서로 고객들에게 품질 정보를 제공한다. 게다가, 위의 정보는 고품질의 결과적인 보고서를 보장하기 위해 이러한 처리의 각 단계에서 품질 보증을 함으로써 향상된다.

Description

데이터 통합 방법{Data integration method}
본 발명은 데이터를 처리하는 방법, 특히 사업체와 관련된 데이터를 처리하는 방법에 관한 것이다.
성공적인 사업을 위해서는 전문적인 판정을 할 필요가 있다. 위험 관리에 있어서, 사업체들은 전체 위험 노출을 이해하고 관리할 필요가 있다. 이들은 고위험 근거들을 식별하고 적극적으로 수집할 필요가 있다. 게다가, 이들은 크레딧(credit)을 신속하고 확실하게 승인하거나 허가할 필요가 있다. 판매 및 마케팅에 있어서, 사업체들은 기존 고객 기반에서의 증가하는 기회뿐만 아니라 최상의 유리한 고객들, 목표로 삼은 잠재고객을 결정할 필요가 있다. 공급 관리에 있어서, 사업체들은 더 나은 유통을 위해 공급자들에 의해 소비된 총량을 알 필요가 있다. 이들은 또한 공급자 실패에 대한 노출을 감소시키기 위해 공급자들에 대한 위험들 및 의존성들을 없앨 필요가 있다.
이들 사업체 판정들의 성공은 이들 배후의 정보 품질에 크게 의존한다. 품질은 정보가 정확한가, 완전한가, 시기 적절한가, 그리고 모순이 없는 가의 여부에 의해 결정된다. 이용 가능한 수천 가지의 데이터 소스들에 있어서, 그것은 어느 것이 사업체가 결정을 하는 데 의존해야할 정보인가를 결정하기 위한 과제이다. 이것 은 특히 사업체가 지나치게 자주 바뀔 때 참이다. 다음의 30분에 있어서, 120개의 사업체 어드레스들은 변하고, 75개의 사업체 전화 번호들이 변하거나 연락이 끊기고, 30개의 새로운 사업체가 개업하고, 20개의 CEO들(chief executive officers)은 이들의 일터를 떠나고, 15개의 회사들이 그들의 상호를 변경할 것이고, 10개의 사업체들이 폐업할 것이다.
사업체 데이터를 제공하는 종래의 방법들은 불완전하다. 몇몇 제공자들은 불완전한 데이터를 수집하고, 엔터티들을 완전하게 매칭시키는 데 실패하고, 번호들을 다시 이용하는 불완전한 넘버링 시스템들(incomplete numbering systems)을 가지며, 회사 패밀리 정보를 제공하는 데 실패하거나 불완전한 회사 패밀리 정보를 제공하고, 단지 불완전한 부가가치 예측 데이터를 제공한다. 본 발명의 목적은 더 완전하고 정확한 사업체 데이터를 제공하는 것이다. 이것은 완전하고 정확한 데이터 수집, 엔터티 매칭, 식별 번호 할당, 회사 링키지, 및 예측 표시기들을 포함한다. 이러한 완전성 및 정확도는 사업체가 사업체 결정을 하기 위해 신뢰하고 의존하는 고품질 사업체 정보를 생성한다.
발명의 요약
사업체들로 하여금 사업체 판정을 할 수 있게 하는 품질 정보를 제공하기 위한 데이터 통합 방법, 특히 사업체 정보가 1차 데이터(primary data)로서 수집되는 방법. 1차 데이터는 정확도에 대해 테스팅되고 완전성(completeness)에 대한 2차 데이터를 생성하기 위해 처리된다. 2차 데이터를 형성하기 위해 1차 데이터를 처리하는 것은 회사 링키지(corporate linkage)를 수행하고 예측 표시기들(predictive indicators)을 제공하는 것을 포함한다. 이후, 조합된 1차 및 2차 데이터는 향상된 사업체 정보로서 제공된다. 1차 및/또는 2차 데이터는 주기적으로 샘플링되고 미리 정해진 조건들에 대해 평가된다. 그 결과, 테스팅 및/또는 처리가 품질을 보장하기 위해 조정된다.
1차 데이터를 테스팅하는 것은 1차 데이터가 이전에 저장된 데이터와 매칭하는지의 여부를 결정하는 것을 포함한다. 매칭이 발견되면, 이 때 회사 링키지(corporate linkage)(즉, 컴퍼니들간 계열들에 대한 검토)이 수행된다. 매칭이 발견되지 않으면, 이 때 테스팅은, 적어도 2개의 소스들이 1차 데이터와 연관된 사업체가 존재하는지를 확인하는 경우와 같은 1차 데이터가 제 1 임계 조건을 만족시키는지의 여부를 결정한다. 1차 데이터가 제 1 임계 조건을 만족시키면, 이 때 식별 번호(identification number)가 할당되고 2차 데이터가 생성되어 저장된다. 식별 번호는 유일하게 사업체를 식별하고, 1회 사용되며, 다시 사용되지 않는다. 1차 데이터가 제 1 임계 조건을 만족시키지 못하면, 이 때 1차 데이터는 새로운 데이터가 이용 가능하게 될 때까지 저장소에 저장된다. 새로운 데이터가 수신되면, 테스팅은 새로운 데이터를 함께 갖는 1차 데이터가 제 1 임계 조건을 만족시키는지의 여부를 결정하는 것을 포함한다. 그렇다면, 식별 번호가 할당되고 2차 데이터가 저장된다.
회상 링키지를 수행하는 것은 1차 데이터가 미리 정해진 판매량과 같은 제 2 임계 조건을 만족시키는지의 여부를 결정하는 것을 포함한다. 그렇다면, 이 때 1 차 데이터가 분석되어 처리되고 회사 패밀리를 1차 데이터와 연결짓기 위해 2차 데이터가 생성되어 저장된다. 회사 패밀리는 합병 또는 인수(merger or acquisition) 후 업데이팅된다. 1차 데이터가 제 2 임계 조건을 만족시키지 못하면, 이 때 예측 표시기들은 추가 2차 데이터로서 생성된다.
예측 표시기들은 단지 1차 데이터가 미리 정해진 레벨의 고객 조회(customer inquiry)와 같은 제 3 임계 조건을 만족시키면 생성된다. 그렇다면, 1차 데이터가 분석되어 처리되고 설명적 평가(descriptive rating), 점수(score), 또는 수요 추정기(demand estimator)와 같은 예측 표시기들(predictive indicators)로서 생성하기 위해 추가 2차 데이터가 생성되어 저장된다.
본 발명의 다른 실시예는 데이터 통합을 위한 시스템이다. 이 시스템은 데이터베이스, 데이터 수집 성분, 식별 번호 성분, 및 예측 표시기 성분을 포함한다. 이 데이터베이스 성분은 사업체와 연관된 정보를 저장한다. 데이터 수집 성분은 사업체와 연관된 1차 데이터를 수집한다. 식별 번호 성분은 식별 번호를 1차 데이터에 적용하고 2차 데이터를 데이터베이스 성분에 저장한다. 예측 표시기 성분은 사업체와 연관된 예측 표시기를 제공하고 또한 2차 데이터를 데이터베이스 성분에 저장한다. 위 시스템은 또한 엔터티 매칭 성분(entity matching component) 및 회사 링키지 성분(corporate linkage component)을 포함할 수 있다. 엔터티 매칭 성분은 데이터베이스 성분에서 사업체의 복제 엔트리들(duplicate entries)을 방지한다. 회사 링키지 성분은 회사 패밀리(corporate family)를 데이터베이스 성분내의 사업체와 연관짓는다.
본 발명의 다른 실시예는 데이터 통합을 위한 실행 가능한 명령들을 저장하는 기계-판독 가능 매체이다. 위 명령들은 사업체에 대한 1차 데이터를 수집하고, 위 사업체에 대한 엔터티 매칭을 수행하고, 식별 번호를 위 사업체에 적용하고, 위 사업체에 대해 회사 링키지를 수행하고, 위 사업체에 대해 예측 표시기들을 제공하는 것을 포함한다.
식별 번호를 적용하는 것은 요구를 받고 시작하는 처리이다. 이러한 요구는 식별 번호 및 1차 데이터를 가진다. 식별 번호가 이미 존재하지 않으면, 이 때 하나가 할당된다. 다른 방법으로, 식별 번호가 다른 데이터에 링크되면, 이 때 유효화(validation)가 수행되고 식별 번호가 제공된다.
회사 링키지를 수행하는 것은 패밀리 트리(family tree)를 유지하고, 조사(investigation)를 수행하고, 패밀리 트리를 처리하고, 그것을 저장하는 것을 포함한다. 패밀리 트리는 임의의 표준 산업 분류들(standard industrial classifications)을 리뷰 및 업데이팅하고, 거래방식들(tradestyles)을 리뷰 및 표준화하고, 임의의 복제들(duplicates)을 분석함으로써 유지된다. 조사(investigation)는 정보를 모은다. 패밀리 트리는 모인 정보를 리뷰 및 처리, 임의의 매칭들을 리뷰 및 업데이팅하고, 임의의 꼭 닮은 것(look-a-likes) 또는 언링크 외부 데이터(unlinked foreign data)를 분석함으로써 처리된다.
예측 표시기들을 제공하는 것은 예측하기 위해 모델 및 결과(outcome)를 결정하는 것을 포함한다. 이 후, 전개 샘플들(development samples)이 선택되고, 프로파일이 생성되고, 통계적 분석이 수행된다. 끝으로, 예측 표시기가 모델, 결과, 샘플들, 프로파일 및 통계적 분석에 기초하여 제공된다.
본 발명의 상기 및 다른 특징들, 양태들, 및 이점들은 도면들, 상세한 설명, 및 특허청구범위를 참조함으로써 더 잘 이해될 것이다.
도 1은 본 발명에 따른 데이터 통합 방법의 블록도.
도 2는 본 발명에 따른 데이터 통합 시스템의 블록도.
도 3은 본 발명에 따른 데이터 통합 시스템의 블록도.
도 4는 본 발명에 따른 데이터 통합 방법을 도시한 논리도.
도 5는 본 발명에 따른 데이터 수집의 예시적인 소스들의 블록도.
도 6은 본 발명에 따른 데이터 수집의 더 많은 예시적인 소스들의 블록도.
도 7 및 도 8은 본 발명에 따른 엔터티 매칭의 블록도들.
도 9는 본 발명에 따라 매칭 데이터가 하나의 데이터베이스에 전송되고 매칭되지 않은 데이터가 새로운 회사 식별 번호의 할당을 위해 보내지는 엔터티 매칭의 블록도.
도 10은 본 발명에 따라 매칭된 데이터가 하나의 데이터베이스에 전송되고 매칭되지 않은 데이터가 새로운 회사 식별 번호의 할당을 위해 보내지거나 추가 데이터가 모아질 때까지 데이터베이스 저장소에 저장되는 엔터티 매칭의 블록도.
도 11 및 도 12는 본 발명에 따른 엔터티 매칭 방법의 블록도.
도 13 내지 도 16은 본 발명에 따른 회사 링킹의 블록도.
도 17은 본 발명에 따라 회사 링키지를 수행하는 예시적인 방법의 논리도.
도 18A 및 도 18B는 본 발명에 따른 예측 표시기를 제공하는 예시적인 방법 의 블록도들.
발명의 상세한 설명
다음의 상세한 설명에 있어서, 참조 번호가 첨부 도면들에 붙여져 있다. 이들 도면들은 이 명세서의 일부를 이루고 예시적으로 본 발명이 실시될 수 있는 특정의 바람직한 실시예들을 나타낸다. 이들 실시예들은 이 기술 분야에서 숙련된 사람들이 본 발명을 실시할 수 있도록 충분히 상세히 기재되어 있다. 다른 실시예들이 사용될 수 있고 구조적, 논리적, 및 전기적 변경들이 본 발명의 사상 및 범위를 벗어나지 않고 만들어질 수 있다. 그러므로, 다음의 상세한 설명은 제한하는 견지에서 행해진 것이 아니며, 본 발명의 범위는 첨부 청구항들에 의해서만 정의된다.
도 1은 본 발명에 따른 데이터 처리 방법의 개관을 나타낸 도면이다. 위 방법의 기초는 품질 보증(102)이며, 이것은 연속 데이터 회계 감사(auditing), 유효화(validating), 정규화(normalizing), 보정 및 모든 처리에 따른 품질을 보장하기 위해 행해지는 업데이팅이다. 입력 데이터(104)를 순차적으로 향상시켜 그것을 품질 정보(106)로 전환시키도록 작용하는 5개의 품질 드라이버들이 있다. 이들 5개의 드라이버들은, 데이터 수집 드라이버(108), 엔터티 매칭 드라이버(110), 식별(identification; ID) 번호 드라이버(112), 회사 링키지 드라이버(114), 및 예측 표시기들 드라이버(116)가 있다. 이들 5개의 드라이버들은 데이터베이스(118)를 액세스한다. 데이터베이스(118)는 관계 데이터베이스(relational database), 객체-지향 데이터베이스(object-oriented database) 또는 임의의 종류의 데이터베이스와 같은 데이터 및 데이터베이스 관리 툴들의 유기적인 수집(organized collection)이다. 데이터베이스(118)내의 데이터는 품질 보증 및 글로벌 데이터 수집에서 고객 피드백(global data collection)에 기초하여 계속적으로 세분되어 향상된다.
데이터 수집 드라이버(108)는 다양한 소스들 월드와이드(variety of sources worldwide)로부터 데이터와 함께 가져온다. 이후, 데이터는 엔터티 매칭 드라이버(110)를 통해 데이터베이스(118)에 통합되고, 그 결과 각 사업체 엔터티의 단일의, 더 정확한 실상으로 된다. 다음에, 식별 번호 드라이버(112)는 그것이 통과하는 임의의 변경들을 통해 포괄적으로 식별 및 트래킹하는 유일한 수단으로서 식별 번호를 적용한다. 이후 회사 링키지 드라이버(114)는 전체 회사 위험 및 기회를 가능하게 하기 위해 코포레이션 패밀리들을 구성한다. 끝으로, 예측 표시기들 드라이버(116)는 사업체의 과거 성과(business'past performance)를 평가하고 그것이 미래에 동일한 방식으로 수행될 가능성을 나타내기 위해 통계적 분석을 이용한다.
도 2 및 도 3은, 다른 시스템들이 또한 본 발명을 실시하는 데 적합할 수 있지만, 본 발명에 따른 데이터 통합을 위한 시스템들의 2개의 예시적인 실시예들을 나타낸다. 도 2는 네트워크 구성을 나타내고, 도 3은 컴퓨터 시스템 구성을 나타낸다. 도 2에 있어서, 네트워크(200)는 컴퓨터 시스템(202)을 포함해서 다른 시스템 구성요소들 간의 통신을 용이하게 한다. 5개의 품질 드라이버들, 즉 데이터 수집 드라이버(108), 엔터티 매칭 드라이버(110), 식별 번호 드라이버(112), 회사 링키지 드라이버(114), 및 예측 표시기들 드라이버(116); 및 품질 보증(102)이 순차적으로 작동하여 입력 데이터(104)를 향상시키고 그것을 데이터베이스(204)에 저장되 는 품질 정보(106)로 변경시킨다. 도 3에 있어서, 컴퓨터 시스템(300)은 버스(306)를 통해 메모리(304)로의 액세스를 갖는 프로세서(302)를 가진다. 메모리(304)는 운영 체제 프로그램(308), 데이터 통합 프로그램(310), 및 데이터(312)를 저장한다.
도 4는 본 발명에 따른 데이터 통합 방법의 다른 실시예를 나타낸다. 이 방법은 데이터 통합의 5개의 주 구성요소들, 즉 데이터 수집(400), 엔터티 매칭(402), 식별 번호(404), 회사 링키지(406), 및 예측 표시기들 처리(408)를 포함하여 고품질 데이터(410)를 생성한다. 데이터 수집(400)은 2차 데이터를 모은다. 1차 데이터는 정밀도에 대해 테스팅되고 처리되어 2차 데이터를 생성한다. 1차 데이터를 처리하는 것은 회사 링키지(406)를 수행하고 예측 표시기들(408)을 제공하는 것을 포함한다. 이후, 조합된 1차 및 2차 데이터가 향상된 사업체 정보 또는 고품질 데이터(410)로서 제공된다. 1차 및 2차 데이터는 주기적으로 샘플링되어 미리 정해진 조건들에 대해 평가된다. 그 결과, 테스팅 및 처리가 품질을 보증하기 위해 조정된다.
1차 데이터를 테스팅하는 것은 엔터티 애칭(402)에서 이전에 저장된 데이터(412)와 매칭하는지의 여부를 판정하는 것을 포함한다. 매칭이 발견되면, 이 후 회사 링키지(406a)가 수행된다. 매칭이 발견되지 않으면, 이후 테스팅은, 적어도 2개의 소스들이 1차 데이터와 연관된 사업체가 존재하는지를 확인하는 경우와 같은 1차 데이터가 제 1 임계 조건(414)을 만족시키는지의 여부를 판정하는 것을 포함한다. 1차 데이터가 제 1 임계 조건을 만족시키면, 이 후 제어는 식별 번호 성분 (404)으로 이행하고 여기서 식별 번호가 할당되고(420) 2차 데이터가 저장된다(422). 식별 번호는 사업체를 유일하게 식별하고, 1회 사용되며, 다시 사용되지 않는다. 1차 데이터가 제 1 임계 조건을 만족시키지 못하면, 이후 1차 데이터는, 신 데이터가 이용가능할 때(418)까지 저장소(416)에 저장된다. 신 데이터가 수신되면, 테스팅은 신 데이터를 갖는 1차 데이터가 제 1 임계 조건을 만족시키는지의 여부를 결정하는 것을 포함한다. 그렇다면, 식별 번호가 할당되고 2차 데이터가 저장된다.
회사 링키지(406)를 수행하는 것은 1차 데이터가 미리 정해진 판매량과 같은 제 2 임계 조건(424)을 만족시키는지의 여부를 판정한다. 그렇다면, 1차 데이터는 분석 및 처리되고(426) 2차 데이터가 저장되어(428) 회사 패밀리를 1차 데이터와 연관짓는다. 회사 패밀리는 합병 또는 인수 후 업데이팅된다. 1차 데이터가 제 2 임계 조건을 만족시키지 못하면, 이 후 제어는 예측 표시기들 성분(408)으로 이행한다.
예측 표시기들(408)을 제공하는 것은 1차 데이터가, 미리 정해진 레벨의 소비자 조회(customer inquiry)와 같은 제 3 임계 조건(430)을 만족시키는지의 여부를 판정하는 것을 포함한다. 그렇다면, 1차 데이터는 분석 및 처리되고(432) 2차 데이터가 저장되어(434) 설명적 평가, 점수, 또는 수요 추정기와 같은 예측 표시기들을 생성한다.
따라서, 5개의 주 성분들 또는 드라이버들이 함께 작용하여 사업체 판정들을 하는 데 유용한 향상된 데이터에 수집된 데이터를 통합한다. 각각의 5개의 드라이버들은 데이터 수집 드라이버(108)로 시작해서, 이하에 더 상세히 검사된다.
도 5는 데이터 수집 드라이버(108)에 사용되는 데이터의 몇몇 소스들을 나타낸다. 데이터는 가능한 가장 완전한 데이터를 수집하는 목표를 갖는 고객들, 잠재고객들(prospects), 및 공급자들에 대해 수집된다. 몇몇 데이터 소스들은 그 중에서도 특히, 직접 조사들(502), 트레이드 데이터(504), 공개 레코드들(506), 및 웹 소스들(508)이다. 직접 조사들(502)은 사업체들에 대한 전화 통화들을 하는 것을 포함한다. 트레이드 데이터(504)는 트레이드 레코드들을 업데이팅하는 것을 포함한다. 공개 레코드들(506)은 법정, 유치권들, 재판들, 및 파산 신청, 및 사업체 등록들 등을 포함한다. 웹 소스들(508)은 URL들(uniform resource locators; URLs), 도메인들로부터의 업데이트들, 및 온라인 업데이트들을 제공하는 소비자들, 및 인터넷으로부터의 다른 웹 데이터를 포함한다.
웹 데이터는 "후이즈(Whois)" 파일들로부터의 정보 및 베리사인 레지스트리(VeriSign Registry)로 불리우는 등록된 도메인들을 위한 중앙 저장소로부터의 정보 및 다른 데이터를 포함한다. 후이즈는 당신이 VeriSign으로 등록된 임의의 제 2 레벨 도메인의 소유자임을 말할 프로그램이다. VeriSign은 마운틴 뷰, 캘리포니아에 본사를 둔 회사이다. 도메인명들의 기본 참조 파일은 식별 번호와 매칭되고 데이터 마이닝(data mining)을 통해 확장된다. 몇몇 URL들은 매치들(matches)에 수동으로 할당된다. "후이즈"파일로부터의 정보 및 데이터 마이닝은 데이터베이스(118)내의 데이터와 매칭된다. 기본 참조 파일은 상태(status), 보완 데이터, 증명 데이터 및 다른 데이터와 같은 추가 웹 사이트 데이터에 대한 데이터 마이닝에 의해 향상된다.
파일 커버리지(file coverage)가 확장된다. 식별 번호들 및 URL들의 모든 매칭들은 합리화된다(rationalized). 원-업, 원-다운 링키지(One-up, one-down linkage)가 사용되어 패밀리 트리 멤버들에 걸쳐 URL 커버리지를 확장한다. URL들은 상태 및 매칭형태에 기초하여 시퀀싱된다. URL들 또는 도메인들의 특정 번호, 즉 상위 5개(top five)가 출력 파일들에 포함된다. 다른 출력 파일은 모든 URL들로 생성되고 식별 번호들과 매칭된다(링키지가 아님).
URL 베이스 파일 데이터 요소들은 URL/도메인명, 매칭 코드, 상태 표시기들, 리다이렉트 표시기(redirect indicator), 및 식별 번호 당 총수 URL들을 포함한다. 매칭 코드는 사이트 또는 계열회사와 매칭된다. 상태 표시기는 구성 중에는 살아 있다(live). 리다이렉트 표시기는 다른 사이트로 리다이렉트되면 리스팅되는 실제 URL이다.
또한 URL 플러스 파일 요소들이 있고, 이것은 URL 베이스 파일과는 별도의 파일에 있다. 그것은 모든 URL들 및 URL 기본 파일로부터의 데이터, 웹사이트 복잡화(website sophistication)에 대한 요약 데이터, 및 액티브/라이브 URL들에 대한 보안성을 포함한다. 그것은 또한 외부 및 내부 링크들의 총수, 메타 태그 표시기(meta tag indicator), 보안 표시기들, 주어진 보안 소켓들 계층(presence secure sockets layer; SSL)과 같은 암호화 강도, 및 증명서 표시기들을 포함한다.
URL 플러스 확장된 요소들은 URL 베이스 URL과는 별도의 독립형 파일들 및 URL 플러스 파일들이다. 이들은 모든 URL 베이스 데이터 및 URL 플러스 라이브 URL들을 갖는 데이터, 웹사이트 복잡화에 대한 상세 데이터, 및 보안성을 갖는 데이터 를 포함한다. 이들은 보안 웹 서버 타입, 증명서 발행기 회사(certificate issuer company), 소유자 플래그(owner flag)를 포함하며, 이것은 증명서 소유자 또는 증명서 이용자(certificate utilizer), 증명서 사용자들의 수, 다수의 외부 URL 링크들, 즉 5개, 그리고 키워드들, 설명, 저자 및 제너레이터(generator)와 같은 메타 데이터를 포함한다.
도 6은 전화 번호부들 또는 업종별 전화번호부들(602), 뉴스 및 미디어(604), 직접 조사들(606), 컴퍼니 재정 정보(608), 납부 데이터(610), 법정들 및 법률 제출국들(612), 및 정부 등기소들(614)과 같은 증가된 정밀도를 위한 데이터 수집 드라이버(108)에 의해 사용되는 데이터의 몇몇 추가 소스들을 나타낸다. 이러한 정보의 완전성은 유리한 사업체 판정을 돕는다. 위험 관리에 있어서, 사용자는 얻은 정보로 미국이 아닌 회사(non-United States(U.S.))로부터의 위험을 평가한다. 소규모 사업체 고객들로부터의 위험은 더 완전하게 식별될 수 있다. 사용자는 위험 판정들이 더 완전한 정보에 기초할 경우 더 전문적이 위험 판정을 할 수 있다. 판매 및 마케팅에 있어서, 사용자는 많은 소스들로부터 얻은 데이터로부터 새로운 잠재고객들을 식별할 수 있다. 사용자는 국제 고객들 및 잠재고객들에 대한 액세스를 얻을 수 있고, 표준 산업 분류(standard industrial classification; SIC)와 같은 부가 가치 정보 및 연락명을 갖는 잠재고객 리스트를 꼼꼼히 고를 수 있다. 공급 관리에 있어서, 사용자는 결과적인 정보로 외부 공급자들로부터의 위험을 평가할 수 있고 더 완전하게 공급자들로부터 위험을 식별할 수 있다. 사용자는 데이터베이스(118)에 대한 일일의 업데이트로 인해 각 고객, 잠재고객, 및 공급자 의 더 새롭고 더 완전한 실상(picture)를 얻을 수 있다.
도 7은 어떻게 다수의 매칭되지 않은 데이터의 피스들(702)이 완전한 단일의 사업체(704)로 전환될 수 있는 가를 나타낸다. 엔터티 매칭 드라이버(110)는 입력 데이터(104)를 체킹하여 그것이 데이터베이스(118)내의 어떤 기존 사업체에 속하는지의 여부를 알아낸다. 이 예에서, ABC, 인코포레이티드, 척의 미니-마트, 및 찰스 스미스는 별도의 회사들인 것으로 보이지만, 엔터티 매칭 후, 이들이 하나의 기업체, ABC 인코포레이티드 및 척의 미니-마트의 모든 부분임이 명백하다. 상이한 주소들 및 다른 관련 정보가 또한 완전한 단일 사업체(704)와 일치된다.
도 8은 어떻게 데이터베이스(118)내의 사업체와 매칭하는 입력 데이터(104)가 엔터티 매칭 드라이버(110)를 통해 사업체에 첨부되는 가를 나타낸다. 다른 케이스가 도 9에 도시되어 있고, 여기서 데이터베이스(118)내의 어떤 사업체와도 매칭하지 않는 입력 데이터(104)가 새로운 사업체로서 지정되거나, 도 10에 도시된 것과 같이, 추가의 데이터가 신 사업체인가를 확인하는 추가 데이터를 대기하기 위해 저장소(1002)에 유지된다. 엔터티 매칭 드라이버(110)는 매번 정확한 사업체에 데이터를 매칭시키도록 설계되고, 따라서, 효율을 증가시킨다. 엔터티 매칭 드라이버(110)는 더 완전하고 정확한 고객, 잠재고객들, 및 공급자 프로파일들을 제공하여 중복 사업체가 훨씬 더 적게 보장한다.
도 11은 매치 드라이버(110)를 통한 예시적인 매칭 방법을 나타낸다. 이 방법은 클리닝 및 파싱(1102), 후보 검색의 수행(1104), 및 판정 수행(1106)을 포함한다. 클리닝 및 파싱(1102)은 조회 데이터(1108) 키 성분들의 식별, 성명, 주소, 및 시의 정규화(1110), 성명 일치(name consistency)의 수행(1112), 및 주소 표준화의 수행(1114)을 포함한다. 후보 검색(1104)은 참조 데이터베이스로부터 가능한 매칭 후보들을 모으고(1116), 검색 품질 및 속도를 향상시키기 위해 키들을 이용하고(1118), 조회 데이터에서 제공된 데이터에 기초하여 키들을 최적화하는(1120) 것을 포함한다. 판정 수행(1106)은 일관된 표준에 따라 매칭들을 평가하고(1122), 매칭 등급을 적용하고(1124), 신용 코드를 적용하고(1126), 신용 백분위율을 적용하는(1128) 것을 포함한다.
도 12는 드라이버(110)를 통한 더욱 상세한 매칭 방법을 나타낸다. 이 방법은 웹 서비스들(1202), 클리닝, 파싱 및 표준화(1204), 후보 검색(1206), 및 측정, 평가, 및 판정(1208)을 포함한다. 웹 서비스들(1202)에 있어서, HTTP 서버는 요구를 수용하고 HTTP를 통해 XML로 응답을 제공하고(1210), 애플리케이션 서버는 XML 요구를 처리하고 그것을 JAVA 오브젝트들로 변환한 후 JAVA 오브젝트들을 처리하고 이들을 다시 XML로 변환한다(1212). 클리닝, 파싱 및 표준화(1204)에 있어서, 성명 및 주소 요소들이 파싱되고 무관한 워드들(extraneous words)이 제거된다(1214). 이후, 주소는, 주소 및 시명들(city names)이 정확한가를 확신하기 위해 확인되고 우편 번호(zip code) 플러스 4 및 위도 및 경도가 할당된다(1216). 참조 테이블은 헛된 시 및 헛된 거리명들을 유지한다(1218). 후보 검색(1206)에 있어서, 키들이 참조 데이터베이스로부터의 후보들의 검색에 사용하기 위해 발생된다(1220). 이후, 키들이 검색 방식에서의 효과적인 데이터베이스 검색 및 후보 검색을 위해 최적화된다(1222). 참조 테이블들이 참조 데이터베이스(1224)를 검색하기 위해 확립 및 유지된다. 측정, 평가 및 판정(1208)에 있어서, 조회와 후보간의 매칭 정도를 나타내는 신용 점수의 크기가 구해진다. 이후, 각 후보를 온라인으로 제공하는 순서가 확립되고 배치(batch)에서 최선의 후보가 선택된다. 이 기술분야에서 숙련된 사람이 생각해낼 수 있는 매칭을 수행하는 다른 방법들도 본 발명을 실시하기 위해 가능하다.
식별(ID) 번호 드라이버(112)는 유일한 식별 번호를 사업체마다에 첨부하여 그것이 용이하고 정확하게 식별될 수 있게 한다. 유일한 식별 번호의 일 예는 뉴저지, 쇼트 힐즈(Short Hills)에 본사를 둔 던 앤 브래드스트리트(Dun & Bradstreet)사제의 D-U-N-S®번호와 같은 것이 있고, 이것은 사업체가 변경들 및 업데이트들을 통해 용이하게 트래킹될 수 있게 하는 9자리 수이다. 식별 번호는 사업체가 존속하는 한 유지된다. 2개의 사업체들은 전혀 동일한 식별 번호를 수신하지 않고 식별 번호들은 결코 다시 사용되지 않는다. 식별 번호는 다수의 데이터 소스들이 사업체가 존재하는 것을 확인할 때까지 할당되지 않는다. 식별 번호는 사업체 식별을 위한 산업 표준으로서 작용한다. 그것은 국제 연합, 국제 표준 기구(International Standards Organization; ISO), 유럽 위원회(European Commission), 및 50개의 산업 그룹들에 걸쳐 보장된다.
식별 번호는 본 발명에 따른 데이터 처리 방법에서의 중심 개념이다. 품질 보증을 위해, 식별 번호는 모든 처리 단계에서 정보의 확인을 허용한다. 데이터 수집 드라이버(108)에 있어서, 데이터가 기존 식별 번호에 링크되지 않으면, 그것은 신 사업체일 가능성을 나타낸다. 엔터티 매칭 드라이버(110)에 있어서, 식별 번호 는 신 데이터로 하여금 기존 사업체들과 정확하게 매칭되게 한다. 회사 링키지 드라이버(114)에 있어서, 회사 패밀리들은 각각의 사업체 식별 번호에 기초하여 조립된다. 예측 표시기들 드라이버(116)에 있어서, 식별 번호는 예측 툴들(predictive tools)을 구성하기 위해 사용된다.
부가적으로, 식별 번호는 사업체가 존재하는지를 확인하는 데 도움을 줌으로써 사용자의 사업체에게 새로운 영역의 기회를 열어준다. 사용자들에게는 잠재고객들, 고객들, 및 공급자들의 완전한 모습(complete view)이 제공된다. 기존 데이터는 명백하게 되고, 복제(duplication)가 제거되고, 관련 사업체들이 관련지어져 표시된다. 사용자들은 식별 번호가 사용자 정보에 첨부된 경우 많은 소비자 또는 공급자들 그룹들을 더 용이하게 관리할 수 있다. 사용 정보에 첨부된 때 식별 번호는 신속하고 용이한 데이터 업데이트들을 가능하게 한다.
도 13은 식별 번호 드라이버(112)의 예시적인 방법을 나타낸다. 위 처리는 성명, 주소, 주 등의 입력을 포함해서, 식별 번호 요구로 시작한다(1302). 예를 들면, 레코드가 데이터베이스(118)에 아직 존재하지 않는 새로운 사업체에 대해 생성되지 않은 경우, 식별 번호가 요구된다. 찾기 동작(1304)에 있어서, 데이터베이스(118)는 요구에서 식별 번호에 대해 검색된다. 그것이 1306에서 발견되면, 이후 식별 번호는 고객들에게 이용 가능하게 된다(1308). 그와는 달리, 요구로부터의 입력은 1310에서 캡쳐되고 Mod 10 유효화(1312)를 포함해서 식별 번호가 할당된다. Mod 10 유효화는 번호들을 명확하게 하기 위해 끝에 체크 디지트(check digit)를 할당한다. 다른 식별 번호들 단계로의 링키지에 있어서(1314), 링키지가 있다면 그 때 그것은 프론트 엔드 유효화들이 수행(1318)되기 전에 유효화된다(1316). 이 후, 복제 유효화들(1320) 및 메인프레임 유효화들(1322)이 수행되고, 식별 번호가 고객들에게 이용 가능하게 된다(1308). 링키지 유효화는 예를 들면 브랜치가 다른 브랜치에 링크되는 것과 같은 에러들을 방지한다.
도 14 내지 도 16은 어떤 회사들이 관련되어 있는지를 보이기 위해 어떻게 회사 링키지 드라이버(114)가 회사 링키지를 구성하는가를 나타낸다. 회사 링키지가 없다면, 도 14의 회사들, 즉 L 리파이너리부(1402), C 스토어즈 인코포레이티드(1404), 및 G 스토리지부(1406)는 관련이 없는 것처럼 보인다.
그러나, 도 15에 나타낸 것과 같이, 회사 링키지를 적용하는 것은 전체 회사 패밀리로 하여금 깊이 또는 폭의 제한 없이 보여질 수 있게 한다. 모 회사 U 프로덕츠 그룹 코포레이션(1502)은 그 아래에 3개의 자회사들, 즉 L 인코포레이티드(1504), C 인코포레이티드(1506), 및 G 인코포레이티드(1508)를 가진다. L 인코포레이티드(1504)는 2개의 지점들, 즉 L 스토리지부(1510) 및 L 리파이너리부(1402)(도 14에 도시됨)를 가진다. C 인코포레이티드(1506)는 2개의 지점들, 즉 인더스트리얼 컴퍼니(1512) 및 빌딩 컴퍼니(1514) 및 자회사, 즉 C 스토어즈 인코포레이티드(1404)(도 4에 도시됨)를 가진다. G 인코포레이티드(1508)는 2개의 지점들, 즉 G 스토리지부(1406)(도 14에 도시됨) 및 G 리파이너리부(1516)를 가진다. C 스토어즈 인코포레이티드는 4개의 지점들, 즉 노스 스토어 인코포레이티드(1518), 사우스 스토어 인코포레이티드(1520), 웨스트 스토어 인코포레이티드(1522), 및 이스트 스토어 인코포레이티드(1524)를 가진다. 빌딩 확장 회사 링키지는 사업체 정보 제공자 가 이러한 완전한 상세를 제공함으로써 산업 리더(industrial leader)가 되게 한다.
도 16은 어떻게 회사 링키지 드라이버(114)가 합병 및 인수 후 패밀리 트리들을 업데이팅하는지를 나타낸다. 이러한 예에서 있어서, 2개의 별도의 사업체들, 즉 ABC (1602) 및 XYZ(1604)는 합병 전에 존재하고 이들 각각은 그들 자신의 자회사들 및 지점들을 가진다. 합병 후, ABC XYZ(1606)는 2개의 자회사들, 즉 ABC 자회사(1608) 및 XYZ 자회사(1610)를 가지며, 이들 각각은 그들 자신의 지점 및/또는 자회사들을 가진다.
회사 링키지 드라이버(114)는 위험 관리, 판매 및 마케팅, 및 사용자를 위한 공급 관리에서 유익한 기회들을 열어 준다. 그것은 사용자로 하여금 회사 패밀리에 대한 전체 위험 노출을 이해할 수 있게 한다. 사용자는 하나의 회사 및 그 회사 패밀리의 나머지에서 파산 또는 재정 압박간의 관계를 인식한다. 사용자는 회사 패밀리 내에서 새로운 그리고 기존 고객들에게서 기회가 증가한 것을 발견할 수 있고 그것의 최상의 고객들 및 잠재고객들이 누구인지 알 수 있을 것이다. 사용자는 더 나은 평가를 위해 회사 패밀리에 의한 그것의 총 소비를 결정할 수 있다.
도 17은 회사 링키지 드라이버(114)를 수행하는 예시적인 방법을 나타낸다. 일반적으로, 그것은 패밀리 트리 링키지(1700)를 업데이팅하는 방법을 나타내고, 여기서 그 목표는 모든 꼭닮은 것들(look-a-likes; LALs)을 분석하면서, 식별 번호를 가진 각각의 엔터티의 모든 자회사들 및 지점들을 일관된 성명들, 거래 방식들, 및 정확한 고용주 번호들과 정확하게 링크시키는 것이다.
예를 들면, 파일 구성 및 다른 활동들은 원래 링크되지 않은 레코드들, 예컨대 복제 레코드들 또는 분석하는 데 필요한 꼭닯은 것들(LALs)을 생성할 수 있다. 예를 들면, 누군가 렌즈크래프트들(LensCrafters)에 대한 레코드를 생성했지만 그것이 렌즈크래프트들 USA였을 경우 그것을 렌즈크래프터들 아이글래시스(LensCrafters EyeGlasses)라 부르면, 이 때 당신은 꼭닮은 것 또는 복제 레코드를 가질 수 있다. 이것을 방지하기 위해, 방법 1700은 꼭닮은 레코드들을 분석한다. 꼭닮은 기록들을 분석하는 일반적인 규칙들이 있다. 먼저, 꼭닮은 것이 디렉토리 상에 있거나 본사에서 구두로 확인될 수 있으면, 이 때 그에 따라 그것이 링크된다. 둘째, 미확인 꼭닯은 것들은 전화 조회를 필요로 한다. 셋째, 모든 꼭닮은 것들은 협력 레벨(cooperation level)과 관계없이 트리 로그오프(tree logoff) 이전에 분석되어야 한다.
방법 1700의 시작에서, 회사는 디렉토리에 대해, 바람직하게는 전자 버전에 대해 연락된다(1702). 가능한 연락들(contacts)은 전자 연락(former contact), 인간 리소스들, 법률부, 제어기, 투자자 관계들 등을 포함한다. 디렉토리가 이용 가능하면, 벌크 처리 가능성에 대한 디렉토리 및 트리가 오프쇼어 키잉(offshore keying)(1704)을 포함해서 평가된다. 이 후, 그에 따라 트리가 갱신된다. 한편, 디렉토리가 이용 가능하지 않았다면, 인터넷이 회사 웹사이트(1706)에 대해 검색된다. 웹사이트가 이용 가능하면, 웹사이트 정보가 오프쇼어 키잉을 포함하여 벌크 처리 가능성에 대해 평가되고 그에 따라 트리가 업데이팅된다(1708). 웹사이트가 이용 가능하지 않으면, 그것은 회사가 공개적으로 트레이드되었는지의 여부를 결정 한다(1710). 그렇다면, 최근의 10-K가 체크된다. 이와는 달리, 자회사들은 트리 구조를 구두로 확인하기 위해 호출된다. 꼭닮은 것들이 분석되고 트리 로그오프가 수행된다.
예측 표시기 드라이버(116)는 사업체에 대해 수집된 정보를 요약하고 미래의 성과를 예측하기 위해 그것을 사용한다. 3가지 형태의 예측 표시기들, 즉 설명적 평가들(descriptive ratings), 예측 점수들, 및 수요 추정기들이 있다. 설명적 평가들은 회사의 과거 성과의 전체 설명적 등급이다. 예측 점수들은 사업체가 미래에 얼마나 신용가치가 있을 수 있는가의 예측이다. 수요 추정기들은 전체적으로 얼마나 많은 제품을 사업체가 구매할 수 있는 가를 추정한다.
예측 표시기들은 모든 영역의 사업을 가속시키기 위해 사용자를 돕는다. 위험 관리에 있어서, 설명적 평가들은 사용자 허가를 돕거나 신용(credit)을 승인한다. 평가는 과거 재정 성과에 기초한 회사의 신용 가치를 나타낸다. 점수는 과거 납부 이력에 기초한 신용 가치를 나타낸다. 예측 점수들은 고위험 근거들을 신속하게 식별하고 적극적인 수집을 즉시 시작하기 위해 사용자의 전체 포트폴리오에 걸쳐 적용될 수 있다. 상업적 신용 점수는 다음의 12개월에 걸쳐 느리게 납부할 사업체의 가능성을 예측한다. 재정 압박 점수는 다음의 12개월에 걸쳐 실패할 사업체의 가능성을 예측한다. 판매 및 마케팅에 있어서, 수요 추정기들은 사용자에게 누가 구매할 가능성이 있는가를 알려 주어 그것은 고객들 또는 잠재고객들 중에서 우선 기회를 줄 수 있다. 수요 추정기들의 예들은 다수의 개인용 컴퓨터 및 근거리 또는 장거리 소비(long distance spending)를 포함한다. 공급 관리에 있어서, 예측 점수 들은 미래에 실패할 이들의 위험을 신속하게 이해시키기 위해 모든 사용자 공급기들에게 적용될 수 있다.
게다가, 예측 점수들은 사용자의 특정 요구 및 기준에 따라 만들어 질 수 있다. 예를 들면, 기준은 (1) 어떤 거동이 사용자가 예측하기를 원하는 것인가, (2) 사용자가 평가하기를 원하는 사업체의 규모는 무엇인가, (3) 위험 평가를 신용 판정 또는 위험 관리 활동으로 바꾸기 위해 사용자 위험 허용오차에 기초한 판정 규칙들이 무엇인가 같은 것이 사용될 수 있다.
예측 표시기들은 분석 능력 및 데이터 능력에 의해 가능하게 된다. 예를 들면, 노련한 B2B(business-to- business) 전문가 PhDs의 전문 팀은 기초 예측 모델들을 만들 수 있고 산업-특정 지식, 재정 및 납입 정보, 및 분석을 위한 확장 이력 정보에 대해 액세스할 수 있다.
도 18A 및 도 18B는 예측 표시기를 생성하는 예시적인 방법을 나타낸다. 그것은 시장 분석(1802)으로 시작하고 이후 모델 전개을 위한 사업체 판정이 있다(1804). 이러한 판정은 끝에서 출력되고 전개될 점수의 형태, 예컨대 실패 위험 점수, 불이행 위험 점수 또는 산업 특정 점수를 포함한다. 실패 위험 점수는 회사가 운영들을 멈출 가능성이다. 불이행 위험 점수는 회사가 늦게 지불할 가능성이다. 산업 특정 점수는 카피어들(copiers) 또는 행상인들을 이용할 가능성 또는 회사가 양호한 신용 위험에 있는지의 여부와 같은 특별한 것을 예측한다. 입력 데이터(1806)는 크레딧 데이터베이스(1808)의 저장소 및 신용과 관련된 이력 데이터를 제공하는 트레이드 테이프 데이터베이스(1810)로부터 모인다. 2개의 관심이 가는 시 간 기간들, 즉 모든 사실들(facts)에서 역사적으로 보이는 것인 활동 기간 및 무엇이 일어났는지를 알기 위해 그 직후의 시간 기간인 결과적인 기간이 있다. 예를 들면, 전년도의 데이터가 주어지면, 회사가 어떻게 현 연도의 특정 시간 기간에 대해 수행하는가를 알 수 있다. 다음 단계는 다음의 12개월에서의 부정적인 실패 가능성을 예측하는 재정 압박 점수와 같은 평가될 위험과 관련된 "불량 정의(bad definition)"(예측될 결과)를 결정한다.
전개 샘플은 사업체 모집단(business universe)(1814)으로부터 선택되고, 인구통계학 프로파일(demographic profile)이 사업체 모집단(1816)으로 생성되고(1816), 설명적 데이터 분석이 수행된다(1818)(모든 변수들의 일도량 분석(univariate analysis)). 예컨대 변수의 범위, 변수의 종류를 결정하고, 변수들을 포함하거나 포함하지 않는 것 및 모델에 놓기 위한 것을 이해하는 것과 관련된 다른 기능들과 같은 태스크들이 수행된다. 변수들은 활동 기간에 따라 선택될 수 있고 그 결과로 얻어진 기간 및 가중치들이 정확도 또는 대표성을 나타내기 위해 할당될 수 있다. 경향들이 요인 중 하나로서 포함된다. 품질 보증은 사업체 모집단내의 어떤 것이 초기 모델에 영향을 주는지를 알기 위해, 점수를 취하고, 이전 기간이 여전히 지시적이거나 예측적인지를 검사하기 위해 그것을 이전 기간에 대해 실행하기 위해 주기적으로 검사하는 것을 포함한다. 샘플들은 결함들(flaws)을 가질 수 있다.
도 18B에 계속 설명하면, 논리적 회귀 및 다른 추정 기술들을 포함하는 통계적 분석 및 모델 전개 과정들(1820)이 수행된다. 이 단계는 적절한 모델들, 식들, 및 통계학을 적용하는 것을 포함한다. 다음에, 통계 계수들은 점수표로 변환된다(1822). 모델들은 테스팅되고 유효화되고(1824), 기술적 스펙들이 전개된다(1826). 끝으로, 모델이 구현되고(1828) 테스팅된다(1830). 데이터는 점수를 발생하기 위해 모델을 통해 실행된다. 주기적으로, 검사들을 수행하여 점수가 여전히 유효한가를 확인하고, 점수표가 업데이트될 필요가 있는지를 결정한다.
상기의 설명은 설명을 위한 것이며 제한하고자 하는 것이 아니라는 것이 이해될 것이다. 많은 다른 실시예들이 상기의 설명을 살펴볼 때 이 기술분야에서 숙련된 사람에게 명백할 것이다. 데이터 수집을 수행하고, 엔터티 매칭을 수행하고, 식별 번호를 적용하고, 회사 링킹을 수행하고, 예측 표시기들을 제공하기 위한 다양한 실시예들이 기술된다. 본 발명은 사업체 정보 산업 외의 응용들에 응용할 수 있다. 그러므로, 본 발명의 범위는 청구항들이 부여하는 등가물들의 전 범위와 함께 첨부 청구항들에 대해 결정되어야 한다.

Claims (31)

  1. 데이터 통합 방법에 있어서,
    1차 데이터를 포함하는 정보를 수집하는 단계;
    정확도에 대해 상기 1차 데이터를 테스팅하는 단계;
    2차 데이터를 생성하기 위해 상기 1차 데이터를 처리하는 단계; 및
    상기 1차 데이터 및 상기 2차 데이터를 포함하는 향상된 정보를 제공하는 단계를 포함하는, 데이터 통합 방법.
  2. 제 1 항에 있어서,
    상기 1차 및/또는 2차 데이터를 주기적으로 샘플링하여, 샘플 데이터를 발생하는 단계;
    품질 평가 조건에 따라 상기 샘플 데이터를 평가하는 단계; 및
    상기 평가에 기초하여 상기 테스팅 및/또는 처리하는 단계를 조정하는 단계를 더 포함하는, 데이터 통합 방법.
  3. 제 1 항에 있어서,
    상기 테스팅 단계는,
    (a) 상기 1차 데이터가 저장된 데이터와 매칭하는지의 여부를 결정하는 단 계; 및
    (b) 식별 번호를 상기 1차 데이터에 할당하는 단계;
    로 구성된 그룹으로부터 선택된 적어도 하나의 단계를 포함하는, 데이터 통합 방법.
  4. 제 3 항에 있어서,
    단계 (a)에서 상기 1차 데이터가 상기 저장된 데이터와 매칭하지 않는다면 단계 (b)에서 식별 번호를 할당하기 전에 상기 1차 데이터가 제 1 임계 조건을 만족시키는지의 여부를 결정하는 단계를 더 포함하는, 데이터 통합 방법.
  5. 제 4 항에 있어서,
    상기 제 1 임계 조건은 상기 1차 데이터와 연관된 사업체(business)가 존재하는지를 확인하는 적어도 2개의 소스들인, 데이터 통합 방법.
  6. 제 3 항에 있어서,
    상기 식별 번호는 엔터티 식별자(entity identifier)인, 데이터 통합 방법.
  7. 제 3 항에 있어서,
    상기 1차 데이터가 상기 제 1 임계 조건을 만족시키지 못하면 상기 1차 데이터를 저장하는 단계를 더 포함하는, 데이터 통합 방법.
  8. 제 7 항에 있어서,
    추가 1차 데이터를 수신하는 단계;
    상기 1차 데이터 및 상기 추가 1차 데이터가 상기 제 1 임계 조건을 만족시키는지의 여부를 결정하는 단계;
    상기 1차 데이터 및 상기 추가 데이터가 상기 제 1 임계 조건을 만족시키면 단계 (b)에서 식별 번호를 할당하는 단계를 더 포함하는, 데이터 통합 방법.
  9. 제 1 항에 있어서,
    상기 1차 데이터를 처리하는 상기 단계는,
    회사 링키지(corporate linkage)를 결정하는 단계; 및
    적어도 하나의 예측 표시기(predictive indicator)를 결정하는 단계;
    로 구성된 그룹으로부터 선택된 적어도 하나의 단계를 포함하는, 데이터 통합 방법.
  10. 제 9 항에 있어서,
    상기 회사 링키지를 결정하는 상기 단계는,
    상기 1차 데이터가 제 2 임계 조건을 만족시키는지의 여부를 결정하는 단계; 및
    상기 2차 데이터를 발생하기 위해 상기 1차 데이터를 처리하는 단계를 포함 하는, 데이터 통합 방법.
  11. 제 10 항에 있어서,
    상기 제 2 임계 조건은 미리 결정된 판매량인, 데이터 통합 방법.
  12. 제 10 항에 있어서,
    상기 1차 데이터를 처리하는 상기 단계는,
    적어도 하나의 계열 엔터티(affiliated entity)를 상기 1차 데이터와 연관짓는 단계를 포함하는, 데이터 통합 방법.
  13. 제 9 항에 있어서,
    상기 적어도 하나의 예측 표시기를 결정하는 상기 단계는,
    상기 1차 데이터가 제 3 임계 조건을 만족시키는지의 여부를 결정하는 단계;
    상기 2차 데이터를 발생하기 위해 상기 1차 데이터를 처리하는 단계를 포함하는, 데이터 통합 방법.
  14. 제 13 항에 있어서,
    상기 제 3 임계 조건은 미리 결정된 레벨의 고객 조회(customer inquiry)를 포함하는, 데이터 통합 방법.
  15. 데이터 통합 시스템에 있어서,
    적어도 하나의 데이터 소스로부터 1차 데이터를 모을 수 있는 데이터 발생기;
    정확도에 대해 상기 1차 데이터를 테스팅할 수 있는 테스팅 유닛;
    상기 1차 데이터를 분석할 수 있고 상기 분석 결과로부터 2차 데이터를 발생할 수 있는 제 1 처리 유닛; 및
    향상된 정보를 형성하기 위해 상기 1차 데이터 및 상기 2차 데이터를 합칠 수 있는 제 2 처리 유닛을 포함하고,
    상기 테스팅 유닛, 제 1 처리 유닛 및 제 2 처리 유닛은 동일한 것이거나 서로 독립적인 것일 수 있는, 데이터 통합 시스템.
  16. 제 15 항에 있어서,
    상기 테스팅 유닛은 데이터 매칭 유닛 및 엔터티 식별자 유닛(entity identifier unit)으로 구성된 그룹으로부터 선택된 적어도 하나를 포함하는, 데이터 통합 시스템.
  17. 제 15 항에 있어서,
    상기 제 1 처리 유닛은 회사 링키지 유닛 및 예측 표시기 유닛으로 구성된 그룹으로부터 선택된 적어도 하나를 포함하는, 데이터 통합 시스템.
  18. 데이터 통합을 위한 실행 가능한 명령들을 저장하는 기계-판독 가능 매체에 있어서,
    상기 명령들은,
    1차 데이터를 포함하는 정보를 수집하는 단계;
    정확도에 대해 상기 1차 데이터를 테스팅하는 단계;
    2차 데이터를 생성하기 위해 상기 1차 데이터를 처리하는 단계; 및
    상기 1차 데이터 및 상기 2차 데이터를 포함하는 향상된 정보를 제공하는 단계를 포함하는, 기계-판독 가능 매체.
  19. 제 18 항에 있어서,
    상기 1차 및/또는 2차 데이터를 주기적으로 샘플링하여, 샘플 데이터를 발생하는 단계;
    품질 평가 조건에 따라 상기 샘플 데이터를 평가하는 단계;
    상기 평가에 기초하여 상기 테스팅 및/또는 처리하는 단계를 조정하는 단계를 더 포함하는, 기계-판독 가능 매체.
  20. 제 18 항에 있어서,
    상기 테스팅하는 단계는,
    (a) 상기 1차 데이터가 저장된 데이터와 매칭하는지의 여부를 결정하는 단계; 및
    (b) 식별 번호를 상기 1차 데이터에 할당하는 단계;
    로 구성된 그룹으로부터 선택된 적어도 하나의 단계를 포함하는, 기계-판독 가능 매체.
  21. 제 20 항에 있어서,
    단계 (a)에서 상기 1차 데이터가 상기 저장된 데이터와 매칭하지 않는다면 단계 (b)에서 식별 번호를 할당하기 전에 상기 1차 데이터가 제 1 임계 조건을 만족시키는지의 여부를 결정하는 단계를 더 포함하는, 기계-판독 가능 매체.
  22. 제 21 항에 있어서,
    상기 제 1 임계 조건은 상기 1차 데이터와 연관된 사업체가 존재하는지를 확인하는 적어도 2개의 소스들인, 기계-판독 가능 매체.
  23. 제 20 항에 있어서,
    상기 식별 번호는 엔터티 식별자인, 기계-판독 가능 매체.
  24. 제 20 항에 있어서,
    상기 1차 데이터가 상기 제 1 임계 조건을 만족시키지 못하면 상기 1차 데이터를 저장하는 단계를 더 포함하는, 기계-판독 가능 매체.
  25. 제 24 항에 있어서,
    추가 1차 데이터를 수신하는 단계;
    상기 1차 데이터 및 상기 추가 1차 데이터가 상기 제 1 임계 조건을 만족시키는지의 여부를 결정하는 단계; 및
    상기 1차 데이터 및 상기 추가 데이터가 상기 제 1 임계 조건을 만족시키면 단계 (b)에서 식별 번호를 할당하는 단계를 더 포함하는, 기계-판독 가능 매체.
  26. 제 18 항에 있어서,
    상기 1차 데이터를 처리하는 상기 단계는,
    회사 링키지를 결정하는 단계; 및
    적어도 하나의 예측 표시기를 결정하는 단계;
    로 구성된 그룹으로부터 선택된 적어도 하나의 단계를 포함하는, 기계-판독 가능 매체.
  27. 제 26 항에 있어서,
    상기 회사 링키지를 결정하는 상기 단계는,
    상기 1차 데이터가 제 2 임계 조건을 만족시키는지의 여부를 결정하는 단계; 및
    상기 2차 데이터를 발생하기 위해 상기 1차 데이터를 처리하는 단계를 포함하는, 기계-판독 가능 매체.
  28. 제 27 항에 있어서,
    상기 제 2 임계 조건은 미리 결정된 판매량인, 기계-판독 가능 매체.
  29. 제 27 항에 있어서,
    상기 1차 데이터를 처리하는 상기 단계는,
    적어도 하나의 계열 엔터티(affiliated entity)를 상기 1차 데이터와 연관짓는 단계를 포함하는, 기계-판독 가능 매체.
  30. 제 26 항에 있어서,
    상기 적어도 하나의 예측 표시기를 결정하는 상기 단계는,
    상기 1차 데이터가 제 3 임계 조건을 만족시키는지의 여부를 결정하는 단계;
    상기 2차 데이터를 발생하기 위해 상기 1차 데이터를 처리하는 단계를 포함하는, 기계-판독 가능 매체.
  31. 제 30 항에 있어서,
    상기 제 3 임계 조건은 미리 결정된 레벨의 고객 조회를 포함하는, 기계-판독 가능 매체.
KR1020057015204A 2003-02-18 2004-01-21 데이터 통합 방법 KR101006889B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/368,072 2003-02-18
US10/368,072 US7822757B2 (en) 2003-02-18 2003-02-18 System and method for providing enhanced information

Publications (2)

Publication Number Publication Date
KR20050115238A KR20050115238A (ko) 2005-12-07
KR101006889B1 true KR101006889B1 (ko) 2011-01-12

Family

ID=32850091

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057015204A KR101006889B1 (ko) 2003-02-18 2004-01-21 데이터 통합 방법

Country Status (9)

Country Link
US (3) US7822757B2 (ko)
EP (1) EP1599778A4 (ko)
JP (1) JP4996242B2 (ko)
KR (1) KR101006889B1 (ko)
CN (1) CN1826578B (ko)
AU (1) AU2004214217B2 (ko)
CA (1) CA2516390C (ko)
SG (1) SG157229A1 (ko)
WO (1) WO2004074981A2 (ko)

Families Citing this family (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7822757B2 (en) * 2003-02-18 2010-10-26 Dun & Bradstreet, Inc. System and method for providing enhanced information
US7822660B1 (en) * 2003-03-07 2010-10-26 Mantas, Inc. Method and system for the protection of broker and investor relationships, accounts and transactions
US7970688B2 (en) * 2003-07-29 2011-06-28 Jp Morgan Chase Bank Method for pricing a trade
US20050108631A1 (en) * 2003-09-29 2005-05-19 Amorin Antonio C. Method of conducting data quality analysis
US20090299909A1 (en) * 2003-11-04 2009-12-03 Levi Andrew E System and method for comprehensive management of company equity structures and related company documents with financial and human resource system integration
US20050154751A1 (en) * 2003-11-04 2005-07-14 Boardroom Software, Inc. System and method for comprehensive management of company equity structures and related company documents with financial and human resource system integration
US20090293104A1 (en) * 2003-11-04 2009-11-26 Levi Andrew E System and method for comprehensive management of company equity structures and related company documents withfinancial and human resource system integration
US8458073B2 (en) * 2003-12-02 2013-06-04 Dun & Bradstreet, Inc. Enterprise risk assessment manager system
US8036907B2 (en) * 2003-12-23 2011-10-11 The Dun & Bradstreet Corporation Method and system for linking business entities using unique identifiers
US20050192891A1 (en) * 2004-02-27 2005-09-01 Dun & Bradstreet, Inc. System and method for providing access to detailed payment experience
US8868456B1 (en) 2004-09-29 2014-10-21 At&T Intellectual Property Ii, L.P. Method and apparatus for managing financial control validation processes
NZ562584A (en) * 2005-03-24 2011-07-29 Accenture Global Services Gmbh Risk based data assessment
WO2007044479A2 (en) * 2005-10-05 2007-04-19 Dun & Bradstreet, Inc. Modular web-based asp application for multiple products
US20080221973A1 (en) * 2005-10-24 2008-09-11 Megdal Myles G Using commercial share of wallet to rate investments
US20070112667A1 (en) * 2005-10-31 2007-05-17 Dun And Bradstreet System and method for providing a fraud risk score
US7584188B2 (en) * 2005-11-23 2009-09-01 Dun And Bradstreet System and method for searching and matching data having ideogrammatic content
US8073724B2 (en) * 2005-12-02 2011-12-06 Saudi Arabian Oil Company Systems program product, and methods for organization realignment
US20070226099A1 (en) * 2005-12-13 2007-09-27 General Electric Company System and method for predicting the financial health of a business entity
EP1966729A4 (en) * 2005-12-27 2011-05-04 Dun & Bradstreet Corp METHOD AND SYSTEM FOR PROVIDING EXTENDED COMPENSATION FOR CUSTOMER-CONTROLLED INQUIRIES
US20070282673A1 (en) 2006-04-28 2007-12-06 Lehman Brothers Inc. Method and system for implementing portal
US7987159B2 (en) 2006-09-15 2011-07-26 Microsoft Corporation Detecting and managing changes in business data integration solutions
US20080140438A1 (en) * 2006-12-08 2008-06-12 Teletech Holdings, Inc. Risk management tool
US8694361B2 (en) * 2006-12-15 2014-04-08 American Express Travel Related Services Company, Inc. Identifying and managing strategic partner relationships
US20080147425A1 (en) * 2006-12-15 2008-06-19 American Express Travel Related Services Company, Inc. Strategic Partner Recognition
US9898767B2 (en) 2007-11-14 2018-02-20 Panjiva, Inc. Transaction facilitating marketplace platform
US8473354B2 (en) 2007-11-14 2013-06-25 Panjiva, Inc. Evaluating public records of supply transactions
US7912867B2 (en) * 2008-02-25 2011-03-22 United Parcel Services Of America, Inc. Systems and methods of profiling data for integration
US8024428B2 (en) * 2008-03-19 2011-09-20 The Go Daddy Group, Inc. Methods for updating WHOIS with information collected from non-controlling party
US20100037299A1 (en) * 2008-08-08 2010-02-11 American Express Travel Related Services Company, Inc. Method, System, And Computer Program Product For Identifying An Authorized Officer Of A Business
US8171033B2 (en) * 2008-09-30 2012-05-01 Vmware, Inc. Methods and systems for the determination of thresholds via weighted quantile analysis
US8725701B2 (en) * 2008-10-08 2014-05-13 Oracle International Corporation Merger and acquisition data validation
US9910875B2 (en) * 2008-12-22 2018-03-06 International Business Machines Corporation Best-value determination rules for an entity resolution system
US8285616B2 (en) * 2009-03-27 2012-10-09 The Dun & Bradstreet Corporation Method and system for dynamically producing detailed trade payment experience for enhancing credit evaluation
US8046312B2 (en) * 2009-05-21 2011-10-25 Accenture Global Services Limited Enhanced postal data modeling framework
US8356037B2 (en) * 2009-12-21 2013-01-15 Clear Channel Management Services, Inc. Processes to learn enterprise data matching
AU2011204831B2 (en) * 2010-07-20 2012-11-29 Accenture Global Services Limited Digital analytics platform
US8381120B2 (en) 2011-04-11 2013-02-19 Credibility Corp. Visualization tools for reviewing credibility and stateful hierarchical access to credibility
US8862543B2 (en) * 2011-06-13 2014-10-14 Business Objects Software Limited Synchronizing primary and secondary repositories
US8626766B1 (en) 2011-09-28 2014-01-07 Google Inc. Systems and methods for ranking and importing business listings
CA2854886A1 (en) 2011-11-08 2013-05-16 Google Inc. Systems and methods for generating and displaying hierarchical search results
WO2014012576A1 (en) * 2012-07-16 2014-01-23 Qatar Foundation A method and system for integrating data into a database
US9582555B2 (en) * 2012-09-06 2017-02-28 Sap Se Data enrichment using business compendium
US10242330B2 (en) * 2012-11-06 2019-03-26 Nice-Systems Ltd Method and apparatus for detection and analysis of first contact resolution failures
US9963954B2 (en) 2012-11-16 2018-05-08 Saudi Arabian Oil Company Caliper steerable tool for lateral sensing and accessing
US20150120347A1 (en) * 2012-11-30 2015-04-30 The Dun & Bradstreet Corporation System and method for updating organization family tree information
US9122710B1 (en) 2013-03-12 2015-09-01 Groupon, Inc. Discovery of new business openings using web content analysis
US8996391B2 (en) 2013-03-14 2015-03-31 Credibility Corp. Custom score generation system and methods
US8712907B1 (en) 2013-03-14 2014-04-29 Credibility Corp. Multi-dimensional credibility scoring
US10699335B2 (en) 2013-05-02 2020-06-30 The Dun & Bradstreet Corporation Apparatus and method for total loss prediction
WO2014179552A1 (en) * 2013-05-02 2014-11-06 The Dun & Bradstreet Corporation A system and method using multi-dimensional rating to determine an entity's future commercial viability
US20150039385A1 (en) * 2013-08-01 2015-02-05 American Express Travel Related Services Company, Inc. System and method for liquidation management of a company
US20150095210A1 (en) * 2013-09-27 2015-04-02 Brian Grech Merchant loan management and processing
US20150100366A1 (en) * 2013-10-08 2015-04-09 immixSolutions, Inc. System and method for managing a law enforcement investigation
US10521866B2 (en) 2013-10-15 2019-12-31 Mastercard International Incorporated Systems and methods for associating related merchants
US20150127501A1 (en) * 2013-11-07 2015-05-07 Strategic Exits Corp. System and Method for Capturing Exit Transaction Data
US10140352B2 (en) 2014-07-17 2018-11-27 Oracle International Corporation Interfacing with a relational database for multi-dimensional analysis via a spreadsheet application
US20160063521A1 (en) * 2014-08-29 2016-03-03 Accenture Global Services Limited Channel partner analytics
US9953105B1 (en) 2014-10-01 2018-04-24 Go Daddy Operating Company, LLC System and method for creating subdomains or directories for a domain name
US9785663B2 (en) 2014-11-14 2017-10-10 Go Daddy Operating Company, LLC Verifying a correspondence address for a registrant
US9779125B2 (en) 2014-11-14 2017-10-03 Go Daddy Operating Company, LLC Ensuring accurate domain name contact information
CN105608087B (zh) * 2014-11-19 2020-01-31 菜鸟智能物流控股有限公司 一种资源调度方法与设备
US10725985B2 (en) * 2015-02-20 2020-07-28 Metropolitan Life Insurance Co. System and method for enterprise data quality processing
US9898497B2 (en) 2015-03-31 2018-02-20 Oracle International Corporation Validating coherency between multiple data sets between database transfers
US11514096B2 (en) 2015-09-01 2022-11-29 Panjiva, Inc. Natural language processing for entity resolution
US20170109761A1 (en) * 2015-10-15 2017-04-20 The Dun & Bradstreet Corporation Global networking system for real-time generation of a global business ranking based upon globally retrieved data
US11580571B2 (en) * 2016-02-04 2023-02-14 LMP Software, LLC Matching reviews between customer feedback systems
US10203984B2 (en) * 2016-07-26 2019-02-12 Sap Se Data structure for multiple executable tasks
WO2018067667A1 (en) 2016-10-06 2018-04-12 The Dun & Bradstreet Corporation Machine learning classifier and prediction engine for artificial intelligence optimized prospect determination on win/loss classification
US11386435B2 (en) 2017-04-03 2022-07-12 The Dun And Bradstreet Corporation System and method for global third party intermediary identification system with anti-bribery and anti-corruption risk assessment
CN110832514A (zh) 2017-04-22 2020-02-21 潘吉瓦公司 由个别的海关交易记录临近预报抽象的调查
WO2019070853A1 (en) 2017-10-04 2019-04-11 The Dun & Bradstreet Corporation SYSTEM AND METHOD FOR IDENTITY RESOLUTION ON A SET OF DISPARATE NETWORKS OF IMMUNE DISTRIBUTED REGISTERS
CN107993010B (zh) * 2017-12-02 2022-05-06 中科钢研节能科技有限公司 一种项目尽职调查自动分析系统及自动分析方法
US10949450B2 (en) 2017-12-04 2021-03-16 Panjiva, Inc. Mtransaction processing improvements
US11580330B2 (en) * 2018-12-28 2023-02-14 Microsoft Technology Licensing, Llc Machine learning framework with model performance tracking and maintenance
CA3041600A1 (en) 2019-04-25 2020-10-25 The Dun & Bradstreet Corporation Machine learning classifier for identifying internet service providers from website tracking
CN110363401B (zh) * 2019-06-26 2022-05-03 北京百度网讯科技有限公司 整合粘性评估方法、装置、计算机设备及存储介质
JP2020149716A (ja) * 2020-05-26 2020-09-17 株式会社ファーマクラウド 医薬品の流通を支援するためのシステム、方法およびプログラム
CN112001710A (zh) * 2020-09-07 2020-11-27 山东钢铁集团日照有限公司 一种钢铁产品生产过程大数据读取整合系统
US20220084091A1 (en) * 2020-09-17 2022-03-17 Mastercard International Incorporated Continuous learning for seller disambiguation, assessment, and onboarding to electronic marketplaces
CN112069215B (zh) * 2020-09-17 2024-09-03 国能龙源电气有限公司 一种基于整合数据的数据查询方法及装置
US11636417B2 (en) * 2020-12-17 2023-04-25 International Business Machines Corporation Cognitive analysis for enterprise decision meta model

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020022670A (ko) * 1999-05-21 2002-03-27 아이엔씨 인터그레이티드 네트워크 코포레이션 그래픽 사용자 인터페이스를 갖는 루프 액세스 시스템

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5588147A (en) 1994-01-14 1996-12-24 Microsoft Corporation Replication facility
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US6460036B1 (en) * 1994-11-29 2002-10-01 Pinpoint Incorporated System and method for providing customized electronic newspapers and target advertisements
US5806074A (en) 1996-03-19 1998-09-08 Oracle Corporation Configurable conflict resolution in a computer implemented distributed database
US5819291A (en) * 1996-08-23 1998-10-06 General Electric Company Matching new customer records to existing customer records in a large business database using hash key
US6026391A (en) * 1997-10-31 2000-02-15 Oracle Corporation Systems and methods for estimating query response times in a computer system
US6523019B1 (en) * 1999-09-21 2003-02-18 Choicemaker Technologies, Inc. Probabilistic record linkage model derived from training data
EP1102225A3 (en) 1999-11-22 2002-08-21 Ncr International Inc. Method of processing electronic payment data and an apparatus therefor
JP3866466B2 (ja) 1999-12-13 2007-01-10 株式会社東芝 データ構造管理装置、データ構造管理システム、データ構造管理方法およびデータ構造管理プログラムを格納する記録媒体
US6810429B1 (en) * 2000-02-03 2004-10-26 Mitsubishi Electric Research Laboratories, Inc. Enterprise integration system
US20010032117A1 (en) * 2000-04-07 2001-10-18 Persky Robert E. Continuous and updatable revenue sharing process for lists
WO2002010989A2 (en) 2000-07-31 2002-02-07 Eliyon Technologies Corporation Method for maintaining people and organization information
US20020161778A1 (en) * 2001-02-24 2002-10-31 Core Integration Partners, Inc. Method and system of data warehousing and building business intelligence using a data storage model
US7103586B2 (en) 2001-03-16 2006-09-05 Gravic, Inc. Collision avoidance in database replication systems
US20030033155A1 (en) 2001-05-17 2003-02-13 Randy Peerson Integration of data for user analysis according to departmental perspectives of a customer
US7953219B2 (en) * 2001-07-19 2011-05-31 Nice Systems, Ltd. Method apparatus and system for capturing and analyzing interaction based content
US20030061232A1 (en) * 2001-09-21 2003-03-27 Dun & Bradstreet Inc. Method and system for processing business data
US7403942B1 (en) * 2003-02-04 2008-07-22 Seisint, Inc. Method and system for processing data records
US7822757B2 (en) * 2003-02-18 2010-10-26 Dun & Bradstreet, Inc. System and method for providing enhanced information

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020022670A (ko) * 1999-05-21 2002-03-27 아이엔씨 인터그레이티드 네트워크 코포레이션 그래픽 사용자 인터페이스를 갖는 루프 액세스 시스템

Also Published As

Publication number Publication date
CA2516390A1 (en) 2004-09-02
EP1599778A2 (en) 2005-11-30
US20110055173A1 (en) 2011-03-03
SG157229A1 (en) 2009-12-29
KR20050115238A (ko) 2005-12-07
CA2516390C (en) 2015-01-06
EP1599778A4 (en) 2006-11-15
WO2004074981A2 (en) 2004-09-02
WO2004074981A3 (en) 2005-12-08
AU2004214217B2 (en) 2009-10-29
US20060004595A1 (en) 2006-01-05
CN1826578B (zh) 2014-07-02
CN1826578A (zh) 2006-08-30
JP4996242B2 (ja) 2012-08-08
AU2004214217A1 (en) 2004-09-02
US20040162742A1 (en) 2004-08-19
US8346790B2 (en) 2013-01-01
JP2006518512A (ja) 2006-08-10
US7822757B2 (en) 2010-10-26

Similar Documents

Publication Publication Date Title
KR101006889B1 (ko) 데이터 통합 방법
US8271313B2 (en) Systems and methods of enhancing leads by determining propensity scores
US7752236B2 (en) Systems and methods of enhancing leads
US8135607B2 (en) System and method of enhancing leads by determining contactability scores
Wang et al. Data quality requirements analysis and modeling
US8768914B2 (en) System and method for searching and matching databases
US6665656B1 (en) Method and apparatus for evaluating documents with correlating information
WO2008057853A2 (en) Systems and methods of enhancing leads
CN113554310A (zh) 基于智能合约的企业信用动态评估模型
US9424278B2 (en) Methods of searching public information for sales leads
US7197471B2 (en) System and method for assessing demographic data accuracy
CN114331728A (zh) 一种证券分析管理系统
US12079115B1 (en) Systems and methods for efficient access to data
CN115422216A (zh) 目标评估数据的确定方法、装置、设备及介质
Lavin A clash of titans: comparing America's most comprehensive business directories.
JP2017183777A (ja) 電話番号調査履歴データベースに法人番号を結合すること
JP2002133057A (ja) 立会い検査方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140121

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20141222

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20151223

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20161223

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20171226

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20181220

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20191224

Year of fee payment: 10