JP4996242B2 - データ統合方法 - Google Patents

データ統合方法 Download PDF

Info

Publication number
JP4996242B2
JP4996242B2 JP2006502895A JP2006502895A JP4996242B2 JP 4996242 B2 JP4996242 B2 JP 4996242B2 JP 2006502895 A JP2006502895 A JP 2006502895A JP 2006502895 A JP2006502895 A JP 2006502895A JP 4996242 B2 JP4996242 B2 JP 4996242B2
Authority
JP
Japan
Prior art keywords
data
primary data
identification number
processor
company
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2006502895A
Other languages
English (en)
Other versions
JP2006518512A (ja
Inventor
エル ストーカー サンドラ
タリーク シャリフ アハマッド
イー プレヴォズナク マイケル
ジョン ルーカス クリストファー
アール ベンケ チャールズ
ピー セクラー マリア
ダックワース アラン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dun&bradstreet inc
Original Assignee
Dun&bradstreet inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dun&bradstreet inc filed Critical Dun&bradstreet inc
Publication of JP2006518512A publication Critical patent/JP2006518512A/ja
Application granted granted Critical
Publication of JP4996242B2 publication Critical patent/JP4996242B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Description

発明の背景
1.1 発明の技術分野
本発明はデータ処理方法に関し、詳しくはビジネス関連ないしは企業関連のデータを処理する方法に関する。
2. 関連する技術の説明
成果を挙げるためにビジネスないしは企業にとって必要とされるのは、インフォームドディシジョンすなわち情報に基づく判断である。リスクマネージメントにおいてビジネスないしは企業により必要とされるのは、晒されるリスク全体を理解しかつ管理することである。その際、ハイリスクの勘定を同定し、それに対して積極的に回収を行う必要がある。これに加えて企業にとって、信用貸しを即座にかつ矛盾なく承認または承諾する必要がある。また、セールスならびにマーケッティングにおいてビジネスないしは企業のために必要とされるのは、最も有益なカスタマおよびターゲットに対するプロスペクトならびに既存のカスタマベースにおいて増大している好機について判定することである。さらにサプライマネージメントにおいてビジネスないしは企業が必要とするのは、商議向上のためサプライヤにより費やされる総額を理解することである。さらには企業にとっては、サプライヤの失敗に晒される状況を少なくするためにサプライヤに対するリスクならびに依存状態を見つけ出すことも必要とされる。
これらのビジネス判定ないしは企業判定の成功は、それらの背後にある情報の品質に大きく左右される。この場合に品質は、情報が正確であるか、完全なものであるか、時宜に適っているのか、さらには首尾一貫しているのかによって決まる。利用可能な情報源が数1000もあれば、決定を下すのに企業が信頼すべき品質情報がどれであるのかを判断するのは難題である。このことは、企業が頻繁に変化する場合に殊にあてはまる。次の30分間で120の企業の住所が変更され75の企業の電話番号が変更されるか不通になり、30の新たな企業が営業を開始し、20の最高経営責任者(CEO)がその職務を離れてしまい、15の会社がその名称を変更し、さらに10の企業が閉鎖されてしまう。
企業データを提供する慣用の方法は不完全である。いくつかの提供元は不完全なデータを収集し、実体に完全にはマッチさせることができず、不完全なナンバリングシステム(numbering system)をもつことになり、コーポレーションファミリー(企業系列)情報を提供することができなくなり、あるいは不完全なコーポレーションファミリー情報を提供することになり、かえって不備のある付加価値予測データを提供することになってしまう。
本発明の課題は、いっそう完全かつ正確なビジネスデータないしは企業データを提供することにある。これには完全かつ正確なデータ収集、実体とのマッチング、識別ナンバーの割り当て、コーポレーションリンケージならびに予測インジケータが含まれる。このような完全性ならびに正確性によって、ビジネス判定ないしは企業判定を下すために企業が信頼しかつ依存する高品質の企業情報が生み出される。
発明の概要
本発明は、企業がビジネス判定を下せるようにする品質情報を提供するデータ統合方法に関し、たとえば企業情報が1次データとして収集される方法に関する。この場合、完全を期すため1次データが精度についてテストされて処理され、2次データが生成される。2次データを生成するために1次データを処理する際、コーポレーションリンケージないしは企業リンケージの実行と予測インジケータの供給が行われる。その後、結合された1次データと2次データが強化された企業情報として供給される。1次データおよび/または2次データは周期的にサンプリングされ、まえもって決められた条件に照らし合わせて評価される。その結果、品質を保証するためにテストおよび/または処理が調整される。
1次データのテストにおいて、1次データが事前に格納されているデータとマッチしているか否かが判定される。マッチングしていれば、コーポレーションリンケージ(すなわち複数の会社間の系列関係ないしは提携関係についてのチェック)が実行される。マッチしていないのであれば、1次データが第1の閾値条件を満たしているか否かの判定が行われ、これが満たされるのは、少なくとも2つのソースにより1次データに関連する企業の存在が裏付けられた場合などである。1次データが第1の閾値条件を満たしているのであれば識別番号が割り当てられ、2次データが生成されて格納される。識別番号によってある企業が一意に同定され、これは1回しか用いられず再利用されない。1次データが第1の閾値条件を満たしていないのであれば、新たなデータが取得されるまで1次データがレポジトリに格納される。新たなデータを受け取ればテストにおいて、この新たなデータとともに1次データが第1の閾値条件を満たしているか否かが判定される。満たしているのであれば識別番号が割り当てられ、2次データが格納される。
コーポレーションリンケージの実行において、1次データがまえもって決められているセールス量のような第2の閾値条件を満たしているか否かの判定が行われる。満たしているのであれば1次データが分析されて処理され、コーポレーションファミリーを1次データと関連づけるために2次データが生成されて格納される。コーポレーションファミリーは、合併または買収が行われた後には更新される。1次データが第2の閾値条件を満たしていないのであれば、付加的な2次データとして予測インジケータが生成される。
予測インジケータは、1次データがまえもって決められたカスタマ照会レベルのような第3の閾値条件を満たしているときにのみ生成される。満たしているのであれば、1次データが分析されて処理され、付加的な2次データが生成されて格納され、たとえば記述による格付け、スコアあるいは需要推定量のような予測インジケータが形成される。
本発明の別の形態はデータ統合システムである。このシステムにはデータベース、データ収集コンポーネント、識別番号コンポーネントならびに予測インジケータコンポーネントが含まれている。データベースコンポーネントは、ビジネスないしは企業に関連する情報が格納されている。データ収集コンポーネントは、ビジネスないしは企業に関連する1次データを収集する。識別番号コンポーネントは1次データに識別番号を付加し、データベースコンポーネント内に2次データを格納する。予測インジケータコンポーネントはビジネスないしは企業に関連する予測インジケータを供給し、やはり2次データをデータベースコンポーネントに格納する。このシステムにはさらに、実体マッチングコンポーネントとコーポレーションリンケージコンポーネントも含まれている。実体マッチングコンポーネントにより、データベースコンポーネント内のビジネスないしは企業が重複してエントリされるのが回避される。コーポレーションリンケージコンポーネントによって、あるコーポレーションファミリーがデータベースコンポーネント内のビジネスないしは企業と対応づけられる。
本発明のさらに別の形態は、データ統合のための実行可能な命令を記憶するための機械で読み取り可能な媒体である。この命令には、ビジネスないしは企業に関する1次データを収集する命令、ビジネスないしは企業に対して実体マッチングを実行する命令、ビジネスないしは企業に識別情報を付加する命令、ビジネスないしは企業に関してコーポレーションリンケージを実行する命令、ビジネスないしは企業に関して予測インジケータを供給する命令が含まれている。
識別番号の付加は、要求を受け取ったときにスタートするプロセスである。この要求には識別番号と1次データが含まれている。その識別番号がまだ存在していなければ、それが割り当てられる。そうでなければ、識別番号が別のデータとリンクされてバリデーションが実行され、その識別番号が用意される。
コーポレーションリンケージの実行には、ファミリーツリーの保守、調査の実施、ファミリーツリーの処理ならびにその格納が含まれている。ファミリーツリーの保守は、何らかの標準産業分類の精査ならびに更新、取引スタイルの精査ならびに標準化、何らかの重複の分析ないしは解消によって行われる。調査によって情報が集められる。ファミリーツリーの処理は、集められた情報の精査ならびに処理、マッチングの精査ならびに更新、ルックアライク(look-a-like 紛らわしいもの)またはリンクされていない外国のデータの分析ないしは解消によって行われる。
予測インジケータの供給にあたり、予測のためにモデルならびに結果が判定される。この場合、開発サンプルが選択され、プロファイルが生成され、統計分析が実行される。最終的に、モデル、結果、サンプル、プロファイルならびに統計分析に基づき予測インジケータが供給される。
本発明のこれらの特徴および他の特徴ならびに利点は、図面、以下の説明ならびに特許請求の範囲を参照することでいっそう理解できるようになる。
図面の簡単な説明
図1は、本発明によるデータ統合方法を示すブロック図である。
図2は、本発明によるデータ統合システムを示すブロック図である。
図3は、本発明によるデータ統合システムを示すブロック図である。
図4は、本発明によるデータ統合方法を描いたロジック図である。
図5は、本発明によるデータ収集における例示的なソースを示すブロック図である。
図6は、本発明によるデータ収集におけるもっと多くの例示的なソースを示すブロック図である。
図7および図8は、本発明による実体マッチングを示すブロック図である。
図9は実体マッチングを示すブロック図であり、この場合、マッチしているデータは1つのデータベースへ供給され、マッチしていないデータは本発明に従い新たな企業識別ナンバーを割り当てるために送信される。
図10は実体マッチングを示すブロック図であり、この場合、マッチしているデータは1つのデータベースへ供給され、マッチしていないデータは本発明に従い新たな企業識別ナンバー割り当てのために送られるかまたは、付加的なデータを収集できるまでデータベースレポジトリに格納される。
図11および図12は、本発明による実体マッチング方法を示すブロック図である。
図13〜図16は、本発明によるコーポレーションリンケージを示すブロック図である。
図17は、本発明によるコーポレーションリンケージ方法の一例を示すブロック図である。
図18Aおよび図18Bは、本発明による予測インジケータ供給方法の一例を示すブロック図である。
発明の説明
次に、図面を参照しながら本発明について詳しく説明する。これらの図面は本明細書の一部分を成すものであり、これらの図面には本発明を実施することのできる有利な実施形態が例示されている。これらの実施形態は、当業者が本発明を実施できる程度に十分詳しく述べられている。他の実施形態を適用することができ、本発明の範囲を逸脱することなく構造的、論理的ならびに電気的な変更を施すことができる。したがって以下の詳細な説明は限定として捉えられるものではなく、本発明の範囲は特許請求の範囲によってのみ規定されるものである。
図1には、本発明によるデータ処理方法の概観が示されている。本発明による方法の基礎となるのは品質保証手段102であり、これにより継続的なデータの監査、バリデーション、正規化、補正ならびに更新が行われ、これらはプロセス全体にわたり品質を確保するために実行される。ここには5つの品質ドライバが設けられており、これらは到来した情報104を強化しすなわちその質を高めて品質情報106に変えるために順次連続して動作する。これら5つのドライバとは、データ収集ドライバ108、実体マッチングドライバ110、識別(ID)番号ドライバ112、コーポレーションリンケージドライバ114ならびに予測インジケータドライバ116である。これら5つのドライバはデータベース118にアクセスする。データベース118は、系統立てられてまとめられたデータ収集とデータベースマネージメントツールから成り、これはたとえばリレーショナルデータベース、オブジェクト指向データベース、あるいは他の種類のデータベースである。データベース118内のデータは、品質保証ならびにグローバルデータ収集におけるカスタマフィードバックに基づき継続的に洗練され強化されその質が高められる。
データ収集ドライバ108は、全世界的な種々のソースからデータを呼び集める。ついでそれらのデータは実体マッチングドライバ110を介してデータベース118に組み込まれて統合され、その結果、ただ1つのいっそう精確な各企業の実体の像ないしは様相が得られる。次に識別番号ドライバ112により、企業を同定しかつ発生するいかなる変化に対してもグローバルに企業を追従する一意の手段として、識別番号が適用される。その後、コーポレーションリンケージドライバ114によって、トータルな企業リスクならびに好機の考察を可能にするコーポレーションファミリーが構築される。最後に予測インジケータドライバ116が統計分析を利用して企業の過去の業績を評価し、将来も同じような業績を上げる見込みを予測する。
図2および図3には、本発明によるデータ統合システムの2つの実施形態が示されている。もっとも、本発明の実施に関してはこれとは別のシステムも適している。図2にはネットワークのコンフィギュレーションが示されている一方、図3にはコンピュータシステムのコンフィギュレーションが示されている。
図2によればネットワーク200は、コンピュータシステム202を含む他のシステムコンポーネント間で通信を行わせる。データ収集ドライバ108、実体マッチングドライバ110、識別番号ドライバ112、コーポレーションリンケージドライバ114、予測インジケータドライバ116から成る5つの品質ドライバと品質保証手段102はシーケンシャルに動作して、到来したデータ104を強化してデータベース204内に格納される品質情報106に変換する。図3によればコンピュータシステム300は、バス306を介してメモリ304にアクセス可能なプロセッサ302を有している。メモリ304には、オペレーティングシステムプログラム308とデータ統合プログラム310とデータ312とが記憶されている。
図4には、本発明によるデータ統合方法の別の実施形態が示されている。この方法には5つの主要なデータ統合コンポーネントが含まれており、すなわちデータ収集コンポーネント400、実体マッチングコンポーネント402、識別番号コンポーネント404、コーポレーションリンケージコンポーネント406、高品質データ410を生成する予測インジケータ処理コンポーネント408が含まれている。この場合、1次データが精度についてテストされて処理され、2次データが生成される。1次データの処理にあたり、コーポレーションリンケージないしは企業リンケージ406の実行と予測インジケータ408の供給が行われる。この場合、結合された1次データと2次データが、強化された企業情報または高品質データ410として供給される。その結果、品質を保証するためにテストと処理が調節される。
1次データのテストにあたり、1次データが実体マッチングコンポーネント402に先行して記憶されているデータとマッチしているか否かの判定412が行われる。マッチしているのであれば、コーポレーションリンケージ406が実行される。マッチしていないのであれば、1次データが第1の閾値条件を満たしているか否かの判定414が行われ、これが満たされるのは、少なくとも2つのソースにより1次データに関連する企業の存在が裏付けられた場合などである。1次データが第1の閾値条件を満たしていれば制御は識別番号コンポーネント404へ移り、そこにおいて識別番号が割り当てられ(420)、2次データが格納される(422)。識別番号によって1つの企業が一意に識別され、この番号は一度だけ使用され、再利用されない。1次データが第1の閾値条件を満たしていなければ、次のデータを取得できるまで(418)、その1次データがレポジトリ416に格納される。新たなデータを受け取るとただちにテストにおいて、1次データが新たなデータとともに第1の閾値条件を満たしているか否かの判定が行われる。満たしているのであれば識別番号が割り当てられ、2次データが格納される。
コーポレーションリンケージ406の実行において、1次データがまえもって決められているセールス量のような第2の閾値条件を満たしているか否かの判定424が行われる。満たしているのであれば1次データが分析されて処理され(426)、コーポレーションファミリーを1次データと関連づけるために2次データが格納される(428)。コーポレーションファミリーは合併または取得後に更新される。1次データが第2の閾値条件を満たしていないのであれば、制御は予測インジケータコンポーネント408へ進む。
予測インジケータ408の供給にあたり、1次データがまえもって決められたカスタマ照会レベルのような第3の閾値条件を満たしているか否かの判定(430)が行われる。満たしているのであれば、1次データが分析されて処理され(432)、2次データが格納され(434)、記述による格付け、スコアあるいは需要推定量のような予測インジケータが生成される。このように5つの主要なコンポーネントまたはドライバが共働して、収集されたデータが統合されて企業判定を下すのに有益な強化されたデータが形成される。以下で5つのドライバ各々についてさらに詳しく説明する。はじめにデータ収集ドライバ108について説明する。
図5には、データ収集ドライバ108において使用されるいくつかのデータソースが示されている。できるかぎり完全なデータを収集する目的で、カスタマ、プロスペクト、サプライヤに関してデータが収集される。いくつかのデータソースはたとえば直接調査502、取引データ504、公記録506、ウェブソース508などである。直接調査502には、企業に電話をかけることが含まれる。取引データ504には取引記録の更新が含まれる。公記録506には訴訟、担保権、判決、破産の書類、企業登記等が含まれる。さらにウェブソース508には、ユニフォームリソースロケータ(uniform resource locator, URL)、ドメインからのアップデート、カスタマが提供するオンラインアップデートならびにインターネットからの他のウェブデータである。
ウェブデータは、"Whois(フーイズ)"ファイルからの情報、VeriSign Registry(ベリサイン・レジストリ)と呼ばれる登録済みドメインに関する中央レポジトリからの情報、ならびその他のデータによって構成されている。Whoisとは、VeriSignにより登録されているあらゆる第2レベルドメイン名の所有者を教えてくれるプログラムのことである。VeriSignは、Mountain View, CA に本部が置かれている会社である。ドメイン名のベースリファレンスファイルは識別番号とマッチしており、データマイニングにより拡張されている。いくつかのURLは手動で候補に割り当てられる。"Whois"ファイルおよびデータマイニングによる情報は、データベース118内のデータにマッチングされる。ベースリファレンスファイルは、ステータス、セキュリティデータ、証明データならびに他のデータのような付加的なウェブサイトデータに関するデータマイニングにより強化される。
ファイル範囲が拡張される。識別番号とURLのすべてのマッチングが合理化される。ファミリーツリーメンバー全体にわたりURL範囲を拡張するために、ワンアップ one-up、ワンダウン one-downのリンケージが使用される。URLはステータスとマッチング形式に基づき順番に並べられる。所定数のURLたとえばトップファイブが出力ファイルに含まれる。URLすべてとマッチングした識別番号(リンクなし)により、別の出力ファイルが生成される。
URLベースファイルデータ要素にはURL/ドメイン名、マッチコード、ステータスインジケータ、リダイレクトインジケータならびに識別番号あたりのURL総数が含まれている。マッチコードは、サイトまたは支店にマッチしている。ステータスインジケータは、「存在している」「作成中」などである。リダイレクトインジケータは、他のサイトにリダイレクトされているときにリストアップされた現存するURLである。
また、URL+ファイル要素というのもあり、これはURLベースファイルとは別個のファイルである。これにはすべてのURLとURLベースファイルからのデータ、ウェブサイトソフィスティケーションにおけるサマリーデータ、ならびにアクティブな/存在するURL上のセキュリティが含まれている。さらにこれには外部リンクおよび内部リンクの総数、メタタグインジケータ、セキュリティインジケータ、プレゼンスセキュアソケットレイヤ(SSL)のような暗号化強度、認証インジケータも含まれている。
URL+拡張された要素は、URLベースファイルおよびURL+ファイルとは別個のスタンドアローンのファイルである。これらにはすべてのURLベースとURL+データが、現存するURL、ウェブサイトソフィスティケーションにおける詳細データならびにセキュリティとともに含まれている。これらにはセキュリティ保護されたウェブサーバタイプ、認証発行会社、認証オーナーまたは認証利用者であるオーナーフラグ、認証ユーザ数、外部URLリンク数たとえば5つ、ならびにキーワード、記述、作成者およびジェネレータのようなメータデータが含まれている。
図6には、精度を高めるためにデータ収集ドライバ108により使用されるいくつかの付加的なデータソースが示されており、それらはたとえば電話帳ないしはイエローページ602、ニュースおよびメディア604、直接調査606、会社の財政情報608、支払いデータ610、裁判・法律関係の書類を扱うオフィス612、行政登記所614である。このような情報の完全性によって、有益な企業判定ないしはビジネス判定が支援される。リスクマネージメントにおいて、ユーザは結果として得られた情報によりアメリカ合衆国(US)以外の会社からのリスクを評価する。この場合、小規模な企業カスタマからのリスクをいっそう完全に識別することができる。ユーザは、いっそう完全な情報に基づくならば、いっそう多くの情報を利用したリスク判定を下すことができる。また、セールスおよびマーケッティングにおいて、ユーザは複数のソースから引き出されたデータにより、新たなプロスペクトを識別することができる。ユーザは、国外のカスタマおよびプロスペクトに対してアクセスすることができ、標準産業分類(SIC)やコンタクト名のような付加価値情報とともにプロスペクトリストをチェリーピックすなわち選り好みすることができる。サプライマネージメントにおいて、ユーザは結果として得られた情報により外国のサプライヤからのリスクを評価することができ、サプライヤからのリスクをいっそう徹底的に識別することができる。データベース118が日ごとに更新されることから、ユーザはカスタマ、プロスペクトおよびサプライヤについていっそう新しくいっそう徹底した像を得ることができる。
図7には、マッチしていない複数のばらばらなデータ702をどのようにして単一の完全な企業704に変えることができるのかが示されている。実体マッチングドライバ110は到来データ104をチェックして、それがデータベース118内の何らかの既存の企業に属するか否かを調べる。この例によればABC, Inc.とChuck's Mini-MartとCharles Smithはそれぞれ別々の会社のように見えるけれども実体マッチング後、それらはすべて1つの企業であるABC, Inc + Chuck's Mini-Martの一部門であることが明らかとなる。複数の異なるアドレスならびに他の関連情報も調和がとられて、完全な単一の企業704が形成される。
図8には、データベース118における企業とマッチした到来データ104を、実体マッチングドライバ110によりどのようにしてその企業に追加するのかが示されている。図9には別の事例が示されており、この事例ではデータベース118内のいかなる企業にもマッチしていない到来データ104が新たな企業として表され、あるいは図10に示されているように、それが新たな企業であることを証明する別のデータが到来するのを待つためにレポジトリ1002に保持される。実体マッチングドライバ110はそのつどデータを正当な企業にマッチさせるように設計されており、したがって効率が高められる。実体マッチングドライバ110はいっそう完全かつ精確なカスタマ、プロスペクトおよびサプライヤのプロファイルを供給し、企業の重複を著しく少なくさせることができる。
図11には、実体マッチングドライバ110を介したマッチング方法の一例が示されている。この方法にはクリーニングcleaningおよびパーシングparsing 1102、候補検索実行1104、意思決定1106が含まれる。クリーニングおよびパーシング1102には、照会データのキーコンポーネントの同定1108、名称、住所、都市の正規化1110、名称一貫性の実行1112、住所標準化の実行1114が含まれている。候補検索1104において、検索の品質と速度を向上させるためのキー1118を使用した参照データベースからの可能なマッチ候補の収集116と、照会データにおいて得られたデータに基づくキーの最適化1120が行われる。さらに意思決定1106において、一貫した標準に従うマッチングの評価1122、マッチグレードの付加1124、信任コード1126の付加、ならびに信頼度パーセンタイルの付加1128が行われる。
図12には、ドライバ110を介したマッチングに関する詳細な方法について示されている。この方法にはウェブサービス1202、クリーニング、パーシングおよび標準化1204、候補検索1206、測定、評価、判定1208が含まれている。ウェブサービス1202において、HTTPサーバはリクエストを受理し、HTTPによりXML形式でレスポンスを供給し(1210)、アプリケーションサーバはXMLリクエストを処理してそれをJAVAオブジェクトに変換し、ついでこのJAVAオブジェクトを処理してXML1212へ変換して戻す(1212)。クリーニング、パーシングおよび標準化1204において、名称と住所の要素がパーシングされ、無関係な語を除去する(1214)。ついで、通り名と都市名が適正となるよう住所がバリデートされ、さらにZIPコード+4および緯度と経度が割り当てられる(1216)。この場合、参照テーブルには無意味な都市名と無意味な通り名が保持される。候補検索1206において、参照データベースから候補を検索するために使用されるキーが生成される(1220)。その後、サーチストラテジおよび候補検索において効果的なデータベース検索が行われるようキーが最適化される(1222)。参照データベースをサーチするため、参照テーブルが作成されて保持される(1224)。測定、評価、判定1208において信頼度スコア測定量が導出され、これによって照会と候補との間におけるマッチングの度合いが表される。ついで候補各々をオンラインで表示するための順序が作成され、このバッチにおいて得られた最良候補が選択される。当業者のいずれかに考えられるような他のマッチング実施方法であっても、本発明を実装するために使用することができる。
識別(ID)番号ドライバ112は一意の識別番号をすべての企業に付加し、それによって簡単かつ精確にそれらの企業を同定することができる。一意の識別番号の一例はDun & Bradstreet(本社Short Hillsin, NJ)から得られるD-U-N-S(登録商標)Numberなどであって、これは9桁の数字をもち、変更および更新を通じて企業を簡単に追跡することができる。識別番号は企業が存続している間、維持される。同じ識別番号を受ける企業は2つとなく、この識別番号が再利用されることは決してない。また、この識別番号は、複数のデータソースにより企業が存在していることが確認されるまでは割り当てられない。この識別番号は企業を同定するための産業標準として機能する。これは国際連合、国際標準化機構(ISO)、欧州委員会、50を上回る産業団体によって支持されている。
識別番号は、本発明によるデータ処理方法における主要なコンセプトである。品質を保証するため、識別番号によってプロセスのどの段階においても情報の検証が可能となる。データ収集ドライバ108についていえば、データが既存の識別番号とリンクされていない場合には、それによって新たな企業の可能性があることが表される。実体マッチングドライバ110についていえば、識別番号により新たなデータを既存の企業に精確にマッチさせることができる。コーポレーションリンケージドライバ114についていえば、企業識別番号各々に基づきコーポレーションファミリーが構築される。予測インジケータドライバ116についていえば、予測ツールを構築するために識別番号が用いられる。
これに加えて識別番号により、ある企業の存在に対する検証の支援によってユーザの企業に対する好機の新たな領域が開かれる。この場合、プロスペクト、カスタマ、サプライヤに関する完全な展望がユーザに提供される。既存のデータがいっそう明確にされ、重複が排除され、関連する企業どうしが関連づけられて呈示される。識別番号がユーザの情報に付加されれば、ユーザはいっそう簡単に大規模なカスタマまたはサプライヤのグループを管理することができる。ユーザ情報に識別番号が付加されれば、それによって迅速かつ簡単なデータ更新が実現される。
図13には、識別番号ドライバ112の一例を示す方法が描かれている。このプロセスは、名称、住所、都市、国等を含む識別番号の要求から始まる(1302)。たとえば、これまでデータベース118内に存在していない新しい企業に関してレコードが生成されると、識別番号が要求される。ルックアップオペレーション1304において、この要求における識別番号についてデータベース118がサーチされる。この識別番号が見つかれば(1306)、カスタマがその識別番号を利用できるようにされる。見つからなければ要求から入力情報が捕捉され(1310)、1つの識別番号が割り当てられ、その際にMod 10 バリデーションが行われる(1312)。番号をクリーンに維持するために、Mod 10 バリデーションは末尾に検査数字を割り当てる。他の識別番号ステップへのリンケージ(1314)において、リンケージが存在するのであれば、フロントエンドバリデーション(1318)が実行される前にバリデーションが行われる(1316)。その後、二重のバリデーション1320とメインフレームバリデーション1322が実行されて、カスタマがその識別番号を利用できるようにする(1308)。リンケージバリデーションによって、ある部門が他の部門とリンクしているといったエラーが回避される。
図14〜図16には、会社が関連している様子を明らかにするためにコーポレーションリンケージドライバ114がどのようにしてコーポレーションリンケージを構築するのかが描かれている。コーポレーションリンケージを行わないと、図14に示されている会社すなわちL Refinery Div. 1402、C Stores Inc. 1404、G Storage Div 1 1406は互いに関連していないように見える。しかしながら図15に示されているようにコーポレーションリンケージを適用すると、階層の深さや広がりについて制約されることなく、コーポレーションファミリー全体の様子を見ることができるようになる。
この場合、親会社はU Products Group Corp. 1502であって、この会社はその配下に3つの子会社すなわちL Inc. 1504、C Inc 1506および G Inc. 1508を有している。1504は2つの部門 L Storage Div. 1510および(図14に示した)L Refinery Div. 1402をもっている。C Inc. 1506は2つの部門すなわちIndustrial Co. 1512およびBuilding Co. 1514ならびに(図14に示した)1つの子会社C Stores Inc. 1404を有している。G Inc. 1508は2つの部門すなわち(図14に示した)G Storage Div.1406とG Refinery Div. 1516を有している。C Stores Inc. は4つのブランチすなわちNorth Store Inc. 1518、South Store Inc. 1520、West Store Inc. 1522およびEast Store Inc. 1524を有している。広範囲にわたるコーポレーションリンケージを構築することによって、企業情報提供側はこのような徹底的な詳細の提供により産業のリーダーとなることができる。
図16には、合併および買収後にコーポレーションリンケージドライバ114がどのようにしてファミリーツリーを更新するのかが描かれている。この例では、合併前には2つの別個の企業すなわちABC 1602およびXYZ 1604が存在しており、それらは各々自身の固有の子会社および部門をもっていた。合併後、ABC XYZ 1606は2つの子会社すなわちABC子会社1608とXYZ子会社1610をもつことになり、各々が自身の部門および/または子会社を有している。
コーポレーションリンケージドライバ114はユーザのためにリスクマネージメント、セールスおよびマーケッティングならびにサプライマネージメントに関して、有益な可能な好機を利用できるようにする。これによってユーザは、あるコーポレーションファミリーが晒されているトータルなリスクを捉えることができるようになる。ユーザは1つの会社における破産または財政圧迫とそのコーポレーションファミリーとの関係を認識する。ユーザは、コーポレーションファミリー内における新たなカスタマと既存のカスタマによる好機の増大を見つけることができ、どれがその最良のカスタマおよびプロスペクトであるのかを捉えることができる。ユーザはよりよい交渉のため、コーポレーションファミリーによるトータルな費用を判定することができる。
図17には、コーポレーションリンケージドライバ114を実行する方法の一例が示されている。この図には全体として、ファミリーツリーリンケージを更新する方法(1700)が示されており、ここで最終目標は、すべてのルックアライクすなわち紛らわしいものあるいは類似したもの(look-a-like LAL)を解消する一方、首尾一貫した名称、取引スタイルおよび正確な従業員数とともに識別番号を有する実体各々におけるすべての子会社と部門を適正にリンクすることである。
たとえば、ファイル作成および他のアクティビティによって、本来はリンクされていないレコードが生成される可能性があり、たとえば解消の必要とされる重複したレコードあるいはルックアライク(LAL)が生成されてしまう可能性がある。たとえばだれかがLensCraftersについて1つのレコードを生成したがLensCrafters USAであったのにLensCrafters EyeGlassesと名付けたとしたら、ルックアライクレコードないしは重複したレコードが与えられてしまうことになる。これを避けるため、方法1700によってルックアライクレコードすなわち紛らわしいレコードが解消される。この場合、ルックアライクレコードを解消するために3つの汎用ルールが存在する。はじめに、ルックアライクが住所録上にあったならば、あるいは本社において口頭でそれを確認できたならば、それが相応にリンクされる。次に、確認されなかったルックアライクのために電話による調査が必要とされる。さらにその次に、すべてのルックアライクを共働レベルとは無関係にツリーのログオフの前に解消する必要がある。
方法1700のスタートにあたり、有利には電子版の住所録1702に関してある会社に対し接触が行われる。可能な接触の仕方としてあげられるのは事前接触、人的資源、法律部門、コントローラ、投資者関係等である。住所録が利用できるのであれば、オフショアキーイングを含むバルクプロセスポテンシャルに関してその住所録とツリーが評価される(1704)。他方、住所録が利用できなければ、ある会社のウェブサイトがインターネットでサーチされる(1706)。ウェブサイトが利用できるならば、オフショアキーイングを含むバルクプロセスポテンシャルについてウェブサイトの情報が評価され、それに応じてツリーが更新される(1708)。ウェブサイトが利用できなければ、その会社がおおやけに取引されているか否かが判定される(1710)。おおやけに取引されているならば、最新の10−Kがチェックされる。そうでなければ、ツリー構造について口頭で検証するために子会社が呼び出される。ルックライクが解消されて、ツリーのログオフが実行される。
予測インジケータドライバ116により、企業について収集された情報が要約され、今後の業績を予測するためにそれが利用される。この場合、3つのタイプの予測インジケータが設けられており、すなわち記述による格付け、予測スコア、需要推定量が設けられている。記述的格付けは、ある会社の過去の業績の記述による全体的なグレードである。予測スコアは、ある企業に関してその将来がどのくらいの確率で信用できるかの予測である。さらに需要推定量は、ある企業が全体としてどれぐらいの量の製品を購入する可能性があるのかに関して推定するものである。
予測インジケータによって、ユーザはその企業のすべての分野の促進が支援される。リスクマネージメントにおいて、記述による格付けによってユーザによる信用の承認または同意が支援される。格付けにより表されるのは、ある会社について過去の財政上の業績に基づき信用貸しする価値があるかである。スコアによって表されるのは、過去の支払い履歴に基づき信用貸しする価値があるのかである。ユーザのポートフォリオ全体にわたりハイリスクのアカウントを迅速に識別し、ただちにアグレッシブな回収を始めるために、予測スコアを適用することができる。商業上の信用貸しスコアによって、次の12ヶ月の間にのろのろと支払う企業の可能性が予測される。財務圧迫スコアによって、次の12ヶ月の間に失敗する企業の可能性が予測される。セールスおよびマーケッティングにおいて需要推定量からユーザは、どの企業が購入する可能性があるのかを知ることができ、それによってカスタマまたはプロスペクトの中から好機を優先させることができる。需要推定量の例として、パーソナルコンピュータ数および地域的なまたは長期の支出などが挙げられる。サプライマネージメントにおいては、ユーザのサプライヤが将来の失敗に対する自身のリスクを迅速に捉えるために、予測スコアを適用することができる。
これに加えて、ユーザ固有のニーズおよび判定基準に従い予測スコアをカスタマイズすることができる。たとえば、1)どのような挙動をユーザが予測したいのか、2)ユーザがアクセスしたい企業のサイズはどのようなものか、3)リスク評価を信用貸し判定またはリスクマネージメントアクションに変換するためにユーザのリスク許容度に基づき何が判定ルールなのか、といった判定基準を用いることができる。
予測インジケータは、分析的ケイパビリティおよびデータケイパビリティによって可能になる。たとえば、熟練した企業間取引(business-to- business B2B)エキスパートPhDの専門チームによって、基礎を成す予測モデルを構築することができ、このチームは産業固有の知識、財政情報および支払い情報ならびに分析のための広範囲にわたる履歴情報にアクセスすることができる。
図18Aおよび図18Bには、予測インジケータを生成するための方法の一例が示されている。この方法はマーケット分析1802からスタートし、ついでモデル開発の企業判定1804が行われる。この判定には開発すべきスコアと終端での出力のタイプが含まれており、たとえば失敗リスクスコア、不履行リスクスコア、あるいは産業固有のスコアなどである。失敗リスクスコアは、ある会社が活動を中止することになる可能性である。不履行リスクスコアは、ある会社が支払いを遅滞させる可能性である。産業固有のスコアによって、コピー機またはトラック運送業者を利用する公算や、ある会社が良好な信用貸しリスクであるか否かなどのように、何らかの特有の事柄が予測される。信用貸しに関する履歴データを提供する信用貸しデータベース1808のアーカイブおよび取引テープデータベース18010から、入力データ1806が収集される。この場合、重要な2つの期間が存在し、その1つは要因すべてに対し履歴的にみた概観を成すアクティビティ周期であり、その1つは何が起こったのかが判明した直後の期間を成す結果として生じた期間である。たとえば、前年のデータがあるならば、ある会社は今年の所定の期間についてどのような業績を上げたか、などである。次のステップすなわち「不正確な定義」(予測すべき結果)の判定において評価すべきリスクが参照され、これはたとえば次の12ヶ月における否定的な失敗の公算を予測する財政圧迫スコアなどである。
企業ユニバースから開発サンプルが選択され(1814)、企業ユニバースから人口統計学的プロファイルが生成され(1816)、説明によるデータ分析(すべての変量の単変量分析)が実行される(1818)。この場合、変量範囲、変量形式、変量を含めるか含めないか、ならびにモデルに何を入れるかの把握に関連する他のファンクションの決定などのようなタスクが実行される。その際に変量をアクティビティ周期および結果として得られた周期に従い選択することができ、さらに精度または代表性を表すために重みを割り当てることができる。トレンドがファクタに含められる。また、品質保証にあたり、企業ユニバースにおける何らかのものが初期モデルに作用を及ぼすか否かを調べるために、ならびにスコアをとるために周期的にチェックが行われ、さらに依然として暗示的(indicative)なのか予測的(predictive)なのかをチェックするために先行の周期に対してこのことが行われる。サンプルには欠陥が含まれている可能性がある。
続いて図18Bを参照すると、統計分析およびモデル開発プロセスにおいて、論理回帰ならびに他の推定技術が実行される(1820)。このステップにいて、適切なモデルと式と統計が適用される。次に、統計係数がスコアカードに変換される(1822)。その際、モデルがテストされてバリデートされ(1824)、技術的な仕様が開発される(1826)。最後にこのモデルがインプリメントされ(1828)テストされる(1830)。そしてスコアを生成するため、このモデルにデータが投入される。スコアが依然として有効であることを検証するため、ならびにスコアカードの更新が必要か否かを判定するため、周期的にチェックが実行される。
これまでの説明は例示を意図したものであり、これらに限定されるものではないのは自明である。当業者であればこれまでの説明を参照することで他の多くの実施形態を考えることができる。データ収集の実施、実体マッチングの実行、識別番号の付加、コーポレーションリンケージの実施、予測インジケータの生成に関して種々の実施形態が考えられる。企業情報産業以外の用途にも本発明を適用することができる。したがって本発明の範囲は、特許請求の範囲ならびに各請求項に記載された構成と同等の範囲全般によって規定されるものである。
本発明によるデータ統合方法を示すブロック図 本発明によるデータ統合システムを示すブロック図 本発明によるデータ統合システムを示すブロック図 本発明によるデータ統合方法を描いたロジック図 本発明によるデータ収集における例示的なソースを示すブロック図 本発明によるデータ収集におけるもっと多くの例示的なソースを示すブロック図 本発明による実体マッチングを示すブロック図 本発明による実体マッチングを示すブロック図 実体マッチングを示すブロック図 実体マッチングを示すブロック図 本発明による実体マッチング方法を示すブロック図 本発明による実体マッチング方法を示すブロック図 本発明によるコーポレーションリンケージを示すブロック図 本発明によるコーポレーションリンケージを示すブロック図 本発明によるコーポレーションリンケージを示すブロック図 本発明によるコーポレーションリンケージを示すブロック図 本発明によるコーポレーションリンケージ方法の一例を示すブロック図 本発明による予測インジケータ供給方法の一例を示すブロック図 本発明による予測インジケータ供給方法の一例を示すブロック図

Claims (8)

  1. コンピュータシステムにおいて、
    プロセッサと、該プロセッサにより読み取り可能であり該プロセッサに以下のステップを実行させる命令が含まれているメモリが設けられており、すなわち該メモリに含まれている命令によってプロセッサは、
    a)データ収集ドライバにより、少なくとも1つのデータソースから、企業に関連する1次データから成る情報を収集するステップと、
    b)該1次データが記憶されている実体データとマッチしているか否かを判定するステップと、
    c)前記1次データに識別番号を割り当て、以下のルールに従い割り当てられた識別番号を生成するステップを実行し、すなわち
    i)前記1次データが記憶されている実体データとマッチしているならば、既存の識別番号を有する識別番号を前記1次データに割り当てるステップと、
    ii)前記1次データが記憶されている実体データとマッチしていないならば、新たな識別番号を有する識別番号を前記1次データに割り当てるステップが実行され、
    さらに前記メモリに含まれている命令によって前記プロセッサは、
    d)コーポレーションリンケージドライバによって、前記企業と企業の実体との関係を検出することによりコーポレーションリンケージデータを生成するステップを実行し、該コーポレーションリンケージデータは複数の企業間の系列関係または提携関係を表し、
    )2次データを生成するステップを実行し、該2次データは、前記割り当てられた識別番号と前記コーポレーションリンケージデータを有しており、
    さらに前記メモリに含まれている命令によってプロセッサは、
    f)前記1次データと前記2次データとを結合して強化された情報を形成するステップと、
    g)前記強化された情報をデータベースに格納するステップと、
    h)以下のステップを含むルーチンを周期的に実行し、すなわち、
    1)前記強化された情報をサンプリングして、サンプルデータを生成するステップと、
    2)前記サンプルデータに基づき前記企業の過去の業績を分析して、該企業の将来の業績を表すデータを生成するステップと、
    3)前記データベース内の前記強化された情報を、前記企業の将来の業績を表すデータにより更新するステップ
    を含むルーチンを周期的に実行し、
    さらに前記メモリに含まれている命令によってプロセッサは、
    i)前記更新された強化された情報を前記データベースに格納するステップを実行することを特徴とする、
    コンピュータシステム。
  2. 請求項1記載のコンピュータシステムにおいて、
    前記メモリに含まれている命令によってプロセッサは、
    前記ステップb)において前記1次データが記憶されているデータとマッチしていなければ、前記ステップc)において識別番号を割り当てる前に、前記1次データが第1の閾値条件を満たしているか否かを判定するステップを実行し、
    前記第1の閾値条件は、前記データ収集ドライバにより収集され前記1次データに関連づけられている企業の存在を裏付ける少なくとも2つのソースであることを特徴とするコンピュータシステム。
  3. 請求項2記載のコンピュータシステムにおいてプロセッサは、
    前記メモリに含まれている命令によって、
    前記1次データが前記第1の閾値条件を満たしていなければ、前記1次データを記憶するステップを実行することを特徴とするコンピュータシステム。
  4. 請求項3記載のコンピュータシステムにおいて、
    前記メモリに含まれている命令によってプロセッサは、
    i)前記1次データが前記格納されている実体データとマッチしておらず、かつii)前記1次データが前記第1の閾値条件を満たしていなければ、
    付加的な1次データを受け取るステップと、
    前記1次データと該付加的な1次データが前記第1の閾値条件を満たしているか否かを判定するステップと、
    前記1次データと前記付加的な1次データが前記第1の閾値条件を満たしているならば、前記ステップc)において識別番号を割り当てるステップと、
    前記1次データと前記付加的な1次データが前記第1の閾値条件を満たしてなければ、前記1次データと前記付加的な1次データをレポジトリへ送信するステップを実行することを特徴とするコンピュータシステム。
  5. 実行可能なコンピュータプログラムを有するコンピュータ読み取り可能な媒体において、
    前記コンピュータプログラムがプロセッサにより読み取られると、該プロセッサにより以下のステップが実行され、すなわち、
    a)データ収集ドライバにより、少なくとも1つのデータソースから、企業に関連する1次データから成る情報を収集するステップと、
    b)該1次データが記憶されている実体データとマッチしているか否かを判定するステップと、
    c)前記1次データに識別番号を割り当て、以下のルールに従い割り当てられた識別番号を生成するステップが実行され、すなわち
    i)前記1次データが記憶されている実体データとマッチしているならば、既存の識別番号を有する識別番号を前記1次データに割り当てるステップと、
    ii)前記1次データが記憶されている実体データとマッチしていないならば、新たな識別番号を有する識別番号を前記1次データに割り当てるステップが実行され、
    さらに前記プロセッサにより、
    d)コーポレーションリンケージドライバによって、前記企業と企業の実体との関係を検出することによりコーポレーションリンケージデータを生成するステップを有しており、該コーポレーションリンケージデータは複数の企業間の系列関係または提携関係を表し、
    )2次データを生成するステップが実行され、該2次データは、前記割り当てられた識別番号と前記コーポレーションリンケージデータを有しており、
    さらに前記プロセッサにより、
    f)前記1次データと前記2次データとを結合して強化された情報を形成するステップと、
    g)前記強化された情報をデータベースに格納するステップと、
    h)以下のステップを含むルーチンが周期的に実行され、すなわち、
    1)前記強化された情報をサンプリングして、サンプルデータを生成するステップと、
    2)前記サンプルデータに基づき前記企業の過去の業績を分析して、該企業の将来の業績を表すデータを生成するステップと、
    3)前記データベース内の強化された情報を、前記企業の将来の業績を表すデータにより更新するステップ
    を含むルーチンが周期的に実行され、
    さらに前記プロセッサにより、
    i)前記更新された強化された情報を前記データベースに格納するステップが実行されることを特徴とする、
    コンピュータ読み取り可能な媒体。
  6. 請求項記載のコンピュータ読み取り可能な媒体において、
    前記プロセッサにより、
    前記ステップb)において前記1次データが記憶されているデータとマッチしていなければ、前記ステップc)において識別番号を割り当てる前に、前記1次データが第1の閾値条件を満たしているか否かを判定するステップが実行され、
    前記第1の閾値条件は、前記データ収集ドライバにより収集され前記1次データに関連づけられている企業の存在を裏付ける少なくとも2つのソースであることを特徴とする、
    コンピュータ読み取り可能な媒体。
  7. 請求項記載のコンピュータ読み取り可能な媒体において、
    前記プロセッサにより、
    前記1次データが前記第1の閾値条件を満たしていなければ、前記1次データを記憶するステップが実行されることを特徴とする、
    コンピュータ読み取り可能な媒体。
  8. 請求項記載のコンピュータ読み取り可能な媒体において、
    前記プロセッサにより、
    i)前記1次データが前記格納されている実体データとマッチしておらず、かつii)前記1次データが前記第1の閾値条件を満たしていなければ、
    付加的な1次データを受け取るステップと、
    前記1次データと該付加的な1次データが前記第1の閾値条件を満たしているか否かを判定するステップと、
    前記1次データと前記付加的な1次データが前記第1の閾値条件を満たしているならば、前記ステップc)において識別番号を割り当てるステップが実行され、
    前記1次データと前記付加的な1次データが前記第1の閾値条件を満たしてなければ、前記1次データと前記付加的な1次データをレポジトリへ送信するステップが実行されることを特徴とする、
    コンピュータ読み取り可能な媒体。
JP2006502895A 2003-02-18 2004-01-21 データ統合方法 Expired - Lifetime JP4996242B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/368,072 2003-02-18
US10/368,072 US7822757B2 (en) 2003-02-18 2003-02-18 System and method for providing enhanced information
PCT/US2004/001435 WO2004074981A2 (en) 2003-02-18 2004-01-21 Data integration method

Publications (2)

Publication Number Publication Date
JP2006518512A JP2006518512A (ja) 2006-08-10
JP4996242B2 true JP4996242B2 (ja) 2012-08-08

Family

ID=32850091

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006502895A Expired - Lifetime JP4996242B2 (ja) 2003-02-18 2004-01-21 データ統合方法

Country Status (9)

Country Link
US (3) US7822757B2 (ja)
EP (1) EP1599778A4 (ja)
JP (1) JP4996242B2 (ja)
KR (1) KR101006889B1 (ja)
CN (1) CN1826578B (ja)
AU (1) AU2004214217B2 (ja)
CA (1) CA2516390C (ja)
SG (1) SG157229A1 (ja)
WO (1) WO2004074981A2 (ja)

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7822757B2 (en) * 2003-02-18 2010-10-26 Dun & Bradstreet, Inc. System and method for providing enhanced information
US7822660B1 (en) * 2003-03-07 2010-10-26 Mantas, Inc. Method and system for the protection of broker and investor relationships, accounts and transactions
US7970688B2 (en) * 2003-07-29 2011-06-28 Jp Morgan Chase Bank Method for pricing a trade
US20050108631A1 (en) * 2003-09-29 2005-05-19 Amorin Antonio C. Method of conducting data quality analysis
US20090299909A1 (en) * 2003-11-04 2009-12-03 Levi Andrew E System and method for comprehensive management of company equity structures and related company documents with financial and human resource system integration
US20090293104A1 (en) * 2003-11-04 2009-11-26 Levi Andrew E System and method for comprehensive management of company equity structures and related company documents withfinancial and human resource system integration
US20050154751A1 (en) * 2003-11-04 2005-07-14 Boardroom Software, Inc. System and method for comprehensive management of company equity structures and related company documents with financial and human resource system integration
US8458073B2 (en) * 2003-12-02 2013-06-04 Dun & Bradstreet, Inc. Enterprise risk assessment manager system
US8036907B2 (en) * 2003-12-23 2011-10-11 The Dun & Bradstreet Corporation Method and system for linking business entities using unique identifiers
US20050192891A1 (en) * 2004-02-27 2005-09-01 Dun & Bradstreet, Inc. System and method for providing access to detailed payment experience
US8868456B1 (en) 2004-09-29 2014-10-21 At&T Intellectual Property Ii, L.P. Method and apparatus for managing financial control validation processes
US20090234684A1 (en) * 2005-03-24 2009-09-17 Mark Peter Stoke Risk Based Data Assessment
WO2007044479A2 (en) * 2005-10-05 2007-04-19 Dun & Bradstreet, Inc. Modular web-based asp application for multiple products
US20080221973A1 (en) * 2005-10-24 2008-09-11 Megdal Myles G Using commercial share of wallet to rate investments
WO2007053630A2 (en) * 2005-10-31 2007-05-10 Dun & Bradstreet, Inc. System and method for providing a fraud risk score
KR101276602B1 (ko) * 2005-11-23 2013-06-19 던 & 브래드스트리트, 아이엔씨. 표의문자적 내용을 가지는 데이터를 서치하고 매칭하기위한 시스템 및 방법
US8073724B2 (en) * 2005-12-02 2011-12-06 Saudi Arabian Oil Company Systems program product, and methods for organization realignment
US20070226099A1 (en) * 2005-12-13 2007-09-27 General Electric Company System and method for predicting the financial health of a business entity
JP5193061B2 (ja) * 2005-12-27 2013-05-08 ダン アンド ブラッドストリート コーポレーション 顧客駆動型クエリからの照合を強化するための方法およびシステム
US20070282673A1 (en) 2006-04-28 2007-12-06 Lehman Brothers Inc. Method and system for implementing portal
US7987159B2 (en) 2006-09-15 2011-07-26 Microsoft Corporation Detecting and managing changes in business data integration solutions
US20080140438A1 (en) * 2006-12-08 2008-06-12 Teletech Holdings, Inc. Risk management tool
US8694361B2 (en) * 2006-12-15 2014-04-08 American Express Travel Related Services Company, Inc. Identifying and managing strategic partner relationships
US20080147425A1 (en) * 2006-12-15 2008-06-19 American Express Travel Related Services Company, Inc. Strategic Partner Recognition
US9898767B2 (en) 2007-11-14 2018-02-20 Panjiva, Inc. Transaction facilitating marketplace platform
EP2212839A4 (en) 2007-11-14 2012-06-27 Panjiva Inc ASSESSMENT OF PUBLIC PROTOCOLS OF DELIVERY TRANSACTIONS
US7912867B2 (en) * 2008-02-25 2011-03-22 United Parcel Services Of America, Inc. Systems and methods of profiling data for integration
US8024428B2 (en) * 2008-03-19 2011-09-20 The Go Daddy Group, Inc. Methods for updating WHOIS with information collected from non-controlling party
US20100037299A1 (en) * 2008-08-08 2010-02-11 American Express Travel Related Services Company, Inc. Method, System, And Computer Program Product For Identifying An Authorized Officer Of A Business
US8171033B2 (en) * 2008-09-30 2012-05-01 Vmware, Inc. Methods and systems for the determination of thresholds via weighted quantile analysis
US8725701B2 (en) * 2008-10-08 2014-05-13 Oracle International Corporation Merger and acquisition data validation
US9910875B2 (en) * 2008-12-22 2018-03-06 International Business Machines Corporation Best-value determination rules for an entity resolution system
US8285616B2 (en) * 2009-03-27 2012-10-09 The Dun & Bradstreet Corporation Method and system for dynamically producing detailed trade payment experience for enhancing credit evaluation
US8046312B2 (en) * 2009-05-21 2011-10-25 Accenture Global Services Limited Enhanced postal data modeling framework
US8356037B2 (en) * 2009-12-21 2013-01-15 Clear Channel Management Services, Inc. Processes to learn enterprise data matching
AU2011204831B2 (en) * 2010-07-20 2012-11-29 Accenture Global Services Limited Digital analytics platform
US8381120B2 (en) * 2011-04-11 2013-02-19 Credibility Corp. Visualization tools for reviewing credibility and stateful hierarchical access to credibility
US8862543B2 (en) * 2011-06-13 2014-10-14 Business Objects Software Limited Synchronizing primary and secondary repositories
US8626766B1 (en) 2011-09-28 2014-01-07 Google Inc. Systems and methods for ranking and importing business listings
US8984006B2 (en) 2011-11-08 2015-03-17 Google Inc. Systems and methods for identifying hierarchical relationships
WO2014012576A1 (en) * 2012-07-16 2014-01-23 Qatar Foundation A method and system for integrating data into a database
US9582555B2 (en) * 2012-09-06 2017-02-28 Sap Se Data enrichment using business compendium
US10242330B2 (en) * 2012-11-06 2019-03-26 Nice-Systems Ltd Method and apparatus for detection and analysis of first contact resolution failures
US9963954B2 (en) 2012-11-16 2018-05-08 Saudi Arabian Oil Company Caliper steerable tool for lateral sensing and accessing
US20150120347A1 (en) * 2012-11-30 2015-04-30 The Dun & Bradstreet Corporation System and method for updating organization family tree information
US9122710B1 (en) 2013-03-12 2015-09-01 Groupon, Inc. Discovery of new business openings using web content analysis
US8996391B2 (en) 2013-03-14 2015-03-31 Credibility Corp. Custom score generation system and methods
US8712907B1 (en) 2013-03-14 2014-04-29 Credibility Corp. Multi-dimensional credibility scoring
US20150149247A1 (en) * 2013-05-02 2015-05-28 The Dun & Bradstreet Corporation System and method using multi-dimensional rating to determine an entity's future commercical viability
WO2014179088A1 (en) 2013-05-02 2014-11-06 The Dun & Bradstreet Corporation Apparatus and method for total loss prediction
US20150039385A1 (en) * 2013-08-01 2015-02-05 American Express Travel Related Services Company, Inc. System and method for liquidation management of a company
US20150095210A1 (en) * 2013-09-27 2015-04-02 Brian Grech Merchant loan management and processing
US20150100366A1 (en) * 2013-10-08 2015-04-09 immixSolutions, Inc. System and method for managing a law enforcement investigation
US10521866B2 (en) 2013-10-15 2019-12-31 Mastercard International Incorporated Systems and methods for associating related merchants
US20150127501A1 (en) * 2013-11-07 2015-05-07 Strategic Exits Corp. System and Method for Capturing Exit Transaction Data
US10140352B2 (en) 2014-07-17 2018-11-27 Oracle International Corporation Interfacing with a relational database for multi-dimensional analysis via a spreadsheet application
US20160063521A1 (en) * 2014-08-29 2016-03-03 Accenture Global Services Limited Channel partner analytics
US9953105B1 (en) 2014-10-01 2018-04-24 Go Daddy Operating Company, LLC System and method for creating subdomains or directories for a domain name
US9785663B2 (en) 2014-11-14 2017-10-10 Go Daddy Operating Company, LLC Verifying a correspondence address for a registrant
US9779125B2 (en) 2014-11-14 2017-10-03 Go Daddy Operating Company, LLC Ensuring accurate domain name contact information
CN105608087B (zh) * 2014-11-19 2020-01-31 菜鸟智能物流控股有限公司 一种资源调度方法与设备
US10725985B2 (en) * 2015-02-20 2020-07-28 Metropolitan Life Insurance Co. System and method for enterprise data quality processing
US9898497B2 (en) 2015-03-31 2018-02-20 Oracle International Corporation Validating coherency between multiple data sets between database transfers
US11514096B2 (en) 2015-09-01 2022-11-29 Panjiva, Inc. Natural language processing for entity resolution
US20170109761A1 (en) * 2015-10-15 2017-04-20 The Dun & Bradstreet Corporation Global networking system for real-time generation of a global business ranking based upon globally retrieved data
US11580571B2 (en) * 2016-02-04 2023-02-14 LMP Software, LLC Matching reviews between customer feedback systems
US10203984B2 (en) * 2016-07-26 2019-02-12 Sap Se Data structure for multiple executable tasks
US11386336B2 (en) 2016-10-06 2022-07-12 The Dun And Bradstreet Corporation Machine learning classifier and prediction engine for artificial intelligence optimized prospect determination on win/loss classification
US11386435B2 (en) 2017-04-03 2022-07-12 The Dun And Bradstreet Corporation System and method for global third party intermediary identification system with anti-bribery and anti-corruption risk assessment
CN110832514A (zh) 2017-04-22 2020-02-21 潘吉瓦公司 由个别的海关交易记录临近预报抽象的调查
EP3692462B1 (en) 2017-10-04 2024-06-26 The Dun & Bradstreet Corporation System and method for identity resolution across disparate distributed immutable ledger networks
CN107993010B (zh) * 2017-12-02 2022-05-06 中科钢研节能科技有限公司 一种项目尽职调查自动分析系统及自动分析方法
WO2019113124A1 (en) 2017-12-04 2019-06-13 Panjiva, Inc. Mtransaction processing improvements
US11580330B2 (en) * 2018-12-28 2023-02-14 Microsoft Technology Licensing, Llc Machine learning framework with model performance tracking and maintenance
CA3041600A1 (en) 2019-04-25 2020-10-25 The Dun & Bradstreet Corporation Machine learning classifier for identifying internet service providers from website tracking
CN110363401B (zh) * 2019-06-26 2022-05-03 北京百度网讯科技有限公司 整合粘性评估方法、装置、计算机设备及存储介质
JP2020149716A (ja) * 2020-05-26 2020-09-17 株式会社ファーマクラウド 医薬品の流通を支援するためのシステム、方法およびプログラム
CN112001710A (zh) * 2020-09-07 2020-11-27 山东钢铁集团日照有限公司 一种钢铁产品生产过程大数据读取整合系统
US20220084091A1 (en) * 2020-09-17 2022-03-17 Mastercard International Incorporated Continuous learning for seller disambiguation, assessment, and onboarding to electronic marketplaces
US11636417B2 (en) * 2020-12-17 2023-04-25 International Business Machines Corporation Cognitive analysis for enterprise decision meta model

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5588147A (en) 1994-01-14 1996-12-24 Microsoft Corporation Replication facility
US6460036B1 (en) * 1994-11-29 2002-10-01 Pinpoint Incorporated System and method for providing customized electronic newspapers and target advertisements
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US5806074A (en) 1996-03-19 1998-09-08 Oracle Corporation Configurable conflict resolution in a computer implemented distributed database
US5819291A (en) * 1996-08-23 1998-10-06 General Electric Company Matching new customer records to existing customer records in a large business database using hash key
US6026391A (en) * 1997-10-31 2000-02-15 Oracle Corporation Systems and methods for estimating query response times in a computer system
AU5144700A (en) * 1999-05-21 2000-12-12 Inc Integrated Network Corporation Loop access system with graphical user interface
US6523019B1 (en) * 1999-09-21 2003-02-18 Choicemaker Technologies, Inc. Probabilistic record linkage model derived from training data
EP1102225A3 (en) 1999-11-22 2002-08-21 Ncr International Inc. Method of processing electronic payment data and an apparatus therefor
JP3866466B2 (ja) 1999-12-13 2007-01-10 株式会社東芝 データ構造管理装置、データ構造管理システム、データ構造管理方法およびデータ構造管理プログラムを格納する記録媒体
US6810429B1 (en) * 2000-02-03 2004-10-26 Mitsubishi Electric Research Laboratories, Inc. Enterprise integration system
US20010032117A1 (en) * 2000-04-07 2001-10-18 Persky Robert E. Continuous and updatable revenue sharing process for lists
AU2001278122A1 (en) 2000-07-31 2002-02-13 Eliyon Technologies Corporation Method for maintaining people and organization information
US20020161778A1 (en) * 2001-02-24 2002-10-31 Core Integration Partners, Inc. Method and system of data warehousing and building business intelligence using a data storage model
US7103586B2 (en) 2001-03-16 2006-09-05 Gravic, Inc. Collision avoidance in database replication systems
US20030033155A1 (en) * 2001-05-17 2003-02-13 Randy Peerson Integration of data for user analysis according to departmental perspectives of a customer
US7953219B2 (en) * 2001-07-19 2011-05-31 Nice Systems, Ltd. Method apparatus and system for capturing and analyzing interaction based content
US20030061232A1 (en) * 2001-09-21 2003-03-27 Dun & Bradstreet Inc. Method and system for processing business data
US7403942B1 (en) * 2003-02-04 2008-07-22 Seisint, Inc. Method and system for processing data records
US7822757B2 (en) * 2003-02-18 2010-10-26 Dun & Bradstreet, Inc. System and method for providing enhanced information

Also Published As

Publication number Publication date
AU2004214217A1 (en) 2004-09-02
EP1599778A2 (en) 2005-11-30
KR101006889B1 (ko) 2011-01-12
KR20050115238A (ko) 2005-12-07
SG157229A1 (en) 2009-12-29
US20110055173A1 (en) 2011-03-03
WO2004074981A3 (en) 2005-12-08
US20060004595A1 (en) 2006-01-05
US20040162742A1 (en) 2004-08-19
JP2006518512A (ja) 2006-08-10
CA2516390A1 (en) 2004-09-02
WO2004074981A2 (en) 2004-09-02
EP1599778A4 (en) 2006-11-15
CN1826578B (zh) 2014-07-02
AU2004214217B2 (en) 2009-10-29
US7822757B2 (en) 2010-10-26
CN1826578A (zh) 2006-08-30
CA2516390C (en) 2015-01-06
US8346790B2 (en) 2013-01-01

Similar Documents

Publication Publication Date Title
JP4996242B2 (ja) データ統合方法
US11558429B2 (en) Data processing and scanning systems for generating and populating a data inventory
US11138336B2 (en) Data processing systems for generating and populating a data inventory
US10430740B2 (en) Data processing systems for calculating and communicating cost of fulfilling data subject access requests and related methods
US11449633B2 (en) Data processing systems and methods for automatic discovery and assessment of mobile software development kits
Wang et al. Data quality requirements analysis and modeling
US7392240B2 (en) System and method for searching and matching databases
US7444323B2 (en) System and method for focused routing of content to dynamically determined groups of reviewers
US6665656B1 (en) Method and apparatus for evaluating documents with correlating information
US10776517B2 (en) Data processing systems for calculating and communicating cost of fulfilling data subject access requests and related methods
US20030120614A1 (en) Automated e-commerce authentication method and system
US20210303603A1 (en) Data processing systems for generating and populating a data inventory
WO2021237075A1 (en) Data processing systems and methods for automatic discovery and assessment of mobile software development kits
Kaur et al. Critical Data Consolidation in MDM to Develop the Unified Version of Truth
US11544667B2 (en) Data processing systems for generating and populating a data inventory
US12079115B1 (en) Systems and methods for efficient access to data
WO2024143561A1 (ja) データ利活用促進システム、データ利活用促進方法、および、プログラム
Kon et al. Data Quality Requirements: Analysis and Modeling
JP2002133057A (ja) 立会い検査方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090812

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091109

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091210

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100518

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100602

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20100702

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101227

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101228

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111130

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111205

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111228

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120110

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20120229

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120229

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120405

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120511

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4996242

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term