JP2011508353A - アンサンブル加盟店予測システムを実装するための方法および装置 - Google Patents

アンサンブル加盟店予測システムを実装するための方法および装置 Download PDF

Info

Publication number
JP2011508353A
JP2011508353A JP2010541467A JP2010541467A JP2011508353A JP 2011508353 A JP2011508353 A JP 2011508353A JP 2010541467 A JP2010541467 A JP 2010541467A JP 2010541467 A JP2010541467 A JP 2010541467A JP 2011508353 A JP2011508353 A JP 2011508353A
Authority
JP
Japan
Prior art keywords
merchant
location
database
data
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010541467A
Other languages
English (en)
Other versions
JP5485911B2 (ja
JP2011508353A5 (ja
Inventor
トーマス・マギーハン
Original Assignee
マスターカード インターナシヨナル インコーポレーテツド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マスターカード インターナシヨナル インコーポレーテツド filed Critical マスターカード インターナシヨナル インコーポレーテツド
Publication of JP2011508353A publication Critical patent/JP2011508353A/ja
Publication of JP2011508353A5 publication Critical patent/JP2011508353A5/ja
Application granted granted Critical
Publication of JP5485911B2 publication Critical patent/JP5485911B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

取引データ内で加盟店のグループメンバーシップを決定する目的で金融取引カードの取引データにおけるパターンを見つけるためのコンピュータベースの方法について説明する。データは、支払いに金融取引カードを受け入れている加盟店に関連している。本方法は、少なくとも1つのデータベースから取引データを受信するステップと、少なくとも1つの予測アルゴリズムおよび前記回収される取引データを使用してグループ内の加盟店のメンバーシップを予測するステップであって、前記アルゴリズムは前記予測を記述するメタデータを生成するステップと、前記少なくとも1つの予測されるグループメンバーシップおよび前記メタデータをデータマイニングアプリケーションへ入力するステップと、前記データマイニングアプリケーションにより、前記予測されるグループメンバーシップおよび前記メタデータを利用して、予測される各グループメンバーシップへ信頼値を割り当てるステップと、を含む。

Description

本発明は概して加盟店予測システムに関し、特に、口座保持者に代わって銀行カードネットワークを越えて処理される支払い業務に関連してアンサンブル加盟店予測システムを実装するための方法およびシステムに関する。
歴史的にみると、消費者取引の支払いに「チャージ」カードを使用することはせいぜい地域的なものであって、クレジット発行銀行と多様な地域加盟店との間の関係性に基づくものであった。支払いカード産業は、発行銀行が協会(例えば、MasterCard)を形成し、そして第三者取引処理会社(例えば、「Merchant Acquirers」)を取り込むことにより、加盟店とカード発行者との銀行関係に関わらず、カード所有者がいずれの加盟店の施設においてもそのチャージカードを広範に使用できるように発展してきた。
例えば、本出願の図1は、カード支払い取引を有効化するための例示的な複数関係者による支払いカード産業システムを示している。図示されているように、加盟店と発行者とは、必ずしも1対1の関係を有している必要はない。さらに、今日のカード支払い産業においては、カード発行者が特定の加盟店、または加盟店グループと特別な、またはカスタマイズされた関係性を有する様々なシナリオが存在する。
2500万件を超える加盟店が支払いカードの形式を受け入れている。これらの加盟店は、より識別しやすいチェーン、ブランドまたは他の法人と提携していることがある。ある例では、多国籍の大型ファーストフード会社の1つのフランチャイズ加盟店が、「Chris's Restaurants, LLC」として、取引カード発行者に識別される場合があり、このため、フランチャイズ本部との相互関連性はない。現在、カード支払い産業においては、実装を向上させる方法が考察されている。具体的には、取引履歴データを利用して将来の金融カード取引を予測し、かつこのデータから関係づけられるべきものがあるかどうかを決定することに注目が集まっている。
より具体的には、企業毎に集められる加盟店ロケーションデータには、法律上の所有権、ブランドまたは他の幾つかの定義に基づいて、より高レベルのグルーピングが割り当てられることが多い。しばしば、これらの関係性は明示的に定義されておらず、または容易に利用可能ではない。この関係性を推論することは、これまで、手動による取引データの調査を必然的に含み、ロケーションに適切なグルーピングへのメンバーシップを得る資格を与えるために使用できるフィールドまたはフィールド集合を見つけてきた。
ある態様においては、取引データ内で加盟店のグループメンバーシップを決定するために金融取引カードの取引データにおけるパターンを見つけるためのコンピュータベースの方法が提供されている。この場合のデータは、支払いに金融取引カードを受け入れている加盟店に関連している。本方法は、少なくとも1つのデータベースから取引データを受信するステップと、少なくとも1つの予測アルゴリズムおよび前記回収される取引データを使用してグループ内の加盟店のメンバーシップを予測するステップであって、前記アルゴリズムは前記予測を記述するメタデータを生成するステップと、前記少なくとも1つの予測されるグループメンバーシップおよび前記メタデータをデータマイニングアプリケーションへ入力するステップと、前記データマイニングアプリケーションにより、前記予測されるグループメンバーシップおよび前記メタデータを利用して、予測される各グループメンバーシップへ信頼値を割り当てるステップと、を含む。
別の態様においては、取引データを利用して個々の加盟店のグループメンバーシップを決定するために、金融取引カードの取引データにおけるパターンを見つけるためのコンピュータシステムが提供される。本コンピュータシステムは、取引データを使用して、各々が前記取引データに基づいて加盟店のグループメンバーシップを予測する複数の予測アルゴリズムを実行し、予測された各グループメンバーシップへ信頼スコアを割り当て、かつ最も高い信頼スコアを有するグループメンバーシップ予測を前記加盟店の最終的なメンバーシップ予測として出力するようにプログラムされる。
日常的なカード支払い取引を有効化するための例示的な複数関係者による支払いカード産業システムを示す略図である。 本発明の一実施形態によるシステムのサーバアーキテクチャの例示的な一実施形態を示す単純化したブロック図である。 本発明の一実施形態によるシステムのサーバアーキテクチャの例示的な一実施形態を示す拡大ブロック図である。 加盟店集合体予測システムのためのハイレベルコンポーネントを示すフローチャートである。 前記加盟店集合体予測システムに関連づけられるスコアリングエンジンのオペレーションを示すフローチャートである。 加盟店ロケーションを分類するアルゴリズムに入力されるデータを示すフローチャート250である。 加盟店ロケーションを分類するアルゴリズムを記述するフローチャートである。 加盟店の集合体および集合を分類システムにおける文書として示す線図である。 加盟店の集合体および集合を分類システムにおける文書として示す線図である。 データベース内の参照文字列または主要コンポーネントの集合の決定を示すフローチャートである。 文字列候補の類似性メトリックを決定するための参照文字列の集合の使用を示すフローチャートである。
本明細書では、アンサンブル加盟店予測のシステムおよび方法について説明する。本システムおよび方法は、ブランド、チェーン、法律上の所有権等の高レベル秩序、または加盟店ロケーションの既存の、幾分自由裁量的なコレクションとの類似性を明らかにする、ビジネスデータ(例えば、加盟店ロケーションデータ)における有意義なパターンを見つけるために利用される。本明細書において使用するアンサンブル予測システムは、その個々の予測が集合されて1つの予測を形成する複数の予測システムを指す。
典型的には、このようなグループメンバーシップが明示的に定義されない場合、その関係性はロケーションデータの手動調査によって推論されなければならない。記述しているアンサンブル加盟店予測システムは、アルゴリズム的手法を使用して、ロケーションレコードを含むスペースの少なくとも一部に関して記述された課題を解く。
本明細書に記述しているシステムおよびプロセスの技術的効果は、下記、即ち(a)ロケーションデータ等の加盟店業務に関するパターンを決定すること、(b)加盟店ロケーションデータに関連づけられる複数の予測から集合予測を提供すること、および(c)前記複数の予測およびこれらの予測に関連づけられる任意のメタデータを利用して各集合予測の信頼値を決定すること、のうちの少なくとも1つを含む。
ある実施形態では、あるコンピュータプログラムが提供され、前記プログラムはコンピュータ読取り可能媒体上に具現され、かつ管理のためのクライアントユーザインタフェース・フロントエンドおよび一般ユーザの入力およびレポートのためのウェブインタフェースを有する構造化問合せ言語(SQL)を使用する。ある例示的な実施形態では、このシステムはウェブ対応であって、企業体のイントラネット上で実行される。さらに別の実施形態では、このシステムは、認証されたアクセスを有する個人によって企業体のファイアウォールの外側でインターネットを介して十分にアクセスされる。さらなる例示的な実施形態では、このシステムはWindows(登録商標)環境(Windowsは、ワシントン州レドモンド所在のMicrosoft社の登録商標である)において実行されている。このアプリケーションはフレキシブルであり、かつ主要な機能性を危うくすることなく様々な異なる環境で実行されるように設計される。
これらのシステムおよびプロセスは、本明細書に記述される特有の実施形態に限定されない。さらに、各システムおよび各プロセスのコンポーネントは、本明細書に記述されている他のコンポーネントおよびプロセスとは独立して別個に実施され得る。また各コンポーネントおよびプロセスは、他のアッセンブリパッケージおよびプロセスと組み合わせて使用され得る。
背景として、図1は、取引履歴が少なくとも部分的に加盟店集合体予測システムによって利用される日常的なカード支払い取引を有効化するための例示的な複数関係者による支払いカード産業システムを示すダイアグラム20である。本明細書において使用しているように、加盟店集合体とは、加盟店ロケーションのハイレベルなグルーピングを指す。より具体的には、1件の小売業者に関する様々な個々の加盟店ロケーションが集められて(例えば、データベース内で互いにリンクされて)1つの加盟店集合体が形成される。従って、1つの加盟店ロケーションは、1つの加盟店集合体の1つのコンポーネントである。典型的には、加盟店集合体はストアチェーンを指す場合に使用され、ロケーションは、本明細書において詳述するように、取引データのデータベースに格納されている幾つかのフィールド値に基づいて集合化される。
本発明は、MasterCard(登録商標)インターチェンジを使用するクレジットカードの支払いシステム等の支払いカードシステムに関する。MasterCard(登録商標)インターチェンジは、MasterCard International社によって普及されている、MasterCard International Incorporated(登録商標)の会員である金融機関間で金融取引データを交換するための独自仕様の通信標準である。(MasterCardは、ニューヨーク州パーチェス所在のMasterCard International社の登録商標である。)
ある典型的な支払いカードシステムでは、「発行者」と呼ばれる金融機関が消費者にクレジットカード等の支払いカードを発行し、消費者はこの支払いカードを使用して加盟店からの購入に対する支払いを申し出る。支払いカードによる支払いを受け入れるためには、加盟店は通常、金融支払いシステムの一部である金融機関と契約を結ばなければならない。この金融機関は一般に、「加盟店銀行」または「アクワイアリングバンク」または「アクワイアラバンク」と呼ばれる。消費者22が支払いカード(金融取引カードとしても知られる)による購入の支払いを申し出ると、加盟店24は購入高に関して加盟店銀行26から認証を要求する。この要求は電話によって実行される場合もあるが、通常は販売時点端末の使用を介して実行される。販売時点端末は、支払いカード上の磁気ストライプから消費者の口座情報を読み取って加盟店銀行の取引処理コンピュータと電子的に通信する。或いは、加盟店銀行は第三者が取引処理を代行することを認可する場合もある。この場合、販売時点端末はこの第三者と通信するように構成される。このような第三者は通常、「加盟店プロセッサ」または「アクワイアリングプロセッサ」と呼ばれる。
インターチェンジ28を使用して、加盟店銀行または加盟店プロセッサのコンピュータはカード発行者銀行30のコンピュータと通信し、その消費者の口座が堅実な状態にあるかどうか、およびその購入がその消費者の利用可能な信用限度額の範囲内であるかどうかを決定する。これらの決定に基づいて、認証要求は謝絶または受容される。要求が受容されれば、加盟店に認証コードが発行される。
認証要求が受け入れられると、消費者の口座32の利用可能信用限度額が下げられる。通常、MasterCard International Incorporated(登録商標)等の銀行カード協会は、商品が出荷されるまで、またはサービスが届けられるまで加盟店に取引をチャージまたは「獲得」させないという規則を普及させていることに起因して、課金は消費者口座へ即時的には計上されない。加盟店が商品を出荷する、またはサービスを届けると、加盟店は、例えば販売時点端末上への適切なデータ入力処置によってその取引を獲得する。取引が獲得される前に消費者が取引をキャンセルすれば、「無効」が発生する。取引が獲得された後に消費者が商品を返品すれば、「クレジット」が発生する。
取引が獲得された後、この取引は、加盟店と、加盟店銀行と、発行者との間で決済される。決済とは、その取引に関連づけられる加盟店の口座と、加盟店銀行と発行者との間の金融データまたは資金の転送を指す。通常、取引は獲得されて「バッチ」に累積され、バッチはグループとして決済される。このような取引に関連づけられるデータは、本明細書において詳述するように、将来の購入活動を予測する分野において利用される。
金融取引カードまたは支払いカードは、クレジットカード、デビットカードおよびプリペイドカードを指す可能性がある。これらのカードは全て、取引を実行するための支払い方法として使用され得る。本明細書に記述しているように、「金融取引カード」または「支払いカード」という言い回しはクレジットカード、デビットカードおよびプリペイドカード等のカードを含むが、支払い勘定情報を保持している場合がある移動電話、パーソナルデジタルアシスタント(PDA)およびキーフォブ等の他の任意のデバイスも含む。
図2は、本発明の一実施形態による例示的なシステム100を示す単純化されたブロック図である。ある実施形態において、システム100は、例えばカスタマイズされた発行者−加盟店の関係性を実装すると同時に取引に関連づけられる履歴データの処理を実行するために使用される支払いカードシステムである。別の実施形態において、システム100は、支払い取引に適用されるべき処理コードを入力するために口座保持者によって利用されることが可能な支払いカードシステムである。
より具体的には、この例示的な実施形態において、システム100はサーバシステム112と、サーバシステム112へ接続されるクライアントシステム114とも称される複数のクライアントサブシステムとを含む。ある実施形態では、クライアントシステム114はウェブブラウザを含むコンピュータであり、よってサーバシステム112はインターネットを使用してクライアントシステム114へアクセス可能である。クライアントシステム114は、ローカルエリアネットワーク(LAN)または広域ネットワーク(WAN)等のネットワーク、ダイアルイン接続、ケーブルモデムおよび専用高速ISDN回線を含む多くのインタフェースを介してインターネットへ相互接続される。クライアントシステム114は、ウェブベース電話、パーソナルデジタルアシスタント(PDA)または他のウェブベースの接続可能機器を含むインターネットへ相互接続することができる任意のデバイスであり得る。データベースサーバ116は、後に詳述するように、様々な事柄に関する情報を含むデータベース120へ接続される。ある実施形態では、サーバシステム112上に集中データベース120が格納され、クライアントシステム114の1つにおける潜在的ユーザはクライアントシステム114のうちの1つを介してサーバシステム112へログオンすることにより、集中データベース120へアクセスすることができる。ある代替実施形態では、データベース120はサーバシステム112から遠隔に格納され、かつ非集中式であってもよい。
後に論じるように、データベース120は、銀行カードネットワーク上で実行される販売行動の一部として生成される、加盟店、口座名義人または顧客および購入に関するデータを含む取引データを格納する。データベース120はさらに、報酬プログラムおよび特典に関する、異なる報酬プログラムおよび特典に関連づけられる処理コードおよび業務規定を含むデータも含む。
図3は、本発明の一実施形態によるシステム122のサーバアーキテクチャを示す例示的な実施形態の拡大ブロック図である。(図2に示す)システム100のコンピュータに等しいシステム122におけるコンポーネントは、図3では、図2で使用している同じ参照数字を使用して識別されている。システム122は、サーバシステム112と、クライアントシステム114とを含む。サーバシステム112はさらに、データベースサーバ116と、アプリケーションサーバ124と、ウェブサーバ126と、ファックスサーバ128と、ディレクトリサーバ130と、メールサーバ132とを含む。データベースサーバ116およびディレクトリサーバ130へは、ディスク記憶ユニット134が結合される。サーバ116、124、126、128、130および132は、ローカルエリアネットワーク(LAN)136内で結合されている。さらに、LAN136へは、システム監督者のワークステーション138、ユーザのワークステーション140および監督者のワークステーション142も結合される。或いは、ワークステーション138、140および142はインターネットリンクを使用してLAN136へ結合され、またはイントラネットを介して接続される。
各ワークステーション138、140および142は、ウェブブラウザを有するパーソナルコンピュータである。これらのワークステーションにおいて実行される機能は、典型的には個々のワークステーション138、140および142において実行されるものとして示されるが、このような機能は、LAN136へ結合される多くのパーソナルコンピュータのうちの1つにおいて実行され得る。ワークステーション138、140および142は、単にLAN136へのアクセスを有する個人により実行され得る異なるタイプの機能の理解を促進する目的で、別々の機能に関連づけられるものとして示されているに過ぎない。
サーバシステム112は、ISPインターネット接続148を使用して従業員を含む様々な個人144へ、かつ例えば口座名義人、顧客、監査人、他である第三者146へ通信可能式に結合されるように構成される。この例示的な実施形態における通信はインターネットを使用して実行されるように示されているが、他の実施形態では、他の任意の広域ネットワーク(WAN)型通信を利用することができる。即ち、これらのシステムおよびプロセスは、インターネットを使用する実施に限定されない。さらに、かつWAN150ではなく、ローカルエリアネットワーク136がWAN150の代わりに使用される可能性もある。
この例示的な実施形態では、ワークステーション154を有する任意の認証された個人がシステム122にアクセスすることができる。クライアントシステムのうちの少なくとも1つは、リモートロケーションに位置づけられるマネージャワークステーション156を含む。ワークステーション154および156は、ウェブブラウザを有するパーソナルコンピュータである。また、ワークステーション154および156は、サーバシステム112と通信するように構成される。さらに、ファックスサーバ128は、電話回線を使用してクライアントシステム156を含む遠隔に位置づけられたクライアントシステムと通信する。ファックスサーバ128は、他のクライアントシステム138、140および142とも通信するように構成される。
図4は、各コンポーネントが金融取引カードネットワークのオペレーションに関する予測を提供する集団的または集合的な加盟店予測システムの一実施形態のハイレベル機能コンポーネントを示すフローチャート200である。従って、さらに述べるように、これらの予測は1つの予測へと集合される。この予測の集合化は、アンサンブル予測と称されることがある。本明細書に記述しているこれらの実施形態に関する一例は、受信された加盟店ロケーションデータに関する集合予測を含む。図4に関連して紹介しているが、本明細書では、全ての予測アルゴリズムについてより詳細に説明する。
第1のコンポーネントは類似ロケーション予測アルゴリズム202(k類似ロケーション予測アルゴリズムと称される場合がある)であり、これは、所定の加盟店ロケーションに最も類似する「k」件の加盟店ロケーションを検索するように構成される。予測アルゴリズム202はさらに、検索された「k」件の最も類似するロケーションの中から類似する加盟店ロケーションの1グループをモードグループとして分類するように動作可能である。
文書予測アルゴリズムとしての集合ロケーション204は、あらゆるフィールドと、既知の値のスペースにおけるロケーションの各集合体(ハイレベルのデータ分類)に関するフィールド値との関連性を計算するために利用され、結果は文書として格納される。これらの文書からの最も関連のある値は、予測を生成するために利用される。
予測が特定の第三者ブランドに関連づけられる場合には、ロケーション照合システムを含む第三者データ予測アルゴリズム206が利用される。アルゴリズム206への少なくとも1つの入力は第三者から受信される取引レコードを含み、これが予測の生成に利用される。ある実施形態では、この予測は、第三者データソースとのロケーション照合が実行された後に生成される。フローチャート200には、その一実施形態が主としてベンフォードの法則に基づき、かつさらには同一のグルーピングに属する加盟店について観察される、Benfordにより識別される分布から比較的一貫した方法で拡散する傾向に基づく数値サイン予測アルゴリズム208が含まれる。アルゴリズム208から結果的に生じる予測は、各加盟店ロケーションに比較して最も類似する数値分布を有するロケーショングループになる。
ある実施形態において、オラクル(Oracle)に実装されるトップレベル統計モデルおよびスコアリングエンジン210は、アルゴリズム202、204、206および208からの予測を利用して、データベース内に新しく受信および/または格納されるデータ間のグループメンバーシップを決定する。このデータの一例は、加盟店ロケーションデータである。少なくとも1つの実施形態では、かつ本明細書でさらに述べるように、データベース内の加盟店ロケーションデータはロケーションおよび距離に関して、例えば所定のロケーションから所定の距離内にある幾つかの加盟店ロケーションに関して記述される。少なくとも1つの態様において、ロケーションおよび距離は必ずしも地理的なものではなく、むしろデータベースに格納されている加盟店データを利用して計算されるような類似性に基づいている。特定の実施形態では、ロケーションおよび距離は、データベース内のフィールド値およびフィールドのトークン化された値に関するクロス属性加重式ターム出現頻度/文書出現頻度逆数(TF/IDF)の計算によって測定されるような類似性に基づいている。
図5は、スコアリングエンジン210のオペレーションを示すフローチャート220である。具体的には、スコアリングエンジン210は、222において、アルゴリズム202、204、206および208からの加盟店ロケーション予測をオラクルデータマイニング(ODM)アプリケーション224における予測に関するメタデータと共に使用し、個々の予測を取り囲む状況を記述し、次いで226において、集合化された個々の予測から最終予測を生成する。この最終予測は、加盟店ロケーションに関するものであってもよい。またこのアプリケーションは、複数のアルゴリズム202、204、206および208に関する集合予測に関連づけられる信頼スコアの生成も行う。
次に、4つのアルゴリズム202、204、206および208の各々についてさらに詳しく説明する。
k件の類似ロケーション(アルゴリズム202)
図6は、類似性に基づいて、例えばロケーションの類似性に基づいて加盟店ロケーションを分類するアルゴリズム202へ入力されるデータを示すフローチャート250である。チェーンまたはコレクション(例えば、グループ)メンバーシップを導出するコンテキストにおいて有意義であることが知られるロケーションレベルフィールドの集合またはロケーション座標252は、金融取引カードを引き受ける機関のデータベース254から識別される。さらに、日常的な新規/変更ロケーションデータベース256並びにその関連の新規/変更ロケーション座標258からのデータは、後述する加盟店ロケーション分類アルゴリズムへ供給される。
図7は、加盟店ロケーションをグループメンバーシップに分類するために利用されるアルゴリズムのうちの1つ(図4に示すアルゴリズム202)を記述するフローチャート280である。アルゴリズム202は、少なくとも図6のフローチャート250に関して記述されているデータを利用する。具体的には、282において、データベース内の加盟店ロケーションデータが、所定のロケーションから所定の距離内にある幾つか(k件)のロケーションについて検索される。さらに、284において、所定の距離内にあるロケーションが類似性について検索され、任意の新規/変更ロケーションが決定される。286では、特定の特徴スペース(取引データをアルゴリズム202へ入力する起点エリア)内の前記(k件の)ロケーション間で発生する加盟店ロケーションを分類することによって、モード値が決定される。(k件の)ロケーション記録の分類によって結果的に得られる最も出現頻度の高い値は最高の重みを有し、かつモード値と称され、後述するように決定される。このモード値は、288においてアルゴリズム202から予測として返される。
後に詳しく述べるように、フィールド(ロケーション座標252および258)はトークン化され、特徴スペースを網羅するトークン化された全てのフィールド値に関して文書出現頻度の逆数が計算される。ある実施形態では、各ロケーションについて、各フィールド値およびトークン化された各フィールド値の重みメトリックの疎行列がターム出現頻度/文書出現頻度逆数として計算される。予測値は、1つまたはそれ以上のフィールドタイプおよびフィールド値に基づいて所定のロケーションフィールドを他のあらゆるロケーションフィールドに結合することによって計算される。
疎行列はロケーション、ターム値のフィールドタイプおよび重みおよびタームトークンを含み、下記の段落に記述するように生成される。
行列は、全てのフィールド値およびトークン化されたフィールド値の文書出現頻度逆数を含んで生成され、かつある実施形態では9個のディメンションを網羅する。ある特定の実施形態では、これらの9個のディメンションは、加盟店カテゴリコード、インターバンクカード協会(ICA)コード、事業領域、加盟店名、加盟店電話番号、アクワイアリング加盟店ID、ティア加盟店ID、加盟店の正式名称および連邦税IDを含む。これらのディメンションは、全ての加盟店ロケーションレコードに包含される。文書出現頻度の逆数は、レコード数を特定の値を含むレコードの数で除算した商の(ある特定の実施形態では2を底とする)対数である。一例を表1に示す。ある実施形態において、この商は、9個のディメンションの各々について別々に計算される。レコードの数は、加盟店ロケーションの数として計算される。特定のタームを含むレコードの数は、各フィールドタイプ内に各タームを含む加盟店ロケーションの数を計数することによって計算される。
Figure 2011508353
各ロケーション毎に、表2に示すような、クロス属性正規化ターム出現頻度−文書出現頻度二重逆数重みが9個のディメンションを網羅する値およびトークン化された値について計算される。この場合も、9個のディメンションは加盟店カテゴリコード、ICAコード、事業領域、加盟店名、加盟店電話番号、アクワイアリング加盟店ID、ティア加盟店ID、加盟店の正式名称および連邦税IDを含む。
Figure 2011508353
所定のロケーションに関するグループメンバーシップ予測および信頼度は、予測すべきロケーションをフィールドタイプおよびフィールド値上の他の全てのロケーションへ結合し、次いで共通するフィールドタイプおよびフィールド値に関してターム出現頻度−文書出現頻度二重/逆数重みの積を合計することによって計算される。ロケーション結果は次に結果スコアの降順にソートされ、最も高いスコアを有する例えば13件のロケーション間で発生するモードグループが予測として与えられる。この予測の信頼スコアは、上位13件のロケーションのうちで同一のグループ(予測された値)を含んでいたロケーションの数、予測されたグループに属するk件のロケーションの個々の重みおよびこれらの重み間の分散によって表される。
文書予測としての集合ロケーション(アルゴリズム204)
図8A−8Bは、文書内の集合へ分類系として集合化されたロケーションを示すダイアグラム300である。集合ロケーションの文書を生成するアルゴリズム204(図4に示す)は、インターネット検索エンジンによって一般に使用される文書関連性アルゴリズムに類似するものである。具体的には、加盟店ロケーションの各集合体またはコレクションに対する所定の加盟店ロケーションの関連性は、下記のようにして計算される。
文書302を生成するためには、例えば住所である関連特徴が複数のロケーション304に関するデータベースのデータから抽出されて集合に、例えば集合306にグルーピングされる。説明を目的として、ダイアグラム300は、4つのロケーション集合306、308、310および312を含んでいる。集合312は集合Mとラベリングされているが、これは、特定の実施において、集合の数は図示されている4つより多い、または少ない場合があることを示す。同様に、1集合内のロケーションの数も1から「N」まで変わる可能性がある。
各々が抽出された関連する特徴を含む生成された文書302、320、322および324は、辞書330に集められる。辞書330を利用して疎行列340が形成され、これにより、抽出された特徴を使用して、各集合加盟店グループ毎にターム出現頻度および文書出現頻度逆数の少なくとも一方に基づいて、各フィールド値およびトークン化されたフィールド値の関連性が計算される。
疎行列340内では、ロケーションレベルの重みの行列が、フィールドタイプおよびフィールド値に基づいて加盟店グループの重みの行列に結合される。ある実施形態では、これらの重みの和が関連性エンジン350によって利用され、各ロケーションの各加盟店グループに対する関連性が決定される。関連性が最も高い加盟店グループは、先に述べた予測値として返される。より具体的には、グループ、フィールドタイプおよびタームルールおよびタームトークンの重みから成る疎行列は、次の段落で説明するようにして生成される。
まず、全ての加盟店ロケーションレコードに亘り、本明細書において別段で列挙した9個のディメンション、具体的には加盟店カテゴリコード、ICAコード、事業領域、加盟店名、加盟店電話番号、アクワイアリング加盟店ID、ティア加盟店ID、加盟店の正式名称および連邦税IDを網羅する全てのフィールド値およびトークン化されたフィールド値の文書頻度の逆数を含む行列が生成される。
文書予測アルゴリズムとしての集合ロケーションに関して、かつ表3に示すように、文書頻度の逆数は、比率、即ち特定の値を含むレコードの数で除算されたレコードの数の対数(ある特定の実施形態では2を底とする)である。ある実施形態では、文書頻度の逆数は9個のディメンションの各々について別々に計算される。レコードの数は、加盟店ロケーションの数として計算される。特定のタームを含むレコードの数は、各フィールドタイプ内の各タームを含む加盟店ロケーションの数を計数することによって計算される。
Figure 2011508353
各グループ毎に、かつ各グループに属する全てのロケーション毎に、表4に示すように、加盟店カテゴリコード、ICAコード、事業領域、加盟店名、加盟店電話番号、アクワイアリング加盟店ID、ティア加盟店ID、加盟店の正式名称および連邦税IDである9個のディメンションを網羅する値およびトークン化された値について、クロス属性正規化ターム出現頻度−文書頻度の二重逆数が計算される。
Figure 2011508353
所定のロケーションに関する1つのグループメンバーシップ予測は、先に説明した(k件の)類似ロケーション行列からの行をフィールドタイプおよびフィールド値上のグループ行列に結合し、次いで共通のフィールドタイプおよびフィールド値のターム出現頻度−文書頻度の二重逆数の重みの積を合計することによって計算される。予測されるグループおよび信頼スコアは、最も高い類似性スコア(一致するフィールド値およびトークン化された値の重みの積の和によって与えられる)を有するグループである。結果的に生じるスコアは、この予測の信頼性である。
第三者データ予測とロケーション照合(アルゴリズム206)
アンサンブル予測の第3のコンポーネントは、加盟店ロケーションによって金融取引のデータベースに照合されたことのある第三者提供データを使用するアルゴリズム206(図4に示す)である。ある実施形態では、これらの第三者レコードに、例えば売り手に関するチェーンIDが割り当てられる。これらのチェーンIDは、金融取引カードブランド(例えば、カード発行者)に関連づけられる加盟店ロケーションのグループにリンクされる。従って、予測は単に、第三者レコードがリンクされているチェーンに対応する加盟店データのグルーピングになる。このリンク付けは、次の段落で説明するようにロケーション照合に続いて発生する。
ロケーションが(売り手によって)チェーンへ割り当てられている場合、加盟店ロケーションのデータセットは第三者データプロバイダから抽出される。第三者加盟店ロケーションのスペース内の各チェーンは、対応する適切なグループへ割り当てられる。近似加盟店ロケーション照合エンジンは、第三者加盟店ロケーションレコードの集合をカード発行者により保持される加盟店ロケーションレコードの集合へ結合するために使用される。次に、所定のロケーションに関する予測グループが、カード発行者の加盟店ロケーションレコードに一致した第三者ロケーションレコードに対応するチェーンに相当するグループとして計算される。信頼スコアは、近似加盟店ロケーション照合エンジンによって割り当てられる照合信頼スコアである。
数値サイン予測(アルゴリズム208)
ある実施形態において、加盟店数値サインアルゴリズム208(図4に示す)は、第1の位置における一日当たりの取引額および取引量の数表示分布に関する観察を使用する。具体的に言えば、この分布は、様々な加盟店データが集合される際には幾分か一意になる傾向がある。さらに、この分布は、自然データにおいてベンフォードの法則が提案する分布に合致している傾向がある。実世界の例では、ファーストフードレストランのチェーンは、取引額の最初の数字として特定の数字を繰返し現出させる傾向を示すことがある。このような傾向は少なくとも部分的に、例えば、ファーストフードレストランチェーンのフランチャイズ加盟店がある特定のロケーションまたは住所に存在することを確認するために利用され得る。
このようなアルゴリズムを利用する予測の一例は、各加盟店集合(加盟店データのグルーピング)からの加盟店ロケーションのランダムな10パーセントサンプルである。加盟店集合毎に、第1の位置の取引額および取引量において発生する数字1−9の分布が計算されかつ集約され、この分布と、ベンフォードの法則により識別される分布との間の角距離が計算される。
次には、所定の加盟店ロケーションについて、第1の位置の取引額および取引量において発生する数字1−9の分布が計算され、この分布と、ベンフォードの法則により識別される分布との間の角距離が計算される。加盟店ロケーションの角距離に最も近い角距離を有する加盟店集合は、その所定のロケーションの加盟店集合予測として与えられる。
より具体的には、かつ各グループ毎に、取引計数、取引額および平均取引額の間における、グループ内の全てのロケーションを網羅する各数字(即ち、1、2、3、4、5、6、7、8、9)の出現頻度の分布が計算され、全体に対する比率として表される。前記分布は次に、表に格納される。表5は、これを表したものである。
Figure 2011508353
各グループに関する分布が計算されると、各グループに関する数値サインが、このグループの分布ベクトルとベンフォードの法則が提案する分布ベクトルとのドット積を計算することによって決定される。このドット積(発散角度)は、各グループの分布ベクトルの平方和によって除算される。ベンフォードの法則において識別される分布が計算され、表に格納される。表6は、これを表したものである。
Figure 2011508353
各ロケーション毎に、所定のロケーションに関して1か月の期間内に観察された取引計数、取引額および平均取引額を網羅する各数字(1、2、3、4、5、6、7、8、9)の出現頻度の分布が計算され、全体に対する比率として表される。これらの分布は次に表に格納され、表7はこれを表す。
Figure 2011508353
各ロケーションに関する分布が計算されると、各ロケーションに関する数値サインが、このロケーションの分布ベクトルとベンフォードの法則が提案する分布ベクトルとのドット積を計算することによって決定される。このドット積(発散角度)は、各ロケーションの分布ベクトルの平方和によって除算され、かつベンフォードの法則において識別される分布が計算され、表に格納される。表8は、これを表したものである。
Figure 2011508353
次に、所定のロケーションに関するグループメンバーシップ予測が、この所定のロケーションの数値サインに最も近い数値サインを有するグループを見つけることによって計算され、信頼スコアがこれらの2サイン間の距離として計算される。
統計モデルとスコアリング
図5に関連して先に述べたように、4つの予測アルゴリズム(202、204、206および208)からの各予測値は、222において、各予測の環境を記述する豊富なメタデータ集合と共に集められ、Oracleデータマイニング(ODM)アプリケーション224へ入力される。ODMアプリケーション224は、ある実施形態では、ラベリングされたトレーニングデータを使用して構築される統計モデル(決定木)を利用して各予測値へ信頼スコアを割り当てる。次には、最も高い信頼スコアを有する予測値が各加盟店ロケーションの最終的な集合値予測として提供される。
近似文字列照合
先に述べたように、アンサンブル予測の1つのコンポーネントは、例えば金融取引カード提携加盟店ロケーションのデータベースへ照合されているロケーションデータを使用するアルゴリズムである。幾つかのデータは、第三者ソースによって提供されてもよい。後述の実施形態は、データベース内のデータについて近似列(例えば、文字列)照合を検索するための方法およびシステムに関する。この実施形態では、文字列照合を利用して、例えばあるロケーションを表す文字列がそのデータベースにおいて別の文字列によって表されているかどうかが決定される。このようなアルゴリズムは、取引レコードにおいて発生する変形に起因して、特にこれらのレコードは加盟店の名称およびロケーションに関連することから、様々な実施形態において適切である。
近似文字列照合のデータベースシステムは、正確に一致する、または共通のフィールド値等の共通の結合キーがデータ内に存在しない場合に、1つのレコード集合を別のレコード集合へ結合するように動作可能である。おそらくは、これらのレコード集合には幾分かの類似性が存在する。
典型的には、2つのデータセットが1つのデータベース内で結合されると、これらは1つまたは複数のフィールドで正確な値を共有する。データ内の変形に起因して2つのデータソース(レコード集合)によって正確なフィールド値が共有されない場合、個々のデータソースからのデータセットを結合する伝統的な方法は、2つの値を取って、そこでその類似性を計算してリターンするという機能を実装することである。データセットを結合する基準として、このタイプの機能の使用することは、結合されるべき各データセット内のレコードの数の積に等しい反復回数を必要とする。
一例として、データセットA内に10,000件のレコードが存在しかつデータセットB内に500,000件のレコードが存在すれば、類似性計算機能はデータセットAをデータセットBへ結合するために50億回呼び出されることになる。さらに、このような機能が呼び出される場合、指数または機能ベース指数はデータベースオプティマイザによって使用されなくなる。このタイプのデータセットは非常に非効率的であって、自明でないデータ量を有するデータセットの結合に使用するにはあまりに処理が集約的に過ぎる。
文字列照合技術は、様々な実施形態において下記のコンポーネントのうちの1つまたはそれ以上を利用して実装されるものが開発されている。具体的には、主成分因子分析(PCFA)を使用して生成される結合基準において参照文字列集合が使用される。PCFAは、既知の値のスペース内に存在する極めて異種である文字列集合を識別しようとするものであり、前記文字列集合は参照文字列として使用される。
別のコンポーネントは、リレーショナルデータベース管理システム(RDBMS)におけるパフォーマンスを最大化するために純粋なASCII構造化問合せ言語(SQL)に実装されるnグラム頻度類似性計算である。さらに、RDBMSには、nグラム頻度類似性計算を使用して2進キーを形成するためのプロセスも実装される。2進キーは、後述するように、PCFAにおいて識別された参照文字列の各々に対する所定のレコードの類似性を示す。
ある実施形態では、全てのnグラムの文書頻度逆数(IDF)を含むテーブルおよびクロス属性加重ターム出現頻度/文書頻度逆数(TF/IDF)計算のSQL実装であるとして、RDBMS内でデータ駆動標準化機能セットが実装される。
文字列照合技術の一実施形態は、同じ2進キー値を共有するレコードを結合し、次いで全ての一致するnグラムのTF/IDFの重みの積を合計することによってこれらを関連性毎にソートするパラメータ化された分析SQLクエリを含む。そのレコードが所定のしきい値より上でi番目の参照文字列に一致すれば、2進キーにおけるi番目のビットは論理1に設定される。
RDBMS内では、結合により生じる各照合へ信頼スコアを割り当てるように、プロセスが実装され、同時に、データセットの結合において取り込まれるデータを格納するRDBMSデータモデルも包含される。
データセット結合問題の1つのシンプルなものとしては、1つの名称(または住所)を、Oracleテーブル等のデータベース内に含まれる名称(または住所)のより大きい集合に対して照合することである。このnグラム照合の一例を表9に示す。
Figure 2011508353
データセット結合のソリューションに必要とされるエレメントは、文字列間の任意の類似性を測定するためのメトリックである。nグラムは単にn文字より成る一意の文字列であり、nグラム照合は、nグラム間の照合を決定するためのプロセスである。nが2に等しい事例では、表1における住所候補は下記の各2グラム、即ち「10」、「00」、「01」、「14」、「4<スペース>」、「<スペース>S」、「S<スペース>」、「<スペース>C」、「Cl」、「la」、...、「Rd」から成る。
表10は、nグラム照合アルゴリズムを要約したものである。これは、文字列候補(例えば、Candidate_array)のnグラム頻度ベクトルを決定することと、照合データベース候補(例えば、Candidate_Match_Array)における各エントリのnグラム頻度ベクトルを決定することと、前記Candidate_arrayと前記Candidate_Match_Arrayとの間の類似性の度合いを測定することと、特定のしきい値を超える照合候補を保持することを含む。例えば、「JoJo’s Diner」は下表のようになる。
Figure 2011508353
表11、表12および表13は、nグラム照合メトリックの例である。「内積」はアレイのドット積であり、「大きさ」は平方和の平方根であり、「(角度の)余弦」は大きさの積で除算されたドット積であり、角度は大きさの積で除算されたドット積の逆余弦である。
Figure 2011508353
Figure 2011508353
Figure 2011508353
参照文字列
上記表および記述は、文字列を量的に表現しかつこれらの間の類似性を測定する能力を示している。この時点で、各レコードの指数は、参照文字列の小集合に対するその相対位置に基づいて構築され得る。
参照文字列を選ぶことにより、参照文字列の各々に対する新しいレコードの相対位置を計算することができる。さらに、データベース内のあらゆるレコードは、参照文字列に対するその固有の予め計算された位置を有する。従って、新しいレコードとデータベース全体との間の完全な類似性メトリックを計算する必要なしに、同じ近接性で指数が付けられたレコードを検索することによって近似照合を見つけることができる。参照文字列を選択する1つの目的は、異種であるレコードを選ぶことであり、こうしてより良い見通しが得られる。次の段落では、参照文字列選択の1つの手法を概説する。
参照文字列は、指数付けされているデータベースから文字列のサンプルをとることによって識別される。サンプル内の各文字列のnグラム表現は、頻度のベクトルを生成することによって生成される。但し、ベクトルのi番目の成分は、その文字列においてnグラムが発生した回数を含む。類似性行列は、余弦類似性メトリックを使用してあらゆるサンプル文字列ペア間の類似性を測定することにより生成される。
類似性データのコレクションにおいて異種成分を見つけるための1つの技術が、主成分分析である。主成分分析は類似性行列に対して実行され、最初のk個の主成分が保持される。各成分上の最大負荷を有するサンプル文字列が保持され、参照文字列集合が形成される。
2進指数および情報検索
指数を生成できるように類似する文字列をグループに纏め、近似文字列照合の間に高速検索候補を提供するために、潜在的な各レコード候補および各比較レコードがnグラム頻度類似性SQL計算を使用して参照文字列の各々と比較される。
類似性計算が予め定義されたしきい値より高いスコアを産生すれば、参照文字列に対応する2進キーの位置に値1が割り当てられる。スコアがしきい値より低ければ、対応するキー位置に0が割り当てられる。
NGRAM類似性計算
所定の2つの文字列内に存在する全ての一意のN−GRAMSの出現頻度を含む二次元ベクトルを形成するSQLクエリが開発されている。このクエリは、次に、各頻度積の合計を頻度ベクトルの各ディメンションの大きさの平方で割って、正規化された類似性メトリックに到達する。
このような計算は、次の例、即ち比較文字列Aが「MASTERCARD」であり、かつ比較文字列Bが「MASTERCHARGE」である例によって表される。下表、表14は、2つの比較文字列内に存在するあらゆる一意のnグラムの出現頻度を含む二次元ベクトルである。
Figure 2011508353
文字列Aの大きさは、ディメンションAにおける各頻度値の平方和の平方根として計算され、具体的には、文字列Aの大きさは3.0である。文字列Bの大きさは、ディメンションBにおける各頻度値の平方和の平方根として計算され、具体的には、大きさBは3.3166247903554である。ベクトルのドット積が計算され、この例の場合、ドット積は7.0(AおよびBの双方が値1を有する表エントリの数)である。類似性はドット積/(大きさAx大きさB)として、即ちこの例示的な例では0.703526470681448として計算される。
2進キー値の形成
類似性計算が予め定義されたしきい値より高いスコアを産生すれば、参照文字列に対応する2進キーの位置に値1が割り当てられる。スコアがしきい値より低ければ、対応するキー位置に0が割り当てられる。ある実施形態において、2進キー位置を決定するためのプロセスは、SQLおよびPL/SQLの組合せを使用して実装される。このアルゴリズムの実装は、アルゴリズム内の以前の反復においてその正確な値に関する2進キー値が計算されていれば所定の文字列に2進キー値を自動的に割り当てるように、分析的構造化問合せ言語を使用することにより、必要とされる文字列比較計算の数を最小化する。この最適化は、SQLで達成される。
一意の識別子および各2進キー値は、RDBMS内の仕切られた索引構成表(IOT)に格納される。一意のデータセットは各々単一のパーティション内に格納され、2つのデータセットが同じパーティションを共有することはない。ロードパフォーマンスを最大化するために、この表への各データセットのロードは、create table as select(CTAS)およびパーティション交換を使用して達成される。各パーティション内のデータは、結合パフォーマンスを最大化するために2進キー値順に格納される。
データの標準化
類似性比較および2進キー値分布の精度を高めるために、ある実施形態では、データが既知の略語および同義語について標準化される。このようなデータ標準化を達成するために、様々なフィールドタイプに関して全ての既知の変形および同義語をその個々の標準表現と共に含むテーブルが生成される。次に、アルゴリズムは各データエレメントをトークン化しかつ任意の既知の変形または同義語をその標準形式にマップするように作動する。
IDFテーブル
近似照合結合に関与するフィールド内に存在する全てのnグラムについて加重TF/IDFを計算する際のパフォーマンスをより高速にするために、レコード候補のスペース内に存在する全ての2文字nグラムの文書頻度逆数を含むテーブルが構築される。スペース内の全てのnグラムの形成はPL/SQLを介して達成されるが、IDFの計算はASCII SQLで行われる。IDFテーブルは、各データカテゴリの可能なnグラムの各々についてIDF値を格納する。このテーブルは、結合パフォーマンスを最大化するために、データカテゴリおよびnグラムに従って索引構成される。
クロス属性加重TF/IDF
近似照合結合に関与するフィールド毎に、所定のレコード内に存在する2文字nグラムの各々へ重みまたは重大さを割り当てるために、各nグラム値についてクロス属性加重ターム出現頻度/文書頻度逆数TF/IDF値が計算される。nグラムタームおよび所定の各レコードおよびフィールド内でのその個々の出現頻度は、入力としてREF_CURSORをとるパイプライン表関数を使用して計算される。この計算は、伝統的な加重TF/IDF計算とは僅かに異なり、各フィールド内の各nグラムについてTF/IDFを計算した後に、各フィールド内の全てのnグラムの重みを同じレコードの他のフィールド内に存在するnグラムの全体の重みに従って上下に調整する。この技術により、各フィールド内の値の全体的な重大さに従った照合nグラムの相対的重みに対するレコードレベルの動的調整が生じる。
先に述べたように、所定のデータセット内の各レコードの一意の識別子は、結合パフォーマンスを最大化するために、そのnグラムタームおよび計算された重みスコアと共に仕切られた索引構成表(IOT)に格納される。このテーブルは、一意の識別子、データカテゴリおよびnグラムターム値に従って編成される。一意のデータセットは各々、テーブル内の別々のパーティション内に格納される。各パーティションは、ロードパフォーマンスを最大化するためにcreate table as selectおよびパーティション交換を使用してロードされる。
結合クエリ
2進キーおよびクロス属性TF/IDF計算がRDBMSへロードされると、分析的な結合クエリを使用して全ての照合レコード候補が検索され、かつ比較レコードに照らしたその関連性または照合品質に従ってソートされる。これは、まず一致する2進キー値を有するレコードを結合し、次に結果的に生じるレコード候補のnグラム値を結合しかつこれらの重みの積の合計を計算することによって達成される。
信頼スコアの割当て
結合クエリの結果は、各入力およびレコード候補に対して超低レベル比較を実行し、次いで先に述べたOracleデータマイニングアプリケーションに使用するための統計モデルを使用して信頼スコアを割り当てるRDBMS内に実装された関数を介して送信される。
近似文字列照合に関連づけられる上述のプロセスを、さらに図9および図10に示す。図9および図10は各々、参照文字列集合の決定を示し、かつ文字列候補の類似性メトリックを決定するための参照文字列集合の利用を示すフローチャート400および450である。各成分上の最大ローディングを有するサンプル文字列は、参照文字列集合を形成するために保持される。これらのサンプル文字列は、相関目的で主成分を表している。類似性メトリックは、文字列候補と決定された参照文字列集合内の個々の文字列との比較における幾つかの一致するnグラムに基づいている。
具体的には、かつ図9を参照すると、データベースは潜在的照合候補データのスペース402を含む。このスペース402は、本明細書において文字列のデータベース(即ち、加盟店の名称および/またはロケーションデータ)と称することがある。本明細書で記述しているように、404において、照合フィールドまたはデータベースレコードのランダムなサンプルが、例えば異種文字列集合の最適化探索に基づいて生成される。406において、類似性行列が計算され、かつ408において主成分因子分析が適用され、その結果主成分410が生じ、その各々は対応する参照文字列を参照する。この参照文字列集合は、この集合が具体的には異種データを包含するように生成されることから、文字列候補に対する比較に有益である。
次に、図10を参照すると、452において、文字列候補を受信した時点で、各文字列候補と各主成分に関連づけられる参照文字列との間の類似性が計算される。本明細書で記述しているように、このような比較はnグラム照合アルゴリズムに基づく場合もあり、よって、454において、文字列候補の各参照文字列およびその対応する主成分に対する類似性を示す2進キーが生成される。456では、高速かつ効率的な近似文字列照合のために、レコード(参照文字列)がその個々の2進キーレコードの比較に基づいて文字列候補へ結合される。このようなプロセスは、ユーザが参照文字列(加盟店の名称および/またはロケーションデータを含んでもよい)と加盟店の名称および/またはロケーションデータを表す場合もある文字列候補との間の高確率照合を迅速に検索することを可能にする。458において、照合されるべき各データベースレコードの2進キーを生成することにより、460では、参照文字列の文字列候補に対する照合ファイルを生成することができる。
以上、様々な特有の実施形態に関して本発明を説明したが、当業者には、本発明をクレームの精神および範囲内にある変形によって実施し得ることが認識されるであろう。

Claims (32)

  1. 取引データ内で加盟店のグループメンバーシップを決定するために金融取引カードの取引データにおけるパターンを見つけるためのコンピュータベースの方法であって、前記データは、支払いに金融取引カードを受け入れている加盟店に関連し、前記方法は、
    少なくとも1つのデータベースから取引データを受信するステップと、
    少なくとも1つの予測アルゴリズムおよび前記回収される取引データを使用してグループ内の加盟店のメンバーシップを予測するステップであって、前記アルゴリズムは前記予測を記述するメタデータを生成するステップと、
    前記少なくとも1つの予測されるグループメンバーシップおよび前記メタデータをデータマイニングアプリケーションへ入力するステップと、
    前記データマイニングアプリケーションにより、前記予測されるグループメンバーシップおよび前記メタデータを利用して、予測される各グループメンバーシップへ信頼値を割り当てるステップと、を含むコンピュータベースの方法。
  2. グループ内の加盟店のメンバーシップを予測するステップは、前記少なくとも1つのデータベースからグループメンバーシップを導出するコンテキストにおいて有意義であるデータベースフィールド集合を識別することを含む、請求項1記載のコンピュータベースの方法。
  3. 所定のロケーションから所定の距離内に存在する幾つかの加盟店ロケーションについて、前記少なくとも1つのデータベース内の加盟店ロケーションデータを探索するステップであって、ロケーションおよび距離は、前記データベース内のフィールド値およびトークン化されたフィールド値についてクロス属性加重ターム出現頻度/文書出現頻度逆数(TF/IDF)により測定される類似性に基づくステップと、
    前記加盟店ロケーションデータを、所定のロケーションから所定の距離内に存在する加盟店ロケーションの類似性について探索し、新しい加盟店ロケーションおよび変更された加盟店ロケーションの少なくとも一方を決定するステップと、
    前記所定のロケーションから前記所定の距離内に発生する前記加盟店ロケーションの分類を介してモード値を計算するステップと、
    最も高頻度で発生するモード値をグループメンバーシップ予測として返すステップとをさらに含む、請求項2記載のコンピュータベースの方法。
  4. グループ内の加盟店のメンバーシップを予測するステップは、
    前記データベース内の少なくとも1つのフィールドをトークン化するステップと、
    前記データベース内のトークン化された全てのフィールド値について文書出現頻度の逆数を計算するステップと、
    各データベースフィールド値およびトークン化された各データベースフィールド値について重みメトリックの疎行列を計算するステップと、
    前記疎行列を使用して、フィールドタイプおよびフィールド値のうちの一方またはそれ以上に基づいて所定のデータベースフィールドロケーションを他の全てのデータベースフィールドロケーションへ結合することにより予測を生成するステップと、を含む、請求項1記載のコンピュータベースの方法。
  5. 前記疎行列は、加盟店カテゴリコードと、インターバンクカード協会(ICA)コードと、事業領域と、加盟店名と、加盟店電話番号と、アクワイアリング加盟店IDと、ティア加盟店IDと、加盟店の正式名称と、連邦税IDとを含む、請求項4記載のコンピュータベースの方法。
  6. グループ内の加盟店のメンバーシップを予測するステップは、加盟店ロケーション集合に対する単一の加盟店ロケーションの関連性を計算するステップを含み、ロケーションは計算された類似性に基づき、前記類似性は前記データベース内のフィールド値およびトークン化されたフィールド値に基づく、請求項1記載のコンピュータベースの方法。
  7. 加盟店ロケーション集合に対する単一の加盟店ロケーションの関連性を計算するステップは、
    集合にグループ化された複数の加盟店ロケーションから関連特徴を抽出して各集合について文書を生成するステップと、
    前記生成される文書を1つの辞書内に集めるステップと、
    前記辞書を利用して疎行列を形成するステップであって、これにより、ターム出現頻度および文書出現頻度の逆数の少なくとも一方に基づいて抽出される関連特徴を利用して、前記生成される文書内の各フィールド値とトークン化されたフィールド値との関連性が計算されるステップと、
    前記疎行列内のフィールドタイプおよびフィールド値に基づいて、加盟店ロケーションレベルの重みの行列を加盟店グループの重みの行列へ結合するステップと、を含む、請求項6記載のコンピュータベースの方法。
  8. 関連性エンジン内で前記加盟店ロケーションレベルの重みと前記加盟店グループの重みとの和を利用して、各加盟店ロケーション集合に対する各加盟店ロケーションの関連性を決定するステップと、
    最も高い関連性を有する前記加盟店ロケーション集合を予測として出力するステップとをさらに含む、請求項7記載のコンピュータベースの方法。
  9. 前記疎行列を形成するステップは、加盟店カテゴリコードと、インターバンクカード協会(ICA)コードと、事業領域と、加盟店名と、加盟店電話番号と、アクワイアリング加盟店IDと、ティア加盟店IDと、加盟店の正式名称と、連邦税IDとを含む、請求項7記載のコンピュータベースの方法。
  10. グループ内の加盟店のメンバーシップを予測するステップは、加盟店ロケーションによって金融取引カード取引のデータベースに照合されたことのある第三者提供データを利用することを含み、ロケーションは計算される類似性に基づき、前記類似性は前記データベース内のフィールド値およびトークン化されたフィールド値に基づく、請求項1記載のコンピュータベースの方法。
  11. グループ内の加盟店のメンバーシップを予測するステップは、
    金融取引カードブランド加盟店ロケーションデータのデータベースに照合されたことのある第三者ロケーションデータを使用するステップであって、ロケーションは計算される類似性に基づき、前記類似性は前記データベース内のフィールド値およびトークン化されたフィールド値に基づき、前記第三者ロケーションデータは割り当てられたチェーンIDを含むステップと、
    前記チェーンIDを前記金融取引カードブランドに関連づけられる加盟店ロケーションへリンクするステップと、を含む、請求項1記載のコンピュータベースの方法。
  12. グループ内の加盟店のメンバーシップを予測するステップは、
    近似加盟店ロケーション照合エンジンを使用して、第三者加盟店レコード集合を前記少なくとも1つのデータベース内の加盟店レコード集合へ結合するステップと、
    所定のロケーションの予測グループを、前記所定のロケーションの結合された集合に対応する加盟店グループとして計算するステップとを含み、
    予測された各グループメンバーシップへ信頼スコアを割り当てるステップは、前記近似加盟店ロケーション照合エンジンによって割り当てられる照合信頼スコアを割り当てるステップを含む、請求項1記載のコンピュータベースの方法。
  13. グループ内の加盟店のメンバーシップを予測するステップは、数値サインアルゴリズムおよび同じグループに属する加盟店はある分布から比較的一様に拡散するという観察済みの傾向を使用して、各加盟店ロケーションに比べて類似する数値分布を有するロケーショングループを予測するステップを含み、ロケーションは計算される類似性に基づき、前記類似性は前記データベース内のフィールド値およびトークン化されたフィールド値に基づく、請求項1記載のコンピュータベースの方法。
  14. グループ内の加盟店のメンバーシップを予測するステップは、
    前記少なくとも1つのデータベース内の加盟店データのグルーピングから加盟店データをランダムにサンプリングするステップと、
    取引額の第1の位置において発生する数字1、2、3、4、5、6、7、8および9の分布を計算するステップと、
    取引量を加盟店グルーピング毎に纏めるステップと、を含む、請求項1記載のコンピュータベースの方法。
  15. 前記計算される数値分布とベンフォードの法則により識別される数値分布との間の角距離を計算するステップと、
    前記計算される角距離に最も近い角距離を有する加盟店グルーピングを前記サンプリングされる加盟店に関する加盟店グルーピング予測として出力するステップとをさらに含む、請求項14記載のコンピュータベースの方法。
  16. 少なくとも1つの予測アルゴリズムおよび前記回収される取引データを使用してグループ内の加盟店のメンバーシップを予測するステップは、複数の予測アルゴリズムを利用して1つの加盟店に対して複数のメンバーシップ予測を提供するステップを含む、請求項1記載のコンピュータベースの方法。
  17. 予測される各グループメンバーシップへ信頼スコアを割り当てるステップは、
    1つの加盟店に対する前記複数のメンバーシップ予測の各々へ信頼スコアを割り当てるステップと、
    最も高い信頼スコアを有するメンバーシップ予測を前記加盟店の最終的なメンバーシップ予測として提供するステップとを含む、請求項16記載のコンピュータベースの方法。
  18. 前記グループメンバーシップは、法律上の所有権、ブランドおよびチェーンのうちの1つまたはそれ以上に基づくメンバーシップを含む、請求項1記載のコンピュータベースの方法。
  19. 取引データを使用して、個々の加盟店のグループメンバーシップを決定するために金融取引カードの取引データにおけるパターンを見つけるためのコンピュータシステムであって、前記コンピュータは、
    前記取引データを使用して、各々が前記取引データに基づいて加盟店のグループメンバーシップを予測する複数の予測アルゴリズムを実行し、
    予測される各グループメンバーシップへ信頼スコアを割り当て、かつ、
    最も高い信頼スコアを有するグループメンバーシップ予測を前記加盟店の最終的なメンバーシップ予測として出力するようにプログラムされるコンピュータシステム。
  20. 前記アルゴリズムのうちの少なくとも1つは、前記取引データ内で、グループメンバーシップの導出に有意義であるデータベースフィールド集合を識別するように動作可能である、請求項19記載のコンピュータシステム。
  21. 前記アルゴリズムのうちの少なくとも1つは、
    所定のロケーションから所定の距離内に存在する幾つかの加盟店ロケーションについて、前記取引データ内の加盟店ロケーションデータを探索し、
    前記所定のロケーションから前記所定の距離内で発生する加盟店ロケーションの分類を介してモード値を計算し、かつ、
    最も高頻度で発生するモード値をグループメンバーシップ予測として返すように動作可能であり、ロケーションおよび距離は計算される類似性に基づき、前記類似性は前記データベース内のフィールド値およびトークン化されたフィールド値に基づく、請求項20記載のコンピュータシステム。
  22. 前記取引データを使用して複数の予測アルゴリズムを実行するために、前記アルゴリズムのうちの少なくとも1つは、
    前記データベース内の少なくとも1つのフィールドをトークン化し、
    前記データベース内のトークン化された全てのデータベースフィールド値について文書出現頻度の逆数を計算し、
    各データベースフィールド値およびトークン化された各データベースフィールド値について重みメトリックの疎行列を生成し、かつ、
    前記疎行列におけるフィールドタイプおよびフィールド値のうちの1つまたはそれ以上に基づいて所定のデータベースフィールドロケーションを他の全てのデータベースフィールドロケーションへ結合することにより予測を計算するように動作可能である、請求項19記載のコンピュータシステム。
  23. 前記取引データを使用して複数の予測アルゴリズムを実行するために、前記コンピュータシステムは、前記取引データ内の加盟店ロケーション集合に対する単一の加盟店ロケーションの関連性を計算するようにプログラムされ、ロケーションは計算される類似性に基づき、前記類似性は前記データベース内のフィールド値およびトークン化されたフィールド値に基づく、請求項19記載のコンピュータシステム。
  24. 前記取引データ内の加盟店ロケーション集合に対する単一の加盟店ロケーションの関連性を計算するために、前記コンピュータシステムは、
    集合にグループ化された複数の加盟店ロケーションから関連特徴を抽出して各集合について文書を生成し、
    前記生成される文書を1つの辞書内に集め、かつ、
    前記辞書を利用して疎行列を形成するように動作可能であって、これにより、ターム出現頻度および文書出現頻度の逆数の少なくとも一方に基づいて抽出される関連特徴を利用して、前記生成される文書内の各フィールド値とトークン化されたフィールド値との関連性が計算され、かつ前記コンピュータシステムは、
    前記疎行列内のフィールドタイプおよびフィールド値に基づいて、加盟店ロケーションレベルの重みの行列を加盟店グループの重みの行列へ結合するように動作可能である、請求項23記載のコンピュータシステム。
  25. 加盟店ロケーションデータの各集合について値を決定するために、前記コンピュータシステムは、関連性エンジン内の重みの合計を利用して加盟店グループに対する各ロケーションの関連性を決定するようにプログラムされる、請求項24記載のコンピュータシステム。
  26. 前記コンピュータシステムは、
    関連性エンジン内の前記加盟店ロケーションレベルの重みと前記加盟店グループの重みとの合計を利用して加盟店ロケーションの各集合に対する各加盟店ロケーションの関連性を決定し、かつ、
    最も高い関連性を有する加盟店ロケーション集合を予測として出力するようにプログラムされる、請求項24記載のコンピュータシステム。
  27. 前記取引データを使用して複数の予測アルゴリズムを実行するために、前記コンピュータシステムは、加盟店ロケーションによって金融取引カード取引のデータベースに照合されたことのある第三者提供データを利用するようにプログラムされ、ロケーションは計算される類似性に基づき、前記類似性は前記データベース内のフィールド値およびトークン化されたフィールド値に基づく、請求項19記載のコンピュータシステム。
  28. ロケーションは計算される類似性に基づき、前記類似性は前記データベース内のフィールド値およびトークン化されたフィールド値に基づき、前記取引データを使用して複数の予測アルゴリズムを実行するために、前記コンピュータシステムは、
    金融取引カードブランド加盟店ロケーションデータのデータベースに照合されたことのある第三者ロケーションデータであって、割り当てられたチェーンIDを含む第三者ロケーションデータを使用し、かつ、
    前記チェーンIDを前記金融取引カードブランドに関連づけられる加盟店ロケーションデータへリンクするようにプログラムされる、請求項19記載のコンピュータシステム。
  29. ロケーションは計算される類似性に基づき、前記類似性は前記データベース内のフィールド値およびトークン化されたフィールド値に基づき、前記取引データを使用して複数の予測アルゴリズムを実行するために、前記コンピュータシステムは、
    近似加盟店ロケーション照合エンジンを使用して、第三者加盟店レコード集合を加盟店ロケーションレコード集合へ結合し、かつ
    所定のロケーションの予測グループを、前記所定のロケーションの結合された集合に対応する加盟店グループとして計算するようにプログラムされる、請求項19記載のコンピュータシステム。
  30. 前記近似加盟店ロケーション照合エンジンによって割り当てられる照合信頼スコアを割り当てるようにさらにプログラムされる、請求項29記載のコンピュータシステム。
  31. 前記取引データを使用して複数の予測アルゴリズムを実行するために、前記コンピュータシステムは、
    加盟店データのグルーピングから加盟店データをランダムにサンプリングし、
    前記取引データ内の取引額の第1の位置において発生する数字1、2、3、4、5、6、7、8および9の分布を計算し、かつ、
    取引量を加盟店グルーピング毎に纏めるようにプログラムされる、請求項19記載のコンピュータシステム。
  32. 前記計算される数値分布とベンフォードの法則により識別される数値分布との間の角距離を計算し、かつ、
    前記計算される角距離に最も近い角距離を有する加盟店グルーピングを前記サンプリングされる加盟店に関する加盟店グルーピング予測として出力するようにさらにプログラムされる、請求項31記載のコンピュータシステム。
JP2010541467A 2007-12-31 2008-12-04 アンサンブル加盟店予測システムを実装するための方法および装置 Expired - Fee Related JP5485911B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/967,490 US8738486B2 (en) 2007-12-31 2007-12-31 Methods and apparatus for implementing an ensemble merchant prediction system
US11/967,490 2007-12-31
PCT/US2008/085566 WO2009085554A1 (en) 2007-12-31 2008-12-04 Methods and apparatus for implementing an ensemble merchant prediction system

Publications (3)

Publication Number Publication Date
JP2011508353A true JP2011508353A (ja) 2011-03-10
JP2011508353A5 JP2011508353A5 (ja) 2012-01-26
JP5485911B2 JP5485911B2 (ja) 2014-05-07

Family

ID=40799626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010541467A Expired - Fee Related JP5485911B2 (ja) 2007-12-31 2008-12-04 アンサンブル加盟店予測システムを実装するための方法および装置

Country Status (10)

Country Link
US (1) US8738486B2 (ja)
EP (1) EP2240916A4 (ja)
JP (1) JP5485911B2 (ja)
KR (1) KR101468764B1 (ja)
AU (1) AU2008343492B2 (ja)
BR (1) BRPI0821420A2 (ja)
CA (1) CA2710752A1 (ja)
MX (1) MX2010007273A (ja)
RU (1) RU2510891C2 (ja)
WO (1) WO2009085554A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11790431B2 (en) 2015-12-11 2023-10-17 Mastercard International Incorporated Systems and methods for generating recommendations using a corpus of data

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8191766B2 (en) * 2008-03-04 2012-06-05 Mastercard International Incorporated Methods and systems for managing merchant identifiers
US10594870B2 (en) 2009-01-21 2020-03-17 Truaxis, Llc System and method for matching a savings opportunity using census data
US10504126B2 (en) * 2009-01-21 2019-12-10 Truaxis, Llc System and method of obtaining merchant sales information for marketing or sales teams
US9841282B2 (en) 2009-07-27 2017-12-12 Visa U.S.A. Inc. Successive offer communications with an offer recipient
US20110035280A1 (en) * 2009-08-04 2011-02-10 Visa U.S.A. Inc. Systems and Methods for Targeted Advertisement Delivery
US9342835B2 (en) 2009-10-09 2016-05-17 Visa U.S.A Systems and methods to deliver targeted advertisements to audience
US20110087547A1 (en) * 2009-10-09 2011-04-14 Visa U.S.A. Systems and Methods for Advertising Services Based on a Local Profile
US20110093324A1 (en) 2009-10-19 2011-04-21 Visa U.S.A. Inc. Systems and Methods to Provide Intelligent Analytics to Cardholders and Merchants
US10007915B2 (en) 2011-01-24 2018-06-26 Visa International Service Association Systems and methods to facilitate loyalty reward transactions
US9235654B1 (en) * 2012-02-06 2016-01-12 Google Inc. Query rewrites for generating auto-complete suggestions
US10339524B2 (en) * 2012-07-31 2019-07-02 Worldpay, Llc Systems and methods for multi-merchant tokenization
US10438269B2 (en) 2013-03-12 2019-10-08 Mastercard International Incorporated Systems and methods for recommending merchants
US10140664B2 (en) * 2013-03-14 2018-11-27 Palantir Technologies Inc. Resolving similar entities from a transaction database
US20150019394A1 (en) * 2013-07-11 2015-01-15 Mastercard International Incorporated Merchant information correction through transaction history or detail
US8938686B1 (en) 2013-10-03 2015-01-20 Palantir Technologies Inc. Systems and methods for analyzing performance of an entity
US10521866B2 (en) 2013-10-15 2019-12-31 Mastercard International Incorporated Systems and methods for associating related merchants
US11263646B1 (en) * 2014-03-31 2022-03-01 Groupon, Inc. Systems, apparatus, and methods of programmatically determining unique contacts
US20150287077A1 (en) * 2014-04-02 2015-10-08 Visa International Service Association Systems and methods to process offers based on merchant hierarchies
CN105590223A (zh) * 2014-12-29 2016-05-18 中国银联股份有限公司 商户的商圈信息的标定
US10387882B2 (en) * 2015-07-01 2019-08-20 Klarna Ab Method for using supervised model with physical store
US9904916B2 (en) 2015-07-01 2018-02-27 Klarna Ab Incremental login and authentication to user portal without username/password
US20170017806A1 (en) * 2015-07-14 2017-01-19 Mastercard International Incorporated Systems and methods for merging networks of heterogeneous data
CA2930705C (en) * 2015-08-27 2019-06-11 Samsung Pay, Inc. Mobile checkout systems and methods
US10715612B2 (en) * 2015-09-15 2020-07-14 Oath Inc. Identifying users' identity through tracking common activity
CN113535382A (zh) * 2016-12-23 2021-10-22 创新先进技术有限公司 资源处理方法及装置
EP3602350A4 (en) * 2017-03-19 2021-01-27 Ofek Eshkolot Research And Development Ltd. SYSTEM AND METHOD FOR GENERATING FILTERS FOR SEARCHING FOR K-MISAPPARATIONS
US10541881B2 (en) * 2017-12-14 2020-01-21 Disney Enterprises, Inc. Automated network supervision including detecting an anonymously administered node, identifying the administrator of the anonymously administered node, and registering the administrator and the anonymously administered node
CN109977982A (zh) * 2017-12-28 2019-07-05 北京京东尚科信息技术有限公司 用户分类方法、系统、电子设备及计算机可读介质
KR102021477B1 (ko) * 2017-12-29 2019-09-16 (주)케이나올 다매체 빅데이터 매칭 패턴 분석을 활용한 신용평가 기반의 선지급 예약 후상환 자동결제 서비스 제공 시스템
US11182395B2 (en) * 2018-05-15 2021-11-23 International Business Machines Corporation Similarity matching systems and methods for record linkage
US11195205B2 (en) 2018-06-12 2021-12-07 Capital One Services, Llc Systems and methods for processing and providing transaction affinity profile information
CN108932585B (zh) * 2018-06-19 2022-02-22 腾讯科技(深圳)有限公司 一种商户运营管理方法及其设备、存储介质、电子设备
RU2728953C1 (ru) * 2019-05-28 2020-08-03 Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) Способ и система определения схожести векторных представлений участников транзакций
CN111144975B (zh) * 2019-12-06 2023-09-12 港融科技有限公司 一种订单匹配方法、服务器及计算机可读存储介质
US11568128B2 (en) * 2020-04-15 2023-01-31 Sap Se Automated determination of data values for form fields
US11634123B2 (en) 2020-07-09 2023-04-25 Toyota Research Institute, Inc. Methods and systems for prioritizing computing methods for autonomous vehicles
CN112783963B (zh) * 2021-03-17 2023-04-28 上海数喆数据科技有限公司 基于商圈划分的企业线下与线上多源数据整合方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000357204A (ja) * 1999-05-06 2000-12-26 Hnc Software Inc 消費者の財政的挙動の予測モデル化方法及びシステム
JP2002083110A (ja) * 2000-09-06 2002-03-22 Dentsu Inc 顧客行動パターンの予測を支援する方法、及びこれを用いたマーケティング支援システム
JP2002297884A (ja) * 2001-03-30 2002-10-11 Aruze Corp 営業分析、営業支援、及び営業評価システム
JP2003323538A (ja) * 2002-04-26 2003-11-14 Nippon Yunishisu Kk 情報処理装置およびその方法
JP2005107688A (ja) * 2003-09-29 2005-04-21 Nippon Telegr & Teleph Corp <Ntt> 情報表示方法及びシステム及び情報表示プログラム
WO2006039102A2 (en) * 2004-09-30 2006-04-13 Deloitte Development Llc System, software and method for examining a database in a forensic accounting environment

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5262941A (en) * 1990-03-30 1993-11-16 Itt Corporation Expert credit recommendation method and system
US5517021A (en) * 1993-01-19 1996-05-14 The Research Foundation State University Of New York Apparatus and method for eye tracking interface
US6006221A (en) * 1995-08-16 1999-12-21 Syracuse University Multilingual document retrieval system and method using semantic vector matching
US6026397A (en) * 1996-05-22 2000-02-15 Electronic Data Systems Corporation Data analysis system and method
US6073095A (en) * 1997-10-15 2000-06-06 International Business Machines Corporation Fast vocabulary independent method and apparatus for spotting words in speech
US6108004A (en) * 1997-10-21 2000-08-22 International Business Machines Corporation GUI guide for data mining
US20010016833A1 (en) * 1998-12-02 2001-08-23 Deborah Everling Merchant transaction data mining method
US6167369A (en) * 1998-12-23 2000-12-26 Xerox Company Automatic language identification using both N-gram and word information
US7406214B2 (en) * 1999-05-19 2008-07-29 Digimarc Corporation Methods and devices employing optical sensors and/or steganography
AU780926B2 (en) * 1999-08-03 2005-04-28 Bally Technologies, Inc. Method and system for matching data sets
NO311658B1 (no) * 2000-03-27 2001-12-27 Scan & Pay As Fremgangsmåte for å gjennomföre handel og betalings- /kredittformidling
JP3866908B2 (ja) * 2000-07-31 2007-01-10 三菱電機株式会社 無線通信用受信装置
US7464086B2 (en) * 2000-08-01 2008-12-09 Yahoo! Inc. Metatag-based datamining
US7328211B2 (en) * 2000-09-21 2008-02-05 Jpmorgan Chase Bank, N.A. System and methods for improved linguistic pattern matching
GB0029229D0 (en) * 2000-11-30 2001-01-17 Unisys Corp Counter measures for irregularities in financial transactions
US7363308B2 (en) * 2000-12-28 2008-04-22 Fair Isaac Corporation System and method for obtaining keyword descriptions of records from a large database
EP1490790A2 (en) * 2001-03-13 2004-12-29 Intelligate Ltd. Dynamic natural language understanding
US6820089B2 (en) * 2001-04-05 2004-11-16 International Business Machines Corporation Method and system for simplifying the use of data mining in domain-specific analytic applications by packaging predefined data mining models
US7698228B2 (en) * 2001-04-27 2010-04-13 Accenture Llp Tracking purchases in a location-based services system
EP1405244A2 (en) * 2001-07-06 2004-04-07 Angoss Software Corporation A method and system for the visual presentation of data mining models
GB2388739B (en) * 2001-11-03 2004-06-02 Dremedia Ltd Time ordered indexing of an information stream
US20030177087A1 (en) * 2001-11-28 2003-09-18 David Lawrence Transaction surveillance
US7290048B1 (en) * 2002-03-29 2007-10-30 Hyperformix, Inc. Method of semi-automatic data collection, data analysis, and model generation for the performance analysis of enterprise applications
US20040236692A1 (en) * 2003-04-11 2004-11-25 Kerry Sellen Authorization approved transaction
US7710498B2 (en) * 2004-02-13 2010-05-04 Sony Corporation Image processing apparatus, image processing method and program
US20060101048A1 (en) * 2004-11-08 2006-05-11 Mazzagatti Jane C KStore data analyzer
WO2006058379A1 (en) * 2004-12-03 2006-06-08 Willcorp Enterprises Pty Ltd System and method of operating a customer loyalty program
WO2006116570A2 (en) * 2005-04-25 2006-11-02 The Ticket Reserve, Inc. Methods and apparatus to predict demand for a product or service
EP1904965A4 (en) * 2005-06-24 2009-06-17 Fair Isaac Corp ANALYTICAL DETECTION OF SIGNIFICANT INTEGRITY INTEGRITY / INTEGRITY INTEGRITY ATTACK AND SYSTEM OF CARD PORTFOLIO MANAGEMENT WHICH INTEGRITY IS REACHED
US7433869B2 (en) * 2005-07-01 2008-10-07 Ebrary, Inc. Method and apparatus for document clustering and document sketching
US20070073745A1 (en) * 2005-09-23 2007-03-29 Applied Linguistics, Llc Similarity metric for semantic profiling
US7558771B2 (en) * 2006-06-07 2009-07-07 Gm Global Technology Operations, Inc. System and method for selection of prediction tools
WO2008005950A2 (en) * 2006-06-30 2008-01-10 New Jersey Institute Of Technology An apparatus and method for a generalized benford's law for analysis of dct and jpeg coefficients
US20080082373A1 (en) * 2006-10-03 2008-04-03 American Express Travel Related Services Co., Inc. System and method for improved itinerary providing merchant information
US7937321B2 (en) * 2007-01-16 2011-05-03 Verizon Patent And Licensing Inc. Managed service for detection of anomalous transactions
US8666976B2 (en) * 2007-12-31 2014-03-04 Mastercard International Incorporated Methods and systems for implementing approximate string matching within a database
US7925652B2 (en) * 2007-12-31 2011-04-12 Mastercard International Incorporated Methods and systems for implementing approximate string matching within a database

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000357204A (ja) * 1999-05-06 2000-12-26 Hnc Software Inc 消費者の財政的挙動の予測モデル化方法及びシステム
JP2002083110A (ja) * 2000-09-06 2002-03-22 Dentsu Inc 顧客行動パターンの予測を支援する方法、及びこれを用いたマーケティング支援システム
JP2002297884A (ja) * 2001-03-30 2002-10-11 Aruze Corp 営業分析、営業支援、及び営業評価システム
JP2003323538A (ja) * 2002-04-26 2003-11-14 Nippon Yunishisu Kk 情報処理装置およびその方法
JP2005107688A (ja) * 2003-09-29 2005-04-21 Nippon Telegr & Teleph Corp <Ntt> 情報表示方法及びシステム及び情報表示プログラム
WO2006039102A2 (en) * 2004-09-30 2006-04-13 Deloitte Development Llc System, software and method for examining a database in a forensic accounting environment

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CSND199700800019; 佐藤 元則: 'データウェアハウス時代のマーケティング データベースマーケティングの基礎' C0mputopia 第32巻第376号, 19980101, p.78-81, コンピュータ・エージ社 *
CSND200301602005; ソニ サンジャイ 他: 'データマイニングを活用する' SQL SERVER magazine 第1号, 20020215, p.47-53, 翔泳社 *
CSNG200000914013; 小野 俊之 他: 'クラスタリングにより選定したサンプリングポイントの需要データを用いた商品マーケットシェア推定の一方法' 電気学会論文誌C 第118-C巻第10号, 19981001, p.1479-1484, 電気学会 *
JPN6013024282; 小野 俊之 他: 'クラスタリングにより選定したサンプリングポイントの需要データを用いた商品マーケットシェア推定の一方法' 電気学会論文誌C 第118-C巻第10号, 19981001, p.1479-1484, 電気学会 *
JPN6013024284; 佐藤 元則: 'データウェアハウス時代のマーケティング データベースマーケティングの基礎' C0mputopia 第32巻第376号, 19980101, p.78-81, コンピュータ・エージ社 *
JPN6013024285; ソニ サンジャイ 他: 'データマイニングを活用する' SQL SERVER magazine 第1号, 20020215, p.47-53, 翔泳社 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11790431B2 (en) 2015-12-11 2023-10-17 Mastercard International Incorporated Systems and methods for generating recommendations using a corpus of data

Also Published As

Publication number Publication date
RU2010125682A (ru) 2011-12-27
RU2510891C2 (ru) 2014-04-10
AU2008343492B2 (en) 2014-03-27
KR101468764B1 (ko) 2014-12-04
US20090171759A1 (en) 2009-07-02
MX2010007273A (es) 2010-12-02
WO2009085554A1 (en) 2009-07-09
EP2240916A1 (en) 2010-10-20
JP5485911B2 (ja) 2014-05-07
EP2240916A4 (en) 2012-02-08
AU2008343492A1 (en) 2009-07-09
US8738486B2 (en) 2014-05-27
BRPI0821420A2 (pt) 2015-06-16
KR20100114058A (ko) 2010-10-22
CA2710752A1 (en) 2009-07-09

Similar Documents

Publication Publication Date Title
JP5485911B2 (ja) アンサンブル加盟店予測システムを実装するための方法および装置
JP5613307B2 (ja) データベース内に近似文字列照合を実装するための方法およびシステム
US8666976B2 (en) Methods and systems for implementing approximate string matching within a database
US10140664B2 (en) Resolving similar entities from a transaction database
US20230153870A1 (en) Unsupervised embeddings disentanglement using a gan for merchant recommendations
JP2011508353A5 (ja)
US20230297552A1 (en) System, Method, and Computer Program Product for Monitoring and Improving Data Quality
WO2014004478A1 (en) Methods and systems for implementing approximate string matching within a database
US12002052B2 (en) Feature subspace isolation and disentanglement in merchant embeddings
US20210103925A1 (en) Feature subspace isolation and disentanglement in merchant embeddings

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111201

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130516

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130521

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130806

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140220

R150 Certificate of patent or registration of utility model

Ref document number: 5485911

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees