JP2022550610A - Eメール・アドレス選択のためのシステム及び方法 - Google Patents
Eメール・アドレス選択のためのシステム及び方法 Download PDFInfo
- Publication number
- JP2022550610A JP2022550610A JP2022520824A JP2022520824A JP2022550610A JP 2022550610 A JP2022550610 A JP 2022550610A JP 2022520824 A JP2022520824 A JP 2022520824A JP 2022520824 A JP2022520824 A JP 2022520824A JP 2022550610 A JP2022550610 A JP 2022550610A
- Authority
- JP
- Japan
- Prior art keywords
- addresses
- matching
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 30
- 230000015654 memory Effects 0.000 claims description 23
- 230000036961 partial effect Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 abstract description 5
- 238000004891 communication Methods 0.000 description 11
- 230000002085 persistent effect Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 235000014510 cooky Nutrition 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013403 standard screening design Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- WDQKVWDSAIJUTF-GPENDAJRSA-N via protocol Chemical compound ClCCNP1(=O)OCCCN1CCCl.O([C@H]1C[C@@](O)(CC=2C(O)=C3C(=O)C=4C=CC=C(C=4C(=O)C3=C(O)C=21)OC)C(=O)CO)[C@H]1C[C@H](N)[C@H](O)[C@H](C)O1.C([C@H](C[C@]1(C(=O)OC)C=2C(=C3C([C@]45[C@H]([C@@]([C@H](OC(C)=O)[C@]6(CC)C=CCN([C@H]56)CC4)(O)C(=O)OC)N3C=O)=CC=2)OC)C[C@@](C2)(O)CC)N2CCC2=C1NC1=CC=CC=C21 WDQKVWDSAIJUTF-GPENDAJRSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/107—Computer-aided management of electronic mailing [e-mailing]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24573—Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/041—Abduction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/048—Fuzzy inferencing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/48—Message addressing, e.g. address format or anonymous messages, aliases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Human Resources & Organizations (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Library & Information Science (AREA)
- Economics (AREA)
- Fuzzy Systems (AREA)
- Automation & Control Theory (AREA)
- Quality & Reliability (AREA)
- Marketing (AREA)
- Computer Hardware Design (AREA)
- General Business, Economics & Management (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
最良のEメール・アドレスを選択するためのシステムは、アイデンティティ・グラフを利用して消費者に関連したEメールについての全てのエビデンスを集約する。このエビデンスは、処理エンジンを適用することによって最良のEメール・アドレスに関するチョイスを行うために使用される。エビデンスは、時点(PIT)信号、日時信号、リーセンシー、ソース寄与、URLプロバイダ、消費者の名前とのローカルEメール部のオーバーラップ、及び同じローカルEメール・アドレス部を共有する消費者の世帯における人数を含む場合がある。Eメール・アドレスのローカル部におけるプロファニティの存在も、Eメール・アドレスが最良のEメール・アドレスであるかどうかを判断する際にプロファニティ・エンジンによって使用される場合があり、タイブレーカは、近いスコアが付けられた2つ以上のEメール・アドレスが存在するときにタイブレーキング・エンジンによって使用される場合がある。
Description
本願は、2019年10月5日に出願された米国仮特許出願第62/911,259号の優先権を主張する。当該出願は、参照により本明細書に全体が組み込まれる。
本発明の分野は、人とコンタクトを取る際に使用するための最良のEメール・アドレスの識別及び選択である。
今日の先進国に生きる大多数の人々は、1つ又は複数のEメール・アドレスを有し、それらを介して彼らにコンタクトを取る場合がある。しかしながら、仕事用のEメールと、個人的な連絡用のEメールとを使用する場合など、一人が複数のEメール・アドレスを有することは珍しくない。多くの人々は、状況に応じて連絡を分けるために複数の個人用のEメールを維持する場合がある。例えば、ある人は、親しい友人及び家族のみに使用されるEメール・アドレス、オンライン・ショッピングに使用するためのEメール・アドレス、並びに趣味、政治又はその他の関心事に関連したグループなどの特定のオンライン・グループに使用される1つ又は複数のEメールを有する場合がある。多くの人々は、望まない「スパム」Eメールを受け取ることをユーザーが予想するパーティとの連絡のために特定のEメール・アドレスを維持する。このようにして、ユーザーは、仮にあるとしても滅多にチェックしないEメール・インボックスに望まないEメール・メッセージを隔離する。多くの場合、ユーザーは、その人がもう通っていない学校で使用していたEメール・アドレスなど、時間の経過により単に忘れてしまった1つ又は複数のアクティブなEメール・アドレスを有する。他方、複数の人が同じEメール・アドレスを共有する場合もあるということも起こる。これは、特に、家族又は同じ世帯で生活する人の間で特に一般的である。
オンライン小売業者は、ターゲットを定めたマーケティング・メッセージを、Eメールを使用してある人に送りたい場合がある。上記に示した理由から、多くの他の可能な理由に加えて、どのEメールが、ある人に届くための「最良の」Eメール・アドレスであるかを判断することが困難である。本明細書における目的のために、「最良の」Eメールとは、該当者に属する可能性が最も高く且つその人の主たるEメールとしてその人によって活発に使用されているものである。最良のEメール・アドレスを正しく選択することによって、マーケターは、マーケティング・メッセージが、ターゲットとなった消費者によって見られる機会を高める。
マーケター(製品又はサービスを提供する小売業者、又は彼らのために働く広告代理店である場合がある)は、ターゲットを定めたEメール・マーケティング・キャンペーンを含むマーケティング・キャンペーンの成功を高めるために、しばしばマーケティング・サービス・プロバイダに頼る。次いで、サービス・プロバイダは、マーケティング・キャンペーンの結果を高めるために、特定のターゲットとなった消費者用の最良のEメール・アドレスをクライアントに提供し、これにより、クライアントに最大価値を提供するために努力する。幾つかのこのようなサービス・プロバイダは、彼らのサービスを最も効果的に提供するために「アイデンティティ・グラフ」を維持する。本明細書における目的のために、「アイデンティティ・グラフ」とは、個々の消費者と相互に関連付けられる識別子及び/又はデバイスを記憶したデータベースであると定義され得る。これらの識別子は、多くの形態を取ることができる。例えば、識別子は、実際の名前、アドレス、電話番号、Eメール・アドレス、オンライン・ユーザーネーム、例えばパーソナル・コンピュータ、スマートフォン、タブレット及び多くのその他の電子デバイスにおいて動作するものなどのブラウザに記憶されたクッキー、ポイントカード番号などである場合がある。消費者に関連したデバイスは、パーソナル・コンピュータ、スマートフォン、アドレス可能なテレビ、及びこの消費者が専ら使用する又は他者と共有する多くのその他のデバイスである場合がある。これらの識別子の幾つかはオンライン識別子であるが、幾つかはオフラインである場合もあることに留意されたい。オンライン及びオフラインの両方の識別子を知ることにより、マーケティング・サービス・プロバイダは、例えば、オフライン広告とオフライン購買とをマッチさせ、オンライン・マーケティング・キャンペーンの全体的な有効性を判断することができる場合がある。様々なタイプのメタデータなどのさらに他の情報がアイデンティティ・グラフに含まれる場合がある。メタデータは、リーセンシー(即ち、どれだけ最近デバイス又は識別子が消費者によって使用されたか)、活発性(即ち、どれだけ頻繁にデバイス又は識別子が消費者に使用されているか)、世帯情報(即ち、どれだけ多くの且つどの人が消費者とデバイス又は識別子を共有しているか)などの、識別子及びデバイスに属する属性を含む場合がある。全てのこれらの様々な識別子及び/又はデバイス並びにメタデータは、アイデンティティ・グラフにおいて互いに結合され、これにより、サービス・プロバイダは、このような機能性を可能にするために、特定の消費者のより理解しやすいビューを展開することができる。アイデンティティ・グラフは、マーケティング・サービス・プロバイダによって収集されたデータ及びメタデータに基づく場合があるが、最も頻繁には、マーケティング・サービス・プロバイダは、データ共有配列において特定のタイプのデータに寄与する1つ又は複数のサードパーティからデータを受け取り、これにより、マーケティング・サービス・プロバイダは、自己のアイデンティティ・グラフをより完全なものにすることができる。
アイデンティティ・グラフ技術を使用して、マーケティング・サービス・プロバイダは、マーケティング・メッセージのターゲットを定めるためのマーケターの能力を高め、ひいてはクライアントのための投資利益率(ROI:Return on Investment)を増大させる場合がある。マーケターは、その顧客とのやり取りから得られた、その顧客についての様々なタイプの情報を有する場合がある。しかしながら、このデータは、大きなギャップを有する場合があるか、又はマーケターによって維持された異なるデータ・ストレージ・システムを横断して広がることによって「サイロ化」される場合がある。例えば、マーケターは、オンライン・セールス・システム・データベースにおける顧客についてのデータ、及びその広告プラットフォーム・ソフトウェア・データストアにおけるその顧客についてのその他のデータを有する場合があり、この顧客のためのレコードの2つのセットが、同じ消費者に実際に属することに気づかない場合さえある。そのアイデンティティ・グラフを使用すると、マーケティング・サービス・プロバイダは、マーケターが顧客のより全体的なビューを有するようにこのような異種のソースからの消費者レコードをマッチ及びリンクさせるプロセスであるアイデンティティ分解を実行することができる。この情報により、マーケターは、より個別化された、ターゲットを定めたマーケティング・メッセージを顧客に提供することができる。マーケターは、特定の顧客とのトータルな関係をより良く理解することができるので、マーケターにとってのその顧客の価値を認識することができ、例えば、最も忠実な顧客として現在認識する顧客に特定の割引又はその他のオファー若しくは特典を提供する場合がある。アイデンティティ・グラフは、特定の顧客の1つ又は複数のEメール・アドレスを含む場合があると見られる場合があるが、顧客が、所望のマーケティング・メッセージに実際に曝される可能性が高まるように、あらゆる特定の消費者の最良のEメール・アドレスを識別するという問題が残る。したがって、マーケティング・サービス・プロバイダに利用可能なアイデンティティ・グラフ及びその他のこのような技術的リソースを使用して、特定の消費者の最良のEメール・アドレスを識別するためのより良いシステム及び方法が望ましい。
この背景技術のセクションにおいて言及した参照文献は、本発明に関して従来技術であることを認めたものではない。
本発明は、特定の消費者又は世帯のための最良のEメール・アドレスを選択するためのシステム及び方法に関する。第1に、マーケティング・サービス・プロバイダは、ある実装例における、アイデンティティ・グラフからの情報を含む、消費者に関連したEメールについての全てのエビデンスを集約する。第2に、このエビデンスは、最良のEメール・アドレスに関するチョイスを行うために使用される。本発明の様々な実施例において、集約されたエビデンスは、場合によってはその他の情報の追加とともに、以下のもののうちの幾つか又は全てを含む場合がある。即ち、時点(PIT)信号(即ち、データ・プロバイダがこの特定のデータを記録した最初の時と最後の時)、日時信号(即ち、PIT信号におけるトレンド)、リーセンシー(即ち、どれだけ最近Eメール・アドレスがレポートされたか)、ソース寄与(即ち、どれだけ多くの及びどのデータ・プロバイダがその特定のEメール・アドレスをレポートしたか)、URLプロバイダ(即ち、特定のEメール・アドレスを生み出したURLは何か)、消費者の名前とのローカルEメール部のオーバーラップ(即ち、消費者の実際の名前の部分又は全てが、Eメール・アドレス内に見つけられ、これは、編集距離のブレンド、パーシャル/ファジー/音声マッチング、インターセクトするストリングの共通のシーケンスを探す、インターセクトするパターンの最長の共通のシーケンスを探すなど、様々な技術を含む場合がある)、同じローカルEメール・アドレス部を共有するその消費者の世帯における人数。ある実装例において、Eメール・アドレスのローカル部におけるプロファニティ(profanity)の存在も、Eメール・アドレスが最良のEメール・アドレスであるかどうかを判断する際に使用される場合があり、タイブレーカは、近いスコアを付けられた2つ以上のEメール・アドレスがある場合に使用される場合がある。
本発明のこれらの特徴、目的及び利点並びにその他の特徴、目的及び利点は、以下に記載の図面に関連する好ましい実施例の以下の詳細な説明の考察からより良く理解されるであろう。
本発明がさらに詳細に記載される前に、本発明は、明細書のあらゆるセクションに記載された特定の実施例に限定されるものではなく、特定の実施例を記載する際に使用された用語は、その特定の実施例のみを記載するためのものであり、限定することを意図したものではないことを理解すべきである。なぜならば、本発明の範囲は、後続の非仮特許出願における請求項によってのみ限定されるからである。
アイデンティティ・グラフは、オブジェクトに関連した識別子をリンクさせるデータ・ストラクチャであると定義される場合がある。ある場合、オブジェクトは、個人(消費者)又は世帯である場合がある。これらの識別子は、名前、住所、電話番号などの様々な形式の個人を特定できる情報(PII)を含む。これは、Eメール・アドレス、ユーザーネーム、インターネットプロトコル(IP)アドレス、ブラウザ・クッキーなどのデジタル・アイデンティティを含む場合もある。アイデンティティ・グラフは、消費者又は消費者の世帯などのオブジェクトについての人口統計学的、地理学的、行動、購買履歴及びその他の関連データを含む場合がある、特定のオブジェクトについて知られた全ての他の情報をリンクさせる場合もある。加えて、アイデンティティ・グラフは、データのソース、いつデータが受け取られ又は追加されたかのタイムスタンプなどの、グラフに記憶された様々なデータについてのメタデータを含む場合がある。全てのこの情報は互いにリンクされるので、容易にアクセスされ、様々な目的のために使用される場合がある。消費者の場合、この情報は、消費者又は類似の特性を有する消費者のグループ(オーディエンス)へのターゲットを定めたマーケティング・メッセージを構築及び送信するために使用される場合がある。アイデンティティ・グラフにより、マーケターは、デジタル・プロパティと相互作用するためにマーケターが使用しているデバイスにかかわらず、また、その時点で用いている場合がある特定のユーザーネーム又はその他の識別子にかかわらず、個人を認識できる場合がある。したがって、このアプローチは、デバイスをトラッキングすることよりも優れたソリューションを提供する。なぜならば、一人のユーザーが複数のデバイスを使用し、複数の人が同じデバイスを使用する場合があるからである。同様に、このアプローチは、ブラウザ・クッキーのみに依存することよりも優れている。なぜならば、クッキーは、長時間にわたって持続するものではなく、特定のブラウザではなく特定の人にリンクされるように設計されていないからである。
図1は、本発明の一実装例に関連して用いられる場合があるアイデンティティ・グラフ1000の簡略化された実例を提供している。現実の世界の用途では、アイデンティティ・グラフ1000は極めて大きくなる場合があることに留意すべきである。1つの実装例では、アイデンティティ・グラフ1000は、18億人の人及び8億の世帯に属するデータを含む場合があり、200TBのデジタル・データ・ストレージを占有する場合がある。しかしながら、サイズにかかわらず、消費者などの特定のオブジェクトについてグラフに記憶された全ての情報を接続するために、持続性リンク1010が使用される。このリンクは、全ての可能なオブジェクトの母集団の中の特定のオブジェクトに独自に関連付けられた、英数字ストリングなどのあらゆる性質の識別子である場合がある。リンクは、オブジェクトに関するPII1012、購買履歴1016、アクセス・デバイス1018及び人口統計学的データ1020を互いにリンクする。PII1012に関して前に記載したような様々なメタデータが、メタデータ1014に示されているが、メタデータは、PII1012のみならず、アイデンティティ・グラフ1000に記憶されたあらゆる又は全てのタイプのデータに関連付けられる場合がある。
図2の流れ図によって例示された本発明の特定の実装例では、ステップ10においてアイデンティティ・グラフ1000から引き出されたPIIデータを使用して、最良のEメール・アドレスが判断される場合がある。PIIデータは、ステップ12においてシステムに取り込まれ、メタデータ・エンジンによってステップ14においてアイデンティティ・グラフ1000からのメタデータと組み合わされる。ここで特に関係するメタデータは、マーケティング・メッセージのためのEメール・アドレスのチョイスに関連する決定に関するメタデータである。新たなデータベースが、関連付けられたPII及びメタデータによって構築される。収集されたメタデータのタイプは、時点(PIT)信号を含む場合があり、この時点(PIT)信号は、例えば、データ・プロバイダがこの特定のデータを記録した最初と最後の時間のタイムスタンプである場合がある。メタデータは、日時信号、即ちPIT信号におけるトレンドをさらに含む場合がある。代替的に、日時信号は、所定の期間にわたる監査時間信号とのリンクをシミュレーションするために一時的な日付信号と置き換えられる場合がある。メタデータは、リーセンシー、即ちどれだけ最近特定のEメール・アドレスがレポートされたかをさらに含む場合がある。メタデータは、ソース寄与データ、即ちどれだけ多くの且つどのデータ・プロバイダがその特定のEメール・アドレスをレポートしたかをさらに含む場合がある。メタデータは、特定のEメール・アドレスを生み出したURLプロバイダをさらに含む場合がある。メタデータは、消費者の名前とのローカルEメール部のオーバーラップがあるかどうか、即ち消費者の実際の名前の部分又は全部がEメール・アドレス内に見られるかどうかの指示をさらに含む場合があり、これは、編集距離のブレンド、部分/ファジー/音声マッチング、交差ストリングの共通のシーケンスを探す、交差パターンの最長の共通のシーケンスを探すなど、様々な技術を含む場合がある。メタデータは、ドメイン・オーバーラップ又は強度をさらに含む場合がある。メタデータは、同じローカル・Eメール・アドレス部を共有する、その消費者の世帯における人数をさらに含む場合がある。
ステップ16において、エビデンス要約が行われ、それによってメタデータからの様々なファクタが各候補Eメール・アドレスに適用される。このプロセスの結果は、Eメール・ルックアップ及びエビデンス・データベース18に記憶され、各Eメール・アドレスは、true/false又はブーリアン型フラグのセットとともにレコードにおいてリンクされる。各フラグは、特定のピースのエビデンスが、あるレベルのデータ品質を満たしたかどうかを示している。例えば、リーセンシー・フラグは、Eメール・アドレスが、去年レポートされたものとして示されたならばtrueに設定される場合がある。次いで、エビデンス・データベース18は、ブロック20においてランキング及びタイブレーキングの次のステップに提供される。タイブレーキングは、Eメール・ルックアップ及びエビデンス・データベース18におけるフラグが比較された後に複数のEメール・アドレスが同じスコアを有することになった場合にのみ実行される。次いで、出力データベース22は、アイデンティティ・グラフ1000内で検討された各オブジェクト(消費者など)のための最良のEメール・アドレスを返す。
特定の試験において、方法の第1のバージョンが、344,159,753人の異なる消費者のグループに適用され、それらの消費者についてのデータがアイデンティティ・グラフ1000において見られた。そのグループのうち、Eメール・アドレスが見られた消費者の中で、消費者の約48%が、アイデンティティ・グラフにおいて1つのEメール・アドレスのみを有していたのに対し、消費者の52%は、2つ以上のEメール・アドレスを有していたことが見られた。2つ以上のEメール・アドレスを有する179,326,168人の消費者のうち、最初の月の間のチャンピオンと比較するためにフィードバック・ループを使用することなく、結果は以下のとおりであった。
・112,929,864人の消費者が、ストロング・カテゴリからピックされた最良のEメールを有していた(即ち、約62%)
・32,874,862人の消費者が、モデレート・カテゴリからピックされた最良のEメールを有していた(即ち、約18%)
・33,521,442人の消費者が、ウィーク・カテゴリからピックされた最良のEメールを有していた(即ち、約18%)
・112,929,864人の消費者が、ストロング・カテゴリからピックされた最良のEメールを有していた(即ち、約62%)
・32,874,862人の消費者が、モデレート・カテゴリからピックされた最良のEメールを有していた(即ち、約18%)
・33,521,442人の消費者が、ウィーク・カテゴリからピックされた最良のEメールを有していた(即ち、約18%)
これらの結果を見ると、追加的な処理によって改良をなすことができたと判断された。第1に、Eメール・アドレスのローカル部におけるプロファニティをチェックするためのステップが追加され、これは、選択肢(例えば、プロファニティを含むEメール・アドレス及び含まないEメール・アドレス)が利用できるときにより良いピックをリターンするために、他のエビデンスと組み合わされた。加えて、近い選択肢が利用できるときにより良いピックをリターンするために、方法を微調整するためにタイブレーカが追加された。
プロファニティを識別するために、「サレイシャス・エンジン(salacious engine)」が構築された。サレイシャス・エンジンへの入力は、約500の不適切な単語のベース・プロファニティ・リストとともに開始し、次いで、リストは、編集、パーシャル、ファジー、音声、共通のサブシーケンス及び関連する技術を使用して、これらの単語の異なるバリエーションを探すことによってダイナミックに拡張された。プロファニティ・チェックは、その他のエビデンス、例えば、PIT、時間ソース寄与、URL、及び消費者の名前とのEメールのローカル部のオーバーラップとの関連において行われる。プロファニティ・チェックは、スペルミス、音声スペリング相違、失われたプロファニティ・コンポーネント、アウト・オブ・オーダー・コンポーネント、文字の脱落、母音の置き換えなどを考慮することによって、誤検出を最少化し且つ検出漏れを最少化するために微調整される。
タイブレーカに関して、エビデンスの全てのピースは、最初にバイアス又は重みなしに等しく考慮されるが、最良のEメール・アドレスをピックする前に、最後に修正される。複数のEメール・チョイスに対して強度、PITのフリーケンシー、時間、リーセンシー、URL信号が互いに近い場合、最良のピックは、以下のタイブレーカ・ファクタを使用して判断される。
・Eメール・アドレス・ローカル部と消費者の名前とのオーバーラップのより高い量
・Eメール・チョイスが同じ量のオーバーラップを有する場合、プロファニティを含まないEメールがチョイスされる
・全ての最良のEメール・チョイスがプロファニティを有さない場合、より高い局所性オーバーラッピング強度を有する最良のピックがチョイスされる
・全てのEメール・チョイスが上述のタイブレーキング・シチュエーションを満たす場合、世帯のより大人数によって共有される最良のピックがチョイスされる。
・Eメール・アドレス・ローカル部と消費者の名前とのオーバーラップのより高い量
・Eメール・チョイスが同じ量のオーバーラップを有する場合、プロファニティを含まないEメールがチョイスされる
・全ての最良のEメール・チョイスがプロファニティを有さない場合、より高い局所性オーバーラッピング強度を有する最良のピックがチョイスされる
・全てのEメール・チョイスが上述のタイブレーキング・シチュエーションを満たす場合、世帯のより大人数によって共有される最良のピックがチョイスされる。
上記に記載のプロファニティ・テスト及びタイブレーカを適用することによって、方法は、上記に記載の異なる消費者の同じグループに適用された。これは、また、最初の月のチャンピオンと比較するためのフィードバック・ループなしに実行された。結果は以下のとおりであった。
・112,938,969人の消費者は、ストロング・バケット/カテゴリからピックされた最良のEメールを有していた(即ち、約63%)
・33,046,235人の消費者は、モデレート・バケット/カテゴリからピックされた最良のEメールを有していた(即ち、約18.42%)
・33,347,155人の消費者は、ウィーク・バケット/カテゴリからピックされた最良のEメールを有していた(即ち、約18.59%)
・112,938,969人の消費者は、ストロング・バケット/カテゴリからピックされた最良のEメールを有していた(即ち、約63%)
・33,046,235人の消費者は、モデレート・バケット/カテゴリからピックされた最良のEメールを有していた(即ち、約18.42%)
・33,347,155人の消費者は、ウィーク・バケット/カテゴリからピックされた最良のEメールを有していた(即ち、約18.59%)
以前の反復と比較して分布が比較的少量(約0.5%)だけ変化することが見られる場合があるが、Eメール・アドレス・チョイスの残りを伴う最良のピックのランキングは、改善されており、より防御可能である。
図2の方法を実装するためのシステムが、図3に示されている。各サブルーチン又は「エンジン」は、仮想マシンを使用してローカルで又はクラウド・コンピューティング環境においてホストされる場合があるコンピューティング・ハードウェアにおいて実装される。アイデンティティ・グラフ1000は、図2に示されたデータベース14を構築するために、PII及びメタデータを関連付けるように構成された、メタデータ・エンジン1100にデータを提供する。次いで、エビデンス・エンジン1102は、エビデンス要約を行い、やはり図2に示したように、Eメール・ルックアップ及びエビデンス・データベース18を生成する。サレイシャス・エンジン1104は、上記に記載したようにプロファニティ・チェックを行う。次いで、このデータはランキング・エンジン1106へ送られ、Eメール・ルックアップ及びエビデンス・データベース18のtrue/false又はブーリアン型フラグに基づいてランキングを行う。決定ブロック1108において、可能な最良のEメール・アドレスの間にタイがあると判断された場合、処理は、タイブレーカ・エンジン1110へ移動し、タイブレーカ・エンジン1110は、上記に記載したタイブレーキングを行う。さもなければ、処理は、出力データベース22へ直接移動し、これは、オブジェクトと、各オブジェクトのための最良のEメール・アドレスとの間のリンケージを含む。
図4は、本明細書に示された本発明の別の実装例による方法を示している。図2に示した方法のように、プロセスは、PIIデータ(即ち、Eメール・アドレス及び関連情報)10を入力することから開始される。レイアウト解釈ステップ1202において、システムは、使用されるデータを集める。システムは、このステップにおいて、非公開エンティティ(non-published entity)をスキップする。
ステップ1204のメトリック計算において、複数のメトリックが計算される。ラスト・シーン・デイツ(LSD)/リーセンシー・メトリックは、Eメールをレポートしたソースの総数に対する、過去のレポーティング・ピリオド(例えば、2年)において特定のEメールをレポートしたソースの比として計算される。レコード・シーン・カウント・メトリックは、各Eメールを含むレコードの数である。ソース・カウント・メトリックは、各Eメールをレポートするソースの数である。URLプロバイダ・カウント・メトリックは、各EメールのためのURLプロバイダの数である。URLプロバイダ・ストレングス・メトリックは、そのEメールのためのプロバイダとしてそのURLを示すソースの数によって重み付けられたURLプロバイダの数である。ネーム・コンポーネント・プレゼント・イン・Eメール・メトリックは、Eメールが、その人に属する名前コンポーネントを含む場合に設定されるフラグである。Eメール・イン・マルチプル・ドメインズ・メトリックは、その世帯に存在するEメールのセット内で、各Eメールのローカル部が反復される回数である。Eメール・イン・ハウスホールド・メトリックは、各Eメールを共有する世帯内の人数である。プロファニティ・メトリックは、Eメールがクリーンである場合に設定されるフラグである。Eメールは、例えば、レコード・シーン・カウント・メトリックが25よりも大きいなど、あるコンテインが満たされた場合にのみ、プロフェインに設定される。
タイブレーカを計算するステップ1206では、ある条件が満たされた場合、タイブレーカが適用される。これらの条件は、例えば、あるEメールがあるメトリックにおいて近いランクになる場合であり得る。この場合、可能なタイをブレークするために、ハンディキャップ値がレコード・シーン・カウント・メトリックに加えられる。最小及び最大メトリックを選択するステップ1208では、システムは、全てのEメールにわたる全てのメトリックの最小値及び最大値を計算する。各メトリックのための強度値を設定するステップ1210では、システムは、各メトリックの相対強度計算、即ち、メトリックの値対その最大値の比を見つけるための計算を行う。1つの実例において、メトリックは、相対強度が0.7以上である場合には「ストロング」と識別され、相対強度が0.7未満であるが0.4以上である場合には「ミディアム」と識別され、それ以外では「ウィーク」と識別される。各Eメールのためのランキングを計算するステップ1212では、全体のランク計算は、各Eメールの全てのメトリックの合計として計算される。
エビデンス・ストリングを生成するステップ1214では、上記の計算を表すストリングが生成される。1つの実例では、一連の9つの文字(0及び1)又は二進数はそれぞれ、前に記載したメトリック、つまり、ソース・カウント、レコード・カウント、LSD、URLプロバイダ・カウント、URLプロバイダ・強度、ネーム・コンポーネント・プレゼント・イン・Eメール、Eメール・イン・マルチプル・ドメインズ、Eメール・イン・ハウスホールド及びプロファニティ、のうちの1つに関連付けられている。それぞれの場合において、メトリックが全てのEメールにわたって最大値である場合、対応する文字のために「1」が存在するが、そうでない場合には「0」が存在する。次いで、エビデンス・ストリングを評価するステップ1216では、ストリングにおける各文字に関して、値が「1」であり、ストリングの合計が、ストリングの合計の最大値に等しい場合、Eメールがチャレンジャとしてピックされることを見つけるために計算がなされる。これは、以下によって表される場合がある。
string[i]=‘1’及びsum(string)=max(sum(string))である場合、チャレンジャとしてピックする
さもなければ、次の文字へ移動する
言い換えれば、metric iが、全てのEメールにわたってそのメトリックの最大値であり、このEメールが、最大メトリックの最多の数を有する場合、このEメールは、チャレンジャとしてピックされる。
string[i]=‘1’及びsum(string)=max(sum(string))である場合、チャレンジャとしてピックする
さもなければ、次の文字へ移動する
言い換えれば、metric iが、全てのEメールにわたってそのメトリックの最大値であり、このEメールが、最大メトリックの最多の数を有する場合、このEメールは、チャレンジャとしてピックされる。
チャンピオン及びチャレンジャを選択するステップ1218では、チャレンジャは、その全体ランクが、チャンピオンの全体ランクよりも、設定されたしきい値T1だけ高いEメールとしてピックされる(ランクはステップ1212において計算される)。チャレンジャは、チャレンジャの全体ランクが、チャンピオンの全体ランクよりも、第2のしきい値T2だけ高く、システムが、過去Mヶ月(Mは、あらゆる所望の値である場合がある)において同じチャレンジャをピックした場合にも、チョイスされる場合がある。T1、T2及びMは、設定可能な値であることに留意されたい。
各Eメールをランキングに割り当てるステップ1220では、部分的なランキングが、全てのEメールについて、それを3つのバケットのうちの1つに割り当てることによって行われる。ランクがRT1以上である場合、Eメールはストロング・バケットに配置され、ランクがRT1未満であるが、少なくともRT2と等しい場合、ミディアムバケットに配置され、それ以外はウィーク・バケットに配置される。RT1及びRT2も設定可能である。全ての計算されたデータを使用し、最良のアドレスを選択するステップ12222では、3つのバケットのそれぞれは、強度によって分類される。ストロング・バケット内の最良のピックであるEメールは、最良のEメールとしてチョイスされるものとなる。次いで、この最良のEメールは、出力22として送達される。
本明細書に記載されたシステム及び方法は、様々な実施例において、ハードウェア及びソフトウェアのあらゆる組み合わせによって実装される場合がある。例えば、1つの実施例では、システム及び方法は、それぞれが、プロセッサに結合されたコンピュータ可読ストレージ媒体に記憶されたプログラム命令を実行する1つ以上のプロセッサを含む、1つのコンピュータ・システム又は複数のコンピュータ・システムの集合体によって実装される場合がある。プログラム命令は、本明細書に記載された機能を実装する場合がある。図面に示され且つ本明細書に記載された様々なシステム及びディスプレイは、例示的な実装例を表す。あらゆる方法の順序は変更される場合があり、様々な要素は、追加、変更又は省略される場合がある。
本明細書に記載のコンピューティング・システム又はコンピューティング・デバイスは、本発明の様々な実装例の部分を形成するものとして、クラウド・コンピューティング・システム又は非クラウド・コンピューティング・システムのハードウェア部分を実装する場合がある。コンピュータ・システムは、様々なタイプのデバイスのいずれかである場合があり、コモディティ・サーバ、パーソナル・コンピュータ・システム、デスクトップ・コンピュータ、ラップトップ又はノートブック・コンピュータ、メインフレーム・コンピュータ・システム、ハンドヘルド・コンピュータ、ワークステーション、ネットワーク・コンピュータ、コンシューマ・デバイス、アプリケーション・サーバ、ストレージ・デバイス、電話、携帯電話、又は一般的にあらゆるタイプのコンピューティング・ノード、コンピュート・ノード、コンピュート・デバイス及び/又はコンピューティング・デバイスを含むが、これらに限定されない。コンピューティング・システムは、入力/出力(I/O)インターフェースを介してシステム・メモリに結合された1つ又は複数のプロセッサ(そのうちいずれも、シングル・スレッド又はマルチ・スレッドである場合がある複数のプロセシング・コアを含む場合がある)を含む。コンピュータ・システムは、I/Oインターフェースに結合されたネットワーク・インターフェースをさらに含む場合がある。
様々な実施例において、コンピュータ・システムは、1つのプロセッサを含むシングル・プロセッサ・システム又は複数のプロセッサを含むマルチプロセッサ・システムである場合がある。プロセッサは、コンピューティング命令を実行することができるあらゆる適切なプロセッサである場合がある。例えば、様々な実施例において、プロセッサは、様々な命令セット・アーキテクチャのいずれかを実装する汎用の又は埋め込まれたプロセッサである場合がある。マルチプロセッサ・システムでは、各プロセッサは、一般的に、同じ命令セットを実装する場合があるが、必ずしもそうでなくてもよい。コンピュータ・システムは、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク又はインターネットなどの通信ネットワークを介して他のシステム及び/又はコンポーネントと通信するための1つ又は複数のネットワーク通信デバイス(例えば、ネットワーク・インターフェース)をも含む。例えば、コンピューティング・デバイスにおいて実行されるクライアント・アプリケーションは、様々なサブシステムにおいて実装されるクラウド・コンピューティング又は非クラウド・コンピューティング環境において本明細書に記載のシステムのコンポーネントのうちの1つ又は複数を実装する1つのサーバ又はサーバのクラスタにおいて実行するサーバ・アプリケーションと通信するためにネットワーク・インターフェースを使用する場合がある。別の実例では、コンピュータ・システムにおいて実行されるサーバ・アプリケーションの一例は、他のコンピュータ・システムにおいて実装される場合があるアプリケーションの他の例と通信するためにネットワーク・インターフェースを使用する場合がある。
コンピューティング・デバイスは、1つ若しくは複数の持続型ストレージ・デバイス及び/又は1つ若しくは複数のI/Oデバイスをも含む。様々な実施例では、持続型ストレージ・デバイスは、ディスク・ドライブ、テープ・ドライブ、ソリッド・ステート・メモリ、その他のマス・ストレージ・デバイス又はあらゆるその他の持続型ストレージ・デバイスに対応する場合がある。コンピュータ・システム(又はコンピュータ・システム上で動作する分散型アプリケーション若しくはオペレーティング・システム)は、要求に応じて命令及び/又はデータを持続型ストレージ・デバイスに記憶する場合があり、要求に応じて、記憶された命令及び/又はデータを検索する場合がある。例えば、幾つかの実施例では、コンピュータ・システムは、制御プレーン又は制御システムの1つ又は複数のノードを実装する場合があり、持続型ストレージは、そのサーバ・ノードに取り付けられたSSDを含む場合がある。複数のコンピュータ・システムは、同じ持続型ストレージ・デバイスを共有する場合があるか又は持続型ストレージ・デバイスのプールを共有する場合があり、プールにおけるデバイスは同じ又は異なるストレージ技術を表す。
コンピュータ・システムは、プロセッサによってアクセス可能なコード/命令及びデータを記憶する場合がある1つ又は複数のシステム・メモリを含む。システム・メモリは、例えば、アクセス速度に基づいてメモリ内の情報をスワップするように設計されたシステムにおけるメモリ及びメモリ・キャッシュの複数のレベルを含む場合がある。インターリービング及びスワッピングは、仮想メモリ実装において持続型ストレージに拡張する場合がある。メモリを実装するために使用される技術は、例えば、スタティック・ランダム・アクセス・メモリ(RAM)、ダイナミックRAM、読み出し専用メモリ(ROM)、不揮発性メモリ又はフラッシュ・タイプ・メモリを含んでもよい。持続型ストレージのように、複数のコンピュータ・システムは、同じシステム・メモリを共有する場合があるか又はシステム・メモリのプールを共有する場合がある。1つ又は複数のシステム・メモリは、本明細書に記載のルーチンを実装するためにプロセッサによって実行可能なプログラム命令を含む場合がある。様々な実施例では、プログラム命令は、バイナリ、アセンブリ言語、Java(登録商標)などのあらゆるインタープリタ型言語、C/C++などのコンパイラ型言語、又はそれらのあらゆる組み合わせにおいてエンコードされる場合がある。ここに示された特定の言語は、単なる実例である。幾つかの実施例では、プログラム命令は、複数の別個のクライアント、サーバ・ノード及び/又はその他のコンポーネントを実装する場合がある。
幾つかの実装例では、プログラム命令は、UNIX(登録商標)、LINUX、Solaris(商標)、MacOS(商標)又はMicrosoft Windows(商標)などの様々なオペレーティング・システムのうちのいずれかである場合があるオペレーティング・システム(図示せず)を実装するために実行可能な命令を含む場合がある。プログラム命令のいずれか又は全ては、様々な実装例に従ってプロセスを行うためにコンピュータ・システム(又はその他の電子デバイス)をプログラムするために使用される場合がある、命令を記憶した非一時的コンピュータ可読ストレージ媒体を含む場合がある、コンピュータ・プログラム製品又はソフトウェアとして提供される場合がある。非一時的コンピュータ可読ストレージ媒体は、マシン(例えば、コンピュータ)によって読み取り可能な形式の情報(例えば、ソフトウェア、プロセシング・アプリケーション)を記憶するためのあらゆる機構を含む場合がある。一般的に言って、非一時的コンピュータ・アクセス可能媒体は、磁気又は光学媒体、例えば、I/Oインターフェースを介してコンピュータ・システムに結合されたディスク又はDVD/CD-ROMなどのコンピュータ可読ストレージ媒体又はメモリ媒体を含む場合がある。非一時的コンピュータ可読ストレージ媒体は、システム・メモリ又は別のタイプのメモリとしてコンピュータ・システムの幾つかの実施例に含まれる場合があるRAM又はROMなどのあらゆる揮発性又は不揮発性媒体をも含む場合がある。その他の実装例では、プログラム命令は、ネットワーク・インターフェースを介して実装される場合があるなど、ネットワーク及び/又は有線又は無線リンクなどの通信媒体を介して搬送される、光、音又はその他の形式の伝播される信号(例えば、搬送波、赤外線信号、デジタル信号など)を使用して通信される場合がある。ネットワーク・インターフェースは、その他のコンピュータ・システム又はあらゆるタイプの外部電子デバイスを含む場合があるその他のデバイスとインターフェースするために使用される場合がある。概して、ネットワークを介して他のデバイスにおいてアクセス可能なシステム・メモリ、持続型ストレージ及び/又はリモート・ストレージは、データブロック、データブロックのレプリカ、データブロック及び/又はそれらの状態に関連したメタデータ、データベース設定情報、及び/又は本明細書に記載のルーチンを実装する際に使用可能なあらゆるその他の情報を記憶する場合がある。
ある実装例では、I/Oインターフェースは、ネットワーク・インターフェース又はその他の周辺インターフェースを介するものを含む、プロセッサ、システム・メモリ及びシステムにおけるあらゆる周辺デバイスの間のI/Oトラフィックを調整する場合がある。幾つかの実施例では、I/Oインターフェースは、1つのコンポーネント(例えば、システム・メモリ)からのデータ信号を、別のコンポーネント(例えば、プロセッサ)によって使用するのに適したフォーマットに変換するために、あらゆる必要なプロトコル、タイミング又はその他のデータ媒体変換を行う場合がある。幾つかの実施例では、I/Oインターフェースは、例えば、ペリフェラル・コンポーネント・インターコネクト(PCI:Peripheral Component Interconnect)バス規格又はユニバーサル・シリアル・バス(USB:Universal Serial Bus)規格の異形などの、様々なタイプの周辺バスを介して取り付けられたデバイスのためのサポートを含む場合がある。また、幾つかの実施例では、システム・メモリへのインターフェースなどの、I/Oインターフェースの機能の幾つか又は全ては、プロセッサに直接組み込まれる場合がある。
ネットワーク・インターフェースは、コンピュータ・システムと、例えば、その他のコンピュータ・システム(1つ又は複数のストレージ・システム・サーバ・ノード、プライマリノード、読み取り専用ノード・ノード及び/又は本明細書に記載のデータベース・システムのクライアントを実装してもよい)などの、ネットワークに取り付けられたその他のデバイスとの間でデータが交換されることを可能にする場合がある。加えて、I/Oインターフェースは、コンピュータ・システムと、様々なI/Oデバイス及び/又はリモート・ストレージとの間の通信を可能にする場合がある。入力/出力デバイスは、幾つかの実施例では、1つ又は複数のディスプレイ端子、キーボード、キーパッド、タッチパッド、スキャニング・デバイス、音声又は光学認識デバイス、又は1つ若しくは複数のコンピュータ・システムによってデータをエンター若しくは検索するのに適したあらゆるその他のデバイスを含む場合がある。これらは、特定のコンピュータ・システムに直接接続されるか又は概してクラウド・コンピューティング環境やグリッド・コンピューティング環境における複数のコンピュータ・システム、又は複数のコンピュータ・システムを含むその他のシステムに接続される場合がある。複数の入力/出力デバイスは、コンピュータ・システムと通信して存在する場合があるか又はコンピュータ・システムを含む分散型システムの様々なノードに分散させられる場合がある。本明細書に記載のユーザー・インターフェースは、CRTディスプレイ、LCDディスプレイ、LEDディスプレイ及びその他のディスプレイ技術を含む場合がある様々なタイプのディスプレイ・スクリーンを使用するユーザーに見える場合がある。幾つかの実装例では、入力は、タッチスクリーン技術を使用するディスプレイを介して受け取られる場合があり、その他の実装例では、入力は、キーボード、マウス、タッチパッド又はその他の入力技術、又はこれらの技術のあらゆる組み合わせを介して受け取られる場合がある。
幾つかの実施例では、類似の入力/出力デバイスは、コンピュータ・システムとは別個である場合があり、ネットワーク・インターフェースを経由するなど、有線又は無線接続を介してコンピュータ・システムを含む分散型システムの1つ又は複数のノードと相互作用する場合がある。ネットワーク・インターフェースは、一般に、1つ又は複数の無線ネットワーキング・プロトコル(例えば、Wi-Fi/IEEE802.11、又は別のワイヤレス・ネットワーキング規格)をサポートする場合がある。ネットワーク・インターフェースは、例えば、その他のタイプのイーサネット(登録商標)・ネットワークなどのあらゆる適切な有線又は無線の一般データ・ネットワークを介した通信をサポートする場合がある。加えて、ネットワーク・インターフェースは、アナログ音声ネットワークなどの遠隔通信/電話ネットワークを介した通信、又はファイバ・チャネル・SANなどのストレージ・エリア・ネットワークを介した又はあらゆるその他の適切なタイプのネットワーク及び/又はプロトコルを介したデジタル・ファイバ通信ネットワークをサポートする場合がある。
本明細書に記載の分散型システム実施例のいずれも、又はそれらコンポーネントのいずれも、クラウド・コンピューティング環境における1つ又は複数のネットワーク・ベース・サービスとして実装される場合がある。例えば、データベース・システムのデータベース階層内の読み書きノード及び/又は読み取り専用ノードは、本明細書に記載の分散型ストレージシステムを用いるデータベース・サービス及び/又はその他のタイプのデータ・ストレージ・サービスをネットワーク・ベース・サービスとしてクライアントに提供する場合がある。幾つかの実施例では、ネットワーク・ベース・サービスは、ネットワークを経由した相互運用可能なマシン同士の相互作用をサポートするように設計されたソフトウェア及び/又はハードウェア・システムによって実装される場合がある。ウェブ・サービスは、ウェブ・サービス記述言語(WSDL:Web Services Description Language)などの機械処理可能フォーマットで記述されたインターフェースを有する場合がある。その他のシステムは、ネットワーク・ベース・サービスのインターフェースの記述によって指示された形式でネットワーク・ベース・サービスと相互作用する場合がある。例えば、ネットワーク・ベース・サービスは、その他のシステムが呼び出す場合がある様々なオペレーションを規定する場合があり、様々なオペレーションをリクエストしたときにその他のシステムが従うと予想される場合がある特定のアプリケーション・プログラミング・インターフェース(API:application programming interface)を規定する場合がある。
様々な実施例では、ネットワーク・ベース・サービスは、ネットワーク・ベース・サービス・リクエストに関連したパラメータ及び/又はデータを含むメッセージの使用を介してリクエストされる場合がある又は呼び出される場合がある。このようなメッセージは、拡張マークアップ言語(XML:Extensible Markup Language)などの特定のマークアップ言語に従ってフォーマットされる場合があり、且つ/又はシンプル・オブジェクト・アクセス・プロトコル(SOAP:Simple Object Access Protocol)などのプロトコルを使用してカプセル化される場合がある。ネットワーク・ベース・サービス・リクエストを行うために、ネットワーク・ベース・サービス・クライアントは、リクエストを含むメッセージをアセンブルし、ハイパーテキスト・転送・プロトコル(HTTP:Hypertext Transfer Protocol)などのインターネット・ベース・アプリケーション・レイヤ・転送・プロトコルを使用して、ウェブ・サービスに対応するアドレス可能なエンドポイント(例えば、ユニフォーム・リソース・ロケータ(URL:Uniform Resource Locator))にメッセージを運ぶ。幾つかの実施例では、ネットワーク・ベース・サービスは、メッセージ・ベース技術ではなくレプリゼンテーショナル・ステート・トランスファ(REST:Representational State Transfer)技術を使用して実装される場合がある。例えば、REST技術に従って実装されたネットワーク・ベース・サービスは、PUT、GET又はDELETEなどのHTTPメソッド内に含まれたパラメータを介して呼び出される場合がある。
別段の定めがない限り、本明細書において使用された全ての技術用語及び科学用語は、本発明が属する技術分野における当業者によって一般的に理解されるのと同じ意味を有する。本明細書に記載されたものと類似又は同等のあらゆる方法及び材料もまた、本発明の実用又は試験において使用することができるが、限られた数の典型的な方法及び材料が本明細書に記載されている。本明細書における発明の概念から逸脱することなく多くのさらなる変更が可能であることが当業者に明らかとなるであろう。
本明細書において使用された全ての用語は、文脈と一致する可能な限り最も広い形式で解釈されるべきである。本明細書においてグループ化が使用される場合、そのグループの全ての個々のメンバー並びにそのグループの全ての可能なコンビネーション及びサブコンビネーションは、個々に含まれることが意図されている。本明細書において範囲が述べられている場合、その範囲は、範囲内の全てのサブレンジ及び個々の点を含むことが意図されている。本明細書に引用された全ての参照物は、本明細書の開示との矛盾がない範囲で参照により本明細書に組み込まれる。
Claims (16)
- 複数のEメール・アドレスから1つのEメール・アドレスを選択するためのシステムであって、
命令のシーケンスを記憶するメモリと、
前記命令のシーケンスを実行するように構成されたプロセッサと、を含み、前記命令のシーケンスは、実行されたとき、前記プロセッサに、
オブジェクトに関する個人を特定できる情報(PII)の少なくとも1つのアイテムを返すためにアイデンティティ・グラフを検索することと、
メタデータの少なくとも1つのアイテムを前記PIIの少なくとも1つのアイテムに関連付けることと、
前記複数のEメール・アドレスと、前記複数のアドレス毎のEメール品質を示す複数のフラグとを含むエビデンス・データベースを構築することと、
前記複数のフラグに基づいて前記複数のEメール・アドレスのそれぞれをランク付けすることと、
を行わせる、システム。 - 前記プロセッサはさらに、前記複数のEメール・アドレスのうちの2つ以上が等しくランク付けされたかどうかを判断し、そうであるならば、前記複数のEメール・アドレスから最良のEメール・アドレスを選択するためにタイブレーカ・ルーチンを行うように構成されている、請求項1に記載のシステム。
- 前記プロセッサはさらに、Eメール・アドレスをベース・プロファニティ・リストと比較するように構成されている、請求項2に記載のシステム。
- 前記プロセッサはさらに、部分マッチング、又はファジー・マッチング、又は音声マッチング、又は部分マッチング、ファジー・マッチング及び音声マッチングの任意の組み合わせによって、前記Eメール・アドレスを前記ベース・プロファニティ・リストと比較するように構成されている、請求項3に記載のシステム。
- 複数のEメール・アドレスから1つのEメール・アドレスを選択するための、コンピュータ実装された方法であって、
オブジェクトに関する個人を特定できる情報(PII)の少なくとも1つのアイテムを返すためにアイデンティティ・グラフを検索するステップと、
メタデータの少なくとも1つのアイテムを前記PIIの少なくとも1つのアイテムに関連付けるステップと、
前記複数のEメール・アドレスと、前記複数のアドレス毎のEメール品質を示す複数のフラグとを含むエビデンス・データベースを構築するステップと、
前記複数のフラグに基づいて前記複数のEメール・アドレスのそれぞれをランク付けするステップと、
を含む、コンピュータ実装された方法。 - 前記複数のEメール・アドレスのうちの2つ以上が等しくランク付けされたかどうかを判断し、そうであるならば、前記複数のEメール・アドレスから最良のEメール・アドレスを選択するためにタイブレーカ・ルーチンを行うステップをさらに含む、請求項5に記載のコンピュータ実装された方法。
- 前記複数のEメール・アドレスのうちの少なくとも1つをベース・プロファニティ・リストと比較するステップをさらに含む、請求項6に記載のコンピュータ実装された方法。
- 前記複数のEメール・アドレスのうちの少なくとも1つをベース・プロファニティ・リストと比較する前記ステップは、部分マッチング、又はファジー・マッチング、又は音声マッチング、又は部分マッチング、ファジー・マッチング及び音声マッチングの任意の組み合わせを行う、請求項7に記載のコンピュータ実装された方法。
- Eメール・アドレス選択システムであって、
アイデンティティ・グラフと、
プロセッサと、
非一時的な、コンピュータ可読ストレージ媒体であって、
オブジェクトに関する個人を特定できる情報(PII)の少なくとも1つのアイテムを返すためにアイデンティティ・グラフを検索することと、
メタデータの少なくとも1つのアイテムを前記PIIの前記少なくとも1つのアイテムに関連付けることと、
前記複数のEメール・アドレスと、前記複数のアドレス毎のEメール品質を示す複数のフラグとを含むエビデンス・データベースを構築することと、
前記複数のフラグに基づいて前記複数のEメール・アドレスのそれぞれをランク付けすることと、
を行うためのコンピュータ命令を含む、非一時的な、コンピュータ可読ストレージ媒体と、
を含む、Eメール・アドレス選択システム。 - 前記非一時的な、コンピュータ可読ストレージ媒体はさらに、前記複数のEメール・アドレスのうちの2つ以上が等しくランク付けされたかどうかを判断し、そうであるならば、前記複数のEメール・アドレスから最良のEメール・アドレスを選択するためにタイブレーカ・ルーチンを行うためのコンピュータ命令を含む、請求項9に記載のEメール・アドレス選択システム。
- 前記非一時的な、コンピュータ可読ストレージ媒体はさらに、少なくとも1つのEメール・アドレスをベース・プロファニティ・リストと比較するためのコンピュータ命令を含む、請求項10に記載のEメール・アドレス選択システム。
- 少なくとも1つのEメール・アドレスをベース・プロファニティ・リストと比較するための前記非一時的な、コンピュータ可読ストレージ媒体はさらに、部分マッチング、又はファジー・マッチング、又は音声マッチング、又は部分マッチング、ファジー・マッチング及び音声マッチングの任意の組み合わせのためのコンピュータ命令を含む、請求項11に記載のEメール・アドレス選択システム。
- 最良のEメール・アドレスを選択するためのシステムであって、
複数のレコードを含むアイデンティティ・グラフであって、各レコードは、複数のフィールドを含み、前記複数のレコード内の前記複数のフィールドのうちの少なくとも幾つかは、Eメール・アドレスではない個人を特定できる情報(PII)のアイテムを表すデータ・ストリングを含み、前記複数のレコード内の前記複数のフィールドのうちの少なくとも幾つかは、Eメール・アドレスを表すデータ・ストリングを含む、アイデンティティ・グラフと、
メタデータの少なくとも1つのアイテムを前記PIIの複数のアイテムのうちの少なくとも1つに関連付けるように構成されたメタデータ・エンジンと、
前記複数のEメール・アドレスと、前記複数のアドレス毎のEメール品質を示す複数のフラグとを含むエビデンス・データベースを構築するように構成されたエビデンス・エンジンと、
前記複数のフラグに基づいて前記複数のEメール・アドレスのそれぞれをランク付けするように構成されたランキング・エンジンと、を含む、システム。 - 前記複数のEメール・アドレスのうちの2つ以上が等しくランク付けされたかどうかを判断し、そうであるならば、前記複数のEメール・アドレスから最良のEメール・アドレスを選択するためにタイブレーカ・ルーチンを行うように構成されたタイブレーカ・エンジンをさらに含む、請求項13に記載のシステム。
- Eメール・アドレスをベース・プロファニティ・リストと比較するように構成されたサレイシャス・エンジンをさらに含む、請求項14に記載のシステム。
- 前記サレイシャス・エンジンはさらに、部分マッチング、又はファジー・マッチング、又は音声マッチング、又は部分マッチング、ファジー・マッチング及び音声マッチングの任意の組み合わせを行うように構成されている、請求項15に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962911259P | 2019-10-05 | 2019-10-05 | |
US62/911,259 | 2019-10-05 | ||
PCT/US2020/054106 WO2021067835A1 (en) | 2019-10-05 | 2020-10-02 | System and method for email address selection |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022550610A true JP2022550610A (ja) | 2022-12-02 |
Family
ID=75336642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022520824A Pending JP2022550610A (ja) | 2019-10-05 | 2020-10-02 | Eメール・アドレス選択のためのシステム及び方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20240070157A1 (ja) |
EP (1) | EP4038554A4 (ja) |
JP (1) | JP2022550610A (ja) |
CA (1) | CA3157120A1 (ja) |
WO (1) | WO2021067835A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113535880B (zh) * | 2021-09-16 | 2022-02-25 | 阿里巴巴达摩院(杭州)科技有限公司 | 地理信息确定方法、装置、电子设备及计算机存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030097361A1 (en) * | 1998-12-07 | 2003-05-22 | Dinh Truong T | Message center based desktop systems |
US20040015699A1 (en) * | 2000-09-22 | 2004-01-22 | Thomas Christopher Field | Identification and contact information |
US7254573B2 (en) * | 2002-10-02 | 2007-08-07 | Burke Thomas R | System and method for identifying alternate contact information in a database related to entity, query by identifying contact information of a different type than was in query which is related to the same entity |
US7634463B1 (en) * | 2005-12-29 | 2009-12-15 | Google Inc. | Automatically generating and maintaining an address book |
US8086676B2 (en) * | 2007-12-17 | 2011-12-27 | Smooth Productions Inc. | Contact aggregator |
US8180630B2 (en) * | 2008-06-06 | 2012-05-15 | Zi Corporation Of Canada, Inc. | Systems and methods for an automated personalized dictionary generator for portable devices |
AU2013295603A1 (en) * | 2012-07-26 | 2015-02-05 | Experian Marketing Solutions, Inc. | Systems and methods of aggregating consumer information |
US20150373092A1 (en) * | 2014-06-23 | 2015-12-24 | Synchronoss Technologies, Inc. | Apparatus, system and method of aggregating multiple address book sources |
WO2018213325A1 (en) * | 2017-05-19 | 2018-11-22 | Liveramp, Inc. | Distributed node cluster for establishing a digital touchpoint across multiple devices on a digital communications network |
-
2020
- 2020-10-02 CA CA3157120A patent/CA3157120A1/en active Pending
- 2020-10-02 JP JP2022520824A patent/JP2022550610A/ja active Pending
- 2020-10-02 WO PCT/US2020/054106 patent/WO2021067835A1/en active Application Filing
- 2020-10-02 US US17/766,471 patent/US20240070157A1/en active Pending
- 2020-10-02 EP EP20870862.8A patent/EP4038554A4/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20240070157A1 (en) | 2024-02-29 |
WO2021067835A1 (en) | 2021-04-08 |
EP4038554A1 (en) | 2022-08-10 |
EP4038554A4 (en) | 2023-11-01 |
CA3157120A1 (en) | 2021-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6440781B2 (ja) | 関連する投稿および入力要素を含むスポンサ記事ユニットの生成 | |
US9779416B2 (en) | Using fingerprinting to identify a node in a social graph of sharing activity of users of the open web as representing a particular person | |
JP6408014B2 (ja) | ニュースフィード内でソーシャル・ネットワーキング・システム・ユーザに提示するためにコンテンツ・アイテムを選択すること | |
JP6125519B2 (ja) | 物理装置またはソフトウェアアプリケーションの識別子間の関連に基づく、ネットワーク接続された装置を使用するときのユーザ活動の識別および追跡 | |
AU2011341576B2 (en) | Targeting social advertising to friends of users who have interacted with an object associated with the advertising | |
JP6472244B2 (ja) | ソーシャル・ネットワーキング・システムにおける認知的関連性ターゲティング | |
CA2865749C (en) | Targeting stories based on influencer scores | |
US20180365710A1 (en) | Website interest detector | |
US20100217720A1 (en) | Identifying users for effective propagation of content | |
KR20060130029A (ko) | 컴퓨터 네트워크를 통한 광고 캠페인의 최적화 방법 | |
KR20200011443A (ko) | 사용자 디바이스 이벤트의 매칭 및 속성 | |
JP2020521232A (ja) | デジタル通信ネットワーク上の複数のデバイスにわたるデジタルタッチポイントを確立するための分散ノードクラスタ | |
US20110131503A1 (en) | Apparatus and methods for providing targeted advertising from user behavior | |
JP2022550610A (ja) | Eメール・アドレス選択のためのシステム及び方法 | |
US9276757B1 (en) | Generating viral metrics | |
US10832279B2 (en) | Aggregation of unique user invocations in an online environment | |
EP3447711A1 (en) | Website interest detector | |
US20240054030A1 (en) | Local and Remote Event Handling | |
US10055766B1 (en) | Viral marketing object oriented system and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230713 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240717 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240723 |