CN110637317A - 用于在数字通信网络上跨多个设备建立数字接触点的分布式节点群集 - Google Patents

用于在数字通信网络上跨多个设备建立数字接触点的分布式节点群集 Download PDF

Info

Publication number
CN110637317A
CN110637317A CN201880032941.XA CN201880032941A CN110637317A CN 110637317 A CN110637317 A CN 110637317A CN 201880032941 A CN201880032941 A CN 201880032941A CN 110637317 A CN110637317 A CN 110637317A
Authority
CN
China
Prior art keywords
contact point
egre
hhl
household
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880032941.XA
Other languages
English (en)
Inventor
A·莫汉拉尔
D·W·柯林斯
P·R·马鲁帕利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chain Rui Co Ltd
LiveRamp Inc
Original Assignee
Chain Rui Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chain Rui Co Ltd filed Critical Chain Rui Co Ltd
Publication of CN110637317A publication Critical patent/CN110637317A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

并行计算环境中的分布式节点群集架构提供了通过多个电子通信设备访问通信网络的个人和家庭与在网络上进行通信时使用的一个或多个特定数字接触点的关联。当确定了个人或家庭名称时,该群集有助于确定接触点,或者替换地,当接收到接触点时,该群集有助于确定个人或家庭。数字接触点与个人或家庭的持久链接与在节点群集处执行的实体解析系统进行通信,以跟踪与实体有关的数据,从而允许接触点随时间与此类个人消费者或家庭进行协调。

Description

用于在数字通信网络上跨多个设备建立数字接触点的分布式 节点群集
技术领域
本发明的领域是数字通信,并且尤其是对于关于在数字通信网络中使用多个电子通信设备的经标识个人或家庭的一个或多个“接触点”的关联和解释的并行处理解决方案。
背景技术
数字网络上的通信不是发生在实际人员之间,而是在可由人员使用的电子设备之间。今天非常普遍的是,当特定个人在诸如互联网之类的数字通信网络上进行数字通信时,会使用多个电子设备。例如,特定的个人可能拥有并使用台式计算机、膝上型计算机、数字平板电脑、游戏机、数字机顶盒和智能手机,所有这些都通过蜂窝网络、Wi-Fi网络、卫星、直接有线电视线或电话线连接、或其他方式连接到因特网。
区分用于数字通信网络上的数字通信的各个电子设备是相对容易的。例如,网站通常使用在访问该网站的个人所使用的电子设备上设置(即存储)的持久性“cookie”。这些cookie是小型文本文件,其中包含各种信息,诸如特定电子设备的标识符。当用户在以后将Web浏览器定向到同一网站时,该网站可以读取该永久性cookie,从而将该特定电子设备标识为先前已访问过该网站。同样,第三方cookie通常由网站使用,以允许跨可能访问的多个网站跟踪特定电子设备的使用。包含许多用户感兴趣的内容的网站可能包含广告,这些广告在用户的Web浏览器上设置了许多第三方cookie,用于跟踪和广告获利目的。用于标识数字通信网络上的特定电子设备的其他技术包括电子设备的“指纹识别”,这可涉及例如由网站进行的对电子设备的各种软件和硬件配置的检查,以便创建该设备的将其与数字通信网络上的其他设备区分开的唯一简档。
跨数字通信网络使用的电子通信设备进行通信的个人和家庭使用若干类型的接触点(TP)中的一种或多种,诸如数字电话号码、电子邮件地址、社交句柄和移动广告标识符。个人可以具有任何接触点类型的一个或多个特定(接触点)实例。为了本文的目的,“接触点”可以被定义为数字接触点,该数字接触点可以定义和扩张对个人或家庭的触及范围。例如,电子邮件地址、电话号码、社交媒体句柄、移动广告标识符(MAID)和游戏中句柄是数字接触点的非排他性示例。这些接触点不一定与数字通信网络上的特定电子通信设备相关联。例如,同一个人可以使用他或她的电子邮件地址通过该个人采用的多个电子通信设备发送通信。同样,不同的人可以使用不同的电子邮件地址、社交媒体句柄等使用同一电子通信设备通过因特网进行通信,诸如使用家庭膝上型计算机的多个人。在另一示例中,家庭客人也可以在使用游戏控制台时使用他们自己的数字接触点进行通信,即使该数字接触点没有与游戏控制台所处的家庭中的人相关联。因此,仅通过知道特定电子设备上使用了特定数字接触点以通过数字通信网络进行通信,不可能将数字接触点与特定个人甚至特定家庭相关联。
每种接触点类型的多个接触点实例通常与特定的个人或家庭相关联。例如,单个人可能具有供个人使用的电子邮件地址和与他或她的职业相关联的电子邮件地址、在多个社交媒体论坛中使用的不同社交媒体句柄、企业座机电话号码和个人蜂窝电话号码。同样,某些接触点实例可能与家庭而不是特定个人相关联,诸如家庭电子邮件地址。为了联系通过多个电子通信设备与数字通信网络交互的特定个人或家庭而使用的“最佳”接触点实例的标识可取决于要传递的消息的类型和上下文。
区分与一组数字接触点实例相关联的特定家庭或特定个人,并为个人或家庭标识一个或多个“最佳”接触点实例,对于通过数字通信网络向个人和家庭提供信息的各方具有重大价值。例如,广告商可以通过了解哪些个人或家庭与特定的数字接触点实例相关联,或者至少通过了解哪些数字接触点实例与特定广告细分中的个人或家庭相关联,或者哪些数字接触点实例展现出特定的购买倾向,将基于因特网的广告更好地定向到最有可能对该广告感兴趣从而最有可能做出响应的消费者。同时,任何将个人或家庭与特定数字接触点实例相关联的系统都必须确保这些个人和家庭的隐私得到保护,从而遵守适用司法管辖区的各种隐私法律和规章以及已经与数字通信网络的使用相关地成长起来的行业最佳实践。因此,高度需要一种系统和方法,该系统和方法允许标识针对个人或家庭的给定接触点类型的最佳数字接触点实例,同时确保使用这些数字通信网络上的电子通信设备的个人和家庭的隐私。
发明内容
本发明尤其针对一种分布式节点群集架构计算系统,该系统尤其允许将个人和家庭与在使用数字通信网络上的电子通信设备进行通信时使用的一个或多个数字接触点实例进行关联。本发明结合了实体图解析储存库(EGRR),它是一种不可发现的储存库,其允许实体的解析,其中每个实体包括个人可识别信息(PII)表示、属性和元数据的集合。使用专有链接技术,诸如在美国专利号6,523,041和6,766,327中描述的(在此通过引用将其全部内容并入),为这些实体给出了持久和维护的标识链接。为了本发明的目的,主要实体代表“消费者”、“地址”和“家庭”。本发明还包括实体图解析引擎(EGRE),其位于EGRR的顶部并且负责进入该图(匹配服务,由匹配服务完成的链接),以及对适当的请求信息的检索。
本发明利用EGRR来执行必要的计算。在某些实现中,本发明可以允许在给定个人或家庭名称时确定数字接触点实例,或者可替换地,可以允许在给定数字接触点实例时确定对应的个人或家庭。这是通过创建数字接触点实例与个人/家庭的持久链接来实现的,反之亦然。在各种实现中,本发明可以分为四个框架:
a.针对个人的最佳接触点实例:该框架标识一个或一组最活跃或当前的数字接触点实例并将其与个人相关联。同样,该框架管理与该人相关联的接触点实例的生命周期。
b.针对家庭的最佳接触点实例:该框架标识一个或一组最活跃或当前的数字接触点实例并将其与家庭相关联。同样,该框架管理与该家庭相关联的接触点实例的生命周期。
c.针对接触点实例的最佳个人:该框架标识一个或一组个人并将其与数字接触点实例相关联。
d.针对接触点实例的最佳家庭:该框架标识一个家庭或一组家庭并将其与数字接触点实例相关联。
除了接触点之外,EGRR还包含名称、地址、消费者链接(CL)、地址链接(AL)和家庭链接(HHL)。消费者链接是一个数字、字母或字母数字值,其表示从EGRR中使用的个人的单个表示点。消费者世界中没有两个消费者共享相同的CL,即,每个CL跨CL的世界是唯一的。地址链接是数字、字母或字母数字值,其表示从EGRR中使用的地址的单个表示点。像每个CL一样,每个AL跨AL世界是唯一的。家庭链接是一个数字、字母或字母数字值,其表示从EGRR中使用的家庭的单个表示点(即,当前AL处的单个或多个CL的组合)。每个HHL跨HHL的世界也是唯一的。本发明的这些实现还利用实体解析系统(ER),其由EGRR和EGRE两者组成。节点群集架构中的多个节点可用于利用并行处理的优点,以大大提高系统内的操作速度。
在某些实现中,本发明仅使用如下数字接触点实例:其中接触点实例的行为基于由个人使用由个人控制的数字通信网络上的电子通信设备所断言的活动。例如,这些类型的接触点包括电话号码、电子邮件地址、MAID、社交网络句柄、游戏句柄等。该框架使用源数据来构建,并基于可通过EGRR向ER提供的个人身份信息(PII)的历史以及来自内部元数据的使用历史而构建。根据系统的某些实现,利用该系统和方法的客户可以提交数字接触点实例,并基于客户的用例取回个人或家庭链接。客户还可以传递与个人或家庭相关联的个人身份信息(PII),诸如姓名或地址,并基于客户的用例寻求取回与该个人或家庭相关联的最佳数字接触点实例。
本发明的这些和其他特征、目标及优点将通过结合如以下描述的附图考虑以下对各实施例和所附权利要求书的详细描述而变得更好理解:
附图的简要说明
图1是根据本发明的实现的来自实体图解析储存库(EGRR)的示例性数据的表。
图2是用于本发明的实现的高级流程图,该实现用于针对每个接触点类型的每个接触点实例选择最佳个人/家庭。
图3是图2的第一子系统(框14)的详细版本(即,最佳个人/家庭的选择决定)。
图4是来自图3中描绘的输入数据的聚合的实现的示例性数据的表。
图5是来自使用来自图4的表的示例性数据的决策子系统(图2的框22)的输出的表。
图6是用于本发明的实现的高级流程图,该实现用于针对每个个人/家庭从每个接触点类型的可用接触点实例中选择最佳接触点实例。
图7是图6的第一子系统(框40)的详细版本(即,最佳接触点实例的选择决定)。
图8A是来自图7中描绘的用于消费者链接的输入数据的聚合的实现的示例性数据的表。
图8B是来自图7中描绘的用于家庭链接的输入数据的聚合的实现的示例性数据的表格。
图9是来自使用来自图8的表的示例性数据的决策子系统(图6的框42)的输出的表。
图10是根据本发明的实现的在客户端与实体图解析引擎(EGRE)之间的用于传递最佳接触点实例的通信的流程图。
图11是根据本发明的实现的在客户端和EGRE之间的用于传递最佳消费者链接/家庭链接的通信的流程图。
图12是解说利用本发明的实现的系统存储改进的表。
图13是解说利用本发明的实现的处理时间改进的表。
具体实施方式
在更详细地描述本发明之前,应当理解,本发明不限于所描述的特定实施例和实现,并且在描述特定实施例和实现时所使用的术语仅用于描述那些特定实施例和实现的目的,而并不旨在进行限制,因为本发明的范围将仅通过权利要求书限定。特别是,尽管此描述使用的是传统家庭的概念,但有关家庭的每个权利要求对于由某些地方共性定义的一组个人的任何概念(包括大家庭、商业伙伴等)均同样有效。
可以结合图2-3的流程图来描述用于确定针对给定接触点实例的最佳个人/家庭的方法,以来自EGRR的示例性数据开始,如图1中的表格形式所示。图1的数据提供了消费者链接、家庭链接、相关联的名字和姓氏、接触点、相关联的URL和接触点实例的类型的示例。当给定接触点的实例时,该实例可能与一个或多个个人和/或家庭有若干潜在关联。(为了清楚起见,这里的示例仅限于个人,但是本发明将相同概念针对家庭作了扩展。)与该接触点实例相关联的“最佳”个人链接(CL)或家庭链接(HHL)必须首先具有实际上该关联看起来是有效的关联(由多个假定的独立来源确认和/或在最近时间的时间范围内多次出现)的合乎情理的证据。同样,所选“最佳”关联必须不具有比任何其他候选关联更少的合乎情理证据。每当没有明确的最佳关联时,需要对所有“最佳”关联进行比较,以查看它们之间是否有很强的局部关系。这样的强局部关系包括不同的人共享相同的姓氏和/或多个共同地址和/或属于同一家庭和/或EGRR中的任何此类相似的共同属性。如果是这样,则可以假定访问这些候选人中的任何一个都有间接访问一组相关个人中的其他候选人的良好机会。因此,相关个人的最大的此集合可以增强这些个人的关联,因此可以将其选为“最佳”,其效果是为该特定组中的所有个人优化预期的营销影响。
在本发明的一种实现中,为了分析时间分量,从各种适当的源中为每个经标识的接触点/个人或家庭关联对收集当月和至少前五个月的交易历史数据,并将其收集在EGRR中作为纵向数据。如果需要,此系统的实现可以收集长达三年或少至三个月的数据。该数据是从跨数字通信网络进行通信的电子通信设备中收集的。来源(即,在记录数量和不同报告的接触点类型两者)的覆盖范围可能不同。所收集的数据可包括共享同一个人的多个此类关联对,因为许多个人具有有效的多个接触点实例,也有多个个人共享一个共用接触点实例,因为诸如电子邮件和电话号码之类的许多接触点实例在多个人之间共享。这些关联对首先根据接触点实例进行聚合(例如,在所有不同的电话号码上进行聚合),然后再就个人而言在每个初始聚合组中进行次聚合。该过程驱动了通过获取先前所述的所收集的数据并按其时间戳每月对其进行聚合,并对从最近一个月开始并在时间上向后移动的结果进行排序来构建时间信号模式。这允许从历史上看到个人/家庭和接触点实例两者的关联。例如,该时间数据可以指示哪个个人正在最多地使用该特定接触点,以及哪个接触点实例是给定个体使用最多的。
现在参考图2和3,可以更详细地描述该过程。特别是,我们将讨论图2,它是系统的高级概述。该图包含一个组件(框14),将在图3中进行更详细的讨论。输入10包括当月的一组原始数据源文件(框12),其中包含个人与接触点实例之间声明的当前关联。这些是由第三方来源贡献者提供的来源。输入10还包括个人(在EGRR上计算的所有消费者链接关联)和接触点实例之间的历史推断的关联(框18)。提取这些关联仅是为了弥补历史推断的关联之间的空白,这些关联是EGRR的一部分,但最近并未由该系统中使用的第三方源数据提供。以月为基础收集和计算内部使用元数据(框20)。对于EGRR中的每个个人/接触点实例关联,其内部元数据形成如上所述的时间信号模式。此聚合数据用于推断个人/家庭两者的行为可能发生的变化。域(URL)分类(框24)按照其行业类型对URL分类。一些第三方数据源是从在线源编译而来的。从中收集数据的URL在源文件上发送。这些URL的分类基于其行业分类,例如:www.amazon.com将被标记为零售URL,而cnn.com将被标记为媒体URL,而citi.com将被标记为金融URL。
EGRE系统在Hadoop分布式文件系统计算环境上被进行处理(框16)。尽管由于Hadoop的对于涉及非常大的数据集的操作的特别有效的工具,Hadoop是进行此类处理的理想环境,但本发明并不仅限于此,在替换实现中也可以使用其他类型的分布式文件系统计算环境。系统的此组件包括若干子组件。“标识针对接触点实例的合乎情理的当前个人/家庭”(框14)组合输入数据并在接触点实例处聚合信息。然后,此信息用于为接触点实例选择最佳(最活跃)的CL/HHL。决策中使用的数据的上下文以及决策本身两者都将被生成。将通过使用图3来更详细地描述该过程。来自框14的最终决策文件将被用于生成具有CL/HHL与接触点实例的关联的交叉参考文件(框22),以便被整合到EGRR建立中。然后,将来自框22的结果整合到EGRE(匹配服务)中,以用作客户消费的递送捆绑包的一部分(框26)。
现在使用图3详细描述框14(即,计算最合乎情理和最活跃的个人/家庭与其相应的接触点实例的关联的组件)。如在图2的描述中所指出的,图3中的所有处理都是使用Hadoop计算环境或其等效方式执行的。图3中的输入流(框10)与上面图2中的描述相同。一组原始数据源文件(如上所述的框12)将与Web地址/域分类(如上所述的框24)一起被读入系统以创建用于该数据的时间信号模式。首先,在框27,将这些原始数据源通过标准文件卫生学系统发送,这包括对数据的重复数据删除(即,移除重复的清单),以及名称表示、邮政地址表示和数字接触点实例的标准化。然后,通过EGRE匹配此增强数据,以将CL和HHL附加到每个记录。接下来,在框29,系统覆盖来自网址分类文件的行业标志,并在接触点实例上聚合数据,以在框29为源数据创建时间模式信号。作为该时间信号模式的一部分,在每个记录实例内记录每个经标识的接触点/个人关联。还记录了来自贡献记录的源的特定源标识符、源活动日期以及对数据有贡献的不同源的数量的计数。
在图3的框30处示出了每个接触点实例/个人/家庭关联的使用历史。在访问EGRR中的特定实体表示时,内部元数据包括该特定实体表示长期达固定时间段的访问历史的集合。此聚合数据用于推断它们标识的实体的行为可能发生的变化。此方法有助于提供可能的相关联的个人/家庭与接触点实例活动以及无法用当前第三方源数据模拟的变化的历史视图。特别地,本发明的发明人已经认识到,可以利用该广泛且匿名的覆盖范围来构建直接解决先前提到的所有问题的、EGRR中的每个消费者链接的代表性的接触点实例关联。此聚合的元数据被用于形成时间信号模式,其可以在非常细粒度的级别上直接标识和验证PII信息中的变化。相对于他们标识的延续了多年的接触点关联和属性数据,EGRR为每个个人/家庭提供了多个这样的时间视图。此类信息的收集和聚合被用于根据内部元数据构造时间模式信号,框30中所示。
如上所述,所有接触点和个人/家庭关联将被视为用于特定接触点实例关联的潜在最佳个人/家庭。组件框32弥合了原始数据源、内部元数据和来自EGRR的历史关联之间的空白。这些类型的关联会在接触点实例级别进行收集和聚合,来为每个个人/家庭和接触点实例关联提供单个视图。该组件将包含属性,如源贡献计数和来自EGRR的最后提供日期。
然后,在框34,将来自上述所有三个组件(框29、30和32)的文件组合起来以创建时间信号模式(使用数据上的时间戳),从而提供针对给定接触点实例及其以上收集到的相应关联属性的所有可能的个人/家庭的整体视图,其将在框36处输出。使用每个接触点/个人关联对的所有相应数据属性创建结果时间信号文件。图4是结果时间信号文件的表格形式的示例(请注意,为了清楚起见,该表分为两部分,但两部分中的对应行属于同一结果文件),现在将在以下示例中使用该结果时间信号文件。上面的结果文件在上下文中非常丰富,并且呈线性化、半结构化格式,从中在图3的框36处可以合乎情理地确定给定接触点实例的最佳个人(CL)或家庭(HHL)。不仅是标识了此单个个人/家庭,而且对具有某种程度的有意义的证据以支持与给定接触点实例的关联的个人/家庭的所有实例进行了排名。该排名取决于给定证据和相关上下文的强度和合乎情理性。每个候选关联的强度是通过两个维度来衡量的,即,证据的数量和提供关联的上下文类型。数量是通过提供给定关联的不同来源的数量来衡量的。例如,使用图4表中的第一个接触点“john.doe@yahoo.com”(列名为“接触点”),返回列出的单个CL 123(列名为“CL”)。如果有多个CL可用,则每个CL包括在此列中,但用竖线分隔。类似地,返回HHL 10001(列名为“HHL”)。此接触点实例还与两个名称相连,特别是“John Doe”和“John Dough”(列名为“名称”),以分号分隔。如果与此接触点实例有两个或更多个CL关联,则每个CL的名称都由竖线分隔(考虑该示例中的第二条记录)。针对此接触点实例有两个URL(列名为“URL”),以分号分隔。两个时间信号(列名为“时间信号模式”)是“45,38,26,24,19,12”和“111000”(以“#”分隔)。第一个代表从最近一个月开始到当前月为止通过EGRR访问此关联的次数。第二个代表该关联是否由至少一个数据源贡献,其中“1”表示是,“0”表示否。该强度还从最近的一个月到当前将被排序。
在排名过程中,如果个人到接触点实例关联是由EGRR的内部元数据中找到的多个独立数据提供者报告的,和/或通过不同的URL提供的,则此信息为该关联是相关的主张增加了情理性。大量此类证据集大大增强了关联的可信度。在第二维(即URL分类)方面,有时个人故意提供将永远不会被该个人使用(伪造或休眠的接触点实例)的接触点实例。这些实例通常可以通过评估该关联的来源的上下文性质而被排除考虑。例如,提供给约会服务的电子邮件比提供给调查站点的电子邮件更有可能成为对个人有意义的电子邮件。类似地,源于金融客户的内部元数据中记录的接触点关联访问比来自直接营销客户的接触点访问更有意义,而直接营销客户通常从各种各样的来源购买各种勘探数据。然后,在使用“冠军挑战者”反馈循环的双重排名系统上对这些关联进行排名,以维持逐月最终排名的主导行为。
作为此双重排名系统的一部分,首先,基于证据的上下文,将与接触点实例关联的个人/家庭分为强、中或弱。其次,然后基于证据的数量方面以及上面提到的上下文强度,对每个类别中的关联进行部分数字排序。例如,在图4中,mary.doe@yahoo.com从元数据的使用历史和数据源贡献中提取在强类别并且具有强时间信号模式的两个CL(CL 123和CL135)。具体地,CL 123分别报告时间信号28、17、36、27、18、15和001001,而CL 135分别报告时间信号55、39、37、42、29、12和111100。在mary.doe@yahoo.com的情况下,CL 135和CL 123两者都报告了来自内部元数据的一致访问信号以及过去六个月中数据源贡献者文件上的存在。但是该系统将CL 135识别为较高的排名,因为电子邮件的局部部分(mary.doe)与和CL 135相关联的个人的“Mary Doe”名称相匹配,访问次数始终较高,并且它作为在最近六个月中来自来源贡献者的最新四个被看到。同样,该系统将家庭10001标识为最佳家庭,因为CL 123和CL 135两者都属于10001的同一家庭。
如图4中所描绘的,在做出关于最佳选择的最终决定之前,将上个月的最佳选择,即“上月最佳CL”列中的值与所标识的选择进行比较。如果这两个值一致,则系统使用该值作为最终选择。如果没有,则必须重新评估证据,以确保有足够的差异推翻决定。在这种情况下,如果证据仅稍微强一些,则保留前一个,并期望如果所选择的证据正确,则将来其信号会越来越强,最终将成为最佳选择。
然后,通过上述图2中的框22处理来自此组件的结果文件,以从系统创建最终输出文件。该文件是接触点实例与为该相应的接触点实例选择的一组经排名CL和HHL的交叉引用,如图5中所示,即,接触点实例(在“接触点”列中)及其相应已选择的CL(在CL列中,多个CL由竖线分隔)或HHL(在HHL列中,多个HHL由竖线分隔)集合。将看到,在将接触点解析到多个CL或HHL的情况下,将以相对于接触点实例解析到的其他CL(在CL排名列中;当我们针对接触点实例有多个CL时,每个相应CL的排名由竖线分隔)或HHL(在HHL排名列中;当我们针对接触点实例有多个HHL时,每个相应HHL的排名由竖线分隔)的排名来返回这些CL或HHL。再者,这可以对应于使用同一接触点实例的多个个人或家庭,但是排名过程允许确定与给定接触点实例相关联的“最佳”个人或家庭。
对于反向过程,现在注意力可转向图6-9,即为个人或家庭确定最佳接触点实例。给定个人或个人的家庭,给定接触点可能有多个实例,这些实例与最初选择的一组人的成员相关联。“最佳”接触点实例必须首先有明确且合乎情理的证据,证明该实例与初始(一个或多个)个人的关联是有效且最新近的。接着,所选的最佳接触点实例的证据强度也不得少于其他任何候选。该上下文比以上参考图2-3描述的上下文更为复杂。在该上下文下,个人/家庭可以拥有活跃使用的多个接触点实例。然而,在某些此类情况下,提供接触点实例以旨在忽略通过它的任何通信,上面提供了此类示例。
图6和图7提供了计算针对CL或HHL(分别对应于特定个人或特定家庭)的最佳接触点的系统的视图。以类似于先前过程的方式,图6表示系统的高级视图。该图包含一个组件(框40),其将在图7中更详细地表示。
现在参考图6,在与上面参考图2-3描述的类似的过程中,使用与先前过程相同的输入来构造用于个人/接触点关联对的证据的时间信号模式(框10)。由于个人/家庭和接触点实例的角色已经反转,因此所收集的信息首先由个人聚合,然后在每个最初聚合的个人组中按接触点实例进行次聚合。数据的这种聚合再次允许在特定对级别和个体级别上这些关联的时间行为的二维视图。
在分布式文件系统计算环境上对该反转系统的处理(框16)同样按以下所述的步骤进行。标识个人/家庭的合乎情理的当前接触点实例(框40)组合输入数据并在个人/家庭处聚合信息。然后,此信息用于为个人(CL)/家庭(HHL)选择最佳(最活跃)的接触点实例。决策中使用的数据的上下文以及决策本身两者都将被生成。将通过使用图7来更详细地描述该过程。来自框40的最终决策文件将被用于在框42处生成具有从接触点实例到CL/HHL的关联的交叉参考文件,以便被整合到EGRR建立中。然后,将来自框42的结果整合到EGRE(匹配服务)中,以用作框44的处递送捆绑包的一部分,以供客户消费。
现在使用图7详细描述框40(即,来自图6的计算最合乎情理和最活跃的接触点实例与其各自的个人/家庭的关联的组件)。如在图6的描述中所指出的,使用Hadoop计算环境16执行图7中的所有处理。图7中的输入流(框10)与上面图6中的描述相同。一组原始数据源文件(如上所述的框12)将与Web地址/域分类(如上所述的框24)一起被读入系统以创建这一数据的时间信号模式。首先,这些原始数据源通过相同的标准文件卫生学子系统来发送,并附加了CL和HHL,如图3中框27处所示。接下来,系统覆盖来自网址分类文件的行业标志,并将数据聚合到个人/家庭,以在框46处为源数据创建时间模式信号。作为该时间信号模式的一部分,每个记录实例中的每个经标识的接触点实例/个人/家庭关联都在图7的框46处与相关的数据源信息一起记录(如图3中所述)。在图7的框48处示出了每个接触点实例/个人/家庭关联的使用历史。如在图3的描述中所述,在访问EGRR中的特定实体表示形式时,其内部元数据可捕获和聚合长期达固定时间段的数据。此聚合数据用于推断它们表示的实体的行为可能发生的变化。此方法有助于我们获得可能的接触点实例关联变化的历史视图,而当前的第三方源数据无法模拟这些变化。如在图3的描述中所指出的,发明人已经认识到,可以利用该广泛且匿名的覆盖范围来构造直接解决先前提到的所有问题的、EGRR中的每个消费者链接的代表性的接触点实例关联。如上所述,此聚合元数据用于形成时间信号模式,该时间信号模式可以非常细粒度的水平直接标识和验证PII信息中的变化。EGRR为每个接触点实例相对于它们多年的经标识的个人/家庭关联以及属性数据提供了多个此类时间视图。此类信息的收集和聚合被用于根据内部元数据构造时间模式信号,如框48中所示。
如上所述,所有接触点和个人/家庭关联将被视为特定个人/家庭关联的潜在最佳接触点实例。框50弥合了通过原始数据源以及内部元数据提供的关联覆盖范围与来自EGRR的所有历史关联之间的空白。这两种类型的关联在个人/家庭处收集和聚合,来为所有个人/家庭和接触点实例关联提供单个视图。该组件将包含属性,如源贡献计数和EGRR的最后提供日期。
然后,将上述所有三个组件(框46、48和50)中的文件组合起来,以创建时间信号模式,从而在框34处提供针对给定个人/家庭及其所有可能接触点实例及其以上收集的相应关联属性的历史视图。为每个接触点实例/个人/家庭关联对创建具有所有相应数据属性的结果文件,并在框52处输出。图8A提供了个人情况下的结果文件示例(请注意,为了清楚起见,该表被分为两部分,但是这两部分中的对应行与前面的示例中所做的操作属于同一结果文件)。将为家庭生成如图8B中所示的非常相似的单独结果文件。
如上面的反转过程描述中所述,上面的结果文件在上下文上非常丰富,并且呈线性化、半结构化格式,从中可在图7的框52处合乎情理地标识针对给定个人(CL)或家庭(HHL)的最佳接触点实例个人(CL)或家庭(HHL)。与前一系统一样,不仅标识了该单个接触点实例,而且还对具有某种程度有意义证据以支持与给定接触点实例的关联的每种接触点类型的所有接触点实例进行排名。与在前一系统一样,该排名是根据给定证据和相关联上下文的强度和合乎情理性来确定的。再一次,每个候选关联的强度是通过两个维度来衡量的,即,证据的量和提供关联的上下文类型。量是通过提供给定关联的不同来源的数量来衡量的。
使用与前一系统中描述的相同准则,此系统的排名过程与前一系统中描述的过程非常相似。然而,两个系统之间存在一个显著差异。在前一系统中,当为接触点实例选择最佳个人/家庭时,在查看时间证据以选择“最佳”之前,每个候选个人/家庭都被认为具有相同的可信度。对于这种情况,系统必须选择最佳接触点实例,并且某些接触点实例可能会受到质疑,而不管实际的时间数据如何。例如,如“000-000-0000”之类的明显“伪造”的电话号码、明显虚假的电子邮件实例或其域来自短寿命电子邮件地址提供商的电子邮件实例将不会被作为“最佳”实例返回。这样的实例可包括在“较差”类别中(如前一系统中已讨论过的)。例如,使用图8A表中的第一个个人(名称为“CL”的列中的CL 123),返回三个电子邮件实例(列名“Touchpoint Type”)为“john.doe@yahoo.com”,“john.doe@yahoo.com”和“john.doe@yahoo.com”(列名“Touchpoint”)。考虑到名为“URL”的列中的信息,第一个电子邮件实例是由金融机构和零售站点两者提供的,而其他两个实例是由较不可靠的站点(调查站点和社交站点)提供的。同样,第一个电子邮件实例包含与个人相关的两个名称之一,即“John Doe”(名为“姓名”的列)。考虑名为“时间信号模式”列中的两个时间信号,所有三个电子邮件实例都有有意义的使用信号,第一个电子邮件实例具有最强的信号,而第二个电子邮件实例具有次强的信号,最后一个实例具有最弱的信号。在“源文件中的存在”信号为0和1的情况下,第一个电子邮件实例是在最近三个月内看到的,第二个电子邮件实例是在最近两个月和六个月前看到的,而第三个仅在六个月前被看到。在对这些电子邮件实例进行排名的方面,该示例中的第一电子邮件和第二电子邮件基于上述信息被置于“良好”类别,而第三电子邮件由于较低时间计数、仅由一个调查站点提供贡献、并且没有任何原始数据源文件的最新贡献而被置于“中等”类别。此分类自动将此第三实例的排名低于“良好”类别的排名。考虑“良好”类别中的两个,上面收集的信息表明,第一电子邮件实例将初始被选为CL 123的最佳实例。对于最后一步(冠军挑战者过程),系统检查在“上个月最佳TP”列中的值,并且注意到初始选择的值与计算出的最佳值相同,因此该值被选作最终选择。应注意,如果上月的选择是其他两个电子邮件实例中的一个,则初始选择和其他选择之间的差异是巨大的,因此第一个实例将击败冠军(上月的选择)。
然后,通过以上在图6中提及的框42处理来自此组件的结果文件,以从系统创建两个最终输出文件。这些文件是CL/HHL与针对该CL和/或HHL选择的一组经排名的接触点实例的交叉引用,如图9所示,即CL(在CL列中)和HHL(在HHL列中)及其分别选择的一组接触点实例(在“个人最佳接触点”和/或“家庭最佳接触点”列中;多个接触点实例由竖线分隔)。将看到,在将CL和/或HHL解析到多个接触点实例的情况下,将以相对于将CL和/或HHL解析到的其他接触点实例的排名返回这些实例(在“接触点排名”列中;当我们具有针对CL和/或HHL的多个接触点实例时,每一相应接触点实例排名由竖线分隔)。同样,这可以对应于使用相同的CL和/或HHL的多个接触点实例,但是排名过程允许确定与给定的个人或家庭相关联的“最佳”接触点实例。同样,如上所述,接触点的排名可能因特定行业或用途而异,这取决于应用。
现在参考图10,上述来自CL/HHL系统的最佳接触点实例的交叉引用文件被用于根据客户的输入来确定个人/家庭的所需最佳接触点实例。如果客户希望为个人的任何接触点类型找到最佳的接触点实例,则在框54处,客户将为个人或家庭输入适当的实体表示。通过使用来自EGRE的匹配逻辑,将在框56处从EGRR中检索唯一链接(CL或HHL),并且将在框58处返回来自图6的框44的输出的适当的最佳接触点实例(此数据由这样的链接来(即CL/HHL)键控)。类似地,参考图11,来自上述接触点实例系统的最佳CL/HHL的交叉参考文件用于根据客户的输入来确定给定接触点实例的所需最佳CL/HHL。如果客户希望找到针对给定接触点实例的最佳CL/HHL,则客户将在框60处输入该接触点实例。框62处来自EGRE的结果包括图2的框26的输出,并以适当的EGRR的属性束返回。
该系统的一种实现位于包含300多个节点计算机/处理器的分布式Hadoop群集上。应用编程接口(API)可被用于接收来自客户端设备(诸如,膝上型计算机或台式计算机)的输入。同样,输出模块提供了一种将结果数据输出到客户端设备的方法。如前所述,由于简化了大型数据环境中的操作的关键特征,分布式文件系统计算环境特别适合于本发明的实现,但是其他实现也是可能的。同样,分布式群集的大小也不是实现该系统的重要要求,但是随着节点数量的增加,该系统的整体效率将大大提高。如图12中所参考的,在一种特定实现中,计算环境允许摄取超过28TB的输入数据。此数据包括几个月的内部元数据,多个实体表示形式以及从EGRR中提取的接触点参考表。还包括多个数据提供商源文件。这种数据的收集将创建上下文上丰富的提示文件,这些文件将在实际决策中使用,从而作出并归档最终决策和做出每个决策的上下文两者。结果的上下文提示文件的内存占用仅为175GB,这小于创建这些提示文件必须消耗和解释的数据占用空间的1%(在一种实现中,仅为0.63%)。这是通过创建以个人、家庭和接触点实例作为键控的半结构化数据来实现的,如分别在图4、图8A和图8B的表中看到的。这些提示文件是来自所创建的时间信号模式的输出,如图3和7所示。这些表示保留了所计算的丰富上下文框架,同时极大地减少了该实现的数据占用,如先前参考图3和图7所述。
即使后端处理使用的是多节点群集,也可以将这些输出的上下文提示文件轻松存储在客户端设备(诸如一台便携式计算机)上,以用于对上述每个接触点关联系统的结果的客户支持。这样做会将支持服务环境与计算环境分离。这种办法在数据安全性方面具有优势,因为大量数据被存储在防火墙之后,客户端设备可通过防火墙访问输出数据。由于可以使用任意数量的客户端设备,因此节省了成本并提高了效率,如果使用便携式或台式计算机,则购买和维护便宜。同样,仅需几秒钟即可查找支持最终结果(排名)的全部或部分证据的标识。以非常高效而准确的方式来标识所有候选者,来为接触点实例选择最佳个人/家庭以及为给定个人/家庭选择最佳接触点实例。类似地,这些候选者的最终排名也以相同程度的效率和准确性生成。
这种分布式系统允许以并行而非纯粹顺序的方式高效地处理大量原始数据。要解决的特定问题的性质使其自身适于分布式节点环境中的并行处理,因此,本发明针对一种分布式节点群集,其目的是通过允许在现实世界商业环境实际的时间帧中执行而使该过程可行。例如,假设需要摄取三个大文件,并且每个文件都可以彼此独立进行处理。如果每个文件需要两个小时的处理,那么顺序系统将需要六个小时以上的时间来处理所有数据,而分布式系统将只需要两个小时,因为每个文件都是并行处理的,并且从一个文件移到另一个文件不会浪费时间。此外,对于给定的算法,分布式系统可以容易地使用一系列独立的步骤,这些步骤可以将中间结果存储到磁盘上,而不是将它们保存在内存中。由于磁盘空间极大地超过了内存空间,因此该系统可用于实现计算和内存密集型精确算法,而无需对其进行更改以创建能够在典型串行单节点系统上成功运行的启发式(某种近似替代)算法。因此,使用该系统和方法不会降低系统结果的质量。
在该系统和方法中规定的计算环境允许用于大量所需数据的摄取和随后的决策过程的(在运行时间方面)极其高效的计算。在图13中,参照运行时间示出的系统数据的构造中有七个不同的组件。名为“存储大小”的列标识了这些组件中每个组件的输入存储。请注意,此实现使用了总共17.5TB的输入数据存储。如果这些组件在单个处理器上按顺序运行,则在名为“使用顺序处理的历时”的列中可以找到完成每个任务所需的时间(共14小时)。然而,该系统的一种实现如上所述在分布式网络上使用并行计算,并且每个步骤的时间都在名为“使用并行处理的历时”列中找到(总计3.5小时,即25%的时间)。
该系统可帮助客户提高市场前景。如果客户认识个人/家庭,他们可以基于他们的用例寻求一组最佳数字接触点,以达到/定位该个人/家庭。同样,如果他们拥有数字接触点,他们可以寻找可以使用该数字接触点作为目标或达到的一组最佳个人/家庭,通过这他们可以很好地了解其可销售的受众。因此,该系统使服务提供商的客户能够更好地标识、细分、定位并向其潜在客户(个人或家庭)营销。具体而言,可能实现的收益包括:客户可以导出对其目标潜在受众的更好了解;客户可以提高潜在消费者的准确性和覆盖面;客户可能期望具有有效的能力,以用一个接触点替换另一个接触点,但是仍然可以保持其受众的现有质量到达范围;以及客户将能够标识有效的数字手段以达到其可营销的受众。由于如上所述和图13中所示的示例极大地减少了处理时间,因此该系统允许决策过程在商业世界中实际的时间帧中发生。底层数据由于来自各种外部数据源的更新而不断变化的事实意味着,较慢的处理时间将导致输出在生成时已经过时。另一方面,简单的顺序处理可能会导致在生成输出时不再具有业务相关性的输出。
在当今瞬息万变的数字世界中,个人(CL)或家庭(HHL)可能与不止一种数字接触点类型相关联,每种接触点类型都具有多个接触点。对于要从数字营销角度扩展其覆盖范围和准确性的客户而言,对于该客户来说,标识可能与接触点实例相关联的个人以及达到该CL或HHL的最佳接触点实例是重要的。同样在某些情况下,客户将会对了解最佳接触点类型和与该接触点类型相关联的接触点实例感兴趣,他们可以使用这些接触点实例来增加定位和到达正确最终消费者的可能性。因此,该系统有助于客户扩大其数字营销的范围和准确性。该系统和方法已经证明了计算环境效率的显著提高,并且由于客户的数字营销活动的聚焦和准确性不断提高,因此有望进一步为客户提供高价值。该系统对于准确性、新近度和时间稳定性的聚焦提供数字接触点的丰富的单个视角。
除非以其他方式说明,否则本文中所使用的所有技术和科学术语具有如本发明所属的本领域的普通技术人员共同理解的相同含义。虽然类似于或等同于本文所描述的方法或材料的任何方法和材料可在实践或测试本发明时使用,本文中描述了有限数目的示例性的方法和/或材料。本领域的那些技术人员将领会,更多的修改是可能的,而不背离本文中的发明概念。
本文中使用的所有术语应当以与上下文一致的尽可能最宽的方式来解释。当本文中使用编组时,该组中的所有个体成员以及该组中所有可能的组合和子组合均旨在被个体地包括。当在此说明范围时,该范围旨在包括该范围内的所有子区域和单个点。本文中引用的所有参考都被通过援引纳入在此到不存在与本说明书的公开不一致的程度。
本发明已参考某些优选和替换实施例来描述,这些实施例旨在仅为示例性的而非旨在限制如所附权利要求书中阐述的本发明的整个范围。

Claims (28)

1.一种用于消费者/家庭解决系统的接触点的节点群集架构,包括:
a.实体图分辨率储存库(EGRR),包括多个表示数据结构,其中每个表示数据结构包括:
i.有关个人或家庭的至少一个数据;
ii.与此个人或家庭相关联的至少一个接触点;和
iii.至少一个消费者链接(CL)或家庭链接(HHL);
b.跨所述节点群集架构托管并与所述EGRR处于通信的实体图解析引擎(EGRE),其中所述EGRE被配置为接收多个输入标识符,并利用所述EGRR以跨所述节点群集架构中的多个节点并行解析此类标识符,其中每个输入标识符针对个人或家庭;
c.由所述EGRE填充并包括接触点与个人或家庭之间的配对的时间信号文件;和
d.由所述EGRE根据所述时间信号文件创建的并且包括针对接触点的CL或HHL排名或针对CL或HHL的接触点排名的交叉引用文件,
其中,所述EGRE进一步包括用于接收请求的应用编程接口(API),其中所述请求包括一个或多个CL或HHL或者一个或多个接触点,
并且进一步地,其中,所述EGRE包括输出模块,所述输出模块被配置为响应于接收到CL或HHL而从所述交叉参考文件返回一个或多个接触点,或者响应于接收到接触点而返回一个或多个CL或HHL。
2.如权利要求1所述的节点群集架构,其特征在于,每个数字接触点包括电话号码、电子邮件地址、移动广告客户标识符(MAID)、社交网络句柄或游戏句柄。
3.如权利要求1所述的节点群集架构,其特征在于,所述EGRR包括多个数据源,所述数据源包括多个原始数据源文件。
4.如权利要求3所述的节点群集架构,其特征在于,所述EGRR数据源进一步包括接触点关联历史。
5.如权利要求4所述的节点群集架构,其特征在于,所述EGRR数据源进一步包括来自内部元数据的原始源使用统计。
6.如权利要求5所述的节点群集架构,其特征在于,所述EGRR数据源进一步包括网络地址/域分类。
7.如权利要求3所述的节点群集架构,其特征在于,所述EGRE被进一步配置成通过文件卫生学来处理所述原始数据源文件,覆盖URL分类标志,并将来自所述EGRR的CL或HHL附加到所述原始数据源文件。
8.如权利要求7所述的节点群集架构,其特征在于,所述EGRE被进一步配置成创建包括URL行业/类型分类标志的时间信号。
9.如权利要求8所述的节点群集架构,其特征在于,所述EGRE被进一步配置成创建针对来自使用统计的数据的时间信号。
10.如权利要求9所述的节点群集架构,其特征在于,所述EGRE被进一步配置成提取针对CL或HHL和接触点组合的属性数据。
11.如权利要求10所述的节点群集架构,其特征在于,所述EGRE被进一步配置成组合时间信号和属性数据。
12.如权利要求1所述的节点群集架构,其特征在于,进一步包括客户端设备和将所述EGRE连接到所述客户端设备的网络,其中所述客户端设备被配置成与所述API交互以发送请求,其中所述请求包括一个或多个CL或HHL或者一个或多个接触点,并且进一步其中所述客户端设备被配置成响应于发送CL或HHL从所述EGRE接收一个或多个接触点,或响应于发送接触点从所述EGRE接收一个或多个CL或HHL。
13.一种用于确定分布式节点架构中针对特定接触点的最佳个人或家庭的方法,所述方法包括以下步骤:
a.构造实体图分辨率储存库(EGRR),所述EGRR包括多个表示数据结构,其中每个表示数据结构包括:
i.有关个人或家庭的至少一个数据;
ii.与此个人或家庭相关联的至少一个接触点表示;和
iii.分别与个体或家庭相关联的至少一个消费者链接(CL)或家庭链接(HHL);
b.使用实体图解析引擎(EGRE)以从每个接触点表示中解析针对每个接触点表示的最合乎情理的个人或家庭,其中每个潜在的个人或家庭的评估分布在所述分布式节点架构的多个节点中;
c.构造由所述EGRE填充并包括接触点表示与个人或家庭之间的配对的时间信号文件;和
d.从所述时间信号文件构造交叉参考文件,其中所述交叉参考文件包括对于每个接触点表示的CL排名、HHL排名或CL和HHL两者的排名。
14.如权利要求13所述的方法,其特征在于,进一步包括在所述EGRE处在应用编程接口(API)处接收来自客户端设备的请求的步骤,其中所述请求包括一个或多个接触点表示。
15.如权利要求14所述的方法,其特征在于,进一步包括在EGRE输出模块处,从所述交叉参考文件向所述客户端设备返回一个或多个CL、HHL或CL和HHL两者的步骤。
16.如权利要求13所述的方法,其特征在于,使用所述EGRE以从每个接触点表示中解析针对每个接触点表示的最合乎情理的个人或家庭的所述步骤进一步包括通过文件卫生学来处理原始数据源文件、覆盖URL分类标志并将CL或HHL附加到所述原始数据源文件的步骤。
17.如权利要求16所述的方法,其特征在于,使用所述EGRE以从每个接触点表示中解析针对每个接触点表示的最合乎情理的个人或家庭的所述步骤进一步包括创建包括URL行业/类型分类标志的时间信号的步骤。
18.如权利要求17所述的方法,其特征在于,使用所述EGRE以从每个接触点表示中解析针对每个接触点表示的最合乎情理的个人或家庭的所述步骤进一步包括从使用统计中创建针对一组数据的时间信号的步骤。
19.如权利要求18所述的方法,其特征在于,使用所述EGRE以从每个接触点表示中解析针对每个接触点表示的最合乎情理的个人或家庭的所述步骤进一步包括提取针对接触点和CL或HHL组合的属性数据的步骤。
20.如权利要求19所述的方法,其特征在于,使用所述EGRE以从每个接触点表示中解析针对每个接触点表示的最合乎情理的个人或家庭的所述步骤进一步包括组合时间信号和属性数据的步骤。
21.一种用于确定分布式节点架构中针对特定个人或家庭的最佳接触点的方法,所述方法包括以下步骤:
a.构建实体图分辨率储存库(EGRR),所述EGRR包括多个表示数据结构,其中每个表示数据结构包括:
i.有关个人或家庭的至少一个数据;
ii.与此个人或家庭相关的至少一个接触点;和
iii.分别与个体或家庭相关联的至少一个消费者链接(CL)或家庭链接(HHL);
b.使用实体图解析引擎(EGRE)以从每个个人或家庭中解析针对每个个人或家庭的最合乎情理的接触点表示,其中每个潜在的接触点表示的评估分布在所述分布式节点架构的多个节点中;
c.构建由所述EGRE填充并包括个人或家庭与接触点表示之间的配对的时间信号文件;和
d.从所述时间信号文件构造交叉参考文件,其中所述交叉参考文件包括针对每个个人或家庭的接触点表示的排名和CL、HHL或CL和HHL两者。
22.如权利要求21所述的方法,其特征在于,进一步包括在所述EGRE处在应用编程接口(API)处接收来自客户端设备的请求的步骤,其中所述请求包括一个或多个个人或家庭。
23.如权利要求22所述的方法,其特征在于,进一步包括在EGRE输出模块处,从所述交叉参考文件向所述客户端设备返回一个或多个CL、HHL或CL和HHL两者的步骤。
24.如权利要求21所述的方法,其特征在于,使用所述EGRE以从每个个人或家庭中解析针对每个个人或家庭的最合乎情理的接触点表示的所述步骤进一步包括通过文件卫生学来处理原始数据源文件、覆盖URL分类标志并将CL或HHL附加到所述原始数据源文件的步骤。
25.如权利要求24所述的方法,其特征在于,使用所述EGRE以从每个个人或家庭中解析针对每个个人或家庭的最合乎情理的接触点表示的所述步骤进一步包括创建包括URL行业/类型分类标志的时间信号的步骤。
26.如权利要求25所述的方法,其特征在于,使用所述EGRE以从每个个人或家庭中解析针对每个个人或家庭的最合乎情理的接触点表示的所述步骤进一步包括创建针对来自使用统计的一组数据的时间信号的步骤。
27.如权利要求26所述的方法,其特征在于,使用所述EGRE以从每个个人或家庭中解析针对每个个人或家庭的最合乎情理的接触点表示的所述步骤进一步包括提取针对接触点和CL或HHL组合的属性数据的步骤。
28.如权利要求27所述的方法,其特征在于,使用所述EGRE以从每个个人或家庭中解析针对每个个人或家庭的最合乎情理的接触点表示的所述步骤进一步包括组合时间信号和属性数据的步骤。
CN201880032941.XA 2017-05-19 2018-05-15 用于在数字通信网络上跨多个设备建立数字接触点的分布式节点群集 Pending CN110637317A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762508805P 2017-05-19 2017-05-19
US62/508,805 2017-05-19
PCT/US2018/032790 WO2018213325A1 (en) 2017-05-19 2018-05-15 Distributed node cluster for establishing a digital touchpoint across multiple devices on a digital communications network

Publications (1)

Publication Number Publication Date
CN110637317A true CN110637317A (zh) 2019-12-31

Family

ID=64274617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880032941.XA Pending CN110637317A (zh) 2017-05-19 2018-05-15 用于在数字通信网络上跨多个设备建立数字接触点的分布式节点群集

Country Status (6)

Country Link
US (1) US11107093B2 (zh)
EP (1) EP3625748B1 (zh)
JP (1) JP7055153B2 (zh)
CN (1) CN110637317A (zh)
CA (1) CA3062865A1 (zh)
WO (1) WO2018213325A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11892996B1 (en) 2019-07-16 2024-02-06 Splunk Inc. Identifying an indexing node to process data using a resource catalog
JP2022550610A (ja) * 2019-10-05 2022-12-02 ライブランプ インコーポレーテッド Eメール・アドレス選択のためのシステム及び方法
US11829415B1 (en) 2020-01-31 2023-11-28 Splunk Inc. Mapping buckets and search peers to a bucket map identifier for searching
US11615082B1 (en) 2020-07-31 2023-03-28 Splunk Inc. Using a data store and message queue to ingest data for a data intake and query system
US11609913B1 (en) 2020-10-16 2023-03-21 Splunk Inc. Reassigning data groups from backup to searching for a processing node
US11809395B1 (en) * 2021-07-15 2023-11-07 Splunk Inc. Load balancing, failover, and reliable delivery of data in a data intake and query system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004753A (zh) * 2009-08-27 2011-04-06 索尼公司 用于支持电子网络中的消费者聚集过程的系统和方法
US8131745B1 (en) * 2007-04-09 2012-03-06 Rapleaf, Inc. Associating user identities with different unique identifiers
US20140207518A1 (en) * 2013-01-23 2014-07-24 24/7 Customer, Inc. Method and Apparatus for Building a User Profile, for Personalization Using Interaction Data, and for Generating, Identifying, and Capturing User Data Across Interactions Using Unique User Identification
US20150341453A1 (en) * 2014-05-21 2015-11-26 Aol Advertising Inc. Systems and methods for matching online users across devices
CN105723398A (zh) * 2013-09-19 2016-06-29 安客诚 用于跟踪多个第三方站点上的用户参与的方法和系统

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US6766327B2 (en) 1997-07-29 2004-07-20 Acxiom Corporation Data linking system and method using encoded links
US7969306B2 (en) * 2002-01-11 2011-06-28 Sap Aktiengesellschaft Context-aware and real-time item tracking system architecture and scenarios
US20070027751A1 (en) 2005-07-29 2007-02-01 Chad Carson Positioning advertisements on the bases of expected revenue
US7672865B2 (en) 2005-10-21 2010-03-02 Fair Isaac Corporation Method and apparatus for retail data mining using pair-wise co-occurrence consistency
EP2024862A4 (en) 2006-05-02 2011-08-10 Invidi Tech Corp FUZZY-LOGIC-BASED ANSE-INDENTIFICATION FOR TARGETED VALUATION SYSTEM
US8200506B2 (en) * 2006-12-19 2012-06-12 Accenture Global Services Limited Integrated health management platform
US20090132366A1 (en) 2007-11-15 2009-05-21 Microsoft Corporation Recognizing and crediting offline realization of online behavior
US8000993B2 (en) * 2008-04-14 2011-08-16 Tra, Inc. Using consumer purchase behavior for television targeting
AU2010201495B2 (en) * 2009-04-16 2012-04-12 Accenture Global Services Limited Touchpoint customization system
US9152727B1 (en) 2010-08-23 2015-10-06 Experian Marketing Solutions, Inc. Systems and methods for processing consumer information for targeted marketing applications
US8768943B2 (en) 2010-09-01 2014-07-01 International Business Machines Corporation Multi-source consumer behavior tracking system
US20120222097A1 (en) * 2011-02-28 2012-08-30 Wilson Jobin System and method for user classification and statistics in telecommunication network
US20120290651A1 (en) * 2011-05-13 2012-11-15 Onzo Limited Nodal data processing system and method
US20130066771A1 (en) 2011-07-22 2013-03-14 Visa International Service Association Systems and Methods to Configure Data for Diverse Services
US8943060B2 (en) 2012-02-28 2015-01-27 CQuotient, Inc. Systems, methods and apparatus for identifying links among interactional digital data
US20140032265A1 (en) 2012-07-26 2014-01-30 Experian Marketing Solutions, Inc. Systems and methods of aggregating consumer information
JP5158827B1 (ja) 2012-08-27 2013-03-06 紀輝 谷 購買者特定装置、購買者特定プログラム、購買者の特定方法及び購買者情報管理システム
US10574766B2 (en) * 2013-06-21 2020-02-25 Comscore, Inc. Clickstream analysis methods and systems related to determining actionable insights relating to a path to purchase
US9256761B1 (en) * 2014-08-18 2016-02-09 Yp Llc Data storage service for personalization system
US20160125456A1 (en) * 2014-11-03 2016-05-05 Ds-Iq, Inc. Advertising campaign targeting using contextual data
JP6320288B2 (ja) 2014-12-19 2018-05-09 ヤフー株式会社 名寄せ装置、名寄せ方法及び名寄せプログラム
US9980011B2 (en) 2015-07-24 2018-05-22 Videoamp, Inc. Sequential delivery of advertising content across media devices
US20170046734A1 (en) 2015-08-11 2017-02-16 Anto Chittilappilly Enhancing touchpoint attribution accuracy using offline data onboarding
WO2017037542A1 (en) * 2015-09-05 2017-03-09 Nudata Security Inc. Systems and methods for detecting and preventing spoofing
US10360244B2 (en) 2015-09-24 2019-07-23 Liveramp, Inc. System and method for improving computational efficiency of consumer databases using household links
JP6085730B1 (ja) 2015-11-10 2017-02-22 楽天株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8131745B1 (en) * 2007-04-09 2012-03-06 Rapleaf, Inc. Associating user identities with different unique identifiers
CN102004753A (zh) * 2009-08-27 2011-04-06 索尼公司 用于支持电子网络中的消费者聚集过程的系统和方法
US20140207518A1 (en) * 2013-01-23 2014-07-24 24/7 Customer, Inc. Method and Apparatus for Building a User Profile, for Personalization Using Interaction Data, and for Generating, Identifying, and Capturing User Data Across Interactions Using Unique User Identification
CN105723398A (zh) * 2013-09-19 2016-06-29 安客诚 用于跟踪多个第三方站点上的用户参与的方法和系统
US20150341453A1 (en) * 2014-05-21 2015-11-26 Aol Advertising Inc. Systems and methods for matching online users across devices

Also Published As

Publication number Publication date
JP2020521232A (ja) 2020-07-16
CA3062865A1 (en) 2018-11-22
EP3625748C0 (en) 2023-06-07
WO2018213325A1 (en) 2018-11-22
EP3625748B1 (en) 2023-06-07
JP7055153B2 (ja) 2022-04-15
US20200104864A1 (en) 2020-04-02
EP3625748A4 (en) 2021-03-17
US11107093B2 (en) 2021-08-31
EP3625748A1 (en) 2020-03-25

Similar Documents

Publication Publication Date Title
US11861628B2 (en) Method, system and computer readable medium for creating a profile of a user based on user behavior
Japec et al. Big data in survey research: AAPOR task force report
US11157926B2 (en) Digital content prioritization to accelerate hyper-targeting
US20160171557A1 (en) Customer Insight System Architecture
US20170286539A1 (en) User profile stitching
US8909569B2 (en) System and method for revealing correlations between data streams
US8676875B1 (en) Social media measurement
US11107093B2 (en) Distributed node cluster for establishing a digital touchpoint across multiple devices on a digital communications network
US20120254152A1 (en) Optimization of social media engagement
US20120226678A1 (en) Optimization of social media engagement
Vosecky et al. Searching for quality microblog posts: Filtering and ranking based on content analysis and implicit links
Japec et al. AAPOR report on big data
Luo et al. Identifying digital traces for business marketing through topic probabilistic model
Goswami et al. Challenges in the analysis of online social networks: A data collection tool perspective
Kim et al. Topic-Driven SocialRank: Personalized search result ranking by identifying similar, credible users in a social network
KR101312575B1 (ko) 기업과 소비자간의 정보 제공 시스템 및 정보 제공 방법
WO2013177230A1 (en) Optimization of social media engagement
Liao et al. Data mining analytics investigate WeChat users’ behaviours: online social media and social commerce development
Zhao et al. Personalized Dynamic Counter Ad-Blocking Using Deep Learning
Isakovic A Recommendation System for Movies by Using Hadoop Mapreduce
Alawad Network-aware recommendations in online social networks
Sponder et al. Understanding and Working with Third-Party Data
Ongan et al. A Framework for Aligning Social Media and Web Analytics Data to Support Search Engine Marketing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40012004

Country of ref document: HK

WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191231

WD01 Invention patent application deemed withdrawn after publication