CN106471539B - 用于混淆受众测量的系统和方法 - Google Patents

用于混淆受众测量的系统和方法 Download PDF

Info

Publication number
CN106471539B
CN106471539B CN201580034952.8A CN201580034952A CN106471539B CN 106471539 B CN106471539 B CN 106471539B CN 201580034952 A CN201580034952 A CN 201580034952A CN 106471539 B CN106471539 B CN 106471539B
Authority
CN
China
Prior art keywords
subset
identifier
audience measurement
client device
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580034952.8A
Other languages
English (en)
Other versions
CN106471539A (zh
Inventor
雷蒙多·米里索拉
奥利弗·托马斯·盖伊蒙德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN106471539A publication Critical patent/CN106471539A/zh
Application granted granted Critical
Publication of CN106471539B publication Critical patent/CN106471539B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • G06Q30/0245Surveys
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

评判组提供者可以向受众测量服务器传送查询,以检索经由一个或更多个特性例如客户端的特性、客户端的设备的特性、接收的内容的特性等选择的客户端子集的测量数据。为了保护评判组数据,评判组提供者不需要向受众测量服务器识别这些特性;而是,可以经由可以应用于客户端和/或内容标识符的多个过滤器来作查询。因为受众测量服务器可以应用过滤器或数据结构来选择客户端数据用于检索而不必知道过滤器表示什么,所以可以隐藏评判组提供者对任何特定查询的原因。为了进一步混淆,评判组提供者可以提供多个过滤器,其可以单独地识别大量客户端,但是当相交或一起应用时,仅识别需要测量数据的客户端。

Description

用于混淆受众测量的系统和方法
相关申请
本申请要求于2014年8月14日提交的名称为“SYSTEMS AND METHODS FOROBFUSCATED AUDIENCE MEASUREMENT(用于混淆受众测量的系统和方法)”的美国专利申请14/459,671的优先权,其全部内容通过引用并入本文。
背景技术
内容块(例如广播媒体或在线流媒体,包括商业广告)的受众通常通过由记录内容随时间曝光的个人或家庭组成的单源数据评判组来测量。然后,每一个块的潜在受众值用于规划和购买广告位。通过利用单一来源,可以随时间测量响应于不同的活动的行为的变化。在非广播平台中,例如在线媒体递送系统,内容发布者可以通过视频、横幅等中的插页广告向用户插入广告。评判组成员可以运行监视软件例如浏览器插件或扩展,其将接收的内容标识符传送到评判组提供者用于聚合。然而,从各种来源聚合数据可能导致评判组成员的隐私的显著缺乏。
发明内容
为了提供来自可以与评判组捕获的数据集成的来自不同源的跨媒体受众测量数据或数据,可以将轻量级通信或“ping”从客户端设备传送到受众测量服务器。ping可以包括多个客户端标识符,诸如评判组会话标识符或cookie、设备标识符、地址标识符或其它这样的标识符;和内容的标识。内容可以包括视频、音频、多媒体、广告或任何其它类型和形式的内容。在一些实施方式中,评判组提供者可以向受众测量服务器传送查询,以检索经由一个或更多个特性(例如客户端的特性、客户端设备的特性、接收到的内容的特性等)选择的客户端子集的测量数据。为了保护评判组数据,评判组提供者不需要向受众测量服务器识别这些特性;而是,可以经由可以应用或匹配到客户端和/或内容标识符的多个过滤器进行查询。在一些实施方式中,评判组提供者可以提供要应用于表示特性的标识符二进制串的一个或更多个位图过滤器,或者可以提供一个或更多个概率数据阵列,例如布隆过滤器,用于由受众测量服务器检索数据。因为受众测量服务器可以应用过滤器或数据结构来选择客户端数据用于检索而不知道过滤器表示什么,所以可以隐藏任何特定查询的评判组提供者的原因。为了进一步混淆,评判组提供者可以提供多个过滤器或数据阵列,其可以单独地识别大量客户端,但是当相交或一起应用时,仅识别需要测量数据的客户端。这可能进一步混淆任何特定查询的原因。
在一些情况下,应用大量过滤器可能导致唯一地标识单个客户端。随着在查询中应用更多的过滤器,匹配每一个查询的结果数目可能减少,直到仅返回来自单个客户端的数据。这可能导致客户端缺乏隐私,因为评判组提供者可以跟踪客户端接收的所有内容。因此,在一些实现中,在确定结果的数目低于预定阈值时,受众测量服务器可以拒绝查询。在其它实现中,受众测量服务器可以计算每一个查询的所请求的客户端标识符的散列,使得查询结果可以不组合,并且可以将查询的结果单独地提供给评判组提供者。这允许评判组提供者访问测量数据,同时防止评判组提供者识别和跟踪任何个人。
本文公开的一个实现是用于经由模糊特性的在线受众测量的方法。该方法包括由受众测量服务器从多个客户端设备中的每一个客户端设备接收从该客户端设备传送的包括从内容提供者接收的内容项目的标识和所述客户端设备的标识符的通信。所述方法还包括由受众测量服务器从评判组测量服务接收对所述评判组测量服务的评判组成员的测量数据的请求,所述请求包括第一数据阵列和第二数据阵列。该方法还包括由受众测量服务器将所接收的通信与第一数据阵列进行比较,以选择所接收的通信的第一子集。所述方法还包括由受众测量服务器将所接收的通信与第二数据阵列进行比较,以选择所接收的通信的第二子集。该方法还包括由受众测量服务器选择所接收的通信的包括第一子集和第二子集的交集的第三子集。该方法还包括由受众测量服务器聚合来自所选择的第三子集的内容项目的标识,以生成每一个内容项目的受众测量;以及由受众测量服务器向评判组测量服务传送所生成的测量数据。
在一些实施方式中,每一个接收的通信中的客户端设备的标识符还包括由评判组测量服务提供的客户端设备的第一标识符和由客户端设备的制造商提供的客户端设备的第二标识符。在另一实现中,该方法包括:识别第一客户端设备的第一标识符与第一数据阵列之间的交集;以及识别所述第一客户端设备的第二标识符与所述第二数据阵列之间的交集。在另一个进一步的实现中,客户端设备的第一标识符包括由评判组测量服务生成的数据阵列;并且所述方法包括响应于所接收的通信的第一标识符和所述请求的第一数据阵列之间的非零交集,选择所接收的通信以包括在所述第一子集中。
在一些实施方式中,该方法包括由受众测量服务器确定所接收的通信的第三子集包括低于预定阈值的客户端设备的标识符的数目。在另一实现中,所述方法包括响应于所述确定在传送所生成的测量数据之前由受众测量服务器从所生成的测量数据中移除客户端设备的标识符。在另一个进一步的实现中,该方法包括:响应于所述确定,使用第一散列函数对所接收的通信的第一子集中的客户端设备的每一个标识符进行散列,以及使用不同的第二散列函数对所接收的通信的第二子集中的客户端设备的每一个标识符进行散列;以及传送所述客户端设备的散列标识符。
在一些实施方式中,第一数据阵列或第二数据阵列包括概率数据过滤器。在其它实现中,第一数据阵列或第二数据阵列包括位图。
在另一方面,本公开涉及一种用于经由模糊特性用于在线受众测量的系统。该系统包括与多个客户端设备及评判组测量服务器通信的执行受众测量服务器的设备。受众测量服务器被配置为从多个客户端设备中的每一个客户端设备接收从该客户端设备传送的包括从内容提供者接收的内容项目的标识和所述客户端设备的标识符的通信。受众测量服务器还被配置为从评判组测量服务接收对所述评判组测量服务的评判组成员的测量数据的请求,所述请求包括第一数据阵列和第二数据阵列。受众测量服务器还被配置为将所接收的通信与第一数据阵列进行比较,以选择所接收的通信的第一子集;以及将所接收的通信与所述第二数据阵列进行比较,以选择所接收的通信的第二子集。受众测量服务器还被配置为选择所接收的通信的包括第一子集和第二子集的交集的第三子集。受众测量服务器还被配置为聚合来自所选择的第三子集的内容项目的标识,以生成每一个内容项目的受众测量;以及向所述评判组测量服务传送所生成的测量数据。
在一些实现中,每一个接收的通信中的客户端设备的标识符还包括由评判组测量服务提供的客户端设备的第一标识符和由客户端设备的制造商提供的客户端设备的第二标识符。在另一实施方式中,受众测量服务器还被配置用于:识别在第一客户端设备的第一标识符和第一数据阵列之间的交集,并且识别在第一客户端设备的第二标识符和第二数据阵列之间的交集。在另一个进一步的实现中,客户端设备的第一标识符包括由评判组测量服务生成的数据阵列;并且所述受众测量服务器还被配置用于:响应于在所接收的通信的第一标识符和所述请求的第一数据阵列之间的非零交集,选择所接收的通信以包括在所述第一子集中。
在一些实施方式中,受众测量服务器还被配置为确定接收到的通信的第三子集包括低于预定阈值的客户端设备的标识符的数目。在另一实施方式中,受众测量服务器还被配置为响应于所述确定,在传送所生成的测量数据之前从所生成的测量数据移除客户端设备的标识符。在另一进一步实施方式中,所述受众测量服务器进一步被配置为响应于所述确定,使用第一散列函数对所述所接收通信的所述第一子集中的客户端装置的每一个识别符进行散列,且利用不同的第二散列函数对所述所接收通信的所述第二子集中的客户端装置的每一识别符进行散列;以及传送所述客户端设备的散列标识符。
在该系统的一些实现中,第一数据阵列或第二数据阵列包括概率数据过滤器。在系统的其它实现中,第一数据阵列或第二数据阵列包括位图。
在另一方面中,本公开涉及一种存储指令的计算机可读存储介质,所述指令在由一个或更多个数据处理器执行时使得一个或更多个数据处理器执行操作,包括从多个所述客户端设备中的每一个客户端装置接收从该客户端设备传送的包括从内容提供者接收的内容项目的标识和所述客户端设备的标识符的通信;以及从评判组测量服务接收对所述评判组测量服务的评判组成员的测量数据的请求,所述请求包括第一数据阵列和第二数据阵列。操作还包括将所接收的通信与第一数据阵列进行比较,以选择所接收的通信的第一子集;以及将所接收的通信与所述第二数据阵列进行比较,以选择所接收的通信的第二子集。操作还包括选择接收的通信的包括第一子集和第二子集的交集的第三子集;聚合来自所选择的第三子集的内容项目的标识,以生成每一个内容项目的受众测量;以及向所述评判组测量服务传送所生成的测量数据。
在一些实现中,操作包括确定接收到的通信的第三子集包括低于预定阈值的客户端设备的标识符的数目;以及响应于所述确定,使用第一散列函数对所接收的通信的第一子集中的客户端设备的每一个标识符进行散列。所述操作还包括:响应于所述确定,使用不同的第二散列函数对所接收的通信的第二子集中的客户端设备的每一个标识符进行散列;以及传送所述客户端设备的散列标识符。
应当理解,本发明的实现可以以任何方便的形式来实现。例如,本发明可以通过可以在可以是有形载体介质(例如磁盘)或无形载体介质(例如通信信号)的适当载体介质上承载的适当计算机程序来实现。本发明的各方面还可以使用合适的装置来实现,所述合适的装置可以采取运行被布置为实现本发明的计算机程序的可编程计算机的形式。本发明的方面可以被组合,并且在一个实现的上下文中描述的特征可以与其它实现的特征组合。提及这些实现方式不限制或限定本公开的范围,而是提供本公开的实现的示例以帮助理解本公开。可以开发特定实现以实现以下优点中的一个或更多个。
附图说明
在附图和以下描述中阐述了一个或更多个实现的细节。从说明书、附图和权利要求书,本公开的其它特征、方面和优点将变得显而易见,其中:
图1A是根据一个实现的用于测量由至少一个内容提供者提供的内容的受众的系统的图;
图1B是根据一个实现的包括客户端标识符和内容标识符的事件日志的图;
图1C是示出根据一个实现的客户端标识符的混淆查询的图;
图1D是根据一个实现的用于测量由至少一个内容提供者经由受众测量服务器提供的内容的受众的系统的框图;
图2A是根据一个实现的客户端设备的框图;
图2B是根据一个实现的服务器设备的框图;并且
图3是根据一个实现的在用于通过受众测量服务器用于混淆受众测量的过程的一个实现中采取的步骤的流程图。
各个附图中同样的附图标记和标记指示同样的元件。
具体实施方式
受众测量数据可以包括由设备接收和显示的内容的标识。这样的内容可以包括音频、视频、多媒体、文本、动画、广告或其它这样的数据。内容的受众的测量可以用于测量受众大小或内容的流行度,以分配用于向受众递送内容的带宽、定价和销售广告布局、规划内容递送时间表或其它此类目的。在传统的地面或卫星广播中,由于缺少从接收机到提供者的反向信道或通信路径,导致提供者可能不直接知道在任何时间调谐的接收机的数目。为了克服这个限制,受众测量系统已经使用同意填写他们已经看过或听过的内容的调查或日记的参与个人的评判组,或者佩戴或携带检测在附近回放的内容并记录日志以便后续传输到评判组提供者的便携式设备。
与典型的广播公司不同,互联网内容提供者可以通过监视输出分组的目的地或通过请求来自每一个接收方设备的返回响应来直接了解接收方设备的数目。然而,随着内容传送系统变得更加复杂,不同的内容项目可以由不同的提供者提供给设备。在一个这样的实例中,网站可以由第一网络服务器提供,而嵌入式视频由单独的内容传送网络提供,并且一个或更多个横幅广告或插页式视频广告由一个或更多个单独的广告传送网络提供。因此,单个提供者实际上可能仅知道由所述单个提供者提供的内容的接收者的数目,并且因此可能不能精确地测量总体受众数目。对于具有大量源的内容递送网络,这可能进一步复杂,其中不同的单独的服务器可以用于向设备提供内容,例如,用于负载平衡目的。
在一些实现中,代理可以在设备上执行,诸如网络浏览器插件或分组拦截器,或者可以在接收设备和内容提供者之间的中间设备上执行,诸如路由器、WiFi接入点、网关或其它这样的设备。在其它实现中,可以通过捕获从客户端设备传送到受众测量服务器的轻量级通信或“ping”,而不需要执行单独的客户端代理来测量内容传送和受众。ping可以包括客户端设备的设备标识符,例如评判组会话标识符或cookie以及内容的标识。在一些实现中,ping可以包括布局内的内容放置的标识,诸如横幅的位置、帧的标识或其它这样的指示符。可以响应于网页或其它数据的呈现、嵌入式脚本的执行或其它这样的功能来传送ping。在一个实现中,ping可以是用于具有参数-值对的一个像素图像的超文本传输协议(HTTP)GET请求,以识别设备标识符以及显示或嵌入在触发GET请求或单独的HTTP请求的页面中的内容(例如响应于A PING标签)。在另一实现中,ping可以是对内容项目的请求,并且可以被传送到受众测量服务器,所述受众测量服务器将该请求(例如,经由HTTP 302重定向或类似方法)重定向到内容提供者。
图1A示出根据一个实现的用于通过由受众测量服务器114提供的数据的聚合来测量由至少一个内容提供者112提供的内容的受众的系统的图。受众测量服务器114可以包括从客户端100接收内容标识符和/或设备标识符,以及将所接收的内容标识符和/或设备标识符提供给评判组提供者116的一个或更多个设备。尽管并行示出了与评判组提供者116和内容提供者112,但是在一些实施方式中,受众测量服务器114可以被部署为评判组提供者116和内容提供者112以及客户端100之一或两者之间的中介。
客户端设备100可以经由网络110与一个或更多个内容提供者112和评判组提供者116通信。客户端设备100(被不同地称为客户端、设备、客户端设备、计算设备、用户设备或任何其它术语)可以是能够通过网络110通信的台式计算机、膝上型计算机、平板计算机、智能电话、视频游戏控制台、智能电视或机顶盒、服务器、工作站或任何其它类型和形式的计算设备。虽然为了清楚仅示出了一个客户端设备100,但是在实践中,多个客户端设备100可以彼此通信和/或与内容或评判组提供者112-116通信。
在一些实现中,客户端设备100可以执行应用102,应用102可以是用于通过网络110通信的应用、服务、服务器、守护进程、例程或其它可执行逻辑,诸如网络浏览器、邮件客户端、视频播放器、音乐播放器、视频游戏或任何其它此类应用。应用110可以包括命令行界面、图形用户界面或这些或其它界面的任何组合。
客户端设备100可以包括一个或更多个客户端标识符104-108,包括设备标识符104、由评判组提供者116提供的cookie 106和/或互联网协议(IP)地址108,通常称为客户端标识符。这样的客户端标识符可以是固定的,周期性地更新,根据请求更新,或者以其它间隔更新。客户端标识符104、106可以各自是字母数字字符串、数据串、序列号、媒体访问控制(MAC)地址、用户名或帐户名、全球唯一标识符(GUID)、cookie、随机或伪随机数字、包括这些或其它标识符的组合的其它类型和形式的标识符。如上所述,客户标识符可以固定到设备或在设备中预配置,诸如制造商序列号或MAC地址的设备标识符104,而在其它实现中,客户标识符可以由评判组提供者116、应用102或其它实体动态设置。cookie 106可以是由评判组提供者116响应于客户端100对评判组提供者116的服务器的登录而提供的会话cookie。在一些实现中,可以为每一个到评判组提供者116的通信设置唯一的或新的客户端标识符,而在其它实现中,客户端标识符可以不被改变,或者可以周期性地(例如每小时、每天、每周等)或以其它间隔(例如,在客户端设备100重新启动、登录互联网服务等)改变。
在一些实现中,应用102可以包括捕获代理(未示出),或者客户端设备100可以执行捕获代理(未示出)。捕获代理可以是用于识别提供给客户端设备100的内容以及将内容(以及在一些实施方式中,客户端标识符104-108)的标识传送给评判组提供者116或其它测量服务的网络浏览器插件或扩展、分组嗅探器或拦截器、屏幕刮板、文本或数据解析器、监视器、应用、服务、守护进程、例程或其它可执行逻辑。如上所述,在一些实现中,捕获代理可以由部署在客户端100和网络110和/或内容提供者112之间的中间设备(未示出)执行。
客户端设备100可以经由网络110与内容提供者116和/或评判组提供者112或其它客户端设备100、服务器或设备通信。网络110可以是在客户端设备100、一个或更多个内容提供者116以及一个或更多个评判组提供者112,以及未示出的其它设备之间中继信息的任何形式的计算机网络或网络的组合。网络110可以包括互联网和/或其它类型的数据网络,诸如局域网(LAN)、广域网(WAN)、蜂窝网络、卫星网络或其它类型的数据网络。网络110还可以包括被配置为在网络110内接收和/或传送数据的任何数目的计算设备(例如,计算机、服务器、路由器、网络交换机等)。网络110还可以包括任何数目的硬连线和/或无线连接。客户端设备100可以与硬连线(例如,经由光纤电缆、CAT5电缆等)到网络110中的其它计算设备的收发器无线地(例如,经由WiFi、蜂窝、无线电等)通信。在一些实现中,网络110可以是虚拟网络,例如由单个物理机器执行的多个虚拟机之间的虚拟网络,或抽象网络,例如经由物理可移除介质的离线数据传输(例如Sneakernet、通过磁带介质、CD-ROM、闪存介质、外部硬盘驱动器、软盘等传输数据)。
内容提供者112可以包括连接到网络110并且被配置为向客户端100提供内容的一个或更多个计算设备。内容提供者112可以被不同地称为内容提供器、服务器、网络服务器、数据服务器、发布者、服务提供者或其它类似术语。在许多实现中,内容提供者112可以包括被配置为服务器群或云的多个计算设备,并且可以包括路由器、负载平衡器、网络地址转换器、防火墙或其它这样的设备。内容提供者112可以是计算机服务器(例如,FTP服务器、文件共享服务器、网络服务器等)或服务器(例如,数据中心、云计算平台等)的组合。内容提供者112可以提供任何类型和形式的内容,包括文本、图像、视频、音频、多媒体或其它数据或这些的任何组合。内容可以包括搜索结果、博客或论坛内容、新闻文章、电影、电视节目、播客、视频游戏或其它交互式内容、以任何格式的广告、网站、社交媒体或任何其它类型和形式的内容。内容提供者112可以是响应于搜索查询向客户端设备100提供搜索结果数据的在线搜索引擎。在另一示例中,内容提供者112可以是响应于对网页的请求而向客户端设备100提供网页数据的第一方网络服务器。在又一示例中,内容提供者112可以是将电视节目或电影连同插页式视频广告、横幅广告、前滚动或后滚动广告或其它这样的内容一起流传输到客户端100的视频流服务,或者提供用于这样的广告或其它这样的内容的插入点,以使得客户端100从一个或更多个其它内容提供者请求内容。
根据各种实现,内容提供者112可以向包括一个或更多个内容标签的客户端设备100提供第一方网页数据。通常,内容标签是指使用第一方网页与包括第三方内容的动作相关联的任何一段网页代码。内容标签可以在网页上定义用于第三方内容的槽、用于页外第三方内容的槽(例如,插页式槽)、是否应当异步地或同步地加载第三方内容、是否第三方内容的加载应当在网页上禁用、是否应该刷新未成功加载的第三方内容、提供第三方内容的内容源(例如,另一内容提供者112、评判组提供者116等)的网络位置、与点击第三方内容相关联的网络位置(例如,URL)、第三方内容将如何在显示器上呈现、使得客户端设备100设置浏览器cookie的命令(例如,经由经由图像请求设置cookie的像素标签)、用于检索第三方内容的一个或更多个关键字以及与使用第一方网页提供第三方内容相关联的其它功能。内容提供者112可以向客户端设备100提供使得客户端设备100向评判组提供者116发送请求的第一方网页数据。
受众测量服务器114可以包括连接到网络110并且被配置为从一个或更多个客户端100接收内容标识符和设备标识符以用于分析或受众测量的一个或更多个计算设备。受众测量服务器114还可以被配置为从评判组提供者116接收一个或更多个查询,选择和聚合内容标识符和设备标识符,以及向评判组提供者提供测量数据。
评判组提供者116可以包括连接到网络110并被配置为从一个或更多个客户端100接收内容标识符以供分析或受众测量的一个或更多个计算设备。评判组提供者116可以被不同地称为测量者、测量系统、服务器、数据服务器、服务提供者或通过其它类似术语。评判组提供者116可以是被配置在服务器群或服务器云中用于分布式处理并且可以提供其它功能的多个设备。在一个实现中,评判组提供者116可以是一个或更多个内容提供者112和客户端100之间的中介,而在其它实现中,评判组提供者116可以经由网络110与内容提供者112通信。
在图1A的示例性信号流中所示的经由评判组成员的客户端设备的受众测量的一个实现中,在步骤A处,客户端设备100可以向内容提供者112传送对内容的请求。该请求可以是任何形式或协议,诸如用于在网页处新闻文章或其它内容的超文本传输协议(HTTP)GET请求。在其它实现中,请求可以用于流视频,诸如电视节目或电影。在步骤B处,内容提供者112可以将内容传送到客户端100。
在步骤C处,客户端设备100或应用102可以识别所传送的内容,并且向受众测量服务器114传送内容标识符和一个或更多个客户端标识符104-108以用于存储和聚合。内容标识符可以包括统一资源定位符(URL)、统一资源标识符(URI)、字母数字字符串、文件名、替代标识符(alt ID)或任何其它这样的信息。在一些实施方式中,内容标识符可以包括内容在页面上(例如在上框架、下框架中)的放置或内容在页面的层级内的位置的标识(例如,嵌入的页面元件的子元件)。客户端设备100和/或应用102可以响应于包括在所接收的内容中的命令(例如,HTTP文档中的IMG标签)来传送内容标识符和/或客户端标识符,其使得在一些实现中网络浏览器102从受众测量服务器114请求相应的图像。这样的图像可以是一个像素乘一个像素的图像或透明图像,以避免在接收到图像时由客户端100显示任何视觉伪像。内容标识符可以是图像的URL的一部分或者在请求中传送到服务器的URL的参数。在一个这样的实现中,针对传送给客户端的每一个内容项目(例如,“http://www.example.com/img/content_id_001.jpg”),可以在页面中包括不同的URL以标识预定第一内容项目),而在另一个这样的实现中,内容可以被识别为参数(例如“http://www.example.com/img/content.jpg?id=001”)。还可以使用将内容标识符传送到受众测量服务器的其它方法。在一些实现中,到内容的嵌入标签或链接可以包括HTML PING标签,该HTML PING标签使得应用102传送对由标签中的URL标识的文档或内容的第一请求,并且向由PING标签指定的URL传送第二通信(例如,受众测量服务器114)。在又一实现中,应用102可以在受众测量服务器114的URL处请求内容,其可以存储所请求内容的标识,并且使用HTTP重定向(例如,状态代码302或HTTP刷新头指定不同的URL)在内容提供者108处标识所请求的内容的URL。在一些实现中,应用102可以将客户端标识符包括为HTTP GET请求内的cookie或选项。
在步骤D处,在一些实施方式中,客户端100可以将内容标识符和/或客户端标识符传送到评判组提供者110。在其它实施例中,例如在客户端不执行评判组提供者提供的捕获代理的情况下,步骤D可以被跳过。来自不执行捕获代理的客户端的数据可以随后由评判组提供者从受众测量服务器114获得。该数据可以与来自与个人相关联的设备的其它数据聚合。在一个这样的实现中,评判组提供者110可以从评判组成员的膝上型计算机直接接收内容标识符和客户标识符,并且可以经由受众测量服务器从评判组成员的智能电视接收内容标识符和客户标识符。因此,跨媒体数据聚合是可能的,即使数据可从不同的源获得。
在步骤E处,评判组提供者116可以向受众测量服务器114传送对测量数据的请求。在一些实现中,请求可以包括一个或更多个客户标识符的集合用于检索数据,和/或可以包括一个或更多个内容标识符的集合用于检索数据。该请求可以包括客户端标识符的列表,并且受众测量服务器114可以对由相应客户端接收的内容的内容标识符的聚合集合进行响应。在另一示例中,请求可以包括内容标识符的集合,并且受众测量服务器114可以对接收到相应内容的客户端标识符的聚合集合进行响应。在又一示例中,请求可以包括内容标识符的集合,并且受众测量服务器114可以对与还接收到与请求的内容标识符相对应的内容的客户端接收的内容相对应的其它内容标识符进行响应。在这样的实现中,评判组提供者116可以请求访问特定网站的所有客户端的测量数据。
在图1A所示的实现中,客户端100在步骤C处直接向受众测量服务器114传送内容和客户端标识符。在其它实现中,客户端100可以向评判组提供者116传送内容和客户端标识符(如在步骤D处),并且评判组提供者116可以将标识符转发给受众测量服务器114,或者重定向客户端100以将标识符重传到受众测量服务器114。在一个这样的实现中,评判组提供者116可以向客户端100提供HTTP 302重定向响应,其指示客户端100应当向受众测量服务器114重传包括内容和/或客户端标识符的请求。
在单源评判组测量的许多实现中,评判组提供者116要求用户或设备例如经由用户名或帐户名或密码或其它认证系统来认证或登录评判组提供者。这可以被实现以允许跟踪随时间显示给特定用户或者(例如通过多会话、多天、多周或其它这样的时间段)传送到设备的内容。在一些实现中,可以经由如上所述的浏览器插件或收集代理来处理认证。在其它实现中,可以经由登录到评判组提供者的服务来处理认证,并且评判组提供者可以向设备传送会话标识符或cookie。会话标识符或cookie可以被设置为在预定时间量之后或在结束会话时终止(例如,终止网络浏览器或应用的执行,重新启动计算设备或使设备休眠等)。
为了允许在不需要收集代理的会话或其它时间段期间识别和测量特定评判组成员接收的内容,在一些实现中,评判组提供者可以通过使客户端设备首先登录到评判组提供者并接收会话标识符来向受众测量服务器注册用户,然后让客户端设备将会话标识符传送给受众测量服务器。受众测量服务器可以向设备传送cookie或设备标识符以在传送内容标识符时使用。客户端设备100可以登录、注册或以其它方式向评判组提供者116认证自身。评判组提供者116可以向客户端设备传送会话标识符,诸如在到指定URL的重定向消息(例如http://www.example.com/register?CookieID=xxxxx)。客户端设备100可以将会话标识符传送到受众测量服务器114,并且受众测量服务器114可以生成与会话标识符相对应的另一cookie或客户端标识符,并且将cookie或客户端标识符传送到客户端100,以用于将来与内容标识符一起传输。受众测量服务器114可以维护会话标识符和相关联的cookie或设备标识符的记录,使得当受众测量服务器向评判组提供者116提供内容标识符用于聚合或分析时,可以利用会话标识符(因此,评判组成员)来标识内容标识符。
在类似的实现中,为了提高评判组的机密性,可以不向受众测量服务器114提供会话标识符;相反,设备100可以简单地从受众测量服务器114请求客户端标识符或cookie。在一些实现中,在接收到客户端标识符或cookie时,客户端设备100可以将客户端标识符或cookie传送到评判组提供者116。评判组提供者116可以将设备标识符或cookie与发送到客户端设备100的会话标识符或生成的会话标识符相关联。在随后接收到内容标识符和设备标识符或cookie时,评判组提供者116可以利用所存储的关联来标识哪些内容标识符对应于哪些设备100。
在未示出的类似实现中,部署在客户端设备100和网络110之间的中间设备可以处理与评判组提供者116的注册以及会话标识符、设备标识符或cookie的传输、接收或请求。诸如路由器或网关的这样的中间设备可以用于测量递送到评判组家庭或用户组而不是个体用户或设备的内容。这可以被实现以降低系统的复杂性(避免在多个设备上安装收集代理)并且增加评判组参与者的个人隐私。
图1B是根据一个实现的包括客户端标识符142和内容标识符148的事件140的图。事件140可以由客户端100经由上述任何方法传送到受众测量服务器114。事件140可以作为请求中的一个或更多个参数-值对来传输,例如HTTP GET请求。客户标识符142可以包括多个客户标识符分段144a-144n。在一些实现中,诸如在客户标识符142包括评判组提供者提供的cookie的情况下,每一个分段144a-144n可以表示客户端和/或评判组成员的特性或特性,例如人口统计或设备信息。第一分段144a可以表示评判组成员的性别,并且第一分段144a的位或字符串可以被设置为预定值以指示评判组成员的性别。类似地,第二分段144b可表示预定年龄组。在许多实现中,每一个分段144a-144n的含义可以不提供给受众测量服务器,使得受众测量服务可能不能确定评判组成员或设备的特性,尽管接收到客户端标识符142。
在另一实现中,评判组提供者可以计算客户标识符分段144a-144n的散列,并且可以将散列结果146提供给客户端100以用作cookie。评判组提供者可以在评判组中的参与者注册期间获得关于每一个评判组参与者的人口统计信息。评判组提供者可以生成包括多个分段144a-144n的标识符,每一个分段指示评判组参与者的特定特性。评判组提供者可以计算标识符的散列,并且可以向客户端提供散列结果,以便利用内容标识符传输到受众测量服务器。通过对分段144a-144n使用散列计算,具有相似但不相同的人口统计特征的评判组参与者可以具有非常不同的散列结果146,使得受众测量服务器可能不能识别参与者是否具有共同的任何特性。在类似的实现中,受众测量服务器可以计算分段144a-144n的散列并且使用散列结果146来与评判组提供者提供的查询中的数据阵列(例如位图或布隆过滤器)进行比较。
如上所述,事件日志140可以包括内容标识符148或内容项目的标识。这样的标识符可以包括不同的信息,诸如内容的源的IP地址、内容的名称、内容的元数据、内容的类型等。在一些实现中,该不同的信息可以由多个分段150a-150n,或者可以由受众测量服务器、内容提供者和/或评判组提供者编码为多个分段150a-150n。在另一实现中,如上所述,可以计算分段150a-150n的散列以生成散列的内容标识符152。这可以用于使内容模糊和/或提供对查询过滤器的更快的检索或比较。
图1C是示出根据一个实施方式的阻止受众测量服务器识别个体客户端的人口统计特征或特征的一个这样的混淆查询的图。如图所示,可以向受众测量服务器提供多个散列的客户端标识符146a-146d。如上所述,这些标识符可以被包括在从对应的客户端100a-100d接收的经由重定向或ping传送的cookie中,或者可以在客户端的注册期间由评判组提供者发送到受众测量服务器并且与其它客户端标识符(例如,设备标识符、IP地址等)相关联。在所示的示例中,客户端A和客户端B可以共享第一人口统计特征或特征,而客户端C和客户端D可以不共享特征。然而,一旦被散列以创建唯一标识符146a-146d,则从客户端A和B共享该特性的标识符特征可能不容易显而易见。
为了查询第一特性的测量数据,评判组提供者可以传送对测量数据的请求,该请求包括一个或更多个数据阵列或过滤器160a-160b。在一个实现中,标识符146a-146d可以被存储为位图,并且过滤器160a-160b可以包括要在逻辑双条件计算中使用的掩码或位图(例如,包括标识符当且仅当其包括所有过滤器的打开位)。在类似的实现中,过滤器160a-160b可以包括用于逻辑双条件计算的布隆过滤器或概率数据阵列。
在所示示例中,过滤器A160a包括与客户端标识符A-C 146a-146c中的对应位匹配的第一位,并且用于生成客户端标识符A 162a的第一子集。类似地,过滤器B 160b包括与客户端标识符A-B和D 146a-146b、146d中的两个对应位匹配的两个位,并且用于生成客户端标识符B162b的第二子集。受众测量服务器然后可以确定子集a 162a和子集b162b的交集164,并选择所得到的客户标识符A-B 146a-146b。可以检索这些所选标识符的测量数据并将其提供给评判组提供者。
因此,通过经由散列混淆每一个客户端标识符的特性,并且提供一起仅识别期望的客户端的多个过滤器,评判组提供者可以检索数据而不通知受众测量服务器客户端的特性或任何特定查询的内容。
图1D是根据一个实施方式的与评判组提供者通信以聚合和匿名测量数据的受众测量服务器114的框图。如图所示,测量服务器114可以存储一个或更多个中继日志180,其可以包括如上面结合图1B所讨论的多个事件日志140。日志180可以以任何类型和形式的数据库、平面文件、数据文件或其它结构存储,并且可以存储在与受众测量服务器114通信的内部和/或外部的一个或更多个存储设备上。
在一些实施方式中,受众测量服务器114可以包括IP散列提取器182。IP散列提取器182可以包括用于从客户端事件ping或日志提取IP地址并且将IP地址作为查询传送到散列服务184(诸如由内容提供者提供的散列服务)的应用、服务、守护进程、例程或其它可执行逻辑。在一些实现中,内容提供者可以维护内容已经被递送到的客户端的标识符。这样的标识符可以与IP地址相关联,诸如从IP地址的散列计算生成的标识符。在这样的实现中,受众测量服务器114可以从接收自客户端100的ping或重定向请求向散列服务184传送IP地址,并且接收与由散列服务和/或内容提供者生成的客户端相关联的标识符。在一些实现中,客户端IP地址与来自散列服务器184的散列标识符的关联可以存储在IP日志186中。IP日志186可以被存储为与事件日志180分开的数据库,或者可以存储在相同的数据库中,并且在一些实现中与相应的客户端标识符相关联。
在一些实现中,受众测量服务器114可以包括匿名器188。下面更详细讨论的匿名器188可以包括应用、服务器、服务、守护进程、例程或其它可执行逻辑(虚线),用于将在从评判组提供者116接收的请求中的数据阵列应用于中继日志180和/或IP日志186以生成要提供给评判组提供者116的聚合测量数据190。在一些实现中,匿名器188可以通过将事件日志合并进集合事件日志(例如,用识别内容项目的单个日志和唯一客户端标识符的数目的计数来替换标识内容项目和不同客户端标识符的多个单独日志;替换内容项目的显式标识符,例如具有通用术语的内容名称,例如内容的类型或内容的来源等)。在下面更详细讨论的一些实现中,匿名器188可以基于对查询的结果的数目来确定是否可以唯一地标识评判组参与者或个体,并且响应于该确定,提供数据的匿名版本,例如具有用针对每一个查询计算的不同散列值替换的客户端标识符的数据。
所示的图2A是客户端、评判组参与者或非评判组参与者(诸如客户端设备100)的计算设备200的一个实现的框图。客户端设备200可以是被配置为经由网络106通信的任何数目的不同类型的用户电子设备网络,包括但不限于膝上型计算机、台式计算机、平板计算机、智能电话、数字视频记录器、用于电视机的机顶盒、视频游戏控制台或任何其它类型和形式的计算设备或设备的组合。在一些实现中,客户端设备200的类型可以被分类为移动设备、桌面设备或旨在保持静止或被配置为主要经由局域网访问网络106的设备或另一类电子设备(例如,媒体消费设备)。
在许多实现中,客户端设备200包括处理器202和存储器204。存储器204可以存储机器指令,当由处理器202执行时,使得处理器202执行这里描述的一个或更多个操作。处理器202可以包括微处理器、ASIC、FPGA等或其组合。在许多实现中,处理器202可以是多核处理器或处理器阵列。存储器202可以包括但不限于能够向处理器202提供程序指令的电子、光学、磁性或任何其它存储设备。存储器202可以包括软盘、CD-ROM、DVD、磁盘、存储器芯片、ROM、RAM、EEPROM、EPROM、闪存、光学介质或者处理器202可以从其读取指令的任何其它合适的存储器。指令可以包括来自任何合适的计算机编程语言的代码,诸如但不限于C、C++、C#、Java、JavaScript、Perl、HTML、XML、Python和Visual Basic。
客户端设备200可以包括一个或更多个网络接口206。网络接口206可以包括任何类型和形式的接口,包括包括10个Base T、100个Base T或1000个Base T(“Gigabit”)的以太网;诸如802.11a、802.11b、802.11g、802.11n或802.11ac的任何种类的802.11无线;蜂窝,包括CDMA、LTE、3G或4G蜂窝;蓝牙或其它短距离无线连接;或这些的任何组合或用于与网络106通信的其它接口。在许多实现中,客户端设备200可以包括不同类型的多个网络接口206,允许连接到各种网络106或网络106,例如经由不同的子网的互联网。
客户端设备200可以包括一个或更多个用户界面设备208。用户界面设备208可以是通过产生感觉信息(例如,显示器上的可视化、一个或更多个声音、触觉反馈等等)将数据传达给用户和/或将从用户接收的感觉信息转换成电子信号(例如,键盘、鼠标、指示设备、触摸屏显示器、麦克风等)的任何电子设备。根据各种实现,一个或更多个用户界面设备可以在客户端设备200的外壳内部,诸如内置显示器、触摸屏、麦克风等,或者在客户端设备200的外壳的外部,诸如连接到客户端设备200的监视器、连接到客户端设备200的扬声器等。
客户端设备200可以在存储器204中包括应用210或者可以利用处理器202执行应用210。应用210可以是用于接收内容以及用于传送响应、命令或其它数据的应用、小程序、脚本、服务、守护进程、例程或其它可执行逻辑。在一个实现中,应用210可以是网络浏览器,而在另一实现中,应用210可以是视频游戏。应用210可以包括用于显示经由网络接口206接收和/或由处理器202本地产生的内容以及用于传送经由用户界面设备208接收的交互(诸如对网站的请求、对调查响应选项的选择、输入文本串等等)的功能。
在一些实施方式中,应用210可以包括数据收集器212。数据收集器212可以包括用于收集由应用210处理的数据的应用插件、应用扩展、子例程、浏览器工具栏、守护进程或其它可执行逻辑。在一些实施方式中,数据收集器212可以是与应用210分离但被配置为拦截和/或收集由应用210处理的数据的单独的应用、服务、守护进程、例程或其它可执行逻辑,诸如屏幕刮刀、分组拦截器、API钩子过程或其它此类应用。数据收集器212可以被配置为拦截或接收经由用户界面设备208输入的数据,诸如互联网搜索查询、文本串、调查响应选择或其它值、或者由应用210接收和处理的数据,包括访问的网站、与网站或应用交互的时间、页面读取或其它此类数据。在许多实现中,数据收集器212可以在行为历史数据库或其它数据结构中存储这些数据的一些或全部或这些数据的标识符,并且可以包括访问的网站的标识、跟随的网络链接、输入的搜索查询或其它这样的数据。在一些实现中,数据可以是匿名的或消歧的,以减少个人可识别信息。数据收集器212可以识别与诸如“欧洲旅游”或“旅行”的搜索查询相对应的预定类别并记录与预定类别相关的搜索的指示,而不是记录所输入的单独搜索查询,诸如“法国的度假地点”的查询。在其它实现中,数据收集器212可以标识由客户端设备接收的流式多媒体内容,诸如电视节目、电影、歌曲、音乐视频或其它这样的内容。可以基于包括ID3标签或其它这样的元数据、统一资源定位符(URL)或统一资源标识符(URI)、文件名或伴随内容的任何其它类型和形式的数据的标识符标签来标识内容。在其它实现中,数据收集器212可以由服务器或部署在客户端和服务器之间的中间设备(诸如路由器、电缆调制解调器或其它这样的设备)执行。当请求和响应经过路由器时,数据请求和响应可以由在中间路由器上执行的数据收集器212解析。在一些实现中,这可以允许监视去往/来自家庭的所有数据流,而不需要在家庭内的多个设备上安装数据收集器212。
客户端200可以包括或标识有设备标识符214。设备标识符214可以包括任何类型和形式的标识,包括但不限于MAC地址、文本和/或数字数据串、用户名、加密公钥、cookie、设备序列号、用户简档数据、网络地址或可以用于将客户端200与其它客户端200区分开的任何其它这样的标识符。在一些实现中,设备标识符214可以与一个或更多个其它设备标识符214(例如,移动设备的设备标识符、家庭计算机的设备标识符等)相关联。在许多实现中,如上所述,设备标识符214可以由评判组提供者或受众测量服务器生成和/或传送到设备200,并且可以响应于请求或成功登录、注册或认证评判组提供者传送。因此,在一些实现中,客户端200可以包括由评判组提供者生成的会话标识符216。在其它实现中,如上所述,客户端200可以从受众测量服务器请求设备标识符或cookie 214,并且可以将设备标识符或cookie 214传送到评判组提供者以用于与设备和/或会话标识符相关联。在一些这样的实现中,会话标识符可以由评判组提供者存储或维护,而不提供给设备。
现在参考图2B,示出了如上面结合图1A所讨论的计算设备或服务器218(诸如受众测量服务器114、内容提供者108或评判组提供者110)的实现的框图。与客户端设备200一样,服务器218可以包括一个或更多个处理器202、存储器204、网络接口206和用户界面208。在被称为无头服务器的一些实现中,服务器218可以不包括用户界面208,但是经由网络106利用用户界面208与客户端200通信。存储器204可以包括内容存储232,诸如网页、图像、音频文件、视频文件、数据文件或任何其它类型和形式的数据的存储。在一些实现中,存储器204可以存储由服务器218的处理器202执行的一个或更多个应用210(未示出),包括FTP服务器、网络服务器、邮件服务器、文件共享服务器、对等服务器或用于递送存储在内容存储器232中的内容的其它这样应用。
在一些实现中,服务器218可以执行测量引擎220。测量引擎220可以包括用于测量内容项目的受众的应用、服务、服务器、守护进程、例程或其它可执行逻辑,包括接收内容标识符和/或设备标识符,根据设备标识符聚合或排序内容标识符,以及在时间段期间测量内容项目的受众。测量引擎可以对识别在与不同设备标识符相关联的一段时间(例如一小时)内接收到的内容的特定项目的内容标识符的数目进行计数,以对接收该内容项目的受众的大小进行计数。可以向内容提供者、广告提供者、营销商、发布商、分析师或其它人提供这种受众测量。
在一些实现中,服务器218可以根据使用来执行加密引擎222,有时被称为解密引擎或加密/解密引擎。加密引擎222可以包括用于加密数据的应用、服务、例程、服务器、守护进程或其它可执行逻辑。在一些实现中,加密引擎222可以包括加密硬件或与加密硬件交互。加密引擎222可以执行任何类型的加密和/或解密算法,包括任何种类的高级加密标准(AES)算法、安全散列算法(SHA)或任何其它类型的对称加密。在其它实现中,加密引擎222可以执行任何其它类型的加密和/或解密,包括非对称加密方案、公钥加密方法、密码散列函数或任何其它类型和形式的密码或密码术。
在一些实施方式中,服务器218可以执行cookie和/或过滤器生成器224,其被称为过滤器生成器、过滤器模块、过滤器或其它这样的名称。在一些实现中,cookie生成器224可以计算客户端标识符的散列,并且可以将该散列结果提供给客户端和/或受众测量服务器以用于与客户端的测量数据相关联。如上面结合图1B-图1C所讨论的,可以在客户端的注册期间和/或从客户端的中继或重定向ping中向受众测量服务器提供散列的客户端标识符或cookie。在一些实现中,过滤器生成器224可以生成数据阵列,例如位图,或者标识用于构造查询的散列的客户端标识符的概率数据结构。这样的结构可以包括布隆过滤器阵列或商过滤器阵列,或任何其它类型和形式的概率数据结构,如上所述。在许多实现中,可以由比较器226应用过滤器阵列或数据结构以从测量数据库提取数据(诸如内容和设备标识符),以生成与用于生成概率数据结构的设备标识符相对应的数据的子集。在许多实现中,过滤器还可以响应于将过滤器应用于未请求数据的客户端标识符而导致的假肯定的数目,提取剩余数据的一些部分。如上所述,在这样的实现中,可以应用多个过滤器,其中过滤器结果的交集被提供给评判组提供者。因此,即使客户端标识符可能被错误地选择用于子集选择,可以在过滤器结果的交集期间移除假肯定。因此,受众测量服务器可以向评判组提供者提供数据的集合,而不能标示哪些客户标识符对应于哪些特性。
比较器226可以包括用于将一个或更多个客户端标识符或散列的客户端标识符与过滤器或数据阵列进行比较,并且在一些实现中,用于计算多个过滤器的交集的应用、服务、服务器、守护进程或其它可执行逻辑。在一个实现中,比较器226可以确定客户端标识符是否满足由过滤器指定的逻辑双边条件。在一些实现中,比较器226可以确定多个子集,然后选择子集的交集,而在其它实现中,比较器226可以应用第一过滤器来选择第一子集;然后将第二过滤器应用于第一子集以选择第一子集的第二子集。这可以减少在存储器中存储多个子集的需要。然而,在其它实现中,子集可以被单独生成,使得受众测量服务器可以确定任何子集是否具有比预定阈值更少数目的成员,指示匿名器228应当采取附加步骤以保持匿名。
匿名器228可以包括应用、服务、服务器、守护进程或其它可执行逻辑,用于确定在向评判组提供者提供数据之前是否应该对数据应用一个或更多个匿名,以及用于应用这样的匿名。如上所述,在一些实现中,如果评判组提供者提供具有大量过滤器的查询,则可以经由过滤结果的交集生成唯一的客户端标识符,允许评判组提供者检索由特定客户端查看的所有内容的测量。这可能是过分侵犯隐私。因此,在许多实现中,匿名器228可以确定相交结果和/或子集中的客户端标识符的数目是否低于预定阈值。如果是,在一个实现中,匿名器228可以用不能检索结果以保护个体的隐私的指示来响应评判组提供者的请求。在另一实现中,匿名器228可以在将测量数据提供给评判组提供者之前从聚合的测量数据中移除客户端标识符。匿名器228可以提供指示多个客户端观看特定内容项目而不提供任何特定客户端标识符的测量数据。在又一实现中,匿名器228可以响应于过滤器计算为子集选择的每一个客户端标识符的散列,并且向评判组提供者提供每一个子集的散列客户端标识符,而不是确定过滤结果的交集。如果第一过滤器使得受众测量服务器选择五个客户端标识符,并且第二过滤器使得受众测量服务器选择三个客户端标识符,并且所得到的过滤结果的交集小于阈值,则匿名器228可以计算八个客户端标识符中的每一个客户端标识符的散列并向提供者提供每一个子集的散列结果。结果可以单独提供或组合提供,并且不确定交叉点。在许多实现中,匿名器228可以对每一个子集使用不同的散列计算或盐值,使得评判组提供者可能不能识别每一个返回的子集中的匹配的客户标识符。可以对每一个查询使用不同的盐值或散列计算,从而防止评判组提供者重复查询以便唯一地标识客户端。
在一些实施方式中,服务器218可以维护日志和测量数据库230.日志和测量数据库230可以包括任何类型和形式的数据库、平面文件、数据文件、数据阵列或其它数据结构,用于存储具有对应的客户端标识符、设备标识符、cookie、IP地址、散列地址和/或会话标识符的多个内容标识符。在许多实现中,日志和测量数据库230还可以包括接收或传送的内容标识符的时间戳。在一些实现中,日志和测量数据库还可以包括评判组成员的帐户信息,包括用户或帐户名称、登录密码或其它凭证、设备类型或其它参数(例如,操作系统、网络浏览器类型或其它应用类型、网络连接类型或速度、地理位置等)。尽管被示为服务器218的一部分,但是测量数据库可以存储在一个或更多个内部和/或外部存储设备上,包括网络可访问存储器。
如上所述,在许多实现中,当开始与在线内容的交互会话时,评判组成员可以注册或登录评判组提供者。一些评判组提供者向用户提供对参与单源评判组的激励,诸如产品的优惠券或折扣、免费服务或其它这样的诱惑。因此,评判组成员可以注册或选择参与数据收集。为了保护参与者的隐私,在许多实现中可以限制或匿名数据收集。为了跟踪参与评判组提供者可以提供要在客户端设备上执行的客户端代理,诸如网络浏览器插件或应用,或者客户端设备可以登录或注册与评判组的会话。在一些实现中,会话可以是时间限制的,并且在预定时间之后自动到期,而在其它实现中,客户端设备可以传送第一通信以发起会话,并且传送第二通信以终止会话。
图3是用于混淆的受众测量的方法300的一个实现的流程图,其中受众测量服务不知道或不了解任何客户端特性或人口统计数据。在步骤302处,受众测量服务器可以接收内容标识符和/或一个或更多个客户端标识符。在一些实现中,如上所述,受众测量服务器可以从客户端,例如经由中继ping或重定向请求,从客户端上的插件或收集代理,从内容提供者或从评判组提供者接收内容标识符和客户端标识符。在一些实现中,客户端标识符可以包括由评判组提供者提供的cookie或散列的客户端或会话标识符,如上所述。在步骤304处,受众测量服务器可以将标识符添加到测量或日志数据库。在一些实现中,例如当在来自客户端的对内容的请求中接收到内容标识符时,在步骤306处,受众测量服务器可以用将客户端引导到内容位置的重定向响应来响应。针对附加客户端和/或内容标识符可以重复步骤302-306。
在步骤308处,受众测量服务器可以从评判组提供者接收对测量数据的请求。该请求可以包括用于过滤客户端标识符的一个或更多个数据阵列、过滤器、位图、布隆过滤器或其它概率数据结构。如上所述,在一些实现中,请求可以不标识要检索的客户端标识符的特性或特征,而是可以仅经由多个过滤器的应用结果的交集来标识期望的客户端标识符。
在步骤310处,受众测量服务器可以应用过滤器或数据阵列来选择客户端标识符的第一子集。在一个实现中,应用过滤器或数据阵列可以包括使用位图作为针对每一个客户端标识符的位图的掩码,其中客户端标识符具有为第一子集选择的掩模匹配位图。在另一实现中,应用过滤器或数据阵列可以包括:确定每一个客户端标识符或散列标识符针对数据阵列或过滤器的逻辑双条件,其中客户端标识符满足为子集选择的双条件要求。如果请求中存在附加阵列,则在一些实现中,可以如图所示为每一个阵列重复步骤310。如上所述,在一些实现中,可以为每一个阵列单独地选择子集以增强匿名性,而在其它实现中,可以将每一个阵列或过滤器应用于先前确定的子集,以减少存储器需求。
在步骤312处,在一些实现中,受众测量服务器可以确定在步骤310处生成的任何子集的大小(例如,生成的子集中唯一客户标识符和/或唯一散列标识符的数目)是否小于预定阈值n。如果是,则可以识别个人。因此,为了增强隐私,在一些实现中,在步骤314处,受众测量服务器可以计算子集中的每一个客户标识符的散列。在一些实现中,可以为每一个子集使用不同的散列计算或散列盐值。在一个这样的实现中,用于选择子集的每一个数据阵列可以用作用于子集中的客户端标识符的散列计算的盐值。在另一个这样的实现中,时钟时间可以用作每一个散列计算的盐值(例如,首先对子集中的客户端标识符执行散列计算的时钟时间),使得每一个子集的散列用不同的时钟值生成盐值。然后可以在步骤318处合并或聚合这些子集以生成客户端标识符的另一子集。用于另一子集的测量数据,诸如由客户端接收的内容的内容标识符的聚合集合对应于另一子集的客户端标识符,可以从事件日志数据库中检索,并且可以在步骤320处被传送到评判组提供者。
如果在步骤310处生成的任何子集的大小不小于阈值,则在步骤316处,子集可以相交,以选择包括在每一个子集中的客户端标识符或散列标识符的另一子集。如上所述,在步骤318处,用于另一子集的测量数据,诸如由客户端接收的对应于另一子集的客户端标识符的内容的内容标识符的聚合集合,可以从事件日志数据库检索并且可以在步骤312处传送到评判组提供者。在一些情况下,尽管在步骤312处初始子集具有大于阈值的大小,但是在步骤316处从初始子集的交集得到的另一子集可以具有小于阈值的大小。因此,在一些实现中,可以在步骤316之后执行步骤312。如果另一子集具有大于阈值的大小,则该方法可以进行到步骤318。如果另一子集不具有大于阈值的大小,则该方法可以进行到如上所述的步骤314,其中初始子集被散列和合并以保护客户端的匿名性。
如上所述,在许多这样的实现中,所收集的数据可以是匿名的或消歧的,以保护隐私,特别是对于不是评判组参与者的个人。在其中可以收集关于客户端设备的用户的个人信息以用于测量或用于选择第三方内容的许多这样的实现或类似情况中,可以向用户提供控制是否可以收集个人信息的程序或特征的机会(例如,关于用户的社交网络、社交动作或活动、用户偏好或用户的当前位置的信息)等,或控制是否或如何将测量数据传送到受众测量服务器和/或评判组提供者的机会。另外,在受众测量服务器存储或使用之前,可以以一种或更多种方式处理某些数据,使得当生成参数(例如,人口统计参数)时移除个人可识别信息。用户的身份可以是匿名的,使得不能为用户确定个人可识别的信息,或者可以在获得位置信息(例如到城市、邮政编码或州级别)的地方,推广用户的地理位置,使得不能确定用户的特定位置。因此,用户可以具有对如何收集关于他或她并由受众测量服务器、评判组提供者和内容提供者使用的信息的控制。
在本说明书中描述的主题和操作的实现可以在数字电子电路中,或在计算机软件、固件或硬件中实现,包括本说明书中公开的结构及其结构等同物,或者它们中的一个或更多个。在本说明书中描述的主题的实现可以实现为在一个或更多个计算机存储介质上编码的一个或更多个计算机程序,即,计算机程序指令的一个或更多个模块,用于由数据执行或控制数据的操作处理装置。替代地或另外地,程序指令可以被编码在人工生成的传播信号上,例如机器生成的电、光或电磁信号,其被生成以编码信息以用于传输到合适的接收机设备以由数据处理装置。计算机存储介质可以是或可以包括在计算机可读存储设备、计算机可读存储基板、随机或串行存取存储器阵列或设备中,或它们中的一个或更多个的组合中。此外,虽然计算机存储介质不是传播信号,但是计算机存储介质可以是在人工生成的传播信号中编码的计算机程序指令的源或目的地。计算机存储介质还可以是或者包括在一个或更多个单独的组件或介质(例如,多个CD、盘或其它存储设备)中。因此,计算机存储介质可以是有形的。
在本说明书中描述的操作可以被实现为由数据处理装置对存储在一个或更多个计算机可读存储设备上或从其它源接收的数据执行的操作。
术语“客户端”或“服务器”包括用于处理数据的所有种类的装置、设备和机器,包括例如可编程处理器、计算机、芯片上系统或上述多个系统或组合。该装置可以包括专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如构成处理器固件、协议栈、数据库管理系统、操作系统、跨平台运行时环境、虚拟机或它们中的一个或更多个的组合。装置和执行环境可以实现各种不同的计算模型基础设施,诸如网络服务、分布式计算和网格计算基础设施。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言编写,包括编译或解释语言、声明性或过程语言,并且它可以部署在包括作为独立程序或作为模块、组件、子例程、对象或适合在计算环境中使用的其它单元的任何形式。计算机程序可以但不需要对应于文件系统中的文件。程序可以存储在保存其它程序或数据(例如,存储在标记语言文档中的一个或更多个脚本)的文件的一部分中,专用于所述程序的单个文件中,或者存储在多个协同文件中(例如,存储一个或更多个模块、子程序或代码部分的文件)。计算机程序可以被部署为在一个计算机上或在位于一个地点或分布在多个地点并通过通信网络互连的多个计算机上执行。
本说明书中描述的过程和逻辑流程可以由执行一个或更多个计算机程序的一个或更多个可编程处理器执行,以通过对输入数据进行操作并生成输出来执行动作。过程和逻辑流程也可以由专用逻辑电路(例如FPGA(现场可编程门阵列)或ASIC(专用集成电路))来执行,并且装置也可以实现为专用逻辑电路。
适合于执行计算机程序的处理器包括例如通用和专用微处理器以及任何种类的数字计算机的任何一个或更多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于根据指令执行动作的处理器和用于存储指令和数据的一个或更多个存储器设备。通常,计算机还将包括用于存储数据的一个或更多个大容量存储设备,例如磁盘、磁光盘或光盘,或者可操作地耦合以从其接收数据或向其传送数据。然而,计算机不需要具有这样的设备。此外,计算机可以嵌入在另一设备中,例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏控制台、全球定位系统(GPS)接收器或便携式存储设备(例如,通用串行总线(USB)闪存驱动器)等。适合于存储计算机程序指令和数据的设备包括所有形式的非易失性存储器、介质和存储器设备,例如包括半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘或可移动盘;磁光盘;和CD ROM和DVD-ROM盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
为了提供与用户的交互,本说明书中描述的主题的实现可以在具有显示设备(例如,CRT(阴极射线管)、LCD(液晶显示器)、OLED(液晶显示器)有机发光二极管)、TFT(薄膜晶体管)、等离子体、其它柔性配置或用于向用户显示信息的任何其它监视器和键盘、指示设备(例如鼠标,轨迹球等)或触摸屏、触摸板等,由此用户可以向计算机提供输入。其它类型的设备也可以用于提供与用户的交互;提供给用户的反馈可以是任何形式的感觉反馈,例如视觉反馈、听觉反馈或触觉反馈;并且可以以任何形式接收来自用户的输入,包括声音、语音或触觉输入。另外,计算机能够通过向用户使用的设备发送文档和从用户使用的设备接收文档来与用户交互;例如通过响应于从网络浏览器接收的请求而向用户的客户端设备上的网络浏览器发送网页。
在本说明书中描述的主题的实现可以在包括后端组件(例如,作为数据服务器)或包括中间件组件(例如,应用服务器)的计算系统中实现,或者包括前端组件,例如具有图形用户界面或网络浏览器的客户端计算机,用户可以通过该客户端计算机与本说明书中描述的主题的实现交互,或者一个或更多个这样的后端、中间件或前端组件。系统的组件可以通过任何形式或介质的数字数据通信(例如通信网络)互连。通信网络的示例包括局域网(“LAN”)和广域网(“WAN”)、网络间(例如,互联网)和对等网络(例如,对等网络)。
这里公开的特征可以在智能电视模块(或连接的电视模块、混合电视模块等)上实现,其可以包括被配置为将互联网连接与更传统的电视节目源(例如,经由电缆、卫星、空中或其它信号)。接收内容并向受众测量服务提供中继ping、标识符或其它数据的客户端设备和/或评判组提供者可以是智能电视模块。智能电视模块可以物理地结合到电视机中,或者可以包括诸如机顶盒、蓝光或其它数字媒体播放器、游戏控制台、酒店电视系统和其它伴随设备的单独的设备。智能电视模块可以被配置为允许观看者在网络上,在本地有线电视频道上,在卫星电视频道上或者存储在本地硬盘驱动器上搜索和查找视频、电影、照片和其它内容。机顶盒(STB)或机顶单元(STU)可以包括信息家电设备,其可以包含调谐器并连接到电视机和外部信号源,将信号转换成内容,然后显示在电视屏幕或其它显示设备。智能电视模块可以被配置为提供主屏幕或顶层屏幕,其包括用于多个不同应用的图标,诸如网络浏览器和多个流媒体服务、连接的电缆或卫星媒体源、其它网络“频道”等。智能电视模块还可以被配置为向用户提供电子节目指南。智能电视模块的伴随应用可以在移动计算设备上操作以向用户提供关于可用节目的附加信息,以允许用户控制智能电视模块等。在替代实现中,特征可以在膝上型计算机或其它个人计算机、智能电话、其它移动电话、手持式计算机、平板PC或其它计算设备上实现。
尽管本说明书包含许多具体实施细节,但是这些不应被解释为对任何发明或可以要求保护的范围的限制,而是被解释为对特定发明的特定实现特定的特征的描述。在单独实现的上下文中在本说明书中描述的某些特征也可以在单个实现中组合实现。相反,在单个实现的上下文中描述的各种特征也可以在多个实现中单独地或以任何合适的子组合来实现。此外,虽然特征可以在上面描述为在某些组合中起作用并且甚至最初如此要求保护,但是来自所要求保护的组合的一个或更多个特征在一些情况下可以从组合中删除,并且所要求保护的组合可以针对子组合或变体的子组合。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应被理解为要求这些操作以所示的特定顺序或以顺序次序执行,或者所有所示的操作被执行以实现期望的结果。在某些情况下,多任务和并行处理可能是有利的。此外,在上述实施方式中的各种系统组件的分离不应被理解为在所有实施方式中需要这种分离,并且应当理解,所描述的程序组件和系统通常可以一起集成在单个软件产品中或封装到多个软件产品中。
因此,已经描述了主题的特定实现。其它实施方式在所附权利要求的范围内。在一些情况下,权利要求中所述的动作可以以不同的顺序执行并且仍然实现期望的结果。另外,附图中描绘的过程不一定需要所示的特定顺序或顺序的顺序,以实现期望的结果。在某些实现中,可以利用多任务或并行处理。

Claims (14)

1.一种用于经由模糊特性的在线受众测量的方法,包括:
由受众测量服务器从多个客户端设备中的每一个客户端设备接收从该客户端设备传送的通信,所述通信包括从内容提供者接收的内容项目的标识和该客户端设备的标识符,所述客户端设备的标识符包括识别从评判组测量服务接收的多个模糊特性的掩码;
由所述受众测量服务器从所述评判组测量服务接收对所述评判组测量服务的评判组成员的测量数据的请求,所述请求包括第一数据阵列和第二数据阵列,所述第一数据阵列包括识别对所述受众测量服务器模糊的散列第一特性的第一概率数据结构,所述第二数据阵列包括识别对所述受众测量服务器模糊的散列第二特性的第二概率数据结构;
由所述受众测量服务器利用逻辑双条件计算将识别来自所述多个客户端设备中的每个客户端设备的多个模糊特性的所述掩码与对所述第一数据阵列的所述受众测量服务器模糊化的第一特性进行比较,以选择所接收的通信的具有所述第一特性的第一子集;
由所述受众测量服务器利用所述逻辑双条件计算将识别来自所述多个客户端设备中的每个客户端设备的所述多个模糊特性的所述掩码与对所述第二数据阵列的所述受众测量服务器模糊化的第二特性进行比较,以选择所接收的通信的具有所述第二特性的第二子集;
由所述受众测量服务器选择所接收的通信的第三子集,所述第三子集包括所述第一子集和所述第二子集的交集;
由所述受众测量服务器基于所接收的通信的所述第三子集低于预定阈值来聚合所接收的通信中具有所述第一特性的所述第一子集和所接收的通信中具有所述第二特性的所述第二子集,以使用第一散列计算或盐值生成所述第一子集的第一受众测量值和使用第二散列计算或盐值生成所述第二子集的第二受众测量值;和
由所述受众测量服务器向所述评判组测量服务传送所生成的第一受众测量值和所述第二受众测量值。
2.根据权利要求1所述的方法,其中每一个接收到的通信中的所述客户端设备的所述标识符还包括由所述评判组测量服务提供的所述客户端设备的第一标识符和由所述客户端设备的制造商提供的所述客户端设备的第二标识符。
3.根据权利要求2所述的方法,其中将所接收的通信与所述第一数据阵列进行比较以选择所接收的通信的所述第一子集包括识别在第一客户端设备的第一标识符与所述第一数据阵列之间的交集;并且其中将所接收的通信与所述第二数据阵列进行比较以选择所接收的通信的所述第二子集包括识别在所述第一客户端设备的第二标识符与所述第二数据阵列之间的交集。
4.根据权利要求2所述的方法,其中所述客户端设备的所述第一标识符包括由所述评判组测量服务生成的数据阵列;并且其中将所接收的通信与所述第一数据阵列进行比较以选择所接收的通信的所述第一子集还包括:响应于在所接收的通信的所述第一标识符与所述请求的所述第一数据阵列之间的非零交集,选择所接收的通信以包括在所述第一子集中。
5.根据权利要求1所述的方法,还包括:响应于确定所接收的通信的所述第三子集低于预定阈值,用第一散列函数对所接收的通信的所述第一子集中的客户端设备的每一个标识符进行散列,并且用不同的第二散列函数对所接收的通信的所述第二子集中的客户端设备的每一个标识符进行散列;并且
其中传送所生成的测量数据还包括传送所述客户端设备的散列标识符。
6.根据权利要求1所述的方法,其中所述第一数据阵列或第二数据阵列包括位图。
7.一种用于经由模糊特性的在线受众测量的系统,包括:
与多个客户端设备及评判组测量服务器通信的执行受众测量服务器的设备,所述受众测量服务器被配置用于:
从多个客户端设备中的每一个客户端设备接收从该客户端设备传送的通信,所述通信包括从内容提供者接收的内容项目的标识和该客户端设备的标识符,该客户端的标识符包括识别从评判组测量服务接收的多个模糊特性的掩码;
从所述评判组测量服务接收对所述评判组测量服务的评判组成员的测量数据的请求,所述请求包括第一数据阵列和第二数据阵列,所述第一数据阵列包括识别对所述受众测量服务器模糊的散列第一特性的第一概率数据结构,所述第二数据阵列包括识别对所述受众测量服务器模糊的散列第二特性的第二概率数据结构;
利用逻辑双条件计算将识别来自所述多个客户端设备中的每一个客户端设备的所述多个模糊特性的所述掩码与对所述第一数据阵列的所述受众测量服务器模糊的第一特性进行比较,以选择所接收的通信的具有所述第一特性的第一子集;
利用所述逻辑双条件计算将识别来自所述多个客户端设备中的每一个客户端设备的所述多个模糊特性的所述掩码与对所述第二数据阵列的所述受众测量服务器模糊的第二特性进行比较,以选择所接收的通信的具有所述第二特性的第二子集;
选择所接收的通信的第三子集,所述第三子集包括所述第一子集和所述第二子集的交集;
基于所接收的通信的所述第三子集低于预定阈值,聚合所接收的通信中具有所述第一特性的所述第一子集和所接收的通信中具有所述第二特性的所述第二子集,以使用第一散列计算或盐值生成所述第一子集的第一受众测量值和使用第二散列计算或盐值生成所述第二子集的第二受众测量值;和
向所述评判组测量服务传送所述第一受众测量值和所述第二受众测量值。
8.根据权利要求7所述的系统,其中每一个接收到的通信中的所述客户端设备的所述标识符还包括由所述评判组测量服务提供的所述客户端设备的第一标识符和由所述客户端设备的制造商提供的所述客户端设备的第二标识符。
9.根据权利要求8所述的系统,其中所述受众测量服务器还被配置用于:识别在第一客户端设备的第一标识符和所述第一数据阵列之间的交集,并且识别在所述第一客户端设备的第二标识符与所述第二数据阵列之间的交集。
10.根据权利要求8所述的系统,其中所述客户端设备的所述第一标识符包括由所述评判组测量服务生成的数据阵列;并且其中所述受众测量服务器还被配置用于:响应于在所接收的通信的第一标识符和所述请求的所述第一数据阵列之间的非零交集,选择所接收的通信以包括在所述第一子集中。
11.根据权利要求7所述的系统,其中所述受众测量服务器还被配置用于:响应于确定所接收的通信的所述第三子集低于预定阈值,用第一散列函数对所接收的通信的所述第一子集中的客户端设备的每一个标识符进行散列,并且用不同的第二散列函数对所接收的通信的所述第二子集中的客户端设备的每一个标识符进行散列;以及传送所述客户端设备的散列标识符。
12.根据权利要求7中的任一项所述的系统,其中所述第一数据阵列或第二数据阵列包括位图。
13.一种存储指令的非暂时性计算机可读存储介质,所述指令在由一个或更多个数据处理器执行时使所述一个或更多个数据处理器执行操作,所述操作包括:
从多个客户端设备中的每一个客户端设备接收从该客户端设备传送的通信,所述通信包括从内容提供者接收的内容项目的标识和所述客户端设备的标识符,所述客户端设备的标识符包括识别从评判组测量服务接收的多个模糊特性的掩码;
从所述评判组测量服务接收对所述评判组测量服务的评判组成员的测量数据的请求,所述请求包括第一数据阵列和第二数据阵列,所述第一数据阵列包括识别对受众测量服务器模糊的散列第一特性的第一概率数据结构,所述第二数据阵列包括识别对所述受众测量服务器模糊的散列第二特性的第二概率数据结构;
利用逻辑双条件计算将识别来自所述客户端设备的每一个客户端设备的所述多个模糊特性的所述掩码与对所述第一数据阵列的所述受众测量服务器模糊的第一特性进行比较,以选择所接收的通信的具有所述第一特性的第一子集;
利用所述逻辑双条件计算将识别来自所述客户端设备的每一个客户端设备的所述多个模糊特性的所述掩码与对所述第二数据阵列的所述受众测量服务器模糊的第二特性进行比较,以选择所接收的通信的具有所述第二特性的第二子集;
选择所接收的通信的第三子集,所述第三子集包括所述第一子集和所述第二子集的交集;
基于所接收的通信的所述第三子集低于预定阈值,聚合所接收的通信中具有所述第一特性的所述第一子集和所接收的通信中具有所述第二特性的所述第二子集,以使用第一散列计算或盐值生成所述第一子集的第一受众测量值和使用第二散列计算或盐值生成所述第二子集的第二受众测量值;和
向所述评判组测量服务传送所述第一受众测量值和所述第二受众测量值。
14.根据权利要求13所述的非暂时性计算机可读存储介质,其中所述指令还使所述一个或更多个数据处理器执行操作,所述操作包括:
响应于所接收的通信的所述第三子集低于预定阈值,用第一散列函数对所接收的通信的所述第一子集中的客户端设备的每一个标识符进行散列;
响应于所接收的通信的所述第三子集低于预定阈值,用不同的第二散列函数对所接收的通信的所述第二子集中的客户端设备的每一个标识符进行散列;和
传送所述客户端设备的散列标识符。
CN201580034952.8A 2014-08-14 2015-07-30 用于混淆受众测量的系统和方法 Active CN106471539B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/459,671 US10600076B2 (en) 2014-08-14 2014-08-14 Systems and methods for obfuscated audience measurement
US14/459,671 2014-08-14
PCT/US2015/042778 WO2016025178A1 (en) 2014-08-14 2015-07-30 Systems and methods for obfuscated audience measurement

Publications (2)

Publication Number Publication Date
CN106471539A CN106471539A (zh) 2017-03-01
CN106471539B true CN106471539B (zh) 2022-05-31

Family

ID=53784030

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580034952.8A Active CN106471539B (zh) 2014-08-14 2015-07-30 用于混淆受众测量的系统和方法

Country Status (4)

Country Link
US (1) US10600076B2 (zh)
CN (1) CN106471539B (zh)
DE (1) DE112015003750B4 (zh)
WO (1) WO2016025178A1 (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9588675B2 (en) 2013-03-15 2017-03-07 Google Inc. Document scale and position optimization
US9544329B2 (en) * 2014-03-18 2017-01-10 Shape Security, Inc. Client/server security by an intermediary executing instructions received from a server and rendering client application instructions
CN104270405A (zh) * 2014-08-29 2015-01-07 小米科技有限责任公司 基于路由器的联网控制方法及装置
US11120163B2 (en) * 2014-11-14 2021-09-14 Oracle International Corporation Associating anonymous information with personally identifiable information in a non-identifiable manner
US20180219810A1 (en) * 2016-08-29 2018-08-02 Mezzemail Llc Transmitting tagged electronic messages
US10531286B2 (en) * 2016-10-24 2020-01-07 Facebook, Inc. Methods and systems for auto-completion of anonymized strings
CN107317816B (zh) * 2017-07-05 2020-06-12 北京信息职业技术学院 一种基于客户端应用程序鉴别的网络访问控制方法
US11063910B2 (en) * 2017-07-31 2021-07-13 Fastly, Inc. Web application firewall for an online service
US10735808B2 (en) * 2017-08-10 2020-08-04 The Nielsen Company (Us), Llc Methods and apparatus of media device detection for minimally invasive media meters
GB2569993B (en) * 2018-01-08 2021-01-06 British Telecomm Data processing method
US11372685B2 (en) * 2018-02-21 2022-06-28 Rapid7, Inc. Hash-based routing
JP7132350B2 (ja) * 2018-04-05 2022-09-06 グーグル エルエルシー ブラウザクッキーの置換えとしてのドメイン固有ブラウザ識別子
CN109191177A (zh) * 2018-08-01 2019-01-11 杭州湘甬机械设备有限公司 一种基于线下数据的线上广告投放方法及系统
US11599655B1 (en) * 2018-09-21 2023-03-07 Amazon Technologies, Inc. Data sharing method
US11606340B2 (en) * 2019-02-28 2023-03-14 Arris Enterprises Llc Method to anonymize client MAC addresses for cloud reporting
US11102666B2 (en) 2019-03-15 2021-08-24 The Nielsen Company (Us), Llc Methods and apparatus to monitor WI-FI media streaming using an alternate access point
CN112189199B (zh) * 2019-05-01 2024-03-12 谷歌有限责任公司 隐私保护数据收集和分析
US11074369B2 (en) * 2019-07-29 2021-07-27 Google Llc Privacy preserving remarketing
EP4026289A1 (en) * 2019-09-03 2022-07-13 Google LLC Systems and methods for secure identification retrieval
US11676160B2 (en) 2020-02-11 2023-06-13 The Nielsen Company (Us), Llc Methods and apparatus to estimate cardinality of users represented in arbitrarily distributed bloom filters
US11741068B2 (en) 2020-06-30 2023-08-29 The Nielsen Company (Us), Llc Methods and apparatus to estimate cardinality of users represented across multiple bloom filter arrays
CN111918078B (zh) * 2020-07-24 2022-09-13 腾讯科技(深圳)有限公司 一种直播方法及装置
US11755545B2 (en) 2020-07-31 2023-09-12 The Nielsen Company (Us), Llc Methods and apparatus to estimate audience measurement metrics based on users represented in bloom filter arrays
KR20220052352A (ko) 2020-08-14 2022-04-27 구글 엘엘씨 온라인 프라이버시 보호 기술
US11949778B1 (en) 2020-09-16 2024-04-02 Snap Inc. Privacy-preserving multi-touch attribution
CN117313139A (zh) * 2021-01-15 2023-12-29 谷歌有限责任公司 一种计算机实现的方法及其系统、介质和产品
US11854030B2 (en) * 2021-06-29 2023-12-26 The Nielsen Company (Us), Llc Methods and apparatus to estimate cardinality across multiple datasets represented using bloom filter arrays

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5892900A (en) 1996-08-30 1999-04-06 Intertrust Technologies Corp. Systems and methods for secure transaction management and electronic rights protection
US6055508A (en) * 1998-06-05 2000-04-25 Yeda Research And Development Co. Ltd. Method for secure accounting and auditing on a communications network
NZ521111A (en) * 2000-02-18 2005-12-23 Acnielsen Corp Audience measurement system and method for digital broadcasts
US7182809B2 (en) * 2000-09-19 2007-02-27 Memc Electronic Materials, Inc. Nitrogen-doped silicon substantially free of oxidation induced stacking faults
US20030177488A1 (en) 2002-03-12 2003-09-18 Smith Geoff S. Systems and methods for media audience measurement
US7627872B2 (en) * 2002-07-26 2009-12-01 Arbitron Inc. Media data usage measurement and reporting systems and methods
US20040088212A1 (en) * 2002-10-31 2004-05-06 Hill Clarke R. Dynamic audience analysis for computer content
US7296158B2 (en) * 2002-11-08 2007-11-13 Palo Alto Research Center Incorporated Methods, apparatus, and program products for inferring service usage
US7363244B2 (en) 2002-11-08 2008-04-22 Palo Alto Research Center Incorporated Methods, apparatus, and program products for inferring service usage
CN1882961A (zh) * 2003-10-17 2006-12-20 尼尔逊媒介研究股份有限公司 便携式多功能受众测量系统
US7558970B2 (en) 2004-01-23 2009-07-07 At&T Corp. Privacy-enhanced searches using encryption
US20050166053A1 (en) 2004-01-28 2005-07-28 Yahoo! Inc. Method and system for associating a signature with a mobile device
US10325272B2 (en) * 2004-02-20 2019-06-18 Information Resources, Inc. Bias reduction using data fusion of household panel data and transaction data
US7623823B2 (en) * 2004-08-31 2009-11-24 Integrated Media Measurement, Inc. Detecting and measuring exposure to media content items
CN101297315A (zh) * 2005-08-26 2008-10-29 光点信迅公司 用于媒体策划、广告制作、广告投放和内容定制的系统和方法
FR2897218B1 (fr) 2006-02-07 2008-07-04 Mediametrie Sa Systeme de mesure d'audience de medias sur au moins un reseau de communication internet
MX2007015979A (es) * 2006-03-31 2009-04-07 Nielsen Media Res Inc Metodos, sistemas y aparato para medicion de multiples fines.
US7783748B2 (en) 2006-05-25 2010-08-24 Qualcomm Incorporated Methods and apparatus for sampling usage information from a pool of terminals in a data network
US7937428B2 (en) 2006-12-21 2011-05-03 International Business Machines Corporation System and method for generating and using a dynamic bloom filter
US8000993B2 (en) * 2008-04-14 2011-08-16 Tra, Inc. Using consumer purchase behavior for television targeting
US7886047B1 (en) * 2008-07-08 2011-02-08 Sprint Communications Company L.P. Audience measurement of wireless web subscribers
US20100057560A1 (en) * 2008-09-04 2010-03-04 At&T Labs, Inc. Methods and Apparatus for Individualized Content Delivery
US9256686B2 (en) 2008-09-15 2016-02-09 International Business Machines Corporation Using a bloom filter in a web analytics application
EP2239869A1 (en) * 2009-04-06 2010-10-13 Gemalto SA A method for measuring audience data, corresponding token and terminal
US8935721B2 (en) * 2009-07-15 2015-01-13 Time Warner Cable Enterprises Llc Methods and apparatus for classifying an audience in a content distribution network
US20140007501A1 (en) * 2009-08-13 2014-01-09 Arthur Francis Griebel Self watering plant system
US20110153391A1 (en) * 2009-12-21 2011-06-23 Michael Tenbrock Peer-to-peer privacy panel for audience measurement
US8768713B2 (en) 2010-03-15 2014-07-01 The Nielsen Company (Us), Llc Set-top-box with integrated encoder/decoder for audience measurement
US10176484B2 (en) * 2010-03-16 2019-01-08 AppNexus Inc. Advertising venues and optimization
US20120310729A1 (en) * 2010-03-16 2012-12-06 Dalto John H Targeted learning in online advertising auction exchanges
US8417966B1 (en) 2010-05-28 2013-04-09 Adobe Systems Incorporated System and method for measuring and reporting consumption of rights-protected media content
US8307006B2 (en) 2010-06-30 2012-11-06 The Nielsen Company (Us), Llc Methods and apparatus to obtain anonymous audience measurement data from network server data for particular demographic and usage profiles
US20120000521A1 (en) * 2010-07-01 2012-01-05 Egypt Nanotechnology Center Graphene Solar Cell And Waveguide
US8851214B2 (en) * 2010-07-15 2014-10-07 Permobil Ab Electric mid-wheel drive wheelchair
US20120066065A1 (en) * 2010-09-14 2012-03-15 Visa International Service Association Systems and Methods to Segment Customers
CA3182470A1 (en) * 2010-09-22 2012-03-29 The Nielsen Company (Us), Llc Methods and apparatus to determine impressions using distributed demographic information
US8527748B2 (en) 2010-10-01 2013-09-03 Schneider Electric USA, Inc. System and method for hosting encrypted monitoring data
US10148623B2 (en) * 2010-11-12 2018-12-04 Time Warner Cable Enterprises Llc Apparatus and methods ensuring data privacy in a content distribution network
US8498995B1 (en) 2011-03-24 2013-07-30 Emc Corporation Optimizing data retrieval during event data query processing
CA2837469A1 (en) 2011-05-26 2012-11-29 Webtuner Corp. Highly scalable audience measurement system with client event pre-processing
JP5969260B2 (ja) * 2011-07-14 2016-08-17 日東電工株式会社 樹脂発泡体、その製造方法、及び発泡シール材
US20130035979A1 (en) 2011-08-01 2013-02-07 Arbitron, Inc. Cross-platform audience measurement with privacy protection
KR101952674B1 (ko) 2011-08-31 2019-02-27 구글 엘엘씨 Tv 시청률 레이팅의 효율적이고 정확한 추정치를 제공하는 방법 및 시스템
US8904171B2 (en) * 2011-12-30 2014-12-02 Ricoh Co., Ltd. Secure search and retrieval
GB201204925D0 (en) 2012-01-24 2012-05-02 Airbus Operations Ltd System and method for providing an aircraft noise advisory during departure and arrival of an aircraft
US20130217333A1 (en) * 2012-02-22 2013-08-22 Qualcomm Incorporated Determining rewards based on proximity of devices using short-range wireless broadcasts
US9544075B2 (en) * 2012-02-22 2017-01-10 Qualcomm Incorporated Platform for wireless identity transmitter and system using short range wireless broadcast
US8706884B2 (en) 2012-06-19 2014-04-22 Canon Kabushiki Kaisha Method and system for generating and using an augmented bloom filter
US8977626B2 (en) 2012-07-20 2015-03-10 Apple Inc. Indexing and searching a data collection
US9071533B2 (en) 2012-07-31 2015-06-30 Cisco Technology, Inc. Multicast group assignment using probabilistic approximations
US20140075018A1 (en) * 2012-09-11 2014-03-13 Umbel Corporation Systems and Methods of Audience Measurement
US9535658B2 (en) 2012-09-28 2017-01-03 Alcatel Lucent Secure private database querying system with content hiding bloom filters
US10423973B2 (en) * 2013-01-04 2019-09-24 PlaceIQ, Inc. Analyzing consumer behavior based on location visitation
US9589048B2 (en) * 2013-02-18 2017-03-07 PlaceIQ, Inc. Geolocation data analytics on multi-group populations of user computing devices
US9639577B1 (en) 2013-03-27 2017-05-02 Symantec Corporation Systems and methods for determining membership of an element within a set using a minimum of resources
US20140337104A1 (en) * 2013-05-09 2014-11-13 Steven J. Splaine Methods and apparatus to determine impressions using distributed demographic information
US9171153B2 (en) 2013-05-17 2015-10-27 Hewlett-Packard Development Company, L.P. Bloom filter with memory element
US9305056B1 (en) 2013-05-24 2016-04-05 Amazon Technologies, Inc. Results cache invalidation
US9852163B2 (en) * 2013-12-30 2017-12-26 The Nielsen Company (Us), Llc Methods and apparatus to de-duplicate impression information
US11558480B2 (en) * 2014-07-16 2023-01-17 Comcast Cable Communications Management, Llc Tracking content use via social media
US10045082B2 (en) * 2015-07-02 2018-08-07 The Nielsen Company (Us), Llc Methods and apparatus to correct errors in audience measurements for media accessed using over-the-top devices
WO2017117574A1 (en) * 2015-12-30 2017-07-06 Verimatrix, Inc. Systems and methods for presering privacy in distribution of digital of content using private tokens

Also Published As

Publication number Publication date
WO2016025178A1 (en) 2016-02-18
DE112015003750B4 (de) 2023-09-28
US20160048868A1 (en) 2016-02-18
CN106471539A (zh) 2017-03-01
US10600076B2 (en) 2020-03-24
DE112015003750T5 (de) 2017-08-17

Similar Documents

Publication Publication Date Title
CN106471539B (zh) 用于混淆受众测量的系统和方法
CN105850100B (zh) 用于受众测量的系统和方法
AU2016238846B2 (en) Systems and methods for enhancing audience measurement data
US11017099B2 (en) Systems and methods for entropy balanced population measurement
KR20200131311A (ko) 브라우저 쿠키를 대체하는 도메인 특정 브라우저 식별자
JP6198214B2 (ja) メディアオブジェクト特性を使用してメディアを測定するための方法及び装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: California, USA

Applicant after: Google limited liability company

Address before: California, USA

Applicant before: Google Inc.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant