CN104205158A - 测量在线观众的系统、方法和产品 - Google Patents

测量在线观众的系统、方法和产品 Download PDF

Info

Publication number
CN104205158A
CN104205158A CN201380017096.6A CN201380017096A CN104205158A CN 104205158 A CN104205158 A CN 104205158A CN 201380017096 A CN201380017096 A CN 201380017096A CN 104205158 A CN104205158 A CN 104205158A
Authority
CN
China
Prior art keywords
group
data
group member
spectators
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380017096.6A
Other languages
English (en)
Other versions
CN104205158B (zh
Inventor
J·R·奥利弗
H·F·斯塔克豪斯
P·C·道
C·唐
M·哈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nielsen Co US LLC
Original Assignee
Nielsen Co US LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nielsen Co US LLC filed Critical Nielsen Co US LLC
Publication of CN104205158A publication Critical patent/CN104205158A/zh
Application granted granted Critical
Publication of CN104205158B publication Critical patent/CN104205158B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • G06Q30/0246Traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Environmental & Geological Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明描述了在内容显示站点监测媒体内容的方法和装置。示例方法包括以下步骤:获得与在所测量的位置访问网页的多名小组成员相对应的小组成员数据,根据小组成员的人口统计信息对小组成员数据进行分类,基于对未测量的位置的网页访问的估计产生虚拟小组,并且基于与该虚拟小组相对应的数据对与该未测量的位置相关联的页面查看数据进行分类。

Description

测量在线观众的系统、方法和产品
相关申请
本专利要求2012年1月26日提交的美国临时专利申请61/591,263的优先权,该申请在此已被全文引用。
技术领域
本说明书大体上涉及观众测量,更具体地涉及在线观众测量的系统、方法和产品。
背景技术
基于小组成员设备计量的在线观众测量和基于网站/网页标记的在线观众测量共同拥有测量网站流量的目标。在每种情况下,该目标是以计数或者估计人有机会看到在线媒体的元素(例如,内容,广告等)的机会的次数。该目标还可以包括对暴露于特定网站的独特观众总数进行估计。
附图说明
图1是例示根据本说明书的指示构造的、用于测量在线观众的公开的示例系统的框图。
图2是可以被用来实现图1的混合在线观众测量系统的示例系统的框图。
图3是实现图2的虚拟小组产生器的示例虚拟小组产生器的框图。
图4是表示可以被执行以实现图1和/或图2的混合在线观众测量系统以测量网站的在线观众的示例计算机可读指令的流程图。
图5是表示示例计算机可读指令的流程图,当示例计算机可读指令被执行时,其使处理器从一组流量数据中过滤非人为流量。
图6是表示示例计算机可读指令的流程图,当示例计算机可读指令被执行时,其使处理器估计从未测量的位置访问网站。
图7是表示示例计算机可读指令的流程图,当示例计算机可读指令被执行时,其使处理器计算负二项分布参数。
图8是表示示例计算机可读指令的流程图,当示例计算机可读指令被执行时,其使处理器计算负二项分布。
图9是表示示例计算机可读指令的流程图,当示例计算机可读指令被执行时,其使处理器选择小组成员以表示未测量的位置的观众。
图10A和图10B共同包括表示示例计算机可读指令的流程图,当示例计算机可读指令被执行时,其使处理器使用所选择的小组成员以估计未测量的位置的观众。
图11A和图11B共同包括表示示例计算机可读指令的流程图,当示例计算机可读指令被执行时,其使处理器使用所选择的小组成员以估计未测量的位置的观众。
图12是表示示例计算机可读指令的流程图,当示例计算机可读指令被执行时,其使处理器平滑数量(volume)度量。
图13A和图13B共同包括表示示例计算机可读指令的流程图,当示例计算机可读指令被执行时,其使处理器计算在线观众。
图14例示针对星期中一天的时段的人口统计群体之间的示例小组流分布百分比。
图15例示针对图14的星期中一天的时段的人口统计群体的流的数量的分布。
图16例示针对报告时段的图14的人口统计群体的示例一的普查流的数量的计算。
图17例示针对图14的示例人口统计群体的缩放的普查会话的计算。
图18是能够执行图4-图13B的指令以实现图1、图2和/或图3的系统的示例处理器平台的框图。
具体实施方式
在此公开的示例系统、方法、装置和产品通过观测的以用户为中心的方法使用的小组数据(例如,从参加者中的小组处获得的数据,诸如,已经同意使他们的在线浏览活动受监测的小组成员)作为核心源数据产生混合在线观众测量数据。在一些示例中,使用从以网站为中心的普查数据导出的信息(例如,网站服务器的网页点击计数)对该小组数据进行校准。在此公开的示例观测的以用户为中心的方法有效地对已知的在线观众测量系统的缺点进行纠正,能够报告任何网站,和/或能够确定从小组数据可得的附加的分析,该分析先前不能根据基于普查的数据确定。
在此公开的示例系统、方法、装置和产品提供了对在之前未测量的位置(例如,家庭和工作环境以外的位置)的观众曝光和行为的测量。此类之前未测量的位置的示例包括由多个用户共享的工作计算机的使用、家庭里的辅助计算机、公共访问位置(例如,公共图书馆的电脑),移动设备使用,和/或其它之前未测量的设备。来自未测量的位置的观众与来自已测量的位置的观众相结合,以得到总独特观众。该结合的已测量的和未测量的观众比根据先前方法获得的总独特在线观众准确。
在一些示例中,参与公布者和/或网站在它们各自内容的源代码内插入或者嵌入标记(例如,HTML代码)。该标记可以包括Java,Javascript和/或其它可执行指令,当该标记在浏览器上执行时,使该页面查看由数据收集设备记录。
标记从Blumenau的美国专利6108637已知,其在此已被全文引用。因为标记被嵌入定义网页的HTML中和/或在网页的HTML中的指针所引用,所以每当浏览器提供相应的网页,该标记就被执行。通常,标记将使该浏览器向数据收集设备发送内容请求。该请求可以被认为是“假性请求”,在于其不同于常规的互联网请求,该假性请求通常不寻求内容的下载。相反,该假性请求实际上用来将观众测量信息传送到数据收集设备。为此,该假性请求的有效载荷携带要由该数据收集设备待收集,编译和/或分析的标识信息。该标识信息可以标识与该标记相关联的网页,在上面访问该网页的用户设备,在上面访问该网页的浏览器,用户等。在一些示例中,该数据收集设备通过从该请求用户设备请求cookie对假性请求的接收做出响应。在一些示例中,如果未接收到cookie(即,目前并未在该用户设备上设置数据收集设备的域内的cookie),设置cookie以便于逐个网页访问来标识该装置。
如上所述的标记的优点在于它能够收集普查之类的数据。也就是说,因为访问已标记的网页的每个浏览器将通过发送该假性请求对该标记做出响应,该数据收集设备将获知每一次对该网页的访问。此外,此数据的收集并不需要在用户设备处使用专用的浏览器,或者专用的计量软件。不如说,因为假性请求看似常规商用的浏览器(例如,火狐,微软浏览器等),如任何其它请求以检索互联网媒体(如请求以获得作为该网页部分显示的内容或者广告素材),任何此类浏览器将参与观众测量流程,无需修改。因此,加标记能够收集来自小组成员和非小组成员之类的观众测量数据。通过加标记方法收集到的数据,如上文所述,在此被描述为普查数据。
如上所述,小组成员是已经同意受例如观众测量实体(如尼尔森公司(美国)有限责任公司)监测的人。通常情况下,小组成员当他们登记参加小组时提供详细的人口统计信息(例如,种族、年龄、收入、家庭地址、教育程度、性别等)。此外,向小组成员提供了收集他们的媒体曝光的计量表。例如,诸Coffey的美国专利5,675,510(在此已全文引用)中公开的软件仪可以被下载到该小组成员的计算机、智能电话、平板电脑和/或其它的浏览设备中。该计量表将收集显示媒体访问活动(例如,网站名称、访问日期/次数、点击流数据、和/或其它标识该小组成员所接触的媒体(例如,网页内容,广告等)的信息的数据。该数据被定期地或者不定期地上传给数据收集设备。在此,由计量表收集到的数据称为小组成员数据。小组成员数据的优点在于它与详细的人口统计信息相结合,因为该小组成员已经提供了他们的人口统计资料作为登记的一部分,并且由该计量表收集到的活动数据可以因而与人口统计信息相关联。当小组成员用户设备访问已标记的页面时,该访问将由该计量表和该数据收集设备经由上述提及的标记装置进行记录。因此,访问已标记的网页的小组成员在小组成员数据和普查数据之间提供了桥梁。
基于经由该计量表收到的小组成员信息和经由该标记收到的普查信息,在此公开的示例系统和方法使用以下技术产生了在线观众测量信息(例如,曝光统计,人口统计等):(1)对基于普查的数据应用过滤技术以去除不期望的流量(例如,网页的自动/程序化刷新,其造成该网页上额外的点击、机械人流量、源自市场外地理位置的流量等);(2)应用字典定义以对观察到的行为、网站、品牌,和/或通道进行分类;(3)确定来自未测量的位置的访问该网页的人口规模和/或人口统计;和(4)对已测量的和未测量的位置的行为进行加权以表示观测到的流量。
在此公开的一些示例方法包括获得与在已测量的位置访问网页的多名小组成员对应的小组成员数据,根据该小组成员的人口统计信息对该小组成员数据进行分类,基于对在未测量的位置的网页访问的估计产生虚拟小组,以及基于与该虚拟小组相对应的数据对与该未测量的位置相关联的页面查看数据进行分类。
在此公开的一些示例方法包括基于第一估计特征对多名小组成员进行赋予权重,基于该权重选择该小组成员中的子集,基于第二估计特征对所选择的小组成员重新加权,以及产生包括作为虚拟小组成员的所选择的小组成员的虚拟小组,其中,基于所述重新加权对从所选择的小组成员处收集到的针对所述虚拟小组的数据赋予权重。
在此公开的示例装置包括:小组数据收集器,其用于收集与在已测量的位置访问网页的多名小组成员对应的小组成员数据;虚拟小组产生器,其用于基于对在未测量的位置的网页访问的估计产生虚拟小组;以及观众分类器,其用于根据该小组成员的人口统计信息对该小组成员数据进行分类,并且基于该虚拟小组所对应的数据对与该未测量的位置相关联的页面查看数据进行分类。
在此公开的示例装置包括:样本加权器,其用于基于第一估计特征对多名小组成员赋予权重;样本选择装置,其用于基于该权重选择该小组成员中的集合;以及样本重新加权器,其用于基于第二估计特征对所选择的小组成员进行重新加权,并且用于产生虚拟小组,该虚拟小组包括作为虚拟小组成员的所选择的小组成员,其中,从所选择的小组成员处收集到的针对虚拟小组的数据将基于该重新加权被赋予权重。
如在此所用的,被定义下列术语来表示:
统一资源定位器(URL)模式–一组类似URL的实例,由于内容和/或目的的相似性,其被归类在一起。
URL实例–独特URL字符串。基于该URL字符串的特殊性、URL字符串中的命令行参数,和/或任何其它使该URL独特的URL字符串的变更,URL实例可以有别于属于URL模式的其它URL实例。
页面查看–在此与“曝光”可互换地使用,是指在有或没有任何关于所提供的网页实际上被消费者或者请求方浏览的指示的情况下,网页或者其它网络媒体(例如,内容、广告、视频、图像、音频等)被提供(例如,成功发送)给消费者或请求方或设备。
流–在此也与“曝光”可互换地使用,是指提供流视频和/或音频的实例,除了是指不同类型的媒体之外,类似于页面查看。
会话–个人在网上从登录到注销所耗用的时间,或者在特定的网站或者多个网站的连续冲浪。
总体/人口–关注的个人/设备/家庭的总数,可以仅限于在线的个人/设备/家庭。
基于普查的数据-基于标记或不限于小组测量的另一种机制所收集到的数据。
小组成员–已经同意使他们的行为的一个或者更多个方面(例如,浏览活动,看电视等)受监测的个人或者人群。
小组成员数据–由与小组成员相关联的计量表收集到的数据。
计量表-收集反映(或者能够确定)用户的身份和/或个人(例如,小组成员)曝光的媒体标识的数据的任何类型的工具(例如,软件和/或硬件)。
媒体–经由任何类型的传送机制(例如,网页、电视、视频、音频等)传送的任何类型的内容和/或广告。
已测量的地点–安装了用于收集小组成员数据的计量表的用户设备或者实际位置(例如,房间)。
未测量的地点–计量表未监测的用户设备或者实际位置。
已测量的流量–从一个或者更多个已测量的地点对媒体的一次或者更多次地访问。
未测量的流量–从未测量的地点对媒体的一次或者更多次地访问。
为简便起见,以下仅参照页面查看描述了示例。然而,在此公开的一些示例适用于其它类型的媒体,诸如,视频流、音频流、和/或任何其它类型的可测量的在线流量。
图1是例示了根据本说明书的指导构建的公开的用于测量在线观众的示例系统100的框图。图1的示例系统100基于应答者的小组或者小组成员获得来自已测量的地点的在线观众流量的测量结果,基于普查数据估计来自未测量的地点的在线观众流量,并且基于从已测量的地点的测量的流量和未测量的流量的估计来估计网站的在线观众总数。该示例系统100还可以提供有关该估计的网站的在线观众(例如,通过已测量的和不可测的地点)总数的人口统计数据。
图1的示例系统100包括混合在线观众测量系统102、总体估计器104、被测量的网站服务器106、108、网络110、以及在线观众小组112。
图1的示例混合在线观众测量系统102获得(例如,接收、检索、收集,等)基于小组的在线观众测量数据、基于普查的测量数据,以及基于调查的观众数据,并且确定针对具体媒体的在线观众(规模和/或人口构成)。图1的示例混合在线观众测量系统102可以确定针对关注网站(诸如,由示例网络服务器106,108所服务的网站)和/或针对属于通道、品牌、和/或父辈(parent)实体的网站的聚集体的指定报告周期的在线观众。由该示例混合在线观众测量系统102产生的在线观众测量信息可以用于改善网站流量,为了购买广告空间、价格广告投放,和/或在线观众测量信息的任何其它用途而进行网站分析。
如下所述,图1的本示例混合在线观众测量系统102通过组合基于小组的观众测量的优点与或者基于普查的观众测量的优点,提供了比已知的观众测量系统精确的在线观众测量。例如,基于小组的测量在人口统计学和其它有用的统计方面具有较精确地表示待测量的人口或者总体的优点。相反地,基于普查的观众测量具有精确地测量在线流量总量的优点。
图1的示例总体估计器104产生在线观众的估计,包括在线观众的人口统计、位置、和/或行为。在一些示例中,该总体估计器104提供独立的和/或连续的枚举研究以提供在线人口的当前估计。图1的示例总体估计器104从持续的季度互联网总体枚举调查产生估计。该示例调查使用通过远程数字拨号(RDD)的方法招募的小组成员的样本以搜集互联网用户的互联网访问信息(例如,访问过的网页、上网花费的时间等)和/或人口资料(例如,年龄,性别等)。图1的示例总体估计器104收集互联网访问信息,其包括小组成员的在除已测量的环境(例如,工作和/或家庭)之外的位置(例如,在未测量的位置,诸如,覆盖了由多名用户共享的计算机的工作环境应用、家庭环境中的辅助计算机、公共访问位置、移动使用、和之前未测量的设备)的在线行为的估计。对与未测量的位置相对应的行为进行估计提高了整体反应率并且降低了可以与非专有的,综合性的调查相关联的反应偏见。
图1的示例网络服务器106,108可通信地耦接到该网络110(例如,互联网)以向请求设备提供网页、视频流、和/或其它网络流量。在图1的示例系统100中,该网络服务器106,108提供已经按照上面解释过的布卢梅瑙方法标记过的用于测量的网页和/或视频流。例如,该网络服务器106,108可以通过在所提供的每个网页和/或视频流中包括一个或者更多个监测指令来对所提供的网页和/或视频流进行标记。该示例标记代码可以是动态内容(例如,Javascript指令,Java指令,HTML5指令等),其使接收到该标记过的网页和/或视频流的该设备执行该指令以对示例混合在线观众测量系统102(例如,对后台程序136以存储该浏览器信息),对该网络服务器106,108,和/或对不同的日志服务器提供信息。
图1的示例在线观众小组112提供了小组成员114的在线活动的测量,诸如访问过的网页、下载的视频流,和/或浏览该网页和/或播放视频流所用的时长。该示例小组成员114与各个计算机116相关联的,当该小组成员114成为该在线观众小组112中的成员时,其每一个均被设置在线监测应用(即,计量表118)。该在线监测应用118唯一地与各个用户设备116相关联,因此,它们收集到的活动数据可以被映射到该小组成员114的人口特征。因此,该小组成员114的已测量的活动与该小组成员114的人口特征相关(correlated)。该示例在线监测应用118记录在计算机116处接收到的网页和/或视频流的统一资源定位符(URLs)、输入的击键,通过光标点击的对象和/或使用计算机116通过该小组成员114进行的任何其它交互动作。该示例计算机118还执行嵌入在受监测的网页(例如,监测指令)内的标记。在一些示例中,该标记由该计量表118识别。在其它示例中,该标记是在混合在线观众测量系统102处后台程序136记录,而不是由该计量表118识别。该在线监测应用118将该小组成员的在线活动的日志发送给该示例混合在线观众测量系统102。该日志可以按规则间隔(例如,每天、每周、每两周、每月等),按照需要,响应于事件或者请求,在预定的时间和/或根据任何其它计划和/或条件而被发送。
由一个或者更多个计量表118所监测的用户设备和/或位置被称为已测量的位置。已测量的位置可以包括家庭环境120(例如,位于该小组成员家里的计算机)和工作环境122(例如,位于该小组成员雇佣位置的计算机)。给定的小组成员114的活动可以在家庭环境120、工作环境122和/或家庭和工作环境这两者进行测量。由于一些企业阻止计量表118的安装,一些小组成员仅在他们的家庭环境受监测,而不在他们的工作环境受监测。
在线活动还发生在该家庭和工作环境120,122以外。图1的示例系统100并未在未测量的位置直接地进行在线活动测量,但这些活动导致了由该示例服务器106,108所提供的额外的页面查看和/或视频流。可以产生网站流量的这种示例未测量的位置包括:由工作环境122中的不包括计量表118的计算机124(例如,由包括非小组成员、小组成员和非小组成员等的多个用户126共享的计算机)、在家庭环境120中的辅助(例如,非主要的)计算机128,在公共访问位置(例如,图书馆,大学等)的计算机130、移动设备132(例如,移动电话、智能手机、平板电脑等),和/或任何其它类型的未测量的设备(例如,连接到互联网的电器,如智能电视、数字媒体播放器、游戏机等)产生的网站流量。在未测量的位置的活动(例如,媒体曝光)可以是由小组成员和/或非小组成员进行的。
图1的该示例网络服务器106,108包括服务器监测器134,其测量由各个网络服务器106,108提供的网络流量(例如,提供过的网页,提供过的视频流等)。图1的示例服务器监测器134收集信息,例如,从该服务器106,108请求网页和/或视频流的浏览器或者其它应用的详细信息、请求方的IP地址、该服务器106,108上的个人浏览会话的长度和/或可以由该服务器106,108确定的任何其它信息(例如,经由记录和/或分析针对网页的请求和/或经由cookie)。经由该服务器监测器134收集到的数据被认为是基于服务器的、以服务器为中心的数据。以服务器为中心的数据被认为存在限制。例如,这种服务器侧数据受到操控(例如,由该服务器的所有方和/或由可被编程以反复从服务器请求数据的机器人或者其它设备)。因此,服务器侧的数据可以多计页面访问。因为网页经常被高速缓存在用户设备中,对网页的第二次或者之后访问可能不涉及对服务器的请求。相反地,可以从该用户设备的本地高速缓存简便地取得,或者由介于之间的代理服务器提供。因此,服务器侧的数据会额外地少计页面查看。
与服务器侧数据这些潜在的多计和少计的问题相反,由该标记系统收集到的普查数据是准确的,因为对标记过的网页(无论来自高速缓存与否)的每次访问,将使该标记击发,导致假性请求的发出和对该标记过的网页的曝光的记录。
图2是图1的混合在线观众测量系统102的示例实现方式的框图。图2的示例混合在线观众测量系统102获得输入数据,其包括基于小组的在线活动数据,在线人口的总量和/或子集的估计和/或针对特定网站的流量的普查数据测量结果。基于该输入数据,图2的该示例混合在线观众测量系统102对反映了针对网站、通道、品牌、父辈和/或任何其它关注的组织单位的在线观众的数据进行分类和/或输出。在一些示例中,该混合在线观众测量系统102对反映了特定报告周期,星期的某天,和/或一天的时段的在线观众的数据进行分类。
图2的示例混合在线观众测量系统102从基于普查的数据收集器202、基于调查的数据收集器204和小组数据收集器206获取数据。该示例混合在线观众测量系统102可以经由网络(例如,图1的网络110),经由人工数据输入(例如,调查响应的输入)和/或使用任何其它接收数据的方法获得数据。
图2的示例基于普查的数据收集器202接收基于普查的流量信息。基于普查的数据可以从,例如,由该服务器监测器134产生的服务器日志、由该后台程序136收集到的基于标记的数据,和/或普查数据的任何其它来源获得。基于普查的流量信息可以包括:从标记过的网页中的标记的执行引起的对普查数据收集器202做出的假性请求而收集到的数据、和/或反映针对网页的请求的基于服务器日志经由服务器监测器134收集到的统计信息、和/或可经由服务监测器134收集的其它流量信息。在一些示例中,基于普查的数据收集器202实现该示例后台程序136以收集、解析和/或存储响应以执行标记指令而从图1的装置116、124、128、130、132接收到的数据。
图2的示例基于调查的数据收集器204接收基于调查的行为信息,例如,观众总数和/或在线观众中的子集的“总体估计”(例如,从图1的示例总体估计器104)。在图1和图2的示例中,该总体估计是从个人访谈获得的,其可以通过电话进行。该访谈提供了互联网访问信息和互联网用户的人口资料,包括针对已测量的位置(诸如工作和家庭)的估计以及针对未测量的位置(诸如工作和家庭外)。调查数据基于应答方准确地回忆起他们活动的能力以及如实汇报的意愿。
图2的示例小组数据收集器206接收小组成员数据,其包括表示小组活动的页面查看数据(例如,经由诸如计量表这样的监测应用118所收集的)。该小组成员数据可以包括访问过的网站(例如,URL)、包括多个URL的会话、反映网站请求和/或会话的发生时间/日期的时间戳、小组成员的人口统计特征、和/或可以经由图1的在线监测应用收集到的任何其它信息。所例示的示例过滤器的示例小组数据收集器206根据规则过滤接收到的小组成员数据。附加地或者另选地,该示例小组数据收集器206可以根据人口统计类别、星期中的某天信息、和/或时间段信息将接收到的小组成员数据进行排序以获得更精确的数据。
图2的示例小组数据收集器206相对于总体基于该小组成员的确定的表示对小组成员网站请求和/或会话进行加权。例如,比第二小组成员表示该总体中大的部分的第一小组成员的行为将进行比第二小组成员的活动大的权重(例如,乘以较大的系数)。图2的示例小组数据收集器206确定针对个别已测量的位置和针对总体上已测量的位置的估计的活动(例如,通过去除重叠或者重复的观众条目)。个别小组成员可以在多个已测量的位置(例如,家庭和工作)进行计数,因此通过去除明显的重复观众成员来对小组成员在多个位置的存在进行计数。
图2的示例混合在线观众测量系统102处理基于普查的流量信息以对该数据进行清理和/或分类。为此,该示例混合在线观众测量系统102包括流量过滤器208和站点分类器210。
很多网站(例如,网络服务器106、108)接收通过非人为和/或间接的人为活动(例如,机器人、网络爬虫网络蜘蛛、自动页面刷新、和/或并非由个人清醒地或者有意地请求网站而产生的其它流量)而产生的流量(例如,页面查看)。该示例流量过滤器208清理了基于普查的信息(例如,服务器日志和/或基于标记的计数)以避免计数不相关的数据及/或其它非人为活动。例如,图2的流量过滤器208将一列已知的用户代理、已知的IP地址和/或活动持续时间阈值应用于基于普查的信息以识别和去除非人为流量。该列已知的用户代理和/或已知的IP地址可以从互动广告局(IAB)/发行量组织稽核电子部(ABCE)国际蜘蛛和机器人列表处获得。在一些示例中,该流量过滤器208还应用基于活动的过滤器以检测非人为流量。
图2的示例流量过滤器208通过使用请求设备的IP地址按地理区域(例如,州、地区、国家,大陆等)对基于普查的数据进行分类。因此,如果不关注特定用途,则可以去除对网站服务器106、108的国际流量。图2的示例流量过滤器208还去除自动网页刷新(例如,网页代码,其造成针对同一网页的更新版本的请求被发送,通常是以接收到初始网页之后的特定间隔)。因为该示例监测应用118识别标记,所以该示例小组数据收集器206通过识别人为请求的页面查看可以估计自动刷新的页面查看活动并且区分来源于自动刷新的页面查看。例如,该监测应用118(例如,计量表)通过跟踪浏览器活动并且确定发生了对应的小组成员动作(例如,按钮点击,击键等)以造成网页刷新和/或是否该网页源代码中的执行的浏览器指令造成该网页刷新,可以识别网页刷新(例如,网页请求),。
人为页面查看和自动刷新页面查看可以被转换为比率或者比值,其中,图2的示例流量过滤器208将该比率或者比值应用于基于普查的流量(例如,页面查看)以减少或者去除归因于自动刷新的页面查看。例如,自动刷新比率可以针对URL模式从基于小组的数据按照星期中的某天和一天的时段来确定,作为自动刷新产生的页面查看次数与所有网页查看量之比。然后,该自动刷新比率或者比例被应用于所选择的URL模式(URL页面查看)的基于普查的页面访问(例如,其已清理了其它非人为和/或非地域市场流量)以确定基于普查的URL页面查看的调整或者清理数(调整后的URL页面查看)。以下算式示出了示例的计算:调整后的URL页面查看=URL页面查看*(1-自动刷新比率)。
图2的示例站点分类器210接收了过滤后的基于普查的流量信息(例如,针对关注的URL的调整后的URL页面查看)并且将该URL(例如,网页和/或视频流)划分类别(例如,体育,零售等)。例如,图2的站点分类器210应用分类字典以协助依照类别对小组成员的活动进行分类和/或建模。该示例站点分类器210按照多种方式进行分类,例如,品牌、父辈实体、通道、互联网领域、互联网子域,和/或以任何其它方式。例如,父辈可以包括多个品牌,其中的每一个可以包括多个通道。
图2的示例混合在线观众测量系统102还包括虚拟小组产生器212。图3是图2的示例虚拟小组产生器212的示例实现方式的框图。虽然示例小组成员数据和示例普查数据可以被用来有效地对在已测量的位置(例如,图1的工作和家庭环境120,122)的在线观众进行估计和/或分类,基于普查的流量经常指示出不断增加的流量来源于未测量的位置。该示例虚拟小组产生器212产生虚拟小组以是的能够比之前可能准确地估计来自未测量的位置的流量。示例未测量的位置可以包括但不限于,工作环境中的共享计算机、家庭环境中的辅助或者次辅助计算机、公共访问位置的计算机、移动设备和/或通过基于小组的方法未测量和/或不可测量的其它设备。
在图2的示例中,负二项分布(NBD)计算器214确定从未测量的位置访问该网站的数量。该负二项分布是在一系列n个独立伯努利试验中成功数量r的离散概率分布(每个伯努利试验的结果被限定为成功或者失败)。在小组成员是否访问URL的试验中,该示例NBD计算器214可以认为成功是由特定小组成员对该URL的页面查看。图2的示例NBD计算器214确定仅从未测量的位置(例如,并非由测量已测量的位置的小组成员数据所表示的)访问网页的观众的特征(例如,规模和/或人口组成)。为了确定在未测量的位置处的观众,图2的示例NBD计算器214接收针对根据该小组成员数据所确定的每个多人口群体的加权观众特征数据,针对根据该小组成员数据所确定的每个多人口群体的加权会话数据,在由流量过滤器208处理后根据基于普查的数据所确定的每个多人口群体的经清理的会话的次数,以及根据调查数据所确定的观众规模的总体估计。该人口统计群体可以被限定为总体或者人口中的子集。相应地,例示的示例的示例NBD计算器214计算与多个人口统计组群对应的多个NBD计算。图2的示例NBD计算器214确定用于NBD处理的变量,并且基于该变量计算人口统计组群的NBD。下面描述用于计算NBD和NBD的输入变量的示例处理(例如,计算机可读指令)。
在确定了仅从未测量的位置处访问该网站的数量(例如,从该NBD计算器214)时,该示例虚拟小组产生器产生表示针对未测量的位置的虚拟小组。图2的示例虚拟小组产生器212通过选择已测量的位置(如,家庭和工作环境)中的子集,复制所选择的小组成员(以及他们相应的在线行为)以形成未测量的位置样本,来产生该虚拟小组(例如,该未测量位置样本)。在图2的示例中,该小组成员的复制版本被提供单独的标识符以将复制的小组成员模拟或者表示为实际小组成员。该示例虚拟小组产生器212选择该小组成员中的子集以具有与未测量的位置的观众的估计的人口分布类似的人口构成,并且使得复制的小组成员的活动表示未测量的位置的观众的被调查行为。该示例虚拟小组产生器212可以选择该复制的小组成员的所有或部分活动以满足数量(volume)目标(基于小组成员数据和基于普查的数据之间的差异计算的对网站的页面浏览量)。
图3的示例虚拟小组产生器212包括示例加权器302、样本选择器304和采样重新加权器306。该示例虚拟小组产生器212接收得到的虚拟小组的所选择的样本大小308(例如,通过操作输入的反映期望的小组规模的值,诸如10,000名成员)、针对一个或者更多个人口统计组群的观众目标310(例如,基于普查的观众和基于小组的观众之间的差异和/或源于未测量的位置的页面查看的估计的次数)、小组行为数据312(例如,在线活动),NBD输出314(例如,从图2的该NBD计算器214的计算),和估计的针对未测量的位置316的总体规模。
图3的所选择的样本大小308表示要选择的(例如,通过样本选择器304)用于形成虚拟小组的小组成员数量。所选择的样本大小308可能至少同表示仅从未测量的位置处访问网页的观众(例如,在诸如家庭或者工作这样的已测量的位置环境不活跃于在线的人群)的人口统计信息和/或活动所需的小组成员的数量一样多。
该示例小组成员行为数据312(例如,小组成员数据中的子集)包括表示针对每个待加权和/或针对虚拟小组而被考虑的小组成员的活动的数据。图3的示例样本加权器302和/或示例样本重新加权器306将在小组行为数据312中反映的活动与未测量的位置中的活动进行比较以确定小组成员的权重。
图3的示例观众目标310(例如,预期的或者估计的观众数量)被计算作为基于普查的观众估计(例如,针对基于清理后的基于普查的页面查看的一个或者更多个网页的观众总数的估计)和基于小组的观众估计(例如,在已测量的位置的观众的估计)之间的差异。图3的观众目标310是仅在未测量的位置发生在线活动的观众成员的估计或者预期的数量。基于小组的观众估计由图2的NBD计算器214来计算。基于普查的观众估计基于基于普查的网站流量(例如,页面请求或者观展的数量,视频流的数量等)以及基于小组的页面查看量计算(例如,网页请求或者观展和小组成员会话)来计算。例如,从清理后的基于普查的数据确定的针对URL模式的页面查看量可以除以每名小组成员(例如,观众成员)的平均页面查看量以确定针对基于普查的数据的观众成员的估计数量。在一些示例中,该观众目标310包括针对全体人口的观众总目标,以及针对与人口统计子组群对应的人口的单个子集的观众目标。
在例示的示例中,针对未测量的位置316的总体规模基于总体规模(例如,通过调查所确定的在线总体)以及已测量的位置的总观众(例如,从小组成员数据所确定的所有已测量的位置的观众)来确定。在图3的示例中,针对未测量的位置316的总体规模是总体规模和针对已测量的位置的所有观众之间的差异。
图2的示例基于调查的数据收集器204向虚拟小组产生器212提供从未测量的位置处访问该网站的人口的估计规模和人口组成。基于普查的数据收集器202提供基于普查的网页浏览信息并且小组数据收集器206向虚拟小组产生器212提供基于小组的信息。该小组成员数据和该普查数据逐个站点地提供关于从未测量的位置处的页面查看的指引,诸如,在从已测量的位置处的页面查看的估计和由基于普查的数据收集器202(例如,经由服务器监测器134和/或后台程序136)所测量到的页面查看之间的页面查看量的差异性。
为了创建该虚拟小组(例如,未测量的位置样本),示例虚拟小组产生器212(例如,经由该样本加权器302)向每名小组成员应用或者赋予权重。示例加权器302产生权重,该权重表示每名示例小组成员针对表示在未测量的位置的观众的期许性或者适用性。例如,该示例加权器302基于观众目标310(其中包括人口统计目标(例如,未测量的位置的估计的人口统计))和/或实体目标(例如,由NBD计算器214确定的在未测量的位置的估计的独特的观众314,估计的在基于普查的数据和小组成员数据之间的页面查看的差值)可以确定该期许性。使用卡尔马(Calmar)加权,图2的示例样本加权器302基于小组成员的个人在线活动和/或人口统计特征相比于人口统计学和/或实体目标,向每名小组成员赋予权重。当卡尔马加权收敛时,确定每名小组成员的权重。该加权指定该小组成员是多么接近地表示在未测量的位置的典型个人。与从未测量的位置访问网站的个人的所估计的人口统计资料和/或行为资料类似的小组成员被给予较高的权重。
在加权之后,图3的示例样本选择器304使用随机选择来选择要纳入该虚拟小组的多个小组成员。由样本加权器302计算出的每名小组成员的权重被用作选择(或者纳入)概率。具有高的权重的小组成员将具有较高的可能性被样本选择器304选择。示例虚拟小组产生器212使用例如FastCube方法可以随机地选择多名小组成员(例如,固定数量)。所选择的小组成员和他们相应的人口统计、行为和/或其它数据被复制以创建虚拟小组成员,同时在小组中保留原始小组成员。
在选择(例如,产生)该虚拟小组成员后,图3的示例样本重新加权器306相对于该人口统计目标和/或观众目标对所选择的虚拟小组成员进行重新加权。用于重新加权的示例目标可以与第一加权期间的相同或者不同于第一加权的,依赖于对在未测量的位置观众和/或行为了解的多少。示例虚拟小组产生器212输出包括所选择的小组成员的集合以及表示观众和/或行为目标的相应的权重的虚拟小组。
该示例小组成员数据(例如,小组成员的行为信息)、基于普查的数据和虚拟小组(例如,针对复制的和/或选择的针对该虚拟小组的小组成员的小组成员数据)被提供给活动实现器216。图2的示例活动履行器216履行(估计起源)已测量的和未测量的小组数量之间的任何剩余活动以及基于已测量的普查的数量。为了履行虚拟小组活动,该示例活动履行器216确定活动量以履行(例如,估计,匹配)由基于普查的数据收集器202所收集、但是针对每个一天的时段的每个人口统计组群不被小组成员数据和虚拟小组计入的活动。活动的差异性可以源自于已测量的环境中的未测量的活动(例如,位于家庭和/或工作环境中的装置上但不被计量的活动)。然后,该示例活动履行器216随机地和/或概率地复制小组成员活动的实例(例如,针对小组成员而记录的页面查看和/或视频流的日志、小组成员的在线会话等的集合)以补偿活动的差异。
图2的示例活性履行器216产生和/或输出观众的报告、观众的人口统计数据、和/或针对所测量的URL、所测量的类似URL的集合、所测量的品牌、所测量的通道、所测量的父辈实体和/或针对任何其它所测量的实体或者子实体的观众的所确定的活动。
图2的示例混合在线观众测量系统102还包括观众分类器218。该示例观众分类器218接收针对已测量的位置(例如,从小组数据收集器206)和未测量的位置(例如,从虚拟小组产生器212)所确定的观众,以及并非由小组(例如,从活动履行器216)所表示的额外的活动。示例观众分类器218还接收来自示例基于普查的数据收集器202的页面查看数据和/或来自站点分类器210清理过的页面查看数据。图2的观众分类器218基于该小组成员数据(例如,针对已测量的位置)对该页面查看数据的第一部分进行分类并且基于该虚拟小组(例如,针对未测量的位置)对页面查看数据的第二部分进行分类。对该页面查看数据进行分类可以包括产生统计数据和/或报告以对URL和/或实体、一天的时段、星期中的某天、和/或任何其他分类的组合的观众和/或流量进行分类。图2的示例观众分类器218对报告期间针对一家或者更多家网站的观众进行估计。例如,例示的示例的观众分类器218估计网站的独特观众成员的数量和网站观众人口统计。
尽管图1的实现混合在线观众测量系统102的示例方式已在图2中例示并且图2的实现虚拟小组产生器212的示例方式已在图3中例示,但是在图1-图3中示出的一个或者更多个元件、流程和/或装置可以被组合、分割、重新排列、省略、消除和/或以任何其它方式来实现。进而,示例混合在线观众测量系统102,示例总体估计器104,示例网络服务器106、108,示例监测应用118,示例服务器监测器134,示例基于普查的数据收集器202,示例基于调查的数据收集器204、示例小组数据收集器206、示例流量过滤器208、示例站点分类器210、示例虚拟小组产生器212、示例NBD计算器214、示例活动履行器216、示例观众分类器218、示例样本加权器302、示例样本选择器304、示例样本二次加权器306和/或,更广泛地,示例系统100、示例混合在线观众测量系统102和/或图1、图2和/或图3的示例虚拟小组产生器212可以通过硬件、软件、固件和/或硬件、软件和/或固件的任何组合来实现。因此,例如,任何示例混合在线观众测量系统102,示例总体估计器104、示例网络服务器106、108、示例监测应用118、示例服务器监测器134、示例基于普查的数据收集器202、示例基于调查的数据收集器204、示例小组数据收集器206,示例流量过滤器208、示例站点分类器210、示例虚拟小组产生器212,示例NBD计算器214,示例活动履行器216、示例观众分类器218、示例加权器302、示例样本选择器304、示例样本重新加权器306和/或,更广泛地,示例系统100、示例混合在线观众测量系统102、和/或示例虚拟小组产生器212可以通过一个或者更多个电路、可编程的处理器、应用专用集成电路(ASIC),可编程逻辑设备(PLD)和/或现场可编程逻辑装置(FPLD)等来实现。当读取本专利的任何装置或者系统权利要求以覆盖单纯软件和/或固件实现时,示例混合在线观众测量系统102、示例总体估计器104、示例网络服务器106、108、示例监测应用118、示例服务器监测器134、示例基于普查的数据收集器202、示例基于调查的数据收集器204、示例小组数据收集器206,示例流量过滤器208、示例站点分类器210、示例虚拟小组产生器212、示例NBD计算器214、示例活动履行器216、示例观众分类器218、示例加权器302、示例样本选择器304,和/或示例样本二次加权器306中至少一个在此被明确地限定以包括有形计算机可读存储介质,例如,存储器、DVD、CD、蓝光等存储软件和/或固件。进而仍然,除了或者代替那些由图1、图2和/或图3所示的,图1、图2和/或图3的示例系统100、示例混合在线观众测量系统102和/或示例虚拟小组产生器212可以包括一个或者更多个元件、流程和/或设备,和/或可以包括不止所例示的元件、流程和设备的任意或者全部之一。
在图4-图13B中示出了用于图1-图3的执行混合在线观众测量系统102的示例机器可读指令的流程图表示。在这些示例中,该机器可读指令包括由处理器执行的程序,例如,下文讨论的示例处理平台1800结合图18所示的处理器1812。该程序可以嵌入存储在有形的计算机可读存储介质,例如,CD-ROM、软盘、硬盘驱动器、数字多功能光盘(DVD)、蓝光光盘、或者与处理器1812相关联的存储器的软件上,但是整个程序和/或其中部件可以替换地由不同于处理器1812和/或嵌入在固件或者专用硬件以外的装置来执行。此外,尽管该示例程序参照图4-图13B中所示的流程图进行了描述,实现示例混合在线观众测量系统102和/或示例虚拟小组产生器212的多种其它方法可以另选地地使用。例如,块的执行的顺序可以改变,和/或所描述块中一部分可以改变,删除或者组合。
如上所述,图4-图13B的示例流程可以使用存储在有形的计算机可读介质的编码指令来实现,例如,存储驱动器、存储磁盘、硬盘驱动器、闪存、只读存储器(ROM)、光盘(CD)、数字式通用光盘(DVD)、蓝光盘、高速缓存、随机存取存储器(RAM)和/或其中用于持续期(例如,用于较长时间段、永久、短暂,用于暂时缓冲,和/或用于信息的高速缓存)内信息存储的任何其它储存装置或者储存盘。如在此所用,术语有形的计算机可读存储介质被明确地定义以包括任何类型的计算机可读存储设备和/或存储盘并且不包括传播信号。另外地或者可选地,图4-图13B的示例流程可以使用存储在非临时性计算机可读介质中的编码指令(例如,计算机可读指令)来执行,例如,硬盘驱动器、闪速存储器、只读存储器、光盘、数字式通用光盘、高速缓存、随机存取存储器和/或其中用于持续期(例如,用于较长时间段、永久、短暂,用于暂时缓冲,和/或用于信息的缓存)内信息存储的任何其它储存装置或者储存盘。如在此所用,术语非临时性计算机可读介质被明确地限定为包括任何类型的计算机可读存储设备和/或存储盘,无论存储的持续时间并且不包括传播信号。如在此所用,当“至少”一词被用作权利要求中的前序部分的过渡词时,它是开放式的,与开放式的术语“包括”为相同的方式。
图4是表示示例计算机测量指令400,其可以被执行以实现图1和/或图2的混合在线观众测量系统102以测量网站的在线观众的流程图。
图4的示例指令400包括获得(例如,接收,收集)总体估计(例如,经由图2的基于调查的数据收集器204)(块402)。该示例总体估计包括在线人口的估计(例如,能够访问网站的数量或者在线人口的另一个定义)。该总体估计还可以包括在线人口的调查行为。
该示例混合在线观众测量系统102(例如,经由基于普查的数据收集器202)获得针对网站的以服务器为中心或者基于普查的数据(块404)。该基于普查的数据可以包括基于标记的数据和/或由图1的示例服务器监测器134进行的网站流量的测量结果。该示例混合在线观众测量系统102过滤(例如,经由该流量过滤器208)基于普查的数据以去除不期望的流量(块406)。不期望的(或者不具有表示性的)流量的示例包括非人为流量,诸如机器人或者蜘蛛,来自非表示性地理位置的流量,和/或自动刷新页面造成的流量。用于实现块406的示例计算机可读指令在下文参照图5进行描述。示例混合在线观众测量系统102获得已测量的位置的小组成员数据(例如,图2的小组数据收集器206)(块408)。示例小组成员数据包括个人小组成员的人口统计和在线行为信息。
该示例混合在线观众测量系统102对网站的小组成员数据、基于普查的数据、和/或基于调查的数据进行分类(例如,经由图2的站点分类器210)(块410)。例如,站点分类器210可以使用分类字典(例如,体育、零售等)对URL、类似的URL的集合,通道、品牌、父辈实体和/或网站的任意其它组织进行分类。
该示例混合在线观众测量系统102估计来自未测量的位置的流量和/或观众(例如,经由图2的NBD计算器214)(块412)。示例NBD计算器214基于普查数据、小组成员数据以及基于调查的数据估计来自未测量的位置的流量和/或观众。用于实现块412的示例计算机可读指令在下文参照图6-图8描述。
示例混合在线观众测量系统102基于对未测量的位置的观众的估计产生虚拟小组(例如,经由图2中的虚拟小组产生器212)(块414)。例如,虚拟小组产生器212可以基于小组成员的人口统计特征和/或在线行为对包含在基于人口统计目标、观众目标和/或活动目标的小组成员数据中的小组成员加权。示例虚拟小组产生器212基于针对纳入虚拟小组的权重选择多个小组成员。用于实现块414的示例计算机指令在下文参照图9描述。
示例混合在线观众测量系统102使用所选择的小组成员对未测量的位置的观众进行估计(例如,经由图2中的虚拟小组产生器212)(块416)。例如,虚拟小组产生器212可以对在块414中选择的小组成员进行重新加权以表示人口统计目标、观众目标和/或活动目标。在虚拟小组中被重新加权的小组成员的组合可以提供针对未测量的位置的估计的观众,包括估计的观众的人口统计特征。
示例混合在线观众测量系统102确定未由该小组测量所表示的额外的活动(例如,通过图2中的活动履行器216)(块418)。例如,活动履行器216可以确定网站流量的基于普查的测量结果和网站流量的基于小组(例如,已测量小组和虚拟小组)的估计之间的差异。示例活动履行器216产生和/或基于实际的小组成员活动对额外的观众活动进行分类以表示该差异。活动的差异可以包括在已测量的位置(例如,家庭环境,工作环境)进行的但未由小组测量的或者表示的活动。用于实现块418的示例计算机读指令在下文参照下图10A和图10B和/或图11A和图11B描述。
示例混合在线观众测量系统102使用已测量的位置的观众、未测量的位置的观众以及额外的活动确定网站的在线观众进行(块420)。在一些示例中,该混合在线观众测量系统102对与特定的标准(诸如,人口统计组群、地理区域、一天的时段、星期中的某天,和/或其它标准)相对应的在线观众进行分类和/或对在线观众中的部分进行确定。在一些示例中,混合在线观众测量系统102基于该虚拟小组所对应的数据对与未测量的位置相关联的页面查看数据进行分类。然后,图4的示例指令400可以终止和/或迭代以确定额外的在线观众。
图5是示例计算机可读指令500的流程图表示,当被执行时,其使得处理器从流量数据的集合(例如,页面查看数据)过滤流量(例如,网页浏览)。图5的该示例指令500可以由图2的示例流量过滤器208执行以进行图4的块406。随后进行该示例指令500以获取针对已测量的网站的基于普查的数据(例如,由图1中网络服务器106、108的服务器监测器134产生的流量日志)。
示例流量过滤器208获得表示非人为流量的已知的用户代理和/或IP地址的列表(块502)。例如,流量过滤器208可以获得IAB/ABCe国际蜘蛛和机器人列表。示例流量过滤器208在基于普查的数据中选择URL(块504)。基于普查的数据可具有针对URL的多个条目(例如,网页浏览,视频流)和/或相同的URL模式所对应的URL的一个或者更多个变体。示例流量过滤器208选择针对所选择的URL的基于普查的数据的条目(块506)。每个示例输入包括有关页面查看或者视频流的信息,诸如,请求设备的IP地址、用于请求该设备的用户代理、页面查看被请求的时间和/或其它信息。
示例流量过滤器208确定了是否所选择的条目的IP地址和/或用户代理与用户代理和/或IP地址的列表匹配(块508)。如果不存在匹配,则示例流量过滤器208确定该IP地址是否对应于要被排除在线观众测量结果之外的地理区域(例如,来自另一个国家的流量)(块510)。例如,该流量过滤器208可以将所选择的条目的IP地址与IP地址对地理区域的映射进行比较。如果所选择的条目的IP地址和/或用户代理对应于非人为的IP地址和/或用户代理的列表(块508)的如果所选择的条目的IP地址对应于被排除的地理区域(块510),则示例流量过滤器208从基于普查的数据中去除所选择的条目(块512)。在一些示例中,流量过滤器208存档所选择的条目或者以其它方式标记所选择的条目以不被用于确定在线观众。
在去除所选择的条目(块512)后,或者如果所选择的条目不匹配IP地址和/或用户代理(块508)的列表并且不对应于被排除的地理区域(块510),则示例流量过滤器确定是否存在所选择的URL(或者URL模式)的额外的条目(块514)。如果存在额外的条目(块514),则控制返回到块506以选择基于普查的数据中的另一个条目。当不存在针对所选择的URL的额外的条目(例如,非人为和/或排除的地理区域的条目已被去除)(块514),则示例流量过滤器208确定针对URL(或URL模式)是否存在可用的自动刷新率(块516)。例如,针对URL的自动刷新率可以根据基于小组的对URL的自动刷新的平均数的观察进行确定。
如果存在可用的自动刷新率(块516),则示例流量过滤器208基于该自动刷新率去除所选择的URL的多个条目(块518)。例如,流量过滤器208可以依照每个人的请求去除多个与自动刷新的平均次数成正比的URL的条目。在去除条目(块518)之后,或者如果不存在针对URL可用的自动刷新率可用数据(块516),则示例流量过滤器208确定基于普查的数据中是否存在额外的URL(块520)。如果存在额外的URL(或者URL模式)(块520),则控制返回到块504以从基于普查的数据中选择另一个URL。当不存在更多的URL时(块520),图5的示例指令500结束并且控制返回到图4的块408。
图6是示例计算机可读指令600的流程图表示,当被执行时,其使处理器估计来自未测量的位置对网站访问。图6的示例指令600可以由图2的示例NBD计算器214来进行以实现图4的块412。在一些示例中,该指令600使NBD计算器214以对仅具有从未测量的位置访问的观众进行估计。
图2的示例NBD计算器214计算NBD参数(块602)。例如,NBD计算器214可以确定是否存在柏松条件和/或计算用于针对每个待测量的人口统计组群的NBD处理的变量。用于计算NBD参数的示例指令在下文参照图7描述。使用计算出的参数,示例NBD计算器214计算人口统计组群的NBD(块604)。用于计算NBD的示例指令在下文参照图8描述。
图6的示例指令600可以然后结束并且将观众总数估计,其中包括来自未测量的位置的观众返回到虚拟小组产生器212和/或图2的活动履行器216。控制返回到图4的块414。
图7是示例计算机可读指令700的流程图表示,当被执行时,其使处理器计算负二项分布参数。图7的该实例指令700可以由图2的示例NBD计算器214进行以实现图6的框602。
示例NBD计算器214获得用于确定NBD参数(块702)的输入。对NBD计算器214的示例输入包括针对人口统计组群(Ui)的加权的小组观众、针对人口统计组群(Vi)的加权的小组会话、针对人口统计组群(Xi)的清理过的服务器会话以及针对人口统计组群(Yi)的估计的总体。
针对人口统计组群Ui的加权的小组观众是在针对关注URL具有至少一次页面查看的所选择的人口统计组群中所估计的人的数量,其被缩放来表示所测量的位置的总体。确定针对人口统计组群的加权的观众的示例在下文中描述。针对人口统计组群Vi的加权小组会话是该小组成员的会话的估计的数量,其被缩放来表示所测量的位置的总体。确定针对人口统计组群Xi的清理过的服务器会话在下文参照图13A和图13B描述。针对人口统计组群Yi的估计的总体可以从调查数据进行确定并且表示关注的总人口中在人口统计组群中的数量。
基于输入,示例NBD计算器214能够计算出额外的信息,其包括针对人口统计组群的总体中每个人的小组会话(例如,Gr=100*Vi/Yi),针对人口统计组群的总体中每个人的调整后的小组会话(例如,Gp=100*Xi/Yi),以及具有零页面查看的人员的权重比例(例如,fr(0)=1-Ui/Yi)。
示例NBD计算器214然后修订变量(需要时),从表示针对人口统计组群的100%覆盖(例如,在报告期间曾访问该网站的人口统计组群总体中的所有成员)和/或针对人口讨论组群的0%覆盖(例如,人口统计组群总体中的成员都不曾访问该网站)(块704)。例如,如果fr(0)=1,那么fr(0)被改变为略小于1的数字(例如,0.999)。相反地,如果fr(0)=0,那么fr(0)被改变为略大于0的数字(例如,0.001)。
示例NBD计算器214还确定针对在NBD参数的计算中使用的常数“c”的值(块706)。在图7的示例中,该常数“c”被计算为c=Gr/(100*ln(fr(0)))。示例NBD计算器214确定常数“c”的值是否大于或者等于-1,以确定泊松条件是否存在(块708)。泊松条件表示人口统计组群的成员具有小于访问网站或者风格的网站的阈值可能性的情况。
如果该泊松条件不存在(例如,常量“c”小于-1)(块708),则示例NBD计算器214估计NBD参数“A”。为了估计参数“A”,示例NBD计算器214设置A=-2*(l+c)(块710)。示例NBD计算器214设置等于“A”的占位符变量“B”(块712)。NBD计算器214基于“A”的先前值并且基于常量“C”计算出A的更新值(例如,A=C*(A-(1+A)*LN(1+A))/(1+A+C))(块714)。
示例NBD计算器214确定是否“A”的值已经收敛(例如,确定是否A的更新值是在B(或者A的先前值)的阈值量以内)(块716)。如果“A”的值尚未收敛(块716),则控制返回到块712以进行迭代计算。当“A”值已经收敛时(块716),示例NBD计算器214设置第二NBD参数“k”(块718)。在图7的示例中,NBD计算器214设置NBD参数k=Gr/(100*A)。
示例NBD计算器214通过计算参数A'=A*(Xi/Vi)(块720)和计算调整后的NBD参数α=1/A'(块722)来缩放NBD参数A以与清理过的页面查看和/或视频流一致。
如果存在泊松条件(块708),则NBD被视为具有一个参数(λ)的泊松分布。因而,该示例NBD计算器214不计算NBD参数α和k,而是,计算泊松参数λ=Gr/100(块724)。当计算NBD参数α和k(块722)或者计算泊松参数时(块724),图7中的示例指令700结束并且控制返回到图6的块604。
图8是示例计算机可读指令800的流程图表示,当被执行时,其使处理器计算负二项分布。图8的示例指令800可以由图2的示例NBD计算器214进行,以实现图6的框604。图8的示例NBD计算人口统计。相应地,示例NBD计算器214可以在报告时段针对不同的人口统计组群迭代指令800。
图2中的示例NBD计算器214确定泊松条件是否存在(块802)。例如,NBD计算器214可以确定针对NBD计算,计算哪些参数(例如,如果泊松条件存在,则λ;如果泊松条件不存在,则α和k)。如果泊松条件不存在(块802),则示例NBD计算器214计算针对人口统计组群(块804)的缩放覆盖率。例如,图2的NBD计算器214计算缩放范围=100*(1-(α/(α+t))k),其中时间变量“t”是单位时间,诸如,报告时段(例如,t天)。该时间变量“t”可以被设置为1以缩放独特观众成员以与例示的示例中的清理过的页面查看和/或视频流匹配(例如,每天的页面查看,每日报告等)。
图2的示例NBD计算器214计算零曝光(例如,页面查看)的概率(块806)。例如,零页面查看的概率,fp(0),可以根据fp(0)=(α/(α+t))k确定,其中时间变量“t”被设置为1以缩放独特观众成员以与清理过的页面查看和/或视频流匹配。图2的示例NBD计算器214计算n次页面查看的概率,其中n≥1(块808)。例如,n次页面查看的概率fp(n)可以根据fp(n)=((k+n-l)/n)*((t/(α+t))*fp(n-l)确定,其中时间变量“t”被设置为1以缩放独特观众成员以与清理过的页面查看和/或视频流匹配。因而,多次页面查看的概率fp(n)是基于较低次数的页面查看(fp(n-l),fp(n-x))的概率。
图2的示例NBD计算器214计算出页面查看的平均次数(或者平均频率)AveF(块810)。页面查看的平均次数可以由AveF=kt/α确定,其中时间变量“t”被设置为1,以缩放独特观众成员以与清理过的页面查看和/或视频流匹配。
示例NBD计算器214计算针对人口统计组总体的每个人的小组会话的数量,表示达时间“t”的总评价点(GRP(t))(块812)。每个人小组的会话次数可以由GRP(t)=t*Gr确定,其中时间变量“t”被设置为1以缩放独特观众以与清理过的页面查看和/或视频流匹配。
如果泊松条件存在(块802),则示例NBD计算器214确定时间t的频率分布fp(i),其中“i”是页面查看的次数(块814)。例如,该示例NBD计算器214可以根据fp(i)=(λt)i*e-λt/i!(其中,!表示阶乘运算子)来确定达时间t的频率分布fp(i)(例如,页面查看量次数的分布)。
图2的示例NBD计算器214确定t天(块816)的计划覆盖率(按百分率表示)(块816)。缩放的覆盖率可以根据覆盖率=100*(1-e-λt)进行确定。图2的示例NBD计算器214确定每个人的小组会话的次数(Gp(t))(块818)。每个人的小组会话的次数(Gp(t))可以根据Gp(t)=t*Gr确定。
在针对泊松条件(块814-818)或者非泊松条件(块804-812)进行NBD之后,该示例指令800结束并且控制返回到图4的块414。该示例指令800可以返回根据NBD确定的计算结果,诸如,输入变量(例如,Xi、Vi、Yi、Ui)、针对人口统计组群的缩放的覆盖率、针对人口统计组群的n≥0的页面查看的概率、针对人口统计组群的页面查看的平均次数、针对人口统计组群的每个人的小组会话和/或人口统计组群的一个或者更多个时间周期的频率分布。
图9是示例计算机可读指令900的流程图表示,当被执行时,其使处理器选择小组成员以表示未测量的位置的观众。该示例指令900可以由图2的示例虚拟小组产生器212来执行以实现图4的块414。
图2的示例虚拟小组产生器212获得针对未测量的位置所对应的观众的人口统计目标(块902)。该人口统计目标可以从基于调查的数据收集器204处收集到并且提供未测量的位置的预计的人口统计。示例样本加权器302获得观众目标和数量目标(块904)。该示例观众目标是针对已测量的位置(例如,家庭和工作环境)所报告的独特观众与由NBD计算器214所确定的估计的独特观众(例如,家庭、工作和未测量的环境或者位置)之间的差异。该示例数量目标是页面查看量的报告数量(例如,从基于普查数据收集器202处接收到的)和/或视频流和/或页面查看和/或视频流的经平滑的数量,以及扣除自未测量的位置的流量。图2的虚拟小组产生器212假定数量度量(诸如页面查看和视频流)符合帕累托(Pareto)分布。用于产生该经光滑的数量的示例指令在下文参照图12描述。给定了具体实体的观众和数量目标,可以通过计算机计算的帕累托分布的所选择的百分比来产生用于样本选择的数量目标。在一些示例中,在计算该百分比之前,该数量度量可被分类为有限的等级。
该示例样品加权器302从针对已测量的位置的小组成员的集合选择小组成员(块906)。该成组小组成员可以从示例小组数据收集器206处获得。示例样本加权器302基于所选择的小组成员的人口统计信息和/或所测量的活动与未测量的位置的人口的目标人口统计学信息和/或目标行为的一致性对所选择的小组成员赋予权重(块908)。该示例样本加权器302确定是否存在待加权的额外的小组成员(块910)。如果存在额外的小组成员(块906),则控制返回到块906以选择另一个小组成员。
当不存在额外的待加权的小组成员(块910)时,该示例样本选择器304将该小组成员权重转化为选择概率(块912)。例如,较高的小组成员权重得到相应的小组成员的较高的选择概率。基于该选择概率,示例样本选择器304选择数个小组成员(块914)。在一些示例中,该示例选择器304使用该选择概率随机地选择小组成员以确定随机地选择任何给定的小组成员的可能性。所选择的小组成员的数量可以基于用于表示未测量的位置观众的小组成员的数量预先确定(例如,图3的所选择的样本规模308)和/或可以动态地确定。
示例重新加权器306对所选择的小组成员(块916)重新加权。该重新加权可以类似于或者相同于在块908内进行的加权和/或可以基于类似的或者相同的系数。该重新加权使该选择的小组成员较紧密地表示未测量的位置观众的人口统计、观众和/或数量目标。然后,该示例指令900可以结束并且控制返回到图4的块416。
图10A和图10B示出了示例计算机可读指令1000的流程图表示,当被执行时,其使用基于概率的方法使处理器实现额外的活动。该示例指令1000可以被执行以实现图2的示例活动履行器216以进行图4的块408。
图2的示例活动履行器216将基于小组数量(例如,页面查看、视频流)与基于普查的数量进行比较以确定需要多少活动以填补基于普查的数据和基于小组的数据之间的差距(块1002)。示例基于小组的数量是基于来自已测量的位置和未测量的位置的小组活动(例如,实际小组成员数据和虚拟小组成员数据)。示例活动履行器216从URL模式的列表中选择URL模式(例如,从URL的基于普查的列表和/或由服务器106、108所请求和/或提供的URL模式)(块1004)。在一些示例中,图1和/或图2的活动履行器216和/或服务器监测器134将URL的实例聚集到URL模式中。
该示例活动履行器216选择一天的时段和人口统计组群(块1006)的组合。示例一天的时段类别是在下表1中例示。示例人口统计组群(例如,性别/年龄类别)在下表2中例示。人口统计组群可以包括额外的和/或另选的区别。图2的示例活动履行器216选择示例一天的时段类别中的一个和示例人口统计组群中的一个。
表1–一天的时段类别
性别/年龄 限定
1 男性2-11
2 女性2-11
3 男性12-17
4 女性12-17
5 男性18-24
6 女性18-24
7 男性25-34
8 女性25-34
9 男性35-44
10 女性35-44
11 男性45-54
12 女性45-54
13 男性55+
14 女性55+
表2–人口统计组群
图2的示例活动履行器216计算针对所选择的组群的加权的已测量的小组数量(例如,针对已测量的位置)作为变量A(块1008)。示例变量A可以通过估计在该时段期间的流量以及通过从小组成员数据中所选择的性别和年龄组确定。该数据相对于虚拟小组数据进行加权以表示来自已测量的位置的观众,并且能够预测来自已测量的位置处所选择的组群的页面查看的数量。该活动履行器216计算针对所选择的组群的加权的虚拟小组数量(例如,针对未测量的位置)作为变量B(块1010)。示例变量B可以通过估计该一天的时段期间的流量以及通过从虚拟小组数据中所选择的性别组确定。该示例虚拟小组数据相对于小组成员数据进行加权以表示来自未测量的位置的观众,并且能够预测从未测量的位置处所选择的组别的页面查看的数量。该活动履行器216计算所选择的组群的服务器页面查看总体作为变量C(块1012)。示例变量C可以是归因于所选择的人口统计组群的在所选择的一天的时段期间的基于人口统计的页面查看总体的估计部分。
图2的示例活动履行器216计算针对所选择的一天的时段、人口统计组群、URL模式(块1014)的活动的复制概率。该示例活动复制概率可以根据变量A、B和C确定(例如,由块1008-1012确定的)作为(C-A-B)/A*100%。
示例活动履行器216确定了是否存在待处理的额外的类别(块1016)。如果存在额外的类别,则控制返回到块1006以选择另一个一天的时段和人口统计组群。当不存在针对所选择的URL模式的额外的类别时(块1016),示例活动履行器216确定是否存在待处理的额外的URL模式(块1018)。如果存在额外的URL模式(块1018),则控制返回到块1004以选择另一个URL模式。
当不存在额外的URL模式时(块1018),示例观众分类器产生指定针对URL格式、一天的时段类别和人口统计组群(块1020)的各组合的复制概率的概率查找表。
转向图10B,图2的示例活动履行器216选择URL实例(例如,页面查看URL,视频流URL等)(块1022)。URL实例可以从小组和/或虚拟小组的表格中选择。活动履行器216基于所选择的URL实例的一天的时段和人口统计组群从针对该URL实例所属于的URL模式的概率查找表处检索复制概率(块1024)。活动履行器216确定复制概率是否小于1(例如,100%)(块1026)。例如,如果小组活动由针对该一天的时段和人口统计组群的服务器总体的大部分组成,则该重复概率可以小于1。
如果该重复概率是1或者更高(块1026),则示例活动履行器216复制所选择的实例并且将表1中URL模式的重复概率减小1(块1028)。复制所选择的实例导致产生相同的实例。如果该重复概率小于1(块1026),则示例活动履行器216产生在0和1之间均匀分布的随机的数字(块1030)。如果所产生的数字小于或者等于该复制概率(块1032),则示例活动履行器216复制所选择的实例(块1034)。
如果活动履行器216复制实例(块1028或者块1034),则示例观众分类器复制该实例作为其一部分的完整会话(块1036)。会话的复制使该会话内的所有的实例被复制(无需两次复制所选择的实例)。在复制该会话(块1036)之后,或者如果该实例并未被复制(块1032),则示例观众分类器确定小组和/或虚拟小组活动的表格内是否存在额外的实例(块1038)。如果存在额外的实例(块1038),则控制返回到块1022以选择另一个实例。
当不存在额外的实例时(块1038),图10A-图10B的示例指令1000可以结束并且控制返回到图4的块420。该示例活动履行器216可以返回通过指令1000产生的额外的活动的列表和/或包括基于小组的活动、基于小组的虚拟活动的活动以及通过该指令1000产生的额外的活动的更新的列表。
图11是示例计算机可读指令1100的流程图表示,当被执行时,其使用基于缩放的方法使处理器实现额外的活动。图11的基于缩放的示例方法不同于图10A-图10B的基于概率的方法,通过计算机计算所“缺失”活动的缩放系数,而不是通过复制小组会话向表格增加更多行。示例指令1100可以被执行以实现图2的示例活动履行器216以进行图4的块418。
图2的示例活动履行器216将基于小组的数量(例如,网页浏览、视频流)与基于普查的数量进行比较以确定需要多少活动来填补基于普查和基于小组的数据之间的差距(块1102)。示例基于小组的数量基于来自未测量的位置和已测量的位置的小组活动(例如,实际小组成员数据和虚拟小组成员数据)。示例活动履行器216从URL模式(例如,从URLs的基于普查列表和/或由服务器106、108所请求和/或提供的URL模式)列表中选择URL模式。在一些示例中,图1和/或2的活动履行器216和/或服务器监测器134将URL的实例聚集到URL模式中。
该示例活动履行器216选择一天的时段和人口统计组群(块1106)的组合。示例一天的时段类别在以上表1中例示。示例人口统计组群(例如,性别/年龄类别)在以上表1中例示。图2的示例活动履行器216选择示例一天的时段类别中的一个和该示例人口统计组群中的一个。
图2的示例活动履行器216计算针对所选择的组群的加权的测量的小组数量作为变量A(块1108)。示例变量A可以通过估计一天的时段期间的流量以及通过从小组成员数据中所选择的性别和年龄组确定。该数据相对于虚拟小组数据进行加权以表示来自已测量的位置的观众,并且可以预测来自已测量的位置的所选择的组群的页面查看数量。该活动履行器216计算所选择的组群(例如,针对未测量的位置)的加权的虚拟小组数量作为如变量B(块1110)。该示例变量B可通过估计一天的时段期间的流量以及通过从该虚拟小组数据中所选择的性别组群进行确定。该示例虚拟小组数据相对于该小组成员数据进行加权以表示来自未测量的位置的观众,并且可以预测从未测量的位置所选择的组群的页面查看数量。该活动履行器216计算所选择组群的普查页面总浏览量作为变量C(块112)。示例变量C可以是归因于所选择的人口统计组群的、所选择的一天的时段期间基于人口统计的页面查看总量的估计的部分。
图2的示例活动履行器216计算所选择的一天的时段、人口统计组群、URL模式(块1114)的缩放系数。该示例活动重复概率可以从变量A、B和C确定(例如,由块1108-1112确定)作为(C-A-B)/A*100%。
示例活动履行器216确定是否存在待处理的额外的类别(块1116)。如果存在额外的类别,则控制返回到块1106以选择另一个一天的时段和人口统计组群。当针对所选择的URL模式不存在额外的类别时(块1116),示例活动履行器216确定是否存在待处理的额外的URL模式(块1118)。如果存在额外的URL模式(块1118),则控制返回到块1004以选择另一个URL模式。
当不存在额外的URL模式时(块1118),示例观众分类器产生了指定针对URL格式、一天的时段类别和人口统计组群(块1120)的各组合的复制概率的概率查找表。
转向图11B,图2的示例活动履行器216产生包括URL模式、一天的时段类别、和人口统计组群(块1122)的各组合的缩放系数的缩放系数查找表。图2的示例活动履行器216选择URL实例(例如,页面查看URL,视频流URL等)(块1124)。基于所选择的实例所属的URL模式,该示例活动履行器216从针对URL实例的一天的时段和人口统计组群(块1126)的查找表检索缩放系数。
活动履行器216将该缩放系数应用于实例(块1128)。例如,活动履行器216可以将缩放值应用于实例中以缩放与该实例相对应的页面查看或者流的数量。所选择的实例的缩放值不必是整数。示例活动履行器216确定是否存在额外的实例(块1130)。如果存在额外的实例(块1130),则控制返回到块1124以选择另一个实例。
当不存在额外的实例时(块1130),指令1100可以结束并且控制返回到图4的块420。示例活动履行器216可以通过该指令1100产生额外的活动的列表和/或包括基于小组的活动、基于小组的虚拟活动的活动以及通过指令1100产生的额外的活动的更新的列表。
图12是示例计算机可读指令的流程图表示,当被执行时,其使处理器计算平滑的数量度量。图12的示例指令1200可以作为数量目标的确定的一部分(例如,图9中的块904)执行。
图3的示例样本加权器302确定针对URL模式、一天的时段和星期中的某天的各组合的普查测量的页面查看的次数(块1202)。例如,服务器监测器134和/或后台程序136可以提供示出了在周一下午1:23:45,URL模式具有120万页面查看的数据。示例样本加权器302计算针对URL模式、一天的时段、星期中的某天和人口统计(块1204)各组合的普查测量的平均页面查看量。例如,该示例加权器302可以根据普查数据(例如,经由基于普查的数据收集器202)确定针对包括周一下午1:23:45的一天的时段针对URL模式的平均普查页面查看为800,000次。
示例样本加权器302确定针对URL模式、一天的时段、星期中的某天和人口统计组群的各组合的基于小组的平均页面查看(块1206)。例如,18-24岁男性的人口统计组群可以根据针对包括周一下午1:23:45的一天的时段的基于小组数据确定。样本加权器302确定针对所选择的人口统计组群(块1208)的未测量的位置系数。例如,针对与URL模式相关的示例风格,针对18-24岁男性的未测量的位置系数为1.1。
该示例样本加权器302计算针对人口统计组群、一天的时段和星期中的某天(块1210)的各组合的平滑的数量度量。该样本加权器302根据平滑的数量度量=Fi*Pi*S/T来确定了平滑的数量度量。针对包括周一下午1:23:45的一天的时段针对18-24岁男性的示例平滑的页面查看为(1.1*60,000*1,200,000)/800,000。然后,该示例指令1200可以结束并且控制返回到图9的块906。
图13是示例计算机可读指令1300的流程图表示,当被执行时,其使处理器计算用于NBD计算的输入。示例指令1300可以由图2的示例NBD计算器214来执行以实现图7的块702。为进行该指令1300,该NBD计算器214接收加权的小组活动(例如,从图2的小组数据收集器206),普查页面查看和/或视频流测量结果(例如,从图2的基于普查的数据收集器202)以及URL模式、通道、品牌和/或父辈的列表作为输入。
NBD计算器214选择URL模式(例如,从待测量的URL模式的列表)(块1302)。NBD计算器214按照星期中的某天和/或一天的时段(块1304)通过计算机计算页面查看人口统计分布。该页面查看人口统计分布确定了星期中的某天和/或一天的时段期间各人口统计组群所选择的URL模式的页面查看百分比。该页面查看人口统计分布可以使用以下算式确定:小组流分布%=(针对一天的时段和/或星期中的某天的针对人口统计组群的加权的小组-测量到的页面查看)/(针对同一个一天的时段和/或星期中的某天的针对所有人口统计组群的加权的小组-测量的页面查看)。
图14例示了示例所选择的URL模式、星期中的某天1402、一天的时段1404的示例人口统计分布1400。该示例人口统计分布可以针对一天的时段和星期中的某天的余下组合针对URL模式产生。该示例人口统计分布示出了针对URL模式的所选择的组合的页面查看1406、星期中的某天1402、一天的时段1404、人口统计组群1408的各组合。该页面查看1406可以从加权的小组的测量结果(例如,由小组数据收集器206收集到)确定。人口统计分布(或小组页面查看分布1410)百分比表示星期中的某天1402的对应日期和一天的时段1404的人口统计组群1408的对应组群的页面查看百分比。
转向图13A,NBD计算器214通过将调整后的普查页面查看乘以各星期中的某天和一天的时段(块1306)的人口统计分布,来将调整后(例如,清理后的)的普查页面查看分配到人口统计组群中。该调整后的普查页面查看经由图2的基于普查的数据收集器202处获得。人口统计分布从块1304所确定的小组流分布1410处获得。图15例示了针对图14的人口统计组群、一天的时段以及星期中的某天的多个流的分配1500。图15的示例分配1500包括针对图14的星期中的某天1402、一天的时段1404、人口统计组群1408以及该小组页面查看分布1410。该分布1500还包括星期中的某天1402和一天的时段1404的调整后的普查页面查看1502的次数。示例NBD计算器214通过将相应的调整后的人口统计页面查看1502乘以相应的小组页面查看分布1410,来确定计算出的针对星期中的某天1402、一天的时段1404的针对各人口统计组群1408的普查-测量的页面查看1504的次数。
转向图13A,该示例NBD计算器214确定是否存在额外的URL模式(块1308)。如果存在额外的模式(块1308),则控制返回到块1302以选择另一个URL模式。当不存在要确定调整后的普查-测量的页面查看的额外的URL模式时(块1308),示例NBD计算器214选择对通道、品牌或者父辈(块1310)。通道、品牌或者父辈的选择可以是基于要进行测量的实体。该示例NBD计算器214选择人口统计组群(例如,图14和/图15的人口统计组群1408中的一个)。
示例NBD计算器214将URL模式聚集到针对所选择的人口统计组群(块1314)的所选择的通道、品牌和/或父辈。例如,NBD计算器214可以将属于所选择的实体的多个URL模式的普查-测量的页面查看相加。示例NBD计算器214将来自完整报告时段的页面查看聚集到针对所选择的组群(块1316)的一天的时段和/或星期中的某天。该报告时段可以是指定的或者请求的报告时段,例如,针对所选择的小时、天、周、月或任何其它报告时段的页面查看。图16例示图14的针对报告时段的针对人口统计组群1408中的一个的示例组群的普查-测量的集合的页面查看的次数。该普查-测量的聚集的页面查看的示例次数可以表示在图13A的块1314和1316中进行的聚集。
所聚集的页面查看1602的示例次数被例示针对图14和/或图15例示的各示例星期中的某天1402和一天的时段1404,以及图14和/或图15未例示的星期中的某天和一天的时段。在图16中的示例中,第一人口统计组群(例如,图14和/或图15的14个示例组群的组群1)被认为在指定的报告时段期间在每周第三天的第一时段期间针对所选择的通道、品牌和/或父辈(例如,属于所选择的通道、品牌和/或父辈的URL模式)具有21305个页面查看。
重新转向图13A,示例NBD计算器214聚集针对所选择的组群和所选择的通道、品牌和/或父辈(块1318)的加权的小组会话。示例加权的小组会话从图2的小组数据收集器处获得。该会话可以被聚集以表示在所选择的报告时段(包括所选择的人口统计组群的所有一天的时段和星期中的某天)期间发生的会话。
转向图13B,示例NBD计算器214通过计算经缩放的普查会话的次数(块1320)。例如,该示例NBD计算器214使用所计算出的普查页面查看与加权的小组页面查看的比率以及聚集的加权的小组会话的数量,可以计算经缩放的普查会话的数量。以下算式可以被用来计算所选择的人口统计组群和通道、品牌、和/或父辈的比例的普查会话:
可以使用确定经缩放的普查会话的其它方法。该示例算式使用基于小组的页面查看与基于普查的页面查看的比率以根据基于小组的会话次数确定基于普查的会话次数。图17例示了针对图14-图16的示例人口统计人群1408的示例计算出的经缩放的普查会话1702。该示例经缩放的普查会话1702是基于加权的小组页面查看的次数1704(例如,从基于小组数据收集器206处获得)、计算出的普查页面查看1706的次数(例如,从图16的所计算的页面查看1602,在图13A的块1306计算的)以及加权的小组会话的次数1708(例如,来自基于小组的数据收集器206)而针对该示例人口统计组群计算的。应该注意的是尽管为了例示,图16的计算出的普查页面查看1602的示例总次数不同于针对人口统计组群1的图16的计算出的普查页面查看1706,但是示例计算出的普查页面查看1706可以被获得作为从块1316所确定的计算出的普查页面查看1602的总次数。如图17所例示,针对该人口统计组群2的经缩放的的普查会话1702被计算成18,130,627=6,989,826*(72,732,430/28,040,233)(例如,截断该分数)。
重新转向图13B,示例NBD计算器214检索针对URL模式的小组组合观众(例如,针对已测量的位置的观众),其属于所选择的通道、品牌和/或父辈并且其在基于普查的数据和基于小组的数据(块1322)之间相匹配。如果URL模式由普查测量(例如,服务器监测器134和/或后台程序136)并且由小组的成员所访问,则该URL模式被认为与图13A-图13B的示例匹配。该示例小组组合观众,其为针对所有已测量的位置(例如,图1中的家庭和工作环境120、122)的观众总数并且包括重复的观众,可以从示例基于小组的数据收集器206处检索。基于小组的数据收集器206例如通过对小组成员数据加权以表示由小组所表示的人口,并且外推出该小组观众以从人口识别观众的估计,来对该小组组合观众进行确定。
示例NBD计算器214确定是否存在针对所选择的品牌、通道、和/或父辈的复制因数(块1324)。该复制因数表示在不同已测量的位置之间观众(例如,在家庭和工作环境等所测量的观众成员,其被计作多名独特观众成员)的重叠(例如,百分比、比率等)。复制因数可以从示例基于小组的数据收集器206处获得。如果不存在可用的复制因数(块1324),则示例NBD计算器214使用所检索到的小组组合观众作为针对该人口统计组群的小组组合观众(块1326)。
如果存在复制因数(块1324),则示例NBD计算器检索针对所选择的品牌、通道和/或父辈的复制因数(块1328)并且计算出针对所测量的位置和所选择的组群的加权的观众(块1330)。在块1330中计算出的加权的观众使用针对所选择的通道、品牌和/或父辈的观众的针对任意URL的观众,而与URL是否与基于普查的数据匹配无关。NBD计算器计算出针对所选择的通道、品牌和/或父辈的调整后的聚集观众以及所选择的组群(块1332)。用于计算调整后的聚集观众示例算式如下示出:
其中,针对已测量的位置的观众包括通过在各已测量的位置(例如,家庭环境和工作环境)的小组所确定的观众。该比率以复制因数调整(例如,乘以(1-复制因数))以从该已测量的位置中去除重复的观众成员。该调整后的组合观众是针对所选择的通道、品牌和/或父辈的URL具有至少一次页面查看的所选择的人口统计组群中的人的估计数量,并且作为Ui参数用于NBD参数的计算。
该示例NBD计算器214确定是否存在额外的人口统计组群(块1334)。如果存在额外的人口统计组群(块1334),则控制返回到图13A的块1312。如果不存在用于计算针对所选择的通道、品牌和/或父辈的额外的人口统计组群(块1334),则示例NBD计算器214确定是否存在要计算NBD的额外的通道、品牌和/或父辈(块1336)。如果存在额外的通道、品牌和/或父辈(块1336),则控制返回到图13A的块1310。当不存在额外的通道、品牌或者父辈时(块1336),示例指令1300结束并且控制返回到图7的块704。示例指令1300将针对经缩放的人口统计会话(Xi)和调整后的组合观众(Ui)的NBD输入返回到NBD计算。如果加权的小组会话不被独立地提供,则该指令1300还可以返回加权的小组会话(Vi)。
图18是能够执行图4-图13B的指令以实现图1-图3的混合在线观众测量系统102和/或虚拟小组产生器212的示例处理平台1800的框图。例如,该处理平台1800可以是服务器、个人电脑和/或任何其它类型的计算机设备。
即时示例的系统1800包括处理器1812。例如,该处理器1812能够由一个或者更多个从任何所需的家庭或者生产商处的微处理器或者控制器来实现。
该处理器1812包括本地存储器1813(例如,高速缓存)并且与包括易失性储存器1814和非易失性储存器1816的主存储器经由总线1818进行通信。该易失性储存器1814可以由同步动态随机存储器(SDRAM)、动态随机存取存储器(DRAM)、动态随机存取存贮器(RDRAM)和/或任何其它类型的随机访问存储器设备来实现。该非易失性储存器1816可以由闪存和/或任何其它必要类型的存储设备来实现。对主存储器1814、1816的访问可以用存储器控制器来控制。
处理平台1800还包括接口电路1820。接口电路1820可以由任何类型的接口标准来实现,例如,以太网接口、通用串行总线(USB)和/或PCI高速接口。
一台或者更多台输入设备1822被连接至接口电路1820。输入设备1822允许用户输入数据和命令至该处理器1812。例如,该输入设备可以由键盘、鼠标、触摸屏、触控板、轨迹球、iso点和/或语音识别系统来实现。
一台或者更多台输出设备1824同样被连接至接口电路1820。例如,输出设备1824可以通过显示设备来实现(例如,液晶显示器、阴极射线管显示器(CRT)、打印机和/或扬声器)。因此,该接口电路1820通常包括显卡。
接口电路1820还包括通信装置,例如,调制解调器或者网络接口卡以便于通过网络1826(例如,以太网连接、数字用户线路(DSL)、电话线、同轴电缆、蜂窝状电话系统等)与外部计算机进行数据交换。
处理平台1800还包括一个或者更多个大数量存储设备1828用于储存软件和数据。此类大数量存储设备1828的示例包括软盘驱动器、硬盘驱动器、光盘驱动器和数字化视频光盘驱动器(DVD)。
图4-图13B中的编码指令1832可以被存储在大数量存储设备1828、易失性储存器1814和非易失性储存器1816和/或移动存储介质中,例如,CD或者DVD。
虽然特定示例系统、方法、设备和产品在此已经介绍过,本专利的覆盖范围不限于此。相反地,本专利覆盖了本专利的权利要求的范围内公平地归属的所有系统、方法、设备和制品。

Claims (41)

1.一种对观众数据分类的方法,该方法包括以下步骤:
获得与在所测量的位置访问网页的多名小组成员相对应的小组成员数据;
根据所述小组成员的人口统计信息对所述小组成员数据进行分类;
基于对在未测量的位置的网页访问的估计产生虚拟小组;以及
基于与所述虚拟小组相对应的数据对与所述未测量的位置相关联的页面查看数据进行分类。
2.根据权利要求1中所限定的方法,其中,所述虚拟小组包括所述多名小组成员的子集。
3.根据权利要求1中所限定的方法,其中,产生所述虚拟小组的步骤包括估计总观众。
4.根据权利要求1中所限定的方法,其中,产生所述虚拟小组的步骤基于页面查看的基于普查的计数、所述小组成员数据和估计的总体。
5.根据权利要求4中所限定的方法,其中,产生所述虚拟小组的步骤包括使用负二项分布对在未测量的位置的观众进行估计。
6.根据权利要求1中所限定的方法,其中,产生所述虚拟小组的步骤是基于人口统计目标或者活动目标中的至少一方。
7.根据权利要求1中所限定的方法,其中,对所述小组成员数据进行分类的步骤包括基于所述小组成员数据对在线观众的第一部分进行估计。
8.根据权利要求7中所限定的方法,其中,对所述页面查看数据进行分类的步骤包括对所述在线观众的第二部分进行估计,所述第一部分和所述第二部分包括独特观众成员的数量。
9.根据权利要求1中所限定的方法,所述方法还包括以下步骤:
确定页面查看的基于普查的计数和与所述页面查看数据的第一部分和第二部分相关联的页面查看的数量之间的差异;以及
基于所述差异对未由所述多名小组成员和所述虚拟小组表示的额外的观众活动进行估计。
10.一种产生虚拟小组的方法,该方法包括以下步骤:
基于第一估计特征对多名小组成员赋予权重;
基于所述权重来选择所述小组成员的子集;
基于第二估计特征对所选择的小组成员重新加权;以及
产生虚拟小组,该虚拟小组包括作为虚拟小组成员的所选择的小组成员,其中,基于所述重新加权对从所选择的小组成员处收集到的针对所述虚拟小组的数据赋予权重。
11.根据权利要求10中所限定的方法,所述方法还包括以下步骤:对观众进行估计,所述小组成员的第一估计特征基于所估计的观众。
12.根据权利要求11中所限定的方法,其中,所述第一估计特征是基于所估计的观众和所测量的观众之间的差异。
13.根据权利要求10中所限定的方法,其中,选择所述小组成员的集合的步骤包括使用分配给对应的小组成员的权重作为针对所述对应的小组成员的选择概率,来随机地选择所述小组成员。
14.根据权利要求10中所限定的方法,所述方法还包括以下步骤:基于人口统计目标或者活动目标中至少一方来计算所述第一估计特征。
15.根据权利要求14中所限定的方法,其中,计算所述第一估计特征的步骤包括将所述小组成员的在线活动与基于普查的网页查看数据进行比较。
16.一种装置,该装置包括:
小组数据收集器,其用于收集与在所测量的位置访问网页的多名小组成员相对应的小组成员数据;
虚拟小组产生器,其用于基于对在未测量的位置的网页访问的估计产生虚拟小组;以及
观众分类器,其用于根据所述小组成员的人口统计信息对所述小组成员数据进行分类,并且基于与该虚拟小组相对应的数据对与所述未测量的位置相关联的页面查看数据进行分类。
17.根据权利要求16中所限定的装置,所述装置还包括负二项分布计算器,其用于基于所述多名小组成员和总体估计来估计在未测量的位置的观众。
18.根据权利要求16中所限定的装置,所述装置还包括:活动履行器,其用于基于所述多名小组成员来确定在线活动,所述观众分类器用于基于所述在线活动对所述页面查看数据的第三部分进行分类。
19.根据权利要求16中所限定的装置,所述装置还包括:基于普查的数据收集器,其用于接收表示来自已测量的和未测量的位置的网页的页面查看的数量的页面查看数据。
20.根据权利要求16中所限定的装置,所述装置还包括:基于调查的数据收集器,其用于收集总体估计,所述虚拟小组产生器用于基于所述总体估计产生所述虚拟小组。
21.一种装置,所述装置包括:
样本加权器,其用于基于第一估计特征对多名小组成员赋予权重;
样本选择器,用于基于所述权重选择所述小组成员的子集;以及
样本重新加权器,用于基于第二估计特征对所选择的小组成员重新加权,并且用于产生虚拟小组,所述虚拟小组包括作为虚拟小组成员的所选择的小组成员,其中,基于所述重新加权,对从所选择的小组成员处收集到的针对所述虚拟小组的数据赋予权重。
22.根据权利要求21中所限定的装置,其中,所述样本加权器:
获得估计的观众;以及
基于所述估计的观众计算所述小组成员的第一估计特征。
23.根据权利要求22中所限定的装置,其中,所述样本加权器基于所估计的观众和所测量的观众之间的差异计算所述第一估计特征。
24.根据权利要求21中所限定的装置,其中,所述样本选择器通过以下方式选择所述子集中的小组成员:使用赋予对应的小组成员的权重作为针对所述对应的小组成员的选择概率,来随机地选择所述小组成员。
25.根据权利要求21中所限定的装置,其中,所述样本加权器基于人口统计目标或者活动目标中至少一方来计算所述第一估计特征。
26.根据权利要求25中所限定的装置,其中,所述样本加权器通过将所述小组成员的在线活动与所测量的页面查看数据进行比较来计算所述第一估计特征。
27.一种有形的计算机可读存储介质,其包括机器可读指令,在所述机器可读指令被执行时使处理器至少:
获得与在所测量的位置访问网页的多名小组成员相对应的小组成员数据;
根据所述小组成员的人口统计信息对所述小组成员数据进行分类;
基于与在未测量的位置的网页访问的估计产生虚拟小组;以及
基于与所述虚拟小组相对应的数据对与所述未测量的位置相关联的页面查看数据进行分类。
28.根据权利要求27中所限定的存储介质,其中,所述虚拟小组包括所述多名小组成员的子集。
29.根据权利要求27中所限定的存储介质,其中,所述指令使所述处理器通过对总观众进行估计来产生所述虚拟小组。
30.根据权利要求27中所限定的存储介质,其中,所述指令使所述处理器基于页面查看的基于普查的计数、所述小组成员数据,和估计的总体产生所述虚拟小组。
31.根据权利要求27中所限定的存储介质,其中,所述指令使所述处理器通过使用负二项分布对在未测量的位置的观众进行估计来产生所述虚拟小组。
32.根据权利要求27中所限定的存储介质,其中,所述指令使所述处理器基于人口统计目标或者活动目标中至少一方来产生所述虚拟小组。
33.根据权利要求27中所限定的存储介质,其中,所述指令使所述处理器通过基于所述小组成员数据对在线观众的第一部分进行估计来对所述小组成员数据进行分类。
34.根据权利要求33中所限定的存储介质,其中,所述指令使所述处理器通过对在线观众的第二部分进行估计来对所述页面查看数据进行分类,所述第一部分和所述第二部分包括独特观众成员的数量。
35.根据权利要求27中所限定的存储介质,其中,所述指令还使所述处理器:
确定页面查看的基于普查的计数和与所述页面查看数据的第一部分和第二部分相关联的页面查看的数量之间的差异;以及
基于所述差异对未由所述多名小组成员和所述虚拟小组表示的额外的观众活动进行估计。
36.一种计算机可读存储介质,其包括机器可读指令,在所述机器可读指令被执行时使处理器:
基于第一估计特征对多名小组成员赋予权重;
基于所述权重来选择所述小组成员的子集;
基于第二估计特征对所选择的小组成员重新加权;以及
产生虚拟小组,该虚拟小组包括作为虚拟小组成员的所选择的小组成员,其中,从所选择的小组成员处收集到的针对所述虚拟小组的数据将基于所述重新加权被赋予权重。
37.根据权利要求36中所限定的计算机可读存储介质,其中,所述指令还使所述处理器估计观众,所述小组成员的第一估计特征基于所估计的观众。
38.根据权利要求37中所限定的计算机可读存储介质,其中,所述第一估计特征是基于所估计的观众和所测量的观众之间的差异。
39.根据权利要求36中所限定的计算机可读存储介质,其中,所述指令还使所述处理器通过以下方式选择所述小组成员的子集:使用赋予对应的小组成员的权重作为针对所述对应的小组成员的选择概率,来随机地选择所述小组成员。
40.根据权利要求36中所限定的计算机可读存储介质,其中,所述指令还使所述处理器基于人口统计目标或者活动目标中至少一方来计算所述第一估计特征。
41.根据权利要求40中所限定的计算机可读存储介质,其中,所述指令还使所述处理器通过将该小组成员的在线活动与基于普查的网页查看数据进行比较来计算所述第一估计特征。
CN201380017096.6A 2012-01-26 2013-01-25 测量在线观众的系统、方法和产品 Expired - Fee Related CN104205158B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261591263P 2012-01-26 2012-01-26
US61/591,263 2012-01-26
PCT/US2013/023259 WO2013112911A1 (en) 2012-01-26 2013-01-25 Systems, methods, and articles of manufacture to measure online audiences

Publications (2)

Publication Number Publication Date
CN104205158A true CN104205158A (zh) 2014-12-10
CN104205158B CN104205158B (zh) 2017-11-28

Family

ID=48871161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380017096.6A Expired - Fee Related CN104205158B (zh) 2012-01-26 2013-01-25 测量在线观众的系统、方法和产品

Country Status (5)

Country Link
US (4) US9224094B2 (zh)
JP (1) JP2015512081A (zh)
CN (1) CN104205158B (zh)
CA (2) CA3013711C (zh)
WO (1) WO2013112911A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210174423A1 (en) * 2016-06-29 2021-06-10 Go Daddy Operating Company, LLC Hosting systems configured to generate optimizzed content based on dynamic tokens and methods of use thereof

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3027898C (en) 2010-09-22 2023-01-17 The Nielsen Company (Us), Llc Methods and apparatus to determine impressions using distributed demographic information
CA2977942C (en) 2010-12-20 2021-08-03 The Nielsen Company (Us), Llc Methods and apparatus to determine media impressions using distributed demographic information
US10089592B2 (en) 2010-12-29 2018-10-02 Comcast Cable Communications, Llc Measuring video asset viewing
US10945011B2 (en) 2010-12-29 2021-03-09 Comcast Cable Communications, Llc Measuring video viewing
CA2810264C (en) 2011-03-18 2020-06-09 The Nielsen Company (Us), Llc Methods and apparatus to determine media impressions
CA3013711C (en) * 2012-01-26 2022-08-09 James R. Oliver Systems, methods, and articles of manufacture to measure online audiences
US10440428B2 (en) 2013-01-13 2019-10-08 Comcast Cable Communications, Llc Measuring video-program-viewing activity
US10645433B1 (en) 2013-08-29 2020-05-05 Comcast Cable Communications, Llc Measuring video-content viewing
AU2013204865B2 (en) 2012-06-11 2015-07-09 The Nielsen Company (Us), Llc Methods and apparatus to share online media impressions data
AU2013204953B2 (en) 2012-08-30 2016-09-08 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions
US9179185B2 (en) * 2013-03-14 2015-11-03 The Nielsen Company (Us), Llc Methods and apparatus to determine a number of people in an area
US9355176B2 (en) 2013-03-15 2016-05-31 The Nielsen Company (Us), Llc Methods and apparatus to supplement web crawling with cached data from distributed devices
US9697533B2 (en) 2013-04-17 2017-07-04 The Nielsen Company (Us), Llc Methods and apparatus to monitor media presentations
US9519914B2 (en) 2013-04-30 2016-12-13 The Nielsen Company (Us), Llc Methods and apparatus to determine ratings information for online media presentations
US20150006255A1 (en) * 2013-06-28 2015-01-01 Streetlight Data, Inc. Determining demographic data
US9661088B2 (en) * 2013-07-01 2017-05-23 24/7 Customer, Inc. Method and apparatus for determining user browsing behavior
US10068246B2 (en) 2013-07-12 2018-09-04 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions
US9313294B2 (en) 2013-08-12 2016-04-12 The Nielsen Company (Us), Llc Methods and apparatus to de-duplicate impression information
US9332035B2 (en) 2013-10-10 2016-05-03 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
EP3065103A4 (en) 2013-10-30 2017-01-18 Panasonic Intellectual Property Management Co., Ltd. Information provision system, specific-information generation device, and specific-information generation method
US10956947B2 (en) 2013-12-23 2021-03-23 The Nielsen Company (Us), Llc Methods and apparatus to measure media using media object characteristics
US9852163B2 (en) * 2013-12-30 2017-12-26 The Nielsen Company (Us), Llc Methods and apparatus to de-duplicate impression information
US9237138B2 (en) 2013-12-31 2016-01-12 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions and search terms
US10147114B2 (en) 2014-01-06 2018-12-04 The Nielsen Company (Us), Llc Methods and apparatus to correct audience measurement data
US20150193816A1 (en) 2014-01-06 2015-07-09 The Nielsen Company (Us), Llc Methods and apparatus to correct misattributions of media impressions
US8910195B1 (en) * 2014-02-20 2014-12-09 Google Inc. Systems and methods for enhancing audience measurement data
CN106663258A (zh) * 2014-02-26 2017-05-10 威图数据研究公司 通过混合的基于统计和用户测量方法测量多屏幕互联网用户概况、交易行为和用户群体结构
US10742753B2 (en) 2014-02-26 2020-08-11 Verto Analytics Oy Measurement of multi-screen internet user profiles, transactional behaviors and structure of user population through a hybrid census and user based measurement methodology
US9953330B2 (en) 2014-03-13 2018-04-24 The Nielsen Company (Us), Llc Methods, apparatus and computer readable media to generate electronic mobile measurement census data
CA3119830C (en) 2014-03-13 2023-11-14 The Nielsen Company (Us), Llc Methods and apparatus to compensate impression data for misattribution and/or non-coverage by a database proprietor
US10311464B2 (en) * 2014-07-17 2019-06-04 The Nielsen Company (Us), Llc Methods and apparatus to determine impressions corresponding to market segments
US9923942B2 (en) * 2014-08-29 2018-03-20 The Nielsen Company (Us), Llc Using messaging associated with adaptive bitrate streaming to perform media monitoring for mobile platforms
US20160063539A1 (en) 2014-08-29 2016-03-03 The Nielsen Company (Us), Llc Methods and apparatus to associate transactions with media impressions
US10652127B2 (en) 2014-10-03 2020-05-12 The Nielsen Company (Us), Llc Fusing online media monitoring data with secondary online data feeds to generate ratings data for online media exposure
US20160189182A1 (en) 2014-12-31 2016-06-30 The Nielsen Company (Us), Llc Methods and apparatus to correct age misattribution in media impressions
US10219039B2 (en) 2015-03-09 2019-02-26 The Nielsen Company (Us), Llc Methods and apparatus to assign viewers to media meter data
US20160342699A1 (en) * 2015-05-18 2016-11-24 Turn Inc. Systems, methods, and devices for profiling audience populations of websites
US20190213612A1 (en) * 2015-06-09 2019-07-11 Clickagy, LLC Map based visualization of user interaction data
US20160364767A1 (en) 2015-06-09 2016-12-15 Clickagy, LLC Method and system for influencing auction based advertising opportunities based on user characteristics
US10045082B2 (en) 2015-07-02 2018-08-07 The Nielsen Company (Us), Llc Methods and apparatus to correct errors in audience measurements for media accessed using over-the-top devices
US10380633B2 (en) 2015-07-02 2019-08-13 The Nielsen Company (Us), Llc Methods and apparatus to generate corrected online audience measurement data
US9838754B2 (en) 2015-09-01 2017-12-05 The Nielsen Company (Us), Llc On-site measurement of over the top media
US10127567B2 (en) * 2015-09-25 2018-11-13 The Nielsen Company (Us), Llc Methods and apparatus to apply household-level weights to household-member level audience measurement data
US10356485B2 (en) * 2015-10-23 2019-07-16 The Nielsen Company (Us), Llc Methods and apparatus to calculate granular data of a region based on another region for media audience measurement
US20170169460A1 (en) * 2015-12-15 2017-06-15 Facebook, Inc. Measuring performance of content presented on an online system based on user information received at variable rates
US10205994B2 (en) 2015-12-17 2019-02-12 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions
US9800928B2 (en) * 2016-02-26 2017-10-24 The Nielsen Company (Us), Llc Methods and apparatus to utilize minimum cross entropy to calculate granular data of a region based on another region for media audience measurement
US9872072B2 (en) 2016-03-21 2018-01-16 Google Llc Systems and methods for identifying non-canonical sessions
US10210459B2 (en) 2016-06-29 2019-02-19 The Nielsen Company (Us), Llc Methods and apparatus to determine a conditional probability based on audience member probability distributions for media audience measurement
EP3491610A4 (en) * 2016-07-27 2019-12-18 Verto Analytics OY ARRANGEMENT AND METHOD FOR MEASURING DIGITAL MEDIA USING USER PANELS
US11151589B2 (en) * 2016-12-16 2021-10-19 The Nielsen Company (Us), Llc Methods and apparatus to determine reach with time dependent weights
US10791355B2 (en) * 2016-12-20 2020-09-29 The Nielsen Company (Us), Llc Methods and apparatus to determine probabilistic media viewing metrics
US20180249211A1 (en) * 2017-02-28 2018-08-30 The Nielsen Company (Us), Llc Methods and apparatus to estimate population reach from marginal ratings
US10681414B2 (en) 2017-02-28 2020-06-09 The Nielsen Company (Us), Llc Methods and apparatus to estimate population reach from different marginal rating unions
US10728614B2 (en) 2017-02-28 2020-07-28 The Nielsen Company (Us), Llc Methods and apparatus to replicate panelists using a local minimum solution of an integer least squares problem
US10602224B2 (en) 2017-02-28 2020-03-24 The Nielsen Company (Us), Llc Methods and apparatus to determine synthetic respondent level data
US10382818B2 (en) 2017-06-27 2019-08-13 The Nielson Company (Us), Llc Methods and apparatus to determine synthetic respondent level data using constrained Markov chains
IT201700105724A1 (it) * 2017-09-25 2019-03-25 Matthaeis Andrea De Metodo per l’estrapolazione di dati da più canali di comunicazione e apparato per l’implementazione di detto metodo
US20190116392A1 (en) * 2017-10-13 2019-04-18 Comscore, Inc. Deterministic household assignment model
WO2019191875A1 (en) 2018-04-02 2019-10-10 The Nielsen Company (Us), Llc Processor systems to estimate audience sizes and impression counts for different frequency intervals
US11249965B2 (en) * 2018-05-24 2022-02-15 Paypal, Inc. Efficient random string processing
US11216834B2 (en) 2019-03-15 2022-01-04 The Nielsen Company (Us), Llc Methods and apparatus to estimate population reach from different marginal ratings and/or unions of marginal ratings based on impression data
US10856027B2 (en) 2019-03-15 2020-12-01 The Nielsen Company (Us), Llc Methods and apparatus to estimate population reach from different marginal rating unions
US11115483B2 (en) * 2019-03-28 2021-09-07 The Nielsen Company (Us), Llc Methods and apparatus for census and panel matching using session identifiers positioned in an HTTP header
US11561942B1 (en) 2019-07-05 2023-01-24 The Nielsen Company (Us), Llc Methods and apparatus to estimate audience sizes of media using deduplication based on vector of counts sketch data
US11416461B1 (en) 2019-07-05 2022-08-16 The Nielsen Company (Us), Llc Methods and apparatus to estimate audience sizes of media using deduplication based on binomial sketch data
US11741485B2 (en) 2019-11-06 2023-08-29 The Nielsen Company (Us), Llc Methods and apparatus to estimate de-duplicated unknown total audience sizes based on partial information of known audiences
US11153392B2 (en) 2019-12-03 2021-10-19 The Nielsen Company (Us), Llc Methods and apparatus for session building from ping-level data
WO2021150639A1 (en) * 2020-01-20 2021-07-29 The Nielsen Company (Us), Llc Methods and apparatus for analyzing an internet audience
US11553054B2 (en) * 2020-04-30 2023-01-10 The Nielsen Company (Us), Llc Measurement of internet media consumption
US11582183B2 (en) 2020-06-30 2023-02-14 The Nielsen Company (Us), Llc Methods and apparatus to perform network-based monitoring of media accesses
US11783354B2 (en) 2020-08-21 2023-10-10 The Nielsen Company (Us), Llc Methods and apparatus to estimate census level audience sizes, impression counts, and duration data
US11481802B2 (en) 2020-08-31 2022-10-25 The Nielsen Company (Us), Llc Methods and apparatus for audience and impression deduplication
US11941646B2 (en) 2020-09-11 2024-03-26 The Nielsen Company (Us), Llc Methods and apparatus to estimate population reach from marginals
US11553226B2 (en) 2020-11-16 2023-01-10 The Nielsen Company (Us), Llc Methods and apparatus to estimate population reach from marginal ratings with missing information
US20220207543A1 (en) * 2020-12-30 2022-06-30 The Nielsen Company (Us), Llc Methods and apparatus to deduplicate audiences across media platforms
US11790397B2 (en) 2021-02-08 2023-10-17 The Nielsen Company (Us), Llc Methods and apparatus to perform computer-based monitoring of audiences of network-based media by using information theory to estimate intermediate level unions
US11949932B2 (en) * 2021-05-25 2024-04-02 The Nielsen Company (Us), Llc Synthetic total audience ratings

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101065170A (zh) * 2004-09-16 2007-10-31 百利国际游戏有限公司 用于游戏机的用户接口系统和方法
CN101142003A (zh) * 2004-12-23 2008-03-12 巨大股份有限公司 用于定向投放到诸如单人或多人游戏等多个视频游戏中进行的广告匹配与评分
US20110246641A1 (en) * 2010-04-05 2011-10-06 Comscore, Inc. Measurements based on panel and census data
CN102270357A (zh) * 2010-06-07 2011-12-07 株式会社东芝 图像处理装置以及医用图像诊断装置
CN102314488A (zh) * 2010-06-30 2012-01-11 尼尔森(美国)有限公司 针对特定的人口统计和使用率分布从网络服务器数据获取匿名观众测量数据的方法和装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPQ206399A0 (en) * 1999-08-06 1999-08-26 Imr Worldwide Pty Ltd. Network user measurement system and method
US20040088212A1 (en) 2002-10-31 2004-05-06 Hill Clarke R. Dynamic audience analysis for computer content
US20060053110A1 (en) * 2004-09-03 2006-03-09 Arbitron Inc. Out-of-home advertising inventory ratings methods and systems
US20080086741A1 (en) 2006-10-10 2008-04-10 Quantcast Corporation Audience commonality and measurement
US20080228543A1 (en) * 2007-03-16 2008-09-18 Peter Campbell Doe Methods and apparatus to compute reach and frequency values for flighted schedules
US9092797B2 (en) * 2010-09-22 2015-07-28 The Nielsen Company (Us), Llc Methods and apparatus to analyze and adjust demographic information
US8549103B2 (en) * 2010-10-07 2013-10-01 Yahoo! Inc. Multisided audience-related hybrid measurements
US20130064109A1 (en) * 2011-09-12 2013-03-14 Jacques Combet Analyzing Internet Traffic by Extrapolating Socio-Demographic Information from a Panel
CA3013711C (en) * 2012-01-26 2022-08-09 James R. Oliver Systems, methods, and articles of manufacture to measure online audiences

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101065170A (zh) * 2004-09-16 2007-10-31 百利国际游戏有限公司 用于游戏机的用户接口系统和方法
CN101142003A (zh) * 2004-12-23 2008-03-12 巨大股份有限公司 用于定向投放到诸如单人或多人游戏等多个视频游戏中进行的广告匹配与评分
US20110246641A1 (en) * 2010-04-05 2011-10-06 Comscore, Inc. Measurements based on panel and census data
CN102270357A (zh) * 2010-06-07 2011-12-07 株式会社东芝 图像处理装置以及医用图像诊断装置
CN102314488A (zh) * 2010-06-30 2012-01-11 尼尔森(美国)有限公司 针对特定的人口统计和使用率分布从网络服务器数据获取匿名观众测量数据的方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210174423A1 (en) * 2016-06-29 2021-06-10 Go Daddy Operating Company, LLC Hosting systems configured to generate optimizzed content based on dynamic tokens and methods of use thereof
US11847683B2 (en) * 2016-06-29 2023-12-19 Go Daddy Operating Company, LLC Hosting systems configured to generate optimized content based on dynamic tokens and methods of use thereof

Also Published As

Publication number Publication date
AU2013204255A1 (en) 2013-08-15
CN104205158B (zh) 2017-11-28
US9224094B2 (en) 2015-12-29
CA3013711C (en) 2022-08-09
CA3013711A1 (en) 2013-08-01
WO2013112911A1 (en) 2013-08-01
AU2013204255B2 (en) 2015-10-01
US10552855B2 (en) 2020-02-04
US11562385B2 (en) 2023-01-24
JP2015512081A (ja) 2015-04-23
CA2862549A1 (en) 2013-08-01
CA2862549C (en) 2018-09-18
US20160086208A1 (en) 2016-03-24
US20230162216A1 (en) 2023-05-25
US20200250692A1 (en) 2020-08-06
US20130198125A1 (en) 2013-08-01

Similar Documents

Publication Publication Date Title
US11562385B2 (en) Systems, methods, and articles of manufacture to measure online audiences
US20210067823A1 (en) Systems and methods for web spike attribution
KR102193392B1 (ko) 데이터베이스 사업자에 의한 기인오류 및/또는 논-커버리지에 대해 노출 데이터를 보상하기 위한 방법 및 장치
CA3076114C (en) Methods and systems for creating a data-driven attribution model for assigning attribution credit to a plurality of events
US9965767B2 (en) Attribution of demographics to census data
CN104035926B (zh) 一种互联网信息的投放和系统
US20120143816A1 (en) Method and System of Information Matching in Electronic Commerce Website
US8504558B2 (en) Framework to evaluate content display policies
US9009298B2 (en) Methods and apparatus to determine audience engagement indices associated with media presentations
KR20140038970A (ko) 광고 지출에 관한 리턴을 갖는 다수의 속성 모델들
CA2757278A1 (en) Determining projection weights based on census data
CN104756504A (zh) 估计使用社交媒体的用户的人口统计数据的方法和设备
US20090259525A1 (en) Internet Probability Sampling
US8429266B2 (en) System for measuring audience of media on at least one internet communication network
US20170091811A1 (en) Systems, methods, and devices for customized data event attribution and bid determination
CN103853839A (zh) 一种评测广告页面恶意点击疑似度的方法及装置
US20160342699A1 (en) Systems, methods, and devices for profiling audience populations of websites
CN114756764A (zh) 基于企业的内容信息流推荐方法、装置、电子设备及存储介质
O’Donnell Is willingness to pay for non-consumptive wildlife watching falling? Evidence from three rounds of the national survey of fishing, hunting, and wildlife-associated recreation
JP2019526129A (ja) ユーザパネルを含むデジタルメディア測定用の装置及び方法
AU2013204255B9 (en) Systems, methods, and articles of manufacture to measure online audiences
Blumenstock et al. The price is right? statistical evaluation of a crowd-sourced market information system in liberia
Zumstein WEB ANALYTICS-Analysing, Classifying and Describing Web Metrics with Fuzzy Logic
Shen Forecasting online user activeness for behavioural targeting: the effect of data sampling
CN115794897A (zh) 行为数据处理方法及装置、存储介质及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171128

CF01 Termination of patent right due to non-payment of annual fee