CN113785595A - 对返回路径数据进行神经网络处理以估计住户成员和访问者人口统计 - Google Patents

对返回路径数据进行神经网络处理以估计住户成员和访问者人口统计 Download PDF

Info

Publication number
CN113785595A
CN113785595A CN202080032847.1A CN202080032847A CN113785595A CN 113785595 A CN113785595 A CN 113785595A CN 202080032847 A CN202080032847 A CN 202080032847A CN 113785595 A CN113785595 A CN 113785595A
Authority
CN
China
Prior art keywords
demographic
return path
visitors
path data
households
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080032847.1A
Other languages
English (en)
Inventor
T·哈灵顿
D·沃伊坚科
P·S·博加尔
P·奇门蒂
S·纳拉姆庞
B·尚卡
D·J·库尔泽尼斯基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nielsen Co US LLC
Original Assignee
Nielsen Co US LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US16/706,398 external-priority patent/US20200226465A1/en
Application filed by Nielsen Co US LLC filed Critical Nielsen Co US LLC
Publication of CN113785595A publication Critical patent/CN113785595A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25883Management of end-user data being end-user demographical data, e.g. age, family status or address
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/252Processing of multiple end-users' preferences to derive collaborative data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44218Detecting physical presence or behaviour of the user, e.g. using sensors to detect if the user is leaving the room or changes his face expression during a TV program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44222Analytics of user selections, e.g. selection of programs or purchase activity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6582Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Social Psychology (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Graphics (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本文公开的示例人口统计估计系统包括:特征生成器,其根据从与返回路径数据住户相关联的机顶盒报告的返回路径数据生成特征;神经网络,其对根据返回路径数据生成的特征进行处理,以预测针对该返回路径数据住户的人口统计分类概率,神经网络将基于从监测与小组成员住户相关联的媒体设备的计量器报告的小组数据来训练;人口统计指派引擎,其基于所预测的人口统计分类概率来向返回路径数据住户中的相应者指派一个或更多个人口统计类别;以及访问者指派引擎,其基于被指派给返回路径数据住户中的相应者的一个或更多个人口统计类别来向返回路径数据住户中的相应者的至少一子集指派虚拟访问者。

Description

对返回路径数据进行神经网络处理以估计住户成员和访问者 人口统计
相关申请
本专利源于2018年12月21日提交的题为“NEURAL NETWORK PROCESSING OFRETURN PATH DATA TO ESTIMATE HOUSEHOLD DEMOGRAPHICS”的美国专利申请序列号No.16/230,620的部分继续申请,该申请要求于2018年10月10日提交的题为“NEURALNETWORK PROCESSING OF SET-TOP BOX RETURN PATH DATA TO ESTIMATE HOUSEHOLDDEMOGRAPHICS”的美国临时申请序列号No.62/743,925的权益和优先权。本专利还要求于2019年5月1日提交的题为“NEURAL NETWORK PROCESSING OF RETURN PATH DATA TOESTIMATE HOUSEHOLD MEMBER AND VISITOR DEMOGRAPHICS”的美国临时申请序列号No.62/841,641的权益和优先权。要求美国专利申请序列号No.16/230,620、美国临时申请序列号No.62/743,925和美国临时申请序列号No.62/841,641的优先权。美国专利申请序列号No.16/230,620、美国临时申请序列号No.62/743,925和美国临时申请序列号No.62/841,641的相应全部内容在此通过引用并入本文。
技术领域
本公开总体上涉及神经网络,并且更具体地,涉及对返回路径数据进行神经网络处理,以估计住户成员和访问者人口统计。
背景技术
受众测量实体(AME)(诸如尼尔森公司(US),LLC)可以从相对小的小组家庭样本中外推总电视观看受众的收视率度量和/或其它受众测量数据。可以充分地研究小组家庭,并且通常选择小组家庭来作为整体表示受众总体(audience universe)。此外,为了帮助补充小组数据,AME(诸如尼尔森公司(US),LLC)可以与付费电视提供商公司达成协议,以获得从机顶盒和/或其它设备/软件获得的电视调谐信息(其在本文中以及在行业中称为返回路径数据)。
附图说明
图1是根据本公开的教导使用神经网络根据机顶盒返回路径数据估计人口统计分类概率的示例处理流程的框图。
图2是根据本公开的教导使用由图1的示例处理流程估计的人口统计分类概率来向住户指派人口统计的示例处理流程的框图。
图3是根据本公开的教导的示例基于神经网络的人口统计估计系统的框图,其被构造成实现图1和图2的处理流程以根据机顶盒返回路径数据来估计住户人口统计。
图4A至图4B例示了由被包括在图3的示例基于神经网络的人口统计估计系统中的示例特征生成器生成的示例特征。
图5是被包括在图3的示例基于神经网络的人口统计估计系统中的示例人口统计预测神经网络的示例实现方式的框图。
图6A至图6C例示了根据本公开的教导的图3的人口统计预测神经网络根据机顶盒返回路径数据来估计人口统计分类概率的示例操作。
图7例示了用于实现被包括在图3的示例基于神经网络的人口统计估计系统中的示例住户人口统计指派引擎的示例伪代码。
图8A至图8E例示了根据本公开的教导的图3的住户人口统计指派引擎向住户指派人口统计的示例操作。
图9A至图9C例示了可以由图3的住户人口统计指派引擎执行的示例模拟退火(simulated annealing)操作。
图10是根据本公开的教导的第二示例基于神经网络的人口统计估计系统的框图,其被构造成根据机顶盒返回路径数据来估计主要住户成员和长期访问者的住户人口统计。
图11是根据本公开的教导的被包括在图10的示例基于神经网络的人口统计估计系统中的示例访问者指派引擎的框图,该示例访问者指派引擎用于将虚拟访问者指派给返回路径数据住户。
图12是表示可以被执行以实现图3的基于神经网络的人口统计估计系统的示例计算机可读指令的流程图。
图13是表示可以被执行以实现图10的第二基于神经网络的人口统计估计系统的示例计算机可读指令的流程图。
图14至图15是表示可以被执行以实现被包括在图10的基于神经网络的人口统计估计系统中的示例人口统计目标调节器的示例计算机可读指令的流程图。
图16至图18是表示可以被执行以实现图10的访问者指派引擎的示例计算机可读指令的流程图。
图19是表示可以被执行以在将一个访问者指派给给定住户的约束下实现图11的访问者矢量指派器的示例计算机可读指令的流程图。
图20是被构造成执行图12的示例机器可读指令以实现图3的示例基于神经网络的人口统计估计系统的示例处理器平台的框图。
图21是被构造成执行图13、图14、图15、图16、图17、图18和/或图19的示例机器可读指令以实现图10的示例基于神经网络的人口统计估计系统的示例处理器平台的框图。
附图未按比例绘制。通常,在整个附图和随附的书面描述中将使用相同的附图标记来指代相同或相似的部分、要素等。
具体实施方式
描述用语“第一”、“第二”、“第三”等在本文中在标识可以单独指代的多个要素或部件时使用。除非基于其使用的上下文另外指定或理解,否则这种描述用语并不旨在在时间上暗示优先级或排序的任何含义,而仅仅是为了便于理解所公开的示例而作为用于单独指代多个要素或部件的标签。在一些示例中,描述用语“第一”可以用于指代详细描述中的要素,而同一要素可以在权利要求中用不同描述用语(诸如“第二”或“第三”)来指代。在这种情况下,应理解,使用这种描述用语仅仅是为了便于指代多个要素或部件。
本文公开了实现返回路径数据的神经网络处理以估计住户人口统计的示例方法、装置、系统和制品(例如,物理存储介质)。本文公开的这种人口统计估计系统的示例包括特征生成器,该特征生成器根据从与返回路径数据住户相关联的机顶盒报告的返回路径数据生成特征。本文公开的示例人口统计估计系统还包括神经网络,该神经网络对根据返回路径数据生成的特征进行处理,以预测针对返回路径数据住户的人口统计分类概率。本文公开的示例人口统计估计系统还包括人口统计指派引擎,该人口统计指派引擎基于所预测的人口统计分类概率来向返回路径数据住户中的相应返回路径数据住户指派一个或更多个人口统计类别。
以下更详细地公开了实现返回路径数据的神经网络处理以估计住户人口统计的这些和其它示例方法、装置、系统和制品(例如,物理存储介质)。
如上所述,AME从相对小的小组成员住户(本文中也称为小组家庭)样本中外推总电视观看受众的收视率度量和/或其它受众测量数据。可以充分地研究小组家庭,并且通常选择小组家庭来作为整体表示受众总体。然而,在小样本小组家庭的情况下准确地表示总受众群体中存在的地理分布和人口统计多样性仍然是一个挑战。结合与针对总受众群体的媒体曝光有关的附加信息流可以填补任何统计样本固有的差距或偏差。
为了帮助补充小组数据,AME(诸如尼尔森公司(US),LLC)可以与付费电视提供商公司达成协议,以获得从机顶盒获得的电视调谐信息(其在本文中以及在行业中称为返回路径数据(RPD))。机顶盒(STB)数据包括由机顶盒收集的所有数据。例如,STB数据可以包括由STB接收的调谐事件和/或命令(例如,通电、断电、改变频道、改变输入源、开始呈现媒体、暂停媒体的呈现、记录媒体的呈现、音量增大/减小等)。另外地或另选地,STB数据可以包括由STB发送至内容提供商的命令(例如,切换输入源、记录媒体呈现、删除所记录的媒体呈现、媒体呈现开始的时间/日期、媒体呈现完成的时间等)、心跳信号等。另外地或另选地,机顶盒数据可以包括住户标识(例如,住户ID)和/或STB标识(例如,STB ID)。
返回路径数据包括能够在媒体服务提供商(例如,诸如有线电视服务提供商、卫星电视服务提供商、流传输媒体服务提供商、内容提供商等)处经由从媒体消费者站点到服务提供商的返回路径接收的任何数据。这样,返回路径数据包括机顶盒数据中的至少一部分机顶盒数据。返回路径数据可以另外地或另选地包括来自具有网络访问能力(例如,经由蜂窝网络、互联网、其它公共或私有网络等)的任何其它消费者设备的数据。例如,返回路径数据可以包括来自STB的任何或所有线性实时数据、来自引导服务器的引导用户数据、点击流数据、密钥流数据(例如,针对远程-音量、静音等的任何点击)、交互活动(诸如视频点播)和任何其它数据(例如,来自中间件的数据)。RPD数据可以另外地或另选地来自网络(例如,经由交换数字软件)和/或来自云的任何基于云的数据(诸如远程服务器DVR)。
RPD可以提供对与较大受众群体部分相关联的媒体曝光的洞察。这是因为RPD通常为比被包括在AME小组家庭中的住户数量大得多的住户提供丰富的电视观看信息流。然而,与充分研究的AME小组家庭不同,付费电视订户的人口统计细节通常是未知的。RPD中缺乏人口统计细节会导致技术问题,从而妨碍或至少限制有效使用RPD来补充AME小组数据的能力,因为监测各种受众人口统计的行为简况需要知道提供RPD的订户家庭的人口统计组成。
如本文所公开的对机顶盒RPD进行神经网络处理以估计住户人口统计提供了针对将RPD与用于受众测量的小组数据组合的技术问题的技术解决方案。如以下更详细地公开的,根据本公开的教导实现的示例基于神经网络的人口统计估计系统使用从被监测的AME小组家庭收集的小组数据作为如下训练集,该训练集用于训练神经网络(例如,递归神经网络),以能够根据描述历史电视调谐行为的RPD调谐数据预测不同住户人口统计特性与报告RPD数据的RPD住户中的相应RPD住户相关联的概率。所公开的示例基于神经网络的人口统计估计系统预测然后使用不同住户人口统计特性的预测概率来向住户指派人口统计组成。以该方式,示例基于神经网络的人口统计估计系统将人口统计组成指派给提供RPD的订户家庭,从而允许RPD与驱动AME受众测量系统的小组数据组合或以其它方式增强该小组数据。这种示例基于神经网络的人口统计估计系统也称为实现示例住户人口统计指派模型(HDAM),其向住户指派人口统计组成。
在一些所公开的示例中,由基于神经网络的人口统计估计系统实现的HDAM基于电视观看数据来预测住户级别人口统计指派,但是预测主要住户成员而不是长期访问者的住户级别人口统计。如本文所使用的,长期访问者是不止一次地和/或在延长的时间段内(诸如每两周至少一次)访问家庭或在日历年中在家庭中待至少一个月的人。长期访问者在别处具有主要住所,其不是住户成员,并且通常在其至少一部分访问或延长停留期间在家庭中观看和/或收听电视。然而,考虑到诸如改进住户依从性的因素,可以使用其它准则来将个体分类为长期访问者。本文公开的一些示例对HDAM模型进行了修改,以预测人口统计,长期访问者同时与从由AME通过监测其小组成员而获得的小组数据(诸如由尼尔森公司(US),LLC生成的尼尔森人监测(NPM)小组数据)获得的长期访问者分布一致。
在本文公开的一些示例中,对HDAM模型进行修改以预测长期访问者的人口统计使用了能够从AME小组数据获得的长期访问者数据。使用该小组数据,可以确定作为长期访问者的各个年龄-性别区(age-gender bucket)中的总人数的百分比。对各个年龄-性别区中的总人数进行了估计,可以基于小组访问者百分比来对这些估计的总数进行修改,以包括访问者。通过修改应用于HDAM模型的群体目标,可以修改HDAM模型,以预测包含长期访问者和主要住户成员的住户组成。
本文公开的示例对长期访问者和主要住户成员进行了区分。在一些示例中,从AME小组数据得知预期的总水平长期访问者群体和年龄-性别分布。HDAM模型的输出可以认为是包含各种人口统计类别(例如,年龄-性别区)中的每一者中的长期访问者和主要住户成员的总数的矢量。在已知各个人口统计类别(例如,各个年龄-性别组)中的长期访问者的百分比的情况下,可以将长期访问者的群体指派给家庭,以满足跨人口统计类别的预期分布。在本文公开的示例中,创建满足小组通知一致性要求的访问者矢量的集合。在创建访问者矢量之后,确定可以放置这些访问者矢量的家庭。例如,确定可以被指派各个访问者矢量的可能(候选)家庭的集合(根据HDAM预测)。使用个体家庭中的相应个体家庭具有长期访问者的概率,访问者矢量被放置在家庭中,从而优先考虑更可能具有长期访问者的家庭。本文公开的示例产生针对预测家庭的长期访问者指派,该长期访问者指派自动满足小组通知一致性要求,而不破坏/影响针对主要住户成员的HDAM预测。因此,主要住户成员指派和长期访问者指派可以通过本文公开的示例来实现。
转向附图,图1例示了根据本公开的教导使用神经网络根据机顶盒RPD估计人口统计分类概率的示例处理流程100的框图。示例处理流程100包括示例数据收集阶段105、示例特征生成阶段110和示例神经网络人口统计概率预测阶段115。示例处理流程100还被划分为示例神经网络训练分支120和示例神经网络应用分支125。
在神经网络训练分支120的数据收集阶段105中,从监测由AME招募的小组家庭中的媒体曝光的计量器收集示例小组成员调谐数据130。小组成员调谐数据130可以包括能够由计量器收集的任何数据,诸如但不限于标识由小组家庭中的媒体设备呈现的媒体的数据、标识小组家庭中的小组成员的特性的人口统计数据等。在神经网络训练分支120的特征生成阶段110中,根据所收集的小组成员调谐数据130生成示例性特征135,并将其布置为形成特征矢量,如下文进一步详细描述的。在神经网络训练分支120的神经网络人口统计概率预测阶段115中,对神经网络140进行训练,以通过根据所收集的小组成员调谐数据130生成的特征135来预测不同住户人口统计特性与不同小组家庭相关联的概率,如下文进一步详细描述的。
在神经网络应用分支125的数据收集阶段105中,从一个或更多个付费电视提供商(例如,有线电视服务提供商、卫星电视服务提供商、流传输媒体服务提供商、内容提供商等)的机顶盒收集示例RPD调谐数据145。机顶盒还可以指可以供收集RPD调谐数据145的任何解码器、接收器、集成接收器-解码器(IRD)、媒体设备等。在神经网络应用分支125的特征生成阶段110中,根据所收集的RPD调谐数据145生成示例特征150,并将其设置为形成特征矢量,如下文进一步详细描述的。在神经网络应用分支125的神经网络人口统计概率预测阶段115中,将经训练的神经网络155应用于根据所收集的RPD调谐数据145生成的特征150,以预测不同住户人口统计特性与报告RPD调谐数据145的不同RPD订户住户相关联的示例估计概率160,如下文进一步详细描述的。
图2例示了根据本公开的教导使用由图1的示例处理流程100预测的估计人口统计分类概率160来向住户指派人口统计的示例处理流程200的框图。如下文进一步详细公开的,处理流程200利用示例混合整数编程解决方案205,其基于由示例处理流程100预测的估计人口统计分类概率160来求解约束优化问题,以向提供RPD调谐数据145的订户家庭指派示例估计人口统计组成210。
图3例示了根据本公开的教导的示例基于神经网络的人口统计估计系统300的框图,其被构造成分别实现图1的处理流程100和图2的处理流程200,以根据机顶盒RPD估计主要住户成员的住户人口统计。示例基于神经网络的人口统计估计系统300包括示例网络接口305、示例小组调谐数据收集器310、示例小组成员数据库315、示例RPD数据收集器320、示例RPD数据库325、示例特征生成器330、示例人口统计预测神经网络335、示例住户人口统计指派引擎340、示例约束数据库345和示例收视率计算器350。
在所示示例中,小组调谐数据收集器310经由与一个或更多个示例网络355进行通信的网络接口305从监测与AME所招募的小组家庭中的示例媒体设备365A-365B(例如,电视、收音机、计算机、平板设备、智能电话等)相关联的媒体曝光的示例计量器360A-306B收集小组成员调谐数据130。小组调谐数据收集器310将所收集的小组成员调谐数据130存储在小组成员数据库315中。在所示示例中,RPD数据收集器320经由与一个或更多个网络355进行通信的网络接口305从一个或更多个示例服务提供商370收集RPD调谐数据145,所述一个或更多个示例服务提供商从订户住户中的示例个体STB 375收集RPD调谐数据145。另外地或另选地,在一些示例中,RPD数据收集器320直接经由与一个或更多个网络355进行通信的网络接口305从订户住户中的个体STB 375中的一者或更多者收集RPD调谐数据145。RPD数据收集器320将所收集的RPD调谐数据145存储在RPD数据库325中。
所示示例的特征生成器330生成由示例人口统计预测神经网络335使用的特征和特征矢量。在一些示例中,RPD调谐数据包括相应机顶盒何时被调谐到不同台的顺序日志。个人(例如,受众成员)在连续的电视观看会话的过程中在多个网络之间进行转换,并且该活动模式可以提供除孤立的调谐记录之外的与住户有关的附加信息。为了捕获该行为,特征生成器330将电视调谐的STB记录编译成“观看块”,该观看块将一个或更多个未知观看者的观看行为汇总成概括各个连续观看会话的固定数量的特征。在一些示例中,观看块持续时间被覆盖在1小时或一些其它持续时间,以考虑多个观看者可以控制电视而不必在会话之间关闭电视的情况。在所示示例中,各个观看块包含F个特征,所述F个特征记录与观看块的开始时间、频道点击率、观看会话的持续时间和在会话期间访问的电视台的列表有关的信息。
图4A至图4B例示了特征生成器330将来自RPD调谐数据145的示例RPD调谐数据记录405组合到对应示例观看块410和415中的示例操作。在图4A的所示示例中,数据记录405中的相应数据记录405记录由STB 375报告的调谐事件。给定数据记录405指定STB标识符(STB ID)420、开始时间425和结束时间430、源标识符(SID)435和广播时间440,该STB标识符(STB ID)420标识对应于事件日志的STB,该开始时间425和结束时间430分别对应于由事件日志表示的调谐事件,该源标识符(SID)435标识与调谐事件相关联的媒体源(例如,频道编号、台标识符等),该广播时间440标识何时最初播放与调谐事件相关联的媒体(例如,以在直播调谐事件和时移调谐事件之间进行区分)。在图4B的所示示例中,观看块410对记录在给定住户的数据记录405中并且在2016年11月5日上午8:23开始的小时间隔中发生的调谐事件进行汇总。在图4B的所示示例中,观看块415对记录在给定住户的数据记录405中并且在2016年11月6日下午6:04开始的小时间隔中发生的调谐事件进行汇总。
所示示例的特征生成器330按照住户对观看块进行分组,并且将一组N个观看块组成二维(N×F)矩阵,该二维矩阵包含在给定观察时段内由住户生成的观看块的记录。在一些示例中,特征生成器330将包括电视调谐器的数量和所观看的电视量的相关住户级别特征与观看块数据汇总成针对各个住户的H维(1×H)附加特征矢量。
在一些示例中,各个观看块是描述了对应电视观看会话的(1×173)特征矢量。这样,针对该示例,对应(N×F)矩阵的F维是173。表1例示了表示为(1×173)特征矢量的示例观看块的内容。
索引 简短描述 有效范围
0 星期几 0-6
1 年日 0-364
2 一天的四分之一小时 0-95
3 频道变化率 0-无穷
4-173 观看各个网络的分钟 0-60
表1
表1中的前三个特征是不言自明的。表1的“频道变化率”特征是在观看块期间频道改变的次数与以分钟为单位的观看块的持续时间的比。“观看各个网络的分钟”特征是观看各个电视台的总分钟数。在表1的示例中,观看块被覆盖在60分钟的持续时间,因此,这些特征在所有网络上的总和将≤=60.0分钟。在一些这样的示例中,观看会话由此可以与一个或更多个观看块相关联。在表1的示例中,各个台被随机指派介于4至173之间的索引值。
在一些示例中,包含少于5分钟的电视观看行为的观看块(来自小组住户)不用于训练人口统计预测神经网络335。然后将各个住户(例如,用于神经网络训练的小组住户和用于神经网络应用的RPD住户)的观看块堆叠成具有例如400行(例如,N=400)的二维矩阵。在一些示例中,生成少于400个唯一观看块的住户被特征生成器330填充零,直到它们具有400行为止,而具有大于400的住户被特征生成器330截断至前400行。特征生成器330然后对来自各个住户的二维阵列进行堆叠,以形成可以被馈送到人口统计预测神经网络335中的三维矩阵。
在一些示例中,特征生成器330利用被合并到递归层之后的人口统计预测神经网络335中的三个住户级别特征H来扩充观看数据,如下所述。表2例示了三个住户级别特征H的示例集合,所述三个住户级别特征H对应于:(i)跨由观看块覆盖的不同持续时间(例如,24小时时段)针对给定住户报告的调谐总量(对应于表中的索引0),(ii)跨不同持续时间针对给定住户报告的观看块的数量(对应于表中的索引1),以及(iii)被包括在返回路径数据住户中的第一个返回路径数据住户中的调谐器的总数(对应于表中的索引2)。
索引 简短描述 有效范围
0 总电视消费(分钟) 1-无穷
1 所记录的观看块的数量 1-无穷
2 室内电视调谐器的数量 1-无穷
表2
在所示示例中,人口统计预测神经网络335被构造为对表示住户中存在不同住户级别人口统计的概率的20个变量(例如,1×20矢量)进行预测(尽管在人口统计预测神经网络335的其它示例实现方式中可以另外地或另选地对表示其它人口统计的其它数量的变量进行预测)。在所示示例中,由人口统计预测神经网络335预测的14个住户人口统计目标变量指示住户中存在14个不同年龄性别组合(其示例在表3中表示)的相应概率(例如,可能性)。
Figure BDA0003331741850000101
Figure BDA0003331741850000111
表3
除了表3的存在变量之外,在一些示例中,人口统计预测神经网络335对描述了户主(HOH)的人口统计简况的六个附加目标变量(其示例在表4中表示)进行预测。
索引 HOH特性
14 HOH年龄
15 HOH性别
16 西班牙裔
17 欧裔美国人
18 非裔美国人
19 亚裔美国人
表4
图5例示了图3的人口统计预测神经网络335的示例实现方式。在一些示例中,针对正被处理的住户(例如,小组和/或RPD住户)中的相应住户生成的二维(N×F)特征矢量(例如,400×173特征矢量)通常是稀疏的(例如,在特征矢量中表示的许多广播网络在给定观看块期间从不被访问)。为了将该输入压缩成更小的特征子集,人口统计预测神经网络335包括示例时间分布密集层(TDDL)505,其学习将各个观看块映射至输入的压缩表示(N×F’,其中F’<<F)的权重的单个集合。然后将该压缩数据馈送到示例长短期记忆(LSTM)递归神经网络层510。LSTM 510按顺序检查观看块矩阵中的每一行,并使用该信息来选择性地更新对来自各个观看会话/观看块的信息进行编码的单个内部状态矢量。LSTM 510的输出是一维(1×F’)特征矢量,其概括了对于各个住户观察到的证据的历史。图5的示例人口统计预测神经网络335包括示例合并层515,其将附加(1×H)住户级别特征与从LSTM 510输出的观看数据的一维表示合并(连接)。附加(1×H)住户级别特征包括与住户中设备的总数、在观察窗中观看的总分钟以及在观察窗中针对特定住户记录的观看块的总数有关的细节,如上所述。
在图5的示例人口统计预测神经网络335中,从合并层515输出的扩充特征矢量在作为(1×C)概率矢量从示例输出层525输出之前被传递至一个或更多个附加示例隐藏层520,该(1×C)概率矢量表示C个可能人口统计类别存在于住户中的相应预测概率。由人口统计预测神经网络335建模的C个人口统计类不必是互斥的(例如,住户可以包含不同年龄/性别的多个人),因此输出矢量对各个建模住户级别人口统计存在于未知住户中的相对概率进行编码。
表5列出了图5的示例人口统计预测神经网络335的各个阶段处的数据的示例维度。在表5中,N是每住户的观看块的总数,F是各个观看块中的特征的数量,F’是由TDDL 505生成的密集特征的数量,并且H是附加住户特定特征的数量。
维度 节点的数量
H 3
N 400
F 173
F’ 30
C 20
表5
在一些示例中,为了防止人口统计预测神经网络335过拟合,并使其能够更好地一般化,特征生成器330在各个训练时期期间将馈送到人口统计预测神经网络335中的块的顺序置乱。
图6A至图6C例示了如下示例操作:在人口统计预测神经网络335已利用根据小组成员数据130生成的特征矢量训练之后,将根据RPD调谐数据145生成的特征矢量625、630和635应用于人口统计预测神经网络335时,人口统计预测神经网络335预测人口统计目标变量605、610、615和620。在所示示例中,人口统计预测神经网络335通过以下操作来训练:(i)根据针对小组成员住户报告的小组成员调谐数据130创建观看块,(ii)如上所述,根据针对小组成员住户中的相应小组成员住户创建的观看块生成相应小组成员住户的特征,以及(iii)根据对神经网络的内部参数进行调节以减小由神经网络335输出的预测人口统计分类概率160与针对小组成员住户已知的实际人口统计之间的误差的任何训练过程,将小组成员住户中的相应小组成员住户的特征应用于神经网络335。如图6A至图6C的示例中所示,当应用更多的观看块来训练神经网络335时,网络335的输出将趋于预测与针对小组成员住户已知的实际人口统计一致的人口统计分类概率160。
回到图3,示例基于神经网络的人口统计估计系统300的示例住户人口统计指派引擎340根据本公开的教导使用从人口统计预测神经网络335输出的估计人口统计分类概率(上文也称为预测人口统计目标变量)来向RPD住户指派人口统计。图7例示了用于实现住户人口统计指派引擎340的示例伪代码700。示例伪代码700还对应于图2的混合整数编程解决方案205的示例。在图7的所示示例中,实现住户人口统计指派引擎340的伪代码700通过求解目标函数以确定矩阵x0(该矩阵是布尔矩阵,该布尔矩阵表示人口统计类别被指派给不同RPD住户)来向住户指派人口统计,给定了成本矩阵C0(该成本矩阵C0表示将不同人口统计类别指派给RPD住户的成本),服从具有被存储在示例约束数据库345中的值的约束的集合。在图7的示例中,矩阵x0是行数等于RPD住户的数量并且列数等于可以被指派给住户的不同可能人口统计类别的数量的矩阵。此外,在所示示例中,针对表示给定RPD住户的x0的给定行,该行的要素包含表示不同可能人口统计类别的二进制(布尔)变量,如果给定可能人口统计类别被指派给该RPD住户,则表示该人口统计类别的给定二进制变量被伪代码700指派值1,或者如果该人口统计类别未被指派给该RPD住户,则被伪代码700指派值0。在图7的示例中,矩阵C0也是行数等于RPD住户的数量并且列数等于可以被指派给住户的不同可能人口统计类别的数量的矩阵。此外,在所示示例中,针对表示给定RPD住户的C0的给定行,该行的要素包含表示向给定RPD住户指派不同可能人口统计类别的相应成本的成本变量。在一些示例中,C0中的成本变量由住户人口统计指派引擎340基于从人口统计预测神经网络335输出的估计人口统计分类概率(上文也称为预测人口统计目标变量)来确定。例如,向给定RPD住户指派给定可能人口统计类别的成本变量可以由住户人口统计指派引擎340确定为如由人口统计预测神经网络335确定的针对该人口统计类别和RPD住户的人口统计分类概率的倒数(或某种其它函数)。
如图7的示例所示,伪代码700采用任何混合整数编程或类似技术通过求解服从约束的集合的目标函数来确定人口统计指派矩阵x0:
Figure BDA0003331741850000131
图7的示例约束基于矩阵x1和大小矩阵S1,矩阵x1是表示可以被指派给不同RPD住户的不同可能住户大小的布尔矩阵,大小矩阵S1表示不同可能住户大小的值。
图8A至图8E例示了由图7的伪代码700实现的住户人口统计指派引擎340通过求解服从图7的示例约束的上述表达式来向RPD住户指派人口统计类别的示例操作。图8A例示了具有5行和4列的示例C0成本矩阵805,5行表示将被指派人口统计类别的5个RPD住户,4列表示可以被指派给RPD住户中的相应RPD住户的4个可能人口统计类别。不同可能人口统计类别的成本值在图8A中由美元符号($)表示,更多的美元符号表示更高的成本。在所示示例中,针对给定住户和人口统计类别组合,被包括在C0成本矩阵805中的成本与从人口统计预测神经网络335的输出层525输出的对应估计人口统计分类概率(上文也称为预测人口统计目标变量)成反比。
参考图7和图8A至图8E,图7的示例约束包括第一约束705,其指定被指派给所有RPD住户的不同人口统计类别的总和将等于针对相应不同人口统计类别的已知总体估计(universe estimate)(UE)(例如,在由变量“slack”表示的容限水平内)。第一约束705的示例在图8B中例示,其中在5个住户中指派的相应人口统计类别的总和将等于针对不同人口统计类别的相应示例UE 810(例如,其可以从提供RPD的服务提供商获得并存储在约束数据库345中)。例如,在图8B中,第一约束705指定将被指派“男士”的人口统计类别的住户的数量将等于针对该人口统计类别为2的UE,将被指派“女士”的人口统计类别的住户的数量将等于针对该人口统计类别为4的UE,将被指派“女孩”的人口统计类别的住户的数量将等于针对该人口统计类别为3的UE,以及将被指派“男士”的人口统计类别的住户的数量将等于针对该人口统计类别为2的UE。
图7的示例约束包括第二约束710,其指定必须有至少一个成人人口统计类别被指派给各个RPD住户。第二约束710的示例在图8B中例示,其中各个RPD住户被约束为包括“男士”的人口统计类别和/或“女士”的人口统计类别(其由附图标记815表示)。
图7的示例约束包括第三约束715,其指定被指派给所有RPD住户的不同可能住户大小的总和将等于针对不同可能住户大小的已知总体估计(UE)(例如,在由变量“slack”表示的容限水平内)。第三约束715的示例在图8D中例示,其中在5个住户中指派的相应可能住户大小的数量将等于针对不同可能住户大小的相应示例UE820(例如,其可以从提供RPD的服务提供商获得并存储在约束数据库345中)。例如,在图8D中,第三约束715指定包含两个人的住户的数量将等于针对该住户大小为3的UE,包含三个人的住户的数量将等于针对该住户大小为1的UE,以及包含四个人的住户的数量将等于针对该住户大小为1的UE。
图7的示例约束包括第四约束720和第五约束725,第四约束720指定各个RPD住户将仅被指派可能住户大小中的一者,第五约束725指定被指派给给定RPD住户的不同人口统计类别的数量将等于被指派给该住户的住户大小。图8E例示了由利用图7的伪代码700实现的住户人口统计指派引擎340确定的并在给定如图8A至图8D所示的示例约束705-725的情况下的所得示例人口统计类别指派825。在图8E的示例中,利用伪代码700实现的住户人口统计指派引擎340对服从前述约束的上文(以及在图7中)提供的表达式进行求解来:(1)向第一RPD住户指派“女士”和“男孩”的人口统计类别,(2)向第二RPD住户指派“女士”和“男孩”的人口统计类别,(3)向第三RPD住户指派“男士”和“女孩”的人口统计类别,(4)向第四RPD住户指派“女士”、“女孩”和“男孩”的人口统计类别,以及(5)向第五RPD住户指派“男士”、“女士”、“女孩”和“男孩”的人口统计类别。如可以在图8A至图8E的示例中看到的,人口统计类别指派825满足指定约束。
在一些示例中,住户人口统计指派引擎340实现模拟退火以进一步调节针对RPD住户做出的人口统计类别指派。图9A至图9C例示了住户人口统计指派引擎340执行模拟退火的示例操作。转到图9A,在所示示例中,住户人口统计指派引擎340已执行了初始住户人口统计指派,其中相对于五个住户的针对人口统计类别的如下组合的UE约束,包含“男孩”和“女孩”的人口统计类别指派是过多代表的,并且相对于五个住户的针对人口统计类别的如下组合的UE约束,包含“男士”和“女孩”的人口统计类别指派是不足代表的。如图9B至图9C所示,住户人口统计指派引擎340可以执行模拟退火,以识别包含“男孩”和“女孩”的过多代表的人口统计类别指派的五个家庭(参见图9B),并将“女孩”的人口统计类别指派从那些住户转移到不具有“男士”和“女孩”的人口统计类别指派的五个住户(参见图9C)。结果是经修正的人口统计类别指派,其校正了图9A所示的过多代表和不足代表。
在一些示例中,住户人口统计指派引擎340将图7所示的人口统计指派问题分成若干较小批次,以减少处理和存储器需求。例如,如果市场包含将被指派人口统计类别的100000个RPD住户,则住户人口统计指派引擎340可以将指派问题分成100组,每组1000个家庭,或1000组,每组100个家庭等。在这样的示例中,调节图7的伪代码700,使得与总体估计(UE)相关的约束按照被包括在成批组中的RPD住户的数量与RPD住户的总数的比率按比例缩小,并且伪代码700被应用于执行针对各个成批组的人口统计类别指派。然而,因为这种简单的缩放可能不会对所有成批组产生可求解约束,所以包括容限水平(例如,由图7中的“slack”表示)以提高各个成批组将具有可求解的人口统计指派的可能性。
回到图3,基于神经网络的人口统计估计系统300包括收视率计算器350,该收视率计算器通过使用由住户人口统计指派引擎340针对RPD住户确定的住户人口统计指派将来自小组成员数据库315的已经具有相关联的人口统计数据的小组调谐数据与来自RPD数据库325的RPD调谐数据进行扩充/组合来确定收视率数据和/或其它受众度量。
上文结合图3、图4A至图4B、图5、图6A至图6C、图7、图8A至图8E和图9A至图9C公开的示例实现了机顶盒返回路径数据的神经网络处理,以向RPD住户指派一个或更多个人口统计类别。换言之,这种公开的示例向住户指派人口统计存在,以满足相应人口统计类别的已知或估计UE(例如,来自小组数据和/或其它受众测量技术)。上文公开的一些示例还将被指派给RPD住户的人口统计存在类别与RPD住户所关联的个体住户成员的数量的已知或估计UE(例如,来自小组数据和/或其它受众测量技术)进行组合,以将个体住户成员(例如,虚拟住户成员)指派给RPD住户中的相应RPD住户,从而满足UE目标。
本文公开的另外的示例将长期访问者(例如,虚拟长期访问者)以及住户成员(也称为主要住户成员,例如,住户是住所的虚拟成员)指派给RPD住户,以满足被指派给住户的人口统计存在类别以及与RPD住户相关联的长期访问者的数量的已知或估计UE(例如,来自小组数据和/或其它受众测量技术)。高水平地,一些这样的公开的访问者指派技术修改了由上文公开的示例人口统计类别指派技术使用的目标(例如,UE),以将访问者并入所使用的不同人口统计类别中的人数的计数中。通过修改输入目标,上文公开的示例人口统计类别指派技术(也称为住户人口统计指派模型(HDAM)技术)能够预测包括(但在这一点上不区分)住户成员和长期访问者的总住户组成。所公开的示例访问者指派技术还包括创建符合所提供的访问者分布目标(例如,来自小组数据和/或其它受众测量技术)的访问者矢量,然后将访问者矢量指派给具有能够支持相应访问者矢量的大小和人口统计组成的预测总住户组成的RPD住户。
图10例示了根据本公开的教导的示例基于神经网络的人口统计估计系统的框图,其被构造成实现图1和图2的处理流程以根据机顶盒返回路径数据来估计主要住户成员和长期访问者的住户人口统计。示例基于神经网络的人口统计估计系统1000包括来自示例基于神经网络的人口统计估计系统300的示例网络接口305、示例小组调谐数据收集器310、示例小组成员数据库315、示例RPD数据收集器320、示例RPD数据库325、示例特征生成器330、示例人口统计预测神经网络335、示例住户人口统计指派引擎340、示例约束数据库345以及示例收视率计算器350,上文结合图3对所述项进行了更详细的描述。示例基于神经网络的人口统计估计系统1000还包括示例人口统计目标调节器1050和示例访问者指派引擎1055。
在图10的所示示例中,人口统计目标调节器1050调节UE人口统计目标,以考虑长期访问者数据。如上文结合基于神经网络的人口统计估计系统300所公开的,基于神经网络的人口统计估计系统300的HDAM技术利用相应不同人口统计类别的UE(也称为人口统计存在UE),其指定将被指派不同人口统计类别中的相应不同人口统计类别的RPD住户的总数。在一些示例中,基于以下项来确定人口统计存在UE:(i)RPD住户成员数量的总目标UE(例如,根据小组数据、提供商数据和/或其它受众测量技术来确定或估计),以及(ii)人口统计分布数据(例如,来自小组数据,诸如尼尔森人监测(NPM)数据),其用于确定各个人口统计类别中的RPD住户成员的总数的UE。各个人口统计类别中的RPD住户成员总数的UE然后与从小组数据(例如,NPM数据)获得的人口统计存在UE一起使用,以确定用于HDAM技术的人口统计存在UE。然而,这种未经修改的UE目标没有考虑长期访问者的存在。但是,小组数据(例如,NPM数据)可以提供与那些标记长期访问者的人口统计(例如,年龄和性别)有关的信息。示例人口统计目标调节器1050使用该信息来计算包括称为比例因子的要素的比例矢量,以应用于不同人口统计类别中的RPD住户成员的数量的UE。各个比例因子对应于相应人口统计类别(例如,年龄-性别区)。使用下标i来表示第i人口统计类别,基于作为长期访问者的人口统计类别(例如,年龄-性别区)i中的总人的分数来确定比例矢量的比例因子,这可以在下面的式1中看到。
fi=Nv,i/(Np,i+Nv,i) (式1)
在上式1中,NV,i是人口统计类别(例如,年龄-性别区)i(例如,从小组/NPM数据获得)中的访问者的数量,并且NP,i是人口统计类别(例如,年龄-性别区)i(例如,从小组/NPM数据获得)中的主要住户成员的数量。发现人口统计类别i的比例因子为:
Si=1-fi=Np,i/(Np,i+Nv,i) (式2)。
如上文结合基于神经网络的人口统计估计系统300所描述的,示例人口统计目标调节器1050使用上式2中的比例因子Si来调节(例如,划分)人口统计类别i中的RPD住户成员的总数的UE,其被用作用于HDAM技术的人口统计类别i的人口统计存在UE。以这种方式,示例人口统计目标调节器1050调节由HDAM技术使用的存在UE,以考虑长期访问者的存在。
在一些示例中,人口统计目标调节器1050可以使用目标率而不是上述比例因子来调节人口统计目标。在一些这样的示例中,假设在基于神经网络的人口统计估计系统300的技术中公开的HDAM技术已被进一步修改,以基于被指派给RPD住户的人口统计类别(例如,人口统计存在)来将个体住户成员指派给RPD住户,如上所述。人口统计目标调节器1050确定不同人口统计类别中不同人数的目标出现率(例如,如根据小组数据和/或其它受众测量技术所确定的)。可以进一步修改上文公开的示例HDAM技术,以按照由示例人口统计目标调节器1050找到的目标率来缩放被指派给RPD住户的人口统计类别(例如,人口统计存在),从而根据这些目标将个体成员指派给RPD住户。例如,如果第一人口统计类别的目标出现率是住户中的一个人将在该类别中是80%,住户中的两个人将在该同一类别中是15%,并且住户中的三个人将在该类别中是5%,则经修改的HDAM技术可以选择已被指派第一人口统计类别的RPD住户,该第一人口统计类别使得这些住户中的80%将在该类别中被指派一个个体,这些住户中的15%将在该类别中被指派两个个体,并且这些家庭中的5%将在该类别中被指派三个个体。
图10的所示示例的访问者指派引擎1055用于将基于经更新的UE目标被指派给RPD住户的总住户组成中访问者与主要住户成员区分开。在一些示例中,目标汇总级别访问者群体和人口统计(例如,年龄-性别)分布是从小组成员数据库315中的小组数据获得的。针对给定RPD住户,示例访问者指派引擎1055接收住户人口统计指派引擎340的输出以及来自示例人口统计目标调节器1050的经更新的UE目标,该输出可以被认为是包含针对各个可能人口统计类别指派给RPD住户的访问者和主要住户成员的总数的矢量。示例访问者指派引擎1055构建具有用于向RPD住户进行指派的目标人口统计的访问者的目标群体。下文结合图11更详细地讨论示例访问者指派引擎1055。
图11是来自图10的示例基于神经网络的人口统计估计系统的示例访问者指派引擎1050的框图。示例访问者指派引擎1050包括示例访问者人口统计分布计算器1105、示例访问者住户分布计算器1110、示例访问者矢量生成器1120和示例访问者矢量指派器1125。
在图11的所示示例中,访问者矢量生成器1120生成满足访问者人口统计目标集合的访问者矢量集合。在本文公开的示例中,示例访问者矢量生成器1120迭代地生成表示将被指派给RPD住户的访问者人口统计组成的访问者矢量。示例访问者矢量生成器1120基于输入来生成访问者矢量,所述输入包括各个人口统计类别中的长期访问者的百分比以及具有相应不同可能访问者数量的家庭的百分比。在图11的所示示例中,访问者人口统计分布计算器1105基于来自小组成员数据库315的小组数据来确定一个或更多个人口统计类别中的一些人口统计类别中的长期访问者的相应百分比。图11的所示示例的访问者住户分布计算器1110基于来自小组成员数据库315的小组数据来确定具有对应长期访问者数量的RPD住户的相应百分比。
图11的所示示例的访问者矢量指派器1125基于RPD住户中的对应RPD住户包括至少一个访问者的相应概率来向RPD住户指派访问者矢量。示例访问者矢量指派器1125将由访问者矢量生成器1120生成的访问者矢量迭代地指派给有效RPD住户。示例访问者矢量指派器1125使用来自示例人口统计目标调节器1050的经更新的人口统计目标,基于由示例住户人口统计指派引擎340作出的住户人口统计指派来指派访问者矢量。示例访问者矢量指派器1125还被提供用于计算RPD住户具有至少一个访问者的概率。示例访问者矢量指派器1125确定哪些RPD住户是针对示例访问者矢量的有效住户,并创建可能RPD住户集合。在所示示例中,访问者矢量指派器1125从可能RPD住户集合中选择相应RPD住户具有至少一个访问者的概率最高的RPD住户,并且访问者矢量指派器1125将访问者矢量指派给所选择的RPD住户。在所示示例中,一旦访问者矢量已被指派给所选择的RPD住户,访问者矢量指派器1125就从可用RPD住户集合中移除所选择的RPD住户,从而不再考虑另外的访问者矢量指派。在所示示例中,RPD住户被约束为仅具有一个访问者矢量指派。然而,在一些示例中,可以允许RPD住户具有多个访问者矢量指派。在一些示例中,访问者矢量指派器1125可以不从可用RPD住户集合中移除所选择的RPD住户,以允许将多个访问者矢量指派给RPD住户。示例访问者矢量指派器1125迭代地将访问者矢量指派给RPD住户,直到没有剩余的访问者矢量为止。在一些示例中,如果不是所有的访问者矢量都能够被指派给RPD住户(例如,因为在某些点,针对给定访问者矢量,没有其余RPD住户是有效的),则示例访问者矢量生成器1120收集其余未指派访问者矢量、根据未指派访问者矢量中表示的其余访问者创建新的访问者池,以生成用于示例访问者矢量指派器1125的新访问者矢量。
示例访问者矢量指派器1125的输出包括不同RPD住户的主要住户成员和长期访问者的人口统计指派。该输出由示例访问者指派引擎1055提供给示例收视率计算器350,其中收视率计算器350基于包括主要住户成员和长期访问者的输出来执行计算。
在一些示例中,访问者矢量指派器1125可以在仅一个访问者被指派给给定RPD住户的约束下被简化。这种简化进一步假设访问者的数量小于或等于RPD住户的数量。在这样的示例中,示例访问者矢量指派器选择人口统计类别中的一者(例如,年龄-性别区中的一者)用于指派访问者矢量。示例访问者矢量指派器1125识别作为所选择的人口统计类别(例如,所选择的年龄-性别区)中的访问者的候选的RPD住户集合,并且基于具有该人口统计类别(例如,年龄-性别区)中的访问者的概率来排序该RPD住户集合。示例访问者矢量指派器1125选择具有最高访问者概率的RPD住户,并将被指派给该人口统计类别(例如,年龄-性别区)中的该RPD住户的人中的一者标记为长期访问者。在这样的示例中,示例访问者矢量指派器进行迭代,直到所选择的人口统计类别(例如,年龄-性别区)中的所有访问者已被放置在RPD住户中,并且在不同人口统计类别上,直到访问者的目标数量已被指派给RPD家庭。
虽然图3例示了实现基于神经网络的人口统计估计系统300的示例方式,但是图3例示的要素、处理和/或设备中的一者或更多者可以被组合、划分、重新布置、省略、消除和/或以任何其它方式实现。此外,示例网络接口305、示例小组调谐数据收集器310、小组成员数据库315、示例RPD数据收集器320、示例RPD数据库325、示例特征生成器330、示例人口统计预测神经网络335、示例住户人口统计指派引擎340、示例约束数据库345、示例收视率计算器350和/或更一般地图3的示例基于神经网络的人口统计估计系统300可以通过硬件、软件、固件和/或硬件、软件和/或固件的任何组合来实现。因此,例如,示例网络接口305、示例小组调谐数据收集器310、小组成员数据库315、示例RPD数据收集器320、示例RPD数据库325、示例特征生成器330、示例人口统计预测神经网络335、示例住户人口统计指派引擎340、示例约束数据库345、示例收视率计算器350和/或更一般地示例基于神经网络的人口统计估计系统300中的任一者可以由一个或更多个模拟或数字电路、逻辑电路、可编程处理器、可编程控制器、图形处理单元(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)和/或现场可编程逻辑器件(FPLD)来实现。当阅读本专利的装置或系统权利要求中的任何装置或系统权利要求以涵盖纯软件和/或固件实现方式时,示例基于神经网络的人口统计估计系统300、示例网络接口305、示例小组调谐数据收集器310、小组成员数据库315、示例RPD数据收集器320、示例RPD数据库325、示例特征生成器330、示例人口统计预测神经网络335、示例住户人口统计指派引擎340、示例约束数据库345和/或示例收视率计算器350中的至少一者在此被明确定义成包括具有软件和/或固件的非暂时性计算机可读存储设备或存储盘,诸如存储器、数字通用盘(DVD)、压缩盘(CD)、蓝光光盘等。更进一步地,示例基于神经网络的人口统计估计系统300除了或代替图3中所示的要素、处理和/或设备还可以包括一个或更多个要素、处理和/或设备,和/或可以包括所示要素、处理和设备中的任何或所有要素、处理和设备中的多于一个的要素、处理和设备。如本文所使用的,短语“进行通信”(包括其变型)涵盖直接通信和/或通过一个或更多个中间部件的间接通信,并且不需要直接的物理(例如,有线)通信和/或恒定的通信,而是附加地包括按照定期间隔、计划间隔、非周期性间隔和/或一次性事件的选择性通信。
虽然图10和图11例示了实现基于神经网络的人口统计估计系统1000的示例方式,但是图10和图11例示的要素、处理和/或设备中的一者或更多者可以被组合、划分、重新布置、省略、消除和/或以任何其它方式实现。此外,示例网络接口305、示例小组调谐数据收集器310、小组成员数据库315、示例RPD数据收集器320、示例RPD数据库325、示例特征生成器330、示例人口统计预测神经网络335、示例住户人口统计指派引擎340、示例约束数据库345、示例人口统计目标调节器1050、示例访问者指派引擎1055、示例收视率计算器350和/或更一般地图10的示例基于神经网络的人口统计估计系统1000可以通过硬件、软件、固件和/或硬件、软件和/或固件的任何组合来实现。因此,例如,示例网络接口305、示例小组调谐数据收集器310、小组成员数据库315、示例RPD数据收集器320、示例RPD数据库325、示例特征生成器330、示例人口统计预测神经网络335、示例住户人口统计指派引擎340、示例约束数据库345、示例人口统计目标调节器1050、示例访问者指派引擎1055、示例收视率计算器350和/或更一般地示例基于神经网络的人口统计估计系统1000中的任一者可以由一个或更多个模拟或数字电路、逻辑电路、可编程处理器、可编程控制器、图形处理单元(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)和/或现场可编程逻辑器件(FPLD)来实现。当阅读本专利的装置或系统权利要求中的任何装置或系统权利要求以涵盖纯软件和/或固件实现方式时,示例基于神经网络的人口统计估计系统1000、示例网络接口305、示例小组调谐数据收集器310、小组成员数据库315、示例RPD数据收集器320、示例RPD数据库325、示例特征生成器330、示例人口统计预测神经网络335、示例住户人口统计指派引擎340、示例约束数据库345、示例人口统计目标调节器1050、示例访问者指派引擎1055和/或示例收视率计算器350中的至少一者在此被明确定义成包括具有软件和/或固件的非暂时性计算机可读存储设备或存储盘,诸如存储器、数字通用盘(DVD)、压缩盘(CD)、蓝光光盘等。更进一步地,示例基于神经网络的人口统计估计系统1000除了或代替图10和图11中所示的要素、处理和/或设备还可以包括一个或更多个要素、处理和/或设备,和/或可以包括所示要素、处理和设备中的任何或所有要素、处理和设备中的多于一个的要素、处理和设备。如本文所使用的,短语“进行通信”(包括其变型)涵盖直接通信和/或通过一个或更多个中间部件的间接通信,并且不需要直接的物理(例如,有线)通信和/或恒定的通信,而是附加地包括按照定期间隔、计划间隔、非周期性间隔和/或一次性事件的选择性通信。
在本文公开的示例中,示例函数生成器330实现用于根据返回路径数据生成特征的装置。示例神经网络335实现用于对根据返回路径数据生成的特征进行处理以预测针对返回路径数据住户的人口统计分类概率的装置。示例人口统计指派引擎340实现用于向返回路径数据住户中的相应返回路径数据住户指派一个或更多个人口统计类别的装置。示例访问者指派引擎1055实现用于向返回路径数据住户中的相应返回路径数据住户的至少一子集指派虚拟访问者的装置。示例人口统计目标调节器1050实现用于更新人口统计目标以考虑访问者的存在的装置。示例访问者矢量生成器1120实现用于生成包含第一数量个访问者的访问者矢量的装置。示例访问者矢量指派器1125实现用于向返回路径数据住户中的第一个返回路径数据住户指派访问者矢量的装置。示例访问者人口统计分布计算器1105实现用于确定一个或更多个人口统计类别中的多个人口统计类别中的访问者的相应百分比的装置。示例访问者住户分布计算器1110实现用于确定具有对应数量个访问者的返回路径数据住户的相应百分比的装置。
图12示出了表示用于实现示例基于神经网络的人口统计估计系统300的示例硬件逻辑、机器可读指令、硬件实现的状态机和/或其任何组合的流程图。在该示例中,机器可读指令可以是一个或更多个可执行程序或其部分,以供计算机处理器(诸如下文结合图20讨论的示例处理器平台2000中所示的处理器2012)执行。所述一个或更多个程序或其部分可以被实施成被存储在非暂时性计算机可读存储介质(诸如CD-ROM、软盘、硬盘驱动器、DVD、蓝光光盘TM或与处理器2012相关联的存储器)上的软件,但是整个程序或多个程序和/或其部分可以另选地由除处理器2012之外的设备执行和/或被实施成固件或专用硬件。此外,尽管参考图12所示的流程图描述了示例程序,但是可以另选地使用实现示例基于神经网络的人口统计估计系统300的许多其它方法。例如,参考图12所示的流程图,可以改变框的执行顺序,和/或所描述的框中的一些框可以改变、消除、组合和/或细分成多个框。另外地或另选地,所述框中的任何或所有框可以由一个或更多个硬件电路(例如,分立和/或集成的模拟和/或数字电路、FPGA、ASIC、比较器、运算放大器(op-amp)、逻辑电路等)来实现,所述一个或更多个硬件电路被构造成无需执行软件或固件即可执行对应操作。
图13、图14、图15、图16、图17、图18和图19示出了表示用于实现示例基于神经网络的人口统计估计系统1000的示例硬件逻辑、机器可读指令、硬件实现的状态机和/或其任何组合的流程图。在该示例中,机器可读指令可以是一个或更多个可执行程序或其部分,以供计算机处理器(诸如下文结合图21讨论的示例处理器平台2100中所示的处理器2012)执行。所述一个或更多个程序或其部分可以被实施成被存储在非暂时性计算机可读存储介质(诸如CD-ROM、软盘、硬盘驱动器、DVD、蓝光光盘TM或与处理器2100相关联的存储器)上的软件,但是整个程序或多个程序和/或其部分可以另选地由除处理器2100之外的设备执行和/或被实施成固件或专用硬件。此外,尽管参考图13、图14、图15、图16、图17、图18和图19所示的流程图描述了示例程序,但是可以另选地使用实现示例基于神经网络的人口统计估计系统1000的许多其它方法。例如,参考图13、图14、图15、图16、图17、图18和图19所示的流程图,可以改变框的执行顺序,和/或所描述的框中的一些框可以改变、消除、组合和/或细分成多个框。另外地或另选地,所述框中的任何或所有框可以由一个或更多个硬件电路(例如,分立和/或集成的模拟和/或数字电路、FPGA、ASIC、比较器、运算放大器(op-amp)、逻辑电路等)来实现,所述一个或更多个硬件电路被构造成无需执行软件或固件即可执行对应操作。
本文所述的机器可读指令可以以压缩格式、加密格式、分段格式、打包格式等中的一者或更多者来存储。本文所述的机器可读指令可以作为可以用于创建、制造和/或生产机器可执行指令的数据(例如,指令的部分、代码、代码表示等)来存储。例如,机器可读指令可以被分段并存储在一个或更多个存储设备和/或计算设备(例如,服务器)上。机器可读指令可能需要安装、修改、适配、更新、组合、补充、配置、解密、解压缩、解包、分发、重新指派等中的一者或更多者,以便使它们能够由计算设备和/或其它机器直接读取和/或执行。例如,机器可读指令可以存储在多个部分中,这些部分被单独压缩、加密并存储在单独的计算设备上,其中,这些部分在被解密、解压缩并组合时形成可执行指令集,该可执行指令集实现诸如本文所述的程序。在另一示例中,机器可读指令可以以计算机可读取的状态存储,但是需要添加库(例如,动态链接库)、软件开发工具包(SDK)、应用编程接口(API)等,以便在特定计算设备或其它设备上执行指令。在另一示例中,在机器可读指令和/或对应程序可以全部或部分地执行之前,可能需要配置机器可读指令(例如,所存储的设置、数据输入、所记录的网络地址等)。因此,所公开的机器可读指令和/或对应程序旨在涵盖这样的机器可读指令和/或程序,而不管机器可读指令和/或程序在被存储时或另外地在静止或运输时的特定格式或状态如何。
如上所述,可以使用可执行指令(例如,计算机和/或机器可读指令)来实现图12、图13、图14、图15、图16、图17、图18和/或图19的示例处理,所述可执行指令被存储在非暂时性计算机和/或机器可读介质上,诸如硬盘驱动器、闪存、只读存储器、光盘、数字通用盘、缓存、随机存取存储器和/或信息被存储任何持续时间(例如,针对延长的时间段、永久地、针对短暂的情况、针对临时缓冲和/或针对信息的缓存)的任何其它存储设备或存储盘。如本文所使用的,术语“非暂时性计算机可读介质”被明确定义成包括任何类型的计算机可读存储设备和/或存储盘,并且排除传播信号并排除传输介质。此外,如本文所使用的,术语“计算机可读”和“机器可读”被认为是等同的,除非另有说明。
“包含”和“包括”(及其所有形式和时态)在本文中用作开放式用语。因此,每当权利要求采用任何形式的“包含”和“包括”(例如,包括(comprises)、包含(includes)、包括(comprising)、包含(including)、具有等)作为前序或在任何种类的权利要求叙述中时,应理解,在不超出对应权利要求或叙述的范围的情况下,可以存在附加要素、用语等。如本文所使用的,当例如在权利要求的前序中使用短语“至少”作为过渡用语时,其以与用语“包括”和“包含”相同的方式是开放式的。用语“和/或”在被使用时,例如,以诸如A、B和/或C的形式使用,该用语“和/或”指A、B、C的任何组合或子集,诸如(1)仅A,(2)仅B,(3)仅C,(4)A与B,(5)A与C,(6)B与C,以及(7)A、B和C。如本文在描述结构、部件、项、对象和/或事物的上下文中所使用的,短语“A和B中的至少一者”意指包括(1)至少一个A、(2)至少一个B以及(3)至少一个A和至少一个B中的任何一者的实现方式。类似地,如本文在描述结构、部件、项、对象和/或事物的上下文中所使用的,短语“A或B中的至少一者”意指包括(1)至少一个A、(2)至少一个B以及(3)至少一个A和至少一个B中的任何一者的实现方式。如本文在描述处理、指令、动作、活动和/或步骤的执行或实施的上下文中所使用的,短语“A和B中的至少一者”意指包括(1)至少一个A、(2)至少一个B以及(3)至少一个A和至少一个B中的任何一者的实现方式。类似地,如本文在描述处理、指令、动作、活动和/或步骤的执行或实施的上下文中所使用的,短语“A或B中的至少一者”意指包括(1)至少一个A、(2)至少一个B以及(3)至少一个A和至少一个B中的任何一者的实现方式。
可以被执行以实现图3的示例基于神经网络的人口统计估计系统300的示例程序1200由图12所示的流程图表示。参考前面的附图和相关联的书面描述,图12的示例程序1000在框1205开始执行,在框1205,如上所述,基于神经网络的人口统计估计系统300的示例小组调谐数据收集器310收集小组调谐数据。在框1210,如上所述,基于神经网络的人口统计估计系统300的示例特征生成器330基于所收集的小组成员数据来生成针对小组成员住户的特征矢量(例如,诸如上文表1中描述的矢量)。在框1215,如上所述,特征生成器330将在框1210生成的小组成员特征矢量应用于基于神经网络的人口统计估计系统300的示例人口统计预测神经网络335来训练人口统计预测神经网络335,以预测针对相应小组成员家庭的人口统计分类概率。
在框1220,如上所述,基于神经网络的人口统计估计系统300的示例RPD数据收集器320收集RPD调谐数据。在框1225,如上所述,示例特征生成器330基于所收集的RPD调谐数据来生成针对RPD住户的特征矢量(例如,诸如上文表1中描述的矢量)。在框1230,如上所述,特征生成器330将在框1225生成的RPD特征矢量应用于基于神经网络的人口统计估计系统300的经训练的人口统计预测神经网络335,以预测针对相应RPD家庭的人口统计分类概率。在框1235,如上所述,基于神经网络的人口统计估计系统300的示例住户人口统计指派引擎340从示例约束数据库345获得人口统计指派约束。在框1240,如上所述,基于神经网络的人口统计估计系统300的示例住户人口统计指派引擎340使用在框1230确定的人口统计分类概率来向RPD住户中的相应RPD住户指派人口统计类别。在框1245,如上所述,基于神经网络的人口统计估计系统300的示例收视率计算器350基于在框1245被指派给RPD住户中的相应RPD住户的人口统计类别来将在框1205收集的已具有相关联的人口统计数据的小组调谐数据与在框1220收集的RPD调谐数据进行扩充/组合。
可以执行示例程序1300以实现图10的示例基于神经网络的人口统计估计系统1000,其由图13所示的流程图表示。参考前面的附图和相关联的书面描述,图13的示例程序1300在框1305开始执行,在框1305,如上所述,基于神经网络的人口统计估计系统1000的示例小组调谐数据收集器310收集小组调谐数据。在框1310,如上所述,基于神经网络的人口统计估计系统1000的示例特征生成器330基于所收集的小组成员数据来生成针对小组成员住户的特征矢量(例如,诸如上文表1中描述的矢量)。在框1315,如上所述,特征生成器330将在框1310生成的小组成员特征矢量应用于基于神经网络的人口统计估计系统1000的示例人口统计预测神经网络335来训练人口统计预测神经网络335,以预测针对相应小组成员家庭的人口统计分类概率。
在框1320,如上所述,基于神经网络的人口统计估计系统1000的示例RPD数据收集器320收集RPD调谐数据。在框1325,如上所述,示例特征生成器330基于所收集的RPD调谐数据来生成针对RPD住户的特征矢量(例如,诸如上文表1中描述的矢量)。在框1330,如上所述,特征生成器330将在框1325生成的RPD特征矢量应用于基于神经网络的人口统计估计系统1000的经训练的人口统计预测神经网络335,以预测针对相应RPD住户的人口统计分类概率。在框1335,人口统计目标调节器1050更新用于住户人口统计指派引擎340的人口统计目标。如下文进一步详细描述的,图14和图15的示例流程图表示可以被实现来更新人口统计目标以考虑长期访问者的示例指令。
在框1340,如上文结合图7和8A至图8E所描述的,示例住户人口统计指派引擎340从示例约束数据库345获得人口统计指派约束。在框1345,如上所述,基于神经网络的人口统计估计系统1000的示例住户人口统计指派引擎340使用在框1330确定的人口统计分类概率、在框1345获得的人口统计指派约束以及在框1335更新的人口统计目标来向RPD住户中的相应RPD住户指派人口统计类别。
在框1350,示例访问者指派引擎1055向住户指派访问者。示例访问者指派引擎1055使用在框1345由示例住户人口统计指派引擎340确定的相应RPD住户的人口统计类别指派来向相应RPD住户指派访问者。如下文进一步详细描述的,图16的示例流程图表示可以被实现用于向住户指派访问者的示例指令。
在框1355,如上所述,基于神经网络的人口统计估计系统1000的示例收视率计算器350基于在框1345被指派给RPD住户中的相应RPD住户的人口统计类别以及在框1350被指派给RPD住户中的相应RPD住户的访问者来将在框1305收集的已具有相关联的人口统计数据的小组调谐数据与在框1320收集的RPD调谐数据进行扩充/组合。
第一示例程序1340a可以被执行以实现图10的示例人口统计目标调节器1040,和/或图13的框1340的处理由图14所示的流程图表示。参考前面的附图和相关联的书面描述,图14的示例程序1340a在框1405开始执行,在框1405,人口统计目标调节器1050从人口统计预测神经网络335收集人口统计目标。示例人口统计预测神经网络335提供针对主要住户成员的预测人口统计目标变量。在框1410,如上文结合图10所述,示例人口统计目标调节器1050计算人口统计类别的比例因子。在框1415,示例人口统计目标调节器1050按照在框1410找到的对应比例因子调节人口统计目标。示例人口统计目标调节器1050在由示例住户人口统计指派引擎340使用时调节人口统计目标,以考虑长期访问者的存在。图14的示例程序1340a然后结束并返回到图13的示例程序1300。
可以被执行以实现图10的示例人口统计目标调节器1040和/或图13的框1340的处理的第二示例另选程序1340b由图15所示的流程图表示。图15的示例程序1340b假设上述HDAM技术被进一步修改以基于被指派给RPD住户的人口统计类别向RPD住户指派个体住户成员,如上文结合图10所述。参考前面的附图和相关联的书面描述,图15的示例程序1340b在框1505开始执行,在框1505,人口统计目标调节器1050根据小组成员数据库315中的小组数据确定访问者的目标出现率。示例人口统计目标调节器1050确定不同人口统计类别中不同数量的访问者的目标出现率(例如,根据小组数据和/或其它受众测量技术来确定)。例如,第一人口统计类别的目标出现率可以是住户中的一个人将在该类别中是80%,住户中的2个人将在该同一类别中是15%,并且住户中的3个人将在该同一类别中是5%。
在框1510,示例住户人口统计指派引擎340根据在框1505找到的目标率向住户指派个体。参考针对框1505的上述同一示例,示例住户人口统计指派引擎340选择已被指派第一人口统计类别的RPD住户,该第一人口统计类别使得这些住户中的80%将在该类别中被指派一个个体,这些住户中的15%将在该类别中被指派两个个体,并且这些家庭中的5%将在该类别中被指派三个个体。在图15的示例程序1340b中,程序1340b结束并在图13的框1350返回到示例程序1300。
可以执行示例程序1350以实现图10的示例访问者指派引擎1055,和/或图13的框1350的处理由图16所示的流程图表示。参考前面的附图和相关联的书面描述,图16的示例程序1350在框1605开始执行,在框1605,访问者指派引擎1050从小组成员数据库315收集针对标记长期访问者的小组成员调谐数据。在框1610,示例访问者矢量生成器1120接收由住户人口统计指派引擎1055确定的针对住户的指派人口统计,如上文结合图3所述。
在框1615,示例访问者人口统计分布计算器1105确定人口统计类别中的多个人口统计类别中的长期访问者的百分比。示例访问者人口统计分布计算器1105使用来自小组成员数据库315的小组成员数据来确定人口统计类别(例如,年龄-性别区)中的每一者中多少百分比的人是长期访问者。在框1620,示例访问者住户分布计算器1110确定具有对应数量个长期访问者的住户的百分比。示例访问者住户分布计算器1110使用来自小组成员数据库315的小组成员数据来确定分别具有1个、2个、3个、4个等访问者的住户的百分比。例如,示例访问者住户分布计算器1110确定多少百分比的住户具有一个访问者,然后确定多少百分比的住户具有两个访问者等。
在框1625,示例访问者矢量生成器1120创建访问者矢量。示例访问者矢量生成器1120使用由示例访问者人口统计分布计算器1105和示例访问者住户分布计算器1110确定的百分比来创建访问者矢量。如下文进一步详细描述的,图17的示例流程图表示可以被实现用于创建访问者矢量的示例指令。
在框1635,示例访问者矢量指派器1125向住户指派访问者矢量。示例访问者矢量指派器1125在向RPD住户指派由访问者矢量生成器在框1625创建的访问者矢量时使用来自小组成员数据库315的小组成员数据。如下文进一步详细描述的,图18和图19的示例流程图表示可以被实现用于向住户指派访问者矢量的示例指令。在执行框1635之后,图16的示例程序1350结束并返回到图13的示例程序1300。
可以执行示例程序1625以实现图11的示例访问者矢量生成器1120,和/或图16的框1625的处理由图17所示的流程图表示。参考前面的附图和相关联的书面描述,图17的示例程序1625在框1705开始执行,在框1705,示例访问者矢量生成器1120将各个住户的总指派人口统计乘以各个人口统计类别的访问者百分比。示例访问者矢量生成器1120将由示例住户人口统计指派引擎340确定的被指派给RPD住户的各个人口统计类别中的总人数乘以由示例访问者人口统计分布计算器1105确定的各个人口统计类别中的长期访问者的百分比。示例访问者矢量生成器1120通过执行上述乘法来确定在各个人口统计类别中将包括多少访问者。
在框1710,示例访问者矢量生成器1120创建访问者池。示例访问者矢量生成器1120创建具有各个人口统计类别(例如,各个年龄-性别区)中的预期访问者总数的访问者池。在框1715,示例访问者矢量生成器1120生成选定大小的访问者矢量。在本文公开的示例中,基于随机数生成器来确定选定大小,其中选择了给定大小的概率对应于具有该给定数量个(例如,1个、2个、3个、4个等)访问者的住户的输入百分比,如示例访问者住户分布计算器1110所确定的。然而,可以另外地或另选地使用其它选择方法。
在框1720,示例访问者矢量生成器1120基于访问者矢量的选定大小来从访问者池中选择多个访问者,并将所选择的访问者放入所生成的访问者矢量中。示例访问者矢量生成器1120从访问者池中选择与在框1715确定的访问者矢量的选定大小相对应的多个访问者。示例访问者矢量生成器1120然后将所选择的访问者放入在框1715生成的访问者矢量中。在框1725,示例访问者矢量生成器1120确定访问者池中是否存在任何剩余访问者。如果示例访问者矢量生成器1120确定访问者池中存在剩余访问者,则图17的示例程序1625返回到框1715,在框1715,生成选定大小的另一访问者矢量。如果示例访问者矢量生成器1120确定访问者池中不存在剩余访问者,则图17的示例程序1625结束并返回到图16的示例程序1350。
可以执行第一示例程序1635a以实现图11的示例访问者矢量指派器1125,和/或图16的框1635的处理由图18所示的流程图表示。参考前面的附图和相关联的书面描述,图18的示例程序1635a在框1805开始执行,在框1805,示例访问者矢量指派器1125访问来自访问者矢量生成器1120的所生成的访问者矢量,以及来自访问者矢量生成器1120的由住户人口统计指派引擎340确定的针对RPD住户的个体成员指派(包括但不区分主要住户成员和访问者)。由于由人口统计目标调节器1050提供的经更新的人口统计目标,所以示例访问者矢量指派器1125接收包括主要住户成员和长期访问者的RPD住户指派。
在框1810,示例访问者矢量指派器1125确定各个住户包括与住户的集合相对应的至少一个访问者的概率。在一些示例中,概率对于所有RPD住户可以是相同的,使得各个家庭同样可能地包括访问者。在一些示例中,上文公开的人口统计预测神经网络335可以适配于输出概率,以基于来自小组成员数据库315的小组成员调谐数据来预测给定RPD住户具有访问者的可能性。
在框1815,示例访问者矢量指派器1125从来自示例访问者矢量生成器1120的所生成的访问者矢量中选择一个访问者矢量。在框1820,示例访问者矢量指派器1125生成用于放置所选择的访问者矢量的有效住户列表。如果RPD住户在各个人口统计类别中被指派(由示例住户人口统计指派引擎340利用来自人口统计目标调节器1050的经修改的人口统计目标)与被包括在选定访问者矢量中的相同数量或更多个体,则RPD住户是有效的。访问者矢量指派器1125还确保在被指派给不是长期访问者的RPD住户的成人人口统计类别中剩余至少一个个体。
在框1825,示例访问者矢量指派器1125从在框1815确定的有效住户列表中选择具有在框1810确定的访问者的概率最高的住户。在框1830,示例访问者矢量指派器1125向所选择的RPD住户指派访问者矢量。在框1835,示例访问者矢量指派器1125从用于访问者指派的可用住户的其余集合中移除所选择的住户。
在框1840,示例访问者矢量指派器1125确定是否存在剩余访问者矢量。如果示例访问者矢量指派器1125确定存在剩余访问者矢量,则图18的示例程序1635a返回到框1815,其中示例访问者矢量指派器1125选择一个访问者矢量。如果示例访问者矢量指派器1125确定不存在剩余访问者矢量,则图18的示例程序1635a结束并返回到图16的程序1350。
第二另选程序1635b可以被执行以在仅一个访问者将被指派给给定住户的约束下实现图11的示例访问者矢量指派器1125,其由图19所示的流程图表示。参考前面的附图和相关联的书面描述,图19的示例程序1635b在框1900开始执行,在框1900,示例访问者矢量指派器1125从访问者矢量生成器1120接收所生成的访问者矢量,并从访问者矢量生成器1120接收由住户人口统计指派引擎340确定的针对RPD住户的个体成员指派(包括但不区分主要住户成员和访问者)。由于由人口统计目标调节器1050提供的经更新的人口统计目标,所以示例访问者矢量指派器1125接收包括主要住户成员和长期访问者的RPD住户指派。
在框1905,示例访问者矢量指派器1125确定各个住户包括与住户的集合相对应的至少一个访问者的概率。在一些示例中,概率对于所有RPD住户可以是相同的,使得各个家庭同样可能地包括访问者。在一些示例中,上文公开的人口统计预测神经网络335可以适配于输出概率,以基于来自小组成员数据库315的小组成员调谐数据来预测给定RPD住户具有访问者的可能性。
在框1910,示例访问者矢量指派器1125选择一个人口统计类别。在框1915,示例访问者矢量指派器1125识别可以在所选择的人口统计类别中具有访问者的RPD住户的集合。在框1920,示例访问者矢量指派器1125基于在框1905确定的所选择的人口统计类别中具有访问者的概率来排序RPD住户的集合。在框1925,示例访问者矢量指派器1125从所排序的住户集合中选择家庭。在本文公开的示例中,示例访问者矢量指派器1125从所排序的集合中选择具有至少一个访问者的概率最高的RPD住户。在框1930,示例访问者矢量指派器1125向所选择的RPD住户指派所选择的人口统计类别的访问者。在框1935,示例访问者矢量指派器1125从所排序的集合中移除所选择的住户。
在框1940,示例访问者矢量指派器1125确定人口统计类别中是否存在剩余访问者。如果示例访问者矢量指派器1125确定人口统计类别中存在剩余访问者,则图19的示例程序1635b返回到框1915,其中示例访问者矢量指派器1125识别可以在所选择的人口统计类别中具有访问者的住户的集合。如果示例访问者矢量指派器1125确定人口统计类别中不存在剩余访问者,则图19的示例程序1635继续到框1945。
在框1945,示例访问者矢量指派器1125确定是否存在剩余人口统计类别。如果示例访问者矢量指派器1125确定存在剩余人口统计类别,则图19的示例程序1635返回到框1910,其中示例访问者矢量指派器1125选择一个人口统计类别。如果示例访问者矢量指派器1125确定不存在剩余人口统计类别,则图19的示例程序1635结束并返回到图16的示例程序1350。
图20是被构造成执行图12的指令以实现图3的示例基于神经网络的人口统计估计系统300的示例处理器平台2000的框图。例如,处理器平台2000可以是服务器、个人计算机、工作站、自学习机(例如,神经网络)、移动设备(例如,手机、智能电话、诸如iPadTM的平板电脑等)、个人数字助理(PDA)、互联网设备或任何其它类型的计算设备。
所示示例的处理器平台2000包括处理器2012。所示示例的处理器2012是硬件。例如,处理器2012可以由来自任何期望系列或制造商的一个或更多个集成电路、逻辑电路、微处理器、GPU、DSP或控制器来实现。硬件处理器2012可以是基于半导体的(例如,基于硅的)器件。在该示例中,处理器2012实现示例小组调谐数据收集器310、示例RPD数据收集器320、示例特征生成器330、示例住户人口统计指派引擎340和示例收视率计算器350。
所示示例的处理器2012包括本地存储器2013(例如,缓存)。所示示例的处理器2012经由链路2018与包括易失性存储器2014和非易失性存储器2016的主存储器进行通信。链路2018可以由总线、一个或更多个点对点连接等或其组合来实现。易失性存储器2014可以由同步动态随机存取存储器(SDRAM)、动态随机存取存储器(DRAM)、
Figure BDA0003331741850000321
动态随机存取存储器
Figure BDA0003331741850000322
和/或任何其它类型的随机存取存储器设备来实现。非易失性存储器2016可以由闪存和/或任何其它期望类型的存储器设备来实现。对主存储器2014、2016的访问由存储器控制器控制。
所示示例的处理器平台2000还包括接口电路2020。接口电路2020可以通过任何类型的接口标准(诸如以太网接口、通用串行总线(USB)、
Figure BDA0003331741850000331
接口、近场通信(NFC)接口和/或PCI Express接口)来实现。在该示例中,接口电路2020实现网络接口305。
在所示示例中,一个或更多个输入设备2022连接至接口电路2020。输入设备2022允许用户将数据和/或命令输入到处理器2012中。例如,输入设备可以由音频传感器、麦克风、摄像头(静止或视频)、键盘、按钮、鼠标、触摸屏、触控板、轨迹球、轨迹条(诸如isopoint)、语音识别系统和/或任何其它人机接口来实现。而且,诸如处理器平台2000的许多系统可以允许用户控制计算机系统并使用诸如但不限于手部或身体移动、面部表情和面部识别的物理姿态向计算机提供数据。
一个或更多个输出设备2024也连接至所示示例的接口电路2020。例如,输出设备2024可以由显示设备(例如,发光二极管(LED)、有机发光二极管(OLED)、液晶显示器(LCD)、阴极射线管显示器(CRT)、就地开关(IPS)显示器、触摸屏等)、触觉输出设备、打印机和/或扬声器来实现。因此,所示示例的接口电路2020通常包括图形驱动器卡、图形驱动器芯片和/或图形驱动器处理器。
所示示例的接口电路2020还包括通信设备(诸如发射器、接收器、收发器、调制解调器、住宅网关、无线接入点和/或网络接口),以利于经由网络2026与外部机器(例如,任何类型的计算设备)交换数据。该通信可以例如经由以太网连接、数字订户线(DSL)连接、电话线连接、同轴电缆系统、卫星系统、直线对传式无线系统、蜂窝电话系统等。
所示示例的处理器平台2000还包括用于存储软件和/或数据的一个或更多个大容量存储设备2028。这种大容量存储设备2028的示例包括软盘驱动器、硬盘驱动器、光盘驱动器、蓝光磁盘驱动器、独立磁盘冗余阵列(RAID)系统和数字通用盘(DVD)驱动器。在一些示例中,大容量存储设备2028可以实现小组成员数据库315、RPD数据库325和/或约束数据库345。另外地或另选地,在一些示例中,易失性存储器2014可以实现小组成员数据库315、RPD数据库325和/或约束数据库345。
与图12的指令相对应的机器可执行指令2032可以被存储在大容量存储设备2028中、易失性存储器2014中、非易失性存储器2016中、本地存储器2013中和/或诸如CD或DVD2036的可移除非暂时性计算机可读存储介质上。
图21是被构造成执行图13、图14、图15、图16、图17、图18和图19的指令以实现图10的示例基于神经网络的人口统计估计系统1000的示例处理器平台2000的框图。例如,处理器平台2000可以是服务器、个人计算机、工作站、自学习机(例如,神经网络)、移动设备(例如,手机、智能电话、诸如iPadTM的平板电脑等)、个人数字助理(PDA)、互联网设备或任何其它类型的计算设备。
所示示例的处理器平台2000包括处理器2112。所示示例的处理器2112是硬件。例如,处理器2112可以由来自任何期望系列或制造商的一个或更多个集成电路、逻辑电路、微处理器、GPU、DSP或控制器来实现。硬件处理器2112可以是基于半导体的(例如,基于硅的)器件。在该示例中,处理器2112实现示例小组调谐数据收集器310、示例RPD数据收集器320、示例特征生成器330、示例住户人口统计指派引擎340、示例人口统计目标调节器1050、示例访问者指派引擎1055和示例收视率计算器350。
所示示例的处理器2112包括本地存储器2113(例如,缓存)。所示示例的处理器2113经由链路2118与包括易失性存储器2113和非易失性存储器2116的主存储器进行通信。链路2118可以由总线、一个或更多个点对点连接等或其组合来实现。易失性存储器2114可以由同步动态随机存取存储器(SDRAM)、动态随机存取存储器(DRAM)、
Figure BDA0003331741850000341
动态随机存取存储器
Figure BDA0003331741850000342
和/或任何其它类型的随机存取存储器设备来实现。非易失性存储器2116可以由闪存和/或任何其它期望类型的存储器设备来实现。对主存储器2114、2116的访问由存储器控制器控制。
所示示例的处理器平台2100还包括接口电路2120。接口电路2120可以通过任何类型的接口标准(诸如以太网接口、通用串行总线(USB)、
Figure BDA0003331741850000343
接口、近场通信(NFC)接口和/或PCI express接口)来实现。在该示例中,接口电路2020实现网络接口305。
在所示示例中,一个或更多个输入设备2120连接至接口电路2120。输入设备2122允许用户将数据和/或命令输入到处理器2112中。例如,输入设备可以由音频传感器、麦克风、摄像头(静止或视频)、键盘、按钮、鼠标、触摸屏、触控板、轨迹球、轨迹条(诸如isopoint)、语音识别系统和/或任何其它人机接口来实现。而且,诸如处理器平台2100的许多系统可以允许用户控制计算机系统并使用诸如但不限于手部或身体移动、面部表情和面部识别的物理姿态向计算机提供数据。
一个或更多个输出设备2124也连接至所示示例的接口电路2120。例如,输出设备2124可以由显示设备(例如,发光二极管(LED)、有机发光二极管(OLED)、液晶显示器(LCD)、阴极射线管显示器(CRT)、就地开关(IPS)显示器、触摸屏等)、触觉输出设备、打印机和/或扬声器来实现。因此,所示示例的接口电路2120通常包括图形驱动器卡、图形驱动器芯片和/或图形驱动器处理器。
所示示例的接口电路2120还包括通信设备(诸如发射器、接收器、收发器、调制解调器、住宅网关、无线接入点和/或网络接口),以利于经由网络2126与外部机器(例如,任何类型的计算设备)交换数据。该通信可以例如经由以太网连接、数字订户线(DSL)连接、电话线连接、同轴电缆系统、卫星系统、直线对传式无线系统、蜂窝电话系统等。
所示示例的处理器平台2100还包括用于存储软件和/或数据的一个或更多个大容量存储设备2128。这种大容量存储设备2128的示例包括软盘驱动器、硬盘驱动器、光盘驱动器、蓝光磁盘驱动器、独立磁盘冗余阵列(RAID)系统和数字通用盘(DVD)驱动器。在一些示例中,大容量存储设备2028可以实现小组成员数据库315、RPD数据库325和/或约束数据库345。另外地或另选地,在一些示例中,易失性存储器2014可以实现小组成员数据库315、RPD数据库325和/或约束数据库345。
与图13、图14、图15、图16、图17、图18和图19的指令相对应的机器可执行指令2132可以被存储在大容量存储设备2128中、易失性存储器2114中、非易失性存储器2116中、本地存储器2113中和/或诸如CD或DVD 2136的可移除非暂时性计算机可读存储介质上。
根据前文,将理解,已公开了实现机顶盒返回路径数据的神经网络处理以估计住户人口统计的示例方法、装置和制品。上文公开的示例基于神经网络的人口统计估计系统1000使用具有时间分布密集层(TDDL)随后是长短期记忆(LSTM)递归网络层的神经网络来根据观看数据(例如,用于训练的小组成员调谐数据以及训练后的RPD调谐数据)预测住户(例如,用于训练的小组住户以及训练后的RPD住户)的人口统计分类。示例基于神经网络的人口统计估计系统1000将住户的观看数据分组成描述相应观看会话的观看块,其中观看块指示星期几、年日、一天的四分之一小时、频道变化率以及观看各个可能网络的分钟。在一些示例中,观看块被覆盖60分钟。在一些示例中,针对给定住户的观看块由TDD组合和处理,以产生针对住户的观看会话的压缩特征集合。然后由LSTM处理该压缩特征集合,以产生概括住户的观看历史的压缩概括特征矢量。将压缩概括特征矢量与附加住户特征(诸如总电视消费、所记录的观看块的数量和住户中的电视调谐器的数量)合并,以产生针对住户的合并概括特征矢量。合并概括特征矢量然后被应用于一个或更多个附加隐藏层,其输出指示住户属于不同可能人口统计类的概率的分类矢量。然后使用混合整数编程来来求解目标函数(其基于从神经网络输出的人口统计分类概率并且服从约束集合),以向提供RPD调谐数据的RPD住户中的相应RPD住户指派一个或更多个人口统计类别。
所公开的方法、装置和制品通过使得能够在受众测量处理系统中将RPD调谐数据与小组成员调谐数据相结合来提高使用计算设备的效率。将RPD调谐数据与可用小组数据相结合可以大大增加受众测量处理系统可访问的用于预测受众度量(例如,收视率)的数据量。这样的增加的数据量可以提高输入数据的统计完整性,从而降低由受众测量处理系统产生的结果的相关联的统计偏差。因此,所公开的方法、装置和制品涉及计算机功能的一个或更多个改进。
尽管本文已公开了某些示例方法、装置和制品,但是本专利的覆盖范围不限于此。相反,本专利涵盖了完全落入本专利的权利要求范围内的所有方法、装置和制品。

Claims (28)

1.一种人口统计估计系统,所述人口统计估计系统包括:
特征生成器,所述特征生成器根据从与返回路径数据住户相关联的机顶盒报告的返回路径数据(RPD)生成特征;
神经网络,所述神经网络对根据所述返回路径数据生成的所述特征进行处理,以预测针对所述返回路径数据住户的人口统计分类概率,所述神经网络将基于从监测与小组成员住户相关联的媒体设备的计量器报告的小组数据来训练;
人口统计指派引擎,所述人口统计指派引擎基于所预测的人口统计分类概率来向所述返回路径数据住户中的相应返回路径数据住户指派一个或更多个人口统计类别;以及
访问者指派引擎,所述访问者指派引擎基于被指派给所述返回路径数据住户中的所述相应返回路径数据住户的所述一个或更多个人口统计类别,向所述返回路径数据住户中的所述相应返回路径数据住户的至少一子集指派虚拟访问者。
2.根据权利要求1所述的人口统计估计系统,所述人口统计估计系统还包括人口统计目标调节器,所述人口统计目标调节器更新人口统计目标,以考虑访问者的存在。
3.根据权利要求2所述的人口统计估计系统,其中,所述人口统计目标调节器将比例因子应用于人口统计目标中的对应人口统计目标来更新人口统计目标,以考虑访问者的存在。
4.根据权利要求1所述的人口统计估计系统,其中,所述访问者指派引擎包括:
访问者矢量生成器,所述访问者矢量生成器生成包含第一数量个访问者的访问者矢量;以及
访问者矢量指派器,所述访问者矢量指派器基于所述返回路径数据住户中的对应返回路径数据住户包括至少一个访问者的相应概率,向所述返回路径数据住户中的第一个返回路径数据住户指派所述访问者矢量,该概率是基于所述小组数据的。
5.根据权利要求4所述的人口统计估计系统,其中,所述第一数量个访问者是基于一百分比的所述返回路径数据住户具有所述第一数量个访问者的概率选择的,所述百分比的所述返回路径数据住户具有所述第一数量个访问者的概率是基于小组数据的。
6.根据权利要求1所述的人口统计估计系统,其中,所述访问者指派引擎包括访问者人口统计分布计算器,所述访问者人口统计分布计算器基于所述小组数据来确定所述一个或更多个人口统计类别中的多个人口统计类别中的访问者的相应百分比。
7.根据权利要求1所述的人口统计估计系统,其中,所述访问者指派引擎包括访问者住户分布计算器,所述访问者住户分布计算器确定具有对应数量个访问者的所述返回路径数据住户的相应百分比。
8.一种对具有访问者的住户的人口统计进行估计的方法,所述方法包括以下步骤:
通过利用处理器执行指令,根据从与返回路径数据住户相关联的机顶盒报告的返回路径数据(RPD)生成特征;
通过利用所述处理器执行指令,对根据所述返回路径数据生成的所述特征进行处理,以预测针对所述返回路径数据住户的人口统计分类概率,所述处理将基于从监测与小组成员住户相关联的媒体设备的计量器报告的小组数据来训练;
通过利用所述处理器执行指令,基于所预测的人口统计分类概率来向所述返回路径数据住户中的相应返回路径数据住户指派一个或更多个人口统计类别;以及
通过利用所述处理器执行指令,基于被指派给所述返回路径数据住户中的所述相应返回路径数据住户的所述一个或更多个人口统计类别,向所述返回路径数据住户中的所述相应返回路径数据住户的至少一子集指派虚拟访问者。
9.根据权利要求8所述的方法,所述方法还包括以下步骤:更新人口统计目标,以考虑访问者的存在。
10.根据权利要求9所述的方法,其中,更新人口统计目标以考虑访问者的存在的步骤包括:将比例因子应用于人口统计目标中的对应人口统计目标。
11.根据权利要求8所述的方法,其中,向所述返回路径数据住户中的所述相应返回路径数据住户的至少一子集指派虚拟访问者的步骤包括:
生成包含第一数量个访问者的访问者矢量;以及
基于所述返回路径数据住户中的对应返回路径数据住户包括至少一个访问者的相应概率,向所述返回路径数据住户中的第一个返回路径数据住户指派所述访问者矢量,该概率是基于所述小组数据的。
12.根据权利要求11所述的方法,其中,所述第一数量个访问者是基于一百分比的所述返回路径数据住户具有所述第一数量个访问者的概率选择的,所述百分比的所述返回路径数据住户具有所述第一数量个访问者的概率是基于小组数据的。
13.根据权利要求8所述的方法,其中,向所述返回路径数据住户中的所述相应返回路径数据住户的至少一子集指派虚拟访问者的步骤包括:基于所述小组数据来确定所述一个或更多个人口统计类别中的多个返回路径数据住户中的访问者的相应百分比。
14.根据权利要求8所述的方法,其中,向所述返回路径数据住户中的所述相应返回路径数据住户的至少一子集指派虚拟访问者的步骤包括:确定具有对应数量个访问者的所述返回路径数据住户的相应百分比。
15.至少一种非暂时性计算机可读介质,所述至少一种非暂时性计算机可读介质包括指令,当所述指令被执行时,所述指令使至少一个处理器至少执行以下操作:
根据从与返回路径数据住户相关联的机顶盒报告的返回路径数据(RPD)生成特征;
对根据所述返回路径数据生成的所述特征进行处理,以预测针对所述返回路径数据住户的人口统计分类概率,所述处理将基于从监测与小组成员住户相关联的媒体设备的计量器报告的小组数据来训练;
基于所预测的人口统计分类概率来向所述返回路径数据住户中的相应返回路径数据住户指派一个或更多个人口统计类别;以及
基于被指派给所述返回路径数据住户中的所述相应返回路径数据住户的所述一个或更多个人口统计类别,向所述返回路径数据住户中的所述相应返回路径数据住户的至少一子集指派虚拟访问者。
16.根据权利要求15所述的至少一种非暂时性计算机可读介质,其中,当所述指令被执行时,所述指令使至少一个处理器执行以下操作:更新人口统计目标,以考虑访问者的存在。
17.根据权利要求16所述的至少一种非暂时性计算机可读介质,其中,当所述指令被执行时,所述指令使至少一个处理器执行以下操作:将比例因子应用于人口统计目标中的对应人口统计目标来更新人口统计目标,以考虑访问者的存在。
18.根据权利要求15所述的至少一种非暂时性计算机可读介质,其中,当所述指令被执行时,所述指令使至少一个处理器执行以下操作:
生成包含第一数量个访问者的访问者矢量;以及
基于所述返回路径数据住户中的对应返回路径数据住户包括至少一个访问者的相应概率,向所述返回路径数据住户中的第一个返回路径数据住户指派所述访问者矢量,该概率是基于所述小组数据的。
19.根据权利要求18所述的至少一种非暂时性计算机可读介质,其中,所述第一数量个访问者是基于一百分比的所述返回路径数据住户具有所述第一数量个访问者的概率选择的,所述百分比的所述返回路径数据住户具有所述第一数量个访问者的概率是基于小组数据的。
20.根据权利要求15所述的至少一种非暂时性计算机可读介质,其中,当所述指令被执行时,所述指令使至少一个处理器执行以下操作:基于所述小组数据来确定所述一个或更多个人口统计类别中的多个人口统计类别中的访问者的相应百分比。
21.根据权利要求15所述的至少一种非暂时性计算机可读介质,其中,当所述指令被执行时,所述指令使至少一个处理器执行以下操作:确定具有对应数量个访问者的所述返回路径数据住户的相应百分比。
22.一种对具有访问者的住户的人口统计进行估计的系统,所述系统包括:
用于根据从与返回路径数据住户相关联的机顶盒报告的返回路径数据(RPD)生成特征的装置;
用于对根据所述返回路径数据生成的所述特征进行处理以预测针对所述返回路径数据住户的人口统计分类概率的装置,用于处理的该装置将基于从监测与小组成员住户相关联的媒体设备的计量器报告的小组数据来训练;
用于基于所预测的人口统计分类概率来向所述返回路径数据住户中的相应返回路径数据住户指派一个或更多个人口统计类别的第一装置;以及
用于基于被指派给所述返回路径数据住户中的所述相应返回路径数据住户的所述一个或更多个人口统计类别来向所述返回路径数据住户中的所述相应返回路径数据住户的至少一子集指派虚拟访问者的第二装置。
23.根据权利要求22所述的系统,所述系统还包括用于更新人口统计目标以考虑访问者的存在的装置。
24.根据权利要求23所述的系统,其中,所述用于更新人口统计目标以考虑访问者的存在的装置包括:将比例因子应用于人口统计目标中的对应人口统计目标。
25.根据权利要求22所述的系统,其中,用于指派虚拟访问者的所述第二装置包括:
用于生成包含第一数量个访问者的访问者矢量的装置;以及
用于基于所述返回路径数据住户中的对应返回路径数据住户包括至少一个访问者的相应概率来向所述返回路径数据住户中的第一个返回路径数据住户指派所述访问者矢量的装置,该概率是基于所述小组数据的。
26.根据权利要求25所述的系统,其中,所述第一数量个访问者是基于一百分比的所述返回路径数据住户具有所述第一数量个访问者的概率选择的,所述百分比的所述返回路径数据住户具有所述第一数量个访问者的概率基于小组数据。
27.根据权利要求22所述的系统,其中,用于指派虚拟访问者的所述第二装置包括用于基于所述小组数据来确定所述一个或更多个人口统计类别中的多个人口统计类别中的访问者的相应百分比的装置。
28.根据权利要求22所述的系统,其中,用于指派虚拟访问者的所述第二装置包括用于确定具有对应数量个访问者的返回路径数据住户的相应百分比的装置。
CN202080032847.1A 2019-05-01 2020-04-30 对返回路径数据进行神经网络处理以估计住户成员和访问者人口统计 Pending CN113785595A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962841641P 2019-05-01 2019-05-01
US62/841,641 2019-05-01
US16/706,398 US20200226465A1 (en) 2018-10-10 2019-12-06 Neural network processing of return path data to estimate household member and visitor demographics
US16/706,398 2019-12-06
PCT/US2020/030762 WO2020223505A1 (en) 2019-05-01 2020-04-30 Neural network processing of return path data to estimate household member and visitor demographics

Publications (1)

Publication Number Publication Date
CN113785595A true CN113785595A (zh) 2021-12-10

Family

ID=73029468

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080032847.1A Pending CN113785595A (zh) 2019-05-01 2020-04-30 对返回路径数据进行神经网络处理以估计住户成员和访问者人口统计

Country Status (3)

Country Link
EP (1) EP3963894A4 (zh)
CN (1) CN113785595A (zh)
WO (1) WO2020223505A1 (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080300965A1 (en) * 2007-05-31 2008-12-04 Peter Campbell Doe Methods and apparatus to model set-top box data
US20140095413A1 (en) * 2012-09-28 2014-04-03 Roman Kirillov Associating a Web Session with a Household Member
CN105450678A (zh) * 2014-07-09 2016-03-30 阿里巴巴集团控股有限公司 一种信息确认方法及装置
US20170006342A1 (en) * 2015-07-02 2017-01-05 The Nielsen Company (Us), Llc Methods and apparatus to correct errors in audience measurements for media accessed using over-the-top devices
CN111527541A (zh) * 2017-12-27 2020-08-11 乐威指南公司 基于语音数据和媒体消费数据识别用户的系统和方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2008363490A1 (en) * 2008-10-28 2010-05-06 Norwell Sa Audience measurement system
WO2013078640A1 (en) * 2011-11-30 2013-06-06 Google Inc. Estimating user demographics
US20160165277A1 (en) * 2013-03-15 2016-06-09 Google Inc. Media metrics estimation from large population data
US9697533B2 (en) * 2013-04-17 2017-07-04 The Nielsen Company (Us), Llc Methods and apparatus to monitor media presentations
US9848224B2 (en) * 2015-08-27 2017-12-19 The Nielsen Company(Us), Llc Methods and apparatus to estimate demographics of a household

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080300965A1 (en) * 2007-05-31 2008-12-04 Peter Campbell Doe Methods and apparatus to model set-top box data
US20140095413A1 (en) * 2012-09-28 2014-04-03 Roman Kirillov Associating a Web Session with a Household Member
CN105450678A (zh) * 2014-07-09 2016-03-30 阿里巴巴集团控股有限公司 一种信息确认方法及装置
US20170006342A1 (en) * 2015-07-02 2017-01-05 The Nielsen Company (Us), Llc Methods and apparatus to correct errors in audience measurements for media accessed using over-the-top devices
CN111527541A (zh) * 2017-12-27 2020-08-11 乐威指南公司 基于语音数据和媒体消费数据识别用户的系统和方法

Also Published As

Publication number Publication date
WO2020223505A9 (en) 2022-04-21
EP3963894A4 (en) 2023-01-25
WO2020223505A1 (en) 2020-11-05
EP3963894A1 (en) 2022-03-09

Similar Documents

Publication Publication Date Title
US11700405B2 (en) Methods and apparatus to estimate demographics of a household
US11689767B2 (en) Methods and apparatus to estimate population reach from different marginal rating unions
US20230042879A1 (en) Methods and apparatus to estimate population reach from marginals
US20200226465A1 (en) Neural network processing of return path data to estimate household member and visitor demographics
CN113196300A (zh) 对返回路径数据的神经网络处理以估计家庭人口统计
US12020139B2 (en) Probabilistic modeling for anonymized data integration and bayesian survey measurement of sparse and weakly-labeled datasets
US11687953B2 (en) Methods and apparatus to apply household-level weights to household-member level audience measurement data
US11941646B2 (en) Methods and apparatus to estimate population reach from marginals
US11889136B2 (en) Assigning synthetic respondents to geographic locations for audience measurement
CN113785595A (zh) 对返回路径数据进行神经网络处理以估计住户成员和访问者人口统计
US20230209133A1 (en) Methods and apparatus for co-viewing adjustment
US11727292B2 (en) Media device on/off detection using return path data
US20230110511A1 (en) System and method for individualized exposure estimation in linear media advertising for cross platform audience management and other applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40066813

Country of ref document: HK