CN112054864B - 用于识别观看电视广告的用户的系统和方法 - Google Patents
用于识别观看电视广告的用户的系统和方法 Download PDFInfo
- Publication number
- CN112054864B CN112054864B CN202010759307.5A CN202010759307A CN112054864B CN 112054864 B CN112054864 B CN 112054864B CN 202010759307 A CN202010759307 A CN 202010759307A CN 112054864 B CN112054864 B CN 112054864B
- Authority
- CN
- China
- Prior art keywords
- broadcast
- audience measurement
- content item
- search
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000005259 measurement Methods 0.000 claims abstract description 219
- 230000004044 response Effects 0.000 claims description 34
- 238000012544 monitoring process Methods 0.000 claims description 9
- 230000003247 decreasing effect Effects 0.000 claims description 6
- 230000001815 facial effect Effects 0.000 abstract description 3
- 230000005540 biological transmission Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 10
- 230000001965 increasing effect Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 235000014510 cooky Nutrition 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000003442 weekly effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000001667 episodic effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000012421 spiking Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/35—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
- H04H60/45—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying users
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44213—Monitoring of end-user related data
- H04N21/44222—Analytics of user selections, e.g. selection of programs or purchase activity
- H04N21/44224—Monitoring of user activity on external systems, e.g. Internet browsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
- G06Q30/0246—Traffic
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/29—Arrangements for monitoring broadcast services or broadcast-related services
- H04H60/33—Arrangements for monitoring the users' behaviour or opinions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/61—Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
- H04H60/63—Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 for services of sales
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/61—Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
- H04H60/66—Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 for using the result on distributors' side
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/812—Monomedia components thereof involving advertisement data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Social Psychology (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Multimedia (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
本申请涉及用于识别观看电视广告的用户的系统和方法。观众测量服务可以监视区域中的广播,摄取隐藏解说词数据、元数据、显示的文本或徽标,对人执行脸部识别,和/或生成广播内容的音频/视频指纹以连同该内容被广播的时间一起创建内容和关联的关键字的数据库。观众测量服务可以从搜索提供者接收用户搜索查询并检测“出峰”查询。观众测量服务可以确定出峰查询是否在场境或时间上与数据库中标识的内容项目相关,并且推断出生成查询的用户可能观看了该内容项目。在一些实施方式中,观众测量服务还可以推断用户很可能在与查询触发项目相同的广播频道上观看了在之前或随后几分钟内显示的其他内容项目(例如广告)。
Description
分案说明
本申请属于申请日为2015年10月29日的中国发明专利申请201580065447.X的分案申请。
相关申请
本申请要求在2014年12月1日提交的题为“SYSTEMS AND METHODS FORIDENTIFYING USERS WHO WATCHED A TELEVISION ADVERTISEMENT(用于识别观看电视广告的用户的系统和方法)”的美国专利申请No.14/556,317的优先权和权益,其全部内容在此通过引用并入以用于任何和所有目的。
技术领域
本申请涉及用于识别观看电视广告的用户的系统和方法。
背景技术
通常经由随着时间而记录内容曝光的个人或家庭组成的单个源数据样本组(datapanel)来测量包括商业广告的内容块——诸如广播媒体或在线流送的媒体——的观众。在一个典型的系统中,样本组成员携带具有麦克风的便携式寻呼机大小的设备,其用于收听媒体节目音频中的嵌入的次声频的代码或水印并记录其听到的代码,从而指示在节目被示出或播放时该样本组成员在场。设备周期性地将其日志传送到测量服务器,该测量服务器聚合来自多个设备的日志以确定该节目的代表性的观众群(viewership)。
即使在最好的情况下,样本组也仅在统计学上代表更大的人群(population),并且当样本组大小增加以减少统计误差时可能变得实现起来非常昂贵。另外,由于成员可能无法携带测量设备或填写日志,因此难以确保样本组合规性(compliance)。最后,在许多实例下,样本组测量数据对于家庭可能是不明确的,并且无法区分不同家庭成员的偏好。
发明内容
很多时候,在观看或收听广播中的内容项目时,用户可能会被吸引并决定在互联网上搜索附加信息,诸如搜索歌曲歌词、产品信息、名人目击、当前事件、食谱、或任何其他这样的信息。通过将内容和搜索查询相关联,观众测量服务有可能通过场境(context)关系(例如,搜索与内容项目相对应的信息)以及通过时间关系(例如,在用户的地理区域内在正广播的内容项目的几分钟内进行搜索)来推断搜索者可能是内容的观众成员。此外,由用户特定设备和/或登录的账户发送的搜索查询信息可以与家庭中的特定个体相链接。在一些实施方式中,由于对于非常有趣或引人入胜的内容的观众群可能被高估(over-represent)(由于与内容相关的增加的搜索)而对典型内容的观众群可能被低估(under-represent)(因为诸如天气或无趣的情景喜剧的不太有趣的内容的观众可能不太可能发起与内容有关的搜索),所以相关性可能不允许生成原始观众群数目。因此,在这样的实施方式中,观众测量服务可能测量了参与观众的相对大小或内容的观看者变为参与并主动寻求附加信息的相对“参与性”或可能性。
在一个实施方式中,观众测量服务可以监视区域中的广播,摄取字母或隐藏解说词数据、元数据(如果可用),识别显示的文本或徽标,对广播中显示的人执行脸部辨识,和/或生成广播内容的音频/视频指纹以连同该内容被广播的时间一起创建内容和关联的关键字的数据库。观众测量服务可以从搜索提供者接收用户搜索查询并检测“出峰(spiking)”或“激增(surging)”查询,或者具有低基线查询量但具有在量上大且突然的增加的那些查询。观众测量服务可以确定出峰查询是否在场境或时间上与数据库中标识的内容项目相关,并且推断出生成该查询的用户很可能观看了该内容项目。在一些实施方式中,观众测量服务还可以推断用户很可能在与触发查询的项目相同的广播频道上观看了之前或随后几分钟内显示的其他内容项目(例如广告)。
本文公开的一个实施方式是用于观众测量的方法。该方法包括由观众测量服务器从广播监视系统接收广播内容项目的多个标识和每个内容项目的相应的广播时间。该方法还包括由观众测量服务器从搜索服务接收由搜索服务接收的搜索查询日志和传送每个搜索查询的设备的对应设备标识符。所述方法还包括由所述观众测量服务器从所接收的搜索查询的日志确定第一搜索查询在第一时间具有高于所述第一搜索查询的基线查询量的查询量。该方法还包括由所述观众测量服务器从所接收的广播内容项目的多个标识中检索在第一时间广播的第一内容项目的标识,所述标识对应于所述第一搜索查询;以及由所述观众测量服务器将传送所述第一搜索查询的设备的标识符与所述第一内容项目相关联。
在一些实施方式中,该方法包括将传送所述第一搜索查询的所述设备的用户识别为所述第一内容项目的观众成员。在其他实施方式中,广播内容项目的每个标识包括所述广播内容项目的解说词转录,并且其中所述第一内容项目的标识对应于响应于包括第一搜索查询的解说词转录的所述第一搜索查询。在其他实施方式中,该方法包括确定在所述第一时间的查询量超过所述搜索查询的平均查询量至少预定阈值。
在一些实施方式中,该方法包括:检索在所述第一时间之前的第二时间广播的第二内容项目的标识;以及将传送第一搜索查询的设备的标识符与第二内容项目相关联。在另一实施方式中,该方法包括以第一置信度分值来对所述设备的标识符与所述第一内容项目的关联记分,并且以第二置信度分值来对所述设备的标识符与所述第二内容项目的关联记分,所述第二分值与在所述第二时间和第一时间之间的时间差成比例地低于所述第一分值。在另一实施方式中,该方法包括基于所述第一搜索查询的峰值查询量和所述第一搜索查询的基线查询量之间的差来生成所述第一置信度分值。在另一个进一步的实施方式中,该方法包括接收对于所述第一内容项目的观众测量的请求,以及响应于所述第一置信度分值高于阈值,将所述设备的标识符包括在所述观众测量中。在另一个进一步的实施方式中,该方法包括接收对于所述第二内容项目的观众测量的请求,以及响应于所述第二置信度分值低于阈值,将所述设备的标识符从所述观众测量中排除。
在一些实施方式中,该方法包括在语义字典中检索与所述第一搜索查询相关的实体;并且在第一时间广播的第一内容项目的标识包括所检索的实体。在其他实施方式中,所述方法包括:响应于所述设备的标识符与所述第一内容项目的关联,选择用于呈现给所述设备的第二内容项目。
在另一方面,本公开描述了用于观众测量的系统。该系统包括广播接收器。该系统还包括连接到所述广播接收器的实体提取器,被配置为提取与广播内容项目相关联的实体,并将实体的标识、广播内容项目、和广播时间记录到实体日志。所述系统还包括观众测量服务器,被配置为接收在第一时间具有高于搜索查询的基线查询量的查询量的搜索查询的标识,以及在第一时间传送了所述搜索查询的设备的标识符;并且确定所标识的搜索查询对应于所标识的实体。观众测量服务器还被配置为响应于所述确定,从所述实体日志检索实体的标识和广播时间;以及响应于所述确定,将设备的标识符和广播内容项目的关联添加到观众群数据库。
在一些实施方式中,所述实体提取器包括隐藏解说词解码器,并且其中,所述观众测量服务器还被配置为:响应于所述搜索查询被包括在所述广播内容项目的隐藏解说词转录中,确定所标识的搜索查询对应于所标识的实体。在其他实施方式中,观众测量服务器被进一步配置为确定该查询量在第一时间超过阈值,该阈值包括基线查询量的倍数。在另外的实施方式中,观众测量服务器还被配置为响应于所述实体和所述搜索查询在语义字典中相关联来确定所标识的搜索查询对应于所标识的实体。在其他实施方式中,所述观众测量服务器还被配置为针对所述设备的标识符与广播内容项目的关联生成置信度分值,并将所生成的置信度分值存储在所述观众群数据库中。在进一步的实施方式中,所述观众测量服务器还被配置为响应于所述置信度分值超过阈值,将所述设备的标识符包括在所述广播内容项目的观众测量中。在另一个另外的实施方式中,观众测量服务器被进一步配置为将所述设备的标识符和紧接在所述广播时间之前的第二时间开始广播的广播内容的第二项目的关联添加到所述观众群数据库;并且针对设备的标识符与第二广播项目的关联生成第二置信度分值,所述第二置信度分值从设备的标识符和广播内容项目的关联的置信度分值减少与在所述第二时间和广播时间之间的差成比例的数量。
在另一方面,本公开涉及一种存储指令的计算机可读存储介质,所述指令在由一个或多个数据处理器执行时,使得所述一个或多个数据处理器执行操作,所述操作包括:从广播监视系统接收广播内容项目的多个标识和每个内容项目的对应的广播时间;从搜索服务接收由所述搜索服务接收的搜索查询日志和传送每个搜索查询的设备的对应标识符,所述搜索查询彼此相关,并且在第一时间具有高于搜索查询的基线查询量的合计查询量;从所接收的广播内容项目的多个标识中检索在第一时间广播的第一内容项目的标识,所述标识对应于所述搜索查询;并且将所述设备的标识符与所述第一内容项目相关联。在一些实施方式中,所述指令的执行还使得所述一个或多个数据处理器以置信度分值来对设备的每个标识符与第一内容项目的关联记分,所述置信度分值基于所述第一内容项目的广播的频率。
提及这些实现不限制或限定本公开的范围,而是提供本公开的实施方式的示例以助于理解本公开。可以开发具体实施方式以实现以下优点中的一个或多个。
附图说明
在附图和下面的描述中阐述了一个或多个实施方式的细节。根据说明书、附图、和权利要求书,本公开的其它特征、方面、和优点将变得显而易见,其中:
图1是根据一个实施方式的、在出峰搜索查询、内容流中的内容项目、和观众群置信度分值之间的关系的图示;
图2A是根据一个实施方式的、用于经由出峰搜索查询的观众测量的系统的框图;
图2B是根据一个实施方式的、用于经由出峰搜索查询的观众测量的另一系统的框图;
图2C是根据一个实施方式的广播提供者系统的框图;
图3A是根据一个实施方式的测量服务捕获设备的框图;
图3B是根据一个实施方式的观众测量服务器的框图;
图4A是根据一个实施方式的、用于识别内容项目的观众成员的过程的一个实施方式中采取的步骤的流程图;以及
图4B是根据一个实施方式的、用于观众测量服务器测量内容项目的观众的过程的一个实施方式中采取的步骤的流程图。
各附图中的相似附图标记和名称指示相似的元件。
具体实施方式
诸如电视节目、电影、商业广告或任何其它类型和形式的内容的观众的测量对于测量用于定价和销售广告投放、规划内容递送时程、或其他这样的用途的内容的观众大小或流行度可能是有用的。在传统的地面或卫星广播中,由于缺乏从接收者到提供者的反向信道或通信路径,供应商可能无法直接了解随时收看的接收者的数目。为了克服这个限制,一些观众测量系统已经使用参与个体的样本组,他们同意填写他们已经看到或收听到的内容的调查或日记。然而,该系统依赖于自我报告,这可能降低了准确性。另一个系统要求样本组参与者佩戴或携带便携式设备,该设备经由次声频的音频水印或代码来检测在附近播放的内容,并记录日志以供后续传输到样本组提供者。然而,该系统需要将在作为信号链的一部分要被测量的每个广播源处安装水印编码器,增加了费用和故障率。此外,当诸如在数字视频记录器或其他系统中应用数据压缩时,嵌入的代码可能会失真或损坏。
来自用户的搜索查询可以由其对广播内容的观众群(viewership)发起。通过依据主题或场境(context)内容和时间关系二者来关联内容和搜索查询,观众测量服务有可能推断搜索者很可能是该内容的观众成员。图1包括三个图,其图示了对内容流内的内容项目的出峰搜索查询(spiking search query)和对应的观众群置信度分值的关系。首先参照图1的顶部的图,所图示的是随时间102的查询100的搜索量的样本图。查询100的搜索量可以是搜索服务所接收的查询的速率,诸如每分钟的查询,或者通过任何其他这样的速率或时间帧。一些查询量可能具有相对低的平均基线值102,特别是相对罕见的查询。响应于某些事件——诸如经由广播媒体显示与查询相关的内容,观看民众(view public)中的某些部分可能发起针对查询的互联网搜索请求。对于经由便携式和/或可穿戴式网络连接的计算设备来持续访问互联网的观看者而言尤其如此。如果大量观看者在内容的广播之后的短时间跨度内发起针对查询的搜索请求,则查询的搜索量100可以上升超过基线102一段时间,识别搜索“尖峰”108——有时被称为搜索激增(search surge)、请求的快闪族、热门查询(trending query)、或其他这样的术语。当搜索量100超过阈值104一段时间时、当搜索量100达到基线102以上的峰值106时、和/或当搜索量在短时间帧110内急剧增加时,可以识别出峰查询。可以动态地设置或者可由管理员配置阈值,例如阈值104或量随时间变化的阈值。在一个实施方式中,阈值104可以被设置为平均基线102的两倍或任何其他这样的值;而在另一实施方式中,阈值104可以被设置为等于平均基线102加上每分钟50个查询或任何其他这样的值。
参考图1的中间图示,诸如内容的地面、卫星、或有线广播信道或流的内容流112随时间102可以包括多个内容项目114、116。内容可以包括电视节目、电影、广告、纪录片、包括突发新闻项目的新闻节目、音乐或音乐视频、访谈节目、产品说明、或这些的组合(例如,主题曲中包括音乐以及在场景期间显示产品的电视节目)。内容114、116可以是任何长度,包括30秒广告和两小时电影。尽管仅图示了一个内容流112,但是多个内容流112可以被多个提供者广播到地理区域中的任何数目的接收者或通过到公共网络服务的连接广播。如上所述,响应于观看内容项目114,一些观看者可以针对与内容项目114相对应的信息发起搜索查询,例如关键字、产品名称、男演员或女演员姓名、歌词、地理位置、或任何其他这样的信息。在一些实施方式中,搜索查询可以是诸如一个或多个关键字的文本字符串,而在其他实施方式中,搜索查询可以包括图像或音频记录。
如图1的顶部图示和中间图示的关系中所示,响应于观看在内容流112中的内容项目114,搜索服务可以接收针对对应的一个或多个查询的增加的搜索量100,并且将增加的量识别为尖峰108。如图所示,尖峰108通常在内容项目114被广播之后或在项目114的广播开始之后的某个时刻发生,因为观看者需要时间来发起搜索请求。然而,大量时间后发生的尖峰108可能不与内容项目114的广播相关联。因此,在许多实施方式中,尖峰108可以仅与在尖峰108之前预定时间段内——诸如在1分钟、10分钟、半小时、或任何其他这样的时间内——广播的对应内容项目114相关联。在一些实施方式中,可以响应于搜索量100来设置时间段。如果搜索查询非常罕见,诸如每天一个搜索或更少,则查询108的尖峰可以是每小时一个搜索的速率。这样的尖峰108可以与达一天或更先前广播的内容项目114相关联。然而,如果搜索查询非常常见(例如,每分钟十个搜索),则查询108的尖峰(例如,每分钟一百个搜索)可以与仅达几分钟前广播的内容项目114相关联。类似地,在一些实施方式中,可以响应于内容项目的显示频率来设置该时间段。如果广告在多个流中的某个流112上一小时广播一次,则搜索量中的对应尖峰108可以仅与广告的最新近广播或者在过去十分钟或其他这样的时间段内的广告的广播相关联。
可以经由内容项目114的可能观看者经由设备上的登录账户或经由特定于用户的设备标识符的对作为尖峰108的一部分的搜索查询的发起来推断内容项目114的可能观看者。可以针对设备标识符或用户与内容项目114的关联来设置置信度分值118,如图1的底部图示所示。可以基于搜索查询的峰值106和基线102量之间的差、尖峰108持续时间、在尖峰108内的用户查询的定时、搜索查询的尖峰108的频率、内容项目114的广播频率、或这些或其他这样的信息的任何组合来设定设备标识符或用户与内容项目114的关联的置信度分值。具有带有非常高的峰值106的尖峰108的、带有低基线102的非常罕见的搜索查询——对应于仅非常少广播的内容项目114——可以导致比非常常见的搜索查询更高的置信度分值118,该非常常见的搜索查询针对在一个频道或另一个频道上的内容项目的广播频率仅带有轻微尖峰(例如,可能在广播区域中的不同无线电频道上在数分钟内播放若干次的目前前40的歌曲)。
在内容项目114的广播之前或之后的一段时间内,内容项目114的观看者将以随时间降低的速率保持调谐到相同的频道或内容流112。如图1的底部图所图示,以随时间降低的速率,基于与出峰搜索查询相对应的内容114的置信度分值,可以将观众群置信度分值118应用于设备标识符与广播频道上的其他内容项目116的关联。这些其它内容项目116的置信度分值118可以通过可能完全相同或不同的在前置信度调整率120或随后置信度调整率122进行调整。虽然以减少到与调整120、122相对应的最低量的每个项目116的置信度分值示出,但是在一些实施方式中,置信度分值可以减少中间量,诸如以置信度调整率120、122减少到与项目116的持续时间的一半相对应的分值。
图2A是根据一个实施方式的用于观众测量的系统的图。如图所示,广播者208可以经由卫星或地面射频(RF)广播、有线系统、或经由诸如经流送或经下载内容、VOD系统、或其他这样的系统的互联网协议(IP)来在客户端位置200处向客户端系统递送内容。尽管示出为单个实体,但是在许多实例下,广播者208可以包括诸如国家广播网络源的广播源、接收并重新分配网络源(有时与额外的本地或特定于区域的内容一起)的区域或本地网络分支机构、有线广播提供者、互联网服务提供者(ISP)、或其他各种附属和非附属实体。
内容可以由客户端系统在接收器202a处接收,接收器202a可以包括天线或卫星碟形天线和解调器或解码器、有线接收器、数字电视(DTV)解码器、机顶盒、DVR、计算设备、或用于接收具有隐藏解说词数据的内容的任何其他类型和形式的设备。接收器202a可以连接到多媒体系统204,诸如电视、家庭影院系统、或用于显示由接收器202a接收和解码的音频和/或视频内容的任何其它类型和形式的设备。在一些实施方式中,接收器202a可以和多媒体系统204组合,如在具有附接天线或所包括的有线解调器的许多电视机、“智能”或互联网附接的电视机、或其他这样的设备中。
客户端位置200处的用户可以使用客户端设备206经由网络210向搜索系统212传送对信息的搜索查询或请求。在许多实例下,搜索查询可以响应于用户观看由接收器202a接收的内容项目而被传送,并且因此可以在场境上和时间上对应于内容项目。客户端设备206可以是台式计算机、膝上型计算机、平板计算机、智能电话、可穿戴计算设备、娱乐或视频游戏控制台、智能电视、机顶盒、或能够经由网络210向搜索系统212传送用户生成的搜索查询的任何其他类型和形式的设备。
网络210可以是任何形式的计算机网络或网络的组合,其在一个或多个客户端设备206和一个或多个搜索服务器214以及未图示出的其他设备和系统之间中继信息(例如,网站、互联网服务提供者、有线提供者等)。网络108可以包括互联网和/或其他类型的数据网络,诸如局域网(LAN)、广域网(WAN)、蜂窝网络、卫星网络、或其他类型的数据网络。网络210还可以包括被配置为在网络210内接收和/或传送数据的任何数目的计算设备(例如,计算机、服务器、路由器、网络交换机等)。网络210还可以包括任何数目的硬连线连接和/或无线连接,使得客户端设备206可以与硬连线(例如,经由光纤线缆、CAT5线缆等)到网络210中的其他计算设备的收发器无线地(例如,经由WiFi、蜂窝、无线电等)通信。在一些实施方式中,网络210可以是:虚拟网络,诸如由单个物理机器执行的多个虚拟机之间的虚拟网络;或抽象网络,诸如经由物理上可移动的介质(例如,Sneakernet、经由磁带介质传输数据、CD-ROM、闪存介质、外部硬盘驱动器、软盘等)的数据的离线传输。
客户端设备206可以将查询传送至搜索系统212,有时称为搜索提供者、互联网搜索提供者、或类似的术语。搜索系统212可以包括一个或多个搜索服务器214,其可以被配置在服务器群、云、或其他网络配置中。搜索系统212可以从客户端设备206接收搜索查询,并以诸如网站、列表、索引或其他格式的任何类型或形式的搜索结果来进行响应。搜索查询可以包括字母数字字符串或关键字、音频记录、图像、视频记录或其他这样的信息。在许多实施方式中,客户端设备206可以向搜索系统212传送设备的标识符以作为搜索查询的一部分,或者可以包括响应于在前的搜索查询、对由搜索系统212或相关联的系统提供的服务的登录而从搜索系统212接收或者由客户端设备206以其他方式获得cookie或其他标识符,以唯一地标识传送搜索查询的客户端设备206和/或客户端设备206的用户。因此,虽然一般地被称为设备标识符或设备的标识符,但是在许多实施方式中,标识符可以标识设备的用户而不是设备本身。标识符可以是字母数字字符串、数据字符串、序列号、媒体访问控制(MAC)地址、互联网协议(IP)地址、用户名或账户名、全局唯一标识符(GUID)、cookie、随机或伪随机数、或任何其他类型和形式的标识符——包括这些或其他标识符的组合,以用于识别客户端设备206。在一些实施方式中,设备标识符可以固定到设备或者在设备中预先配置,例如制造者序列号或MAC地址,而在其他实施方式中,设备标识符可以由搜索服务、由观众测量服务器、或其他实体诸如经由cookie或用户名来动态地设置。在一些实施方式中,可以针对向搜索服务器的每个通信设置唯一或新的设备标识符,而在其他实施方式中,设备标识符可以不被改变,或者可以周期性地改变(例如,每小时、每天、每周等)或在其他间隔(例如,在重新启动捕获设备、登录到互联网服务等时)。可以在搜索查询的传输之前、与其一起、或在其之后将设备标识符传送到搜索服务器。在一个实施例中,客户端设备可以使用设备标识符登录搜索服务或与搜索服务建立认证会话。在另一个实施例中,客户端设备可以在分组的主体中传送搜索查询,其中设备标识符包括在分组的报头中。可以经由表述性状态转移(REST)协议、超文本传输协议(HTTP)请求(例如,具有作为参数值对的查询数据的POST或GET请求)或经由任何其他这样的应用、会话、或表示层协议来传送查询。搜索系统212可将搜索请求和设备标识符存储在搜索日志数据库216中。在一些实施方式中,可以对请求和设备标识符进行加密、散列、或匿名化以保护个人的隐私。
测量系统218——有时也被称为观众测量提供者——也可以从广播者208或其他这样的内容标识接收内容流。在一些实施方式中,测量系统可以包括接收器202b,其可以类似于在客户端位置200处的接收器202a。接收器202b可以经由地面或卫星广播、有线系统、互联网、或任何其他这样的方式来从广播者208接收内容,并且可以将视频输出到测量服务捕获设备220、指纹生成器224、或其他这样的设备。在一些实施方式中,接收器202b可以与接收器202a处于相同的地理区域。在一个这样的实施方式中,至少一个接收器202b可以被部署在主要城市或广播市场中以从本地广播者208捕获广播。在其他实施方式中,接收器202b可以被部署在其他地方,并且可以接收类似但不同的广播。接收器202b可以经由有线系统接收国家网络广播,而接收器202a可以从国家网络广播机构的本地分支机构接收地面广播。这样的本地分支广播可以包括类似的内容,但是可以具有不同的插播式广告、本地新闻广播、或其他所插入或所修改的内容。虽然仅图示了一个接收器202b,但是在一些实施方式中,多个接收器202b可以部署在一个位置;例如待测量的每个广播者一个接收器。在其他实施方式中,接收器202b可以具有多个调谐器、解调器、或子接收器,并且可以能够同时地接收多个广播并将其输出到对应的多个测量服务捕获设备220和/或指纹生成器224。
联邦通信委员会(FCC)法规要求所有美国广播公司为电视节目提供隐藏解说词。在符合国家电视系统委员会(NTSC)标准的模拟电视广播中,在EIA-608格式中隐藏解说词被编码在垂直消隐间隔的行21内,EIA-608格式由电子工业联盟(EIA)开发,经常被称为“行21字幕”。对于符合高级电视系统委员会(ATSC)标准的数字电视广播,经由三个编码流来提供隐藏解说词,其中两个编码流提供与NTSC解码器的向后兼容性,第三个编码流提供多达63个以EIA-708格式编码的附加字幕流(有时称为“CEA-708”格式)。由于隐藏解说词是特定于内容的,所以编码文本可以用于识别观众正在观看的特定节目,并且因此可以经由本文公开的系统和方法用于观众测量。因为每个广播者已经在生成和嵌入字幕,所以这些系统和方法不需要在站点或有线提供者处安装任何附加的编码器。许多其他国家要求隐藏解说词或字幕数据的相似的嵌入,或者可以由私人实体提供隐藏解说词,其可以以类似的方式使用(例如英国的通信部(Ofcom)颁布的字幕要求;澳大利亚的红蜂媒体(Red Bee Media)等)。
捕获设备220可以从接收器202b(例如,有线或HDTV解码器、机顶盒、数字视频录像机(DVR)、接收器、电视输出、或其他这样的来源)接收NTSC/ATSC/DVB和/或ISDB视频信号。捕获设备220可以解码隐藏解说词信号(例如,编码的行21信号和/或嵌入式EIA-708流)以用于生成隐藏解说词文本222的数据库。可以经由接收本地或国家广播信号的一个或多个捕获设备220填充数据库,或者可以利用由广播者单独提供的数据(例如元数据、文本文件、辅助数据、或其他这样的传输)来填充数据库。
虽然在测量系统中分组地示出,但是在一些实施方式中,接收器202b不需要在地理上接近测量服务捕获设备220和/或观众测量服务器228定位。在这样的实施方式中,接收器202b可以经由诸如互联网的网络210来与测量服务捕获设备220进行通信;和/或测量服务捕获设备220可以经由网络210与观众测量服务器228进行通信。在一个实施方式中,接收器202b和/或测量服务捕获设备220可以部署在广播传输站点或工作室(studio),并且接收发射器前(pre-transmitter)视频馈送或来自站点或工作室处的监视接收器的馈送,并且可以经由网络210将解码的隐藏解说词数据或日志222传送到观众测量服务器228。
如上所述,在一些实施方式中,测量系统可以包括存储隐藏解说词数据——通常被称为解说词日志222——的数据库或存储设备222。数据库222的隐藏解说词数据可以从测量服务捕获设备220接收,或者可以直接从广播者208接收。在一个实施方式中,隐藏解说词数据可以在视频信号中编码之前被截取和/或经由广播站点或工作室处的监视输出被解码隐藏解说词,并且可以经由网络210传送以用于存储在隐藏解说词数据库222中。在一个类似的实施方式中,可以从广播者208非实时地提供隐藏解说词数据,以包含在隐藏解说词数据库222中。在一个实施方式中,广播者208可以在播放电影或电视节目期间有时在广播之前的数小时、数日、或数星期单独提供要嵌入视频信号中的隐藏解说词数据的文本或数据文件。类似地,广播者208可以提供在VOD库中的一个或多个内容项目的隐藏解说词数据的文本或数据文件。
尽管与观众测量服务器228分开示出,但是在许多实施方式中,隐藏解说词数据222可以是观众测量服务器228的一部分,或由观众测量服务器228维护。因此,在这样的实施方式中,观众测量服务器228可以从广播者208和/或测量服务捕获设备220接收隐藏解说词数据,并且可以将该数据存储在隐藏解说词数据库222中。
隐藏解说词数据库222可以包括关系数据库、平面文件、数据文件、或任何其他类型和形式的数据库。在一些实施方式中,隐藏解说词文本可以作为文本存储在数据库222中。在其他实施方式中,隐藏解说词文本的一部分(例如,多个词或字符,例如5个词、8个词、10个词、50个词、或任何其他这样的值;多个视频场中的数据量,例如来自一个视频场、10个视频场、或任何其他这样的值的隐藏解说词数据;或者在预定时间段内的数据量,诸如在5秒的视频、10秒的视频、或任何其他这样的值内嵌入的隐藏解说词数据)可以被散列或用作散列法算法的输入,其中结果被录入到数据库中或用作数据库中的条目的索引。隐藏解说词数据库222还可以包括与隐藏解说词数据或隐藏解说词数据的一部分相关联的内容项目的标识。在从广播者非实时地接收隐藏解说词数据的实施方式中,数据可以被明确地识别为与内容项目相关联。在经由接收器202b接收隐藏解说词数据并由测量服务捕获设备222解码的其他实施方式中,数据可以基于广播时程、嵌入的元数据、或其他这样的信息来与内容项目相关联。在其他实施方式中,数据可以与内容被接收器202b接收的频道和广播时间相关联,并且可以随后——诸如在观众测量的后续步骤期间——基于广播时程来与内容项目相关联。
观众测量系统218还可以包括一个或多个指纹生成器224。指纹生成器224可以包括用于识别作为广播内容流的一部分的、由广播者208提供的内容项目和/或广告的硬件和/或软件。在一些实施方式中,指纹生成器224可以通过下述方式来生成内容项目的音频和/或视频指纹:通过对内容项目的音频数据和/或视频数据进行采样并计算得到的音频数据和/或视频数据的散列、通过抽取音频数据和/或视频数据(例如,通过去除十个样本中的九个)并且散列化被抽取的数据、通过计算音频数据与视频数据的卷积、或者以其他方式创建内容项目的唯一标识符。指纹可以存储在指纹数据库226中,并与其他指纹进行比较以识别是否先前在相同或不同的广播流中提供了内容项目。相同的广告可以由广播者208在不同时间在多个频道上提供,或者可以在不同时间在市场上的多个无线电台上播放流行的歌曲。对样的内容的音频和/或视频进行指纹识别可以允许对内容的观众的聚合测量,以及分辨对内容的广播的不同实例的搜索尖峰。在一些实施方式中,诸如广告的内容的指纹可以被预先生成或添加到指纹数据库226。指纹生成器224可以接收传入音频或视频,并将针对音频或视频生成的指纹与数据库中的指纹进行比较。匹配可以允许测量系统218辨识出正在广播诸如广告的已知内容的特定项目。测量系统218可以向数据库234添加标识以指示已知内容在指定时间在指定频道上广播。
观众测量系统可以包括一个或多个观众测量服务器228。观众测量服务器228可以包括一个或多个计算设备、服务器、台式计算机、机架安装计算机、工作站、或用于从搜索系统212接收搜索日志216的其他设备(诸如经由与网络210类似或相同的网络210'),以用于识别搜索日志216内的出峰查询,并且用于基于解说词日志222和/或指纹226来将出峰查询与内容项目相关联。在一些实施例中,观众测量服务器228可以是由一个或多个物理机器——诸如在云服务器或服务器群中——执行的一个或多个虚拟机器。观众测量服务器228可以位于测量服务捕获设备220附近,或者可以远离一个或多个测量服务捕获设备220,并且可以通过网络210与设备进行通信。
测量服务器228可以经由网络210'从搜索系统212接收搜索日志216。如上所述,搜索日志216可以包括搜索的标识和对应的设备标识符或匿名设备标识符。在一些实施方式中,搜索可以被搜索系统聚合成在指定时间段内提供特定查询的一组设备标识符(例如,在十秒钟的时间段内传送对“x”的搜索的所有设备标识符)。这可以减少特别流行的搜索查询的搜索日志216所需的带宽和存储空间。在各个实施方式中,搜索日志或出峰查询数据可以以推送或请求-响应的方式来提供。
在一些实施方式中,观众测量服务器228可以接收整个搜索日志216并且识别或提取出峰查询,而在其他实现中,搜索系统212可以识别出峰查询,并且仅将这些查询的日志数据传送到观众测量服务器228。在一些实现中并如上面结合图1所讨论的,可以通过下述方式来识别出峰查询:识别查询的基线搜索率(例如每十分钟一个查询),并且以查询的提高的搜索速率或对查询的搜索的提高的变化率来识别时间段(例如,激增或尖峰)。在一些实施方式中,响应于对查询的搜索速率超过阈值,可以识别出峰查询。阈值可以基于基线速率来动态地设置,——诸如基线速率的两倍或三倍,或等于基线速率加上指定时间段内的值。在其他实施方式中,可以基于随时间的搜索速率的变化率或搜索量的变化(dV/dT)超过阈值(例如,每秒10个查询的量每秒增加每秒1个查询)来识别出峰查询。
在一些实施方式中,出峰查询可以包括若干不同但相关的搜索查询。观众测量服务器228和/或搜索系统212可以经由查询(例如,关键字、图像、声音等)与类别的语义字典或映射将查询识别为相关。在一个这样的实施方式中,演员的图像可以在语义映射中与演员的姓名、演员出现过的一组电影或电视节目、演员已经宣传的一组产品等相关。响应于显示包括演员的内容项目(例如,一个这样的电视节目),可以将对于任何相关查询的搜索请求识别为针对语义类别的出峰查询。在另一个实施方式中,歌曲歌词中的每个词可以被映射到该歌曲,从而允许用户搜索歌词的任何子集以被计数,以用于响应于正在本地无线电台播放的歌曲来检测歌曲的出峰查询的目的。语义映射也可以应用于解说词日志222和/或指纹数据库226,使得观众测量服务器228可以基于任何相应映射的查询来识别相关内容项目。
如上所述,一旦已经识别出出峰查询,观众测量服务器228可以确定在尖峰之前的预定时间段内是否已经广播内容项目。测量服务器228可以在解说词日志222和/或指纹数据库226内搜索查询(或语义映射的类别和/或类别相关的查询)。在其他实施方式中,如上所述,指纹数据库226可以包含诸如广告或其他这样的内容的已知的内容项目的指纹和标识。测量服务器228可以将针对传入实况音频或视频生成的签名与先前存储的指纹进行比较,以辨识正在广播的诸如广告的已知内容的特定项目。测量系统218可以向实体数据库234添加标识。在识别出峰查询后,测量系统218可以在数据库中搜索对应的实体(诸如与特定广告相关的关键字),并且可以确定广告是否是在查询尖峰之前的预定窗口或时间段(例如3分钟)内广播。如果是这样,则测量服务器228可以推断传送对应查询的设备具有很可能观看广播实体或内容的用户。在一些实施方式中,测量服务器228可以使用针对包括所接收的文本的解说词日志222中的文本字符串的搜索算法。如上所述,在字幕数据被散列或以散列形式存储在数据库中的实施方式中,测量服务器228可以确定在数据库中由散列计算值标识的索引处是否存的条目,使得这样的条目(具有内容的相关联的标识)的存在指示出峰查询匹配从测量服务捕获设备220或从广播者208接收的数据。
为了进一步增加与内容相关联的隐藏解说词字符串的唯一性,可以从数据库222中去除较旧内容或隐藏解说词数据。许多广播节目每天或每周呈现(例如,具有完全相同介绍的夜间新闻广播或各集独立的情景喜剧(episodic sitcom)等)。来自这些节目的隐藏解说词数据可以在一天或一周的对应时间段之后从数据库222中去除,从而消除了出峰查询匹配相同节目的当前呈现和先前呈现二者的可能性。在其他实施方式中,内容或隐藏解说词数据可以与广播时间相关联,并且出峰查询可以从在尖峰之前的预定时间段(例如,达3分钟)起与数据库中的实体进行比较。使用短比较窗口可以增加相关联实体的广播是尖峰的触发的置信度。可以保留较旧的解说词或内容数据以用于与历史搜索日志进行比较。
如果测量服务器228识别匹配的指纹或解说词日志条目,或者识别出在预定时间段内广播者208广播与指纹或字幕相对应的内容项目,则测量服务器228可以确定在尖峰期间接收的查询是由观看内容项目的用户发起的。响应于该确定,测量服务器可以将与对应查询相关联的设备标识符添加到观众群数据库230中针对该内容项目的条目。如上所述,在一些实施方式中,测量服务器可以针对每个设备标识符向观众群数据库添加置信度分值或度量。置信度分值可以基于在基线量之上的搜索的峰值量、对于查询的搜索的频率、内容项目的广播频率、或任何其它这样的信息或信息组合。在一些实施方式中,测量服务器还可以针对紧接在与出峰查询相关联的内容项目的广播之前和之后的相同媒体和频道上广播的其他内容项目,将设备标识符添加到数据库230中的条目。测量服务器可以进一步为每个设备标识符的其他内容项目添加置信度分值,所述置信度分值基于之前和随后的置信度分值调整因子而减小,如上面结合图1所讨论的。
在一些实施方式中,在将设备标识符添加到观众群数据库230之前,测量服务器228和/或搜索系统212可以提取已知在广播者208的地理广播区域中的设备的设备标识符的子集,该广播者208提供经由解说词日志222或指纹数据库226识别的内容项目。这可以允许在观看内容项目之后发起查询的用户和处于不同广播区域并且在类似时间巧合地发起类似的查询的其他用户之间的分辨。在这样的实施方式中,搜索系统212可以利用搜索请求或在与搜索系统212的先前交互期间(例如,在登录到相关联的服务时、利用先前的搜索请求等)从客户端设备206接收位置信息。在其他实施方式中,可以基于广播方法从该子集排除设备标识符以添加到观众群数据库230(例如已经通知测量系统和/或搜索系统他们不拥有电视机的用户的设备标识符可以不被包括在与被广播的内容项目相关联的数据库230条目中,但是可以被包括在与经由互联网流传送的内容项目相关联的数据库230条目中)。
简要地参考图2B,图示的是在与图2A的实施方式类似的实施方式中的观众测量系统的框图。如图所示,除了提取隐藏解说词数据的测量服务捕获设备220以外或者作为其替代,测量系统可以包括光学字符识别(OCR)检测器232、音乐检测器236、和/或人检测器238,一般称为实体检测器。有时称为屏幕掘取器(screen scraper)或文本分析器的OCR检测器232可以识别视频信号中的文本并提取显示的词。这可以有助于从广播图像中提取产品、地点、或商家名称。提取的文本可以被添加到实体数据库234并且与广播内容项目(例如,频道和时间)相关联。在一个类似的实施例中,OCR检测器232或另一个屏幕掘取器可以识别产品徽标或商标、产品图像、或其他这样的特征,并且可以将对应的标识(例如从图像搜索系统接收的标识)添加到实体数据库234。在另一个类似的实施例中,测量系统218可以包括语音转文本引擎(未示出),其可以自动地转录包括来自广播的讲出的词的输入音频。
类似地,音乐检测器236可以针对音乐(例如,主题歌曲、音乐视频的音频、无线电音乐广播等)来监视广播,并且提取音乐的签名。签名可以被传送到搜索系统212和/或音乐匹配服务,其可以用歌曲、艺术家、专辑、歌词、或其他这样的信息的标识来响应。这些标识可以被添加到实体数据库234并与广播内容项目相关联。
同样,人检测器238可以监视视频广播并检测出现在视频中的脸部。人检测器238可以为检测到的脸部(例如,通过使用特征脸的主成分分析、线性判别分析、弹性束图匹配、或任何其他这样的辨识系统)生成脸部识别签名,并且可以将签名查询传送到搜索系统212和/或脸部辨识服务,其可以以对应的男演员、女演员、名人、或其他这样的人的标识来响应。该标识可以被添加到实体数据库234并与广播内容项目相关联。
因此,在一些这样的实施方式中,可以将文本(例如在屏幕上或在隐藏解说词数据中显示的文本)、音频、脸部图像、徽标、元数据、或其他这样的信息或标识实体添加到数据库234并与广播内容项目、时间、和/或频道相关联,以用于与上述的出峰查询匹配。
图2C是根据一个实施方式的广播提供者系统的框图。如图所示,广播者208可以包括一个或多个媒体源250。虽然仅图示了一个媒体源,但是可以容易地理解,典型的广播者208可以包括多个工作室、媒体播放源、卫星下行链路、或其他器材,其可以经由混合器、路由器、交换机、或其他接口混合或选择,并提供给一般被称为编码器256的隐藏解说词编码器或嵌入器256。
如上所述,编码器256可以从一个或多个源——例如字幕输入接口252和/或隐藏解说词数据文件254——接收隐藏解说词数据,并且可以以EIA-608和/或EIA-708格式或其他类似格式将数据编码或嵌入。可以经由输入接口252(例如计算设备、键盘、文本转语音转换器等)插入隐藏解说词以用于实况节目,诸如实况体育或新闻广播事件;或者可以由预录制内容——诸如电影或电视节目——的节目制片人或第三方服务提供隐藏解说词。隐藏解说词数据文件254可以经由自动化或用于在空中广播的播放期间进行同步嵌入的其他系统发送到编码器256。
在一些实施方式中,编码器256的输出可以被提供给发射器258,诸如卫星发射器、地面发射器、微波发射器、或线缆调制器;可以被提供给web服务器260以用于流式广播;和/或可以被提供给VOD服务器262,以用于响应于请求而传输到客户端。在一些实施方式中,来自源250和隐藏解说词数据254的媒体内容可以分别被提供给VOD服务器262,而无需嵌入或者用于经由客户端侧接口来嵌入。
图3A是根据一个实施方式的诸如测量服务捕获设备220的隐藏解说词捕获设备的框图。捕获设备220可以包括视频输入300。视频输入300可以是任何类型和形式的视频输入,包括模拟复合或分量视频输入、基带或RF视频输入、数字视频输入、或任何其他类型输入。在一些实施方式中,捕获设备220可以包括视频分割器302和视频输出304。在一个这样的实施方式中,捕获设备220可以被部署为接收器的视频输出和电视或其他显示器的视频输入之间或接收器与指纹生成器224之间的中介设备。因此,捕获设备220可以包括用于连接到接收器的视频输入300、用于将输入信号分割以由隐藏解说词解码器306处理的视频分割器302和用于连接其他设备的视频输出304。在其他实施方式中,捕获设备可以不包括视频分割器302和视频输出304。
视频输入300或视频分割器302的输出可以被提供给一般被称为解码器306的隐藏解说词解码器306。解码器306可以包括硬件、软件、或硬件和软件的组合。在一个实施方式中,解码器306可以包括CMOS集成电路(IC),诸如由Illinois州Schaumburg的Motorola公司制造的MC144144系列IC或等效的IC;可编程IC或现场可编程门阵列(FPGA);或任何其他类型和形式的电路或电路的组合。在另一实施方式中,捕获设备220可以包括处理器314和存储器设备316,并且可以执行软件解码器306,软件解码器306可以读取连接到视频输入端300的模数转换器的数字输入或输出。
解码器306可以输出隐藏解说词数据的一个或多个字符串。EIA-608允许信息的四个通道。在一些实施方式中,解码器306可以输出多个这些通道,而在其他实施方式中,解码器306可以输出单个通道或者被选择性地设置为输出单个通道。类似地,EIA-708允许63个通道加上两个向后兼容的EIA-608通道,并且解码器306可被设置为输出嵌入的通道中的一个或多个。
在一些实施方式中,捕获设备220可以包括散列计算器308。散列计算器308可以包括用于对来自隐藏解说词解码器306的输出数据的字符串执行散列法计算的硬件、软件、或硬件和软件的组合。散列计算器308可以包括被编程为执行加密或非加密散列法函数的IC、PIC、FPGA、或其他硬件,加密或非加密散列函数诸如消息摘要算法(MD)散列(例如MD2、MD4、MD5、MD6等)、安全散列算法(SHA)散列、或任何其他类型和形式的散列函数。在其他实施方式中,散列计算器308可以包括存储在存储器316中并由解码器306的输出上的处理器314执行的软件算法。如上所述,散列计算器306可以对任何数目的字符或词执行散列法计算,并且可以利用滑动窗口对从解码器306输出的重叠数据集执行散列法计算。
在一些实施方式中,解码器306和/或散列计算器308的输出可以缓冲在缓冲器310中,诸如先入先出(FIFO)缓冲器、环形缓冲器、或类似的存储器结构。由于隐藏解说词数据的单个字段可能只是几个字或字符,所以可能更有效率的是,在通过网络传送数据或将数据写入到日志或实体数据库之前收集几千字节或更多的隐藏解说词数据和/或散列计算结果。因此,在这样的实施方式中,数据可以在缓冲器310中缓冲预定的时间段,或者可以缓冲预定数目的数据以用于随后的传输。
在一些实施方式中,缓冲器310和/或解码器306或散列计算器308的输出可以经由网络接口312传送或流送到观众测量服务器和/或实体数据库234或解说词日志222。网络接口312可以包括任何类型和形式的网络接口,包括有线接口(例如,以太网,包括10Base T、100Base T、或1000Base T(“千兆位”))、无线接口(例如802.11a、802.11b、802.11g、802.11n、802.11.ac、蓝牙、蓝牙低功耗、近场通信(NFC))、蜂窝接口、或用于通过网络传送数据的任何其他类型的接口。在一些实施方式中,网络接口312可以包括并行或串行接口,诸如USB接口、IEEE 1394(火线)接口、RS-232接口、RS-485接口、或到另一个计算设备的任何其它类型和形式的接口。在许多实施方式中,第二计算设备可以充当用于与观众测量服务器的通信的中介。在一个这样的实施方式中,捕获设备可以经由USB接口与台式计算机进行通信,该台式计算机可以经由以太网接口将捕获的隐藏解说词数据传送到连接至互联网的网络网关或交换机,以用于传输到观众测量服务器。在这种实施方式中,网络接口312可以被称为通信接口。在一些实施方式中,捕获设备220可以将经解码和/或经散列的数据存储在存储器316中,以用于经由连接到网络210的计算设备的后续同步或传输。
如上所述,在许多实施方式中,捕获设备220可以包括处理器314。处理器314可以包括任何类型和形式的处理单元,包括微处理器、专用集成电路(ASIC)、FPGA等或这些或其他处理单元的组合。在许多实施方式中,处理器314可以是多核处理器或处理器阵列。捕获设备220还可以包括存储器316,其可以包括但不限于能够向处理器314提供程序指令的电子、光学、磁性、或任何其他存储设备。存储器316可以包括软盘、CD-ROM、DVD、磁盘、存储器芯片、ROM、RAM、EEPROM、EPROM、闪速存储器、光学介质、或处理器314可以从其读取指令并且在一些实施方式中处理器314可以向其写入经解码或经散列的隐藏解说词数据以供经由网络接口312进行后续传输的任何其他合适的存储器。所述指令可以包括来自任何合适的计算机编程语言的代码,该语言诸如但不限于C、C++、C#、Java、JavaScript、Perl、HTML、XML、Python和Visual Basic。
在一些实施方式中,捕获设备220可以包括设备标识符318。设备标识符318可以是用以识别捕获设备220的字母数字字符串、数据字符串、序列号、MAC地址、IP地址、用户名或账户名、GUID、cookie、随机或伪随机数、或任何其他类型和形式的标识符,包括这些或其他标识符的组合。在一些实施方式中,设备标识符318可以固定到设备或者在设备中预先配置,诸如制造者序列号或MAC地址,而在其他实施方式中,设备标识符318可由样本组提供者、由观众测量服务器、或其它实体诸如经由cookie或用户名来动态地设置。在一些实施方式中,可以为向观众测量服务器的每个通信设置唯一或新的设备标识符318,而在其他实施方式中,设备标识符318可以不被改变,或者可以周期性地改变(例如,每小时、每天、每周等等)或以其他间隔(例如,在重新启动捕获设备、登录到互联网服务等时)。设备标识符318可以在传输经解码和/或经散列的隐藏解说词数据之前、与其一起、或在其之后被传送到观众测量服务器,使得数据可以被识别为已被设备220捕获。在一个实施例中,捕获设备220可以使用设备标识符318登录观众测量服务器或建立与观众测量服务器的认证会话。在另一实施例中,捕获设备220可以在分组的主体中传送隐藏解说词数据,其中设备标识符包括在分组的报头中。隐藏解说词数据可以经由RESTful协议、HTTP请求(例如具有解说词数据作为参数值对的POST或GET请求)或经由任何其他这样的应用、会话、或表示层协议来传送。在其他实施方式中,可以经由诸如TCP或UDP分组的传输层协议分组报头的选项字段来传送隐藏解说词数据。在其他实施方式中,可以将隐藏解说词数据作为串行比特流提供。
在一些实施方式中,捕获设备220可以包括电源320。电源320可以包括电池、AC电源、DC电源、USB电源、有源以太网(PoE)电源、感应电源、或任何其他类型和形式的电源。虽然在捕获设备220内部图示,但是在许多实施方式中,电源320可以在设备220的外部,诸如外部AC-DC转换器。
图3B是根据一个实施方式的观众测量服务器228的框图。在如上所述的许多实施方式中,观众测量服务器228可以包括诸如服务器群或集群或者设备云的经由网络连接的多个设备。在其他实施方式中,一个或多个观众测量服务器228可以包括由物理机器执行的虚拟机。因此,在这样的实施方式中,观众测量服务器228可以包括接口、存储器、和处理器350-356中的每一个中的一个或多个。
观众测量服务器228可以包括一个或多个存储设备或捕获设备接口354以及一个或多个网络接口356。如上所述,在许多实施方式中,捕获设备220可以经由到网络接口356的网络210来与观众测量服务器228进行通信。网络接口356可以包括任何类型和形式的网络接口,诸如有线接口(例如,以太网)、无线接口(例如,802.11a、802.11b、802.11g、802.11n、802.11.ac、蓝牙、蓝牙低功耗、NFC接口等)、蜂窝接口或用于从捕获设备220接收数据的任何其它类型的接口。网络接口356还可以用于与搜索服务进行通信和/或用于从搜索服务接收搜索日志或出峰查询的日志。在一些实施方式中,网络接口356还可用于向音乐匹配服务或脸部辨识数据库服务提供音乐或脸部辨识数据,并用于接收匹配实体的标识。
在许多实施方式中,如上所述,观众测量服务器228可以本地地部署到观众测量捕获设备220。在这样的实施方式中,捕获设备可以经由网络接口356或者经由捕获设备接口354连接,网络接口356或捕获设备接口354包括并行或串行接口,诸如USB接口、IEEE 1394(火线)接口、RS-232接口、RS-485接口、或任何其他类型和形式的接口。在许多实施方式中,观众测量服务器228可以连接到一个或多个存储设备,诸如硬盘驱动器、闪存驱动器、独立盘冗余阵列(RAID阵列)、网络附接的存储(NAS)设备、存储区域网络(SAN)设备、或任何其他类型和形式的存储器。如上所述,这样的存储设备可以存储从一个或多个广播者208、一个或多个观众测量捕获设备220接收的隐藏解说词数据222,或其他数据。存储设备还可以存储实体数据库234、指纹数据库、观众群数据库230、和/或观众测量数据,下文进行更详细讨论。
观众测量服务器228可以包括一个或多个处理器350,其包括一个或多个微处理器、ASIC电路、FPGA等、或这些或其他处理单元的组合。在许多实施方式中,处理器350可以是多核处理器或处理器阵列。在其他实施方式中,处理器350可以包括由物理处理器执行的虚拟处理器。处理器350可以被配置用于执行测量引擎358和/或散列计算器360,以及用于经由网络接口356和捕获设备接口354与捕获设备220和/或存储设备进行通信。
观众测量服务器228还可以包括存储器352,其可以包括但不限于能够向处理器350提供程序指令的电子、光学、磁性、或任何其他存储设备。存储器352可以包括软盘、CD-ROM、DVD、磁盘、存储器芯片、ROM、RAM、EEPROM、EPROM、闪速存储器、光学介质、或处理器350可从其读取指令并且处理器350可以向其写数据的任何其他合适的存储器。如图所示,在一些实施方式中,隐藏解说词数据库220、实体数据库234、指纹数据库、和/或观众群数据库230可以存储在存储器352而不是外部存储设备中。
存储器264可以包括测量引擎358。测量引擎358可以包括应用、服务、服务器、守护进程(daemon)、例程、子例程、或其他可执行逻辑,以用于经由对基线查询量的识别并对量与阈值的比较或量变化率与阈值的比较来识别出峰查询,和/或用于将出峰查询与隐藏解说词或实体数据库进行比较,以识别与查询相对应的广播内容项目。如上所述,在一些实施方式中,测量引擎358可以基于基线查询量、内容频率、尖峰长度、或任何其他这样的特征来动态地确定阈值。
测量引擎358可以执行一个或多个匹配或比较功能,诸如搜索功能、查找功能、或任何其他这样的功能。测量引擎358可以识别出峰搜索查询或从搜索服务接收搜索查询的标识,并在与搜索查询相对应的关键字或实体的实体数据库或隐藏解说词数据库内进行搜索。如上所述,在一些实施方式中,测量引擎358可以搜索与出峰查询不同但相关(例如在相同的语义类别中)的语义上相关的关键字或实体。可以在语义字典中识别关键字或实体之间的相互关系和/或语义类别。一旦在与出峰查询相对应的数据库中识别出关键字或实体,则测量引擎358可以检索与该关键字或实体相对应的广播时间和频道的标识或广播流标识,并且识别该时间是否在搜索尖峰的特定的时间段内。在一些实施方式中,只有在指定的时间段(例如5分钟、10分钟、15分钟、1小时、或任何其他这样的时间)内广播内容项目时,内容项目才可以被识别为触发尖峰。可以基于内容项目的广播的频率来选择该时间段,其中广播越频繁时间段越短;可以基于尖峰的长度来选择该时间段,其中搜索峰值越长时间段越长;和/或可以基于这些或其他信息的任何组合来选择时间段。
在一些实施方式中,测量引擎358可以维护观众群数据库230。观看数据库230可以包括任何类型和形式的数据库——包括数据文件、平面文件、关系数据库、结构化数据库等——以用于存储内容和/或广播频道的标识和时间段以及发起查询的客户端设备的设备标识符的对应集合,该查询匹配于由测量捕获设备220捕获或从广播者208接收的内容的对应数据。一旦内容项目被识别为触发搜索尖峰,则传送对应的搜索请求的设备标识符可以被添加到与内容项目相关联的观众群数据库230中。测量引擎358可以对在数据库230中与内容项目相关联的唯一设备标识符进行计数,以确定内容的观众测量。观众群数据库230还可以存储每个设备标识符与内容项目的匹配的置信度分值。置信度分值可以基于尖峰峰值水平和基线搜索量之间的差异,其中越大的差异对应于越高的置信度分值;和/或可以基于搜索尖峰的频率,其中越频繁的尖峰对应于越低的置信度分值。在一些实施方式中,置信度分值可以基于语义对应的距离或者在出峰查询与从与内容项目相关联的设备传送的查询或关键字或实体之间的关系。如果出峰查询针对特定的足球队,并且与包括该队的比赛的广播相关联,则传送对球队名称或球队徽标的图像的查询的设备可以具有比笼统地传送对“足球”的查询的设备更高的置信度分值。如上所述,在许多实施方式中,可以推测观看者还观看了在前或随后的内容项目,并且可以将用户设备的设备标识符添加到观众群数据库230中以获得用于所述在前和随后内容项目的条目。这些其他内容项目的置信度分值可以根据在前置信度分值调整率和随后的置信度分值调整率——其可以相同或不同——而从查询触发内容项目的置信度分值减去。调整率可以将置信度分值降低每秒或每分钟的规定百分比,其中内容项目的置信度分值基于内容项目的开始、中间或结尾处降低的置信度分值。在一些实施方式中,当生成内容项目的整体观众计数时,具有低置信度分值的设备标识符可以被从观众测量计数中去除或排除。
在一个类似的实施方式中,除了与内容项目相关联的设备标识符的数据库或阵列以外或作为其替代,测量引擎可以维持与设备标识符相关联的内容的数据库或阵列。不同于维持被识别为特定节目的观众的一部分的设备的列表或阵列测量引擎可以维持被识别为已被特定设备接收到的节目的列表或阵列。在一些这样的实施方式中,测量引擎随后可以在与设备相关联的多个阵列中搜索内容项目的内容标识符,以确定多少设备是观众的一部分。在一个类似的实施方式中,阵列可以被提供给第三方,诸如样本组提供者,以用于分析和/或观众测量。
图4A是在识别内容项目的观众成员的过程400的一个实施方式中采取的步骤的流程图。简要概述,在步骤402,观众测量服务器可以接收搜索日志。在步骤404,在一些实施方式中,观众测量服务器可以确定搜索查询量是否高于查询的基线量。如果搜索查询量不在基线量之上,则可以重复步骤402。如果搜索查询量超过基线量,则在一些实施方式中,观众测量服务器可以在步骤406确定搜索查询量是否高于尖峰阈值,或者在步骤408处确定搜索查询量是否以大于阈值的速率dV/dT增大。如果搜索查询量既不在尖峰阈值上方,也不以大于阈值的速率增加,则可以重复步骤402。如果搜索查询量或速率高于阈值,则在一些实施方式中,观众测量服务器可以在步骤410检索对应的实体或隐藏解说词日志条目。在步骤412,观众测量服务器可以确定是否有与实体或解说词相关联的广播时间在新近的时间段内。否则,观众测量服务器可以在步骤414确定是否存在其他对应的实体或日志条目。如果确实存在其他对应的实体,则可以重复步骤410-412。
如果与实体或解说词相关联的广播时间在新近的时间段内,则在步骤416,在一些实施方式中,观众测量服务可以检索与该实体或解说词相关联的频道和时间(以及之前和随后的时间)的一个或多个内容标识符。在步骤418,观众测量服务可以将搜索日志中的检索到的内容标识符和设备标识符添加到观众群数据库。在420,在一些实施方式中,观众测量服务可以针对内容标识符将置信度分值添加到每个设备标识符条目。在步骤422,观众测量服务可以调整先前或后续内容项目的设备标识符的置信度分值。在许多实施方式中,步骤418-422中的一个或多个可以组合。
仍然参考图4A并且更详细地,在方法400的步骤402,观众测量服务器可以接收搜索日志。在一些实施方式中,观众测量服务器可以从搜索提供者或服务请求搜索日志,并且作为响应接收该日志。在其他实施方式中,搜索提供者或服务可以周期性地或连续地将日志提供给观众测量服务器。在其他实施方式中,搜索提供者可以识别出峰搜索查询,并且可以将仅搜索查询的日志传送到观众测量服务器。在这样的实施方式中,步骤404、406、和/或408可以在步骤402之前由搜索服务器执行。可以经由任何类型和形式的传输来接收搜索日志,包括通过LAN的文件传输、经由诸如互联网的WAN的传输、或者利用搜索服务从共享存储位置读取日志。
在步骤404,在一些实施方式中,观众测量服务器可以确定搜索查询量是否高于查询的基线量。在如上所述的其他实施方式中,搜索服务器可以确定搜索查询量是否高于查询的基线量。确定查询量是否高于基线量可以包括在指定的时间段——诸如1秒、1分钟、10分钟、或1小时——期间监视多个搜索查询。在利用语义字典的实施方式中,确定查询量是否高于基线量可以包括监视多个相关搜索查询并在指定的时间段内合计任何相关查询的请求数。如果搜索查询量不在基线量之上,则可以重复步骤402。
如果搜索查询量高于基线量,则在一些实施方式中,在步骤406,观众测量服务器(或搜索服务)可以确定搜索查询量是否高于尖峰阈值。如上所述,尖峰阈值可以基于基线量来动态地设置,诸如基线量的两倍、基线量的三倍、基线量的十倍、基线量加上每秒一个查询、或任何其他这样的数量。动态地设置尖峰阈值可以允许同时使用高基线量和低基线量查询二者。
如果搜索查询量高于基线量,则在一些实施方式中,观众测量服务器(或搜索服务)可以在步骤408确定搜索查询量是否以大于阈值的速率dV/dT增加。如上所述,可以基于搜索量的增加速率而不是通过与特定量阈值进行比较来确定尖峰。监视查询量的增加速率可以允许更快地识别搜索尖峰或识别非常短期尖峰。
如果搜索查询量既不在尖峰阈值上方,也不以大于阈值的速率增加,则可以重复步骤402。如果搜索查询量或速率高于阈值,则在一些实施方式中,在步骤410,观众测量服务器可以检索对应的实体或隐藏解说词日志条目。检索对应的实体或日志条目可以包括对实体数据库或解说词日志搜索与搜索查询相对应的条目。在一些实施方式中,检索对应的实体或日志条目可以包括从语义字典检索与搜索查询相对应的类别的标识和/或与出峰查询相关的一个或多个附加搜索查询或实体。观众测量服务可以对实体数据库或解说词日志搜索与该类别或一个或多个其他搜索查询相对应的任何条目。在其他实施方式中,如上所述,步骤404-408可以在步骤402之前由搜索提供者执行,并且观众测量服务器可以接收出峰查询的日志,并直接进行到步骤410。
数据库中的每个实体或解说词可以与广播服务和/或频道和广播时间相关联。在步骤412,观众测量服务器可以确定与所检索的实体或解说词相关联的广播时间是否在新近时间段内(例如,实体是否在相对于搜索查询尖峰的预定时间段内广播)。因此,“新近”可能相对于搜索查询尖峰而不是方法400的当前执行时间(诸如当对历史搜索日志执行方法400时)。可以基于与检索到的实体或解说词相关联的内容项目的广播频率来动态地确定该时间段,其中越频繁的广播项目(例如特定广告、辛迪加节目、流行歌曲等)具有越短的时间段。该时间段还可以基于查询的尖峰频率和/或尖峰长度来确定,其中越不频繁或越长的尖峰长度与越长的时间段相关联;或者可以基于基线搜索量或在峰值搜索量与基线搜索量之间的差异来确定,其中越大的差异或越低基线量与越长时间段相关联。在某些实施方式中,可能会从数据库中清除未在新近时间段内收到的实体或字幕。这可能有助于避免搜索查询匹配相同内容的多个广播的模糊结果。如果与检索到的实体或解说词相关联的广播时间不在新近时间段内,则观众测量服务器可以在步骤414确定是否存在其他对应的实体或日志条目。如果确实存在其他对应的实体,则可以重复步骤410-412。在一些实施方式中,观众测量服务器可以检索最新近匹配的实体或字幕。因此,如果最新近匹配的实体或解说词在新近的时间段之外,则不存在其他对应的实体。在一些实施方式中,时间段可以被扩展以包括其他实体或解说词和对应的内容广播,但是可以对应地减少与传送所述内容的查询和观众群的设备的关联的置信度分值。在其他实施方式中,在步骤410,可以经由在指定时间窗口内的搜索来检索实体。这可以允许系统跳过步骤412-414。
如果与实体或解说词相关联的广播时间在新近时间段内,则在步骤416,在一些实施方式中,观众测量服务可以检索与所检索的实体或解说词相关联的频道和时间的内容标识符。内容标识符可以标识来自广播者的广播系统(例如地面网络、卫星网络、有线提供者、互联网流或源等)和频道或内容流,以及在流内检测到实体或解说词的时间。可以从广播者或其他服务接收的节目指南中检索内容标识符,可以经由元数据、隐藏解说词、或与内容项目的开头一起提供的其他数据来确定内容标识符(例如,电视节目介绍、标识新闻节目的解说词等)。在一些实施方式中,如上所述,观众测量服务还可以检索在与所检索的实体或解说词相关联的时间之前的时间的该频道的内容标识符,以及在与所检索的实体或解说词相关联的时间之后的时间的频道的内容标识符。在许多实施方式中,观众测量服务可以检索在查询触发内容的指定时间范围(例如5分钟、10分钟、或任何其他这样的值)内广播的这样的之前或随后内容的内容标识符。
在步骤418,观众测量服务可以将搜索日志中的检索到的内容标识符和设备标识符添加到观众群数据库。如上所述,在一些实施方式中,观众群数据库可以包括每个内容项目的条目,并且观众测量服务器可以将出峰查询日志中的设备标识符添加到该条目。在其他实施方式中,观众群数据库可以包括针对每个设备标识符的条目,并且观众测量服务器可以将每个内容项目的条目添加到传送与尖峰相对应的查询的设备标识符的条目。
在420,在一些实施方式中,观众测量服务可以针对内容标识符来向每个设备标识符条目添加置信度分值。在步骤422,观众测量服务可以调整之前或随后内容项目的设备标识符的置信度分值。在许多实施方式中,步骤418-422中的一个或多个可以组合。如上所述,传送出峰查询的设备的设备标识符和与查询相对应的内容项目之间的关联可以被给予置信度分值。置信度分值可以是默认分值,或者置信度分值可以基于以下中的一个或多个:针对查询的出峰查询的频率,其中越频繁的尖峰与不同于先前内容项目的触发搜索查询的内容项目的更低的置信度分值相关联;内容项目的广播频率,其中频繁地广播的内容项目与观看者观看该项目的特定广播的越低置信度分值相关联;搜索尖峰的长度,其中长的尖峰潜在地指示热门主题或该主题的口碑传播,而不是触发查询的用户观看特定的广播(例如,较低的置信度分值);基线搜索量与峰值尖峰量之间的差,其中大的差指示观众更可能已经观看了广播(例如更高的置信度分值);基线搜索量,其中很低的搜索量指示在在尖峰期间触发搜索的用户更可能已经观看了该内容项目;或任何其他这样的信息。根据之前和随后的置信度调整率,可以从针对查询触发内容项目生成的置信度分值中减去之前和随后内容项目的置信度。在一些实施方式中,因为观看者可能已经停止观看广播流以便生成查询,随后的调整速率可能会比之前的调整率更大(将置信度分值减小更大的数量)。
在一些实施方式中,可以实时地执行观众测量,对于添加到内容项目的观众阵列或条目的每个设备标识符使计数器递增,并且响应于设备标识符的置信度量度降到阈值以下而使计数器递减(并且可能去除设备标识符)。在其他实施方式中,可以响应于对观众测量的请求或响应于正在广播的内容项目的结束来执行观众测量。图4B是根据一个实施方式的,用于通过听众测量服务器测量内容项目的观众的过程450的一个实施方式中采取的步骤的流程图。在步骤452,测量引擎可以接收对内容项目的观众测量的请求。该请求可以从广播者、广告主、制片人、样本组提供者、营销人员、分析师、或其他实体接收。该请求可以识别一个或多个内容项目,并且在一些实施方式中可以包括用于测量的置信度度量阈值。
在步骤454,在一些实施方式中,测量引擎可以确定内容项目是否仍被广播或已经结束。如果内容仍在广播,则在一些实施方式中,测量引擎可以等待并重复步骤454,直到内容项目结束。响应于包括节目开始和结束时间的从广播者接收到的元数据,或者基于其他类似信息,测量引擎可以基于所发布的广播时程来确定内容项目仍在广播。在其他实施方式中,步骤454可以被跳过,以用于在节目期间的现场观众测量。
在步骤456,测量引擎可以从内容项目的观众阵列或数据库检索第一设备标识符,并且在一些实施方式中,检索与设备标识符相关联的置信度分值或度量。在步骤458中,在一些实施方式中,测量引擎可以确定置信度分值是否高于阈值n,诸如预定阈值或在步骤452接收到的阈值。如果置信度分值大于阈值n,则在步骤460,可以递增内容项目的观众计数器。如果置信度分值小于阈值,则可跳过步骤460。在步骤462,观众测量引擎可以针对观众阵列中的每个附加设备标识符重复步骤456-462,直到生成内容项目的总观众测量。在没有利用置信度分值的实施方式中,可以跳过步骤458,并且观众计数器可以是观众阵列中的设备标识符的数目的直接计数。在步骤464,可以输出或提供观众测量以作为对于对观众测量的请求的响应。
可以周期性地清除隐藏解说词数据库、实体数据库、指纹数据库、和观众群数据库或阵列。在节目完成并生成测量之后,可以从观众阵列中去除设备标识符和置信度分值。在其他实施方式中,可以在一小时、一天、一周、或任何其他时间量之后从阵列中去除设备标识符和置信度分值。这可以允许对观众测量的合计,包括现场观众以及对节目进行记录并时间偏移(time-shift)以供稍后观看的观众成员。也可以利用在预定时间量之后——诸如在节目的下一集之前或者简单地周期性地去除条目来清除隐藏解说词数据库、实体数据库、和指纹数据库。
在一些实施方式中,发起查询的用户可以被提供有机会来控制是否或如何将测量数据传送到观众测量服务器。因此,用户可以控制观众测量服务器和内容提供者如何收集和使用关于他或她的信息。
本说明书中描述的主题和操作的实现可以以数字电子电路或以计算机软件、固件、或硬件,包括在本说明书中公开的结构及其结构等同物,或者以它们的一个或多个的组合来实现。本说明书中描述的主题的实施方式可以被实现为一个或多个计算机程序,即,一个或多个计算机程序指令的模块,其被编码在一个或多个计算机存储介质上以用于由数据处理设备执行或控制数据处理设备的操作。替选地或另外地,程序指令可以在人工生成的传播信号——例如机器生成的电、光、或电磁信号上进行编码,该信号被生成以编码用于传输到合适的接收器装置的信息,以供数据处理装置执行。计算机存储介质可以是或被包括在计算机可读存储设备、计算机可读存储基底、随机或串行存取存储器阵列或设备、或它们的一个或多个的组合。此外,输入计算机存储介质不是传播信号时,但是计算机存储介质可以是以人工生成的传播信号编码的计算机程序指令的源或目的地。计算机存储介质也可以是或被包括在一个或多个单独的组件或介质(例如,多个CD、盘、或其它存储设备)中。因此,计算机存储介质可以是有形的。
本说明书中描述的操作可以实现为由数据处理装置对存储在一个或多个计算机可读存储设备上或从其他源接收的数据执行的操作。
术语“客户端”或“服务器”包括用于处理数据的所有种类的装置、设备、和机器,包括例如可编程处理器、计算机、片上系统、或上述的多个或组合。装置可以包括专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。除了硬件之外,装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如构成处理器固件、协议栈、数据库管理系统、操作系统、跨平台运行时环境、虚拟机、或它们中的一个或多个的组合的代码。装置和执行环境可以实现各种不同的计算模型基础架构,如Web服务、分布式计算和网格计算基础架构。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言编写,包括编译或解释语言、声明式或过程式语言,并且其可以以任何形式部署,包括作为独立程序或作为适合在计算环境中使用的模块、组件、子程序、对象或其他单元。计算机程序可以但不必对应于文件系统中的文件。程序可以存储在保存其他程序或数据(例如,存储在标记语言文档中的一个或多个脚本)的文件的一部分中,在专用于所讨论的程序的单个文件中,或在多个协同文件(例如,存储一个或多个模块、子程序、或代码的部分的文件)。可以将计算机程序部署为在一个计算机上或位于一个站点上或者跨多个站点分布并由通信网络互连的多个计算机上执行。
本说明书中描述的过程和逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程处理器执行,以通过对输入数据进行操作并生成输出来执行动作。过程和逻辑流程也可以由专用逻辑电路——例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)——执行,并且装置也可以被实现为该专用逻辑电路。
适于执行计算机程序的处理器例如包括通用和专用微处理器以及任何种类的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的必要元件是用于根据指令执行动作的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备——例如磁盘、磁光盘、或光盘,或操作地耦合至其以从其接收数据和向其传输数据,或这两者。但是,计算机不必具有这样的设备。此外,计算机可以嵌入在另一个设备中,例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏控制台、全球定位系统(GPS)接收器、或便携式存储设备(例如,通用串行总线(USB)闪存驱动器),仅举几例。适于存储计算机程序指令和数据的设备包括所有形式的非易失性存储器、介质和存储设备,包括例如半导体存储设备,例如EPROM、EEPROM和闪速存储设备;磁盘,例如内部硬盘或可移动盘;磁光盘;和CD-ROM和DVD-ROM盘。处理器和存储器可由专用逻辑电路补充或并入其中。
为了提供与用户的交互,本说明书中描述的主题的实现可以在具有以下的计算机上:显示设备——例如CRT(阴极射线管)、LCD(液晶显示器)、OLED(有机发光二极管)、TFT(薄膜晶体管)、等离子体、其他柔性配置、或用于向用户显示信息的任何其它监视器;以及用户可以通过其向计算机提供输入的键盘、指示设备——例如鼠标、轨迹球等、或触摸屏、触摸板等。其他种类的设备也可用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的感觉反馈,例如视觉反馈、听觉反馈、或触觉反馈;并且可以以任何形式接收来自用户的输入,包括声音、语音、或触觉输入。此外,计算机可以通过向用户使用的设备发送文档并从其接收文档来与用户交互;例如,通过响应于从web浏览器接收到的请求,将网页发送到用户的客户端设备上的web浏览器。
在本说明书中描述的主题的实施方式可以在计算系统中实现,该计算系统包括后端组件——例如作为数据服务器、或包括中间件组件——例如应用服务器、或包括前端组件——例如用户可以通过其与本说明书中描述的主题的实现交互的具有图形用户界面或Web浏览器的客户端计算机、或者一个或多个这样的后端、中间件、或前端组件的任何组合。系统的组件可以通过数字数据通信的任何形式或介质——例如通信网络——互连。通信网络的示例包括局域网(“LAN”)和广域网(“WAN”)、互连网络(例如互联网)、和对等网络(例如,点对点对等网络)。
本文公开的特征可以在智能电视模块(或连接的电视模块、混合电视模块等)上实现,其可以包括被配置为将互联网连接与更传统的电视节目源(例如,经由有线、卫星、空中、或其他信号来接收)整合的处理电路。智能电视模块可以被物理地并入到电视机中,或者可以包括诸如机顶盒、蓝光或其他数字媒体播放器、游戏控制台、酒店电视系统、和其他伴侣设备的单独设备。智能电视模块可以被配置为允许观看者搜索和找到在web上、在本地有线电视频道上、在卫星电视频道上、或存储在本地硬盘驱动器上的视频、电影、照片和其他内容。机顶盒(STB)或机顶单元(STU)可以包括可以包含调谐器并连接到电视机和外部信号源的信息仪器设备,将信号转换成然后显示在电视屏幕或其他显示设备上的内容。智能电视模块可以被配置来提供主屏幕或顶层级屏幕,其包括多个不同应用的图标,诸如web浏览器和多个流媒体服务、连接的有线或卫星媒体源、其他web“频道“等。智能电视模块还可以被配置为向用户提供电子节目指南。智能电视模块的配套应用可以在移动计算设备上可操作来向用户提供关于可用节目的附加信息,以允许用户控制智能电视模块等。在一个替选实施例中,可以在膝上型计算机或其他个人计算机、智能电话、其他移动电话、手持式计算机、平板电脑、或其他计算设备上实现所述特征。
虽然本说明书包含许多具体的实施方式细节,但是这些不应被解释为对任何发明的范围或所要求保护的范围的限制,而是作为特定发明的特定实施方式特有的特征的描述。在本说明书中在单独实施方式的场境中描述的某些特征也可以在单个实施方式中组合地实现。相反,在单个实施方式的场境中描述的各种特征也可以单独地或以任何合适的子组合在多个实施方式中实现。此外,虽然以上可能将特征描述为以某些组合的方式起作用,并且甚至最初要求如此保护,但来自要求保护的组合的一个或多个特征在某些情况下可以从组合中被删去,并且所要求保护的组合可以针对子组合或子组合的变化。
类似地,尽管在附图中以特定顺序描绘操作,但是这不应被理解为要求以所示的特定顺序或按连续顺序执行这样的操作,或者需要执行所有所图示的操作来实现所需的结果。在某些情况下,多任务和并行处理可能是有利的。此外,在上述实施方式中的各种系统组件的分离不应被理解为在所有实施方式中要求这样的分离,并且应当理解,所描述的程序组件和系统通常可以整合在单个软件产品中或被封装成多个软件产品。
因此,已经描述了主题的特定实施方式。其他实施方式在所附权利要求书的范围内。在一些情况下,权利要求中所记载的动作可以以不同的顺序执行并且仍然实现期望的结果。此外,附图中所描绘的过程不一定需要所示的特定顺序或连续顺序来获得期望的结果。在某些是否是中,可以利用多任务或并行处理。
Claims (16)
1.一种用于观众测量的方法,包括:
由观众测量服务器从广播监视系统接收在第一时间段期间广播的广播内容项目的多个标识和每个内容项目的对应的广播时间;
由所述观众测量服务器确定在所述第一时间段期间具有高于基线查询量的查询量的第一搜索查询;
由所述观众测量服务器从广播内容项目的所述多个标识中检索与所述第一搜索查询相对应的第一内容项目的标识;
由所述观众测量服务器基于所述第一搜索查询的峰值查询量和所述第一搜索查询的基线查询量之间的差来生成传送所述第一搜索查询的设备的标识符与所述第一内容项目的匹配的第一置信度分值;
由所述观众测量服务器检索在所述第一时间段之前的第二时间段期间广播的第二内容项目的标识;
由所述观众测量服务器生成传送所述第一搜索查询的所述设备的所述标识符与所述第二内容项目的匹配的第二置信度分值,所述第二置信度分值从所述第一置信度分值减少与在所述第二时间段和所述第一时间段之间的时间差成比例的数量;
接收对于所述第二内容项目的观众测量的请求;以及
响应于所述第二置信度分值高于预定阈值,将所述设备的标识符包括在所述观众测量中;或者
响应于所述第二置信度分值低于所述预定阈值,将所述设备的标识符从所述观众测量中排除。
2.根据权利要求1所述的方法,进一步包括:由所述观众测量服务器将传送所述第一搜索查询的所述设备的标识符与所述第一内容项目相关联。
3.根据权利要求1所述的方法,其中,广播内容项目的每个标识包括所述广播内容项目的解说词转录,并且其中,所述第一内容项目的标识与响应于包括所述第一搜索查询的解说词转录的所述第一搜索查询相对应。
4.根据权利要求1所述的方法,其中,确定所述第一搜索查询在所述第一时间段期间具有高于所述搜索查询的基线查询量的查询量进一步包括:确定在所述第一时间段期间的查询量超过所述搜索查询的平均查询量至少预定阈值。
5.根据权利要求1所述的方法,进一步包括:由所述观众测量服务器从搜索服务接收由所述搜索服务接收的并且与传送搜索查询的设备的设备标识符相对应的搜索查询的日志。
6.根据权利要求5所述的方法,进一步包括:基于所述搜索查询日志来确定所述第一搜索查询具有高于所述基线查询量的查询量。
7.根据权利要求1所述的方法,其中,检索在所述第一时间段期间广播的所述第一内容项目的标识进一步包括:在语义字典中检索与所述第一搜索查询相关的实体;并且其中,在所述第一时间段期间广播的所述第一内容项目的标识包括检索的实体。
8.一种用于观众测量的系统,包括:
广播接收器;以及
观众测量服务器,被配置来作出以下操作:
确定在第一时间段期间具有高于基线查询量的查询量的第一搜索查询;
检索在所述第一时间段期间广播的与所述第一搜索查询相对应的第一内容项目的标识;
基于所述第一搜索查询的峰值查询量和所述第一搜索查询的基线查询量之间的差来生成传送所述第一搜索查询的设备的标识符与所述第一内容项目的匹配的第一置信度分值;
检索在所述第一时间段之前的第二时间段期间广播的第二内容项目的标识;
生成传送所述第一搜索查询的所述设备的所述标识符与所述第二内容项目的匹配的第二置信度分值,所述第二置信度分值从所述第一置信度分值减少与在所述第二时间段和所述第一时间段之间的时间差成比例的数量;
接收对于所述第二内容项目的观众测量的请求;以及
响应于所述第二置信度分值高于预定阈值,将所述设备的标识符包括在所述观众测量中;或者
响应于所述第二置信度分值低于所述预定阈值,将所述设备的标识符从所述观众测量中排除。
9.根据权利要求8所述的系统,进一步包括实体提取器,其中,所述实体提取器被配置来提取与在所述第一时间段期间广播的广播内容项目相关联的实体,并将所述实体的标识、所述广播内容项目和广播时间记录到实体日志。
10.根据权利要求8所述的系统,其中,所述观众测量服务器进一步被配置来响应于所述第一搜索查询被包括在所述第一内容项目的隐藏解说词转录中,确定所述第一搜索查询对应于识别的实体。
11.根据权利要求8所述的系统,其中,所述观众测量服务器进一步被配置来确定所述查询量在所述第一时间段期间超过阈值,所述阈值包括所述基线查询量的倍数。
12.根据权利要求8所述的系统,其中,所述观众测量服务器进一步被配置来响应于实体和所述第一搜索查询在语义字典中相关联来确定所述第一搜索查询对应于识别的实体。
13.根据权利要求8所述的系统,其中,所述观众测量服务器进一步被配置来将传送所述第一搜索查询的所述设备的标识符与所述第一内容项目相关联。
14.根据权利要求8所述的系统,其中,所述观众测量服务器进一步被配置来:
接收由所述搜索服务接收的并且与传送搜索查询的设备的设备标识符相对应的搜索查询的日志;以及
基于所述搜索查询日志来确定所述第一搜索查询具有高于所述基线查询量的查询量。
15.一种存储指令的非暂时性计算机可读存储介质,所述指令在由观众测量服务器的一个或多个数据处理器执行时,使得所述一个或多个数据处理器执行操作,所述操作包括:
从广播监视系统接收在第一时间段期间广播的广播内容项目的多个标识和每个内容项目的对应的广播时间;
确定第一搜索查询在所述第一时间段期间具有高于基线查询量的查询量;
从广播内容项目的所述多个标识中检索与所述第一搜索查询相对应的第一内容项目的标识;
基于所述第一搜索查询的峰值查询量和所述第一搜索查询的基线查询量之间的差来生成传送所述第一搜索查询的设备的标识符与所述第一内容项目的匹配的第一置信度分值;
检索在所述第一时间段之前的第二时间段期间广播的第二内容项目的标识;
生成传送所述第一搜索查询的所述设备的所述标识符与所述第二内容项目的匹配的第二置信度分值,所述第二置信度分值从所述第一置信度分值减少与在所述第二时间段和所述第一时间段之间的时间差成比例的数量;
接收对于所述第二内容项目的观众测量的请求;以及
响应于所述第二置信度分值高于预定阈值,将所述设备的标识符包括在所述观众测量中;或者
响应于所述第二置信度分值低于所述预定阈值,将所述设备的标识符从所述观众测量中排除。
16.根据权利要求15所述的非暂时性计算机可读存储介质,其中,所述指令的执行进一步使得所述一个或多个数据处理器作出以下操作:
至少基于解说词日志来将所述第一时间段期间广播的所述第一内容项目与所述第一搜索查询相关联。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010759307.5A CN112054864B (zh) | 2014-12-01 | 2015-10-29 | 用于识别观看电视广告的用户的系统和方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/556,317 US9967619B2 (en) | 2014-12-01 | 2014-12-01 | System and method for associating search queries with remote content display |
US14/556,317 | 2014-12-01 | ||
CN202010759307.5A CN112054864B (zh) | 2014-12-01 | 2015-10-29 | 用于识别观看电视广告的用户的系统和方法 |
PCT/US2015/057958 WO2016089510A1 (en) | 2014-12-01 | 2015-10-29 | Systems and methods for identifying users who watched a television advertisement |
CN201580065447.XA CN107004210B (zh) | 2014-12-01 | 2015-10-29 | 用于识别观看电视广告的用户的系统和方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580065447.XA Division CN107004210B (zh) | 2014-12-01 | 2015-10-29 | 用于识别观看电视广告的用户的系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112054864A CN112054864A (zh) | 2020-12-08 |
CN112054864B true CN112054864B (zh) | 2024-06-11 |
Family
ID=54540209
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580065447.XA Active CN107004210B (zh) | 2014-12-01 | 2015-10-29 | 用于识别观看电视广告的用户的系统和方法 |
CN202010759307.5A Active CN112054864B (zh) | 2014-12-01 | 2015-10-29 | 用于识别观看电视广告的用户的系统和方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580065447.XA Active CN107004210B (zh) | 2014-12-01 | 2015-10-29 | 用于识别观看电视广告的用户的系统和方法 |
Country Status (5)
Country | Link |
---|---|
US (4) | US9967619B2 (zh) |
CN (2) | CN107004210B (zh) |
DE (1) | DE112015005408T5 (zh) |
GB (1) | GB2549639B (zh) |
WO (1) | WO2016089510A1 (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10075751B2 (en) * | 2015-09-30 | 2018-09-11 | Rovi Guides, Inc. | Method and system for verifying scheduled media assets |
KR102536202B1 (ko) * | 2016-08-26 | 2023-05-25 | 삼성전자주식회사 | 서버 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체 |
US10108718B2 (en) | 2016-11-02 | 2018-10-23 | Alphonso Inc. | System and method for detecting repeating content, including commercials, in a video data stream |
US10848578B1 (en) * | 2017-04-11 | 2020-11-24 | Wells Fargo Bank, N.A. | Systems and methods for content delivery |
JP7213009B2 (ja) | 2017-08-08 | 2023-01-26 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
US10735808B2 (en) * | 2017-08-10 | 2020-08-04 | The Nielsen Company (Us), Llc | Methods and apparatus of media device detection for minimally invasive media meters |
US11048702B1 (en) * | 2018-02-07 | 2021-06-29 | Amazon Technologies, Inc. | Query answering |
US20190295123A1 (en) * | 2018-03-26 | 2019-09-26 | Free Stream Media Corporation d/b/a Samba TV | Evaluating media content using synthetic control groups |
US10346474B1 (en) * | 2018-03-30 | 2019-07-09 | Alphonso Inc. | System and method for detecting repeating content, including commercials, in a video data stream using audio-based and video-based automated content recognition |
EP3641275A1 (de) * | 2018-10-18 | 2020-04-22 | Siemens Aktiengesellschaft | Verfahren, vorrichtung und computerprogramm zur automatischen verarbeitung von datenbezeichnern |
US10764640B2 (en) * | 2018-11-23 | 2020-09-01 | Sony Corporation | Receiver device including native broadcaster application |
JP6720365B1 (ja) * | 2019-02-15 | 2020-07-08 | 株式会社電通グループ | 広告接触判定システム、広告接触判定装置及びプログラム |
CN110266645A (zh) * | 2019-05-21 | 2019-09-20 | 平安科技(深圳)有限公司 | 实时数据的验证方法、装置、服务器及介质 |
CN113940086B (zh) * | 2019-06-07 | 2024-01-05 | 六科股份有限公司 | 具有广播调度利用特征的内容修改系统 |
US11250872B2 (en) | 2019-12-14 | 2022-02-15 | International Business Machines Corporation | Using closed captions as parallel training data for customization of closed captioning systems |
US20230344536A1 (en) * | 2020-12-14 | 2023-10-26 | Funai Electric Co., Ltd. | Real-time immersion of multiple users |
CN112988666B (zh) * | 2021-03-22 | 2022-04-22 | 湖南大学 | 一种基于布谷鸟过滤器的分布式日志条件查询方法与系统 |
US20220382819A1 (en) * | 2021-05-28 | 2022-12-01 | Google Llc | Search Results Based Triggering For Understanding User Intent On Assistant |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4938846A (en) * | 1986-12-08 | 1990-07-03 | Atochem, North America, Inc. | Preparation of anhydrous alkanesulfonic acid |
WO2008128195A1 (en) * | 2007-04-13 | 2008-10-23 | Google Inc. | Estimating off-line advertising impressions |
US8275764B2 (en) | 2007-08-24 | 2012-09-25 | Google Inc. | Recommending media programs based on media program popularity |
US8489774B2 (en) | 2009-05-27 | 2013-07-16 | Spot411 Technologies, Inc. | Synchronized delivery of interactive content |
US8176032B2 (en) * | 2009-10-22 | 2012-05-08 | Ebay Inc. | System and method for automatically publishing data items associated with an event |
US9009298B2 (en) | 2010-12-10 | 2015-04-14 | The Nielsen Company (Us), Llc | Methods and apparatus to determine audience engagement indices associated with media presentations |
US8887188B2 (en) | 2012-05-09 | 2014-11-11 | Rentrak Corporation | System and method for television advertisement audience measurement |
US20140073236A1 (en) | 2012-09-07 | 2014-03-13 | Adori Labs, Inc. | Radio audience measurement |
DE102012112873B4 (de) | 2012-09-12 | 2015-11-12 | Deutsche Post Ag | Erfassung der Wahrnehmung einer Werbung durch einen Nutzer und deren Wirkung |
-
2014
- 2014-12-01 US US14/556,317 patent/US9967619B2/en active Active
-
2015
- 2015-10-29 DE DE112015005408.1T patent/DE112015005408T5/de active Pending
- 2015-10-29 CN CN201580065447.XA patent/CN107004210B/zh active Active
- 2015-10-29 CN CN202010759307.5A patent/CN112054864B/zh active Active
- 2015-10-29 GB GB1710513.1A patent/GB2549639B/en active Active
- 2015-10-29 WO PCT/US2015/057958 patent/WO2016089510A1/en active Application Filing
-
2018
- 2018-04-20 US US15/958,352 patent/US10567839B2/en active Active
-
2020
- 2020-01-14 US US16/742,017 patent/US10999626B2/en active Active
-
2021
- 2021-04-19 US US17/234,354 patent/US11546659B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20210243496A1 (en) | 2021-08-05 |
CN112054864A (zh) | 2020-12-08 |
CN107004210A (zh) | 2017-08-01 |
US20180242041A1 (en) | 2018-08-23 |
US20160156972A1 (en) | 2016-06-02 |
GB2549639B (en) | 2019-05-22 |
CN107004210B (zh) | 2020-08-14 |
US10999626B2 (en) | 2021-05-04 |
US10567839B2 (en) | 2020-02-18 |
GB2549639A (en) | 2017-10-25 |
US20200213669A1 (en) | 2020-07-02 |
US11546659B2 (en) | 2023-01-03 |
DE112015005408T5 (de) | 2017-08-31 |
US9967619B2 (en) | 2018-05-08 |
WO2016089510A1 (en) | 2016-06-09 |
GB201710513D0 (en) | 2017-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11546659B2 (en) | System and method for associating search queries with remote content display | |
US10296645B2 (en) | Systems and methods for content selection based on search query correlation with broadcast media | |
US11412300B2 (en) | System and methods for analyzing content engagement in conjunction with social media | |
US9854315B1 (en) | Systems and methods for broadcast audience interaction and participation | |
US11019125B2 (en) | Similar introduction advertising caching mechanism | |
US10602236B2 (en) | Unique content sequence identification method and apparatus | |
KR102091414B1 (ko) | 방송되는 미디어 관련 전자 메시징 향상 | |
US9306989B1 (en) | Linking social media and broadcast media | |
US20140373036A1 (en) | Hybrid video recognition system based on audio and subtitle data | |
US20140280571A1 (en) | Processing of user-specific social media for time-shifted multimedia content | |
US10009648B1 (en) | Systems and methods for using closed captions for television viewership measurement | |
US20170134810A1 (en) | Systems and methods for user interaction | |
US20130132842A1 (en) | Systems and methods for user interaction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |