CN101779201A - 互联网发布内容的监控方法和装置 - Google Patents

互联网发布内容的监控方法和装置 Download PDF

Info

Publication number
CN101779201A
CN101779201A CN200880025615A CN200880025615A CN101779201A CN 101779201 A CN101779201 A CN 101779201A CN 200880025615 A CN200880025615 A CN 200880025615A CN 200880025615 A CN200880025615 A CN 200880025615A CN 101779201 A CN101779201 A CN 101779201A
Authority
CN
China
Prior art keywords
content
media content
media
identification code
signature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880025615A
Other languages
English (en)
Inventor
阿伦·拉马斯瓦米
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nielsen Co US LLC
Original Assignee
Nielsen Co US LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nielsen Co US LLC filed Critical Nielsen Co US LLC
Publication of CN101779201A publication Critical patent/CN101779201A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了对互联网发布的内容进行监控的方法和装置。示例性方法包括以下步骤:请求与接收的主题标识相关联的真正简易聚合(RSS)源文件,接收标识出第一媒体内容的所述RSS源文件,从所述RSS源文件中提取所述第一媒体内容的第一资源标识符,使用所述第一资源标识符检索获得所述第一媒体内容,执行从所述第一媒体内容提取第一内容识别码的步骤和生成所述第一媒体内容的第一签名的步骤中的至少一个,以及将所述第一内容识别码和所述第一签名二者中的至少一个存储在存储器中。

Description

互联网发布内容的监控方法和装置
技术领域
本公开涉及媒体内容发布的监控,更具体地,涉及互联网发布内容的监控方法和装置。
背景技术
随着互联网站点的大小和复杂度的增加,以及网页更新频率的加快,网站创建者们开发出了使网站用户获悉网站内可用信息和内容的各种方法和技术。网站创建者们现已采用的一种技术是内容源。内容源是如下的单个或多个文件,该单个或多个文件包含网站可用内容的总结以及网站可用内容的全文链接。内容源的一种类型被称为真正简易聚合(reallysimple syndication,RSS)。RSS文档是根据针对RSS源建立的标准而创建的可扩展标记语言(extensible markup language,XML)文件。通过遵循RSS标准,网站创建者能确保支持RSS标准的任意类型的客户机都能够读取其内容源。
例如,希望总能获悉网站变化的网站用户可以订阅内容源(例如,让该用户的内容源读取器定期并且自动地从远程站点检索获得内容源,然后提示该用户)和/或人工检索获得内容源。如果在上一次检索获得内容源之后进行了网页的更新,则该用户将会被提示。该用户能够浏览内容源中的信息(例如,对网页上可用的信息和/或媒体内容的说明)并能够指令内容源读取器从内容源中所标识的位置处检索获得全部内容和/或请求用户的web浏览器显示全部内容。
附图说明
图1是其中站点监控器检测和/或识别远程站点处可用的媒体内容的示例性系统的框图。
图2是图1所示的站点监控器的示例性实现的框图。
图3是表示可被执行以实现图1和图2所示的站点监控器的示例性机器可读指令的流程图。
图4是表示可被执行以实现图1和图2所示的站点监控器的示例性机器可读指令的流程图。
图5是表示可被执行以实现图1和图2所示的站点监控器的示例性机器可读指令的流程图。
图6例示了XML格式的示例性内容源文件。
图7是能够执行如图3-5所示的机器可读指令以实现此处公开的装置和/或方法的示例性计算机平台的框图。
具体实施方式
图1是示例性系统100的框图,在该示例性系统100中站点监控器110检测和/或识别远程站点102和104处可用的媒体内容。示例性系统100可用于例如检测版权的侵权。在一个示例性实施方式中,站点监控器110订阅远程站点102和104中的一个或更多个的媒体内容源(如聚合源)。除此之外,示例性媒体内容源提供了远程站点102和104处的可用媒体内容的一个或更多个统一资源定位符(universal resource locator,URL)。例如,以周期性间隔(如每周一次),远程站点102和104可发送和/或站点监控器可请求并接收可扩展标记语言(extensible markuplanguage,XML)文件,该XML文件标识出了自发出上一个XML文件后相对于各远程站点102或104的所有新媒体内容。示例性站点监控器110接收来自远程站点102和/或104的媒体内容源并提取所需条目的URL。例如,用户可以向站点监控器110输入一个或更多个关键字或词组。从而,站点监控器110将仅提取与该关键字或词组相关联的内容的URL。站点监控器110检索获得所提取URL的媒体内容,并提取与该媒体内容相关联的任何程序识别码和/或生成各检索获得的媒体内容的签名(例如,代表该媒体内容的一个或更多个特征的信号或字符串)。示例性站点监控器110将所提取的码和/或所生成的签名与已知媒体内容的参考码和/或参考签名的数据库进行比较。如果示例性站点监控器110确定针对任一检索获得的内容所提取的代码和/或所生成的签名与数据库中相应的参考码和/或参考签名匹配,则可以由此识别出内容的同一性和/或其原始来源(其可能不同于提供该内容的远程站点102和104),并且示例性站点监控器对相应远程站点(即远程站点102和104之一)正发布已知媒体内容这一情况进行记录。如果该已知媒体内容是受版权保护的媒体内容,示例性站点监控器110可向媒体内容的原始来源和/或发布来源(如远程站点102和/或104)发出侵犯版权通知。
图1的示例性系统100包含远程站点102、远程站点104、通信网络108以及站点监控器110。尽管示例性系统100中包含两个远程站点、一个网络以及一个站点监控器,但系统100的其它实现可包括任意数量的远程站点、网络和站点监控器。例如,可针对每个远程站点或相应远程站点组而包含独立的站点监控器。
例示的示例性远程站点102和远程站点104是网络服务器,其输出标识了相应远程站点处的可用内容的内容源。具体地说,例示的示例性远程站点102响应于对与主题标识(如关键字、词组等)相关联内容的请求而输出XML文件(例如如图6所示的XML文件)。例如,假设远程站点具有关于电视网络(如NBC和/或ABC)的内容,当远程站点102的用户(如人或站点监控器110)发出对与电视网络NBC相关联的内容的请求时,远程站点102发送标识出在远程站点102处可用的与NBC相关联的媒体内容的XML文件。与此相反,所例示的示例性远程站点104允许用户订阅以自动接收内容源。尽管示例性远程站点102和示例性远程站点104被实现为以不同方式处理内容源,但系统100可包含被实现为响应于请求而发送内容源的任意数量的远程站点以及被实现为基于订阅而发送内容源的任意数量的远程站点。此外,远程站点可以采用任何其它技术来发送内容源。
示例性远程站点102发送的示例性XML文件包含以下信息:远程站点102的地址(如URL)以及远程站点102处可用的各媒体内容(如网页、视频文件或视频流、音频文件或音频流、文本文件、多媒体表示等)的标题、说明、地址(如URL)、公布日期和父网页(如URL)。另选地,XML文件可包含上述信息的任意子集和/或可以包含附加信息(如内容的作者、上传内容的用户、内容的创建日期等)。
示例性远程站点104向已订阅内容源的用户、设备和/或系统定期发送标识出该内容的XML文件。例如,如果用户订阅了“最新添加”内容源,则远程站点104将定期发送标识出自上次发送后已被添加的内容的XML文件。远程站点104可包含任意数量和/或类型的内容源。例如,远程站点104可允许用户识别将在XML文件中定期标识出的媒体内容的主题。尽管示例性远程站点104定期发送XML文件,但可根据任意的日程表(例如在日程表规定的特定时间或日期添加新内容时,在用户请求发送文件时,在定位了与发送相关联的某一最少量的媒体内容时等)发送XML文件。此外,尽管示例性远程站点104发送了XML文件,但可以使用任意其它类型的文件,例如有定界符(delimited)的文本文件、
Figure G2008800256152D00041
Figure G2008800256152D00042
文件、超文本标记语言(hyper-text markup language,HTML)文件等。
远程站点102和远程站点104可为任意类型的远程站点。在所例示的例子中,远程站点102和远程站点104为互联网上的服务器。例如,远程站点102和/或远程站点104可为YouTubeTM网站或接受用户提交内容的其它任何网站中的一种。然而,远程站点102和远程站点104或者可以是任意类型网络上的任意类型服务器。
所例示的示例性通信网络108是以可通信方式连接远程站点102、远程站点104和站点监控器110的广域网。例如,通信网络108可为互联网,而远程站点102、远程站点104和站点监控器110中的每一个可包含使各部件能够经由互联网通信的设备和/或服务订阅。另选地,任意其它类型的网络可以实现通信网络108。例如,该通信网络可以是任意类型的局域网、广域网、无线网络、有线网络等。此外,通信网络108可由一个或更多个独立或互联的网络实现。例如,远程站点102可以经由独立网络以可通信方式连接到站点监控器110,而不经由以可通信方式连接远程站点104和站点监控器110的网络。
所例示的示例性站点监控器110请求内容源(如聚合源、RSS源等)和/或订阅内容源,并且定期地从远程站点102和/或接远程站点104接收内容源。图1的示例性站点监控器110自动地解析内容源以提取用于内容检索的地址或标识符,检索获得所述内容,并从媒体内容提取和/或生成识别信息。站点监控器110将提取和/或生成的识别信息(如音频和/或视频中的程序识别码、签名(音频和/或视频)等)与参考识别信息(如已知媒体内容的识别信息)进行比较以识别出媒体内容(例如确定该媒体内容与参考媒体内容相同或确实相似)。示例性站点监控器110将识别信息存储在数据库中并计算所标识的媒体内容的量度(metrics)。例如,站点监控器110可以计算来自特定远程站点的媒体内容与参考媒体内容确实相似的实例数量。站点监控器110可以附加地或另选地发送关于媒体内容是否与参考媒体内容匹配的通知。例如,如果已知参考媒体内容为受版权保护的媒体内容,则站点监控器110可向正发布媒体内容的远程站点、远程站点的用户(如在远程站点上传媒体内容的用户)、参考媒体内容的版权所有者和/或版权维权实体(例如法律事务所、执法机构、政府机构、私人调查机构等)发出通知(如电子邮件)。
图2是图1的示例性站点监控器110的示例性实现的框图。图2的示例性站点监控器110包括查询创建器202、源读取器204、源处理器206、内容下载器208、内容接收器210、内容处理器212、数据存储部214、量度生成器216以及通知器218。
所示例子中的查询创建器202从站点监控器110的用户处接收主题标识,并将该主题标识发送到源读取器204。所示例子中的主题标识是任意类型的关键字或词组。例如,希望分析与媒体内容制造者相关联的内容的用户可以输入制造者的名称。希望分析与特定对象(如篮球、足球、超级碗(
Figure G2008800256152D00051
)、世界棒球锦标赛(World Series)、书籍等)相关联内容的用户可以输入与特定对象相关联的关键字或词组。希望分析由特定软件所编码或创建的内容的用户可以输入软件名称。换言之,任何关键字和/或词组都可用来将站点监控器110的分析限定于特定主题。另选地,如果站点监控器110包括一个或更多个存储的关键字或词组,或站点监控器110要分析远程站点处的所有可用内容,则可以不接收关键字或词组。
所示例子中的查询创建器202还接收应当被监控或查询的远程站点(例如图1的远程站点102和远程站点104)一个或更多个标识(如URL)。另选地,查询创建器202可包括预定远程站点的列表,可基于所接收的主题标识自动确定相关的远程站点,可查询所有的可用远程站点等。查询创建器202将所接收的远程站点标识发送到源读取器204。
所示例子中的源读取器204向查询创建器202所标识出的远程站点(如远程站点102或远程站点104)订阅和/或请求内容源,并从远程站点(如远程站点102或远程站点104)接收内容源。示例性源读取器204基于从查询创建器202接收的主题信息而请求内容源和/或订阅内容源。当远程站点(如远程站点102或远程站点104)向站点监控器110发送内容源时,源读取器204接收内容源(如XML文件)并将该内容源发送到源处理器206。
所示例子中的源处理器206从源读取器204接收内容源,并提取用于检索获得在内容源中标识出的媒体内容的任何地址。例如,所示例子的源处理器206从XML内容源文件中提取一个或更多个URL。源处理器206可以经由源读取器204从查询创建器202另外接收主题标识,并可以选择性地提取与主题标识相关联的内容的一个或更多个地址(例如,可以从主题标识中提取具有包含关键字和/或词组的说明(如包含在XML内容源文件中的文本)的内容源中的条目的地址)。示例性源处理器206将提取的地址发送到内容下载器208。
图2的示例性内容下载器208从源处理器206接收一个或更多个地址,并请求从该地址指定的位置发送媒体内容。在所示例子中,该地址指定了向站点监控器110发送内容源的远程站点102或104。另选地,该地址可以指定与将内容源发送到站点监控器110的站点不同的站点。所示例子中的内容下载器208可以每次请求一条媒体内容。另选地,可以使用任意类型的下载技术,例如并行地请求多于一条媒体内容,使用点对点下载技术(例如BitTorrentTM客户机)请求媒体内容,等等。
所示例子中的内容接收器210响应于内容下载器208的请求而对发送到站点监控器110的媒体内容进行接收。在所示例子中,内容接收器210每次接收一条媒体内容。然而,类似于内容下载器208,内容接收器210可使用任意类型的下载技术或流技术来接收媒体内容。内容接收器210将所接收的媒体内容发送到内容处理器212。例如,部分媒体内容(如流媒体内容)可以在全部媒体内容被接收之前发送到内容处理器212。
所示例子中的内容处理器212从内容接收器210接收媒体内容,并对该媒体内容进行处理以生成识别信息。示例性内容处理器212提取所嵌入的程序识别码和/或生成媒体内容的签名。换言之,内容处理器212可以对码(如音频码、视频码、分组标识(packet identification,PID)报头或其他标识符)进行提取,可以生成签名(如优选为内容的某方面的唯一标识或代表了内容的信号),和/或可以对码进行提取并生成签名。此外,内容处理器212可以用其它任何方式获得识别信息,例如通过提取与媒体内容包含在一起的元数据,通过从远程站点(例如,图1的远程站点102和/或远程站点104)检索获得与媒体内容相关联的信息等。
所示例子中的内容处理器212将获得的识别信息与从数据存储部214中检索获得的参考识别信息进行比较,以确定媒体内容的同一性。例如,内容处理器212将根据接收的媒体内容所生成的签名与存储在数据存储部214中并与已知媒体内容相关联的签名进行比较。如果签名能够匹配,则内容处理器212将接收的媒体内容识别为与参考签名相关联的已知媒体内容。内容处理器212附加地或另选地将提取的程序和/或源识别码与存储在数据存储部214中的码进行比较。当提取的码与存储在数据存储部214中的码相匹配时,内容处理器212将检索获得的媒体内容识别为与存储的(参考)码相关联的已知媒体内容。尽管图2的示例性内容处理器212采用签名比较或码比较来识别媒体内容(例如,在未检测到码或码不匹配时采用签名比较)时,内容处理器212可以另选地采用这两种比较并在这两种比较得出的结果不同时将媒体内容识别为不确定媒体内容,或采用加权算法来确定最有可能正确的识别信息。
示例性内容处理器212将获得的识别信息和/或通过码和/或签名比较而获得的信息发送到数据存储部214进行存储。此外,内容处理器212将识别信息发送到量度生成器216以及通知器218。
所示例子中的数据存储部214是数据库,该数据库包括用于存储与接收的媒体内容相关联的信息的第一表格以及用于存储与参考(例如已知)媒体内容相关联的信息的第二表格。另选地,数据存储部214可由任何其它类型的数据存储部(例如存储在存储器设备上的文件)实现。
所示例子中的量度生成器216从内容处理器212接收标识出媒体内容的信息,并使用该信息来生成关于媒体内容消费的量度。例如,量度生成器216可追踪来自特定远程站点的媒体内容与参考数据相匹配的次数。例如,当参考数据是受版权保护的媒体内容时,量度生成器216可使得与该内容相关联和/或与版权保护材料的所有者相关联的计数器递增以对远程站点的媒体内容可能侵犯版权所有者的版权的实例数量进行计数。在另一个例子中,量度生成器216可以通过确定媒体内容在一个或更多个远程站点被发现的次数来指示媒体内容的流行程度(popularity)。量度生成器216可以将生成的量度发送到数据存储部214进行存储和/或可将量度发送到通知器218以通知有关各方(如版权持有者)。
所示例子的通知器218接收与在站点监控器110处接收到的媒体内容相关联的信息以及指示了媒体内容是否与参考媒体内容相匹配的信息。作为响应,所示例子的通知器218向有关各方发送通知。例如,所示例子中的通知器218自动向从中接收到媒体内容的远程站点发送通知。当接收的媒体内容与受版权保护的参考媒体内容进行比较时,该通知可以是要求清除媒体内容的侵犯版权通知。当远程站点允许用户将媒体内容上传到该远程站点时,通知器218可以附加地或另选地向上传该媒体内容的用户发送通知。附加地或另选地,通知器218可以向任何其他方(如版权所有者、版权维权实体、知识产权法律事务所或代理公司等)发送通知。此外,该通知可以采用任何格式。例如,消息可以是包含消息的纯文本通知,可以是采用易于被计算机解释的格式的消息(如有定界符的文本文件、Microsoft Excel文件等),可以包括与多于一条媒体内容有关的信息(如从相同远程站点接收的多于一个的不同视频)等。
图3-5是表示可被执行以实现图1的站点监控器110和/或图2的查询创建器202、源读取器204、源处理器206、内容下载器208、内容接收器210、内容处理器212、数据存储部214、量度生成器216和/或通知器218的示例性机器可读指令的流程图。图3-5的示例性机器可读指令可由处理器、控制器和/或任何其它合适的处理设备执行。例如,图3-5的示例性机器可读指令可以包含在与处理器(如示例性处理平台1000中所示并在下文中结合图7进行讨论的处理器1002)相关联的有形介质(如闪存或随机存取存储器RAM)上存储的经编码指令中。另选地,图3-5的示例性流程图可采用专用集成电路(ASIC)、可编程逻辑设备(PLD)、现场可编程逻辑设备(FPLD)、离散逻辑、硬件、固件等来实现。此外,图3-5的示例性流程图可以人工实现或被实现为任意前述技术的组合。例如,图1的站点监控器110和/或图2的查询创建器202、源读取器204、源处理器206、内容下载器208、内容接收器210、内容处理器212、数据存储部214、量度生成器216和通知器218中的任何一种或全部可由固件、软件和/或硬件的结合而实现。此外,尽管示例性站点监控器110是通过执行图3-5的流程图所示的示例性机器可读指令而实现的,但还可采用用于实现图3-5所示指令的很多其它方法。例如,这些方框的执行顺序可以改变,和/或所述方框中的一些可以改变、消除、细分和/或组合。另选地,图3-5的示例性机器可读指令可以由例如单独的处理线程、处理器、设备、电路等顺序地执行和/或并行地执行。
图3是表示可被执行以实现图1和图2的站点监控器110的示例性机器可读指令的流程图。当站点监控器(例如图1的站点监控器110)的查询创建器202接收到来自用户的查询时(方框302)图3的流程图开始。接着,站点监控器110的源读取器204向用户指定的该远程站点和/或用户指定或另外标识出的一组远程站点(例如预定的远程站点组)发送请求,并从指定的远程站点接收内容源(例如,图2的源读取器204从图1的远程站点102和/或远程站点104接收内容源)(方框304)。另选地,为了响应于查询而对源进行请求,内容源可能先前已被请求和/或订阅,和/或内容源可能已由第三方请求和/或订阅。
接着,站点监控器110的源处理器206从与接收的查询所关联的媒体内容相对应的内容源中提取媒体内容参考(方框306)。例如,图2的源处理器206可以分析与媒体内容参考包含在一起的标题或说明,以确定该媒体内容是否与接收到的查询相关联。接着,站点监控器110的内容下载器208下载所选择的媒体内容(方框308)。内容接收器210随后接收内容下载器208所请求的媒体内容。接着,站点监控器110的内容处理器212从下载的媒体内容中提取和/或生成识别信息(如码、签名等)(方框310)。站点监控器110的内容处理器212将提取的识别信息与参考媒体内容所关联的识别信息进行比较,以确定媒体内容的同一性(例如,确定所下载媒体内容的识别数据是否与参考媒体内容的识别数据确实匹配,如果匹配,则将该媒体内容识别为参考媒体内容)(方框312)。接着,站点监控器110的内容处理器212将识别信息和/或比较结果存储在数据存储部(例如图2的数据存储部214)中(方框314)。
图4是表示可被执行以实现图1和图2的站点监控器110的示例性机器可读指令的流程图。与图3的机器可读指令不同,图4的机器可读指令被构造成用于确定内容源是否标识出新媒体内容(例如先前未被处理过的媒体内容)。当图1的站点监控器110的查询创建器202经由查询创建器202接收到来自用户的查询时图4的流程图开始(方框402)。接着,站点监控器110的源读取器204向用户指定的远程站点(或者向用户指定的或另外标识出的远程站点组(例如预定的远程站点组))发送请求。接着,源读取器204从远程站点接收内容源(例如,图2的源读取器204从图1的远程站点102和/或远程站点104接收内容源)(方框404)。另选地,为了响应于查询而对源进行请求,内容源可能先前已被请求和/或订阅,和/或内容源可能已由第三方请求和/或订阅。
在接收到内容源之后,站点监控器110的源处理器206确定该内容源是否包含先前未被下载和处理的媒体内容(方框406)。例如,源处理器206可以确定自从上一次接收到内容源之后是否上传了新内容。如果该内容源不包含任何新媒体内容(方框406),则控制返回方框402并等待进一步的查询。另选地,控制可返回方框404并等待进一步的内容源。
如果该内容源包含先前未被下载和分析的媒体内容(方框406),站点监控器110的源处理器206提取内容源中新媒体内容的标识(例如地址或URL)(方框408)。接着,源处理器206选择与接收到的查询相关联的任意条新媒体内容(方框410)。接下来,站点监控器110的内容下载器208和内容接收器210利用所提取的标识来下载标识出的媒体内容(方框412)。在接收到所下载的媒体内容之后,站点监控器110的内容处理器212对该媒体内容进行处理以确定该媒体内容的同一性(方框414)。例如,站点监控器110的内容处理器212可以从媒体内容中提取和/或产生码和/或签名,并可以将该码和/或签名与已知媒体内容所关联的码和/或签名进行比较。
接着,站点监控器110的量度生成器216采用接收到的识别信息来计算量度(方框416)。例如,量度生成器216可以确定特定媒体内容在远程站点处可用的唯一实例的数量,可以确定远程站点处的媒体内容与参考媒体内容相匹配的次数等。量度生成器216将量度和识别信息存储在数据存储部214中(方框418)。接着,控制返回方框402并等待进一步的查询。另选地,控制可返回方框404并等待进一步的内容源。
图5是表示可被执行以实现图1和图2的站点监控器110的示例性机器可读指令的流程图。与图3和图4中所示的机器可读指令不同,图5所示的机器可读指令确定媒体内容是否被识别为受版权保护的媒体内容并发出版权通知。当图1的站点监控器110的查询创建器202经由查询创建器202接收到来自用户的查询时,图5的流程开始(方框502)。接着,站点监控器110的源读取器204向用户指定的远程站点(或者向用户指定的或另外标识出的远程站点组(例如预定的远程站点组))发送请求。接着,源读取器204从远程站点接收的内容源(例如,图2的源读取器204从图1的远程站点102和/或远程站点104接收内容源)(方框504)。另选地,为了响应于查询而对源进行请求,内容源可能先前已被请求和/或订阅,和/或内容源可能已由第三方请求和/或订阅。
在接收到内容源之后,站点监控器110的源处理器206确定该内容源是否包含先前未被下载和处理的媒体内容(方框506)。例如,源处理器206可以确定自从上一次接收到内容源之后是否上传了新内容。如果该内容源不包含任何新媒体内容(方框506),则控制返回方框502并等待进一步的查询。另选地,控制可返回方框504并等待进一步的内容源。
如果该内容源包含先前未被下载和分析的媒体内容(方框506),则站点监控器110的源处理器206提取该内容源中新媒体内容的标识(例如地址或URL)(方框508)。接着,源处理器206选择与接收到的查询相关联的任意条新媒体内容(方框510)。接下来,站点监控器110的内容下载器208和内容接收器210利用所提取的标识来下载标识出的媒体内容(方框512)。在接收到所下载的媒体内容之后,站点监控器110的内容处理器212对媒体内容进行处理以确定媒体内容的同一性(方框514)。例如,站点监控器110的内容处理器212可以从媒体内容中提取和/或产生码和/或签名,并可以将该码和/或签名与已知媒体内容所关联的码和/或签名进行比较。
接着,内容处理器212将提取的识别信息与受版权保护的媒体内容的数据库中的识别信息进行比较(方框516)。如果从媒体内容提取的识别信息与受版权保护的媒体内容所关联的识别信息不匹配(方框518),则控制返回方框502并等待进一步的查询信息。另选地,控制可返回方框504并等待进一步的内容源。
如果从媒体内容提取的识别信息与受版权保护的媒体内容所关联的识别信息确实匹配(方框518),则站点监控器110的通知器218向有关各方发送通知(方框520)。例如,站点监控器可以向提供媒体内容下载的远程站点、将媒体内容上传到远程站点的用户、在远程站点浏览媒体内容的用户、媒体内容版权的所有者和/或执法实体发送版权通知。然后,控制返回方框502并等待进一步的查询。另选地,控制可返回方框504并等待进一步的内容源。
图6例示了示例性内容源文件600。示例性内容源文件600为XML格式的真正简易聚合(Really Simple Syndication,RSS)文件。示例性内容源文件600可由图1的站点监控器110接收以获得与远程站点102和/或远程站点104处的媒体内容有关的信息。该示例性内容源文件包括站点部分602、第一项目部分604、第二项目部分606以及第三项目部分608。
所示例子中的站点部分602包括远程站点(例如图1的远程站点102和/或远程站点104)的名称610、远程站点的URL链接612、远程站点的说明614、内容源的语言616、内容源的公布日期618以及远程站点管理员的联系信息620。
第一项目部分604、第二项目部分606和第三项目部分608分别标识出在站点部分602中所标识的远程站点处的一条不同的媒体内容。第一项目部分604、第二项目部分606和第三项目部分608各自包括媒体内容的名称622(a-c)、媒体内容的URL链接624(a-c)、媒体内容的说明626(a-c)、媒体内容的公布日期628(a-c)、以及指向远程站点用户可访问的媒体内容所在的来源网页的URL链接630(a-c)。
尽管示例性内容源文件600包括上述部分和字段,但内容字段文件可包括上述部分和字段的任意组合,并可包括与远程站点或媒体内容相关联的任何其它信息。此外,当示例性内容源文件600为XML文件时,可以使用任何类型的内容源文件。
图7是示例性计算机平台1000的框图,该示例性计算机平台1000能够执行如图3-5所示的机器可读指令以实现图1的站点监控器110和/或图2的查询创建器202、源读取器204、源处理器206、内容下载器208、内容接收器210、内容处理器212、数据存储部214、量度生成器216以及通知器218,和/或此处公开的其它装置和/或方法。
本示例的计算机平台1000包括处理器1012(如通用可编程处理器)。处理器1012包括本地存储器1014,并执行随机存取存储器1018中的经编码指令1016、只读存储器1020中的经编码指令1017和/或另一存储器设备中的指令。除此之外,处理器1012可执行如图3所示的机器可读指令。处理器1012可为任意类型的处理单元,例如来自微处理器系列、
Figure G2008800256152D00132
微处理器系列、
Figure G2008800256152D00133
微处理器系列和/或Intel
Figure G2008800256152D00134
微处理器系列的微处理器。当然,其它系列的其它处理器也是适用的。
处理器1012经由总线1022与包括易失性存储器1018和非易失性存储器1020的主存储器进行通信。易失性存储器1018可由以下装置实现:同步动态随机存取存储器(SDRAM)、动态随机存取存储器(DRAM)、RAMBUS动态随机存取存储器(RDRAM)和/或任何其它类型的随机存取存储器设备。非易失性存储器1020可由闪存和/或任何其它所需类型的存储器设备实现。通常由存储器控制器(未示出)以常规方式控制对主存储器1018、1020的访问。
计算机1000还包括常规的接口电路1024。接口电路1024可由任何类型的公知接口标准实现,例如以太网接口、通用串行总线(USB)和/或第三代输入/输出(3GIO)接口。
一个或更多个输入设备1026连接到接口电路1024。输入设备1026允许用户将数据和命令输入到处理器1012中。输入设备可以由例如键盘、鼠标、触摸屏、轨迹板、轨迹球、isopoint和/或语音识别系统实现。
一个或多个输出设备1028也连接到接口电路1024。输出设备1028可由例如显示设备(例如液晶显示器、阴极射线管显示器(CRT)、打印机和/或扬声器)实现。因此,接口电路1024通常包括图形驱动卡。
接口电路1024还包括通信设备(例如调制解调器或网络接口卡)以便经由网络(例如以太网连接、数字用户线(DSL)、电话线、同轴电缆、蜂窝电话系统等)与外部计算机交换数据。
计算机100还包括一个或更多个用于存储软件和数据的海量存储设备1030。这种海量存储设备1030的示例包括软盘驱动器、硬盘驱动器、光盘(CD)驱动器和数字通用盘(DVD)驱动器。
尽管此处描述了特定方法、装置和制品,但本专利的涵盖范围并不局限于此。相反,本专利涵盖了无论是在文字上还是根据等同原理而完全落入所附权利要求书范围内的所有方法、装置和制品。

Claims (63)

1.一种方法,所述方法包括以下步骤:
请求与接收的主题标识相关联的真正简易聚合(RSS)源文件;
接收标识出第一媒体内容的所述RSS源文件;
从所述RSS源文件中提取所述第一媒体内容的第一资源标识符;
使用所述第一资源标识符检索获得所述第一媒体内容;
执行以下步骤中的至少一个:从所述第一媒体内容提取第一内容识别码,和生成所述第一媒体内容的第一签名;以及
将所述第一内容识别码和所述第一签名二者中的至少一个存储在存储器中。
2.根据权利要求1所述的方法,所述方法还包括以下步骤:将所述第一内容识别码和所述第一签名二者中的至少一个与参考媒体内容所关联的码和第一签名二者中的至少一个进行比较。
3.根据权利要求2所述的方法,所述方法还包括以下步骤:当所述第一内容识别码和所述第一签名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至少一个相匹配时,存储所述第一媒体内容的标识。
4.根据权利要求2所述的方法,所述方法还包括以下步骤:当所述第一内容识别码和所述第一签名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至少一个相匹配时,向所述参考内容的版权所有者、所述第一媒体内容的发布者、版权维权实体以及媒体内容评价提供者中的至少一个发送通知,所述通知指示了所述第一媒体内容是所述参考媒体内容的真实副本。
5.根据权利要求1所述的方法,其中所述RSS源文件标识出第二媒体内容,所述方法还包括以下步骤:
从所述RSS源文件中提取所述第二媒体内容的第二资源标识符;
使用所述第二资源标识符检索获得所述第二媒体内容;
执行以下步骤中的至少一个:从所述第二媒体内容提取第二内容识别码,和生成所述第二媒体内容的第二签名;以及
将所述第二内容识别码和所述第二签名二者中的至少一个存储在存储器中。
6.根据权利要求1所述的方法,其中所述RSS源文件是可扩展标记语言文件。
7.根据权利要求1所述的方法,其中所述第一媒体内容是视频。
8.根据权利要求1所述的方法,其中从互联网上的服务器接收所述RSS源文件。
9.根据权利要求8所述的方法,其中从所述服务器下载所述第一媒体内容。
10.根据权利要求8所述的方法,其中从与提供所述RSS源文件的服务器不同的内容服务器下载所述第一媒体内容。
11.根据权利要求1所述的方法,其中所述RSS源文件标识出第二媒体内容,所述方法还包括以下步骤:
提取与所述第二媒体内容相关联的文本;
确定所述文本是否标识出所接收的主题标识;以及
当所述文本标识出所述主题标识时,检索获得所述第二媒体内容。
12.一种装置,所述装置包括:
源读取器,其请求与接收的主题标识相关联的真正简易聚合(RSS)源文件,并且接收标识出第一媒体内容的所述RSS源文件;
源处理器,其从所述RSS源文件中提取所述第一媒体内容的第一资源标识符;
内容下载器,其使用所述第一资源标识符检索获得所述第一媒体内容;
内容处理器,其执行以下操作中的至少一个:从所述第一媒体内容提取第一内容识别码,和生成所述第一媒体内容的第一签名;以及
数据存储部,其存储所述第一内容识别码和所述第一签名二者中的至少一个。
13.根据权利要求12所述的装置,其中所述内容处理器还将所述第一内容识别码和所述第一签名二者中的至少一个与参考媒体内容所关联的码和第一签名二者中的至少一个进行比较。
14.根据权利要求13所述的装置,其中当所述第一内容识别码和所述第一签名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至少一个相匹配时,所述数据存储部还存储所述第一媒体内容的标识。
15.根据权利要求13所述的装置,所述装置还包括通知器,当所述第一内容识别码和所述第一签名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至少一个相匹配时,所述通知器向所述参考内容的版权所有者、所述第一媒体内容的发布者、版权维权实体以及媒体内容评价提供者中的至少一个发送通知,所述通知指示了所述第一媒体内容是所述参考媒体内容的真实副本。
16.根据权利要求12所述的装置,其中所述RSS源文件标识出第二媒体内容,所述源处理器还从所述RSS源文件中提取所述第二媒体内容的第二资源标识符,所述内容下载器还使用所述第二资源标识符检索获得所述第二媒体内容,所述内容处理器还执行从所述第二媒体内容提取第二内容识别码的操作和生成所述第二媒体内容的第二签名的操作中的至少一个,以及所述数据存储部还存储所述第二内容识别码和所述第二签名二者中的至少一个。
17.根据权利要求12所述的装置,其中所述RSS源文件是可扩展标记语言文件。
18.根据权利要求12所述的装置,其中所述第一媒体内容是视频。
19.根据权利要求12所述的装置,其中从互联网上的服务器接收所述RSS源文件。
20.根据权利要求19所述的装置,其中从所述服务器下载所述第一媒体内容。
21.根据权利要求19所述的装置,其中从与提供所述RSS源文件的服务器不同的内容服务器下载所述第一媒体内容。
22.根据权利要求12所述的装置,其中所述RSS源文件标识出第二媒体内容,所述源处理器还提取与所述第二媒体内容相关联的文本并确定所述文本是否标识出所接收的主题标识,以及当所述文本标识出所述主题标识时,所述内容检索器还检索获得所述第二媒体内容。
23.一种存储有指令的机器可读介质,所述指令在被执行时使得机器执行以下操作:
请求与接收的主题标识相关联的真正简易聚合(RSS)源文件;
接收标识出第一媒体内容的所述RSS源文件;
从所述RSS源文件中提取所述第一媒体内容的第一资源标识符;
使用所述第一资源标识符检索获得所述第一媒体内容;
执行以下操作中的至少一个:从所述第一媒体内容提取第一内容识别码,和生成所述第一媒体内容的第一签名;以及
将所述第一内容识别码和所述第一签名二者中的至少一个存储在存储器中。
24.根据权利要求23所述的机器可读介质,其中所述指令还使得所述机器将所述第一内容识别码和所述第一签名二者中的至少一个与参考媒体内容所关联的码和第一签名二者中的至少一个进行比较。
25.根据权利要求24所述的机器可读介质,其中当所述第一内容识别码和所述第一签名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至少一个相匹配时,所述指令还使得所述机器存储所述第一媒体内容的标识。
26.根据权利要求24所述的机器可读介质,其中当所述第一内容识别码和所述第一签名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至少一个相匹配时,所述指令还使得所述机器向所述参考内容的版权所有者、所述第一媒体内容的发布者、版权维权实体以及媒体内容评价提供者中的至少一个发送通知,所述通知指示了所述第一媒体内容是所述参考媒体内容的真实副本。
27.根据权利要求23所述的机器可读介质,其中所述RSS源文件标识出第二媒体内容,并且所述指令还使得所述机器执行以下操作:
从所述RSS源文件中提取所述第二媒体内容的第二资源标识符;
使用所述第二资源标识符检索获得所述第二媒体内容;
执行以下操作中的至少一个:从所述第二媒体内容中提取第二内容识别码,和生成所述第二媒体内容的第二签名;以及
将所述第二内容识别码和所述第二签名二者中的至少一个存储在存储器中。
28.根据权利要求23所述的机器可读介质,其中所述RSS源文件是可扩展标记语言文件。
29.根据权利要求23所述的机器可读介质,其中所述第一媒体内容是视频。
30.根据权利要求23所述的机器可读介质,其中从互联网上的服务器接收所述RSS源文件。
31.根据权利要求30所述的机器可读介质,其中从所述服务器下载所述第一媒体内容。
32.根据权利要求30所述的机器可读介质,其中从与提供所述RSS源文件的服务器不同的内容服务器下载所述第一媒体内容。
33.根据权利要求23所述的机器可读介质,其中所述RSS源文件标识出第二媒体内容,并且所述指令还使得所述机器执行以下操作:
提取与所述第二媒体内容相关联的文本;
确定所述文本是否标识出所接收的主题标识;以及
当所述文本标识出所述主题标识时,检索获得所述第二媒体内容。
34.一种方法,所述方法包括以下步骤:
订阅聚合源;
接收标识出第一媒体内容的源广播;
从所述源广播中提取所述第一媒体内容的第一资源标识符;
使用所述第一资源标识符检索获得所述第一媒体内容;
执行以下步骤中的至少一个:从所述第一媒体内容中提取第一内容识别码,和生成所述第一媒体内容的第一签名;以及
将所述第一内容识别码和所述第一签名二者中的至少一个存储在存储器中。
35.根据权利要求34所述的方法,所述方法还包括以下步骤:将所述第一内容识别码和所述第一签名二者中的至少一个与参考媒体内容所关联的码和第一签名二者中的至少一个进行比较。
36.根据权利要求35所述的方法,所述方法还包括以下步骤:当所述第一内容识别码和所述第一签名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至少一个相匹配时,存储所述第一媒体内容的标识。
37.根据权利要求35所述的方法,所述方法还包括以下步骤:当所述识别码和所述第一签名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至少一个相匹配时,向所述参考内容的版权所有者、所述第一媒体内容的发布者、版权维权实体、所述网络服务器以及媒体内容评价提供者中的至少一个发送通知,所述通知指示了所述第一媒体内容是所述参考媒体内容的真实副本。
38.根据权利要求34所述的方法,其中所述聚合源标识出第二媒体内容,所述方法还包括以下步骤:
从所述聚合源中提取所述第二媒体内容的第二资源标识符;
使用所述第二资源标识符检索获得所述第二媒体内容;
执行以下步骤中的至少一个:从所述第二媒体内容中提取第二内容识别码,和生成所述第二媒体内容的第二签名;以及
将所述第二内容识别码和所述第二签名二者中的至少一个存储在存储器中。
39.根据权利要求34所述的方法,其中所述聚合源是可扩展标记语言文件。
40.根据权利要求34所述的方法,其中所述第一媒体内容是视频。
41.根据权利要求34所述的方法,其中从所述网络服务器检索获得所述第一媒体内容。
42.根据权利要求34所述的方法,其中从与提供所述聚合源的服务器不同的内容服务器下载所述第一媒体内容。
43.根据权利要求34所述的方法,其中所述聚合源标识出第二媒体内容,所述方法还包括以下步骤:
接收主题标识;
提取与所述第二媒体内容相关联的文本;
确定所述文本是否标识出所接收的主题标识;以及
当所述文本标识出所述主题标识时,检索获得所述第二媒体内容。
44.一种装置,所述装置包括:
源读取器,其订阅聚合源,并接收标识出第一媒体内容的源广播;
源处理器,其从所述源广播中提取所述第一媒体内容的第一资源标识符;
源下载器,其使用所述第一资源标识符检索获得所述第一媒体内容;
源处理器,其执行以下步骤中的至少一个:从所述第一媒体内容中提取第一内容识别码,和生成所述第一媒体内容的第一签名;以及
数据存储部,其将所述第一内容识别码和所述第一签名二者中的至少一个存储在存储器中。
45.根据权利要求44所述的装置,其中所述源处理器还将所述第一内容识别码和所述第一签名二者中的至少一个与参考媒体内容所关联的码和第一签名二者中的至少一个进行比较。
46.根据权利要求45所述的装置,其中当所述第一内容识别码和所述第一签名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至少一个相匹配时,所述数据存储部还存储所述第一媒体内容的标识。
47.根据权利要求45所述的装置,所述装置还包括通知器,当所述识别码和所述第一签名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至少一个相匹配时,所述通知器向所述参考内容的版权所有者、所述第一媒体内容的发布者、版权维权实体、所述网络服务器以及媒体内容评价提供者中的至少一个发送通知,所述通知指示了所述第一媒体内容是所述参考媒体内容的真实副本。
48.根据权利要求44所述的装置,其中所述聚合源标识出第二媒体内容,所述源处理器还从所述聚合源中提取所述第二媒体内容的第二资源标识符,所述源下载器还使用所述第二资源标识符检索获得所述第二媒体内容,所述内容处理器还执行从所述第二媒体内容中提取第二内容识别码的操作和生成所述第二媒体内容的第二签名的操作中的至少一个,以及所述数据存储部还将所述第二内容识别码和所述第二签名二者中的至少一个存储在存储器中。
49.根据权利要求44所述的装置,其中所述聚合源是可扩展标记语言文件。
50.根据权利要求44所述的装置,其中所述第一媒体内容是视频。
51.根据权利要求44所述的装置,其中从所述网络服务器检索获得所述第一媒体内容。
52.根据权利要求44所述的装置,其中从与提供所述聚合源的服务器不同的内容服务器下载所述第一媒体内容。
53.根据权利要求44所述的装置,其中所述聚合源标识出第二媒体内容,所述装置还包括用于接收主题标识的查询创建器,其中所述源处理器还提取与所述第二媒体内容相关联的文本并确定所述文本是否标识出所接收的主题标识,并且当所述文本标识出所述主题标识时,所述内容下载器还检索获得所述第二媒体内容。
54.一种存储有指令的机器可读介质,所述指令在被执行时使得机器执行以下操作:
订阅聚合源;
接收标识出第一媒体内容的源广播;
从所述源广播中提取所述第一媒体内容的第一资源标识符;
使用所述第一资源标识符检索获得所述第一媒体内容;
执行以下操作中的至少一个:从所述第一媒体内容中提取第一内容识别码,和生成所述第一媒体内容的第一签名;以及
将所述第一内容识别码和所述第一签名二者中的至少一个存储在存储器中。
55.根据权利要求54所述的机器可读介质,其中所述指令还使得所述机器将所述第一内容识别码和所述第一签名二者中的至少一个与参考媒体内容所关联的码和第一签名二者中的至少一个进行比较。
56.根据权利要求55所述的机器可读介质,其中当所述第一内容识别码和所述第一签名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至少一个相匹配时,所述指令还使得所述机器存储所述第一媒体内容的标识。
57.根据权利要求55所述的机器可读介质,其中当所述识别码和所述第一签名二者中的至少一个与所述参考媒体内容所关联的码和第一签名二者中的至少一个相匹配时,所述指令还使得所述机器向所述参考内容的版权所有者、所述第一媒体内容的发布者、版权维权实体、所述网络服务器以及媒体内容评价提供者中的至少一个发送通知,所述通知指示了所述第一媒体内容是所述参考媒体内容的真实副本。
58.根据权利要求54所述的机器可读介质,其中所述聚合源标识出第二媒体内容,并且所述指令还使得所述机器执行以下操作:
从所述聚合源中提取所述第二媒体内容的第二资源标识符;
使用所述第二资源标识符检索获得所述第二媒体内容;
执行以下操作中的至少一个:从所述第二媒体内容中提取第二内容识别码,和生成所述第二媒体内容的第二签名;以及
将所述第二内容识别码和所述第二签名二者中的至少一个存储在存储器中。
59.根据权利要求54所述的机器可读介质,其中所述聚合源是可扩展标记语言文件。
60.根据权利要求54所述的机器可读介质,其中所述第一媒体内容是视频。
61.根据权利要求54所述的机器可读介质,其中从所述网络服务器检索获得所述第一媒体内容。
62.根据权利要求54所述的机器可读介质,其中从与提供所述聚合源的服务器不同的内容服务器下载所述第一媒体内容。
63.根据权利要求54所述的机器可读介质,其中所述聚合源标识出第二媒体内容,并且所述指令还使得所述机器执行以下操作:
接收主题标识;
提取与所述第二媒体内容相关联的文本;
确定所述文本是否标识出所接收的主题标识;以及
当所述文本标识出所述主题标识时,检索获得所述第二媒体内容。
CN200880025615A 2007-05-21 2008-02-15 互联网发布内容的监控方法和装置 Pending CN101779201A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US93934107P 2007-05-21 2007-05-21
US60/939,341 2007-05-21
PCT/US2008/054151 WO2008144087A1 (en) 2007-05-21 2008-02-15 Methods and apparatus to monitor content distributed by the internet

Publications (1)

Publication Number Publication Date
CN101779201A true CN101779201A (zh) 2010-07-14

Family

ID=39433725

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880025615A Pending CN101779201A (zh) 2007-05-21 2008-02-15 互联网发布内容的监控方法和装置

Country Status (4)

Country Link
US (1) US20080294647A1 (zh)
EP (1) EP2165277A1 (zh)
CN (1) CN101779201A (zh)
WO (1) WO2008144087A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012016404A1 (zh) * 2010-08-05 2012-02-09 中兴通讯股份有限公司 Rss订阅方法及其客户端
CN103369364A (zh) * 2012-03-26 2013-10-23 尼尔森(美国)有限公司 使用多类型签名进行媒体监控
CN104115142A (zh) * 2011-11-01 2014-10-22 谷歌公司 用于书签同步的特定于设备的文件夹
CN103369364B (zh) * 2012-03-26 2016-11-30 尼尔森(美国)有限公司 使用多类型签名进行媒体监控
CN108335150A (zh) * 2013-04-17 2018-07-27 尼尔森(美国)有限公司 用于监测媒体呈现的装置和计算机可读存储介质

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9646005B2 (en) * 2005-10-26 2017-05-09 Cortica, Ltd. System and method for creating a database of multimedia content elements assigned to users
US20080288983A1 (en) 2007-05-18 2008-11-20 Johnson Bradley G System and Method for Providing Sequential Video and Interactive Content
US8386387B2 (en) * 2007-12-21 2013-02-26 Utrom Processing Co. L.L.C. System and method for tracking syndication of internet content
KR101508246B1 (ko) * 2008-01-17 2015-04-06 삼성전자주식회사 휴대용 디바이스가 rss 서비스를 제공하는 방법 및 이를위한 장치
US8265990B2 (en) * 2008-05-15 2012-09-11 Utrom Processing Co. L.L.C. Method and system for selecting and delivering media content via the internet
US8521732B2 (en) 2008-05-23 2013-08-27 Solera Networks, Inc. Presentation of an extracted artifact based on an indexing technique
US20090290492A1 (en) * 2008-05-23 2009-11-26 Matthew Scott Wood Method and apparatus to index network traffic meta-data
US8625642B2 (en) 2008-05-23 2014-01-07 Solera Networks, Inc. Method and apparatus of network artifact indentification and extraction
US20100107090A1 (en) * 2008-10-27 2010-04-29 Camille Hearst Remote linking to media asset groups
US20100191609A1 (en) * 2009-01-23 2010-07-29 Philip Hodgetts System and method for providing access to remotely stored digital media using an rss feed
US8849991B2 (en) 2010-12-15 2014-09-30 Blue Coat Systems, Inc. System and method for hypertext transfer protocol layered reconstruction
US8666985B2 (en) 2011-03-16 2014-03-04 Solera Networks, Inc. Hardware accelerated application-based pattern matching for real time classification and recording of network traffic
CN102214227B (zh) * 2011-06-23 2013-03-20 华南理工大学 基于互联网层次结构存储的自动舆情监控方法
US8875303B2 (en) * 2012-08-02 2014-10-28 Google Inc. Detecting pirated applications
US20140082183A1 (en) * 2012-09-14 2014-03-20 Salesforce.Com, Inc. Detection and handling of aggregated online content using characterizing signatures of content items
US20150169677A1 (en) * 2013-12-18 2015-06-18 Avraham Noiman System for following governmental rules and rulemaking processes
US20150242376A1 (en) * 2014-02-24 2015-08-27 Ca, Inc. Publishing Information Technology Data As A Newsfeed
CN105991671A (zh) * 2015-01-28 2016-10-05 中兴通讯股份有限公司 一种存储文件的方法和服务器
US11470367B2 (en) * 2020-04-30 2022-10-11 The Nielsen Company (Us), Llc Methods and apparatus to monitor on-demand media

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7171016B1 (en) * 1993-11-18 2007-01-30 Digimarc Corporation Method for monitoring internet dissemination of image, video and/or audio files
US6611607B1 (en) * 1993-11-18 2003-08-26 Digimarc Corporation Integrating digital watermarks in multimedia content
US5862260A (en) * 1993-11-18 1999-01-19 Digimarc Corporation Methods for surveying dissemination of proprietary empirical data
US6424725B1 (en) * 1996-05-16 2002-07-23 Digimarc Corporation Determining transformations of media signals with embedded code signals
US6408082B1 (en) * 1996-04-25 2002-06-18 Digimarc Corporation Watermark detection using a fourier mellin transform
US6614914B1 (en) * 1995-05-08 2003-09-02 Digimarc Corporation Watermark embedder and reader
US5574787A (en) * 1994-07-25 1996-11-12 Ryan; John O. Apparatus and method for comprehensive copy protection for video platforms and unprotected source material
US5943422A (en) * 1996-08-12 1999-08-24 Intertrust Technologies Corp. Steganographic techniques for securely delivering electronic digital rights management control information over insecure communication channels
CN101359350B (zh) * 1995-02-13 2012-10-03 英特特拉斯特技术公司 用于安全地管理在数据项上的操作的方法
US6760463B2 (en) * 1995-05-08 2004-07-06 Digimarc Corporation Watermarking methods and media
US6807534B1 (en) * 1995-10-13 2004-10-19 Trustees Of Dartmouth College System and method for managing copyrighted electronic media
US5572643A (en) * 1995-10-19 1996-11-05 Judson; David H. Web browser with dynamic display of information objects during linking
US6381341B1 (en) * 1996-05-16 2002-04-30 Digimarc Corporation Watermark encoding method exploiting biases inherent in original signal
US5805699A (en) * 1996-05-20 1998-09-08 Fujitsu Limited Software copying system
US6108637A (en) * 1996-09-03 2000-08-22 Nielsen Media Research, Inc. Content display monitor
US6130889A (en) * 1996-10-02 2000-10-10 International Business Machines Corporation Determining and maintaining hop-count for switched networks
US5850386A (en) * 1996-11-01 1998-12-15 Wandel & Goltermann Technologies, Inc. Protocol analyzer for monitoring digital transmission networks
US5708654A (en) * 1996-11-27 1998-01-13 Arndt; Manfred R. Method for detecting proxy ARP replies from devices in a local area network
US6012087A (en) * 1997-01-14 2000-01-04 Netmind Technologies, Inc. Unique-change detection of dynamic web pages using history tables of signatures
US6112202A (en) * 1997-03-07 2000-08-29 International Business Machines Corporation Method and system for identifying authoritative information resources in an environment with content-based links between information resources
US5895471A (en) * 1997-07-11 1999-04-20 Unwired Planet, Inc. Providing a directory of frequently used hyperlinks on a remote server
US6078917A (en) * 1997-12-18 2000-06-20 International Business Machines Corporation System for searching internet using automatic relevance feedback
US6339595B1 (en) * 1997-12-23 2002-01-15 Cisco Technology, Inc. Peer-model support for virtual private networks with potentially overlapping addresses
JP4313873B2 (ja) * 1998-01-30 2009-08-12 キヤノン株式会社 電子機器及びデータ処理方法
JPH11234264A (ja) * 1998-02-17 1999-08-27 Canon Inc 電子透かし方式及びそれを用いた電子情報配布システム並びに記憶媒体
US6192404B1 (en) * 1998-05-14 2001-02-20 Sun Microsystems, Inc. Determination of distance between nodes in a computer network
JP3641139B2 (ja) * 1998-06-30 2005-04-20 株式会社東芝 ホップカウント管理方法およびノード装置
US6401118B1 (en) * 1998-06-30 2002-06-04 Online Monitoring Services Method and computer program product for an online monitoring search engine
US6862622B2 (en) * 1998-07-10 2005-03-01 Van Drebbel Mariner Llc Transmission control protocol/internet protocol (TCP/IP) packet-centric wireless point to multi-point (PTMP) transmission system architecture
US7383228B2 (en) * 1998-08-13 2008-06-03 International Business Machines Corporation Method and system for preventing unauthorized rerecording of multimedia content
US6295296B1 (en) * 1998-09-08 2001-09-25 Cisco Technology, Inc. Use of a single data structure for label forwarding and imposition
US6337861B1 (en) * 1999-02-02 2002-01-08 Cisco Technology, Inc. Method and apparatus to properly route ICMP messages in a tag-switching network
US6526044B1 (en) * 1999-06-29 2003-02-25 Wandel & Goltermann Technologies, Inc. Real-time analysis through capture buffer with real-time historical data correlation
US6795863B1 (en) * 1999-08-10 2004-09-21 Intline.Com, Inc. System, device and method for combining streaming video with e-mail
US7194752B1 (en) * 1999-10-19 2007-03-20 Iceberg Industries, Llc Method and apparatus for automatically recognizing input audio and/or video streams
US6885748B1 (en) * 1999-10-23 2005-04-26 Contentguard Holdings, Inc. System and method for protection of digital works
US6687247B1 (en) * 1999-10-27 2004-02-03 Cisco Technology, Inc. Architecture for high speed class of service enabled linecard
FR2803676A1 (fr) * 2000-01-11 2001-07-13 Canon Kk Determination d'une segmentation d'un signal numerique pour inserer des signaux de marquage et insertion associee
US6594694B1 (en) * 2000-05-12 2003-07-15 Hewlett-Packard Development Company, Lp. System and method for near-uniform sampling of web page addresses
US6684254B1 (en) * 2000-05-31 2004-01-27 International Business Machines Corporation Hyperlink filter for “pirated” and “disputed” copyright material on the internet in a method, system and program
US6920133B1 (en) * 2000-06-07 2005-07-19 At&T Corp. Techniques for introducing in-band network management packets in multi-protocol label switching networks
US6430301B1 (en) * 2000-08-30 2002-08-06 Verance Corporation Formation and analysis of signals with common and transaction watermarks
US7043473B1 (en) * 2000-11-22 2006-05-09 Widevine Technologies, Inc. Media tracking system and method
US8055899B2 (en) * 2000-12-18 2011-11-08 Digimarc Corporation Systems and methods using digital watermarking and identifier extraction to provide promotional opportunities
US7342942B1 (en) * 2001-02-07 2008-03-11 Cortina Systems, Inc. Multi-service segmentation and reassembly device that maintains only one reassembly context per active output port
US7213069B2 (en) * 2001-02-28 2007-05-01 Microsoft Corporation Category name service able to override the category name based on requestor privilege information
WO2002082271A1 (en) * 2001-04-05 2002-10-17 Audible Magic Corporation Copyright detection and protection system and method
US6973574B2 (en) * 2001-04-24 2005-12-06 Microsoft Corp. Recognizer of audio-content in digital signals
US7126944B2 (en) * 2001-07-05 2006-10-24 Intel Corporation Routing packets across multiple forwarding elements
US6958998B2 (en) * 2001-07-09 2005-10-25 International Business Machines Corporation Traffic management in packet-based networks
US7171683B2 (en) * 2001-08-30 2007-01-30 Riverhead Networks Inc. Protecting against distributed denial of service attacks
US7200146B2 (en) * 2001-08-17 2007-04-03 Intel Corporation System and method of IP packet forwarding across directly connected forwarding elements
US7082129B2 (en) * 2002-04-29 2006-07-25 International Business Machines Corporation Secure method and system to prevent external unauthorized remotely initiated power up events in computer
KR101019981B1 (ko) * 2002-06-07 2011-03-09 톰슨 라이센싱 네트워크에서 디지털 인코딩된 데이터의 분배를 제어하기 위한 방법 및 장치
US10986403B2 (en) * 2002-06-27 2021-04-20 Piranha Media Distribution, Inc. Interactive digital media and advertising presentation platform
US7388869B2 (en) * 2002-11-19 2008-06-17 Hughes Network Systems, Llc System and method for routing among private addressing domains
US20040139170A1 (en) * 2003-01-15 2004-07-15 Ming-Teh Shen Method and apparatus for management of shared wide area network connections
US20050268343A1 (en) * 2004-05-14 2005-12-01 Onoda Sen Ichi Application management device and its method
US7975062B2 (en) * 2004-06-07 2011-07-05 Sling Media, Inc. Capturing and sharing media content
US7596571B2 (en) * 2004-06-30 2009-09-29 Technorati, Inc. Ecosystem method of aggregation and search and related techniques
US20060036488A1 (en) * 2004-08-10 2006-02-16 Hiro-Media Ltd. Method and system for dynamic, real-time addition of advertisements to downloaded static content
US9299077B2 (en) * 2005-10-25 2016-03-29 Vie, Inc. Method and apparatus for obtaining revenue from the distribution of hyper-relevant advertising through permissive mind reading, proximity encounters, and database aggregation
US20070162761A1 (en) * 2005-12-23 2007-07-12 Davis Bruce L Methods and Systems to Help Detect Identity Fraud
US8738749B2 (en) * 2006-08-29 2014-05-27 Digimarc Corporation Content monitoring and host compliance evaluation
US8694607B2 (en) * 2006-10-06 2014-04-08 Google Inc. Recursive subscriptions to content feeds
US9179200B2 (en) * 2007-03-14 2015-11-03 Digimarc Corporation Method and system for determining content treatment
US20080155653A1 (en) * 2006-12-24 2008-06-26 Angelo Anthony Mandato Manageable feed for distributing audio and/or video content for a specific user
US7930290B2 (en) * 2007-01-12 2011-04-19 Microsoft Corporation Providing virtual really simple syndication (RSS) feeds
CN101682461A (zh) * 2007-03-22 2010-03-24 尼尔森(美国)有限公司 数字版权管理和观众测量系统及方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012016404A1 (zh) * 2010-08-05 2012-02-09 中兴通讯股份有限公司 Rss订阅方法及其客户端
CN104115142A (zh) * 2011-11-01 2014-10-22 谷歌公司 用于书签同步的特定于设备的文件夹
CN104115142B (zh) * 2011-11-01 2016-02-03 谷歌公司 用于书签同步的特定于设备的文件夹
CN103369364A (zh) * 2012-03-26 2013-10-23 尼尔森(美国)有限公司 使用多类型签名进行媒体监控
CN103369364B (zh) * 2012-03-26 2016-11-30 尼尔森(美国)有限公司 使用多类型签名进行媒体监控
CN108335150A (zh) * 2013-04-17 2018-07-27 尼尔森(美国)有限公司 用于监测媒体呈现的装置和计算机可读存储介质
US11282097B2 (en) 2013-04-17 2022-03-22 The Nielsen Company (Us), Llc Methods and apparatus to monitor media presentations
CN108335150B (zh) * 2013-04-17 2022-03-29 尼尔森(美国)有限公司 用于监测媒体呈现的装置和计算机可读存储介质
US11687958B2 (en) 2013-04-17 2023-06-27 The Nielsen Company (Us), Llc Methods and apparatus to monitor media presentations

Also Published As

Publication number Publication date
WO2008144087A1 (en) 2008-11-27
EP2165277A1 (en) 2010-03-24
US20080294647A1 (en) 2008-11-27

Similar Documents

Publication Publication Date Title
CN101779201A (zh) 互联网发布内容的监控方法和装置
US11907237B2 (en) Gathering and contributing content across diverse sources
US20200241719A1 (en) System and method for visual analysis of on-image gestures
JP6848085B2 (ja) ページ表示プログラム、装置、サーバー及び記憶媒体
CN102768676B (zh) 一种格式未知文件的处理方法和装置
US8393002B1 (en) Method and system for testing an entity
US9235557B2 (en) System and method thereof for dynamically associating a link to an information resource with a multimedia content displayed in a web-page
CN104137553B (zh) 视频管理系统
US20160301988A1 (en) Methods and apparatus to validate a tag for media
US7747083B2 (en) System and method for good nearest neighbor clustering of text
AU2008314573B2 (en) Methods and apparatus to create a media measurement reference database from a plurality of distributed sources
US20090319449A1 (en) Providing context for web articles
US20070226207A1 (en) System and method for clustering content items from content feeds
US20080133525A1 (en) Method and system for managing playlists
US20070220048A1 (en) Limited and combined podcast subscriptions
US8886660B2 (en) Method and apparatus for tracking a change in a collection of web documents
EP3149652A1 (en) Fingerprinting and matching of content of a multi-media file
CN105589922A (zh) 页面显示方法、装置、系统以及页面显示辅助方法、装置
US20110184956A1 (en) Accessing digitally published content using re-indexing of search results
EP2423837B1 (en) Method and system for viewing web page and computer program product thereof
US20070179937A1 (en) Apparatus, method, and computer program product for extracting structured document
CN101203853A (zh) 用于支持播客的技术和系统
RU2530671C1 (ru) Способ проверки веб-страниц на содержание в них целевого аудио и/или видео (av) контента реального времени
JP3539146B2 (ja) 著作物の使用条件違反チェック方法及び装置、並びに、著作物の使用条件違反チェックプログラムを格納した記憶媒体
US20200311172A1 (en) System and method thereof for dynamically associating a link to an information resource with a multimedia content displayed in a web-page

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1144971

Country of ref document: HK

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20100714

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1144971

Country of ref document: HK