CN105141871A

CN105141871A - 多功能多媒体设备

Info

Publication number: CN105141871A
Application number: CN201510542342.0A
Authority: CN
Inventors: B·波尼亚托夫斯基; R·马修斯
Original assignee: Tivo Inc
Current assignee: Adeia Media Solutions Inc
Priority date: 2009-12-04
Filing date: 2010-12-03
Publication date: 2015-12-09
Also published as: AU2010325897A1; JP5844274B2; JP2013513315A; EP2507729A1; SG181484A1; EP2507729A4; CN102741842A; CA2782562A1; HK1218814A1; WO2011069035A1

Abstract

描述了一种解释消息、用户定义的警告条件、语音命令并且执行行为进行响应的方法。描述了一种注释媒体内容的方法。描述了一种呈现与基于指纹所识别的媒体内容相关的附加内容的方法。描述了一种识别媒体内容的广告部分正基于从媒体内容获取的指纹而播放的方法。描述了一种一个媒体设备响应于另一媒体记录特定媒体内容而自动记录该特定媒体内容的方法。描述了一种同时在多个设备上播放媒体内容的方法。描述了一种发布与媒体内容的记录相关的信息的方法。描述了一种通过满足闲置准则的媒体设备获取指纹的方法。描述了一种记录或播放基于指纹识别的媒体内容的方法。

Description

多功能多媒体设备

本申请是申请日为2010年12月3日、申请号为201080063087.7、发明名称为“多功能多媒体设备”的申请的分案申请。

技术领域

本发明涉及一种多功能多媒体设备。

背景技术

在本节中所描述的方式是可以实行的方式，但不一定是先前已经构思或实行的方式。因此，除非另有指示，不应该仅仅由于包含在本节中而将本节所述的方法假定为现有技术。

多媒体内容流可以由多媒体播放机接收，以便显示给用户。此外，有关多媒体内容的一般说明可以由多媒体播放机接收，以便显示给用户。多媒体内容通常以固定的不可编辑的格式呈现。用户通过由制作人创作的场景选择，可以跳转到媒体内容内的特定点。因此，观看媒体内容通常是被动的并且用户交互很少。

附图说明

本发明通过示例而非限定的方式在附图中示出，并且图中相同的附图标记表示相似的元件，其中：

图1A是框图，示出了根据实施例的示例性系统；

图1B是框图，示出了根据实施例的示例性媒体设备；

图2示出了流程图，用于根据实施例呈现附加内容。

图3示出了流程图，用于根据实施例确定在媒体内容播放中的位置。

图4示出了流程图，用于根据实施例检测广告播放。

图5示出了流程图，用于根据实施例从媒体内容获取指纹。

图6示出了示例性架构，用于收集和存储从媒体设备获取的指纹。

图7示出了流程图，用于根据实施例呈现消息。

图8示出了流程图，用于根据实施例解释语音命令；

图9示出了流程图，用于根据实施例将注释与媒体内容关联；

图10示出了示例性系统，用于根据一个或多个实施例配置环境。

图11示出了流程图，用于根据一个或多个实施例选择媒体内容，以基于一个或多个从媒体内容获取的指纹进行记录；

图12示出了流程图，用于根据一个或多个实施例把媒体内容的不完整拷贝替换成媒体内容的完整拷贝；

图13示出了流程图，用于根据一个或多个实施例，开始基于一个或多个从媒体内容获取的指纹记录内容流中的媒体内容；

图14示出了流程图，用于根据一个或多个实施例，停止基于一个或多个从媒体内容获取的指纹记录内容流中的媒体内容；

图15示出了框图，示出了本发明的实施例可以在其上实现的系统。

具体实施方式

在下面的描述中，出于解释的目的，陈述了许多具体的细节以提供对本发明彻底的了解。然而显而易见的是，本发明可以在没有这些具体细节的情况下实施。在其他情况下，公知的结构和设备以框图的形式被示出，以避免不必要地使本发明变得模糊。

以下介绍一些特征，每一个特征都可以彼此独立地或与其他特征任意组合地使用。然而，任何单独的特征可能不会解决上述任何问题，或者只能解决上述问题中的一个。上述问题中的一些可能无法被这里所述的任何特征彻底解决。虽然提供了标题，但是关于特定标题却没有在具有该标题的章节中出现的信息也可以在说明书的其他地方找到。

根据以下大纲，描述示例性的特征：

1.0功能概述

2.0系统架构

3.0基于媒体内容指纹呈现附加内容

4.0基于媒体内容指纹确定播放位置，

5.0基于媒体内容指纹进行记录

6.0发布记录或观看信息

7.0从媒体内容获取指纹

8.0呈现消息

9.0解释命令

10.0使输入与媒体内容关联

11.0由个人媒体设备得到注释

12.0标记媒体内容

13.0媒体内容注释的发布

14.0自动生成的注释

15.0环境配置

16.0硬件概述

17.0延伸和替代

1.0功能概述

在实施例中，将媒体内容接收并呈现给用户。从媒体内容获取的指纹接着用于对服务器进行查询，以识别媒体内容。基于媒体内容(基于指纹识别的)，附加内容被获得并呈现给用户。

在实施例中，附加内容可以包括广告(例如，用于产品、服务或其他媒体内容)，其基于所识别的媒体内容而被选择。

在实施例中，在接收命令以呈现媒体内容后，指纹动态地从媒体内容获取。在实施例中，在接收命令以呈现附加内容后，指纹动态地从媒体内容获取，所述附加内容与被呈现的媒体内容有关。

在实施例中，基于从媒体内容获取的指纹，在媒体内容中对面部进行检测。与所述面部有关的人名被确定并呈现在附加内容中。检测面部和/或确定与面部有关的人名可以响应于接收到用户命令而执行。

在实施例中，可以基于从媒体内容获取的指纹对媒体内容帧中的特征(例如，物体、结构、景观、位置等)进行检测。可以对特征进行识别并且可以对识别进行呈现。可以响应于用户命令对特征进行识别和/或对识别进行呈现。

在实施例中，指纹可以在播放媒体内容的同时获取动态地。然后，媒体内容播放中的位置可以基于指纹确定。

在实施例中，附加内容可以基于媒体内容中的播放位置而呈现。在实施例中，基于媒体内容的播放位置而呈现的附加内容可以响应于用户命令。

在实施例中，媒体内容的播放可以在多个设备上基于媒体内容播放中的位置同步进行。在实施例中，通过在多个设备上同时开始播放媒体内容，寻找设备上媒体内容的任意位置或延迟设备上媒体内容的播放，可以实现在多个设备上的同步。在多个设备上同步播放媒体内容期间，在一个设备上的快进、快退、暂停、停止、寻找或播放的命令可以在所有同步的设备上进行。在实施例中，可以确定，广告正基于媒体内容播放中的位置而播放。基于媒体内容播放中的位置，广告可以被跳过或快进。在实施例中，可以提供播放广告或播放广告的速度的通知。在实施例中，可以基于媒体内容播放中的位置选择广告。

在实施例中，通过确定正在播放的媒体内容的一个或多个指纹与媒体内容的广告部分相关，可以检测广告的播放。在实施例中，通过识别与媒体内容的广告部分中的面部相关的人，并且确定所识别的人不是媒体内容中所列的演员，可以检测该广告。在实施例中，可以使用属于正在做广告的产品或服务的附加内容加强广告。在实施例中，广告可以自动快进、静音、或被替换广告取代。在实施例中，依靠跳过检测到的媒体内容的广告部分，可以只记录媒体内容的非广告部分。

在实施例中，接收命令以在与第一用户相关的第一设备上记录特定媒体内容，并且对所述特定媒体内容进行安排，用于在第一设备上进行记录。对第一设备上的特定媒体内容的记录进行安排的通知被提供给与第二用户相关的第二设备。然后，第二设备可以安排特定媒体内容的记录。响应于上述通知，第二设备可以在不接收用户命令或接收用户确认以后对特定媒体内容的记录进行安排，以记录所述特定媒体内容。

在实施例中，可以通过第二设备从第二用户接收命令，以记录被安排用于在第一设备、多个指定设备中的任一个，或与多个指定用户中的任一个相关的设备上记录的所有媒体内容。

在实施例中，可以检测多个设备上的特定媒体内容的已安排的记录。响应于检测到特定媒体内容被安排用于在多个设备上进行记录，可以向多个设备中的至少一个提供特定媒体内容被安排用于在多个设备上进行记录的通知。特定媒体内容可以接着同步显示在多个设备上。基于通过每个设备可访问的用户可用性日历，其中一个设备可以选择时间，以在多个设备上同步播放特定媒体内容。还可以建议时间，以对于所建议的时间接收用户确认。

在实施例中，可以接收命令，以在与用户相关的设备上记录或播放特定媒体内容。响应于命令，特定媒体内容可以被记录或播放，并且可以发布与用户指示相关的信息，用户指示是用户正在记录或播放特定媒体内容。信息可以自动发布到网络服务用于进一步行动，例如在网页上显示。响应于命令，与特定媒体内容相关的信息可以被获得并呈现给用户。在实施例中，可以自动创建组(例如，在一个社交网站上)，用于与播放或记录特定媒体内容的设备相关的用户。

在实施例中，可以检测满足闲置准则的媒体设备。响应于检测到闲置准则，媒体内容可以发送到媒体设备。媒体设备可以配置为，接收特定内容流或经由包括媒体内容的互联网可访问的流。媒体设备可以从媒体内容获取指纹，并且将指纹以及属于媒体的附加数据(如标题、大纲、隐藏字幕文本等)发送到指纹数据库。检测到媒体设备满足闲置准则可以涉及从媒体设备接收信号，媒体设备在媒体设备上没有接收用户命令的情况下完成持续时间，或确定媒体内容具有用于获取指纹的资源可用性。

在实施例中，在播放音频/视频(AV)内容的同时接收消息。基于与用户相关的消息喜好对消息进行解释，并且基于消息喜好向用户呈现信息。在实施例中，一个或多个消息可以基于消息喜好而被过滤。

在实施例中，呈现消息包括在正向用户播放的AV内容的一个或多个视频帧上覆盖与该消息相关的信息。呈现消息可以包括播放与该消息相关的音频信息。在实施例中，AV内容在消息呈现时被暂停或静音。

在实施例中，消息由另一用户作为音频输入、文字输入或图形输入呈现。音频输入可以包括语音，语音与消息的发送者、消息的接收者、特定的虚构人物或非虚构人物，或它们的组合相关。消息可以被唯一地播放给消息接收者。

在实施例中，消息可以在消息优选喜好指定的一段时间内被呈现。消息可以在播放AV内容期间被保留直到出现商业广告，并且可以在商业广告时间被呈现。在实施例中，消息可以从与社交网站相关的消息服务被接收。

在实施例中，用户定义的警报条件从用户处接收。AV内容播放的同时对用户定义的警报条件的发生进行监控，并且对用户定义的警报条件的发生进行检测。警报可以响应于检测到用户定义的警报条件的发生而呈现。

在实施例中，检测警报条件包括确定用户感兴趣的媒体内容在内容流上可用。在实施例中，检测警报条件包括确定与用户请求信息有关的媒体内容在内容流上可用。检测警报条件可以包括接收指示警报条件发生的通知。在实施例中，检测警报条件的发生可以包括，利用光学字符识别(OCR)获得信息和基于信息检测警报条件的发生。

在实施例中，从用户接收语音命令并且基于语音命令对用户进行识别。然后，基于与所识别的用户相关的优选喜好对语音命令进行解释，来确定多个行为中的行为。然后执行所述行为。

在实施例中，确定多个能够适用语音命令的用户。适用用户的数量可以基于语音输入依靠识别用户而被确定。

在实施例中，基于用户优选喜好的行为可以包括配置多媒体设备或环境、呈现信息、进行购买或执行另一适当的行为。在实施例中，行为可以在执行行为之前呈现，用于用户确认，或者可以对行为进行检查，以确保用户允许执行该行为。在实施例中，语音命令可以基于接收的语音命令的语言而被解释。

在实施例中，在多媒体设备上播放媒体内容的同时，从用户接收注释。注释被存储为与媒体内容相关。在实施例中，注释可以包括音频输入、文本输入和/或图形输入。在实施例中，第二次播放的媒体内容伴有从用户接收的音频输入。第二次播放媒体内容可以涉及仅播放带有从用户接收的音频输入的媒体内容的视频部分。

在实施例中，注释的多个版本可以在媒体内容不同回放期间被接收，并且每个注释可以存储为与媒体内容相关。可以以与媒体内容的音频部分的原始语言不同的语言提供注释。注释可以具有与打算进行的回放相关的指令。注释可以包括基于利用光学字符识别获得的信息自动生成的音频。在实施例中，可以对注释进行分析，以获取与媒体内容相关的注释模式。注释可以从用户得到并可以包括媒体内容的评论。在实施例中，用户配置文件可以基于注释产生。注释可以标记在媒体内容播放中的时间间隔或特定点，这可以用作书签以继续媒体内容的播放。由注释标记的间隔在随后播放媒体内容期间可以被跳过，或用来创建播放顺序。

虽然具体的部件在此处叙述作为执行方法步骤，但在其他实施例中，代表指定部件的媒介或机构可以执行方法步骤。此外，虽然本发明的某些方面是关于系统中的部件进行讨论，但本发明可以通过分布在多个系统的部件来实现。本发明的实施例还包括任何系统，该系统包括用于执行在此所述的方法步骤的装置。本发明的实施例还包括带有指令的计算机可读介质，该指令在执行时会使得在此所述的方法步骤被执行。

2.0系统架构

虽然在此描述了特定的计算机架构，但本发明其他的实施例适用于能够用来执行在此所述的功能的任何架构。

图1显示了媒体设备A(100)、媒体源(110)、媒体设备N(120)、指纹服务器(130)、网络设备(140)和网络服务器(150)。这些部件中的任何一个都被呈现，以阐明在此所述的功能，并且这些部件中的任何一个可以不是实现本发明必需的。此外，没有在图1示出的部件也可以用于执行在此所述的功能。描述为通过一个部件执行的功能可以由另一个部件代替执行。

在实施例中，媒体源(110)通常代表任何内容源，媒体设备A(100)可以从媒体源接收媒体内容。媒体源(110)可以是广播者(包括广播公司/服务)，其使媒体内容流到媒体设备A(100)。媒体源(110)可以是媒体内容服务器，媒体设备A(100)从媒体内容服务器下载媒体内容。媒体源(100)可以是音频和/或视频播放机，媒体设备A(100)从音频和/或视频播放机接收正在播放的媒体内容。媒体源(100)可以是计算机可读存储或输入介质(例如，物理存储器、压缩盘或数字视频盘)，媒体设备A(100)对其进行读取来获得媒体内容。术语流、广播、或下载到设备可以在此交替地使用并且不应解释为限制于设备获得数据的一个特定的方法。媒体设备A(100)可以通过流、广播、下载等从广播服务、网络服务器、另一媒体设备，或者能够由媒体设备访问的带有数据或内容的任何适宜的系统接收数据。不同的源可以被提到，作为不同的示例呈现如下。描述了特定源的示例不应理解为仅限于所述源。

在实施例中，指纹服务器(130)通常代表任何服务器，其存储从媒体内容获取的指纹。指纹服务器(130)可以由媒体设备A(100)访问，以下载和/或上传从媒体内容获取的指纹。指纹服务器(130)可以由内容源(例如，广播服务、网络服务或任何其他内容源)管理，用于存储从媒体内容获取的指纹的数据库。内容源可以选择待采指纹的媒体内容。媒体设备A(100)可以从所选的媒体内容获取指纹，并且将指纹提供给指纹服务器(130)。在实施例中，指纹服务器(130)可以作为数据库，用于识别媒体内容或与媒体内容相关(基于从该媒体内容获取的指纹)的元数据。在实施例中，指纹服务器(130)的至少一部分在一个或多个媒体设备上实现。媒体设备可不断地、定期地，或在指纹服务器(130)更新时根据另一合适的时间表进行更新。

在实施例中，网络设备(140)通常代表任何部件，其是媒体设备A(100)的一部分或完全是独立的设备(其包括在网络(例如，互联网，内联网，万维网等)的通信功能)。例如，网络设备(140)可以是计算机，其与媒体设备A(100)或媒体设备A(100)的网卡通信连接。网络设备(140)可以包括发布与媒体设备A(100)相关的信息(例如，安排用于在媒体设备A(100)上记录的媒体内容，在媒体设备A(100)上记录的媒体内容，正在媒体设备A(100)上播放的媒体内容，以前在媒体设备A(100)上播放的媒体内容，媒体设备A(100)上显示的媒体内容，通过媒体设备A(100)收集的用户优选喜好/统计数据，在媒体设备A(100)上的用户设置，等等)的功能。网络设备(140)可以在网站上公布信息，以电子消息或文本消息的形式提供信息，在网络打印机上打印信息，或以任何其他合适的方式发布信息。网络设备(140)可以包括直接将信息提供到另一媒体设备(例如，媒体设备N(120))的功能。网络设备(140)可以包括从网络获得信息的功能。例如，网络设备(140)可以对元数据或任何其他与媒体内容相关的附加数据进行搜索，并且将搜索结果提供到媒体设备A(100)。另一个示例可以涉及获得与媒体内容相关的信息的网络设备(140)，所述媒体内容在媒体设备N(120)上安排、记录、和/或播放。

在实施例中，媒体设备A(100)(或媒体设备N(120))通常表示包括处理器且配置为呈现媒体内容的任何媒体设备。媒体设备A(100)可以指单一的设备或设备(例如，接收器和电视机)的任何组合，其可配置为呈现媒体内容。媒体设备A(100)的示例包括接收器、数字视频录像机、数字视频播放机、电视机、显示器、蓝光播放机、音频内容播放机、视频内容播放机、数码照片相框、手持移动设备、计算机、打印机等中的一个或多个。媒体设备A(100)可通过播放媒体内容(例如，音频和/或视觉媒体内容)，显示媒体内容(例如，静止图像)，打印媒体内容(例如，优惠券)，电子传输媒体内容(例如，电子邮箱)，发布媒体内容(例如，在网站上)或任何其他合适的方法来呈现媒体内容。在实施例中，媒体设备A(100)可以是与系统中的一个或多个其他媒体设备进行通信的管理设备。例如，媒体设备A(100)可以从媒体设备(例如，DVD播放机、遥控装置、操纵杆等)接收命令并将命令传达到另一媒体设备(例如，显示器、接收器等)。在实施例中，媒体设备A(100)可以代表具有配置为执行在此所述的功能一个或多个子系统的任何装置。

在实施例中，媒体设备A(100)可以包括从媒体内容中获取指纹的功能。例如，媒体设备A(100)可以从媒体内容中获取指纹，所述媒体内容记录在相关的存储器上或存储在任何其他可访问的地方(例如，外部硬盘驱动器、DVD等)。媒体设备A(100)也可以从在内容流上可用的媒体内容获取指纹。在内容流上可用的媒体内容包括媒体设备A(100)可访问的任何媒体内容。例如，在内容流上可用的内容可以包括正在由广播服务播出的内容，从网络服务器、对等设备或另一个系统下载的可用内容，或以其他方式由媒体设备A(100)可访问的内容。在实施例中，媒体设备A(100)可以包括获得正在播放的媒体内容以及从正在播放的媒体内容或存储在媒体设备上的媒体内容动态获取指纹的功能。在实施例中，媒体设备A(100)可以包括处理和存储能力，以解压媒体内容(例如，视频帧)、修改和/或编辑媒体内容以及压缩媒体内容。

在实施例中，媒体设备A(100)可以包括通过记录或播放和其他媒体设备相同的媒体内容来模仿其他媒体设备(例如，媒体设备N(120))的功能。例如，媒体设备A(100)可以包括接收媒体设备N(120)上正在记录媒体内容的通知并从内容源获得相同媒体内容的功能。媒体设备A可以自动记录媒体内容或将所述通知提供给用户，并且响应于用户命令记录媒体内容。

根据一个或多个实施例，图1B示出了媒体设备的示例性框图。如图1B所示，媒体设备(100)可以包括多个部件，如存储器系统(155)、磁盘(160)、中央处理单元(CPU)(165)、显示子系统(170)、音频/视频输入(175)、调谐器(180)、网络模块(190)、外设单元(195)、文本/音频转换器(167)和/或执行在此所述功能必要的其他部件。

在实施例中，音频/视频输入(175)可对应任何部件，其包括从外部源接收音频和/或视频输入(例如，HDMI176、DVI177、模拟设备178)的功能。例如，音频/视频输入(175)可以是显示端口或高清晰度多媒体接口(HDMI)，其可以接收来自不同设备的输入。音频/视频输入(175)可以从机顶盒、蓝光光盘播放机、个人计算机、视频游戏机、音频/视频接收器、光盘播放机、增强型通用盘播放机、高清晰度光盘、全息通用盘、激光盘、迷你盘、盘式胶片、RAM盘、乙烯盘、软盘、硬盘驱动器等接收输入。媒体设备A(100)可以包括多个音频/视频输入(175)。

在实施例中，调谐器(180)通常代表能够接收内容流的任何输入部件(例如，通过有线、卫星、互联网、网络、或地面天线)。调谐器(180)可以允许一个或多个接收频率而过滤掉其他(例如，通过使用电子共振)。电视调谐器可以将RF电视传输转换成音频和视频信号，该信号可以进一步处理以产生声音和/或图像。

在实施例中，也可以从网络模块(190)接收输入。网络模块(190)通常代表能够通过网络(例如，互联网、内联网、万维网等)接收信息的任何输入部件。网络模块(190)的示例包括网卡、网络适配器、网络接口控制器(NIC)、网络接口卡、局域网适配器、以太网卡和/或任何其他可以通过网络接收信息的部件。网络模块(190)也可用于直接连接其他设备(例如，媒体设备、计算机、二级存储设备等)。

在实施例中，可以由媒体设备(100)从通过有线和/或无线通信区段通信连接的设备接收输入。媒体设备(100)接收的输入可以存储到存储器系统(155)或磁盘(160)。存储器系统(155)可以包含一个或多个不同类型的物理存储器来存储数据。例如，存储器系统(155)中的一个或多个存储器缓冲器(例如，高清帧缓冲器)可以包括存储容量来加载一个或多个未压缩的高清晰度(HD)视频帧，用于编辑和/或采集指纹。存储器系统(155)也可以以压缩格式(例如，MPEG2、MPEG4或任何其他合适的格式)存储帧，然后帧在此处被解压缩到帧缓冲器，用于修改、采集指纹、更换和/或显示。存储器系统(155)可以包括闪存存储器、DRAM存储器、EEPROM、传统的旋转式磁盘驱动器等。磁盘(160)通常代表媒体设备(100)可访问的二级存储。

在实施例中，中央处理单元(165)可以使用媒体设备A(100)接收的任何输入来执行在此所述的功能。例如，中央处理单元(165)可以用于从储存在存储器系统(155)中的媒体内容帧动态获取指纹。中央处理单元(165)可配置为，基于标签、哈希值、指纹、时间戳或与媒体内容相关的其他合适的信息来标记或识别媒体内容或部分媒体内容。中央处理单元(165)可以用于修改媒体内容(例如，缩放视频帧)、分析媒体内容、解压缩媒体内容、压缩媒体内容等。存储在视频帧缓冲器中的视频帧(例如，高清视频帧)可以由中央处理单元(165)动态修改，以在视频帧之上覆盖附加内容(例如，有关帧的信息、节目信息、聊天消息、系统消息、网页内容、图片、电子节目指南或任何其他合适的内容)，操作视频帧(例如，拉伸、旋转、缩小等)，或实时地更换视频帧。因此，电子节目指南、动态选择的广告信息、媒体内容信息或任何其他文本/图形可以被写到存储在帧缓冲器中的视频帧上，以在存储的视频帧上叠加附加内容。中央处理单元(165)可用于处理与任何输入和/或输出设备的通信(所述输入和/或输出设备与媒体设备(100)相关)。例如，可以随后传输实时动态修改的视频帧以用于显示。中央处理单元(165)可用于与其他媒体设备进行通信，以执行关于同步或数据发布的功能。

在实施例中，文本/音频转换器(167)通常代表用于将文本转换为音频和/或用于将音频转换为文本的任何软件和/或硬件。例如，文本/音频转换器可以包括将对应于隐藏字幕数据的文本转换为音频文件的功能。音频文件可基于计算机化的语音，或者可以被训练，以使用用户、虚构或非虚构的人物的语音等。在实施例中，自动生成的用于特定消息的语音可以是用户生成消息的语音。文本/音频转换器可以包括当从语音转换到文本或从文本转换到语音时切换语言的功能。例如，法语的音频输入可转换为英语的文本消息。

在实施例中，外设单元(195)通常代表用于任何外设的输入和输出，这些外设与媒体设备(100)通信连接(例如，通过USB、外部串行高级技术附件(eSATA)、并行ATA、串行ATA、蓝牙、红外等)。外设的示例可以包括遥控装置、USB驱动器、键盘、鼠标、麦克风和可用于操作媒体设备(100)的语音识别设备。在实施例中，多个麦克风可用于检测语音、识别用户位置等。在实施例中，麦克风可以是媒体设备A(100)或与媒体设备(100)通信连接的其他设备(例如，遥控装置)的一部分。在实施例中，当从用户接收音频输入时(例如，通过麦克风)，媒体设备(100)可以包括识别正在播放的媒体内容(例如，特定节目、或特定节目中的位置)的功能。

在实施例中，显示子系统(170)通常代表包括输出(例如，视频输出显示171)和/或实际显示一个或多个图像的功能的任何软件和/或设备。显示设备的示例包括信息站、手持设备、计算机屏幕、显示器、电视等。显示设备可以使用不同类型的屏幕，如液晶显示器、阴极射线管、投影仪、等离子屏幕等。媒体设备(100)的输出可以是专门格式，以用于正在使用的显示设备的类型、显示设备的大小、分辨率(例如，720i、720P、1080i、1080P或其他合适的分辨率)等。

3.0基于媒体内容指纹呈现附加内容

根据实施例，图2示出了用于呈现附加内容的流程图。下面描述的步骤中的一个或多个可以被省略、重复和/或以不同的顺序进行。因此，图2所示的步骤的具体安排不应解释为限制本发明的范围。

最初，根据实施例，接收命令以呈现媒体内容(步骤202)。接收的命令可以由用户通过键盘或遥控装置输入。所述命令可以是用户在电子节目指南(EPG)中的选择，用于记录和/或播放媒体内容。所述命令可以是由用户输入的频道选择。所述命令可以是请求显示图片幻灯片。所述命令可以是播放音频文件。所述命令可以是请求播放电影(例如，蓝光播放机的命令)。在实施例中，接收呈现媒体内容的命令可以包括用户在用户界面上的搜索栏输入媒体内容的标题。在实施例中，媒体内容被呈现(步骤204)。呈现媒体内容可以包括播放音频和/或视觉媒体内容(例如，视频内容)、显示或打印图像等。呈现媒体内容还涉及将媒体内容覆盖在其他正在呈现的媒体内容上。

在实施例中，从媒体内容获取指纹(步骤206)。从媒体内容获取指纹的示例包括将一个或多个视频帧的强度值投影到一组投影向量上并且获得一组投影值。指纹比特可以接着基于投影值中的每一个进行计算并连接，以计算媒体内容的指纹。另一个示例可以包括将数学函数应用到音频文件的频谱图。根据一个或多个实施例，还可以使用其他的指纹获取技术从媒体内容获取指纹。在实施例中，当媒体内容正在播放时，指纹从媒体内容中动态地获取。例如，从内容源接收的媒体内容可以同时被播放和采集指纹。指纹可以获取用于媒体内容识别，例如，识别特定节目、电影等。含有3维视频的媒体流也可以采集指纹。在实施例中，对3维视频采集指纹可以涉及选择3维视频的指纹部分。例如，可以选择3维视频流中近处的物体(例如，当观看3维视频时出现得更近的物体)采集指纹，以识别面部或结构。近处的物体可以基于与物体相关的深度标记域或通过物体与其他物体的相对大小进行选择。

在实施例中，接收命令以呈现与正在呈现的媒体内容相关的附加内容(步骤208)。可以接收命令以识别一般性附加内容(例如，媒体内容中的任何特点)。例如，正在播放的媒体内容的信息，如电影的剧情简介、电影中的演员、电影的制作年份、与特定的媒体内容相关的持续时间、电影的导演或制片人、电影类型等。在实施例中，可以请求具体的信息。例如，请求正在播放的当前场景在全球的地理位置的命令。另一个可以示例涉及请求识别正在播放的当前场景中的人的命令。另一个可以示例涉及在电影场景中的汽车的年份和型号的请求。另一个可以示例涉及保存或发布关于内容的信息(包括时间戳、从开始的偏移和其他上下文数据)以便日后使用或参考的请求。因此，具体的信息请求可以包括在媒体内容的场景中的地点、物体或人的识别。

当接收附加内容的命令时，由用户请求的附加内容可能不可用。因此，在接收命令后，基于媒体内容的指纹动态识别附加内容(步骤210)。例如，从媒体内容获取的指纹可以用于查询网络服务器并接收在与指纹匹配的场景中的物体、地点或人的识别。指纹也可以用来识别正在播放的媒体内容，以获得已经与媒体内容相关的元数据。在实施例中，在接收呈现附加信息的命令之后，可以从媒体内容动态获取指纹。

在实施例中，附加内容被呈现(步骤212)。呈现附加内容可以包括在正在呈现给用户的媒体内容上覆盖附加内容。呈现附加内容可以还包括在通过缩放、裁剪或以其他方式改变原始内容而替换的帧的部分上覆盖附加内容。为了在原始或改变的媒体内容上覆盖附加内容，未压缩的HD帧可以载入帧缓冲器，并且附加的数据可以被写入相同的帧缓冲器，从而用附加数据覆盖原始帧信息。附加信息可以与正在播放的媒体内容、EPG显示数据、横幅显示格式中的频道指示(正如美国专利6,642,939所描述的，该专利由本申请人拥有并且通过引用合并于此)、节目简介等有关。例如，在电影中，场景的地理位置可以与场景同时显示在屏幕上。在另一个示例中，字段可以在任何给定时间显示场景里当前演员的名字。可以显示将物体、地点、人等的名称与屏幕上的物体、地点、人联系的视觉指示。例如，场景中的汽车和识别有关汽车的信息之间的线。附加内容还可以提供与所显示的图像有关的广告商、商业等的链接。例如，在屏幕上显示的关于汽车的附加信息可以包括关于汽车的识别信息，销售汽车的汽车经销商的名称、销售汽车的汽车经销商的链接、与汽车相关的价格信息、与汽车相关的安全信息，或者直接或间接地与识别的汽车有关的任何其他信息。另一个可以涉及呈现关于可用内容流(例如，从广播服务接收或从网络服务器接收)的信息。内容本身可以在帧上被覆盖，或者带有描述的链接可在帧上被覆盖，其中所述链接可以通过用户输入进行选择。附加的内容可作为隐藏字幕数据呈现。在另一个示例中，用户所选语言的字幕可以被覆盖在内容上，如电影或电视节目。字幕可以通过各种方法获取，包括从现有的字幕文件数据库下载，或者从原始内容的隐藏字幕文本进行实时计算翻译。另一个示例可以涉及在音乐视频或音乐会演出上歌词的同步覆盖。系统可以在几帧上执行此操作，或者直到用户指示它删除覆盖。在这一点上，系统可以停止将附加信息写入帧缓冲器。在实施例中，音频内容可以取代或覆盖来自原始内容的音频。一个示例可以涉及把全国足球比赛的全国广播的音频流更换成当地电台播音员的音频流。一个示例可以涉及来自原始媒体的音频与附加音频(例如，演员在场景中的评述)的实时混合。所述例子可以涉及原始和附加音频的修改，如放大。

4.0基于媒体内容指纹确定播放位置

根据实施例，图3示出了用于确定媒体内容播放中的位置的流程图。下面描述的步骤中的一个或多个可以被省略、重复和/或以不同的顺序进行。因此，图3所示的步骤的具体安排不应解释为限制本发明的范围。

最初，根据实施例，接收命令以呈现媒体内容(步骤302)并且媒体内容被呈现(步骤304)。步骤302和步骤304与上述的步骤202和步骤204本质相同。

在实施例中，指纹从正在播放的媒体内容获取(步骤306)，以确定在第一设备上的媒体内容播放中的位置(步骤308)。例如，随着媒体设备接收内容流中(或来自任何其他源)的媒体内容，媒体设备可以显示媒体内容并从正在显示的特定帧获取指纹。媒体设备也可以从每n个帧、从内嵌帧(iframes)，或基于任何其他的帧选择机制获取指纹。从一个或多个帧获取的内容指纹接着可以与指纹数据库进行比较，以识别匹配帧指纹的数据库指纹。指纹数据库可以在媒体设备自身上在本地实现，或者在与媒体设备通信连接的服务器上实现。内容指纹和数据库指纹之间的匹配可以是精确匹配，或者这两个指纹可以满足相似性阈值(例如，指纹中至少有阈值数量的签名位匹配)。一旦在数据库中识别出匹配，即获得了存储为与数据库指纹相关的元数据。元数据可以包括媒体内容中的位置。例如，元数据可以指示指纹对应媒体内容中总共n个帧中的第k个帧。基于所述位置信息和/或每秒的帧数，可以确定媒体内容播放中的位置。元数据也可以明确地指示位置。例如，元数据可以指示指纹对应从媒体内容开始35分3秒时的播放位置。

根据与一个或多个实施例，基于第一设备上的媒体内容播放中的位置，第二设备可以通过同时在第二设备上播放相同的媒体内容实现与第一设备同步(步骤310)。一旦对第一设备确定了媒体内容播放中的位置，第二设备上的媒体内容的播放可以在所述位置开始。如果在第二设备上已经开始播放媒体内容，第二设备上的媒体内容的播放可以在所述位置停止并重新开始。可选择地，第二设备上的媒体内容的播放可以快进或后退到所述位置。

在实施例中，实况转播或存储节目的观看可以使用结合到媒体设备中的缓冲器而同步。例如，在内容流中接收的内容可以在它们被接收时存储在多个设备。此后，设备可以进行通信，以同步地开始媒体内容的播放、媒体内容的暂停、媒体内容的快进和媒体内容的倒回。可以在实施例中使用能够存储整个媒体内容的大缓冲器。可选择地，可以使用较小的缓冲器，而视频帧可以随着它们的播放而被删除，并且由内容流中接收的新的视频帧更换。实况转播或存储节目的同步播放可以涉及在特定的时间播放存储器缓冲器中存储的特定的帧以获得帧级同步。例如，两个设备可以交换信息，该信息指示存储在存储器中的特定的帧将要在哪一秒被播放以及未来的帧将要被播放的速率。因此，基于相同的开始时间，帧可以在不同的媒体设备上在确切的同一时间或大约在同一时间被显示。此外，可以确定附加的帧/时间的组合以确保保持同步。当媒体设备正在不同的时区使用时，可以调整时间以考虑时差。例如，格林威治标准时间(GMT)可以在所有媒体设备上使用，用于媒体内容的同步播放。

在实施例中，播放相同媒体内容的多台设备同步之后，该同步可以保持。为了保持同步，一个设备上接收的任何播放功能(例如，停止、快进、倒回、播放、暂停等)可以在两个设备上进行(步骤312)。

在实施例中，广告的播放可以基于媒体内容播放中的位置进行检测(步骤314)。例如，在内容流上可用的媒体内容可以包括电视节目和在电视节目期间的不同时间穿插的广告。媒体内容的组成信息可以指示电视节目播放了二十五分钟，接着是五分钟的广告，接着是另一个二十五分钟的电视节目，而再接着是另一个五分钟的广告。因此，如果媒体内容播放中的位置被确定为开始后的二十分钟，则正在播放电视节目。但是，如果媒体内容播放的位置被确定为开始后的二十七分钟，则正在播放广告。

在实施例中，可以在不用确定媒体内容播放中的位置的情况下检测广告的播放。例如，如果媒体内容包括电视节目和电视节目之间穿插的广告，则可以基于从当前正在播放的媒体内容获取的指纹检测广告。从当前正在播放的媒体内容获取的指纹可以和只从电视节目获取或只从广告获取的指纹进行对比。基于对比结果，正在同时播放的媒体内容可以被确定是电视节目的一部分或广告的一部分。

在实施例中，可以基于媒体内容中呈现的元素检测广告的播放。例如，基于从正在播放的媒体内容获取的指纹，可以认出媒体内容里演员的面部。演员的名字接着可以与在电视节目中演员列表里的演员的名字对比。如果正在播放的媒体内容中检测出的演员与电视节目中列出的演员匹配，则正在播放电视节目。可选择地，如果正在播放的媒体内容中检测出的演员与电视节目中列出的演员不匹配，则正在播放广告。在实施例中，时间窗口可用于在电视节目中已知演员的检测，其中至少有一个在电视节目中列出的演员必须在时间窗口内检测出来，以推断电视节目正在播放。

根据一个或多个实施例，响应于确定正在播放广告，可以进行许多不同的行为。在实施例中，可以自动快进广告。例如，只要检测到广告的播放，自动快进功能即可以用于媒体内容的播放，直到广告播放完成(例如，当电视节目的播放基于指纹被再次检测到)。同样地，广告也可以被自动静音，其中响应于检测到广告的完成而选择静音功能。

在实施例中，如果正在记录媒体内容，则可以为了记录自动跳过广告。例如，在正从内容源接收的电影的记录中，媒体内容的非广告部分(例如，电影部分)可以被记录下来，而可以为了记录跳过媒体内容的广告部分。

在实施例中，可以显示替换广告。当接收和显示内容流时，检测到的内容流的广告部分可以由替换广告取代。例如，在体育酒吧处的媒体设备可以被编程，以显示特价酒水而不是从内容流中接收的广告。可选择地，可以显示存储在存储器中或流自服务器的本地供应商的广告而不是在内容流中接收的广告。可以基于媒体内容选择广告。例如，如果在播放体育赛事期间，可以选择直接指向人的广告。

在实施例中，可以利用与广告相关的附加内容加强广告。当接收内容流时，检测到的内容流的广告部分可以被缩放、裁剪或以其他方式修改，并且被显示的空的空间可以由附加内容有计划地填充。例如，对于电影院里电影即将开始的广告，可以通过在设备附近15英里内的电影院的放映时间而加强。也可以向用户呈现一个或多个有关附加内容的交互式功能，如存储有关播放电影信息的选项，包括所选的本地电影院和放映时间，以用于未来的呈现、参考、购票或其他相关活动。在另一个示例中，可以用有关广告的游戏、小测验、调查、视频和音频加强广告。在实施例中，可以利用与用户的社交网络连接(与广告有关)所采取的行动有关的信息加强广告。例如，数码相机的广告可以通过用户朋友用相同的数码相机拍摄的照片而加强。另一个例子中，最近发布的DVD电影的广告可以通过朋友对所述电影的评分和评论而加强。

在实施例中，可以利用与广告无关的附加内容加强广告。当接收内容流时，检测到的内容流的广告部分可以被缩放、裁剪或以其他方式修改，并且被显示的空的空间可以由附加内容有计划地填充。在一个实施例中，用户可以在广告期间指示系统使用显示器的一部分来显示个性化内容。在一个示例中，个性化的内容可以包括用户喜爱的运动队的最新得分和统计。在另一个示例中，内容可以包括用户最新接收的全部或部分消息，如电子邮件、短信(SMS)、即时消息、社交网络通知和语音邮件。在另一个示例中，可以向用户呈现关于附加内容(与被广告中断的内容有关)的信息。在另一个示例中，可以向用户呈现在先前开始的游戏中轮到他的机会。在实施例中，也可以向用户呈现一个或多个与附加内容有关的交互式功能，如存储关于在未来呈现、参考或其他活动中使用的内容信息的选项。在一个示例中，用户可以选择使用键盘或麦克风来响应短信、电子邮件、语音邮件或即时消息。

在实施例中，通过媒体设备播放广告的通知可以提供给相关方(例如，供应商或广播公司)。例如，如果供应商的广告在媒体设备上播放，内容源可以被告知供应商的广告实际上被播放过了。此外，如果供应商的广告被快进通过，内容源可以被告知供应商的广告被快进通过。此信息可以提供给供应商，以使供应商确定广告的有效性。附加的信息包括广告是作为先前存储的记录而播放，还是直接在从内容源接收后直接播放，所述信息可以提供给相关方。

在实施例中，用户的累计统计也可以基于广告检测而收集。例如，用户观看的特定类型的广告或媒体内容可以被保存以确定用户兴趣。这些用户兴趣可以提供给供应商，存储在服务器上，在与用户相关的交互式网页上发布，或以其他方式呈现。可以收集多个用户的匿名信息，以基于用户观看或输入建立报告。美国专利申请10/189,989(由本申请人拥有并通过引用合并于此)描述了这种做法。

5.0基于媒体内容指纹进行记录

在实施例中，从内容流中的媒体内容获取的指纹可以用于开始和/或结束内容流中的媒体内容的记录，如图13和14所示。

内容流中的或已知内容流中在未来某一时间可用的特定媒体内容的记录可以被安排(步骤1302)。特定的媒体内容的安排可以基于用于内容流中的媒体内容的播出的时间间隔，正如电子节目指南(EPG)的指示。然而，根据一个或多个实施例，特定的时间间隔对于安排记录不是必要的。

内容流中的内容可以通过从内容流中接收的内容获取的指纹(步骤1304)而被监控。内容流的监控可以在被安排用于记录的特定媒体内容的预计开始时间(例如，通过EPG指示)之前的指定的时间段开始之前。然后，指纹可以用来查询指纹数据库并识别内容流中的内容(步骤1306)。如果内容流中的内容匹配安排用于记录的特定媒体内容(步骤1308)，则内容流中的内容的记录开始(步骤1310)。如果内容流中的内容不匹配安排用于记录的特定媒体内容，可以继续监控媒体内容。如果特定的媒体内容在安排的开始时间之前播出，上述方法记录特定媒体内容的全部内容，因为记录的开始时间是基于识别出内容流中的特定媒体内容。

图14示出了基于内容(从内容流中接收)获取的指纹结束特定的媒体内容的示例。内容流中特定的媒体内容的记录开始(步骤1402)。可以使用如图14所示的基于指纹的方法开始记录或者可以简单地基于预计的开始时间(例如，由EPG指示)开始记录。然后指纹可以从内容流中的内容获取(步骤1404)。一旦特定媒体内容的广播(包括流)开始或在特定媒体内容的预计结束时间附近，就可以连续或定期地获取指纹。例如，对结束的监控可以以特定媒体内容的播出为开始，或者可以在安排的结束时间前十五分钟开始。此后，指纹数据库可以用指纹进行查询，以识别内容流中的内容(步骤1406)。只要内容流中的内容匹配安排用于记录的特定媒体内容(步骤1408)，内容流中的内容的记录继续进行。然而，当内容流中的内容不再匹配特定的媒体内容时，停止记录(步骤1410)。例如，用户可以从EPG选择足球比赛的记录。足球比赛的流的结束时间可能不知道，因为足球比赛的长度提前可能不知道。在这个示例中，内容流中包括足球比赛的内容可以连续或定期采集指纹，以确定如果足球比赛是否仍然在播出。一旦确定足球比赛不再被播出，记录可以停止。

在实施例中，所获取的指纹可以用来识别与一组特定媒体内容中最相关的内容。例如，EPG数据可以指示，足球比赛将在5pm至8pm的内容流中可用，跟着是从8pm至9pm的喜剧表演。然而，足球比赛可以进行比EPG数据指示的5pm至8pm的预定时间间隔更短或更长的时间。因此，足球比赛的结束时间将不是仅基于EPG数据即可决定的。从EPG数据指示的预计结束时间之前的某段时间，直到内容在内容流上不再可用，指纹可以连续或定期地从内容流中的内容获取。继续前面的示例，可以从7:30pm至8:30pm或从7:30pm直到足球比赛在内容流上不再可用时获取指纹。

在这个示例中，系统可以确定(例如，基于EPG数据)，无论足球比赛提前或推迟结束，喜剧表演将跟随足球比赛。因此，可以对获取的指纹进行分析，以确定相应的媒体内容是否是如下之一：(1)足球比赛或(2)喜剧表演。从有限的一组可能的媒体内容确定哪个媒体内容对应指纹，比从媒体内容文件的大型数据库识别媒体内容，需要较少的计算和/或处理能力。例如，获取的指纹可以只是用来确定相应的媒体内容帧是否包括主演喜剧或在喜剧开场中已知的喜剧演员的面部。指纹也可以从在每个媒体内容文件的较少的一组特征获取，以简化指纹获取计算。基于内容流的指纹，可以确定足球比赛的结束时间，并且可以确定喜剧表演的开始时间。

在实施例中，一个或多个广告可以显示在内容流中。为了从内容流中的后续节目中区分广告，指纹可以在正进行记录的节目完成后用最少的持续时间获取，以确保所述节目在内容流中不再可用。例如，指纹可以在被识别为正进行记录的媒体内容的最后一帧之后的10分钟的窗口(比大多数广告间歇长)中获取。此后，如果在所述10分钟的窗口或其他指定时间内，在内容流中没有发现媒体内容，则可以确定内容流中的媒体内容的播出已经结束。附加内容(其不是媒体内容的一部分)可以被删除。在前面的示例中，如果非足球比赛内容在足球比赛的预计结束时间附近不断地显示持续最少10分钟，系统可以确定足球比赛的播出已经结束并且最后10分钟的记录是替换内容，其不是足球比赛的一部分。这最后10分钟的记录可以被删除。

在实施例中，记录安排可以基于在媒体内容流中计划外的延长或减少而修改。节目的计划外的延长可能导致整个播出安排变动一天或一晚。例如，如果足球比赛导致二十分钟的计划外的延长，随后的表演和/或节目的已安排的播出将全部变动二十分钟。在实施例中，变动可以基于从内容流中的内容获取的指纹而识别，并且在多媒体设备上的记录安排可以变动，以匹配所安排的播出中的变动。

如图11所示，根据一个或多个实施例，可以基于从媒体内容获取的指纹来选择媒体内容，用于媒体设备进行记录。一个或多个指纹可以从正在被监控的内容流中的内容获取(步骤1102)。然后，指纹可以与指纹数据库比较以识别媒体内容(步骤1104)。可以选择用户观看更为频繁的内容流用于监控。在另一个示例中，可以监控由用户指定的内容流。此后，如果识别的媒体内容匹配用户指定的特性或用户观看历史(步骤1106)，则该媒体内容可以被记录(步骤1108)。用户指定的特性的示例可以包括内容类型、男演员或女演员、地理区域、语言、声音或用户已经指定的任何其他特征。在实施例中，指纹用于识别在别的方面不可用的媒体内容中(例如，在与媒体内容相关的元数据中)用户指定的特征。在另一个示例中，如果内容流中的媒体内容与用户观看和/或记录的节目相似，媒体内容可以被记录下来。

如图12所示，根据一个或多个实施例，媒体内容的不完整拷贝可以被媒体内容的完整拷贝代替。例如，在记录媒体内容的拷贝(步骤1202)之后，确定所记录的拷贝是不完整的(步骤1204)。上述确定是通过确定所记录的拷贝的持续时间比媒体内容的预计持续时间短而做出的。媒体内容的预计持续时间可以从电子节目指南(EPG)获得，也可以从与媒体内容相关的元数据，从对于持续时间的网上搜索、数据库查询或从任何其他合适的来源获得。

在实施例中，获得媒体内容的新的完整拷贝(步骤1206)。获得媒体内容的新拷贝可以涉及识别带有媒体内容的可访问的内容流和从所述内容流获得媒体内容。在另一个示例中，媒体内容的新拷贝可以从网络服务器或广播服务请求。在另一个示例中，媒体内容的新拷贝可以通过网络(例如，互联网)搜索和下载。在实施例中，任何已识别的部分记录可以连结单独记录的媒体内容的另一部分，以获得媒体内容的整个记录。所记录的媒体内容的拷贝的缺失部分可以首先基于从记录媒体内容获取的指纹而识别。例如，从部分记录获取的指纹可以对比已知与媒体内容的完整记录相关的指纹。基于对比结果，可以识别所获取的指纹的缺失部分和相应的部分记录的缺失部分。此后，可以根据上述技术仅获得缺失部分(代替新的拷贝)。

当先前播出的媒体内容有计划外的延长时，媒体内容记录的一部分可以被剪切。在上面的示例中，来自内容流的内容可以被安排用于从8pm至9pm记录由用户请求的喜剧节目。然而，由于足球比赛的二十分钟的延迟，喜剧节目的第一个20分钟将在内容流上不可用。因此，8pm至9pm的内容的记录可以包括20分钟的足球比赛和后面40分钟的喜剧节目。可选择地，从8:20pm至9:00pm较短的记录可以仅包括原始喜剧节目的一部分。在实施例中，指纹可以用来确定在视频播放中的位置，并相应地调整记录间隔。例如，在8:20pm的内容流中的可用内容可以基于从内容获取的指纹被识别为喜剧的开始。基于此识别，记录间隔可以从8:00pm-9:00pm改为8:20pm-9：20pm，或从8:00pm-9:00pm改为8:00pm-9:20pm。在另一实施例中，记录可以简单地持续，直到从内容流中的内容获取的指纹不再匹配与喜剧相关的指纹。在实施例中，用于内容流中的媒体内容的指纹可以被提前发送到媒体设备，使得媒体设备可以将已接收的已知对应于完整媒体内容的指纹与从在内容流上可访问的媒体内容获取的指纹进行比较。

在实施例中，所记录内容的回放可以包括选择开始位置(除了所记录内容的开始)和/或选择结束位置(除了所记录内容的结束)。例如，如果喜剧节目一小时长的记录包括20分钟的足球比赛，随后是40分钟的喜剧节目，则指纹可以用来确定喜剧节目在记录20分钟的位置开始。基于该信息，当选择回放喜剧节目时，回放可以在20分钟的位置开始。同样，替换内容可以在喜剧节目记录结束时被记录。在这个示例中，响应于确定记录的其余部分不包括喜剧节目，可以通过多媒体设备自动停止回放。基于内容的指纹识别，开始和/或停止所记录内容的回放也可以用来在记录开始或结束时跳过广告。例如，响应于30分钟的记录的回放，如果前两分钟的记录只包括广告，回放可以在两分钟的位置开始。

在实施例中，喜剧节目的部分记录(例如，缩短了的四十分钟的记录，或一小时的记录中只有四十分钟对应于喜剧节目)可以基于从记录获取的指纹、记录长度，或使用另一适当的机制被识别。在实施例中，响应于识别媒体内容的部分记录，媒体内容可以自动地再次记录，如图12所示并如上所述。

在实施例中，基于指纹的标签可以被生成用于标记媒体内容的开始点和/或结束点。例如，标签可以基于所获取的指纹由接收内容流的媒体设备生成，标签标记了指示节目的开始和/或结束时间的特定帧。在另一个示例中，内容源可以使用从媒体内容获取的指纹来识别媒体内容确切的开始和结束时间，并且之后在流到媒体设备前为帧加标签，以指示开始点和/或结束点。在实施例中，任何其他基于指纹的实现方式可以用于媒体内容的开始点和/或结束点由从媒体内容获取的指纹来检测的情况。

6.0发布记录或观看信息

根据实施例，图4示出了流程图，其用于检测广告的播放。下面描述的一个或多个步骤可以被省略、重复和/或以不同的顺序进行。因此，图4所示的步骤的具体安排，不应解释为限制本发明的范围。

在实施例中，接收命令以在与第一用户有关的第一设备上观看或记录媒体内容(步骤402)。观看或记录媒体内容的命令可以通过在电子节目指南(EPG)中的选择被接收。所述命令可以用于媒体内容的单个记录(例如，电影、体育赛事或特定的电视节目)或媒体内容的一系列记录(例如，多集电视节目)。可以接收命令以播放在本地存储在存储器上的媒体内容文件(例如，DVD播放机可以接收命令来播放DVD，数字视频录像机可以接收命令来播放存储的记录)。在实施例中，单一媒体设备可以接收所有这些命令并且据此指示其他设备(例如，DVD播放机、蓝光播放机)。

根据实施例，将媒体内容在第一设备上的观看或记录发布(步骤404)。发布媒体内容的观看或记录可以是用户指定的。例如，媒体内容的观看或记录可以公布在与用户相关的网页上(例如，网络网站上的用户网页，如或)(是MySpace,Inc.,BeverlyHills,CA的注册商标，而是Facebook,Inc.,PaloAlto,CA的注册商标)，组页上的公布可以通过电子邮件发送(例如，为组指定的网页)给其他用户，可以以文本消息提供，或者可以以任何其他方式发布。在实施例中，用户的所有观看或记录可以自动通过电子邮件发送给列表上的已经选择从该用户接受消息的其他用户(例如，使用是Twitter,Inc.,SanFrancisco,CA的注册商标)。发布媒体内容的观看或记录还可以包括与媒体内容相关的费用。例如，如果用户选择了付费点播电影，电影的价格也可以被发布。在实施例中，发布媒体内容的观看或记录可以涉及在与媒体内容相关的出版物上发布用户的名字(或与用户相关的用户名)。例如，所有观看过特定媒体内容的用户可以发布在与社交网络网站相关的单个网页上。任何已经对与特定媒体内容相关的公布作出回应(例如，“喜欢(like)”、“赞许(thumbsup)”、“分享(share)”等)(这表明用户已经观看了特定的媒体内容)的用户可以发布在单个网页上。

在实施例中，响应于接收命令以在与第一用户相关的第一设备上记录媒体内容，媒体内容记录在所述第一设备和与第二用户相关的第二设备上(步骤406)。例如，第一设备可以通知第二设备媒体内容所安排的记录，并且第二设备可以自动记录媒体内容。在另一个例子中，响应于第一设备的通知，第二设备可以提示第二用户记录媒体内容。然后，第二设备可以在接收用户的记录媒体内容的命令后记录媒体内容。在实施例中，第二设备上的媒体内容的记录可以紧接第一设备上的记录的发布(例如，在网站上)，如上所述。例如，第二用户可以选择网站上与第一设备上媒体内容记录的发布相关的链接，来记录与第二用户相关的第二设备上的媒体内容。在实施例中，媒体设备可以通过记录其他媒体设备记录的所有节目来模仿其他媒体设备。

根据实施例，可以检测相同媒体内容在多个设备上的记录(步骤408)。例如，用户组内不同的用户可以在其各自的媒体设备上安排相同媒体内容的记录。可以收集并比较与用户组内的用户相关的每个媒体设备的安排的记录(例如，通过服务器、服务或媒体设备之一)，以检测任何重叠安排的记录。在实施例中，已经在媒体设备上记录的媒体内容可以与已经在另一媒体内容上记录的媒体内容比较，或者与另一媒体内容上所安排的记录比较。

在实施例中，媒体设备可以配置为，对安排用于由另一指定媒体设备记录的任何媒体内容自动地安排记录。因此，媒体设备可以配置为模仿由设备标识号识别的其他媒体设备。媒体设备也可以配置为模仿与指定的用户相关的任何设备。例如，基于社交网络网站上的第二用户的公布，第一用户可以确定第二用户有对新表演或节目的多种选择。然后，通过提交带有与第二用户或第二用户的名称相关的媒体设备的标识号的模仿请求，第一用户选择模仿第二用户的观看电视的习惯。可选择地，第一用户可以在社交网络网站上表明喜好。社交网络网站则可以将第一用户和第二用户的标识传达到内容源，所述内容源配置与第一用户相关的媒体设备，以记录由与第二用户相关的媒体设备记录相同的节目。

在实施例中，每个媒体设备可以配置为访问媒体设备记录安排的数据库(例如，在服务器上，由第三方服务提供等)。用户可以使用他们自己的媒体设备访问这个数据库，并且模仿由特定用户的名称或标识进行标记的另一媒体设备的记录。例如，用户可以选择同样由另一用户记录的特定的节目。在实施例中，用户将能够访问其他与记录相关的统计数据，以选择用于观看或记录的节目。例如，基于将来所安排的记录，基于已完成的记录，或者基于多个用户(它们在节目在内容流上可用时观看节目)，媒体设备记录数据库可以指示最流行的节目。

根据实施例，可以安排同时在多个设备上播放媒体内容的时间(步骤410)。媒体内容的播放时间可以自动选择，或者基于来自一个或多个用户的输入而选择。例如，与媒体设备(被安排用于记录(或已经记录)特定媒体内容)相关的所有用户可以被通知重叠选择，并且通过所有使用其各自媒体设备的用户，一个用户可以选择媒体内容的同时观看时间。在另一个示例中，每个媒体设备可以访问用户可用性日历，以确定对于各个用户的可用的观看时间。此后，可以在日历中安排节目的同步观看，使得所有用户(或大多数用户)可用。

根据实施例，相同的媒体内容的观众/记录者可以自动注册到与媒体内容相关的组(步骤412)。例如，响应于每次记录/观看电影，特定电影的所有观众和/或记录者可以自动注册到与该电影有关的社交网络组。自动注册的组可以由用户用作论坛来讨论媒体内容，找到具有相似观看喜好的其他用户，安排对相似记录的观看时间或任何其他合适的用途。论坛可以由两个或更多个与多个设备相关的用户发起，所述多个设备正在同步播放媒体内容。论坛可以由邀请用户参加即时消息聊天(例如，InstantMessaging、Chat、等)(是Yahoo！,Inc.,Sunnyvale,CA的注册商标，是Google,Inc.,MountainView,CA的注册商标，是AOLLLC,Dulles,VA的注册商标，是Twitter,Inc.,SanFrancisco,CA的注册商标)、视频聊天(例如，是SkypeLimitedCorp.,Dublin,Ireland的注册商标)、网站话题或电子消息(email)话题的媒体发起。论坛可以包括两个用户或任意数量的用户。论坛可以为已经知道将要连接的用户创建。例如，如果用户是社交网站上的朋友，可以创建论坛。在实施例中，可以创建论坛，以将供应商介绍给潜在客户。例如，在播放足球比赛期间，可以呈现邀请，来和足球比赛门票的供应商聊天。在实施例中，论坛可以作为约会入口。例如，约会服务器订购的同一地理区域中观看同一节目的男性和女性可以由媒体设备邀请聊天。另一个示例涉及活动入口。例如，可以配置媒体设备，来邀请烹饪频道节目的观众一起做饭，或者可以配置媒体设备，来邀请旅游频道节目的观众一起前往有特色的目的地。如上所述，可以配置媒体设备来与任何其他计算设备(例如，其他媒体设备或个人计算机)通信。

7.0从媒体内容获取指纹

根据实施例，图5示出了从媒体内容获取指纹的流程图。下面描述的步骤中的一个或多个可以被省略、重复和/或以不同的顺序进行。因此，图5所示的步骤的具体安排不应解释为限制本发明的范围。

在实施例中，对媒体设备进行监控，以确定媒体设备满足闲置准则(步骤502)。闲置准则可以基于媒体设备或部件的停用或使用百分比(例如，与总带宽的可用带宽相关的百分比或与总处理能力相关的可用处理能力的百分比)。媒体设备可以自我监控或由服务器监控。为闲置准则而监控媒体设备可以涉及检测一段时间的结束而无需接收用户命令。为闲置准则而监控媒体设备可以涉及检测用于接收媒体内容和/或从媒体内容获取指纹的资源的可用性。监控媒体设备可以包括独立地监控媒体设备的不同部件。例如，如果用户正在观看媒体设备上存储的记录，并且没有记录正在传输到媒体设备的任何附加内容，则调谐器可能是闲置的。基于该信息，可以作出调谐器满足闲置准则的确定。因此，媒体设备的不同部件可以与独立的闲置准则相关。在另一个示例中，从媒体内容获取指纹所必需的部件可以满足闲置准则。

在实施例中，媒体设备从内容源接收媒体内容，用于从媒体内容获取指纹的目的(步骤504)。媒体设备可以响应于提醒内容源媒体设备(或媒体设备内的部件)满足闲置准则而接收媒体内容。在实施例中，内容源可以自动检测媒体设备是否满足闲置准则。例如，内容源可以确定媒体设备没有请求观看任何特定的媒体内容(例如，广播内容、网页内容等)。因此，调谐器很有可能具有带宽来下载媒体内容。在实施例中，媒体设备可以包括接收多个内容流的功能。在该实施例中，内容源可以确定有多少内容流正在由媒体设备接收。基于媒体设备的已知的配置和/或功能，内容源可以确定调谐器用于接收其他媒体内容的可用带宽。一旦满足闲置准则，内容源可以下载特定媒体内容，使媒体设备生成指纹。

在实施例中，通过将待播出的媒体内容分配到多个满足闲置准则的媒体设备，内容源可以建立用于媒体内容的指纹数据库。例如，如果五千个设备满足闲置准则并且两千个独特的媒体内容文件将要采集指纹，则内容源可以把四个独特的媒体内容文件传送到五千个媒体设备中的每一个，用于从媒体设备产生各自的指纹。在实施例中，内容源可以把每一个独特的媒体内容文件发送到两个或更多个媒体设备，以防与从媒体设备获取的指纹有错误，或者媒体设备在获取指纹时中断。内容源也可指示媒体设备对已被下载到媒体设备的内容采集指纹(例如，基于用户的命令)。在实施例中，用户可以恢复利用媒体设备，从而防止或阻止媒体设备获取指纹。在实施例中，当媒体内容下载到媒体设备之前满足闲置准则时，内容源可以促使用户请求使用媒体设备的权限。如果用户允许内容源使用媒体设备以实现和/或执行特定功能(例如，获取指纹)，则内容源也可以提供奖励，如收看按次收费电影的积分。

在实施例中，指纹从媒体设备的媒体内容获取(步骤506)。任何技术可以用于从媒体内容获取指纹。一个示例是基于在视频帧内的像素的强度值从视频帧获取指纹。可以将函数(例如，下载到媒体设备上的函数)应用于每个强度值，并且之后基于结果，可以为该强度值指定签名位(例如，“0”或“1”)。通过将该方法应用到从音频数据产生的频谱，类似的技术可以用于音频指纹的采集。

基于来自内容源的具体指令，指纹可以由媒体设备获取。例如，指纹可以从特定的媒体内容文件的所有视频帧中获取。可选择地，指纹可以从媒体设备接收的每n个帧或每个内嵌帧获取。在实施例中，待采指纹的特定帧可以被标记。标记技术在申请09/665,921，申请11/473,990和申请11/473,543中描述，这些申请全部由本申请人拥有并且通过参考合并于此。一旦媒体设备接收被标记的帧，则媒体设备可以解压缩帧，分析帧，从帧获取指纹。根据媒体内容，视频帧指纹可以由媒体设备分类(例如，通过媒体内容的名称、集数等)。

在实施例中，媒体设备可以为用户正在观看的媒体内容获取指纹。例如，用户可以选择由媒体设备显示的电子节目指南上的特定节目。然后，媒体设备可以从包括特定节目的内容源请求内容流。作为可选步骤，所述源可以指示指纹是否需要用于媒体设备所请求的特定节目。该指示可以是在媒体设备接收的数据里的标记。如果特定节目需要如标记指示采集指纹，媒体设备可以解压相应的视频帧，将解压的视频帧加载到存储器中，并且分析视频帧，用于从视频帧获取指纹。在实施例中，用户可以通过正在采集指纹的媒体内容的播放而中途更改频道。因此调谐器可以被用于接收不同的内容流。在这种情况下，媒体设备可以具有仅为部分媒体内容获取的指纹。媒体设备可以产生指示媒体内容播放中的开始位置和结束位置的元数据(已经为所述媒体内容获取了指纹)。

在实施例中，媒体设备接着可以把从媒体内容(或从媒体内容的一部分)获取的指纹上传到指纹服务器(步骤508)。因此，指纹数据库可以通过多个媒体设备(每个媒体设备上传媒体内容的指纹)而建立。仅对于媒体内容的一部分而接收的指纹可以与来自相同媒体内容的其他指纹相结合，以产生完整的指纹。例如，如果一个媒体设备生成并上传节目的第一半部的视频帧的指纹，而第二媒体设备生成并上传同一节目的第二半部的视频帧的指纹，则从两个设备接收的两个指纹可以被组合，以得到对于节目所有视频帧的指纹。

根据一个或多个实施例，图6示出了用于收集和存储从媒体设备获取的指纹的示例性架构。指纹管理引擎(604)通常表示可以配置为获得由媒体设备获取的指纹的任何硬件和/或软件(例如，媒体设备A(606)、媒体设备B(608)、媒体设备C(610)、媒体设备N(620)等)。指纹管理引擎(600)可以由内容源或者其他系统/服务(包括取得由媒体设备获取的指纹的功能)实现。指纹管理引擎(604)可以获得对于已经被媒体设备接收的媒体内容的指纹(例如，响应于用户对媒体内容或包含媒体内容的内容流的选择)。指纹管理引擎(604)可以将媒体内容传输到媒体设备，尤其是出于获取指纹的目的。指纹管理引擎(604)可以响应于检测到媒体设备是空闲的而将媒体内容传输到媒体设备用于获取指纹。在实施例中，指纹管理引擎(604)维护指纹数据库(602)，用于存储和查询媒体设备获取的指纹。

8.0呈现消息

根据实施例，图7示出了用于呈现消息的流程图。下面描述的步骤中的一个或多个可以被省略、重复和/或以不同的顺序进行。因此，图7所示的步骤的具体安排不应解释为限制本发明的范围。

最初，与用户相关的消息喜好被接收(步骤702)。消息喜好通常表示与消息内容、消息时机、消息过滤、消息优先级、消息呈现或(与消息有关的)任何其他特性相关的喜好。例如，消息喜好可以指示，一旦消息被接收或保留到特定时间(例如，此时正在播放广告)就将消息呈现。基于消息源或消息收件人，消息优选喜好可以表明不同的喜好。例如，来自特定网站、真正简单整合(RSS)源或特定用户的消息可以被分类为高优先级的消息，以便首先呈现或在一收到时就呈现。低优先级的消息可以被保留一段特定的时间。消息喜好可以指示消息是否将在接收时呈现，将转换为文本，将转换为音频，将以特定的方式/格式/样式呈现等。消息喜好可以与自动的操作相关，其中接收特定消息引起自动执行指定的动作。一个或多个喜好(例如，消息喜好)、观看历史和/或其他与用户相关的信息形成了用户配置文件。

在实施例中，消息喜好可以包括用户定义的警报条件。例如，警报条件可以包括接收电子邮件、语音邮件、文本消息、即时消息、twitter留言等，满足特定条件。警报条件可以包括由指定列表的用户执行的特定用户操作。例如，警报条件可以是特定用户在网页上发布远足活动邀请。警报条件可以基于通信中的特定关键字、与通信相关的主题等。例如，如果在通信中发现词“紧急情况(emergency)”或“急迫的(urgent)”，则可以满足警报条件。警报条件可以与安全相关(例如，正在发出的房子报警或汽车报警)。警报条件可以与厨房器具相关。例如，警报条件可以与响起的烤箱定时器相关。警报条件可以包括在用户指定的实体状态的变化。例如，警报条件可以与社交网络网站的用户从“相处中(inarelationship)”到“单身(single)”改变状态的时刻相关。警报条件可以包括基于用户配置文件所选的内容流中的特定媒体内容的可用性。例如，用户配置文件可以包括观看历史、演员的名字、媒体内容的类型、与媒体内容相关的语言。如果媒体内容匹配用户配置文件的任何部分，则可以满足警报条件并且可以相应发出警报。

在实施例中，消息喜好可以作为来自用户的直接输入来接收，基于用户文件确定，从互联网上(例如，通过查询数据库从网页或与用户相关的其他文件等)获得。消息喜好可以通过监控媒体设备的使用模式而获得。例如，如果使用模式表明用户在接收到消息的通知时立即检查消息，则信息喜好可以指示立即显示或播放该消息。用户的消息喜好也可以基于发送者。例如，消息的发送者可以表明传送方法和/或传送喜好。消息喜好也可以随机地(例如，用户输入)、定期地或连续地被修改。

在实施例中，接收播放媒体内容的命令(步骤704)。接收的命令可以由用户通过键盘、遥控装置、鼠标、游戏杆、麦克风或任何其他合适的输入设备提交。所述命令可以由用户在电子节目指南(EPG)中选择，用于媒体内容的播放。所述命令可以是由用户输入的通道选择。所述命令可以是请求显示图片幻灯片。所述命令可以是播放音频文件。所述命令可以是请求播放电影(例如，蓝光播放机的命令)。在实施例中，接收呈现媒体内容的命令可以包括用户在用户界面上的搜索栏输入媒体内容的标题。播放媒体内容的命令可以是用户对存储在存储器中的特定媒体内容的选择。

在实施例中，播放媒体内容(步骤706)。在实施例中，媒体内容可以响应于命令或在不接收命令的情况下播放。例如，用户可以打开媒体设备，该媒体设备自动配置为接收在最后选定的频道或默认的频道上的内容流。在实施例中，媒体设备可以基于用户喜好，或响应于媒体内容在另一媒体设备上的播放或记录而选择媒体内容来播放。

在实施例中，可以在播放媒体内容时接收消息(步骤708)。可以从本地资源或通过网络(例如，互联网、内联网、广播服务等)从远程资源接收消息。可以通过互联网连接从网络服务接收消息。例如，与社交网络网站相关的朋友消息或状态变化可以从网络服务接收。可以配置网络服务来提供与社交网络网站相关的所有信息或与特定喜好相关的过滤后的消息选择。另一个示例可以包括真正简单整合(RSS)源，其可以接收自与新闻、体育、娱乐、天气、股票或任何其他合适的类别相关的网络服务。在实施例中，可以从与内容源所提供的服务有关的内容源接收所述消息。例如，消息可以指示汽车采购服务的可用性，或出售的特定汽车的可用性。

消息可以是给用户或用户组(例如，语音邮件、文本消息、电子邮件等)的直接信息。可以以与原始格式不同的格式接收消息。例如，可以把文本消息作为音频文件来接收，或者可以在收到文本消息后通过媒体设备把文本消息转换成音频文件。相反，可以把音频文件作为文本消息来接收，或转换成文本消息。在实施例中，符号、缩写、图像等，可以用于代表消息。在实施例中，以一种语言接收的消息可以被翻译成不同的语言。

在实施例中，接收消息可以包括检测用户定义的警报条件的发生。例如，所有的消息可以被监控并与用户定义的警报条件比较。在实施例中，可以为警报条件的发生监控EPG数据、RSS源、网页、事件日志、使用OCR获得的显示信息或任何其他的信息来源。如果有任何接收的消息匹配警报条件，可以识别警报条件的发生。然后警报可以立即呈现，指示警报条件发生。指示警报条件发生的消息可以基于用户喜好而被解释。

可以确定是立即呈现消息，稍后呈现消息，还是根本不呈现消息(步骤710)。基于用户喜好，接收的消息可以立即呈现(步骤717)或保留直至稍后时间。消息可以在广告休息期间呈现，此时用户基于指定的时间表或其他合适的时间选择观看消息。消息也可以基于用户喜好而被过滤掉。例如，每个接收的消息可以与用户定义的警报条件比较，来确定所述消息是否匹配用户定义的警报条件。匹配用户定义的警报条件的消息将被呈现，而不匹配用户定义的警报条件的消息将被过滤掉。

在实施例中，呈现消息可以包括以可视化的格式呈现消息和/或以音频格式播放消息。例如，可以通过将媒体内容载入帧缓冲器并在帧缓冲器中覆盖消息内容以改写媒体内容帧的一部分来呈现消息。然后，帧缓冲器的内容可以显示在屏幕上。在另一个示例性的实现方式中，不同的缓冲器可以用于媒体内容和消息内容，其中显示屏上的内容从两个缓冲器获得。在实施例中，呈现消息可以包括显示消息信息并同时播放带有消息信息的音频文件。在屏幕上显示的和在音频文件中播放的消息信息可以是相同或不同的。例如，显示屏幕可以显示与消息相关或宣布消息的人的面部，而音频文件可以包括实际的消息。在实施例中，播放音频消息可以包括将与播放媒体内容相关音量的消除或降低。

9.0解释命令

根据实施例，图8示出了用于解释语音命令的流程图。下面描述的步骤中的一个或多个可以被省略、重复和/或以不同的顺序进行。从而，图8所示步骤的具体安排不应解释为限制本发明的范围。

最初，识别多媒体设备附近存在的一个或多个用户(步骤802)。一个或多个用户可以基于由多媒体设备或与多媒体设备相关的输入设备(例如，麦克风、遥控装置)接收的语音输入而识别。例如，多媒体设备(或相关的输入设备)可以配置为，定期对可检测的语音输入取样并且把语音输入与代表用户语音的数据进行比较，以识别已知用户。可以基于用户进行语音训练产生代表用户语音的数据，以使多媒体设备接收与用户有关的语音样本。用户可以在主动或被动模式期间被识别出来。例如，用户可以在用户命令被接收以辨别用户时被识别，或者可以在没有具体用户命令时被自动地识别。虽然语音识别是作为示例使用，但是也可以使用其他方法识别用户。例如，可以通过输入设备(例如，键盘、鼠标、遥控装置、操纵杆等)输入用户名。可以基于与家庭有关的元数据识别用户。可以使用媒体设备上的指纹检测或者另一通信连接的设备(例如，遥控装置)上的指纹检测识别用户。

在实施例中，用户的语音命令被接收(步骤804)。语音命令可以通过用户首先指示语音命令即将给出而被接收。例如，用户可以说出关键字(例如，“命令(command)”)或在设备(例如，遥控装置)上进行输入，表明用户将提交语音命令。通过不断处理所有的语音输入并把语音输入与已知命令进行比较以确定是否提交了语音命令，语音命令可以被接收。例如，可以连续地提交当前时间最近的n秒中的语音输入用于分析，以确定在最近的n秒内是否接收了语音命令。在实施例中，可以从不同用户接收语音命令的不同部分。例如，命令“记录(record)”可以从第一用户接收，而节目/表演的不同标题可以从多个用户接收。其他命令的示例包括“订购比萨(orderpizza)”、“(留言这个游戏是令人惊异的)tweetthisgameisamazing”、“留言板谁想看艾美奖(wallpostwhowantstocomewatchtheemmys)”等。虽然在这个例子中使用语音命令，但是可以接受任何类型的输入(例如，使用鼠标、键盘、操纵杆)。

可以基于与一个或多个所识别的用户相关的喜好(例如，在用户配置文件里)解释命令(步骤806)，来确定待执行的行为(步骤808)。解释命令可以涉及确定该命令对一个用户(例如，给出命令的用户)或多个用户(例如，包括在步骤802中识别的多个用户)是否适用。特定的命令字可以表明单用户命令或多用户命令。例如，留言命令可以默认解释为适用于单个用户，例如，提交命令的用户。此外，可以基于用户喜好/设置来解释命令。如果提交命令“留言这个游戏是令人惊异的(tweetthisgameisamazing)”的用户与twitter账户相关，则要执行的行为是为该用户的twitter账户产生留言(包括词语“这个游戏是令人惊异的(thisgameisamazing)”)。适用于单个用户的命令的另一个示例包括“留言板谁想看艾美奖(wallpostwhowantstocomewatchtheemmys)”。在这种情况下，用户的命令可以识别为Facebook留言板，而消息“谁想看艾美奖(whowantstocomewatchtheemmys)”可以公布在用户的Facebook的配置文件上。可以配置多媒体设备，以使某些类型的命令与多个用户命令相关。例如，食品的订单可与所有已识别的用户相关。命令“订购比萨(orderpizza)”可以解释为，对带有与所有已识别用户的喜好匹配的配料的比萨的订单。命令“买票(buytickets)”可以解释为，为所有已识别用户购买目前在电视上做广告的足球比赛门票的订单。基于已识别的用户，命令可以对于完整的解释是有意模糊的。例如，命令“播放已记录的节目(playrecordedshow)”可以使得在媒体设备上评估每个记录的节目，以基于用户喜好确定多少已识别用户喜欢已记录的节目。此后，选择与最多数量的已识别用户的喜好匹配的已记录节目进行播放。

在实施例中，全部或部分命令解释可以在执行前由用户确认。例如，订购比萨时，可以呈现基于用户喜好选择的比萨配料用于确认。另一个涉及命令的确认的示例可以涉及任何需要金钱或金钱临界值的订单。

在实施例中，命令可以基于与用户相关的权限进行解释，并且该命令可以仅当给出命令的用户拥有给出命令的权限时才能执行。例如，记录和/或播放R级电影可以被限制于十七岁以上的用户。可以为每个用户安装包括用户的年龄的配置文件。如果识别的十七岁以上的用户给出记录/播放R级电影的命令，则执行命令。然而，如果十七岁以下的用户给出了记录/播放R级电影的命令，则拒绝命令。在实施例中，可以基于用户的宗教和/或政治信仰解释命令。例如，如果民主党用户提交命令，由民主党主办的选举节目将被记录下来，如果共和党用户提交命令，由共和党主办的选举节目将被记录下来。

在实施例中，用来提交命令的语言可以用于解释命令。例如，如果以法语提交记录节目的命令，法语字幕将从一组可用的字幕流中挑选出来并且与节目一起记录。在另一个示例中，如果多个音频流在不同的语言中是可用的，将基于命令的语言选择音频流。

10.0使输入与媒体内容关联

根据实施例，图9示出了使注释与媒体内容关联的流程图。下面描述的步骤中的一个或多个可以被省略、重复和/或以不同的顺序进行。因此，图9所示的步骤的具体安排不应解释为限制本发明的范围。此外，虽然可能在下面的例子中讨论具体类型的注释(例如，音频、文本、图形等)，但是本发明的实施例适用于任何类型的注释。

在实施例中，媒体内容被播放(步骤902)。媒体内容可以包括音频和视频内容，或者媒体内容可以单独包括视频内容。媒体内容播放的同时，从用户接收的音频输入可以被记录(步骤904)。从用户接收的音频输入可以是对媒体内容通常的回应。例如，音频输入可以包括笑声、兴奋(例如，喘气、“哇(wow)”等)、评论、批评、赞美或对媒体内容的任何其他的反应。在实施例中，评论可以包括计划用于媒体内容随后的播放的音频输入。例如，在关于旅游目的地的纪录片中，用户可以提交语音输入，其包括与具有特色的特定旅游目的地相关的故事或回忆。在另一个示例中，乐队可以在媒体内容的特定部分期间提供歌词，用于与媒体内容的所述部分相关地进行记录。在另一个实施例中，用户可以在原始语言的媒体内容的播放期间以替换语言提供评论、剧情、人物线条或关于媒体内容的任何其他信息。不同版本的音频输入(例如，由相同用户或由不同用户)可以被记录为与特定媒体内容相关。在实施例中，音频输入可以具有用于有意回放的信息的指令。例如，回放信息可以指示，提交的音频将完全取代原有的音频，或与原始音频同时播放。在实施例中，音频输入可以由文本至言语的转换器自动生成，该转换器基于与媒体内容相关的文本生成言语。例如，基于替换语言中的隐藏字幕文本可以产生替换语言的言语。在实施例中，可以使用光学字符识别来识别显示在屏幕上的建筑物名称、字母、球队名字等，并且将其转换为音频，以用于视力受损的观众或用于不能读取信息(例如，由于语言障碍或年龄)的观众。在实施例中，音频输入可以在播放媒体内容的特定部分的同时被接收，并且储存为与媒体内容的所述特定部分相关。

在实施例中，媒体内容接着与在媒体内容先前的播放期间接收的音频输入一起播放(步骤906)。播放在媒体内容先前的播放期间接收的附加音频输入可以包括完全取代原始音频流或与原始音频流同时播放。在实施例中，附加的音频输入可以是能够在相应的媒体内容的播放期间打开或关闭的特征。在实施例中，可以提供多个版本的附加音频输入，其中用户可以选择特定的附加音频输入，用于在媒体内容的播放过程中播放。例如，可以建立在线社区，用于提交和下载随不同的电影播放的评论。不同的用户可以利用不同的媒体设备记录与特定的电影(或其他内容)相关的音频输入，并且之后将音频输入上传以与该电影关联。当电影购买者下载电影时，购买者能够选择通过另一用户即将下载/与电影一起播放的评论(例如，音频输入)。如果购买者发现特定用户的评论有趣，购买者在下载电影(或其他媒体内容)时可以将该特定用户设置为默认评论员并且下载该特定用户所有的评论。

虽然音频输入被用作媒体内容的注释的示例，但是根据本发明的实施例，可以使用任何类型的注释。例如，在播放媒体内容期间，可以输入文字或可以由一个或多个用户提交图像。在实施例中，全部或部分注释或注释集可以被处理或分析，以获得新的内容。在实施例中，与相同的媒体内容相关的注释集可以被比较，以识别注释模式。例如，可以分析注释集，以确定媒体内容内注释最多的点。因此，引起用户极大兴奋(或其他情绪)的场景或演员可以在场景中通过注释被识别出来。在另一个示例中，可以分析包括在注释集(如文字或语音注解)中的用户内容，以确定集体用户的感觉(例如，电影中最有趣的场景，或2009年发布的最有趣的电影)。

11.0由个人媒体设备得到注释

在实施例中，任何注释(包括音频输入、文本输入、图形输入等)可以在通过与用户相关的个人媒体设备呈现媒体内容之前、之中或之后得到。可以基于管理员、内容制片人、内容总监等的选择得到注释。例如，在内容流的媒体内容中的才艺大赛展示中的每个表演结束后，媒体设备促使用户作出评论(例如，投票、评价、批评、表扬等)，所述内容流由媒体设备接收并且由媒体设备显示。在实施例中，得到的注释(或其他注释)可以与整体媒体内容而不是媒体内容中的具体点(如提交音频输入时)相关。可以接着为媒体内容处理(例如，计算投票、分数等)一个或多个用户的注释。

在实施例中，音频输入由媒体设备从用户得到，以建立用户配置文件。例如，可以从用户得到对不同的媒体内容的反应。基于所述反应，可以自动创建用户配置文件，其可以包括用户的兴趣、爱好、厌恶、价值观念、政治观点等。自动创建的配置文件可以用于约会服务、社交网络网站等。自动生成的配置文件可以公布在网页上(例如，社交网络网站的网页)。

在实施例中，系统能够得到用户注释以识别与媒体内容相关的信息。例如，可以得到注释用于识别虽然已经检测但是不能自动识别的面部。也可以在媒体内容已近播放完之后配置系统，以得到家长的注释，其指示媒体内容是否适合儿童。

12.0标记媒体内容

在实施例中，用户可以使用注释，以标记媒体内容播放中的位置。例如，用户可以在媒体内容的播放期间提交音频输入或文本输入，包括特定的关键字，如“标记(mark)”、“注解(note)”、“记录(record)”等，其指示系统标记媒体内容播放的当前位置。系统可以基于用户的响应自动标记特定位置。例如，在一定的频率或一定的分贝水平以上的用户输入可以指示用户是兴奋的。这个兴奋点可以被自动存储。在实施例中，所标记的点可以包括起点和/或终点。例如，可能与体育比赛令人兴奋的部分相关的高用户活动期间可以通过起点和终点被标记。家长可以标记不适合儿童的媒体内容的起点和终点，由此标记部分可以在回放时被跳过，除非提供密码。用户可以标记家庭视频中多事的一段。作为用户对点进行标记或基于用户响应自动标记的结果，注释可以存储为与点相关。当用户对点进行标记时，注释可以体现对原始内容、时间，或从原始内容的开始偏移的帧以及UTC的参考。虽然音频输入可以作为例子使用，但是输入也可以通过按下遥控装置上的键、点击鼠标、在键盘上输入命令，或使用任何其他的输入方法来提交。

在实施例中，标记(或识别)媒体内容中的特定点可以涉及标记媒体帧。例如，媒体帧可以使用标签进行标记，正如申请人所拥有的2000年9月20日提交的专利申请09/665,921所描述，该申请通过参考合并于此。另一个例子可以涉及使用哈希值标记媒体帧，正如在申请人所拥有的2006年6月22日提交的专利申请11/473,543所描述，该申请通过参考在此纳入。在实施例中，标记媒体内容中的特定点可以涉及从媒体内容中的一个或多个帧获取指纹，并使用指纹来识别媒体内容中的特定点。在实施例中，可以通过存储从媒体内容播放中的起点开始时间间隔来标记特定点。

在实施例中，用户标记的位置可以由用户在以后的时间选择。例如，用户能够浏览不同用户在播放媒体内容的过程中通过按下下一个(next)或扫描(scan)所标记的点。每个标记点的图像可以呈现给用户，用户可以在其中选择特定的图像并从对应的用户标记点开始/恢复播放媒体内容。用户注释可用于动态地将媒体内容分割成不同的部分。用户注释也可以用来过滤掉媒体内容的某些部分(例如，没有注释/兴奋的时期)，并在媒体内容接下来的播放中播放媒体内容的其余部分。

13.0媒体内容注释的发布

在实施例中，可以发布全部或部分注释(例如，在网站或网页服务上引用或呈现)。在实施例中，全部或部分注释可以被自动呈现给另一个系统上的用户。在一示例中，用户可以请求系统把全部或部分注释发送到电子邮件或SMS地址。在另一示例中，用户可以请求系统在另一个用户(例如，电影评论家或朋友)积极地评论了电影时自动将电影添加到在线购物车或队列。在实施例中，媒体内容注释可以由在线社区中的用户出售，用于媒体内容的销售或交易。在实施例中，注释(例如，带嵌入注释的媒体内容)可以直接从一个媒体设备传送到另一个媒体设备(例如，通过电子邮件、内联网、互联网或任何其他可用的通信方法)。

14.0自动生成的注释

在实施例中，系统可以从媒体内容的隐藏字幕部分获取媒体内容的注释内容。在一示例中，系统可以产生注释，其包括自然语言处理系统和/或语义分析系统识别的适当的名称，并且接着将注释与视频内容关联，所述适当的名称出现在隐藏字幕中。在另一示例中，当话语“我们将在这些词语之后回来(we’llbebackafterthesewords)”或类似的话语在隐藏字幕中被识别时，系统可以产生注释，所述注释指示出广告休息的开始。另一个示例包括生产与媒体内容的地区相关的注释的系统，媒体内容包含明确的闭合字幕语言。然后，所述系统可以提供选项，以自动将与明确的隐藏字幕语言相关的媒体内容的音频部分静音。

在实施例中，系统可以利用光学字符识别系统生成音频输入。在一示例中，所述系统可以产生注释，其包括正在预告电影的标题。例如，一旦电影标题被识别或在电影宣传片结束时，注释可以显示电影标题(例如，在屏幕底部)。在另一示例中，所述系统可以产生音频注释，其包括来自视频内容对应于致谢名单的剧组成员的名字。另一示例可以涉及，通过分析在体育比赛播出的传声器区域内的OCR获取的数据，系统在体育比赛过程中产生指示比分变化的注释。

在一示例中，系统可以通过从OCR识别节目和电影标题的集合来检测用户正在浏览电子节目指南(EPG)。然后，系统可以在EPG中产生视觉注释，推荐EPG中所列的最高收视率节目。在实施例中，注释也可以包括其他的上下文信息，其可以用来进一步优化推荐。例如，注释可以基于用户最近观看的内容，注释可用于从EPG推荐同一类型或相同的演员的内容。

在实施例中，系统可以利用语音到文本的系统获取注释内容。例如，当音频静音或听力障碍的人作出请求时，系统可以产生将在未来的展示中使用的媒体内容中的对话抄本。在实施例中，获取的抄本可以由单独的系统处理，该系统监控感兴趣的主题或人，然后自动生成与感兴趣的主题或人相关的注释。

15.0环境配置

根据一个或多个实施例，图10示出了用于配置环境的示例性系统。在实施例中，环境配置引擎(1015)通常表示任何软件和/或硬件，其可配置以确定环境配置(1025)。环境配置引擎(1015)可以在媒体设备内实现，如图1B所示，或可作为单独的部件实现。环境配置引擎(1015)可以识别环境配置引擎(1015)附近的一个或多个用户(例如，用户A(1005)、用户N(1010)等)，并且识别与确定的用户相关的用户喜好(1020)。可以基于语音识别或基于识别用户的其他输入对用户进行识别。基于用户喜好(1020)，环境配置引擎可以配置用户界面、音频系统配置、室内照明、游戏机、音乐播放列表、座位配置或任何其他合适的环境配置(1025)。例如，如果识别了与组用户喜好相关的五个朋友，可以自动选择播放体育比赛的频道，并且可以选择与体育比赛相关的音频流的环绕语音。另一个是列可以涉及识别一对夫妇，并自动开始播放浪漫的喜剧。

16.0硬件概述

根据一个实施例，在此描述的技术由一个或多个专用计算设备实现。专用计算设备可以是硬连线来执行技术，或者可以包括数字电子设备，如一个或多个专用集成电路(ASIC)或现场可编程逻辑门阵列(FPGA)，其被持续地编程来执行技术，或者可以包括一个或多个通用硬件处理器，根据在固件、存储器、其他存储或组合中的程序指令来编程执行技术。这种专用计算设备也可结合定制的硬接线逻辑、ASIC或带有定制编程的FPGA来完成技术。专用计算设备可以是台式计算机系统、便携式计算机系统、手持设备、网络设备或任何其他包括硬接线和/或编程逻辑设备来实现技术。

例如，图11是方框图，其示出了可以在其上实现本发明的实施例的系统1100。系统1100包括总线1102或其他用于传达信息的通信机制，还包括硬件处理器1104，其与总线1102连接用于处理信息。硬件处理器1104可以是(例如)通用微处理器。

系统1100还包括主存储器1106(如随机存取存储器(RAM)或其他动态存储设备)，其连接至总线1102用于存储将被处理器1104的信息和指令。主存储器1106也可用于在处理器1104执行指令的执行过程中存储临时变量或其他中间信息。所述指令在其存储在处理器1104可访问的存储介质中时使得系统1100成为专用机器，其专门执行指令中指定的操作。

系统1100进一步包括只读存储器(ROM)1108或其他静态存储设备，其连接至总线1102用于存储处理器1104的静态信息和指令。存储设备1110，如磁盘或光盘，被提供和耦合于总线1102用于存储信息和指令。

系统1100可以通过总线1102连接至显示器1112(如阴极射线管(CRT))，用于给计算机用户显示信息。输入设备1114(包括字母数字键和其他键)连接至总线1102，用于向处理器1104传达信息和命令选择。另一种类型的用户输入设备是光标控制11111(如鼠标、轨迹球、光标方向键)，用于向处理器1104传达方向信息和命令选择，并且用于在显示器1112上控制光标移动。所述输入设备通常具有在两个轴上的两个自由度，第一轴(例如，x轴)和第二轴(例如，y轴)，其允许设备指明平面中的位置。

系统1100可以实现本文所述的技术，其使用了定制的硬接线逻辑、一个或多个ASIC或FPGA、固件和/或程序逻辑，其与系统的组合使得系统1100成为专用机器或者将系统1100编程为转用机器。根据一个实施例，响应于处理器1104执行包含在主存储器1106中的一个或多个指令的一个或多个序列，此处的技术由系统1100执行。这些指令可以从另一存储介质(如存储设备1110)中读入主存储器1106。包含在主存储器1106中的指令序列的执行引起处理器1104来执行在此所述的处理步骤。在可选的实施例中，硬连线电路可以用于代替软件指令或与软件指令组合使用。

此处使用的术语“存储介质”是指任何媒体，其存储使得机器以特定的方式运作的数据和/或指令。这种存储介质可以包括非易失性的介质和/或易失性的介质。非易失性的介质包括，例如，光盘或磁盘，如存储设备1110。易失性的介质包括动态存储器，如主存储器1106。常见形式的存储介质包括，例如，软盘、软磁盘、硬盘、固态硬盘、磁带或任何其他的磁性数据存储介质、CD-ROM、任何其他光学数据存储媒体、任何带孔图案的物理介质、RAM、PROM和EPROM、FLASH-EPROM、NVRAM、任何其他的存储器芯片或盒式磁带。

存储介质与传输介质是截然不同的，但可以与传输介质同时使用。传输介质参与存储介质之间的信息传输。例如，传输介质包括同轴电缆、铜线和光纤(包括含有总线1102的电线)。传输介质也可以采取声波或光波的形式，如无线电波和红外数据通信过程中产生的声波或光波。

各种形式的介质可以涉及将一个或多个指令的一个或多个序列传输给处理器1104以便执行。例如，指令最初可以装载在磁盘上或远程计算机的固态驱动器上。远程计算机可以把指令装入其动态存储器并且通过使用调制解调器的电话线发送指令。系统1100本地的调制解调器可以接收电话线上的数据并且使用红外发射器将数据转换成红外信号。红外探测器可以接收红外信号承载的数据，而适当的电路可以将数据放置在数据总线1102上。总线1102运送数据到主存储器1106，处理器1104从主存储器读出并执行指令。主存储器1106接收的指令可以可选地在处理器1104执行之前或之后存储在存储设备1110上。

系统1100还包括连接至总线1102的通信接口1118。通信接口1118提供连接至网络链接1120的双向数据通信，网络链接1120连接到本地网络1122。例如，通信接口1118可以是综合业务数字网(ISDN)卡、电缆调制解调器、卫星调制解调器或提供相应类型的电话线的数据通信连接的调制解调器。作为另一个示例，通信接口1118可以是局域网(LAN)卡，以提供与兼容LAN的数据通信连接。也可以实现无线连接。在任何这样的实现方式中，通信接口1118发送和接收电、电磁或光信号，这些信号传送代表不同类型信息的数字数据流。

网络连接1120通常通过一个或多个网络向其他数据设备提供数据通信。例如，网络链接1120可以通过本地网络1122提供到主机1124或到由互联网服务提供商(ISP)11211操作的数据设备的数据通信。ISP11211进而通过世界各地的分组数据通信网络(现在通常被称为“互联网”1128)提供数据通信。本地网络1122和互联网1128都使用承载数字数据流的电、电磁或光信号。通过各种网络的信号，以及在网络链接1120和通过通信接口1118的信号(这些信号将数字数据传送给系统1100或从系统1100传送数字数据)，是传输介质的示例性形式。

系统1100可以通过网络、网络链接1120和通信接口1118发送消息和接收数据(包括程序代码)。在互联网的示例中，服务器1130可以通过互联网1128、ISP11211、本地网络1122和通信接口1118传送应用程序请求的代码。

接收的代码可以在其被接收时由处理器1104执行，并且/或者存储在存储设备1110或其他非易失性存储中用于以后执行。

17.0延伸和替代

在上述说明书中，已经参考多个具体的细节描述了本发明的实施例，这些细节根据实现方式可以有所不同。因此，关于什么是本发明，什么是申请人通过本发明的意图的唯一且排他的指示是权利要求书，权利要求书以具体的形式从本发明得出，包括随后的任何修改。对于包含在所述权利要求中的术语，在此明确表达的任何定义应该决定在所述权利要求中使用的这些术语的含义。因此，在权利要求中没有明确表达的限制、元素、属性、特点、优势或属性，不应该以任何方式限制所述权利要求的范围。因此，说明书和附图被视为示例性的而非限制的意义。

Claims

1.一种方法，包括：

记录媒体内容的第一拷贝；

检测到所述媒体内容的第一拷贝是媒体内容的不完整拷贝；

响应于检测步骤，获得媒体内容的第二拷贝，其中所述第二拷贝是媒体内容的完整拷贝。

2.根据权利要求1所述的方法，其中获得步骤包括以下的一个或多个：

从广播服务请求所述媒体内容的第二拷贝并且响应于所述请求接收所述第二拷贝；

从网络服务器下载媒体内容的第二拷贝；

使用媒体内容的第二拷贝识别内容流并且从内容流记录媒体内容的第二拷贝。

3.根据权利要求1所述的方法，其中检测步骤包括：

确定媒体内容的第一拷贝的持续时间短于媒体内容的第一拷贝预计的持续时间。

4.根据权利要求1所述的方法，其中检测步骤包括：

确定在内容流上先于所述媒体内容可用的第二媒体内容被播出长于所述第二媒体内容安排的结束时间。

5.根据权利要求3所述的方法，其中从电子节目指南(EPG)获得媒体内容的第一拷贝预计的持续时间。

6.根据权利要求3所述的方法，其中从与媒体内容有关的元数据获得媒体内容的第一拷贝预计的持续时间。

7.根据权利要求3所述的方法，其中从网络搜索获得媒体内容的第一拷贝预计的持续时间。

8.一种装备，其包括配置为执行根据权利要求1至7中的一项或多项所述的步骤的装置。

9.一种装备，其包括配置为执行根据权利要求1至7中的一项或多项所述的步骤的至少一个设备。