CN105874809A - 用于基于所检测的音频事件倒回媒体内容的方法、系统和介质 - Google Patents
用于基于所检测的音频事件倒回媒体内容的方法、系统和介质 Download PDFInfo
- Publication number
- CN105874809A CN105874809A CN201480071616.6A CN201480071616A CN105874809A CN 105874809 A CN105874809 A CN 105874809A CN 201480071616 A CN201480071616 A CN 201480071616A CN 105874809 A CN105874809 A CN 105874809A
- Authority
- CN
- China
- Prior art keywords
- media content
- audio
- voice data
- audio event
- event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/238—Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
- H04N21/2387—Stream processing in response to a playback request from an end-user, e.g. for trick-play
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/432—Content retrieval operation from a local storage medium, e.g. hard-disk
- H04N21/4325—Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47202—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47217—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4882—Data services, e.g. news ticker for displaying messages, e.g. warnings, reminders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/658—Transmission by the client directed to the server
- H04N21/6587—Control parameters, e.g. trick play commands, viewpoint selection
Abstract
提供了用于基于所检测的音频事件倒回媒体内容的方法、系统和介质。在一些实施例中,提供了一种用于提供媒体引导的方法,所述方法包括:使得媒体内容被呈现;使用音频输入设备接收包括所述媒体内容在其中被呈现的环境之中的周边声音的音频数据;接收倒回媒体内容的用户命令;响应于接收倒回媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的呈现期间所发生的音频事件相对应;基于所述音频事件确定所述媒体内容中的播放位置;以及使得所述媒体内容从所确定的播放位置被呈现。
Description
相关申请的交叉引用
本申请要求于2013年12月31日提交的美国专利申请序列号14/145057的权益,其全部内容通过引用合并于此。
技术领域
所公开的主题涉及用于基于所检测的音频事件倒回媒体内容的方法、系统和介质。更具体地,所公开的主题涉及响应于接收用户请求而检测诸如在媒体内容的播放期间所发生的中断的音频事件,并且基于所检测的音频事件自动倒回媒体内容。
背景技术
当消费诸如电视节目的媒体内容时,用户可能会被诸如电话呼叫、门铃响、另一个用户对消费媒体内容的用户讲话以及其它中断的各种源所打扰。为了避免错过媒体内容的一部分,用户可能必须在被这样的中断所打扰之后立即手动暂停媒体内容的播放。替选地,用户可能必须将媒体内容手动倒回至中断发生之前的播放位置。例如,这会对用户造成不连续的体验,其中用户必须一次或多次倒回媒体内容以定位所期望的播放位置从而恢复媒体内容的播放。
因此,期望提供用于基于所检测的音频事件倒回媒体内容的新机制。
发明内容
提供了用于基于所检测的音频事件倒回媒体内容的方法、系统和介质。
根据所公开主题的一些实施例,提供了一种用于提供媒体引导的方法,所述方法包括:使用硬件处理器使得媒体内容被呈现;使用音频输入设备接收包括所述媒体内容在其中被呈现的环境之中的周边声音的音频数据;接收倒回媒体内容的用户命令;响应于接收倒回媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的呈现期间所发生的音频事件相对应;基于所述音频事件确定所述媒体内容中的播放位置;以及使得所述媒体内容从所确定的播放位置被呈现。
根据所公开主题的一些实施例,提供了一种用于提供媒体引导的系统,所述系统包括:音频输入设备;存储设备;和至少一个硬件处理器,其被配置为:使得媒体内容被呈现;将使用音频输入设备所接收的音频数据存储在所述存储设备中,其中所述音频数据包括所述媒体内容在其中被呈现的环境之中的周边声音;接收倒回媒体内容的用户命令;响应于接收与倒回媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的呈现期间所发生的音频事件相对应;基于所述音频事件确定所述媒体内容中的播放位置;以及使得所述媒体内容从所确定的播放位置被呈现。
根据所公开主题的一些实施例,提供了一种包含计算机可执行指令的非暂时性计算机可读介质,所述指令在被处理器执行时使得所述处理器执行一种用于呈现媒体文件的方法,所述方法包括:使得媒体内容被呈现;接收包括所述媒体内容在其中被呈现的环境之中的周边声音的音频数据;接收倒回媒体内容的用户命令;响应于接收与倒回媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的呈现期间所发生的音频事件相对应;基于所述音频事件确定所述媒体内容中的播放位置;以及使得所述媒体内容从所确定的播放位置被呈现。
根据所公开主题的一些实施例,提供了一种用于提供媒体引导的系统,所述系统包括:用于使得媒体内容被呈现的装置;用于接收包括所述媒体内容在其中被呈现的环境之中的周边声音的音频数据的装置;用于接收倒回媒体内容的用户命令的装置;用于响应于接收倒回媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的呈现期间所发生的音频事件相对应的装置;用于基于所述音频事件来确定所述媒体内容中的播放位置的装置;和用于使得所述媒体内容从所确定的播放位置被呈现的装置。
在一些实施例中,所述播放位置与所述媒体内容中在所述音频事件发生之前的时间位置相对应。
在一些实施例中,所述用于接收倒回媒体内容的用户命令的装置进一步包括用于从音频数据中识别与倒回所述媒体内容的请求相对应的语音输入的装置。
在一些实施例中,所述用于接收倒回媒体内容的用户命令的装置进一步包括用于检测已经从远程控制接收到所述用户命令的装置。
在一些实施例中,所述系统进一步包括:用于确定所述音频数据中的多个绝对周边噪声水平的装置;用于将所述多个绝对周边噪声水平中的每一个与预定阈值的值进行比较的装置;和用于基于所述比较来检测所述媒体内容的呈现期间的音频事件的装置。
在一些实施例中,所述系统进一步包括:用于从音频数据检测音频事件的类型的装置;和用于基于所述音频事件的类型确定播放位置的装置。
在一些实施例中,所述媒体内容包括音频部分,并且所述系统进一步包括:用于基于所述音频部分计算所述音频数据中的多个相对周边噪声水平的装置,和用于基于所述多个相对周边噪声水平检测所述媒体内容的呈现期间所发生的音频事件的装置。
附图说明
在结合以下附图进行考虑时,所公开主题的各种目标、特征和优势能够参考以下对所公开主题的详细描述而被更为全面地理解,其中同样的附图标记识别同样的元素。
图1是根据所公开主题的一些实施例的用于基于所检测到的音频事件倒回媒体内容的说明性过程的框图。
图2示出了根据所公开主题的一些实施例的用于基于所检测到的音频事件呈现媒体内容并倒回媒体内容的说明性显示屏幕的示例。
图3是根据所公开主题的一些实施例的适用于用来基于所检测到的音频事件倒回媒体内容的本文中所描述的机制的实施方式的说明性系统的框图。
图4示出了能够根据所公开主题的一些实施例使用的图3的媒体播放设备以及移动设备之一的详细示例。
具体实施方式
根据各个实施例,提供了用于基于所检测到的音频事件倒回媒体内容的机制(其可以包括方法、系统和/或介质)。
在一些实施例中,本文中所描述的机制能够对包括媒体内容呈现期间的音频事件的周边或背景声音的音频信号进行监测。例如,所述机制能够接收到包括所述媒体内容在其中呈现的环境(例如,起居室环境)中的周边声音的音频信号。在更为具体的示例中,麦克风能够位于所述环境中以在呈现媒体设备时接收包括周边声音的音频数据。所述机制随后能够将周边声音转换为音频信号(例如,使用麦克风或硬件处理器)。
应当注意的是,在使用音频输入设备接收音频信号或任意其它音频数据之前,这些机制能够向用户提供以对执行动作提供同意或授权的机会,诸如激活音频输入设备并传送音频数据。例如,一旦在诸如电视设备和媒体播放设备的计算设备上加载应用时,所述应用能够提示用户提供用于激活音频输入设备、传送音频数据、检测音频数据中的事件和/或基于所检测到的事件倒回媒体内容的授权。在更多特定示例中,响应于下载应用以及在媒体播放设备上加载所述应用,能够在执行这些动作之前利用请求(或要求)用户提供同意的消息来提示用户。除此之外或替选地,响应于安装所述应用,能够在执行这些检测和/或传送与这些检测有关的信息之前利用请求(或要求)用户提供同意的许可消息来提示用户。在用户同意对这样的数据的使用的情况下,来自音频输入设备的音频数据能够被接收并且一个或多个音频事件(例如,中断点)能够被检测。
在一些实施例中,所述机制能够接收将媒体内容倒回至所检测到的音频事件(例如,所检测到的中断)发生之前的播放位置的用户命令。例如,音频事件能够被检测并且能够响应于接收到用户通过音频输入设备所发出的语音命令(例如,来自用户的“倒回”的语音输入)而在所检测到的音频事件发生之前的播放位置处呈现媒体内容。在另一个示例中,音频事件能够被检测并且能够响应于用户选择了远程控制、移动电话、平板计算设备、可穿戴计算设备等上的倒回按钮而在所检测到的音频事件发生之前的播放位置处呈现媒体内容。音频事件(例如,在媒体内容呈现期间发生的中断)的检测能够由用户命令的接收来触发。
在一些实施例中,响应于接收到倒回媒体内容的用户命令,所述机制能够基于从音频输入设备所接收到的音频信号而检测在媒体内容呈现期间所发生的音频事件。例如,所述机制能够计算音频信号内的绝对周边音量水平。该机制随后能够通过确定绝对周边音量水平中的至少一个超过了预定阈值的值而检测在媒体内容呈现期间所发生的音频事件。作为另一个示例,所述机制能够计算音频信号内的一个或多个相对周边音量水平(例如,两个绝对周边音量水平之间的变化量、与多个绝对周边音量水平相对应的变化速率、绝对周边音量水平和平均周边音量水平之间的变化量,等等)。该机制随后能够通过确定相对周边音量水平中的至少一个超过了预定阈值的值而检测在媒体内容呈现期间所发生的音频事件。作为又另一个示例,所述机制能够通过识别音频信号内特定类型的周边声音(诸如人声、电话呼叫等)而检测在媒体内容呈现期间所发生的音频事件。
一旦检测到在媒体内容呈现期间所发生的音频事件,该机制能够使得从音频事件发生之前的特定播放位置呈现媒体内容。例如,响应于接收到倒回媒体内容的用户命令并且检测到音频事件,该机制能够自动将媒体内容倒回至所检测到的音频事件之前的特定秒数的位置。
替选地,在一些实施例中,能够在媒体内容呈现的期间执行音频事件(例如,在媒体内容呈现期间发生的中断)的检测,其中播放位置能够沿媒体内容的时间线被指定。响应于接收到倒回媒体内容的用户命令,(诸如语音命令“倒回,我被打扰了(Rewind–I wasinterrupted)”)该用户命令能够触发该机制以使得从所检测到的音频事件发生之前的播放位置呈现媒体内容。
本文中结合图1至4对用于基于所检测到的音频事件倒回媒体内容的这些和其它特征进行描述。
转向图1,示出了根据所公开主题的一些实施例的用于基于所检测到的音频事件倒回媒体内容的说明性过程100的流程图。
如所图示的,过程100能够通过在110处呈现媒体内容开始。所呈现的媒体内容可以是任意适当内容,诸如视频内容、音频内容、电视节目、电影、卡通、音乐、声效、音频书、流直播内容(例如,流广播秀、直播音乐会等),等等。例如,如图2中所示出的,硬件处理器能够使得媒体内容210在显示器200上被呈现。
在一些实施例中,能够使用任意适当的媒体播放设备来呈现媒体内容,诸如流媒体播放设备、媒体中心计算机、DVD录影机、蓝光播放器、数字视频录音机、电视设备、平板计算设备、膝上型计算机、台式机、移动电话、游戏机、CD播放器、MP3播放器、电子图书阅读器,或者任意其它适当媒体设备。
在120处,过程100能够接受音频信号,所述音频信号包括在该媒体内容在其中被呈现的环境中的周边声音。能够使用诸如麦克风或声度表的任意适当的音频输入设备来生成该音频信号。例如,麦克风能够位于在其中呈现媒体内容的环境之中以接收和/或录制该环境(例如,起居室环境)中的周边声音。在另一个示例中,该麦克风或其它音频输入设备能够与媒体播放设备和/或移动设备进行整合,诸如游戏机、移动电话、平板计算设备或电视设备的内建式麦克风。
应当注意的是,在使用音频输入设备接收音频信号或任何其它音频数据之前,过程100能够提供给用户提供对执行动作的同意或授权的机会,诸如激活音频输入设备并传送音频数据。例如,一旦在诸如电视设备和媒体播放设备的计算设备上加载应用时,该应用能够提示用户提供用于激活音频输入设备、传送音频数据、检测音频数据中的事件和/或基于所检测到的事件倒回媒体内容的授权。在更为特定的示例中,响应于下载应用以及在媒体播放设备或移动设备上加载该应用,能够在执行这些动作之前利用请求(或要求)用户提供同意的消息来提示用户。除此之外或替选地,响应于安装该应用,能够在执行这些检测和/或传送与这些检测有关的信息之前利用请求(或要求)提供同意的许可消息来提示用户。
在一些实施例中,过程100随后能够将该周边声音转换为音频信号(例如,使用音频输入设备或硬件处理器)。例如,媒体播放设备或连接至音频输入设备的任意其它适当设备能够将音频数据和/或音频信号临时存储在循环缓冲器(例如,在接收到新的音频数据或音频信号时将被重写的易失性存储器中被实现)中。在更为特定示例中,该循环缓冲器能够被用来临时存储与预定数量的音频数据(例如,三十秒、一分钟、十分钟、三十分钟等)相对应的音频数据,并且最旧的音频数据能够被新录制的音频数据持续重写。应当注意的是,在其中使用一个或多个扬声器呈现媒体内容的一些实施例中,该音频信号的分量能够与所呈现的媒体内容的音频部分相对应。
在一些实施例中,过程100能够以任意适当的方式来存储所接收到的音频信号。例如,过程100能够以临时的方式对音频信号的一部分进行存储。在更为具体的示例中,与给定时间间隔或给定频带相对应的音频信号的分段能够在一个时间段内(例如,几秒钟、几分钟或者任意其它适当时间段)被存储在缓冲器中。在一些实施例中,音频数据被存储在缓冲器中的时间段能够由用户所指定(例如,在启动应用时)。作为另一个示例,过程100能够提取音频信号的一个或多个特征(例如,通过计算音频信号的一个或多个峰值、振幅、功率水平、频率、信噪比和/或其它适当特征)并且将所提取的特征存储在适当存储设备中。
在一些实施例中,过程100能够生成一个或多个音频指纹,所述音频指纹能够表示音频信号或音频信号的一个或多个适当部分。该音频指纹可以是从所接收到的音频信号生成的数字表示,其中该音频指纹能够被用来识别音频信号中的相同或相似部分(例如,与媒体内容相对应的音频信号的部分,与在媒体内容呈现期间所发生的一个或多个中断相对应的音频信号的部分,等等)。在一些实施例中,该音频指纹能够使用任意适当的音频指纹算法来生成,所述音频指纹算法可以包括一种或多种适当的二维变换(例如,离散余弦变换)、三维变换(例如,小波变换)、散列函数等。该音频指纹随后能够被存储在适当存储设备中。
在130处,过程100能够确定是否已经接收到倒回媒体内容的用户命令。在一些实施例中,倒回媒体文件的用户命令能够与一个或多个用户输入相对应。例如,该用户命令能够与指示用户想要倒回媒体内容的语音命令相对应。在更为具体的示例中,语音命令“倒回”能够由消费媒体内容的用户来提供并且其能够由被连接至媒体播放设备和/或移动设备的麦克风所检测到。作为另一个示例,硬件处理器能够响应于用户使用移动设备选择了倒回按钮而确定已经接收到倒回媒体内容的用户命令,所述移动设备诸如远程控制、移动电话、平板计算机等。应当注意的是,在一些实施例中,倒回媒体内容的用户命令能够以任意适当的形式进行传送,诸如一个或多个红外信号、高清多媒体接口(HDMI)通信信道协议(CEC)命令、WiFi信号、和/或其它适当控制信号。
在一些实施例中,响应于确定还没有接收到倒回媒体内容的用户命令,过程100能够返回至步骤120。
在140处,响应于确定已经接收到倒回媒体内容的用户命令,过程100能够基于音频信号或音频数据而生成周边噪声信号。例如,在其中使用一个或多个扬声器呈现媒体内容的一些实施例中,过程100能够通过从在120处所接收的音频信号中减去或去除表示所呈现的媒体内容的音频部分而生成周边噪声信号。在更为具体的示例中,能够由监测媒体播放设备所呈现的媒体内容的麦克风生成表示媒体内容的音频信号。在一些实施例中,能够使用两个麦克风来分别监测环境中的周边声音以及媒体播放设备所呈现的媒体内容。除此之外或替选地,能够基于包含媒体内容的媒体文件而生成表示与所呈现的媒体内容相对应的音频数据的音频部分。
在一些实施例中,在确定并未使用一个或多个扬声器呈现媒体内容时,过程100能够使用在120处所接收的音频信号作为周边噪声信号。
除此之外或替选地,过程100能够使用一种或多种适当的信号处理算法对音频信号和/或周边噪声信号进行处理以生成周边噪声信号。在更为具体的示例中,过程100能够使用适当的模数转换器来将模拟音频信号转换为数字音频信号。在另一个更为具体的示例中,过程100能够将音频信号或周边噪声信号转换为频域信号(例如,通过执行快速傅里叶变换等)。在又另一个更为特定的示例中,过程100能够对音频信号和/或周边噪声信号应用低通滤波器、带通滤波器等中的一个或多个。
接下来,在150处,过程100能够基于该周边噪声信号来检测在媒体内容呈现期间所发生的音频事件。能够在媒体内容呈现期间发生的音频事件的说明性示例可以包括电话响铃、大于阈值的值的噪声、音乐、人声,或者能够对媒体内容的播放造成干扰的任意其它适当中断。
在一些实施例中,过程100能够使用适当信号处理算法对周边噪声信号或周边噪声信号的一部分(例如,周边噪声信号中与特定时间段、特定频带等相对应的分段)进行处理。过程100随后能够基于经处理的周边噪声信号来检测音频事件。
例如,过程100能够基于周边噪声信号来计算一个或多个绝对周边噪声水平。过程100随后能够通过定位超过预定阈值的绝对周边噪声水平来检测音频事件的发生。在更为具体的示例中,过程100能够计算周边噪声信号的一个或多个适当特征,诸如峰值、振幅、功率水平等。过程100随后能够将该特征与预定阈值进行比较(例如,通过应用适当滤波器)并且基于该比较来检测音频事件的发生。
作为另一个示例,过程100能够计算一个或多个相对周边噪声水平并且基于该相对周边噪声水平检测音频事件的发生。更具体地,例如,过程100能够计算两个绝对周边噪声水平之间与不同时间相对应的变化数量(例如,以分贝为单位),与多个绝对周边噪声水平相对应的变化速率,等等。过程100随后能够通过定位超过预定阈值的相对周边噪声水平来检测音频事件的发生。
作为又另一个示例,过程100能够通过检测特定类型的周边噪声来定位媒体内容呈现期间音频事件的发生。在一些实施例中,该特定类型的周边噪声能够由用户和/或适当设置预先定义。在更为具体的示例中,过程100能够检测作为在媒体内容呈现期间所发生的音频事件的来电呼叫。在另一个更为具体的示例中,过程100能够使用适当的话音检测算法(例如,通过分析周边噪声信号中的一个或多个频率分量)来检测周边噪声信号中所包含的人的语音或话音的出现。应当注意的是,能够在并不识别话音内容的情况下检测到人的语音或话音的存在。
作为进一步的示例,过程100能够通过将与所接收到的音频信号相关联的音频指纹与多个音频指纹进行比较来定位媒体内容呈现期间音频事件的发生。在更为具体的示例中,过程100能够访问包含多个音频指纹的数据库或其它适当存储设备并且搜索表示与和所接收到的音频信号相关联的音频指纹相同或基本上相似的一个或多个音频事件(例如,中断点)的音频指纹。在另一个更为具体的示例中,能够将与所接收到的音频信号相关联的音频指纹与表示所呈现媒体内容的音频指纹的集合进行比较。
在一些实施例中,一旦识别出在媒体内容的呈现期间所发生的一个或多个音频事件和/或该类型的音频事件,能够基于所检测到的音频事件对该媒体内容进行标记。例如,所检测到的时间或音频事件能够与音频事件的描述、与该音频事件相对应的媒体内容中的时间位置和/或与所检测到的音频事件有关的其它适当信息相关联。接着能够基于相关联的信息对多个所检测到的音频事件进行索引和/或存储。
在如图2所示出的更为具体的示例中,当在媒体播放设备200上进行呈现媒体内容时,能够如以上所描述地在该媒体内容的呈现期间检测一个或多个音频事件。在一些实施例中,所检测到的音频事件能够包括在媒体内容的呈现期间的时间215处发生的第一事件(例如,电话响铃)以及在媒体内容的呈现期间的时间220处发生的第二事件(例如,讲话事件)。能够将该第一事件和第二事件分别与时间215和时间220相关联。除此之外或替选地,描述能够与第一事件和第二事件(如,电话呼叫、对话等)中的每一个相关联并且能够与其在媒体内容呈现期间的对应时间一起被存储在适当存储设备中。在这样的示例中,表示音频信号和/或周边音频信号的音频数据并非必然被存储以基于所检测到的事件倒回和/或表示媒体内容。
在一些实施例中,过程100可以包括将与所检测到的音频事件相对应的音频数据的部分传送至检测服务(例如,音频搜索引擎、音频检测服务等)。响应于接收到该音频数据部分,该检测服务能够确定对应的音频事件的类型,诸如电话响铃、人声讲话、狗吠、警报响铃等。例如,每种不同类型的音频事件能够具有相关联的播放位置(例如,检测到任意类型的电话响铃之前的30秒的播放位置,检测到任意类型的人声讲话之前的一分钟的播放位置,等等)。
在一些实施例中,一旦媒体内容的呈现期间检测到多个音频事件,能够向用户呈现一个或多个适当用户界面以向用户通知所检测到的事件。例如,硬件处理器能够在显示器200上提供指示,其向用户指示“已经检测到中断。您想要将视频倒回至该中断发生之前吗?现在说‘倒回’。”在另一个示例中,硬件处理器能够在显示器210上提供图标或指示符,其向用户指示有自动倒回至所检测到的音频事件发生之前的倒回选项可用。除此之外或替选地,用户可以被提示以选择与所期望的倒回点相对应的所检测到的事件(例如,通过发出与所检测到的事件相对应的语音命令)。
在160处,过程100能够基于所检测到的音频事件倒回媒体内容。在一些实施例中,过程200能够基于音频事件的发生而确定媒体内容中的播放位置。例如,过程100能够选定与所检测到的音频事件的开始相对应的特定时间的播放位置(例如,根据何时检测到电话响铃事件)。在另一个示例中,过程100能够自动选定作为所检测到的音频事件之前的特定时间段的播放位置(例如,所检测到的音频事件之前的五秒钟)。在另一个示例中,过程100能够确定用户所选定的指定播放位置的偏好。在更为特定的示例中,用户在设定客户端应用时能够被请求输入用于响应于所检测到的音频事件而指定播放位置的时间间隔(例如,始终为所检测到的音频事件之前的三十秒)。在又另一个示例中,过程100能够检测与所检测到的音频事件的发生相对应的时刻之前在媒体内容中的场景变换。过程100随后能够使得媒体内容根据所检测到的场景变换进行呈现。
在更为特定的示例中,播放位置能够被生成并且与所检测到的音频事件相关联。用户可以在当媒体内容的播放期间媒体播放设备上消费媒体内容,另一个用户可能开始与该用户讲话。在用户讲话时,被连接至该媒体播放设备的音频输入设备能够接收用户对话的音频并且检测事件(例如,音频事件)。执行应用的媒体播放设备能够确定该音频事件是讲话音频事件并且生成与媒体内容呈现期间检测到该事件的时间相关联的播放位置(例如,在媒体内容的55秒标记处所检测到的讲话音频事件之前的五秒钟)。在一些实施例中,在生成这些播放位置之后,被用来检测音频事件并且生成播放位置的音频数据能够被断开连接。例如,在播放位置已经被生成之后,其就不再与音频数据(例如,用户所讲出的单词或短语)相关联,而是仅与一个或多个所检测到的音频事件相关联。这能够允许在不存在用户之间的对话或其它音频数据被录制的风险的情况下确定倒回点。这能够缓解用户可能关心的录制他们对话的设备的隐私性问题。
过程100随后能够将媒体内容倒回至该播放位置并且使得该媒体内容从该播放位置被呈现给用户。
应当注意的是,图1的流程图中的上述步骤能够以任意顺序或次序来执行或实践而并不局限于图中所示出并描述的顺序和次序。而且,该图1的流程图中的上述步骤中的一些在能够在适当情况下基本上同时执行或实践或者并行执行或实施以减少延时和处理时间。此外,应当注意的是,图1仅是作为示例而被提供的。这些附图中所示出的步骤中的至少一些可以以与所表示不同的顺序来执行、同时执行或者共同被省略。
例如,在一些实施例中,过程100能够基于音频信号或音频数据生成周边噪声信号,并且能够检测接收到诸如语音命令的用户命令之前的音频事件。在一些实施例中,音频数据能够被持续保存在循环缓冲器或任意其它适当存储设备中,并且存储在该循环缓冲器中的基于该音频数据的周边噪声信号能够被生成并被分析以确定是否出现了音频事件。响应于接收到诸如倒回语音命令的用户命令,过程100能够将媒体内容的呈现倒回至所检测到的音频事件之前的播放位置。此外,响应于接收到倒回媒体内容的后续用户意见,过程100能够将媒体内容的呈现倒回至之前所检测到的音频事件之前的播放位置。
转向图3,示出了根据所公开主题的一些实施例的用于基于所检测到的事件倒回媒体内容的系统的示例300。如所图示的,系统300可以包括显示设备302、媒体播放设备304、一个或多个音频输入设备306、一个或多个移动设备308、通信网络310,以及通信链路312、314、316、318、320和322。
在一些实施例中,如图1中所图示的过程100中的一个或多个部分或者其全部能够由显示设备302、媒体播放设备304、音频输入设备306和移动设备308中的一个或多个来实现。例如,媒体播放设备304和/或移动设备308中的一个或多个可以基于音频输入设备302所生成的音频数据来检测媒体内容呈现期间的一个或多个音频事件,并且基于所检测到的音频事件来计算一个或多个倒回点。替选地或除此之外,音频数据或音频数据的适当部分能够被传送至适当的服务用于分析。在更为特定的示例中,音频数据能够被传送至搜索系统,所述搜索系统访问匹配的服务(例如,音频指纹匹配服务)。该搜索系统接着能够生成该音频数据的一个或多个适当音频指纹和/或搜索与所生成的音频指纹相匹配的所存储的参照音频指纹。
显示设备302可以是能够接收、转换、处理和/或呈现媒体内容的任意适当设备,诸如流媒体播放设备、媒体中心计算机、CRT显示器、LCD、LED显示器、等离子显示器、触摸屏显示器、模拟触摸屏、电视设备、移动电话等。在一些实施例中,显示设备302能够为用户呈现三维内容。
媒体播放设备304可以是能够呈现媒体内容、接收并处理指示用于倒回媒体内容的请求的控制信号,和/或执行任意其它适当功能的任意适当设备。流媒体设备的示例包括流媒体播放设备、媒体中心计算机、DVD录影机、蓝光播放器、数字视频录影机、电视设备、平板计算设备、膝上型计算机、台式机、移动电话、游戏机、CD播放器、MP3播放器、电子书阅读器、机顶盒等。在一些实施例中,媒体内容可以包括任意适当内容,诸如音频内容、视频内容、多媒体内容等。在一些实施例中,媒体内容可以具有任意适当格式,诸如MP3、WMA、WMV、OCD、MPEG-DST、AVI、MOV等。
移动设备308可以是能够接收和/或处理用户输入、基于所接收到的用户输入生成并传送控制信号,和/或执行任意其它适当功能的任意适当设备。例如,移动设备308可以包括远程控制、移动电话、平板计算机、膝上型计算机、台式计算机、个人数字助理(PDA)、便携式电子邮件设备、语音识别系统、手势识别系统、键盘、鼠标、麦克风等。在一些实施例中,移动设备208能够接收指示用户想要倒回媒体内容的适当用户输入。例如,用户输入能够包括用户使用麦克风所发出的一个或多个语音命令。作为另一个示例,用户输入能够包括用户使用移动设备选择倒回按钮(例如,通过按压和/或释放远程控制的一个或多个按钮,选择在移动设备308或显示设备302上所显示的用户界面上的一个或多个适当按钮)。
虽然图3中示出了三个移动设备308以避免使得图示过于复杂,但是在一些实施例中能够使用任意适当数量的这些设备以及任意适当类型的这些设备。
音频输入设备306可以是能够从用户接收声音输入,收集与周边噪声有关的音频数据,生成音频信号,处理音频信号和/或执行其它适当功能的任意适当设备。音频输入设备的示例可以包括麦克风、声度表等。在一些实施例中,音频输入设备310能够与移动设备308、显示设备302、媒体播放设备304等进行整合或与之连接。在一些实施例中,音频输入设备306能够包括外部麦克风(例如,诸如有线或无线耳机的配件中的麦克风)。
在一些实施例中,显示设备302、媒体播放设备304和移动设备308中的每一个可以是任意的通用设备,诸如计算机,或者是诸如客户端、服务器等的专用设备。这些通用或专用设备中的任意都可以包括任意适当的组件,诸如硬件处理器(其可以是麦克风、数字信号处理器、控制器等)、存储器、通信接口、显示控制器、输入设备、存储设备(其可以包括硬盘、数字视频录影机、固态存储设备、可移除存储设备或者任意其它适当存储设备),等等。
在一些实施例中,媒体播放设备304能够分别通过通信链路312和314被连接至显示设备302和音频输入设备306。在一些实施例中,显示设备302、媒体播放设备304、音频输入设备306和移动设备308中的每一个都能够分别通过通信链路316、318、320和322被连接至通信网络310。通信链路312、314、316、318、320和322可以是任意适当的通信链路,诸如网络链路、拨号链路、无线链路、硬线链路、任意其它适当通信链路,或者这样的链路的组合。在一些实施例中,通信链路312、314、316、318、320和322中的每一个可以包括一个或多个红外(IR)通信链路、高清多媒体接口(HDMI)链路、局域网(LAN)链路等。
通信网络310可以是任意适当计算机网络,包括互联网、内联网、广域网(“WAN”)、局域网(“LAN”)、无线网络、数字订户线路(“DSL”)网络、帧中继网络、异步传输模式(“ATM”)网络、虚拟私人网络(“VPN”)、有线电视网络、光纤网络、电话网络、卫星网络,或者任意这样的网络的任意组合。
在一些实施例中,显示设备302、媒体播放设备304、音频输入设备306和移动设备308中的每一个能够被实现为独立设备或者与系统300的其它组件进行整合。
例如,在计算设备上执行的倒回应用能够包括第二屏幕应用或者能够与已经在移动设备(例如,移动电话、平板计算设备、可穿戴计算设备等)上安装的第二屏幕应用进行通信。例如,第二屏幕应用能够允许向移动设备或其它第二屏幕应用的用户呈现被传送至媒体播放设备的内容,上述媒体播放设备诸如电视设备、机顶盒、游戏机等。在一些实施例中,倒回应用能够使用第二屏幕应用以基于所检测到的事件倒回媒体内容。在一些实施例中,该第二屏幕应用能够被用来激活第二屏幕设备上的音频输入设备并且该音频输入设备所检测到的音频数据能够由第二屏幕设备和/或媒体播放设备进行处理。
媒体播放设备以及图3中所描绘的移动设备之一在图4中进行了更为详细的图示。参考图4,移动设备308可以包括可以被互连的硬件处理器402、显示器404、输入设备406和存储器408。在一些实施例中,存储器408可以包括用于存储计算机程序以便控制硬件处理器402、音频数据、用户输入和/或其它适当信息的存储设备(诸如非暂时性计算机可读介质)。
处理器402使用计算机程序在显示器404上呈现媒体内容、用户界面、通过通信链路308所接收的数据,以及移动设备308的用户所传送的命令和数值。还应当注意的是,通过通信链路322或任意其它通信链路所接收的数据可以从任意适当的源被接收。在一些实施例中,例如,硬件处理器402能够使用传送器、接收器、传送器/接收器、收发器或者任意其它适当通信设备来通过通信链路322或者任意其它通信链路发送和接收数据。输入设备406可以是计算机键盘、鼠标、小键盘、光标控制器、手势系统、远程控制,或者输入系统或处理控制系统的设计人员将会使用的任意其它适当输入设备。替选地,输入设备406可以是显示器404的手指敏感或输入笔敏感的触摸屏输入。为了接收以上所描述的语音命令,输入设备406可以是麦克风。
媒体播放设备304可以包括能够互连的处理器420、显示器422、输入设备424和存储器426。在优选实施例中,存储器426包含用于存储通过通信链路318或通过其它链路所接收的数据,并且还接收由一个或多个用户所传送的命令和数值。该存储设备进一步包含用于控制处理器320的服务器程序。
在一些实施例中,应用可以包括应用程序接口(未示出),或者替选地,该应用可以驻留于移动设备208或媒体播放设备304的存储器中。在另一个适当实施例中,例如,到移动设备308的唯一分发可以是图形用户界面(GUI),其允许用户与驻留于媒体播放设备304处的应用进行交互。
在一些实施例中,能够使用任意适当的计算机可读介质用来存储用于执行本文中所描述的过程的指令。例如,在一些实施例中,计算机可读介质可以是暂时性的或非暂时性的。例如,非暂时性的计算机可读介质可以包括诸如磁性介质(诸如,硬盘、软盘等)、光学介质(诸如紧致盘、数字视频盘、蓝光盘等)、半导体介质(诸如闪速存储器、电可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)等)的介质,在传输期间不是短暂的或者缺乏任何永久的外观的任意适当介质,和/或任意适当有形介质。作为另一个示例,暂时性计算机可读介质可以包括网络上、线路、导体、光纤、电路、在传输期间是短暂的且缺乏任何永久的外貌的任意适当介质中的信号,和/或任意适当非有形介质。
应当注意的是,在本文中所描述的其中应用(或本文中所描述的其它机制)收集关于特定用户的个人信息的实施方式中,可向该用户提供控制是否收集与特定用户有关的信息和/或如何由应用使用所收集到的用户信息的机会。与用户有关的信息的示例可以包括用户的兴趣、用户的位置、用户所讲出的姓名等。此外,某些与用户有关的信息可在其被存储之前被本地存储(例如,不被共享)、加密和/或以一种或多种方式进行处理以去除个人可识别信息。例如,用户的身份可被处理,使得无法针对用户确定个人可识别信息。作为另一个示例,在获得位置信息(诸如城市、邮政编码或州级)的情况下能够对用户的地理位置进行泛化,而使得无法确定用户的特定位置。使用本文中所描述的这些和其它技术,用户能够对与用户有关的哪些信息被收集和/或该信息如何被主题确定应用(或其它机制)所使用加以控制。
因此,提供了用于基于所检测到的音频事件倒回媒体内容的方法、系统和介质。
本文中所描述的示例(以及以如“诸如”、“例如”、“包括”等的短语所给出的条款)的提供并不应当被解释为将所要求保护主题局限于具体事例;相反,该示例旨在仅对许多可能方面中的一些加以说明。
虽然所公开的主题已经在之前的说明性实施例中进行了描述和图示,但是应当理解的是,本公开仅是以示例的形式而作出,并且能够对所公开主题的实施方式的细节进行许多改变而并不背离所公开主题的精神和范围,其仅由随后的权利要求所限定。所公开实施例的特征能够以各种方式进行组合和重新排列。
Claims (21)
1.一种用于提供媒体引导的方法,所述方法包括:
使用硬件处理器使得媒体内容被呈现;
使用音频输入设备接收音频数据,所述音频数据包括所述媒体内容在其中被呈现的环境中的周边声音;
接收倒回所述媒体内容的用户命令;
响应于接收倒回所述媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的所述呈现期间所发生的音频事件相对应;
基于所述音频事件来确定所述媒体内容中的播放位置;以及
使得所述媒体内容从所确定的播放位置被呈现。
2.根据权利要求1所述的方法,其中,所述播放位置与所述媒体内容中在所述音频事件的发生之前的时间位置相对应。
3.根据权利要求1所述的方法,其中,接收倒回所述媒体内容的用户命令进一步包括从所述音频数据中识别与倒回所述媒体内容的请求相对应的语音输入。
4.根据权利要求1所述的方法,其中,接收倒回所述媒体内容的用户命令进一步包括检测已经从远程控制接收到所述用户命令。
5.根据权利要求1所述的方法,进一步包括:
确定所述音频数据中的多个绝对周边噪声水平;
将所述多个绝对周边噪声水平中的每一个与预定阈值的值进行比较;以及
基于所述比较来检测所述媒体内容的所述呈现期间的音频事件。
6.根据权利要求1所述的方法,进一步包括:
从所述音频数据检测音频事件的类型;以及
基于所述音频事件的类型来确定所述播放位置。
7.根据权利要求1所述的方法,其中,所述媒体内容包括音频部分,并且其中,所述方法进一步包括:
基于所述音频部分来计算所述音频数据中的多个相对周边噪声水平;以及
基于所述多个相对周边噪声水平来检测所述媒体内容的所述呈现期间的所述音频事件。
8.一种用于提供媒体引导的系统,所述系统包括:
音频输入设备;
存储设备;和
至少一个硬件处理器,所述至少一个硬件处理器被配置为:
使得媒体内容被呈现;
将使用所述音频输入设备接收的音频数据存储在所述存储设备中,其中所述音频数据包括所述媒体内容在其中被呈现的环境中的周边声音;
接收倒回所述媒体内容的用户命令;
响应于接收倒回所述媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的所述呈现期间所发生的音频事件相对应;
基于所述音频事件来确定所述媒体内容中的播放位置;以及使得所述媒体内容从所确定的播放位置被呈现。
9.根据权利要求8所述的系统,其中,所述播放位置与所述媒体内容中在所述音频事件发生之前的时间位置相对应。
10.根据权利要求8所述的系统,其中,所述硬件处理器进一步被配置为从所述音频数据中识别与倒回所述媒体内容的请求相对应的语音输入。
11.根据权利要求8所述的系统,其中,所述硬件处理器进一步被配置为检测已经从远程控制接收到所述用户命令。
12.根据权利要求8所述的系统,其中,所述硬件处理器进一步被配置为:
确定所述音频数据中的多个绝对周边噪声水平;
将所述多个绝对周边噪声水平中的每一个与预定阈值的值进行比较;以及
基于所述比较来检测所述媒体内容的所述呈现期间的音频事件。
13.根据权利要求8所述的系统,其中,所述硬件处理器进一步被配置为:
从所述音频数据检测音频事件的类型;以及
基于所述音频事件的类型来确定所述播放位置。
14.根据权利要求8所述的系统,其中,所述媒体内容包括音频部分,并且其中,所述硬件处理器进一步被配置为:
基于所述音频部分来计算所述音频数据中的多个相对周边噪声水平;以及
基于所述多个相对周边噪声水平来检测所述媒体内容的所述呈现期间的所述音频事件。
15.一种包含计算机可执行指令的非暂时性计算机可读介质,所述指令在被处理器执行时使得所述处理器执行一种用于呈现媒体文件的方法,所述方法包括:
使得媒体内容被呈现;
接收音频数据,所述音频数据包括所述媒体内容在其中被呈现的环境中的周边声音;
接收倒回所述媒体内容的用户命令;
响应于接收倒回所述媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的所述呈现期间所发生的音频事件相对应;
基于所述音频事件来确定所述媒体内容中的播放位置;以及
使得所述媒体内容从所确定的播放位置被呈现。
16.根据权利要求15所述的非暂时性计算机可读介质,其中,所述播放位置与所述媒体内容中在所述音频事件发生之前的时间位置相对应。
17.根据权利要求15所述的非暂时性计算机可读介质,其中,所述方法进一步包括从所述音频数据中识别与倒回所述媒体内容的请求相对应的语音输入。
18.根据权利要求15所述的非暂时性计算机可读介质,其中,所述方法进一步包括检测已经从远程控制接收到所述用户命令。
19.根据权利要求15所述的非暂时性计算机可读介质,其中,所述方法进一步包括:
确定所述音频数据中的多个绝对周边噪声水平;
将所述多个绝对周边噪声水平中的每一个与预定阈值的值进行比较;以及
基于所述比较来检测所述媒体内容的所述呈现期间的音频事件。
20.根据权利要求15所述的非暂时性计算机可读介质,其中,所述方法进一步包括:
从所述音频数据检测音频事件的类型;以及
基于所述音频事件的类型来确定所述播放位置。
21.根据权利要求15所述的非暂时性计算机可读介质,其中,所述媒体内容包括音频部分,并且其中,所述方法进一步包括:
基于所述音频部分来计算所述音频数据中的多个相对周边噪声水平;以及
基于所述多个相对周边噪声水平来检测所述媒体内容的所述呈现期间的所述音频事件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910707388.1A CN110519539B (zh) | 2013-12-31 | 2014-12-23 | 用于基于所检测的音频事件倒回媒体内容的方法、系统和介质 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/145,057 US9274673B2 (en) | 2013-12-31 | 2013-12-31 | Methods, systems, and media for rewinding media content based on detected audio events |
US14/145,057 | 2013-12-31 | ||
PCT/US2014/072265 WO2015103056A1 (en) | 2013-12-31 | 2014-12-23 | Methods, systems, and media for rewinding media content based on detected audio events |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910707388.1A Division CN110519539B (zh) | 2013-12-31 | 2014-12-23 | 用于基于所检测的音频事件倒回媒体内容的方法、系统和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105874809A true CN105874809A (zh) | 2016-08-17 |
CN105874809B CN105874809B (zh) | 2019-08-16 |
Family
ID=52440817
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910707388.1A Active CN110519539B (zh) | 2013-12-31 | 2014-12-23 | 用于基于所检测的音频事件倒回媒体内容的方法、系统和介质 |
CN201480071616.6A Active CN105874809B (zh) | 2013-12-31 | 2014-12-23 | 用于基于所检测的音频事件倒回媒体内容的方法、系统和介质 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910707388.1A Active CN110519539B (zh) | 2013-12-31 | 2014-12-23 | 用于基于所检测的音频事件倒回媒体内容的方法、系统和介质 |
Country Status (4)
Country | Link |
---|---|
US (6) | US9274673B2 (zh) |
EP (1) | EP3090537A1 (zh) |
CN (2) | CN110519539B (zh) |
WO (1) | WO2015103056A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107785037A (zh) * | 2016-08-24 | 2018-03-09 | 谷歌有限责任公司 | 使用音频时间码同步媒体内容的方法、系统和介质 |
Families Citing this family (161)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US20120311585A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Organizing task items that represent tasks to perform |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US10199051B2 (en) | 2013-02-07 | 2019-02-05 | Apple Inc. | Voice trigger for a digital assistant |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN110442699A (zh) | 2013-06-09 | 2019-11-12 | 苹果公司 | 操作数字助理的方法、计算机可读介质、电子设备和系统 |
US20170263067A1 (en) | 2014-08-27 | 2017-09-14 | SkyBell Technologies, Inc. | Smart lock systems and methods |
US11909549B2 (en) | 2013-07-26 | 2024-02-20 | Skybell Technologies Ip, Llc | Doorbell communication systems and methods |
US11651665B2 (en) | 2013-07-26 | 2023-05-16 | Skybell Technologies Ip, Llc | Doorbell communities |
US11764990B2 (en) | 2013-07-26 | 2023-09-19 | Skybell Technologies Ip, Llc | Doorbell communications systems and methods |
US10440165B2 (en) | 2013-07-26 | 2019-10-08 | SkyBell Technologies, Inc. | Doorbell communication and electrical systems |
US20180343141A1 (en) | 2015-09-22 | 2018-11-29 | SkyBell Technologies, Inc. | Doorbell communication systems and methods |
US11889009B2 (en) | 2013-07-26 | 2024-01-30 | Skybell Technologies Ip, Llc | Doorbell communication and electrical systems |
US10672238B2 (en) | 2015-06-23 | 2020-06-02 | SkyBell Technologies, Inc. | Doorbell communities |
US10708404B2 (en) | 2014-09-01 | 2020-07-07 | Skybell Technologies Ip, Llc | Doorbell communication and electrical systems |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9274673B2 (en) * | 2013-12-31 | 2016-03-01 | Google Inc. | Methods, systems, and media for rewinding media content based on detected audio events |
US10073671B2 (en) * | 2014-01-20 | 2018-09-11 | Lenovo (Singapore) Pte. Ltd. | Detecting noise or object interruption in audio video viewing and altering presentation based thereon |
US10643616B1 (en) * | 2014-03-11 | 2020-05-05 | Nvoq Incorporated | Apparatus and methods for dynamically changing a speech resource based on recognized text |
US9516165B1 (en) * | 2014-03-26 | 2016-12-06 | West Corporation | IVR engagements and upfront background noise |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
EP3480811A1 (en) | 2014-05-30 | 2019-05-08 | Apple Inc. | Multi-command single utterance input method |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9888216B2 (en) * | 2015-09-22 | 2018-02-06 | SkyBell Technologies, Inc. | Doorbell communication systems and methods |
US10687029B2 (en) * | 2015-09-22 | 2020-06-16 | SkyBell Technologies, Inc. | Doorbell communication systems and methods |
US11184589B2 (en) * | 2014-06-23 | 2021-11-23 | Skybell Technologies Ip, Llc | Doorbell communication systems and methods |
US20170085843A1 (en) | 2015-09-22 | 2017-03-23 | SkyBell Technologies, Inc. | Doorbell communication systems and methods |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US10742938B2 (en) | 2015-03-07 | 2020-08-11 | Skybell Technologies Ip, Llc | Garage door communication systems and methods |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US11575537B2 (en) | 2015-03-27 | 2023-02-07 | Skybell Technologies Ip, Llc | Doorbell communication systems and methods |
US11381686B2 (en) | 2015-04-13 | 2022-07-05 | Skybell Technologies Ip, Llc | Power outlet cameras |
US11641452B2 (en) * | 2015-05-08 | 2023-05-02 | Skybell Technologies Ip, Llc | Doorbell communication systems and methods |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US20180047269A1 (en) | 2015-06-23 | 2018-02-15 | SkyBell Technologies, Inc. | Doorbell communities |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10706702B2 (en) | 2015-07-30 | 2020-07-07 | Skybell Technologies Ip, Llc | Doorbell package detection systems and methods |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) * | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
CN105657497B (zh) * | 2016-02-01 | 2019-08-13 | 华为技术有限公司 | 一种视频播放方法及设备 |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10764643B2 (en) * | 2016-06-15 | 2020-09-01 | Opentv, Inc. | Context driven content rewind |
WO2018034059A1 (ja) * | 2016-08-17 | 2018-02-22 | パナソニックIpマネジメント株式会社 | 音声入力装置、翻訳装置、音声入力方法、及び音声入力プログラム |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10390096B2 (en) * | 2016-09-16 | 2019-08-20 | DISH Technologies L.L.C. | Collecting media consumer data |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10542319B2 (en) * | 2016-11-09 | 2020-01-21 | Opentv, Inc. | End-of-show content display trigger |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
KR102496793B1 (ko) * | 2016-12-13 | 2023-02-06 | 현대자동차 주식회사 | 통합 원격 제어 시스템 및 이를 이용한 원격 제어 방법이 구현된 컴퓨터로 판독 가능한 기록매체 |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US11172262B2 (en) | 2017-03-24 | 2021-11-09 | Roku, Inc. | Enabling interactive control of live television broadcast streams |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US20180341372A1 (en) * | 2017-05-24 | 2018-11-29 | Iheartmedia Management Services, Inc. | Radio content replay |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US11489691B2 (en) | 2017-07-12 | 2022-11-01 | Universal Electronics Inc. | Apparatus, system and method for directing voice input in a controlling device |
US10930276B2 (en) | 2017-07-12 | 2021-02-23 | Universal Electronics Inc. | Apparatus, system and method for directing voice input in a controlling device |
US11134279B1 (en) * | 2017-07-27 | 2021-09-28 | Amazon Technologies, Inc. | Validation of media using fingerprinting |
CN110945473A (zh) * | 2017-07-31 | 2020-03-31 | 索尼公司 | 信息处理装置和信息处理方法 |
US10902847B2 (en) | 2017-09-12 | 2021-01-26 | Spotify Ab | System and method for assessing and correcting potential underserved content in natural language understanding applications |
US10909825B2 (en) | 2017-09-18 | 2021-02-02 | Skybell Technologies Ip, Llc | Outdoor security systems and methods |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
KR102490376B1 (ko) * | 2017-11-06 | 2023-01-25 | 삼성전자 주식회사 | 전자 장치 및 전자 장치 간 음성으로 기능을 실행하는 방법 |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
WO2019136065A1 (en) * | 2018-01-03 | 2019-07-11 | Universal Electronics Inc. | Apparatus, system and method for directing voice input in a controlling device |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US11076039B2 (en) | 2018-06-03 | 2021-07-27 | Apple Inc. | Accelerated task performance |
US11064264B2 (en) | 2018-09-20 | 2021-07-13 | International Business Machines Corporation | Intelligent rewind function when playing media content |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
JP2022545039A (ja) | 2019-08-24 | 2022-10-24 | スカイベル テクノロジーズ アイピー、エルエルシー | ドアベル通信システム及び方法 |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
US11223665B2 (en) * | 2019-09-25 | 2022-01-11 | Disney Enterprises, Inc. | Media content system for transferring a playback marker between network-connected playback devices |
US11043220B1 (en) | 2020-05-11 | 2021-06-22 | Apple Inc. | Digital assistant hardware abstraction |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
CN112791408B (zh) * | 2021-02-22 | 2022-10-04 | 上海莉莉丝科技股份有限公司 | 实时音频处理方法、系统、设备和介质 |
US20230217071A1 (en) * | 2021-12-31 | 2023-07-06 | The Nielsen Company (Us), Llc | Methods and apparatus for measuring engagement during media exposure |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030097659A1 (en) * | 2001-11-16 | 2003-05-22 | Goldman Phillip Y. | Interrupting the output of media content in response to an event |
US20070033607A1 (en) * | 2005-08-08 | 2007-02-08 | Bryan David A | Presence and proximity responsive program display |
US20130117248A1 (en) * | 2011-11-07 | 2013-05-09 | International Business Machines Corporation | Adaptive media file rewind |
Family Cites Families (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5371551A (en) * | 1992-10-29 | 1994-12-06 | Logan; James | Time delayed digital video system using concurrent recording and playback |
US6302320B1 (en) * | 1995-01-13 | 2001-10-16 | The Mead Corporation | Heavy duty article carrier |
US6034689A (en) | 1996-06-03 | 2000-03-07 | Webtv Networks, Inc. | Web browser allowing navigation between hypertext objects using remote control |
US6391995B2 (en) * | 2000-02-09 | 2002-05-21 | Reilly Industries, Inc. | Polymer compositions useful as dye complexing agents, and processes for preparing same |
US6678817B1 (en) * | 2000-02-22 | 2004-01-13 | Hewlett-Packard Development Company, L.P. | Method and apparatus for fetching instructions from the memory subsystem of a mixed architecture processor into a hardware emulation engine |
US7293279B1 (en) * | 2000-03-09 | 2007-11-06 | Sedna Patent Services, Llc | Advanced set top terminal having a program pause feature with voice-to-text conversion |
US6529586B1 (en) * | 2000-08-31 | 2003-03-04 | Oracle Cable, Inc. | System and method for gathering, personalized rendering, and secure telephonic transmission of audio data |
US6505703B2 (en) * | 2001-03-14 | 2003-01-14 | Visteon Global Technologies, Inc. | Vehicle steering system control |
JP4530587B2 (ja) * | 2001-07-30 | 2010-08-25 | 株式会社リコー | 放送受信装置 |
US20030041332A1 (en) * | 2001-08-21 | 2003-02-27 | Allen Paul G. | System and method for mitigating interruptions during television viewing |
US6530196B1 (en) * | 2001-11-30 | 2003-03-11 | Coastal Pet Products, Inc. | Snap connector |
US20030135290A1 (en) * | 2001-12-31 | 2003-07-17 | Yixin Yao | Vehicle road wheel fuzzy logic control system and method of implementing a fuzzy logic strategy for same |
US6761243B2 (en) * | 2001-12-31 | 2004-07-13 | Visteon Global Technologies, Inc. | Steering control with variable damper assistance and method implementing the same |
US6702707B2 (en) * | 2002-01-31 | 2004-03-09 | Visteon Global Technologies, Inc. | Differential assembly |
WO2003067594A1 (en) * | 2002-02-08 | 2003-08-14 | Ucentric Holdings, Inc. | Centralized digital video recording system with bookmarking and playback from multiple locations |
US6678595B2 (en) * | 2002-03-29 | 2004-01-13 | Visteon Global Technologies, Inc. | System and method of simulating a steering resistance torque on a vehicle steering wheel |
US6935656B2 (en) * | 2002-05-28 | 2005-08-30 | James Veril Stout | Combination hitch-mountable utility cart |
US8174436B2 (en) * | 2002-07-08 | 2012-05-08 | American Underwater Products, Inc. | Dive computer with global positioning system receiver |
US6795763B2 (en) * | 2002-10-30 | 2004-09-21 | Visteon Global Technologies, Inc. | Expert-type vehicle steering control system and method |
US7249437B2 (en) * | 2003-04-24 | 2007-07-31 | Soundstarts, Inc. | Method and apparatus for exterminating gophers and other burrowing pests |
US6946877B2 (en) * | 2003-12-12 | 2005-09-20 | Hewlett-Packard Development Company, L.P. | Circuit and associated methodology |
US20070189544A1 (en) * | 2005-01-15 | 2007-08-16 | Outland Research, Llc | Ambient sound responsive media player |
US8014542B2 (en) * | 2005-11-04 | 2011-09-06 | At&T Intellectual Property I, L.P. | System and method of providing audio content |
EP1801803B1 (en) * | 2005-12-21 | 2017-06-07 | Advanced Digital Broadcast S.A. | Audio/video device with replay function and method for handling replay function |
EP1843591A1 (en) | 2006-04-05 | 2007-10-10 | British Telecommunications Public Limited Company | Intelligent media content playing device with user attention detection, corresponding method and carrier medium |
DE102007061084A1 (de) * | 2007-12-19 | 2009-07-02 | Federal-Mogul Sealing Systems Gmbh | Metallische Flachdichtung und Herstellverfahren |
US9105298B2 (en) * | 2008-01-03 | 2015-08-11 | International Business Machines Corporation | Digital life recorder with selective playback of digital video |
US8244105B2 (en) * | 2008-03-20 | 2012-08-14 | Verna Ip Holdings, Llc | Talking replay |
US9055271B2 (en) * | 2008-03-20 | 2015-06-09 | Verna Ip Holdings, Llc | System and methods providing sports event related media to internet-enabled devices synchronized with a live broadcast of the sports event |
US7610202B1 (en) * | 2008-04-21 | 2009-10-27 | Nuance Communications, Inc. | Integrated system and method for mobile audio playback and dictation |
US20100077458A1 (en) * | 2008-09-25 | 2010-03-25 | Card Access, Inc. | Apparatus, System, and Method for Responsibility-Based Data Management |
US9639744B2 (en) * | 2009-01-30 | 2017-05-02 | Thomson Licensing | Method for controlling and requesting information from displaying multimedia |
US20110029326A1 (en) * | 2009-07-28 | 2011-02-03 | General Electric Company, A New York Corporation | Interactive healthcare media devices and systems |
KR101626621B1 (ko) * | 2009-12-30 | 2016-06-01 | 엘지전자 주식회사 | 원형 디스플레이부를 구비한 이동 통신 단말기의 데이터 제어 방법 및 이를 적용한 이동 통신 단말기 |
US20110161304A1 (en) * | 2009-12-30 | 2011-06-30 | Verizon North Inc. (SJ) | Deployment and compliance manager |
WO2011138628A1 (en) * | 2010-05-07 | 2011-11-10 | Thomson Licensing | Method and device for optimal playback positioning in digital content |
WO2011123626A2 (en) * | 2010-03-31 | 2011-10-06 | Federal-Mogul Corporation | Cylinder head compression sensor gasket assembly, method of construction thereof and method of servicing a pressure sensor assembly in a cylinder head compression sensor gasket assembly |
US20120060162A1 (en) * | 2010-08-31 | 2012-03-08 | Avanade Holdings, Llc | Systems and methods for providing a senior leader approval process |
US20120060116A1 (en) * | 2010-09-08 | 2012-03-08 | Microsoft Corporation | Content signaturing user interface |
US8832551B2 (en) * | 2012-05-10 | 2014-09-09 | Dassault Systemes Americas Corp. | Video-based undo and redo operations |
US20140108010A1 (en) * | 2012-10-11 | 2014-04-17 | Intermec Ip Corp. | Voice-enabled documents for facilitating operational procedures |
US9477376B1 (en) * | 2012-12-19 | 2016-10-25 | Google Inc. | Prioritizing content based on user frequency |
US20140226953A1 (en) * | 2013-02-14 | 2014-08-14 | Rply, Inc. | Facilitating user input during playback of content |
US20140255003A1 (en) * | 2013-03-05 | 2014-09-11 | Google Inc. | Surfacing information about items mentioned or presented in a film in association with viewing the film |
US10285624B2 (en) * | 2013-03-12 | 2019-05-14 | University Of Washington | Systems, devices, and methods for estimating bilirubin levels |
WO2015039005A2 (en) * | 2013-09-13 | 2015-03-19 | Federal-Mogul Corporation | Hot gasket with stainless steel |
US9215510B2 (en) * | 2013-12-06 | 2015-12-15 | Rovi Guides, Inc. | Systems and methods for automatically tagging a media asset based on verbal input and playback adjustments |
US9274673B2 (en) * | 2013-12-31 | 2016-03-01 | Google Inc. | Methods, systems, and media for rewinding media content based on detected audio events |
US9098754B1 (en) * | 2014-04-25 | 2015-08-04 | Google Inc. | Methods and systems for object detection using laser point clouds |
US20160007570A1 (en) * | 2014-07-09 | 2016-01-14 | Coastal Pet Products, Inc. | Pet harness with unique leash connector |
US20160136944A1 (en) * | 2014-11-18 | 2016-05-19 | Collar Central, Llc | Method and apparatus for imprinting collars |
US9836895B1 (en) * | 2015-06-19 | 2017-12-05 | Waymo Llc | Simulating virtual objects |
US10038348B2 (en) * | 2015-08-12 | 2018-07-31 | Regal Beloit America, Inc. | Liner, stator assembly and associated method |
US10635070B2 (en) * | 2017-02-24 | 2020-04-28 | Regal Beloit America, Inc. | Systems and methods for programming a motor |
US10284130B2 (en) * | 2017-03-13 | 2019-05-07 | Regal Beloit America, Inc. | PSC motor having multiple speed and voltage configurations |
US11278813B2 (en) * | 2017-12-22 | 2022-03-22 | Activision Publishing, Inc. | Systems and methods for enabling audience participation in bonus game play sessions |
US10868460B2 (en) * | 2018-03-06 | 2020-12-15 | Regal Beloit America, Inc. | PSC motor having multiple pole configurations for use in at least two different air moving devices |
US10713148B2 (en) * | 2018-08-07 | 2020-07-14 | Waymo Llc | Using divergence to conduct log-based simulations |
US10795804B1 (en) * | 2018-08-21 | 2020-10-06 | Waymo Llc | Collision evaluation for log-based simulations |
US11126763B1 (en) * | 2018-08-22 | 2021-09-21 | Waymo Llc | Realism metric for testing software for controlling autonomous vehicles |
-
2013
- 2013-12-31 US US14/145,057 patent/US9274673B2/en active Active
-
2014
- 2014-12-23 WO PCT/US2014/072265 patent/WO2015103056A1/en active Application Filing
- 2014-12-23 CN CN201910707388.1A patent/CN110519539B/zh active Active
- 2014-12-23 EP EP14833431.1A patent/EP3090537A1/en not_active Withdrawn
- 2014-12-23 CN CN201480071616.6A patent/CN105874809B/zh active Active
-
2016
- 2016-01-25 US US15/005,439 patent/US10073674B2/en active Active
-
2018
- 2018-08-27 US US16/113,266 patent/US10649728B2/en active Active
-
2020
- 2020-05-11 US US16/871,306 patent/US11175887B2/en active Active
-
2021
- 2021-11-15 US US17/526,336 patent/US11531521B2/en active Active
-
2022
- 2022-12-16 US US18/082,817 patent/US20230127384A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030097659A1 (en) * | 2001-11-16 | 2003-05-22 | Goldman Phillip Y. | Interrupting the output of media content in response to an event |
US20070033607A1 (en) * | 2005-08-08 | 2007-02-08 | Bryan David A | Presence and proximity responsive program display |
US20130117248A1 (en) * | 2011-11-07 | 2013-05-09 | International Business Machines Corporation | Adaptive media file rewind |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107785037A (zh) * | 2016-08-24 | 2018-03-09 | 谷歌有限责任公司 | 使用音频时间码同步媒体内容的方法、系统和介质 |
CN107785037B (zh) * | 2016-08-24 | 2021-03-23 | 谷歌有限责任公司 | 使用音频时间码同步媒体内容的方法、系统和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN105874809B (zh) | 2019-08-16 |
US10649728B2 (en) | 2020-05-12 |
US20180364978A1 (en) | 2018-12-20 |
US20160154625A1 (en) | 2016-06-02 |
US11175887B2 (en) | 2021-11-16 |
US20200272415A1 (en) | 2020-08-27 |
WO2015103056A1 (en) | 2015-07-09 |
US20230127384A1 (en) | 2023-04-27 |
US9274673B2 (en) | 2016-03-01 |
US10073674B2 (en) | 2018-09-11 |
EP3090537A1 (en) | 2016-11-09 |
CN110519539A (zh) | 2019-11-29 |
US20150185964A1 (en) | 2015-07-02 |
CN110519539B (zh) | 2022-04-12 |
US11531521B2 (en) | 2022-12-20 |
US20220075594A1 (en) | 2022-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105874809A (zh) | 用于基于所检测的音频事件倒回媒体内容的方法、系统和介质 | |
KR102325697B1 (ko) | 정보 처리 장치, 정보 처리 방법 및 프로그램 | |
KR101726945B1 (ko) | 수동 시작/종료 포인팅 및 트리거 구문들에 대한 필요성의 저감 | |
CN106464939A (zh) | 播放音效的方法及装置 | |
CN107515925A (zh) | 音乐播放方法及装置 | |
CN107396177A (zh) | 视频播放方法、装置及存储介质 | |
CN106375782A (zh) | 视频播放方法及装置 | |
CN109032345B (zh) | 设备控制方法、装置、设备、服务端和存储介质 | |
CN109257498B (zh) | 一种声音处理方法及移动终端 | |
KR20140081636A (ko) | 콘텐트 재생 방법 및 이를 위한 단말 | |
CN104112459B (zh) | 播放音频数据的方法和装置 | |
US20180054688A1 (en) | Personal Audio Lifestyle Analytics and Behavior Modification Feedback | |
CN109151565A (zh) | 播放语音的方法、装置、电子设备及存储介质 | |
CN109830248A (zh) | 一种音频录制方法及终端设备 | |
CN106128440A (zh) | 一种歌词显示处理方法、装置、终端设备及系统 | |
CN106598432A (zh) | 多媒体播放的方法和装置 | |
CN109828741A (zh) | 用于播放音频的方法和装置 | |
CN108763475B (zh) | 一种录制方法、录制装置及终端设备 | |
CN104182039A (zh) | 设备控制方法、装置及电子设备 | |
CN107454359B (zh) | 播放视频的方法及装置 | |
CN110019936A (zh) | 一种媒体文件播放过程中的注释方法和装置 | |
US20190156259A1 (en) | Methods, systems, and media for creating an atmosphere suited to a social event | |
CN107832377A (zh) | 图像信息显示方法、装置及系统、存储介质 | |
CN106534965A (zh) | 获取视频信息的方法及装置 | |
CN109902606B (zh) | 一种操作方法及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: American California Applicant after: Google limited liability company Address before: American California Applicant before: Google Inc. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |