CN105874809A - 用于基于所检测的音频事件倒回媒体内容的方法、系统和介质 - Google Patents

用于基于所检测的音频事件倒回媒体内容的方法、系统和介质 Download PDF

Info

Publication number
CN105874809A
CN105874809A CN201480071616.6A CN201480071616A CN105874809A CN 105874809 A CN105874809 A CN 105874809A CN 201480071616 A CN201480071616 A CN 201480071616A CN 105874809 A CN105874809 A CN 105874809A
Authority
CN
China
Prior art keywords
media content
audio
voice data
audio event
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480071616.6A
Other languages
English (en)
Other versions
CN105874809B (zh
Inventor
詹姆士·斯托特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Priority to CN201910707388.1A priority Critical patent/CN110519539B/zh
Publication of CN105874809A publication Critical patent/CN105874809A/zh
Application granted granted Critical
Publication of CN105874809B publication Critical patent/CN105874809B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2387Stream processing in response to a playback request from an end-user, e.g. for trick-play
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/432Content retrieval operation from a local storage medium, e.g. hard-disk
    • H04N21/4325Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47202End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4882Data services, e.g. news ticker for displaying messages, e.g. warnings, reminders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection

Abstract

提供了用于基于所检测的音频事件倒回媒体内容的方法、系统和介质。在一些实施例中,提供了一种用于提供媒体引导的方法,所述方法包括:使得媒体内容被呈现;使用音频输入设备接收包括所述媒体内容在其中被呈现的环境之中的周边声音的音频数据;接收倒回媒体内容的用户命令;响应于接收倒回媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的呈现期间所发生的音频事件相对应;基于所述音频事件确定所述媒体内容中的播放位置;以及使得所述媒体内容从所确定的播放位置被呈现。

Description

用于基于所检测的音频事件倒回媒体内容的方法、系统和介质
相关申请的交叉引用
本申请要求于2013年12月31日提交的美国专利申请序列号14/145057的权益,其全部内容通过引用合并于此。
技术领域
所公开的主题涉及用于基于所检测的音频事件倒回媒体内容的方法、系统和介质。更具体地,所公开的主题涉及响应于接收用户请求而检测诸如在媒体内容的播放期间所发生的中断的音频事件,并且基于所检测的音频事件自动倒回媒体内容。
背景技术
当消费诸如电视节目的媒体内容时,用户可能会被诸如电话呼叫、门铃响、另一个用户对消费媒体内容的用户讲话以及其它中断的各种源所打扰。为了避免错过媒体内容的一部分,用户可能必须在被这样的中断所打扰之后立即手动暂停媒体内容的播放。替选地,用户可能必须将媒体内容手动倒回至中断发生之前的播放位置。例如,这会对用户造成不连续的体验,其中用户必须一次或多次倒回媒体内容以定位所期望的播放位置从而恢复媒体内容的播放。
因此,期望提供用于基于所检测的音频事件倒回媒体内容的新机制。
发明内容
提供了用于基于所检测的音频事件倒回媒体内容的方法、系统和介质。
根据所公开主题的一些实施例,提供了一种用于提供媒体引导的方法,所述方法包括:使用硬件处理器使得媒体内容被呈现;使用音频输入设备接收包括所述媒体内容在其中被呈现的环境之中的周边声音的音频数据;接收倒回媒体内容的用户命令;响应于接收倒回媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的呈现期间所发生的音频事件相对应;基于所述音频事件确定所述媒体内容中的播放位置;以及使得所述媒体内容从所确定的播放位置被呈现。
根据所公开主题的一些实施例,提供了一种用于提供媒体引导的系统,所述系统包括:音频输入设备;存储设备;和至少一个硬件处理器,其被配置为:使得媒体内容被呈现;将使用音频输入设备所接收的音频数据存储在所述存储设备中,其中所述音频数据包括所述媒体内容在其中被呈现的环境之中的周边声音;接收倒回媒体内容的用户命令;响应于接收与倒回媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的呈现期间所发生的音频事件相对应;基于所述音频事件确定所述媒体内容中的播放位置;以及使得所述媒体内容从所确定的播放位置被呈现。
根据所公开主题的一些实施例,提供了一种包含计算机可执行指令的非暂时性计算机可读介质,所述指令在被处理器执行时使得所述处理器执行一种用于呈现媒体文件的方法,所述方法包括:使得媒体内容被呈现;接收包括所述媒体内容在其中被呈现的环境之中的周边声音的音频数据;接收倒回媒体内容的用户命令;响应于接收与倒回媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的呈现期间所发生的音频事件相对应;基于所述音频事件确定所述媒体内容中的播放位置;以及使得所述媒体内容从所确定的播放位置被呈现。
根据所公开主题的一些实施例,提供了一种用于提供媒体引导的系统,所述系统包括:用于使得媒体内容被呈现的装置;用于接收包括所述媒体内容在其中被呈现的环境之中的周边声音的音频数据的装置;用于接收倒回媒体内容的用户命令的装置;用于响应于接收倒回媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的呈现期间所发生的音频事件相对应的装置;用于基于所述音频事件来确定所述媒体内容中的播放位置的装置;和用于使得所述媒体内容从所确定的播放位置被呈现的装置。
在一些实施例中,所述播放位置与所述媒体内容中在所述音频事件发生之前的时间位置相对应。
在一些实施例中,所述用于接收倒回媒体内容的用户命令的装置进一步包括用于从音频数据中识别与倒回所述媒体内容的请求相对应的语音输入的装置。
在一些实施例中,所述用于接收倒回媒体内容的用户命令的装置进一步包括用于检测已经从远程控制接收到所述用户命令的装置。
在一些实施例中,所述系统进一步包括:用于确定所述音频数据中的多个绝对周边噪声水平的装置;用于将所述多个绝对周边噪声水平中的每一个与预定阈值的值进行比较的装置;和用于基于所述比较来检测所述媒体内容的呈现期间的音频事件的装置。
在一些实施例中,所述系统进一步包括:用于从音频数据检测音频事件的类型的装置;和用于基于所述音频事件的类型确定播放位置的装置。
在一些实施例中,所述媒体内容包括音频部分,并且所述系统进一步包括:用于基于所述音频部分计算所述音频数据中的多个相对周边噪声水平的装置,和用于基于所述多个相对周边噪声水平检测所述媒体内容的呈现期间所发生的音频事件的装置。
附图说明
在结合以下附图进行考虑时,所公开主题的各种目标、特征和优势能够参考以下对所公开主题的详细描述而被更为全面地理解,其中同样的附图标记识别同样的元素。
图1是根据所公开主题的一些实施例的用于基于所检测到的音频事件倒回媒体内容的说明性过程的框图。
图2示出了根据所公开主题的一些实施例的用于基于所检测到的音频事件呈现媒体内容并倒回媒体内容的说明性显示屏幕的示例。
图3是根据所公开主题的一些实施例的适用于用来基于所检测到的音频事件倒回媒体内容的本文中所描述的机制的实施方式的说明性系统的框图。
图4示出了能够根据所公开主题的一些实施例使用的图3的媒体播放设备以及移动设备之一的详细示例。
具体实施方式
根据各个实施例,提供了用于基于所检测到的音频事件倒回媒体内容的机制(其可以包括方法、系统和/或介质)。
在一些实施例中,本文中所描述的机制能够对包括媒体内容呈现期间的音频事件的周边或背景声音的音频信号进行监测。例如,所述机制能够接收到包括所述媒体内容在其中呈现的环境(例如,起居室环境)中的周边声音的音频信号。在更为具体的示例中,麦克风能够位于所述环境中以在呈现媒体设备时接收包括周边声音的音频数据。所述机制随后能够将周边声音转换为音频信号(例如,使用麦克风或硬件处理器)。
应当注意的是,在使用音频输入设备接收音频信号或任意其它音频数据之前,这些机制能够向用户提供以对执行动作提供同意或授权的机会,诸如激活音频输入设备并传送音频数据。例如,一旦在诸如电视设备和媒体播放设备的计算设备上加载应用时,所述应用能够提示用户提供用于激活音频输入设备、传送音频数据、检测音频数据中的事件和/或基于所检测到的事件倒回媒体内容的授权。在更多特定示例中,响应于下载应用以及在媒体播放设备上加载所述应用,能够在执行这些动作之前利用请求(或要求)用户提供同意的消息来提示用户。除此之外或替选地,响应于安装所述应用,能够在执行这些检测和/或传送与这些检测有关的信息之前利用请求(或要求)用户提供同意的许可消息来提示用户。在用户同意对这样的数据的使用的情况下,来自音频输入设备的音频数据能够被接收并且一个或多个音频事件(例如,中断点)能够被检测。
在一些实施例中,所述机制能够接收将媒体内容倒回至所检测到的音频事件(例如,所检测到的中断)发生之前的播放位置的用户命令。例如,音频事件能够被检测并且能够响应于接收到用户通过音频输入设备所发出的语音命令(例如,来自用户的“倒回”的语音输入)而在所检测到的音频事件发生之前的播放位置处呈现媒体内容。在另一个示例中,音频事件能够被检测并且能够响应于用户选择了远程控制、移动电话、平板计算设备、可穿戴计算设备等上的倒回按钮而在所检测到的音频事件发生之前的播放位置处呈现媒体内容。音频事件(例如,在媒体内容呈现期间发生的中断)的检测能够由用户命令的接收来触发。
在一些实施例中,响应于接收到倒回媒体内容的用户命令,所述机制能够基于从音频输入设备所接收到的音频信号而检测在媒体内容呈现期间所发生的音频事件。例如,所述机制能够计算音频信号内的绝对周边音量水平。该机制随后能够通过确定绝对周边音量水平中的至少一个超过了预定阈值的值而检测在媒体内容呈现期间所发生的音频事件。作为另一个示例,所述机制能够计算音频信号内的一个或多个相对周边音量水平(例如,两个绝对周边音量水平之间的变化量、与多个绝对周边音量水平相对应的变化速率、绝对周边音量水平和平均周边音量水平之间的变化量,等等)。该机制随后能够通过确定相对周边音量水平中的至少一个超过了预定阈值的值而检测在媒体内容呈现期间所发生的音频事件。作为又另一个示例,所述机制能够通过识别音频信号内特定类型的周边声音(诸如人声、电话呼叫等)而检测在媒体内容呈现期间所发生的音频事件。
一旦检测到在媒体内容呈现期间所发生的音频事件,该机制能够使得从音频事件发生之前的特定播放位置呈现媒体内容。例如,响应于接收到倒回媒体内容的用户命令并且检测到音频事件,该机制能够自动将媒体内容倒回至所检测到的音频事件之前的特定秒数的位置。
替选地,在一些实施例中,能够在媒体内容呈现的期间执行音频事件(例如,在媒体内容呈现期间发生的中断)的检测,其中播放位置能够沿媒体内容的时间线被指定。响应于接收到倒回媒体内容的用户命令,(诸如语音命令“倒回,我被打扰了(Rewind–I wasinterrupted)”)该用户命令能够触发该机制以使得从所检测到的音频事件发生之前的播放位置呈现媒体内容。
本文中结合图1至4对用于基于所检测到的音频事件倒回媒体内容的这些和其它特征进行描述。
转向图1,示出了根据所公开主题的一些实施例的用于基于所检测到的音频事件倒回媒体内容的说明性过程100的流程图。
如所图示的,过程100能够通过在110处呈现媒体内容开始。所呈现的媒体内容可以是任意适当内容,诸如视频内容、音频内容、电视节目、电影、卡通、音乐、声效、音频书、流直播内容(例如,流广播秀、直播音乐会等),等等。例如,如图2中所示出的,硬件处理器能够使得媒体内容210在显示器200上被呈现。
在一些实施例中,能够使用任意适当的媒体播放设备来呈现媒体内容,诸如流媒体播放设备、媒体中心计算机、DVD录影机、蓝光播放器、数字视频录音机、电视设备、平板计算设备、膝上型计算机、台式机、移动电话、游戏机、CD播放器、MP3播放器、电子图书阅读器,或者任意其它适当媒体设备。
在120处,过程100能够接受音频信号,所述音频信号包括在该媒体内容在其中被呈现的环境中的周边声音。能够使用诸如麦克风或声度表的任意适当的音频输入设备来生成该音频信号。例如,麦克风能够位于在其中呈现媒体内容的环境之中以接收和/或录制该环境(例如,起居室环境)中的周边声音。在另一个示例中,该麦克风或其它音频输入设备能够与媒体播放设备和/或移动设备进行整合,诸如游戏机、移动电话、平板计算设备或电视设备的内建式麦克风。
应当注意的是,在使用音频输入设备接收音频信号或任何其它音频数据之前,过程100能够提供给用户提供对执行动作的同意或授权的机会,诸如激活音频输入设备并传送音频数据。例如,一旦在诸如电视设备和媒体播放设备的计算设备上加载应用时,该应用能够提示用户提供用于激活音频输入设备、传送音频数据、检测音频数据中的事件和/或基于所检测到的事件倒回媒体内容的授权。在更为特定的示例中,响应于下载应用以及在媒体播放设备或移动设备上加载该应用,能够在执行这些动作之前利用请求(或要求)用户提供同意的消息来提示用户。除此之外或替选地,响应于安装该应用,能够在执行这些检测和/或传送与这些检测有关的信息之前利用请求(或要求)提供同意的许可消息来提示用户。
在一些实施例中,过程100随后能够将该周边声音转换为音频信号(例如,使用音频输入设备或硬件处理器)。例如,媒体播放设备或连接至音频输入设备的任意其它适当设备能够将音频数据和/或音频信号临时存储在循环缓冲器(例如,在接收到新的音频数据或音频信号时将被重写的易失性存储器中被实现)中。在更为特定示例中,该循环缓冲器能够被用来临时存储与预定数量的音频数据(例如,三十秒、一分钟、十分钟、三十分钟等)相对应的音频数据,并且最旧的音频数据能够被新录制的音频数据持续重写。应当注意的是,在其中使用一个或多个扬声器呈现媒体内容的一些实施例中,该音频信号的分量能够与所呈现的媒体内容的音频部分相对应。
在一些实施例中,过程100能够以任意适当的方式来存储所接收到的音频信号。例如,过程100能够以临时的方式对音频信号的一部分进行存储。在更为具体的示例中,与给定时间间隔或给定频带相对应的音频信号的分段能够在一个时间段内(例如,几秒钟、几分钟或者任意其它适当时间段)被存储在缓冲器中。在一些实施例中,音频数据被存储在缓冲器中的时间段能够由用户所指定(例如,在启动应用时)。作为另一个示例,过程100能够提取音频信号的一个或多个特征(例如,通过计算音频信号的一个或多个峰值、振幅、功率水平、频率、信噪比和/或其它适当特征)并且将所提取的特征存储在适当存储设备中。
在一些实施例中,过程100能够生成一个或多个音频指纹,所述音频指纹能够表示音频信号或音频信号的一个或多个适当部分。该音频指纹可以是从所接收到的音频信号生成的数字表示,其中该音频指纹能够被用来识别音频信号中的相同或相似部分(例如,与媒体内容相对应的音频信号的部分,与在媒体内容呈现期间所发生的一个或多个中断相对应的音频信号的部分,等等)。在一些实施例中,该音频指纹能够使用任意适当的音频指纹算法来生成,所述音频指纹算法可以包括一种或多种适当的二维变换(例如,离散余弦变换)、三维变换(例如,小波变换)、散列函数等。该音频指纹随后能够被存储在适当存储设备中。
在130处,过程100能够确定是否已经接收到倒回媒体内容的用户命令。在一些实施例中,倒回媒体文件的用户命令能够与一个或多个用户输入相对应。例如,该用户命令能够与指示用户想要倒回媒体内容的语音命令相对应。在更为具体的示例中,语音命令“倒回”能够由消费媒体内容的用户来提供并且其能够由被连接至媒体播放设备和/或移动设备的麦克风所检测到。作为另一个示例,硬件处理器能够响应于用户使用移动设备选择了倒回按钮而确定已经接收到倒回媒体内容的用户命令,所述移动设备诸如远程控制、移动电话、平板计算机等。应当注意的是,在一些实施例中,倒回媒体内容的用户命令能够以任意适当的形式进行传送,诸如一个或多个红外信号、高清多媒体接口(HDMI)通信信道协议(CEC)命令、WiFi信号、和/或其它适当控制信号。
在一些实施例中,响应于确定还没有接收到倒回媒体内容的用户命令,过程100能够返回至步骤120。
在140处,响应于确定已经接收到倒回媒体内容的用户命令,过程100能够基于音频信号或音频数据而生成周边噪声信号。例如,在其中使用一个或多个扬声器呈现媒体内容的一些实施例中,过程100能够通过从在120处所接收的音频信号中减去或去除表示所呈现的媒体内容的音频部分而生成周边噪声信号。在更为具体的示例中,能够由监测媒体播放设备所呈现的媒体内容的麦克风生成表示媒体内容的音频信号。在一些实施例中,能够使用两个麦克风来分别监测环境中的周边声音以及媒体播放设备所呈现的媒体内容。除此之外或替选地,能够基于包含媒体内容的媒体文件而生成表示与所呈现的媒体内容相对应的音频数据的音频部分。
在一些实施例中,在确定并未使用一个或多个扬声器呈现媒体内容时,过程100能够使用在120处所接收的音频信号作为周边噪声信号。
除此之外或替选地,过程100能够使用一种或多种适当的信号处理算法对音频信号和/或周边噪声信号进行处理以生成周边噪声信号。在更为具体的示例中,过程100能够使用适当的模数转换器来将模拟音频信号转换为数字音频信号。在另一个更为具体的示例中,过程100能够将音频信号或周边噪声信号转换为频域信号(例如,通过执行快速傅里叶变换等)。在又另一个更为特定的示例中,过程100能够对音频信号和/或周边噪声信号应用低通滤波器、带通滤波器等中的一个或多个。
接下来,在150处,过程100能够基于该周边噪声信号来检测在媒体内容呈现期间所发生的音频事件。能够在媒体内容呈现期间发生的音频事件的说明性示例可以包括电话响铃、大于阈值的值的噪声、音乐、人声,或者能够对媒体内容的播放造成干扰的任意其它适当中断。
在一些实施例中,过程100能够使用适当信号处理算法对周边噪声信号或周边噪声信号的一部分(例如,周边噪声信号中与特定时间段、特定频带等相对应的分段)进行处理。过程100随后能够基于经处理的周边噪声信号来检测音频事件。
例如,过程100能够基于周边噪声信号来计算一个或多个绝对周边噪声水平。过程100随后能够通过定位超过预定阈值的绝对周边噪声水平来检测音频事件的发生。在更为具体的示例中,过程100能够计算周边噪声信号的一个或多个适当特征,诸如峰值、振幅、功率水平等。过程100随后能够将该特征与预定阈值进行比较(例如,通过应用适当滤波器)并且基于该比较来检测音频事件的发生。
作为另一个示例,过程100能够计算一个或多个相对周边噪声水平并且基于该相对周边噪声水平检测音频事件的发生。更具体地,例如,过程100能够计算两个绝对周边噪声水平之间与不同时间相对应的变化数量(例如,以分贝为单位),与多个绝对周边噪声水平相对应的变化速率,等等。过程100随后能够通过定位超过预定阈值的相对周边噪声水平来检测音频事件的发生。
作为又另一个示例,过程100能够通过检测特定类型的周边噪声来定位媒体内容呈现期间音频事件的发生。在一些实施例中,该特定类型的周边噪声能够由用户和/或适当设置预先定义。在更为具体的示例中,过程100能够检测作为在媒体内容呈现期间所发生的音频事件的来电呼叫。在另一个更为具体的示例中,过程100能够使用适当的话音检测算法(例如,通过分析周边噪声信号中的一个或多个频率分量)来检测周边噪声信号中所包含的人的语音或话音的出现。应当注意的是,能够在并不识别话音内容的情况下检测到人的语音或话音的存在。
作为进一步的示例,过程100能够通过将与所接收到的音频信号相关联的音频指纹与多个音频指纹进行比较来定位媒体内容呈现期间音频事件的发生。在更为具体的示例中,过程100能够访问包含多个音频指纹的数据库或其它适当存储设备并且搜索表示与和所接收到的音频信号相关联的音频指纹相同或基本上相似的一个或多个音频事件(例如,中断点)的音频指纹。在另一个更为具体的示例中,能够将与所接收到的音频信号相关联的音频指纹与表示所呈现媒体内容的音频指纹的集合进行比较。
在一些实施例中,一旦识别出在媒体内容的呈现期间所发生的一个或多个音频事件和/或该类型的音频事件,能够基于所检测到的音频事件对该媒体内容进行标记。例如,所检测到的时间或音频事件能够与音频事件的描述、与该音频事件相对应的媒体内容中的时间位置和/或与所检测到的音频事件有关的其它适当信息相关联。接着能够基于相关联的信息对多个所检测到的音频事件进行索引和/或存储。
在如图2所示出的更为具体的示例中,当在媒体播放设备200上进行呈现媒体内容时,能够如以上所描述地在该媒体内容的呈现期间检测一个或多个音频事件。在一些实施例中,所检测到的音频事件能够包括在媒体内容的呈现期间的时间215处发生的第一事件(例如,电话响铃)以及在媒体内容的呈现期间的时间220处发生的第二事件(例如,讲话事件)。能够将该第一事件和第二事件分别与时间215和时间220相关联。除此之外或替选地,描述能够与第一事件和第二事件(如,电话呼叫、对话等)中的每一个相关联并且能够与其在媒体内容呈现期间的对应时间一起被存储在适当存储设备中。在这样的示例中,表示音频信号和/或周边音频信号的音频数据并非必然被存储以基于所检测到的事件倒回和/或表示媒体内容。
在一些实施例中,过程100可以包括将与所检测到的音频事件相对应的音频数据的部分传送至检测服务(例如,音频搜索引擎、音频检测服务等)。响应于接收到该音频数据部分,该检测服务能够确定对应的音频事件的类型,诸如电话响铃、人声讲话、狗吠、警报响铃等。例如,每种不同类型的音频事件能够具有相关联的播放位置(例如,检测到任意类型的电话响铃之前的30秒的播放位置,检测到任意类型的人声讲话之前的一分钟的播放位置,等等)。
在一些实施例中,一旦媒体内容的呈现期间检测到多个音频事件,能够向用户呈现一个或多个适当用户界面以向用户通知所检测到的事件。例如,硬件处理器能够在显示器200上提供指示,其向用户指示“已经检测到中断。您想要将视频倒回至该中断发生之前吗?现在说‘倒回’。”在另一个示例中,硬件处理器能够在显示器210上提供图标或指示符,其向用户指示有自动倒回至所检测到的音频事件发生之前的倒回选项可用。除此之外或替选地,用户可以被提示以选择与所期望的倒回点相对应的所检测到的事件(例如,通过发出与所检测到的事件相对应的语音命令)。
在160处,过程100能够基于所检测到的音频事件倒回媒体内容。在一些实施例中,过程200能够基于音频事件的发生而确定媒体内容中的播放位置。例如,过程100能够选定与所检测到的音频事件的开始相对应的特定时间的播放位置(例如,根据何时检测到电话响铃事件)。在另一个示例中,过程100能够自动选定作为所检测到的音频事件之前的特定时间段的播放位置(例如,所检测到的音频事件之前的五秒钟)。在另一个示例中,过程100能够确定用户所选定的指定播放位置的偏好。在更为特定的示例中,用户在设定客户端应用时能够被请求输入用于响应于所检测到的音频事件而指定播放位置的时间间隔(例如,始终为所检测到的音频事件之前的三十秒)。在又另一个示例中,过程100能够检测与所检测到的音频事件的发生相对应的时刻之前在媒体内容中的场景变换。过程100随后能够使得媒体内容根据所检测到的场景变换进行呈现。
在更为特定的示例中,播放位置能够被生成并且与所检测到的音频事件相关联。用户可以在当媒体内容的播放期间媒体播放设备上消费媒体内容,另一个用户可能开始与该用户讲话。在用户讲话时,被连接至该媒体播放设备的音频输入设备能够接收用户对话的音频并且检测事件(例如,音频事件)。执行应用的媒体播放设备能够确定该音频事件是讲话音频事件并且生成与媒体内容呈现期间检测到该事件的时间相关联的播放位置(例如,在媒体内容的55秒标记处所检测到的讲话音频事件之前的五秒钟)。在一些实施例中,在生成这些播放位置之后,被用来检测音频事件并且生成播放位置的音频数据能够被断开连接。例如,在播放位置已经被生成之后,其就不再与音频数据(例如,用户所讲出的单词或短语)相关联,而是仅与一个或多个所检测到的音频事件相关联。这能够允许在不存在用户之间的对话或其它音频数据被录制的风险的情况下确定倒回点。这能够缓解用户可能关心的录制他们对话的设备的隐私性问题。
过程100随后能够将媒体内容倒回至该播放位置并且使得该媒体内容从该播放位置被呈现给用户。
应当注意的是,图1的流程图中的上述步骤能够以任意顺序或次序来执行或实践而并不局限于图中所示出并描述的顺序和次序。而且,该图1的流程图中的上述步骤中的一些在能够在适当情况下基本上同时执行或实践或者并行执行或实施以减少延时和处理时间。此外,应当注意的是,图1仅是作为示例而被提供的。这些附图中所示出的步骤中的至少一些可以以与所表示不同的顺序来执行、同时执行或者共同被省略。
例如,在一些实施例中,过程100能够基于音频信号或音频数据生成周边噪声信号,并且能够检测接收到诸如语音命令的用户命令之前的音频事件。在一些实施例中,音频数据能够被持续保存在循环缓冲器或任意其它适当存储设备中,并且存储在该循环缓冲器中的基于该音频数据的周边噪声信号能够被生成并被分析以确定是否出现了音频事件。响应于接收到诸如倒回语音命令的用户命令,过程100能够将媒体内容的呈现倒回至所检测到的音频事件之前的播放位置。此外,响应于接收到倒回媒体内容的后续用户意见,过程100能够将媒体内容的呈现倒回至之前所检测到的音频事件之前的播放位置。
转向图3,示出了根据所公开主题的一些实施例的用于基于所检测到的事件倒回媒体内容的系统的示例300。如所图示的,系统300可以包括显示设备302、媒体播放设备304、一个或多个音频输入设备306、一个或多个移动设备308、通信网络310,以及通信链路312、314、316、318、320和322。
在一些实施例中,如图1中所图示的过程100中的一个或多个部分或者其全部能够由显示设备302、媒体播放设备304、音频输入设备306和移动设备308中的一个或多个来实现。例如,媒体播放设备304和/或移动设备308中的一个或多个可以基于音频输入设备302所生成的音频数据来检测媒体内容呈现期间的一个或多个音频事件,并且基于所检测到的音频事件来计算一个或多个倒回点。替选地或除此之外,音频数据或音频数据的适当部分能够被传送至适当的服务用于分析。在更为特定的示例中,音频数据能够被传送至搜索系统,所述搜索系统访问匹配的服务(例如,音频指纹匹配服务)。该搜索系统接着能够生成该音频数据的一个或多个适当音频指纹和/或搜索与所生成的音频指纹相匹配的所存储的参照音频指纹。
显示设备302可以是能够接收、转换、处理和/或呈现媒体内容的任意适当设备,诸如流媒体播放设备、媒体中心计算机、CRT显示器、LCD、LED显示器、等离子显示器、触摸屏显示器、模拟触摸屏、电视设备、移动电话等。在一些实施例中,显示设备302能够为用户呈现三维内容。
媒体播放设备304可以是能够呈现媒体内容、接收并处理指示用于倒回媒体内容的请求的控制信号,和/或执行任意其它适当功能的任意适当设备。流媒体设备的示例包括流媒体播放设备、媒体中心计算机、DVD录影机、蓝光播放器、数字视频录影机、电视设备、平板计算设备、膝上型计算机、台式机、移动电话、游戏机、CD播放器、MP3播放器、电子书阅读器、机顶盒等。在一些实施例中,媒体内容可以包括任意适当内容,诸如音频内容、视频内容、多媒体内容等。在一些实施例中,媒体内容可以具有任意适当格式,诸如MP3、WMA、WMV、OCD、MPEG-DST、AVI、MOV等。
移动设备308可以是能够接收和/或处理用户输入、基于所接收到的用户输入生成并传送控制信号,和/或执行任意其它适当功能的任意适当设备。例如,移动设备308可以包括远程控制、移动电话、平板计算机、膝上型计算机、台式计算机、个人数字助理(PDA)、便携式电子邮件设备、语音识别系统、手势识别系统、键盘、鼠标、麦克风等。在一些实施例中,移动设备208能够接收指示用户想要倒回媒体内容的适当用户输入。例如,用户输入能够包括用户使用麦克风所发出的一个或多个语音命令。作为另一个示例,用户输入能够包括用户使用移动设备选择倒回按钮(例如,通过按压和/或释放远程控制的一个或多个按钮,选择在移动设备308或显示设备302上所显示的用户界面上的一个或多个适当按钮)。
虽然图3中示出了三个移动设备308以避免使得图示过于复杂,但是在一些实施例中能够使用任意适当数量的这些设备以及任意适当类型的这些设备。
音频输入设备306可以是能够从用户接收声音输入,收集与周边噪声有关的音频数据,生成音频信号,处理音频信号和/或执行其它适当功能的任意适当设备。音频输入设备的示例可以包括麦克风、声度表等。在一些实施例中,音频输入设备310能够与移动设备308、显示设备302、媒体播放设备304等进行整合或与之连接。在一些实施例中,音频输入设备306能够包括外部麦克风(例如,诸如有线或无线耳机的配件中的麦克风)。
在一些实施例中,显示设备302、媒体播放设备304和移动设备308中的每一个可以是任意的通用设备,诸如计算机,或者是诸如客户端、服务器等的专用设备。这些通用或专用设备中的任意都可以包括任意适当的组件,诸如硬件处理器(其可以是麦克风、数字信号处理器、控制器等)、存储器、通信接口、显示控制器、输入设备、存储设备(其可以包括硬盘、数字视频录影机、固态存储设备、可移除存储设备或者任意其它适当存储设备),等等。
在一些实施例中,媒体播放设备304能够分别通过通信链路312和314被连接至显示设备302和音频输入设备306。在一些实施例中,显示设备302、媒体播放设备304、音频输入设备306和移动设备308中的每一个都能够分别通过通信链路316、318、320和322被连接至通信网络310。通信链路312、314、316、318、320和322可以是任意适当的通信链路,诸如网络链路、拨号链路、无线链路、硬线链路、任意其它适当通信链路,或者这样的链路的组合。在一些实施例中,通信链路312、314、316、318、320和322中的每一个可以包括一个或多个红外(IR)通信链路、高清多媒体接口(HDMI)链路、局域网(LAN)链路等。
通信网络310可以是任意适当计算机网络,包括互联网、内联网、广域网(“WAN”)、局域网(“LAN”)、无线网络、数字订户线路(“DSL”)网络、帧中继网络、异步传输模式(“ATM”)网络、虚拟私人网络(“VPN”)、有线电视网络、光纤网络、电话网络、卫星网络,或者任意这样的网络的任意组合。
在一些实施例中,显示设备302、媒体播放设备304、音频输入设备306和移动设备308中的每一个能够被实现为独立设备或者与系统300的其它组件进行整合。
例如,在计算设备上执行的倒回应用能够包括第二屏幕应用或者能够与已经在移动设备(例如,移动电话、平板计算设备、可穿戴计算设备等)上安装的第二屏幕应用进行通信。例如,第二屏幕应用能够允许向移动设备或其它第二屏幕应用的用户呈现被传送至媒体播放设备的内容,上述媒体播放设备诸如电视设备、机顶盒、游戏机等。在一些实施例中,倒回应用能够使用第二屏幕应用以基于所检测到的事件倒回媒体内容。在一些实施例中,该第二屏幕应用能够被用来激活第二屏幕设备上的音频输入设备并且该音频输入设备所检测到的音频数据能够由第二屏幕设备和/或媒体播放设备进行处理。
媒体播放设备以及图3中所描绘的移动设备之一在图4中进行了更为详细的图示。参考图4,移动设备308可以包括可以被互连的硬件处理器402、显示器404、输入设备406和存储器408。在一些实施例中,存储器408可以包括用于存储计算机程序以便控制硬件处理器402、音频数据、用户输入和/或其它适当信息的存储设备(诸如非暂时性计算机可读介质)。
处理器402使用计算机程序在显示器404上呈现媒体内容、用户界面、通过通信链路308所接收的数据,以及移动设备308的用户所传送的命令和数值。还应当注意的是,通过通信链路322或任意其它通信链路所接收的数据可以从任意适当的源被接收。在一些实施例中,例如,硬件处理器402能够使用传送器、接收器、传送器/接收器、收发器或者任意其它适当通信设备来通过通信链路322或者任意其它通信链路发送和接收数据。输入设备406可以是计算机键盘、鼠标、小键盘、光标控制器、手势系统、远程控制,或者输入系统或处理控制系统的设计人员将会使用的任意其它适当输入设备。替选地,输入设备406可以是显示器404的手指敏感或输入笔敏感的触摸屏输入。为了接收以上所描述的语音命令,输入设备406可以是麦克风。
媒体播放设备304可以包括能够互连的处理器420、显示器422、输入设备424和存储器426。在优选实施例中,存储器426包含用于存储通过通信链路318或通过其它链路所接收的数据,并且还接收由一个或多个用户所传送的命令和数值。该存储设备进一步包含用于控制处理器320的服务器程序。
在一些实施例中,应用可以包括应用程序接口(未示出),或者替选地,该应用可以驻留于移动设备208或媒体播放设备304的存储器中。在另一个适当实施例中,例如,到移动设备308的唯一分发可以是图形用户界面(GUI),其允许用户与驻留于媒体播放设备304处的应用进行交互。
在一些实施例中,能够使用任意适当的计算机可读介质用来存储用于执行本文中所描述的过程的指令。例如,在一些实施例中,计算机可读介质可以是暂时性的或非暂时性的。例如,非暂时性的计算机可读介质可以包括诸如磁性介质(诸如,硬盘、软盘等)、光学介质(诸如紧致盘、数字视频盘、蓝光盘等)、半导体介质(诸如闪速存储器、电可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)等)的介质,在传输期间不是短暂的或者缺乏任何永久的外观的任意适当介质,和/或任意适当有形介质。作为另一个示例,暂时性计算机可读介质可以包括网络上、线路、导体、光纤、电路、在传输期间是短暂的且缺乏任何永久的外貌的任意适当介质中的信号,和/或任意适当非有形介质。
应当注意的是,在本文中所描述的其中应用(或本文中所描述的其它机制)收集关于特定用户的个人信息的实施方式中,可向该用户提供控制是否收集与特定用户有关的信息和/或如何由应用使用所收集到的用户信息的机会。与用户有关的信息的示例可以包括用户的兴趣、用户的位置、用户所讲出的姓名等。此外,某些与用户有关的信息可在其被存储之前被本地存储(例如,不被共享)、加密和/或以一种或多种方式进行处理以去除个人可识别信息。例如,用户的身份可被处理,使得无法针对用户确定个人可识别信息。作为另一个示例,在获得位置信息(诸如城市、邮政编码或州级)的情况下能够对用户的地理位置进行泛化,而使得无法确定用户的特定位置。使用本文中所描述的这些和其它技术,用户能够对与用户有关的哪些信息被收集和/或该信息如何被主题确定应用(或其它机制)所使用加以控制。
因此,提供了用于基于所检测到的音频事件倒回媒体内容的方法、系统和介质。
本文中所描述的示例(以及以如“诸如”、“例如”、“包括”等的短语所给出的条款)的提供并不应当被解释为将所要求保护主题局限于具体事例;相反,该示例旨在仅对许多可能方面中的一些加以说明。
虽然所公开的主题已经在之前的说明性实施例中进行了描述和图示,但是应当理解的是,本公开仅是以示例的形式而作出,并且能够对所公开主题的实施方式的细节进行许多改变而并不背离所公开主题的精神和范围,其仅由随后的权利要求所限定。所公开实施例的特征能够以各种方式进行组合和重新排列。

Claims (21)

1.一种用于提供媒体引导的方法,所述方法包括:
使用硬件处理器使得媒体内容被呈现;
使用音频输入设备接收音频数据,所述音频数据包括所述媒体内容在其中被呈现的环境中的周边声音;
接收倒回所述媒体内容的用户命令;
响应于接收倒回所述媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的所述呈现期间所发生的音频事件相对应;
基于所述音频事件来确定所述媒体内容中的播放位置;以及
使得所述媒体内容从所确定的播放位置被呈现。
2.根据权利要求1所述的方法,其中,所述播放位置与所述媒体内容中在所述音频事件的发生之前的时间位置相对应。
3.根据权利要求1所述的方法,其中,接收倒回所述媒体内容的用户命令进一步包括从所述音频数据中识别与倒回所述媒体内容的请求相对应的语音输入。
4.根据权利要求1所述的方法,其中,接收倒回所述媒体内容的用户命令进一步包括检测已经从远程控制接收到所述用户命令。
5.根据权利要求1所述的方法,进一步包括:
确定所述音频数据中的多个绝对周边噪声水平;
将所述多个绝对周边噪声水平中的每一个与预定阈值的值进行比较;以及
基于所述比较来检测所述媒体内容的所述呈现期间的音频事件。
6.根据权利要求1所述的方法,进一步包括:
从所述音频数据检测音频事件的类型;以及
基于所述音频事件的类型来确定所述播放位置。
7.根据权利要求1所述的方法,其中,所述媒体内容包括音频部分,并且其中,所述方法进一步包括:
基于所述音频部分来计算所述音频数据中的多个相对周边噪声水平;以及
基于所述多个相对周边噪声水平来检测所述媒体内容的所述呈现期间的所述音频事件。
8.一种用于提供媒体引导的系统,所述系统包括:
音频输入设备;
存储设备;和
至少一个硬件处理器,所述至少一个硬件处理器被配置为:
使得媒体内容被呈现;
将使用所述音频输入设备接收的音频数据存储在所述存储设备中,其中所述音频数据包括所述媒体内容在其中被呈现的环境中的周边声音;
接收倒回所述媒体内容的用户命令;
响应于接收倒回所述媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的所述呈现期间所发生的音频事件相对应;
基于所述音频事件来确定所述媒体内容中的播放位置;以及使得所述媒体内容从所确定的播放位置被呈现。
9.根据权利要求8所述的系统,其中,所述播放位置与所述媒体内容中在所述音频事件发生之前的时间位置相对应。
10.根据权利要求8所述的系统,其中,所述硬件处理器进一步被配置为从所述音频数据中识别与倒回所述媒体内容的请求相对应的语音输入。
11.根据权利要求8所述的系统,其中,所述硬件处理器进一步被配置为检测已经从远程控制接收到所述用户命令。
12.根据权利要求8所述的系统,其中,所述硬件处理器进一步被配置为:
确定所述音频数据中的多个绝对周边噪声水平;
将所述多个绝对周边噪声水平中的每一个与预定阈值的值进行比较;以及
基于所述比较来检测所述媒体内容的所述呈现期间的音频事件。
13.根据权利要求8所述的系统,其中,所述硬件处理器进一步被配置为:
从所述音频数据检测音频事件的类型;以及
基于所述音频事件的类型来确定所述播放位置。
14.根据权利要求8所述的系统,其中,所述媒体内容包括音频部分,并且其中,所述硬件处理器进一步被配置为:
基于所述音频部分来计算所述音频数据中的多个相对周边噪声水平;以及
基于所述多个相对周边噪声水平来检测所述媒体内容的所述呈现期间的所述音频事件。
15.一种包含计算机可执行指令的非暂时性计算机可读介质,所述指令在被处理器执行时使得所述处理器执行一种用于呈现媒体文件的方法,所述方法包括:
使得媒体内容被呈现;
接收音频数据,所述音频数据包括所述媒体内容在其中被呈现的环境中的周边声音;
接收倒回所述媒体内容的用户命令;
响应于接收倒回所述媒体内容的用户命令而检测所述音频数据的一部分与在所述媒体内容的所述呈现期间所发生的音频事件相对应;
基于所述音频事件来确定所述媒体内容中的播放位置;以及
使得所述媒体内容从所确定的播放位置被呈现。
16.根据权利要求15所述的非暂时性计算机可读介质,其中,所述播放位置与所述媒体内容中在所述音频事件发生之前的时间位置相对应。
17.根据权利要求15所述的非暂时性计算机可读介质,其中,所述方法进一步包括从所述音频数据中识别与倒回所述媒体内容的请求相对应的语音输入。
18.根据权利要求15所述的非暂时性计算机可读介质,其中,所述方法进一步包括检测已经从远程控制接收到所述用户命令。
19.根据权利要求15所述的非暂时性计算机可读介质,其中,所述方法进一步包括:
确定所述音频数据中的多个绝对周边噪声水平;
将所述多个绝对周边噪声水平中的每一个与预定阈值的值进行比较;以及
基于所述比较来检测所述媒体内容的所述呈现期间的音频事件。
20.根据权利要求15所述的非暂时性计算机可读介质,其中,所述方法进一步包括:
从所述音频数据检测音频事件的类型;以及
基于所述音频事件的类型来确定所述播放位置。
21.根据权利要求15所述的非暂时性计算机可读介质,其中,所述媒体内容包括音频部分,并且其中,所述方法进一步包括:
基于所述音频部分来计算所述音频数据中的多个相对周边噪声水平;以及
基于所述多个相对周边噪声水平来检测所述媒体内容的所述呈现期间的所述音频事件。
CN201480071616.6A 2013-12-31 2014-12-23 用于基于所检测的音频事件倒回媒体内容的方法、系统和介质 Active CN105874809B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910707388.1A CN110519539B (zh) 2013-12-31 2014-12-23 用于基于所检测的音频事件倒回媒体内容的方法、系统和介质

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/145,057 US9274673B2 (en) 2013-12-31 2013-12-31 Methods, systems, and media for rewinding media content based on detected audio events
US14/145,057 2013-12-31
PCT/US2014/072265 WO2015103056A1 (en) 2013-12-31 2014-12-23 Methods, systems, and media for rewinding media content based on detected audio events

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201910707388.1A Division CN110519539B (zh) 2013-12-31 2014-12-23 用于基于所检测的音频事件倒回媒体内容的方法、系统和介质

Publications (2)

Publication Number Publication Date
CN105874809A true CN105874809A (zh) 2016-08-17
CN105874809B CN105874809B (zh) 2019-08-16

Family

ID=52440817

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910707388.1A Active CN110519539B (zh) 2013-12-31 2014-12-23 用于基于所检测的音频事件倒回媒体内容的方法、系统和介质
CN201480071616.6A Active CN105874809B (zh) 2013-12-31 2014-12-23 用于基于所检测的音频事件倒回媒体内容的方法、系统和介质

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201910707388.1A Active CN110519539B (zh) 2013-12-31 2014-12-23 用于基于所检测的音频事件倒回媒体内容的方法、系统和介质

Country Status (4)

Country Link
US (6) US9274673B2 (zh)
EP (1) EP3090537A1 (zh)
CN (2) CN110519539B (zh)
WO (1) WO2015103056A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107785037A (zh) * 2016-08-24 2018-03-09 谷歌有限责任公司 使用音频时间码同步媒体内容的方法、系统和介质

Families Citing this family (161)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US10199051B2 (en) 2013-02-07 2019-02-05 Apple Inc. Voice trigger for a digital assistant
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
US20170263067A1 (en) 2014-08-27 2017-09-14 SkyBell Technologies, Inc. Smart lock systems and methods
US11909549B2 (en) 2013-07-26 2024-02-20 Skybell Technologies Ip, Llc Doorbell communication systems and methods
US11651665B2 (en) 2013-07-26 2023-05-16 Skybell Technologies Ip, Llc Doorbell communities
US11764990B2 (en) 2013-07-26 2023-09-19 Skybell Technologies Ip, Llc Doorbell communications systems and methods
US10440165B2 (en) 2013-07-26 2019-10-08 SkyBell Technologies, Inc. Doorbell communication and electrical systems
US20180343141A1 (en) 2015-09-22 2018-11-29 SkyBell Technologies, Inc. Doorbell communication systems and methods
US11889009B2 (en) 2013-07-26 2024-01-30 Skybell Technologies Ip, Llc Doorbell communication and electrical systems
US10672238B2 (en) 2015-06-23 2020-06-02 SkyBell Technologies, Inc. Doorbell communities
US10708404B2 (en) 2014-09-01 2020-07-07 Skybell Technologies Ip, Llc Doorbell communication and electrical systems
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9274673B2 (en) * 2013-12-31 2016-03-01 Google Inc. Methods, systems, and media for rewinding media content based on detected audio events
US10073671B2 (en) * 2014-01-20 2018-09-11 Lenovo (Singapore) Pte. Ltd. Detecting noise or object interruption in audio video viewing and altering presentation based thereon
US10643616B1 (en) * 2014-03-11 2020-05-05 Nvoq Incorporated Apparatus and methods for dynamically changing a speech resource based on recognized text
US9516165B1 (en) * 2014-03-26 2016-12-06 West Corporation IVR engagements and upfront background noise
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
EP3480811A1 (en) 2014-05-30 2019-05-08 Apple Inc. Multi-command single utterance input method
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9888216B2 (en) * 2015-09-22 2018-02-06 SkyBell Technologies, Inc. Doorbell communication systems and methods
US10687029B2 (en) * 2015-09-22 2020-06-16 SkyBell Technologies, Inc. Doorbell communication systems and methods
US11184589B2 (en) * 2014-06-23 2021-11-23 Skybell Technologies Ip, Llc Doorbell communication systems and methods
US20170085843A1 (en) 2015-09-22 2017-03-23 SkyBell Technologies, Inc. Doorbell communication systems and methods
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US10742938B2 (en) 2015-03-07 2020-08-11 Skybell Technologies Ip, Llc Garage door communication systems and methods
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US11575537B2 (en) 2015-03-27 2023-02-07 Skybell Technologies Ip, Llc Doorbell communication systems and methods
US11381686B2 (en) 2015-04-13 2022-07-05 Skybell Technologies Ip, Llc Power outlet cameras
US11641452B2 (en) * 2015-05-08 2023-05-02 Skybell Technologies Ip, Llc Doorbell communication systems and methods
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20180047269A1 (en) 2015-06-23 2018-02-15 SkyBell Technologies, Inc. Doorbell communities
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10706702B2 (en) 2015-07-30 2020-07-07 Skybell Technologies Ip, Llc Doorbell package detection systems and methods
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10331312B2 (en) * 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
CN105657497B (zh) * 2016-02-01 2019-08-13 华为技术有限公司 一种视频播放方法及设备
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10764643B2 (en) * 2016-06-15 2020-09-01 Opentv, Inc. Context driven content rewind
WO2018034059A1 (ja) * 2016-08-17 2018-02-22 パナソニックIpマネジメント株式会社 音声入力装置、翻訳装置、音声入力方法、及び音声入力プログラム
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10390096B2 (en) * 2016-09-16 2019-08-20 DISH Technologies L.L.C. Collecting media consumer data
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10542319B2 (en) * 2016-11-09 2020-01-21 Opentv, Inc. End-of-show content display trigger
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
KR102496793B1 (ko) * 2016-12-13 2023-02-06 현대자동차 주식회사 통합 원격 제어 시스템 및 이를 이용한 원격 제어 방법이 구현된 컴퓨터로 판독 가능한 기록매체
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US11172262B2 (en) 2017-03-24 2021-11-09 Roku, Inc. Enabling interactive control of live television broadcast streams
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US20180341372A1 (en) * 2017-05-24 2018-11-29 Iheartmedia Management Services, Inc. Radio content replay
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US11489691B2 (en) 2017-07-12 2022-11-01 Universal Electronics Inc. Apparatus, system and method for directing voice input in a controlling device
US10930276B2 (en) 2017-07-12 2021-02-23 Universal Electronics Inc. Apparatus, system and method for directing voice input in a controlling device
US11134279B1 (en) * 2017-07-27 2021-09-28 Amazon Technologies, Inc. Validation of media using fingerprinting
CN110945473A (zh) * 2017-07-31 2020-03-31 索尼公司 信息处理装置和信息处理方法
US10902847B2 (en) 2017-09-12 2021-01-26 Spotify Ab System and method for assessing and correcting potential underserved content in natural language understanding applications
US10909825B2 (en) 2017-09-18 2021-02-02 Skybell Technologies Ip, Llc Outdoor security systems and methods
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
KR102490376B1 (ko) * 2017-11-06 2023-01-25 삼성전자 주식회사 전자 장치 및 전자 장치 간 음성으로 기능을 실행하는 방법
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
WO2019136065A1 (en) * 2018-01-03 2019-07-11 Universal Electronics Inc. Apparatus, system and method for directing voice input in a controlling device
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11076039B2 (en) 2018-06-03 2021-07-27 Apple Inc. Accelerated task performance
US11064264B2 (en) 2018-09-20 2021-07-13 International Business Machines Corporation Intelligent rewind function when playing media content
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
JP2022545039A (ja) 2019-08-24 2022-10-24 スカイベル テクノロジーズ アイピー、エルエルシー ドアベル通信システム及び方法
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
US11223665B2 (en) * 2019-09-25 2022-01-11 Disney Enterprises, Inc. Media content system for transferring a playback marker between network-connected playback devices
US11043220B1 (en) 2020-05-11 2021-06-22 Apple Inc. Digital assistant hardware abstraction
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
CN112791408B (zh) * 2021-02-22 2022-10-04 上海莉莉丝科技股份有限公司 实时音频处理方法、系统、设备和介质
US20230217071A1 (en) * 2021-12-31 2023-07-06 The Nielsen Company (Us), Llc Methods and apparatus for measuring engagement during media exposure

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030097659A1 (en) * 2001-11-16 2003-05-22 Goldman Phillip Y. Interrupting the output of media content in response to an event
US20070033607A1 (en) * 2005-08-08 2007-02-08 Bryan David A Presence and proximity responsive program display
US20130117248A1 (en) * 2011-11-07 2013-05-09 International Business Machines Corporation Adaptive media file rewind

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5371551A (en) * 1992-10-29 1994-12-06 Logan; James Time delayed digital video system using concurrent recording and playback
US6302320B1 (en) * 1995-01-13 2001-10-16 The Mead Corporation Heavy duty article carrier
US6034689A (en) 1996-06-03 2000-03-07 Webtv Networks, Inc. Web browser allowing navigation between hypertext objects using remote control
US6391995B2 (en) * 2000-02-09 2002-05-21 Reilly Industries, Inc. Polymer compositions useful as dye complexing agents, and processes for preparing same
US6678817B1 (en) * 2000-02-22 2004-01-13 Hewlett-Packard Development Company, L.P. Method and apparatus for fetching instructions from the memory subsystem of a mixed architecture processor into a hardware emulation engine
US7293279B1 (en) * 2000-03-09 2007-11-06 Sedna Patent Services, Llc Advanced set top terminal having a program pause feature with voice-to-text conversion
US6529586B1 (en) * 2000-08-31 2003-03-04 Oracle Cable, Inc. System and method for gathering, personalized rendering, and secure telephonic transmission of audio data
US6505703B2 (en) * 2001-03-14 2003-01-14 Visteon Global Technologies, Inc. Vehicle steering system control
JP4530587B2 (ja) * 2001-07-30 2010-08-25 株式会社リコー 放送受信装置
US20030041332A1 (en) * 2001-08-21 2003-02-27 Allen Paul G. System and method for mitigating interruptions during television viewing
US6530196B1 (en) * 2001-11-30 2003-03-11 Coastal Pet Products, Inc. Snap connector
US20030135290A1 (en) * 2001-12-31 2003-07-17 Yixin Yao Vehicle road wheel fuzzy logic control system and method of implementing a fuzzy logic strategy for same
US6761243B2 (en) * 2001-12-31 2004-07-13 Visteon Global Technologies, Inc. Steering control with variable damper assistance and method implementing the same
US6702707B2 (en) * 2002-01-31 2004-03-09 Visteon Global Technologies, Inc. Differential assembly
WO2003067594A1 (en) * 2002-02-08 2003-08-14 Ucentric Holdings, Inc. Centralized digital video recording system with bookmarking and playback from multiple locations
US6678595B2 (en) * 2002-03-29 2004-01-13 Visteon Global Technologies, Inc. System and method of simulating a steering resistance torque on a vehicle steering wheel
US6935656B2 (en) * 2002-05-28 2005-08-30 James Veril Stout Combination hitch-mountable utility cart
US8174436B2 (en) * 2002-07-08 2012-05-08 American Underwater Products, Inc. Dive computer with global positioning system receiver
US6795763B2 (en) * 2002-10-30 2004-09-21 Visteon Global Technologies, Inc. Expert-type vehicle steering control system and method
US7249437B2 (en) * 2003-04-24 2007-07-31 Soundstarts, Inc. Method and apparatus for exterminating gophers and other burrowing pests
US6946877B2 (en) * 2003-12-12 2005-09-20 Hewlett-Packard Development Company, L.P. Circuit and associated methodology
US20070189544A1 (en) * 2005-01-15 2007-08-16 Outland Research, Llc Ambient sound responsive media player
US8014542B2 (en) * 2005-11-04 2011-09-06 At&T Intellectual Property I, L.P. System and method of providing audio content
EP1801803B1 (en) * 2005-12-21 2017-06-07 Advanced Digital Broadcast S.A. Audio/video device with replay function and method for handling replay function
EP1843591A1 (en) 2006-04-05 2007-10-10 British Telecommunications Public Limited Company Intelligent media content playing device with user attention detection, corresponding method and carrier medium
DE102007061084A1 (de) * 2007-12-19 2009-07-02 Federal-Mogul Sealing Systems Gmbh Metallische Flachdichtung und Herstellverfahren
US9105298B2 (en) * 2008-01-03 2015-08-11 International Business Machines Corporation Digital life recorder with selective playback of digital video
US8244105B2 (en) * 2008-03-20 2012-08-14 Verna Ip Holdings, Llc Talking replay
US9055271B2 (en) * 2008-03-20 2015-06-09 Verna Ip Holdings, Llc System and methods providing sports event related media to internet-enabled devices synchronized with a live broadcast of the sports event
US7610202B1 (en) * 2008-04-21 2009-10-27 Nuance Communications, Inc. Integrated system and method for mobile audio playback and dictation
US20100077458A1 (en) * 2008-09-25 2010-03-25 Card Access, Inc. Apparatus, System, and Method for Responsibility-Based Data Management
US9639744B2 (en) * 2009-01-30 2017-05-02 Thomson Licensing Method for controlling and requesting information from displaying multimedia
US20110029326A1 (en) * 2009-07-28 2011-02-03 General Electric Company, A New York Corporation Interactive healthcare media devices and systems
KR101626621B1 (ko) * 2009-12-30 2016-06-01 엘지전자 주식회사 원형 디스플레이부를 구비한 이동 통신 단말기의 데이터 제어 방법 및 이를 적용한 이동 통신 단말기
US20110161304A1 (en) * 2009-12-30 2011-06-30 Verizon North Inc. (SJ) Deployment and compliance manager
WO2011138628A1 (en) * 2010-05-07 2011-11-10 Thomson Licensing Method and device for optimal playback positioning in digital content
WO2011123626A2 (en) * 2010-03-31 2011-10-06 Federal-Mogul Corporation Cylinder head compression sensor gasket assembly, method of construction thereof and method of servicing a pressure sensor assembly in a cylinder head compression sensor gasket assembly
US20120060162A1 (en) * 2010-08-31 2012-03-08 Avanade Holdings, Llc Systems and methods for providing a senior leader approval process
US20120060116A1 (en) * 2010-09-08 2012-03-08 Microsoft Corporation Content signaturing user interface
US8832551B2 (en) * 2012-05-10 2014-09-09 Dassault Systemes Americas Corp. Video-based undo and redo operations
US20140108010A1 (en) * 2012-10-11 2014-04-17 Intermec Ip Corp. Voice-enabled documents for facilitating operational procedures
US9477376B1 (en) * 2012-12-19 2016-10-25 Google Inc. Prioritizing content based on user frequency
US20140226953A1 (en) * 2013-02-14 2014-08-14 Rply, Inc. Facilitating user input during playback of content
US20140255003A1 (en) * 2013-03-05 2014-09-11 Google Inc. Surfacing information about items mentioned or presented in a film in association with viewing the film
US10285624B2 (en) * 2013-03-12 2019-05-14 University Of Washington Systems, devices, and methods for estimating bilirubin levels
WO2015039005A2 (en) * 2013-09-13 2015-03-19 Federal-Mogul Corporation Hot gasket with stainless steel
US9215510B2 (en) * 2013-12-06 2015-12-15 Rovi Guides, Inc. Systems and methods for automatically tagging a media asset based on verbal input and playback adjustments
US9274673B2 (en) * 2013-12-31 2016-03-01 Google Inc. Methods, systems, and media for rewinding media content based on detected audio events
US9098754B1 (en) * 2014-04-25 2015-08-04 Google Inc. Methods and systems for object detection using laser point clouds
US20160007570A1 (en) * 2014-07-09 2016-01-14 Coastal Pet Products, Inc. Pet harness with unique leash connector
US20160136944A1 (en) * 2014-11-18 2016-05-19 Collar Central, Llc Method and apparatus for imprinting collars
US9836895B1 (en) * 2015-06-19 2017-12-05 Waymo Llc Simulating virtual objects
US10038348B2 (en) * 2015-08-12 2018-07-31 Regal Beloit America, Inc. Liner, stator assembly and associated method
US10635070B2 (en) * 2017-02-24 2020-04-28 Regal Beloit America, Inc. Systems and methods for programming a motor
US10284130B2 (en) * 2017-03-13 2019-05-07 Regal Beloit America, Inc. PSC motor having multiple speed and voltage configurations
US11278813B2 (en) * 2017-12-22 2022-03-22 Activision Publishing, Inc. Systems and methods for enabling audience participation in bonus game play sessions
US10868460B2 (en) * 2018-03-06 2020-12-15 Regal Beloit America, Inc. PSC motor having multiple pole configurations for use in at least two different air moving devices
US10713148B2 (en) * 2018-08-07 2020-07-14 Waymo Llc Using divergence to conduct log-based simulations
US10795804B1 (en) * 2018-08-21 2020-10-06 Waymo Llc Collision evaluation for log-based simulations
US11126763B1 (en) * 2018-08-22 2021-09-21 Waymo Llc Realism metric for testing software for controlling autonomous vehicles

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030097659A1 (en) * 2001-11-16 2003-05-22 Goldman Phillip Y. Interrupting the output of media content in response to an event
US20070033607A1 (en) * 2005-08-08 2007-02-08 Bryan David A Presence and proximity responsive program display
US20130117248A1 (en) * 2011-11-07 2013-05-09 International Business Machines Corporation Adaptive media file rewind

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107785037A (zh) * 2016-08-24 2018-03-09 谷歌有限责任公司 使用音频时间码同步媒体内容的方法、系统和介质
CN107785037B (zh) * 2016-08-24 2021-03-23 谷歌有限责任公司 使用音频时间码同步媒体内容的方法、系统和介质

Also Published As

Publication number Publication date
CN105874809B (zh) 2019-08-16
US10649728B2 (en) 2020-05-12
US20180364978A1 (en) 2018-12-20
US20160154625A1 (en) 2016-06-02
US11175887B2 (en) 2021-11-16
US20200272415A1 (en) 2020-08-27
WO2015103056A1 (en) 2015-07-09
US20230127384A1 (en) 2023-04-27
US9274673B2 (en) 2016-03-01
US10073674B2 (en) 2018-09-11
EP3090537A1 (en) 2016-11-09
CN110519539A (zh) 2019-11-29
US20150185964A1 (en) 2015-07-02
CN110519539B (zh) 2022-04-12
US11531521B2 (en) 2022-12-20
US20220075594A1 (en) 2022-03-10

Similar Documents

Publication Publication Date Title
CN105874809A (zh) 用于基于所检测的音频事件倒回媒体内容的方法、系统和介质
KR102325697B1 (ko) 정보 처리 장치, 정보 처리 방법 및 프로그램
KR101726945B1 (ko) 수동 시작/종료 포인팅 및 트리거 구문들에 대한 필요성의 저감
CN106464939A (zh) 播放音效的方法及装置
CN107515925A (zh) 音乐播放方法及装置
CN107396177A (zh) 视频播放方法、装置及存储介质
CN106375782A (zh) 视频播放方法及装置
CN109032345B (zh) 设备控制方法、装置、设备、服务端和存储介质
CN109257498B (zh) 一种声音处理方法及移动终端
KR20140081636A (ko) 콘텐트 재생 방법 및 이를 위한 단말
CN104112459B (zh) 播放音频数据的方法和装置
US20180054688A1 (en) Personal Audio Lifestyle Analytics and Behavior Modification Feedback
CN109151565A (zh) 播放语音的方法、装置、电子设备及存储介质
CN109830248A (zh) 一种音频录制方法及终端设备
CN106128440A (zh) 一种歌词显示处理方法、装置、终端设备及系统
CN106598432A (zh) 多媒体播放的方法和装置
CN109828741A (zh) 用于播放音频的方法和装置
CN108763475B (zh) 一种录制方法、录制装置及终端设备
CN104182039A (zh) 设备控制方法、装置及电子设备
CN107454359B (zh) 播放视频的方法及装置
CN110019936A (zh) 一种媒体文件播放过程中的注释方法和装置
US20190156259A1 (en) Methods, systems, and media for creating an atmosphere suited to a social event
CN107832377A (zh) 图像信息显示方法、装置及系统、存储介质
CN106534965A (zh) 获取视频信息的方法及装置
CN109902606B (zh) 一种操作方法及终端设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: American California

Applicant after: Google limited liability company

Address before: American California

Applicant before: Google Inc.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant