CN109388365A - 信息处理方法、信息处理设备及计算机可读存储介质 - Google Patents

信息处理方法、信息处理设备及计算机可读存储介质 Download PDF

Info

Publication number
CN109388365A
CN109388365A CN201810638585.8A CN201810638585A CN109388365A CN 109388365 A CN109388365 A CN 109388365A CN 201810638585 A CN201810638585 A CN 201810638585A CN 109388365 A CN109388365 A CN 109388365A
Authority
CN
China
Prior art keywords
content
user
information processing
active
mediun
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810638585.8A
Other languages
English (en)
Inventor
罗德里克·埃科尔斯
瑞安·查尔斯·克努森
蒂莫西·温思罗普·金斯伯里
乔纳森·盖瑟·诺克斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Singapore Pte Ltd
Original Assignee
Lenovo Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Singapore Pte Ltd filed Critical Lenovo Singapore Pte Ltd
Publication of CN109388365A publication Critical patent/CN109388365A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了信息处理方法、信息处理设备及计算机可读存储介质。一个非限制性实施方式提供了一种信息处理方法,该方法包括:从用户接收包括触发事件的用户输入;使用至少一个处理器来识别活动媒体内容;以及基于触发事件对活动媒体内容执行动作。该实施方式意在是非限制性的,并且其他实施方式被设想、公开和讨论。

Description

信息处理方法、信息处理设备及计算机可读存储介质
技术领域
本发明总体上涉及信息处理方法、信息处理设备及计算机可读存储介质。
背景技术
技术的进步增加了消费者获得媒体内容的方式。以前,消费者可以选择现场活动、无线电或预先记录媒体例如乙烯基录制品、8轨道磁带、盒式磁带、光盘等。消费者现在有了新选择,如例如通过因特网连接递送的流媒体、卫星递送的呈音频形式、视频形式和/或其组合的媒体。例如计算机、平板计算机、智能电话、汽车立体声系统、电视流媒体盒、电缆盒、卫星盒等的信息处理设备(“设备”)通常能够获得这些新形式的媒体。因此,消费者在任何时候都可以轻而易举地获得可用内容的大量可用库。消费者可能难以跟踪大量可用媒体,特别是可能难以跟踪适合消费者偏好的优选媒体。
发明内容
总而言之,一个方面提供了一种信息处理方法,该方法包括:从用户接收包括触发事件的用户输入;使用至少一个处理器来识别活动媒体内容;以及基于触发事件对活动媒体内容执行动作。
另一个方面提供了一种信息处理设备,该信息处理设备包括:处理器;至少一个处理器;存储指令的存储器设备,所述指令能够由所述至少一个处理器执行以:从用户接收包括触发事件的用户输入;使用所述至少一个处理器来识别活动媒体内容;以及基于触发事件对活动媒体内容执行动作。
另一个方面提供了一种计算机可读存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被执行时,执行一种信息处理方法,所述方法包括:从用户接收包括触发事件的用户输入;使用至少一个处理器来识别活动媒体内容;以及基于触发事件对活动媒体内容执行动作。
前述是概要,因此可以包括简化、概括和细节省略;因此,本领域技术人员将理解,该概要仅是说明性的,并不意在以任何方式进行限制。
为了更好地理解实施方式以及实施方式的其他和另外的特征和优点,结合附图参考以下描述。本发明的范围将在所附权利要求书中指出。
附图说明
图1示出了信息处理设备电路的示例;
图2示出了信息处理设备电路的另一示例;以及
图3示出了基于接收到触发事件对活动媒体内容执行动作的示例方法。
具体实施方式
将容易理解的是,除了描述的示例性实施方式以外,如一般描述和在本文中在附图中示出的实施方式的部件可以以各种各样的不同配置来布置和设计。因此,如附图中表示的示例性实施方式的以下更详细的描述并非旨在限制要求保护的实施方式的范围,而仅仅是示例实施方式的表示。
在整个说明书中对“一个实施方式”或“实施方式”(等)的引用意味着结合该实施方式描述的特定特征、结构或特性包括在至少一个实施方式中。因此,遍及本说明书在各处出现的措辞“在一个实施方式中”或“在实施方式中”等不一定都指代同一实施方式。
此外,描述的特征、结构或特性可以以任何合适的方式在一个或更多个实施方式中组合。在以下描述中,提供了许多具体细节以给出实施方式的透彻理解。然而,相关领域的技术人员将认识到,可以在没有一个或更多个特定细节的情况下或者利用其他方法、部件、材料等来实践各种实施方式。在其他情况下,未详细示出或描述公知的结构、材料或操作以避免混淆。
用户在任何给定的一天经常遇到大量媒体,例如,人们可以收听无线电,通过因特网观看视频,收看电视节目,收听新闻广播等。在如今的快节奏生活中,用户可能没有时间在媒体被播送或播放时欣赏媒体内容。例如,在节目、歌曲或其他音频内容结束之前,汽车的驾驶员可能正在收听无线电台并到达期望的目的地。驾驶员可能没有时间来听完媒体内容,但是希望在稍后更方便的时间完成或重放媒体内容。作为另一示例,听者可能正在收听卫星广播并且听到当前不在用户库中的新音乐。另外,用户可能没有时间弄清歌曲的名称、艺术家或其他标识特性。用户可能希望记住稍后要听或要购买的歌曲。作为另一示例,用户可能正在观看电视(“TV”)节目,或者可能看到他们想要观看的稍后上演的电视节目。然而,用户可能需要离开而没有时间观看节目,设置记录节目的提醒,或者对要记录的节目进行设置。尽管如此,用户可能希望做一些事情来创建提醒,以在不得不离开之前寻找节目或开始记录。
常规地,用户将采取更劳动密集的方法以在稍后的时间保留媒体。在最基本的形式中,用户可以写下媒体的属性(即标题、关键字、艺术家、频道等),并且在稍后的时间搜索媒体。搜索可以使用因特网搜索引擎来执行,或者可以在媒体源的频道的网站上执行。诸如“标记”媒体文件(如流式服务上的“类似”功能)的能力的技术发展例如可以保留媒体文件并且提醒用户何时可以再次播放媒体。然而,令人讨厌的是,“类似”功能常常暗示与用户真正想要记住的媒体稍微相关的其他有关媒体。此外,用户可以设置数字视频记录(DVR)单元来保存媒体文件以备后用。然而,这可能要求用户使用指南找到他们希望记录的节目,然后设置记录器以记录媒体。这些方法需要附加步骤和时间让用户记住优选媒体,以在稍后时间内识别媒体文件,或者保存媒体以在稍后的时间消费。
因此,实施方式提供了用于基于接收到触发事件对活动媒体内容执行动作的系统和方法。触发事件可以是单词、动作、姿势、从某个区域离开、视线跟踪、按下按钮、无线通信等。为了容易且简单地阅读,描述了触发词;然而,应当理解,术语“触发词”可以指并且可以是公开的触发事件中的任意触发事件。实施方式可以从用户接收触发词。触发事件可以包括“标记”活动媒体文件以在稍后时间使用的命令。触发事件可以被预先编程在系统中,或者触发事件可以由用户选择。例如,用户可以选择单词“保留”作为触发词。一旦实施方式已经接收到触发词,实施方式就可以识别活动媒体内容。活动媒体的识别可以包括:识别特定音频媒体文件;访问时间表;识别频道;识别活动媒体的特性(例如,标题、艺术家、制作者、网络等)等。实施方式然后可以对活动媒体内容执行动作:例如,提供通知;提供提醒;记录活动媒体内容;随后播放活动媒体内容;在虚拟助理处输入活动媒体等。
作为示例并且使用示例性触发词“保留”,用户可能正在汽车中收听NPR广播节目,并且节目持续时间持续到超过用户到达目的地的时间。此时,用户可以说出触发词“保留”,并且正在进行的活动媒体可以被选择或被标记以供在稍后时间收听。选择或标记可以包括:记录内容;向用户发送包括内容的链接;在内容正被重放或重播时通知用户等。
作为另一示例,触发事件可以是用户离开他们的汽车。用户可能正在汽车内收听NPR广播节目,并且节目持续时间持续到超过用户到达目的地的时间。此时,触发事件可以是离开汽车,并且正在进行的活动媒体可以被选择或被标记以供稍后时间收听。选择或标记可以包括:记录内容;向用户发送包括内容的链接;在内容正被重放或重播时通知用户等。
将通过参照附图最佳地理解示出的示例实施方式。以下描述意在仅作为示例,并且仅仅示出了某些示例性实施方式。
虽然可以在信息处理设备中利用各种其他电路、电路系统或部件,但是对于智能电话和/或平板计算机电路100,图1所示的示例包括例如在平板计算机或其他移动计算平台中发现的芯片设计系统。软件和处理器被组合在单个芯片110中。如本领域公知的,处理器包括内部算术单元、寄存器、高速缓冲存储器、总线、I/O端口等。内部总线等取决于不同的供应商,但是基本上所有的外围设备120都可以附接至单个芯片110。电路系统100将处理器、存储器控制和I/O控制器集线器全部组合到单个芯片110中。此外,这种类型的系统100通常不使用SATA或PCI或LPC。公用接口例如包括SDIO和I2C。
存在电力管理芯片130,例如电池管理单元BMU,其管理例如经由可再充电电池140所提供的电力,所述可再充电电池140可以通过与电源(未示出)的连接而被再充电。在至少一种设计中,使用单个芯片(如110)来提供BIOS式功能和DRAM存储器。
系统100通常包括用于连接至各种网络如电信网络以及无线因特网设备例如接入点的WWAN收发器150和WLAN收发器160中的一个或更多个。另外,通常包括设备120,例如,诸如相机的图像传感器、诸如麦克风的音频捕获设备、热传感器等。系统100通常包括用于数据输入和显示/渲染的触摸屏170。系统100通常还包括各种存储器设备,例如,闪速存储器180和SDRAM 190。
图2描绘了信息处理设备电路、电路系统或部件的另一示例的框图。图2描绘的示例可以与诸如由位于北卡罗来纳州莫里斯维尔(Morrisville,NC)的联想(美国)公司出售的THINKPAD系列个人计算机或其他设备的计算系统对应。如从本文中的描述显而易见的是,实施方式可以包括其他特征或图2所示的示例的仅一些特征。
图2的示例包括具有会根据制造商(例如,INTEL、AMD、ARM等)而变化的架构的所谓的芯片组210(一组一起工作的集成电路或芯片,芯片组)。INTEL是英特尔公司在美国和其他国家的注册商标。AMD是超微半导体设备有限公司(Advanced Micro Device Inc.)在美国和其他国家的注册商标。ARM是ARM控股公司(ARM Holding plc)在美国和其他国家的未注册商标。芯片组210的架构包括核与存储器控制组220以及I/O控制器集线器250,所述核与存储器控制器组220以及I/O控制器集线器250经由直接管理接口(DMI)242或链路控制器244来交换信息(例如,数据、信号、命令等)。在图2中,DMI 242是芯片到芯片接口(有时被称为“北桥”与“南桥”之间的链路)。核与存储器控制组220包括经由前端总线(FSB)224交换信息的存储器控制器集线器226和一个或更多个处理器222(例如,单核或多核);应该注意,组220的部件可以集成在替代常规“北桥”式架构的芯片中。如本领域众所周知的,一个或更多个处理器222包括内部算术单元、寄存器、高速缓冲存储器、总线、I/O端口等。
在图2中,存储器控制器集线器226与存储器240对接(例如,为可以被称为“系统存储器”或“存储器”的RAM类型提供支持)。存储器控制器集线器226还包括用于显示设备292(例如,CRT、平板、触摸屏等)的低压差分信令(LVDS)接口232。块238包括可以经由LVDS接口232(例如,串行数字视频、HDMI/DVI、显示端口)支持的一些技术。存储器控制器集线器226还包括可以支持显卡236的PCI-express接口(PCI-E)234。
在图2中,I/O集线器控制器250包括:SATA接口251(例如,用于HDD/SDD等,280)、PCI-E接口252(例如,用于无线连接282)、USB接口253(例如,用于设备284如数字转换器、键盘、鼠标、相机、电话、麦克风、存储器、其他连接的设备等)、网络接口254(例如,LAN)、GPIO接口255、LPC接口270(用于ASIC 271、TPM 272、超级I/O 273、固件集线器274、BIOS支持275以及诸如ROM 277、闪存278和NVRAM 279的各种类型的存储器276)、电源管理接口261、时钟发生器接口262、音频接口263(例如,用于扬声器294)、TCO接口264、系统管理总线接口265以及可以包括BIOS 268和启动代码290的SPI闪存266。I/O集线器控制器250可以包括千兆以太网支持。
该系统在通电时可以被配置成执行如存储在SPI闪存266内的用于BIOS 268的启动代码290,此后在一个或更多个操作系统和应用软件(例如,存储在系统存储器240中)的控制下处理数据。操作系统可以被存储在各个位置中的任何位置中,并且例如根据BIOS268的指令而被访问。如本文中描述的,设备可以包括比图2的系统所示的特征更少或更多的特征。
如例如图1或图2中概述的信息处理设备电路系统可以用于以下设备中:诸如平板计算机、智能电话、启用AR的耳机的设备、一般的个人计算机设备和/或可以用于消费活动媒体内容和/或可以用于识别活动媒体内容并且响应于接收到用户输入而执行动作的电子设备。例如,图1中概述的电路系统可以在平板计算机或智能电话实施方式中实现,而图2中概述的电路系统可以在个人计算机实施方式中实现。
现在参照图3,实施方式可以基于接收到由用户执行或提供的触发事件来对活动媒体内容执行动作。在301处,实施方式可以从用户接收包括触发词的用户输入。触发词可以包括一个或更多个词,例如,触发词可以包括短语或多个词而不是单个词。触发词可以包括对实施方式执行特定功能的指示,例如以识别活动媒体内容并且对活动媒体内容执行动作。如下面更详细说明的,触发词可以使实施方式标记或选择活动媒体内容。
在一个实施方式中,触发词可以是预设或默认的词,或者可以由用户来编程。例如,用户可以选择要用于使实施方式执行功能的特定词或短语。不同用户可以选择或编程不同的触发词。例如,一个用户可能更喜欢触发词“保留(retain)”,而另一个用户更喜欢触发词“将其保持(keep this)”。针对不同用户的不同触发词可以反映用户的个人偏好或者帮助设备区分用户。例如,实施方式可以基于所使用的触发词来识别将活动媒体内容与哪个用户关联。可替选地,实施方式可以使用不同的识别方法(例如,用户凭证、设备关联(例如,设备与用户相关联等)、生物识别(例如,指纹识别、面部识别、视网膜识别等)等)来识别用户。
实施方式还可以包括多个触发词,每个触发词对活动媒体内容执行不同的功能。例如,用户可以使用触发词“保存”来将活动媒体内容保存,以及可以使用触发词“发送”来将活动媒体内容的链接发送至用户。此外,这些多个触发词可以是预设的或者可以由用户选择。另外,不同用户可以使用同一触发词来执行不同功能。例如,一个用户可以使用触发词“发送”来将活动媒体的链接发送至用户的电子邮件地址,而另一个用户可以使用触发词“发送”来将活动媒体文件发送至用户的数据存储位置。在实施方式中,用户输入的触发词可以在虚拟助理处被接收,虚拟助理可以对活动媒体内容执行所请求的功能。
可以在输入设备(例如,物理键盘、屏幕上键盘、音频捕获设备、图像捕获设备、视频捕获设备、数字助理、电视调谐器盒、卫星无线电单元、汽车娱乐单元、智能电话等)处接收输入,并且可以通过向电子设备提供输入(例如,触摸输入、文本输入、语音输入等)的任何已知方法来提供。为了简单起见,本文的大部分讨论将涉及可以在可操作地耦接至语音识别设备的输入设备(例如,麦克风、语音捕获设备等)处接收的语音输入。然而,应当理解,通常可以利用任何形式的用户输入。例如,用户可以向信息处理设备提供触发设备采取某些行动的触摸或机械输入。
在实施方式中,输入设备可以是对语音识别设备不可缺的输入设备。例如,智能电话、数字助理、立体声系统、TV、流式盒或卫星无线电单元可以设置有能够接收语音输入数据的麦克风。可替选地,输入设备可以设置在另一设备上,并且可以将接收到的语音输入数据传送至语音识别设备。例如,语音输入可以在如下智能扬声器处被接收,所述智能扬声器可以随后将语音数据传送至另一设备(例如,传送至用户的智能电话以进行处理等)。可以经由无线连接(例如,使用蓝牙(BLUETOOTH)连接、近场通信(NFC)、无线连接技术等)、有线连接(例如,设备耦接至另一设备或源等)、通过连接的数据存储系统(例如,经由云存储装置、远程存储装置、本地存储装置、网络存储装置等)等将语音输入数据从其他源传送至语音识别设备。
在实施方式中,输入设备可以被配置成:通过将输入设备保持在使用状态(activestate)来连续地接收语音输入数据。即使当设备的其他功能(例如,相机、光传感器、扬声器、其他麦克风、扬声器、显示屏幕等)待用(inactive)时,输入设备也可以例如连续地检测语音输入数据。可替选地,输入设备可以在预定时间量(例如,30分钟、1小时、2小时等)内保持使用状态,或者设备可以响应于触发词或接收到用户输入而“醒来”。
在302处,实施方式可以确定活动媒体内容是否可以被识别。活动媒体内容可以是任何类型的媒体文件,例如,歌曲、视频、电视节目、因特网播客或任何其他类型的媒体文件。媒体文件可以在不同类型的媒体源(例如,无线电、卫星无线电、流媒体、订阅媒体、广播电视、有线电视、卫星电视等)上活动。活动媒体内容可以来自商业提供者或个人源,例如,无线广播电台、用户的MP3播放器、因特网提供商、数据存储位置(例如,远程存储装置、本地存储装置、云存储装置等)等。活动媒体内容还可以包括现场直播格式或预先记录格式。
活动媒体内容可以包括当前活动的媒体内容,或者可以包括已经活动或将要活动的媒体内容。换言之,在一个实施方式中,用户可以说出触发词,实施方式可以识别什么媒体内容当前是活动的(例如,正在播送、正在播放、当前可听等)。例如,如果用户正在乘坐汽车旅行并且当用户到达目的地时正在收听正在进行的广播节目,则用户可以说出触发词并且系统可以响应于接收到触发词而识别当前活动的媒体内容。作为另一示例,用户可能正在观看电视节目,但是在节目结束之前需要离开,用户可以使用触发词并且系统可以识别当前活动的媒体内容。
可替选地,在一个实施方式中,如果用户提供包括特定持续时间、时间帧或特定时间的触发词,则实施方式可以确定在指定时间处将活动或已经活动的媒体内容。作为示例,如果用户说出“保存将在十分钟内开始的视频”,则实施方式可以确定在十分钟内将播放什么视频并且将保存该视频。如在下面说明或在下面更详细地说明的,确定什么将活动或什么已经活动可以包括访问其他源。可替选地,实施方式可以将媒体内容“倒回”到指定的时间点,或者可以等待直到时间点已经发生或过去,然后识别与该时间点相关联的媒体内容。作为示例,用户可能知道特定网络广播将在上午10点播送,并且可以提供指示实施方式应当对网络广播执行动作的触发短语。然后,实施方式可以在其识别出时间是上午10:00时采取行动。作为另一示例,用户可能正在收听脱口秀并且可能必须在脱口秀结束之前离开。用户可以提供触发以记录整个节目。因此,实施方式可以“倒回”并且从头开始记录脱口秀。
在实施方式中,识别活动媒体内容可以包括识别活动媒体内容的特性或属性。属性可以包括元数据、标题、艺术家、类型、时间、日期、专辑、年份、歌词、乐句、图像、制作者、播放媒体内容的位置、与媒体内容相关联的频道等。例如,实施方式可以使用歌曲的一个或更多个属性或特性来识别当前播放的特定音频媒体文件。例如,如果歌曲正在卫星、无线电或流服务上播放,则实施方式可以通过使用歌曲识别软件等访问活动媒体文件的属性来识别活动媒体。活动媒体文件的属性可以存储在云中、用户设备上、活动媒体文件数据存储系统上等。属性可以由最初的艺术家、广播公司或用户预先编程。
在实施方式中,识别活动媒体内容可以包括访问与活动媒体内容对应的时间表。例如,媒体提供者可以在特定时隙中广播预先编程或预先记录的媒体,并且可以提供标识将在特定时隙播送的活动媒体内容的指南或节目时间表。访问时间表可以有助于识别用户已经选择的活动媒体内容。例如,用户可以使用触发词,实施方式可以访问广播服务的时间表以识别:哪个活动媒体文件当前正在播送;哪个活动媒体文件已在所识别的时间播送;或者哪个活动媒体文件将在所识别的时间播送。因此,当用户提供触发词时,实施方式可以访问时间表,并且实施方式可以基于时间表来识别活动媒体。时间表可以存储在云中、广播提供者服务器上、用户设备上、应用中、程序上等。
在实施方式中,识别活动媒体内容包括识别活动媒体内容的频道。例如,如果用户正在收听卫星无线电频道并且用户使用触发词,则实施方式可以识别当前正在播放的卫星无线电台或频道,并且可以将活动媒体文件与该特定卫星无线电台关联。这些频道可以来自任何广播源,例如,无线电、卫星、电缆、流等。广播的源可以来自商业提供者、用户创建的媒体列表等。频道信息可以从商业提供者、用户创建的列表、基于云的存储装置获得。频道信息可以呈预定的存储格式或者以实时数据流来广播。
如果在302处不能识别活动媒体内容,则在303处系统可以不采取行动。例如,如果实施方式不能识别活动媒体内容,则实施方式可以不采取行动。可替选地,实施方式可以向用户提供活动媒体内容无法被识别的指示,或者请求用户提供附加输入。作为另一示例,用户可以具有执行与设备有关的其他功能的其他预先编程的词(例如,用于数字助理的唤醒词、用于执行与活动媒体内容不相关的动作的触发词等)。因此,实施方式可以将用于识别活动媒体内容的触发词与其他词进行区分,并且如果接收到不同触发词,则对活动媒体内容不执行动作。
如果在302处可以识别活动媒体内容,则在304处实施方式可以对活动媒体内容执行动作。如下面实施方式中公开的,一旦活动媒体内容被识别,就可以采取许多行动。如上面简要讨论的,所采取的行动可以部分地基于接收到的触发词。换言之,一个触发词可以引起采取一个行动,而不同的触发词可以引起采取不同的行动。在实施方式中,执行动作包括将活动媒体与用户关联。例如,如果用户正在观看电视并且不能结束节目,则实施方式可以识别活动媒体文件并且将媒体文件与用户关联。因此,当用户再打开设备、返回或访问可以播放媒体内容的另一设备时,实施方式可以识别用户并且向用户通知所记录的媒体内容,即,媒体内容可以在不同时间在不同频道上找到等。
另外地或可替选地,实施方式可以将活动媒体文件与一个或更多个用户或甚至预定的一组用户关联。因此,当任何用户访问可以播放媒体内容的设备时,实施方式可以向用户通知媒体文件以及可以对该媒体文件采取的不同行动。可以例如通过个人简档、IP地址、设备上的唯一标识符、登录名称、支付信息、语音识别、物理特征识别、电子邮件账户、社交媒体账户、用户凭证、面部识别等使用不同的用户识别技术来完成用户的识别。
在实施方式中,可以向用户提供与活动内容有关的通知。例如,如果用户听到歌曲并且使用触发词,则实施方式可以向用户提供以下通知:提供活动媒体文件的标识。如上所述,活动媒体文件的标识,从而通知可以包括与活动媒体文件有关的属性。通知属性可以包括元数据、标题、艺术家、类型、时间、日期、专辑、年份、歌词、乐句、图像等。作为示例,实施方式可以向用户发送文本消息、电子邮件消息、弹出通知等,以提供媒体文件的标识的细节。通知可以生成和/或存储在用户设备中、云中、提供者数据库中等。通知可以永久地存储或仅存储一段时间。在一个实施方式中,可以在触发词被使用之后立即将通知发送给用户,或者可替选地,通知可以具有滞后时间。滞后时间可以由用户预设,或者可以在用户有时间关注通知时发生。
在一个实施方式中,通知可以是搜索活动媒体内容的提醒。例如,通知可以告诉用户在稍后时间例如使用通知中包括的属性来搜索活动媒体文件。在一个实施方式中,通知可以包括向用户提供与媒体文件有关的信息。例如,在识别出媒体文件并且将其与用户关联时,实施方式可以向用户提供可以在别处访问媒体文件的通知。在一个实施方式中,通知可以包括活动媒体文件的链接。通知可以是可听警报(例如,语音、嘟嘟声等)、触觉反馈(例如,振动、脉动等)、可见指示(例如,光、图标、显示消息等)或另一其他类型的通知。通知可以是经由电子邮件、SMS消息、社交媒体站点、媒体文件库等发送给用户的消息。
通知可以被提供在最初播放活动媒体文件的设备上或者由最初播放活动媒体文件的设备提供,或者可替选地,可以在不播放活动媒体文件的设备上。例如,通知可以通过无线连接(例如,使用蓝牙(BLUETOOTH)连接、近场通信(NFC)、无线连接技术等)、有线连接(例如,设备耦接至另一设备或源等)、通过连接的数据存储系统(例如,经由云存储装置、远程存储装置、本地存储装置、网络存储装置等)等从一个设备被发送至另一设备。
在实施方式中,在304处执行的动作可以包括记录活动媒体文件。记录可以是记录整个媒体文件或媒体文件的一部分。整个媒体文件被记录还是仅一部分媒体文件被记录可以取决于接收到的触发词。记录可以在用户设备处发生,该用户设备可以是最初访问活动媒体文件的用户设备或者可以在另外的一个或多个用户上发生。可替选地,记录可以在云存储单元、远程存储设备等处执行。记录可以包括活动媒体文件中包含的元数据。记录可以是到存储活动媒体文件的另一设备(即,用户设备、云存储装置或广播存储装置)的链接。
该记录然后可以被发送给用户、被存储以供在稍后时间访问,记录的链接可以被发送给用户等。用户然后可以访问该记录或该记录的链接,并且该记录可以随后被播放。活动媒体文件的播放可以在最初访问活动媒体文件的设备上。替选地或另外地,活动媒体文件的播放可以在没有访问原始活动媒体文件的设备上,例如,回放可以在不同的用户设备处、来自云源等。
因此,本文中描述的各种实施方式表示对常规活动媒体内容系统的技术改进。如本文中描述的系统和方法为用户提供用于对活动媒体内容执行动作的技术,这对于常规技术是不可能的。用户然后可以在稍后时间访问与活动媒体内容有关的信息或与实际活动媒体内容有关的信息。可以确保用户可以在稍后的时间访问媒体文件并且将不会忘记与媒体文件相关联的细节,而非错过节目或媒体文件的结尾。使用如本文中描述的技术,用户不必执行耗时且繁琐的步骤来对媒体内容采取行动。相反,用户只提供触发词,系统就会执行期望的动作,所述期望的动作可以包括向用户通知所执行的动作。
如本领域技术人员将理解的,各个方面可以实现为系统、方法或设备程序产品。因此,各方面可以采用完全硬件实施方式的形式或者在包括本文中可以全部统称为“电路”、“模块”或“系统”的软件的实施方式的形式。此外,各方面可以采用设备程序产品的形式,该设备程序产品实现为包括有设备可读程序代码的一个或更多个设备可读介质。
应当注意,本文中描述的各种功能可以使用由处理器执行的存储在设备可读存储介质例如非信号存储设备上的指令来实现。存储设备可以是例如系统、装置或设备(例如,电子系统、磁性系统、光学系统、电磁系统、红外系统或半导体系统、装置或设备)或者前述的任何适当的组合。存储设备/介质的更具体的示例包括以下:便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)、光纤、便携式光盘只读存储器(CD-ROM)、光存储设备、磁存储设备或前述的任何适当的组合。在本文献的上下文中,存储设备不是信号,“非暂态”包括除信号介质以外的所有介质。
可以使用任何适当的介质来传输在存储介质上所包含的程序代码,所述任何适当的介质包括但不限于无线、有线、光纤电缆、RF等或者前述的任何适当的组合。
用于执行操作的程序代码可以以一种或更多种编程语言的任意组合来编写。程序代码可以完全在单个设备上执行,部分地在单个设备上执行,作为独立软件包执行,部分地在单个设备上并且部分地在另一个设备上执行,或者完全在其他设备上执行。在一些情况下,可以通过任何类型的连接或网络(包括局域网(LAN)或广域网(WAN))来连接设备,或者可以通过其他设备(例如,通过使用因特网服务提供商的因特网)、通过无线连接(例如,近场通信)或通过硬线连接(如通过USB连接)来进行连接。
本文参考示出了根据各种示例实施方式的示例方法、设备和程序产品的附图描述了示例实施方式。应当理解,动作和功能可以至少部分地通过程序指令来实现。可以将这些程序指令提供至设备、专用信息处理设备或其他可编程数据处理设备的处理器以产生机器指令,使得经由设备的处理器执行的指令实现指定的功能/动作。
值得注意的是,尽管在附图中使用了特定块,并且已经示出了块的特定排序,但这些都是非限制性示例。由于明确说明的示例仅用于描述性目的并且不应被解释为进行限制,所以在某些情况中,可以将两个或更多个块组合,可以将块划分为两个或更多个块,或者可以适当地将某些块重新排序或重新组织。
如本文中使用的,除非另外清楚地指出,否则单数可以被解释为包括复数“一个或更多个”。
已经出于说明和描述目的呈现了本公开内容,而非旨在是穷举或限制。对于本领域普通技术人员而言,许多修改和变化将是明显的。选择并描述示例性实施方式是为了说明原理和实际应用,并且使得本领域的其他普通技术人员能够理解用于具有适合于预期的特定用途的各种修改的各种实施方式的公开内容。
因此,虽然本文参考附图已经描述了说明性示例实施方式,但是应当理解的是,这种描述不是限制性的,并且在不偏离本公开内容的范围或精神的情况下,本领域技术人员可以作出各种其他变化和修改。

Claims (20)

1.一种信息处理方法,包括:
从用户接收包括触发事件的用户输入;
响应于所述用户输入来识别活动媒体内容;以及
基于所述触发事件对所述活动媒体内容执行动作。
2.根据权利要求1所述的信息处理方法,其中,所述活动媒体内容包括音频媒体内容,并且其中,所述识别活动媒体内容包括识别当前播放的特定音频媒体文件。
3.根据权利要求1所述的信息处理方法,其中,所述识别活动媒体内容包括访问与所述活动媒体内容对应的时间表。
4.根据权利要求1所述的信息处理方法,其中,所述识别活动媒体内容包括识别所述活动媒体内容的频道。
5.根据权利要求1所述的信息处理方法,其中,所述执行动作包括将所述活动媒体内容与所述用户关联。
6.根据权利要求5所述的信息处理方法,还包括向所述用户提供与所述活动媒体内容有关的通知。
7.根据权利要求6所述的信息处理方法,其中,所述提供通知包括提供搜索所述活动媒体内容的提醒。
8.根据权利要求1所述的信息处理方法,其中,所述执行动作包括记录所述活动媒体内容。
9.根据权利要求8所述的信息处理方法,其中,记录所述活动媒体内容包括记录所述活动媒体内容的后续播放。
10.根据权利要求1所述的信息处理方法,其中,所述接收用户输入包括在信息处理设备上的虚拟助理处接收用户输入。
11.一种信息处理设备,包括:
至少一个处理器;
存储器设备,所述存储器设备存储能够由所述至少一个处理器执行以进行以下操作的指令:
从用户接收包括触发事件的用户输入;
使用所述至少一个处理器来识别活动媒体内容;以及
基于所述触发事件对所述活动媒体内容执行动作。
12.根据权利要求11所述的信息处理设备,其中,所述活动媒体内容包括音频媒体内容,并且其中,所述识别活动媒体内容包括识别当前播放的特定音频媒体文件。
13.根据权利要求11所述的信息处理设备,其中,所述识别活动媒体内容包括访问与所述活动媒体内容对应的时间表。
14.根据权利要求11所述的信息处理设备,其中,所述识别活动媒体内容包括识别所述活动媒体内容的频道。
15.根据权利要求11所述的信息处理设备,其中,所述执行动作包括将所述活动媒体内容与所述用户关联。
16.根据权利要求15所述的信息处理设备,还包括向所述用户提供与所述活动媒体内容相关的通知。
17.根据权利要求16所述的信息处理设备,其中,所述提供通知包括提供搜索所述活动媒体内容的提醒。
18.根据权利要求11所述的信息处理设备,其中,所述执行动作包括记录所述活动媒体内容。
19.根据权利要求11所述的信息处理设备,其中,所述接收用户输入包括在信息处理设备上的虚拟助理处接收用户输入。
20.一种计算机可读存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被执行时,执行一种信息处理方法,所述方法包括:
从用户接收包括触发事件的用户输入;
使用至少一个处理器来识别活动媒体内容;以及
基于所述触发事件对所述活动媒体内容执行动作。
CN201810638585.8A 2017-08-09 2018-06-20 信息处理方法、信息处理设备及计算机可读存储介质 Pending CN109388365A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/673,079 US10964316B2 (en) 2017-08-09 2017-08-09 Performing action on active media content
US15/673,079 2017-08-09

Publications (1)

Publication Number Publication Date
CN109388365A true CN109388365A (zh) 2019-02-26

Family

ID=65084698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810638585.8A Pending CN109388365A (zh) 2017-08-09 2018-06-20 信息处理方法、信息处理设备及计算机可读存储介质

Country Status (3)

Country Link
US (1) US10964316B2 (zh)
CN (1) CN109388365A (zh)
DE (1) DE102018119101A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190180883A1 (en) * 2017-12-11 2019-06-13 Teletracking Technologies, Inc. Milestone detection sensing
US11166063B1 (en) * 2020-12-08 2021-11-02 Rovi Guides, Inc. Enhanced set-top box control
US12105677B2 (en) * 2020-12-14 2024-10-01 Dropbox, Inc. Per-node metadata for custom node behaviors across platforms
EP4213145A1 (en) * 2022-01-14 2023-07-19 Vestel Elektronik Sanayi ve Ticaret A.S. Device and method for triggering a music identification application

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105320726A (zh) * 2014-05-30 2016-02-10 苹果公司 降低对手动开始/结束点和触发短语的需求
US20160335052A1 (en) * 2014-03-17 2016-11-17 Google Inc. Visual indication of a recognized voice-initiated action
CN106537901A (zh) * 2014-03-26 2017-03-22 马克·W·帕布利科弗 用于提供定制的娱乐内容的计算机处理方法和系统
CN106791958A (zh) * 2017-01-09 2017-05-31 北京小米移动软件有限公司 位置标记信息生成方法及装置
CN106796497A (zh) * 2014-09-12 2017-05-31 苹果公司 用于始终监听语音触发的动态阈值
CN107025906A (zh) * 2015-12-09 2017-08-08 联想(新加坡)私人有限公司 扩展语音识别的周期的方法和产品以及信息处理设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6662180B1 (en) * 1999-05-12 2003-12-09 Matsushita Electric Industrial Co., Ltd. Method for searching in large databases of automatically recognized text
US6535850B1 (en) * 2000-03-09 2003-03-18 Conexant Systems, Inc. Smart training and smart scoring in SD speech recognition system with user defined vocabulary
GB0015233D0 (en) * 2000-06-21 2000-08-16 Canon Kk Indexing method and apparatus
WO2005010866A1 (en) * 2003-07-23 2005-02-03 Nexidia Inc. Spoken word spotting queries
US7983915B2 (en) * 2007-04-30 2011-07-19 Sonic Foundry, Inc. Audio content search engine
US20100269145A1 (en) * 2009-04-17 2010-10-21 Apple Inc. Accessing radio content from a non-radio source
US10146316B2 (en) * 2012-10-31 2018-12-04 Nokia Technologies Oy Method and apparatus for disambiguating a plurality of targets
US9582246B2 (en) * 2014-03-04 2017-02-28 Microsoft Technology Licensing, Llc Voice-command suggestions based on computer context

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160335052A1 (en) * 2014-03-17 2016-11-17 Google Inc. Visual indication of a recognized voice-initiated action
CN106537901A (zh) * 2014-03-26 2017-03-22 马克·W·帕布利科弗 用于提供定制的娱乐内容的计算机处理方法和系统
CN105320726A (zh) * 2014-05-30 2016-02-10 苹果公司 降低对手动开始/结束点和触发短语的需求
CN106796497A (zh) * 2014-09-12 2017-05-31 苹果公司 用于始终监听语音触发的动态阈值
CN107025906A (zh) * 2015-12-09 2017-08-08 联想(新加坡)私人有限公司 扩展语音识别的周期的方法和产品以及信息处理设备
CN106791958A (zh) * 2017-01-09 2017-05-31 北京小米移动软件有限公司 位置标记信息生成方法及装置

Also Published As

Publication number Publication date
US10964316B2 (en) 2021-03-30
DE102018119101A1 (de) 2019-02-14
US20190051296A1 (en) 2019-02-14

Similar Documents

Publication Publication Date Title
US20210043219A1 (en) Personal audio assistant device and method
US20200201596A1 (en) Method and system for playback of audio content using wireless mobile device
US20150148093A1 (en) Battery pack with supplemental memory
CN105488112B (zh) 信息推送方法及装置
US9483110B2 (en) Adaptive media file rewind
CN109388365A (zh) 信息处理方法、信息处理设备及计算机可读存储介质
CN107025906A (zh) 扩展语音识别的周期的方法和产品以及信息处理设备
CN105653434A (zh) 对应用使用进行跟踪处理的方法及装置
WO2016042889A1 (ja) 情報処理装置、情報処理方法及びコンピュータプログラム
CN104378441A (zh) 日程创建方法和装置
CN105068976A (zh) 票务信息展示方法及装置
US20150195315A1 (en) Method and system for delivery of audio content for use on wireless mobile device
US10362391B2 (en) Adjusting audio content based on audience
CN115134653A (zh) 预测媒体路由
CN107342082A (zh) 基于语音交互的音频处理方法、装置及音频播放设备
TW201510854A (zh) 自動化耳機快取管理
US12080312B2 (en) Personal audio assistant device and method
CN107147957A (zh) 视频播放方法和装置
CN104750357A (zh) 备忘信息处理方法及装置
CN107959751A (zh) 音频播放方法及装置
US20230325884A1 (en) Advertisement Display Method and Electronic Device
JP2013247544A (ja) 携帯端末装置
CN104794074B (zh) 外接设备识别方法及装置
CN107295099A (zh) 推送消息处理方法、装置及存储介质
JP2012216185A (ja) 情報処理装置、情報処理方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190226