CN104205791A - 管理补充信息的回放 - Google Patents

管理补充信息的回放 Download PDF

Info

Publication number
CN104205791A
CN104205791A CN201280063654.8A CN201280063654A CN104205791A CN 104205791 A CN104205791 A CN 104205791A CN 201280063654 A CN201280063654 A CN 201280063654A CN 104205791 A CN104205791 A CN 104205791A
Authority
CN
China
Prior art keywords
information
audio content
audio
side information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201280063654.8A
Other languages
English (en)
Inventor
居伊·A·斯托里
道格拉斯·S·戈尔茨坦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Order C Compaq
Audible Inc
Original Assignee
Order C Compaq
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Order C Compaq filed Critical Order C Compaq
Publication of CN104205791A publication Critical patent/CN104205791A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B21/00Teaching, or communicating with, the blind, deaf or mute
    • G09B21/001Teaching or communicating with blind persons
    • G09B21/006Teaching or communicating with blind persons using audible presentation of the information
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

计算设备可以提供使得用户能够回放包括补充信息的音频内容的接口。所述补充信息可以例如对应于尾注、脚注、术语表、附录;来自作家、编者、或其它方的评论;或对应于附加补充信息。在所述音频内容的回放期间,用户可以指示应播放与所述音频内容的当前回放位置相关联的补充信息项。在一些实施方案中,这种指示可以响应于对所述用户补充信息是可用的指示。然后,所述设备可以回放与所述当前回放位置相关联的所述补充信息。

Description

管理补充信息的回放
发明背景
传统印刷书、电子书或其它印刷介质(无论是以电子还是以实体形式)常常包含主文本和附加补充信息,诸如脚注、尾注、术语表和附录。这些补充信息项常常包含有用的或有趣的信息,诸如关于主文本、外部引用、或评论的附加背景或解释性文本。
经常地,印刷介质被转换成音频格式。一般地,这可能涉及叙述和记录对印刷介质的读取。因此,可以使得最终的音频书或音频内容对用户而言是可用的。可以在广泛范围的设备上回放音频内容,所述设备诸如笔记本和平板计算机、移动电话、个人音乐播放器、电子书(“eBook”)阅读器、和其它音频回放设备或具有音频回放能力的设备。
附图简述
通过参照结合附图所做的下列详细描述,本公开的前述方面和许多伴随优势将变得更加容易领悟,因为它们变得更好理解,在附图中:
图1为描绘被被配置成实现补充音频信息的回放的计算设备的说明性实施方案的框图;
图2为描绘说明性操作环境的示意框图,在该环境中,图1的计算设备可以与电子市场互动以获取音频内容和补充信息;
图3为包括补充信息的音频内容的说明性图解表示或可视化;
图4A-4D描绘可以用来促进补充音频信息的回放的说明性用户接口;并且
图5为描绘用于补充音频信息的回放的说明性例程的流程图。
具体实施方式
本公开的大体描述的方面涉及关于计算设备的补充音频信息的输出。具体地,公开了用于控制包括一个或多个补充信息项(诸如脚注、尾注、术语表信息、或评论)的音频内容的回放的系统和方法。例如,用户可以利用诸如个人音乐播放器的计算设备以便获得对包括补充音频信息的音频内容的访问。在听取音频内容时,用户可以接收补充信息是可用的并且与最近播放的或即将出现的音频内容相关联的指示。该补充信息可以对应于音频内容从其产生的印刷文本内所包含的信息。例如,脚注、尾注、术语表、和附录都可以构成补充信息。此外,补充信息可以对应于其它信息,诸如作家或编者评论、或来自已经购买音频内容的其它用户的评论。再者,补充信息可以对应于由用户的联系人所产生的评论。这样的联系人可以经用来检索音频内容的电子市场、通过一个或多个社交连网系统、或通过其它系统与用户相关联。
例如,本公开的实施方案可以能够(通过因特网和/或另一个数据网络)与外部社交连网系统通信。社交连网系统可以托管社交连网网站,该社交连网网站提供让用户设置社交连网账户(以变成“会员”)并且与其它会员建立联系或“朋友”关系的功能。这样的社交连网系统和网站的示例包括FacebookTM、MySpaceTM、MixiTM、和LinkedInTM。为了经这样的系统建立“联系人”或“朋友”关系,一个会员通常通过与社交连网系统的互动来启动将邀请(有时也称为“朋友请求”或“连接请求”)传输到另一个会员。如果接收请求的会员接受该邀请(诸如,通过点击接受按钮或链接),社交连网系统产生指示两个用户为彼此的联系人的数据库记录或输入。
社交连网系统可以包括服务接口,该服务接口包括API(应用程序编程接口),其使得外部系统能够检索会员个人资料信息以及将信息邮递给会员个人资料库。本公开的实施方案可以使用该服务接口来检索社交连网系统的特定会员的社交连网个人资料信息。例如,本公开的实施方案可以对社交连网系统进行API调用以请求社交连网系统的特定会员的社交连网数据。在于2010年8月30日提交的且标题为“CUSTOMIZING CONTENT BASED ON SOCIAL NETWORKINFORMATION(基于社交网络信息的定制化内容)”的美国专利申请No.12/871,733中给出了用于判定用户的联系人的进一步的示例,该美国专利申请以其整体据此通过引用并入。
被提供有音频内容的补充信息可以或可以不被包含在对应的印刷文本内。在接收补充信息是可用的指示之后,用户可以输入指示他们希望听取补充信息的命令。在一些实施方案中,在补充信息是可用的点之前或之后的一段时间可以接收命令(例如,可以为用户预留n秒以在其间输入命令)。该命令可以在个人音乐播放器处通过任意输入(诸如,按钮的按压)而获得,或,在个人音乐播放器装有麦克风或其它音频输入的情况下,口述命令。在接收命令之后,个人音乐播放器可以随之将补充信息输出给用户。用作说明地,在播放补充信息之后,个人音乐播放器可以在用户输入命令的位置处或在靠近用户输入命令的位置处返回到音频内容。
如将在下文描述的,各实施方案可以排外地使用或结合上文描述的说明性实例使用。例如,在一个实施方案中,个人音乐播放器可以不输出补充信息是可用的指示,或可以仅指示将是用户特别感兴趣的补充信息的可用性。防止指示每个补充信息项可能是有益的,例如,在补充信息量大的情况下或在补充信息频繁可用的情况下。用作说明地,可以提供包含关于音频内容内的字符、术语、位置、或实体的解释信息的音频内容的术语表或附录。可能不期望在每次提及音频内容内的那些字符、术语等时指示这种补充信息的存在。替代地,个人音乐播放器可以被配置成接收在音频内容内的任意点处播放补充信息的命令,并且可以搜索对应于音频内容中最近叙述的词语的补充信息。用作说明地,如果音频内容的回放提及用户不熟悉的字符名称,则用户可以输入搜索补充信息的命令。个人音乐播放器可以检测音频最近讨论的字符,并且定位与该字符相关联的对应的补充信息。以这种方式,可以为听取音频内容的用户提供对与给于文本的阅读器相同的参考信息的访问。在这些实施方案中,如果不能找到与当前回放位置相关联的补充信息,则可能播放错误。
在一些实施方案中,音频内容可以与对应的文本内容相关联。例如,个人音乐播放器可以存储音频内容和对应的文本。在某些情况下,对应的文本可以是音频内容从其产生的书。在其它情况下,文本可以是从音频内容产生的转录物。例如,一些实施方案或本公开可以包括用于处理多个内容项(例如,音频内容和文本内容)以及判定这样的内容项是否能够同步化的伴随识别模块(在图1-9内未示出)。伴随识别模块可以使用与内容项相关的产品标识符和/或元数据(例如,标题、作者、编辑等)来识别可同步化的内容。比如,这样的信息能够用来判定不同格式/版本的相同或类似内容(诸如,给定的电子书和给定的音频书)为伴随内容。在一些实施方式中,伴随识别模块可以通过应用过滤、拼写/语法检查、和任意其它适当的自动化算法进一步处理内容信息以识别伴随内容。此外,伴随识别模块能够包含附加参考材料以比如通过访问统一资源标识符来识别内容匹配。此外,伴随识别模块可以比较内容对或内容的其它组合以例如通过以通用格式使各内容对/组合相关联来判定各对/组合是否为伴随内容。更具体地,如果内容信息对应于与内容(例如,音频书)的特定表示的显示相关的信息,则伴随识别模块可以将内容的至少一部分转换成对应于不同版本的内容的格式(例如,将音频转换成特定的电子书格式)和/或转换成通用格式(例如,文本)。转换的内容信息能够与其它内容信息相关联以判定各对内容是否为能够被同步化的伴随内容。在其它实施方式中,伴随识别模块可以提示用户输入一个或多个内容的数据(例如,标题、作者、编辑等)。伴随识别模块可以比较数据以便识别伴随内容。在另一些其它实施方式中,伴随识别模块可以提示用户以确认第一和第二内容为伴随内容。
本领域的技术人员将理解,即使第一内容和第二内容可能为伴随内容,第一内容也可能不与第二内容精确关联。例如,由于音频书的叙述脚本与电子书的文本之间的差别,编辑之间的差别,“前页”中的差别(例如,音频制作的引言、目录、索引等)和/或“后页”,未删节版本和删节版本之间的差别,内容的格式上的差别,设备能力上的差别等,The Adventures of Tom Sawyer(《汤姆·索亚历险记》)的音频书可能显示不与The Adventures of Tom Sawyer(《汤姆·索亚历险记》)的电子书一一对应。由于潜在伴随内容的这样的未校正的部分的存在,伴随识别模块能够被配置成识别内容对/组合中包括失配部分的伴随内容。虽然下文将参考未删节版本的电子书与删节版本的对应的音频书相关联的部分提供更多细节,但是所描述的概念可以适用于其中第一和第二内容包括失配部分的任意应用。
如上所指出的,当使未删节版本的电子书与删节版本的对应的音频书相关联时,失配会因多个来源而产生,所述多个来源诸如删减、修改、新材料的插入、或其任意组合。然而,删节版本的电子书可以包括可以与删节版本的音频书深度关联的未修改材料的大部分。因此,在一些实施方案中,伴随识别模块可以使用解决“最长公共序列”问题的算法来检测删节版本和未删节版本内容之间的失配,这种算法的实施方式能够在例如UNIX“差异”操作中找到。伴随识别模块因此能够为不同版本的相关的部分生成内容同步化信息,并且为用户的计算设备提供内容同步化信息以便当使删节音频书与未删节电子书的显示同步化时使用。更具体地,类似于完整的书和完整的音频书如何相关联,伴随识别模块能够使未修改的材料相关联。然而,对于具有小规模修改的删节版本的段落,伴随识别模块可以使修改的材料相关联并且生成这些部分包括一些失配的指示符。虽然删节版本中的新的和删除的材料可以不与完整版本相关联,但是这些不相关的段落和修改的材料能够经处理从而提供最有用且自然的用户体验。这可以包括禁用同步显示特征的子集和/或提供小规模失配的指示。作为非限制性示例,当用户在通过文本的同步化突出显示来看未删节电子书的同时听取删节音频书时,小规模修改可以不同地突出显示以指示音频回放不完全匹配写入文本。类似的技术能够在将未删节音频书与伴随未删节电子书相关联时应用,因为一些材料在这些版本之间可能不匹配。
现在将概括地描述能够由伴随识别模块实施以便处理失配的说明性方法。首先,能够将可能的伴随内容转换成通用格式,诸如文本和/或音位。然后,能够执行做出以小规模(例如,在词语层面上)匹配内容的尝试。由于缺失的或增加的段落能够包括较大的不匹配部分(例如,整个句子或段落),所以能够针对句子、段落、和/或其它文本单元计算指示失配频率的段落失配分数。例如,段落失配分数可以代表文本(例如,句子、段落、或页)的较大部分的词语适配数量和/或百分比。能够识别与相邻的序列相比具有相似高失配频率的较大部分的序列(其中“高”能够从分析已知伴随内容的相关性以经验为主地设置)。这些序列可以代表不应与伴随内容对中的其它内容同步化的内容。能够删除任一或两个内容中的高失配段落,并且能够以较小的规模(例如,在词语层面上)重新尝试匹配。元数据能够基于该(这些)相关性而生成以判定内容同步化信息的对齐点。元数据还可以包括信息识别伴随内容中的至少一个中的匹配部分开始/结束的参考点。在于2011年3月23日提交的且标题为“SYTEMS ANDMETHODS FOR SYNCHRONIZING DIGITAL CONTENT(用于同步化数字内容的系统和方法)”的美国专利申请No.13/070,313中给出了文本和音频内容的同步化的进一步的示例,该美国专利申请以其整体据此通过引用并入。
在这些实施方案中,音频和文本内容的相关性可以用来提供附加功能或用来进一步增强上文描述的特征。例如,如上文所描述的,当补充信息项的回放已经结束时,播放可以从用户发出播放补充信息的命令的点或该点附近继续。用作说明地,回放可以恰好在命令被接收的点处或那个点之前的一些固定的时间段(例如,3秒或5秒)恢复。然而,在信息关于对应于播放的音频的文本的信息已知的实施方案中,回放可以在至少部分地基于对应的文本判定的的点处恢复。例如,回放可以在音频内容中的恰好在用户指示的补充信息应被播放的口述句子之前的点处恢复。在其它实施方案中,回放可以在段落、词语、或文本的其它单元的开头处恢复。在这些实施方案中,对于已经播放过的补充信息,可以抑制补充信息的指示符。
音频和文本之间的相关性可以进一步用来增强上文的实施方案。例如,在用户可以请求关于任意字符、术语等的补充信息的实施方案中,通过发送播放补充信息的命令,个人音乐播放器可以使用对应于最近播放的音频的文本在所提供的术语表或附录中搜索这样的术语。
在一些实施方案中,补充信息项可以与主音频内容内的多个位置相关联。例如,补充信息可以与音频内容的章内的位置相关联,并且还与该章的结尾相关联。以这种方式,用户可以有多个机会听取补充信息项。此外,补充信息项可以与另一个补充信息项内的位置相关联。例如,补充信息的第一项可以与主音频内容中的位置相关联,并且补充信息的第二项可以与补充信息的第一项中的位置相关联。补充信息的第二项本身可以具有与之相关联的一个或多个附加补充信息项。因此,可以提供多层次补充信息,各新层次与先前层次或主音频内容相关联。在补充信息的关联性将促使补充信息在音频内容的回放内多次可用的实施方案中,在首先指示补充信息是可用的之后,可以抑制该补充信息的可用性的指示。在其它实施方案中,在已经充分播放补充信息之后,可以抑制补充信息的指示。
在一些实施方案中,可以将音频内容和补充信息存储在回放设备的数据存储区内。在其它实施方案中,可以将音频内容和/或补充信息存储在远离回放设备的诸如远程服务器上。用作说明地,回放设备可以被配置成从远程服务器检索音频内容和/或补充信息。在一些实施方案中,可以在与音频内容大致相同的时间检索与音频内容相关联的补充信息。在其它实施方案中,回放设备可以被配置成定期地检索补充信息。例如,回放设备可以每隔n小时查询与音频内容相关联的远程服务器以便判定新的补充信息是否为可用的。在进一步的实施方案中,回放设备可以向远程服务器查询与当前播放的音频内容相关联的补充信息。在又一些其它实施方案中,远程服务器可以被配置成向回放设备通知可用的补充信息。
在一些实施方案中,回放设备的用户可以指定期望的补充信息类型。例如,用户可以指定,应播放与作者相关联的补充信息(例如,脚注、术语表、作者评论等),而不应播放与出版者相关联的补充信息(例如,编者评论等)。此外,用户可以指定,应播放与用户的联系人相关联的补充信息,而不应播放与从其获取音频内容的电子市场的一般用户相关联的补充信息。
在进一步的实施方案中,回放设备的用户可以指定期望的补充信息种类。例如,在已经从电子市场获取音频内容的情况下,电子市场可以将补充信息项分类为一个或多个种类。这样的种类的示例包括但不限于“最受好评的”、“搞笑的”、“有深刻见解的”、“信息量大的”和“有趣的。”用作说明地,用户可以指定,仅被列出为“最受好评的”或“搞笑的”的补充信息应被显示以便回放,而其它补充信息应被排除在外。在一些实施方案中,在用户已经排除一些类型的补充信息并且补充信息离回放设备远程地被存储的情况下,可以不必让回放设备检索远程存储的补充信息。
虽然先前的描述涉及个人音乐播放器,但是根据本公开,可以使用能够向用户显示音频内容的任意计算设备。这样的计算设备能够包括但并不限于膝上型计算机、个人计算机、平板计算机、个人数字助理(PDA)、混合PDA/移动电话、移动电话、电子书阅读器、数字媒体播放器、计算设备中内含的集成部件、电气用具、车辆或机械中内含的电子设备、游戏设备、机顶盒、电视中内含的电子设备等。这些计算设备可以与多个视觉输出设备、触觉输出设备、或听觉输出设备中的任一个相关联,并且可以与用于用户输入的多个设备相关联,所述用于用户输入的多个设备包括但不限于键盘、鼠标、轨迹球、轨迹板、操纵杆、输入板、指点杆、触摸屏、远程控件、游戏控制器、运动检测器等。
此外,音频内容能够参考包含能够由用户直接或间接地访问的音频信息的任意数据,包括但不限于多媒体数据、数字视频、音频数据、电子书(“eBook”)、电子文档、电子出版物、计算机可执行代码、以上中的部分等。对文本内容或其它视觉显示的内容的参考应被理解为,包括任意形式的视觉或触觉内容,包括文本、图像、图表、图形、幻灯片、地图、盲文、浮雕图像、或能够以视觉或触觉介质显示的任意其它内容。内容可以存储在计算设备上,可以由计算设备产生,或可以跨网络流动以便显示或输出在计算设备上。而且,可以从多个源中的任一个获得内容,所述多个源包括网络内容提供者、局部数据存储区、计算机可读介质、远程或本地运行的内容生成算法(例如,文本到语音算法)、或通过用户输入(例如,由用户输入的文本)。可以从任一个源或源的组合获得、存储、或传送内容,如上文所描述的。
图1为图示配置成实现包括补充信息的内容的回放的计算设备100的实施方案的框图。计算设备100可以具有与网络接口104、显示器接口106、计算机可读介质驱动器108、和输入输出设备接口110通信的一个或多个处理器102,所有这些处理器借助通信总线相互通信。网络接口104可以提供到一个或多个网络或计算系统的连接性。该(这些)处理器102可以因此经网络从其它计算系统或服务接收信息和指令。该(这些)处理器102还可以与存储器112通信以及从存储器112进行通信并且经显示器接口106和/或输入/输出设备接口110进一步提供输出信息或接收输入信息。输入/输出设备接口110可以接受来自一个或多个输入设备124的输入,所述一个或多个输入设备124包括但不限于键盘、鼠标、轨迹球、轨迹板、操纵杆、输入板、指点杆、触摸屏、远程控件、游戏控制器、心律监视器、速度传感器、电压或电流传感器、运动检测器、转发器、全球定位系统、射频识别标签、或能够从用户获得位置或大小值的任意其它输入设备。输入输出接口还可以经一个或多个输出设备122提供输出,所述一个或多个输出设备122包括但不限于一个或多个扬声器或任意各种数字或模拟音频能力输出端口,包括但不限于耳机插孔、1/4英寸插孔、XLR插孔、立体声插孔、蓝牙链路、RCA插孔、光学端口或USB端口,如上文所描述的。显示器接口106可以与合并了多种有源或无源显示技术(例如,电子墨水、LCD、LED或OLED、CRT、投射、全息图像、三维成像系统等)或盲文或其它触觉信息显示技术中的任一种的任意数量的视觉或触觉接口相关联。
存储器112可以包括该(这些)处理器102执行以便实施一个或多个实施方案的计算机程序指令。存储器112一般包括RAM、ROM和/或其它永久或非暂态计算机可读存储介质。存储器112可以存储显示模块114以便管理信息经显示器接口106和/或输入输出接口110输出到显示器和/或其它输出设备122。存储器112可以还包括用户控制模块116,该用户控制模块116管理并获得一个或多个输入设备124经输入/输出设备接口110接收的用户输入信息。在一个实施方案中,用户控制模块116此外还可以解释用户输入信息以便开始补充信息的回放。存储器112可以进一步存储补充信息模块118。在一个实施方案中,补充信息模块118可以检测与最近播放的或即将出现的音频内容项(例如,经显示模块114输出)相关联的补充信息的存在。补充信息模块118可以促使显示模块114输出补充信息是可用的指示。该指示可以对应于经输出设备122的任意类型的可能的输出。例如,该指示可以对应于经扬声器或头戴式耳机的音频输出。该音频内容可以包括音调、铃声、语音指示、或指示附加内容的存在和可用性的其它声音。此外,该指示可以对应于经显示器接口106的视觉输出。再者,该指示可以对应于触觉指示,诸如由显示器接口106包括的或以其它方式提供的触觉反馈设备引起的振动。
此外,补充信息模块118可以经用户控制模块116接收和解释用户输入以判定是否促使补充信息的回放。当播放补充信息的命令被接收时,补充信息模块118可以促使经输出设备122回放与音频回放的当前点相关联的补充信息。再者,补充信息模块118可以解释在补充信息的回放期间接收的命令。如上所述,补充信息本身可以与一个或多个补充信息项相关联。用作说明地,补充信息模块118可以解释在第一补充信息项的回放期间接收的输入以指示播放与第一补充信息相关联的第二补充信息项的命令。在一些实施方案中,用户可以发送命令以停止补充信息项的回放。补充信息模块118可以将接收的输入解释为这样的命令并且促使显示模块114恢复回放先前的内容项(即,在当前音频内容项的回放之前播放的补充信息或主音频内容)。
图2为描绘说明性操作环境的示意框图,在该环境中,图1的计算设备可以与电子市场150互动以获取音频内容和补充信息。如图2所示,该操作环境包括经网络130与电子市场150通信的一个或多个用户计算设备100,诸如,图1的计算设备。
本领域的技术人员将理解,网络130可以是任意有线网络、无线网络或其组合。此外,网络130可以是个域网、局域网、广域网、电缆网、卫星网、蜂窝电话网、或其组合。在图示的实施方案中,网络130为因特网。用于经因特网或任何其它上述类型的通信网络通信的协议和部件已为计算机通信领域的技术人员所熟知并且因此不必在本文中更详细地描述。
因此,关于音频内容,用户使用他或她的用户计算设备100可以与电子市场150通信。电子市场150还可以使关于音频内容的补充信息为可用的。在一个实施方案中,用户利用他或她的计算设备100可以浏览通过电子市场150变得有用的音频内容的描述。在另一个实施方案中,用户利用他或她的计算设备100可以获取期望的音频内容或关于来自电子市场150音频内容的补充信息。
电子市场150在图2中图示为在包括使用一个或多个网络互连的一些计算机系统的分布式计算环境中工作。更具体地,电子市场150可以包括以下更详细地讨论的市场服务器156、内容目录152、补充信息目录154、和分布式计算环境155。然而,本领域的技术人员可以理解的是,电子市场150可以具有比在图1所示的更少或更多的部件。此外,电子市场150能够包括各种网络服务和/或对等网络配置。因此,图1中的电子市场150的描绘应被视为说明性的并且不限制于本公开。
市场服务器156、内容目录152、和补充信息目录154中的任一个或多个可以以多个部件实现,各部件执行相应的市场服务器156、内容目录152、和补充信息目录154的实例。实施市场服务器156、内容目录152、和补充信息目录154中的任一个的服务器或其它计算部件可以包括网络接口、存储器、处理单元、和计算机可读介质驱动器,所有这些部件都可以以通信总线的方式相互通信。网络接口可以通过网络130和/或其它网络或计算机系统提供连接性。处理单元可以与包含程序指令的存储器通信以及从所述存储器进行通信,处理单元执行所述程序指令以便操作相应的市场服务器156、内容目录152、和补充信息目录154。存储器一般可以包括RAM、ROM、其它永久性和辅助存储器、和/或任意非暂态计算机可读介质。
在该说明性示例中,内容目录152和补充信息目录154能够由分布式计算环境155实施。此外,在一些实施方案中,市场服务器156或电子市场150的其它部件可以由分布式计算环境实施。在一些实施方案中,整个电子市场150可以由分布式计算环境150实施。
分布式计算环境155可以包括一系列托管的与电子市场150或第三方有关的迅速提供和释放的计算资源。计算资源可以包括相互通信的多个计算设备、连网设备和存储设备。在一些实施方案中,计算设备可以对应于实体计算设备。在其它实施方案中,计算设备可以对应于由一个或多个实体计算设备实施的虚拟机实例。在又一些其它实施方案中,计算设备可以对应于虚拟计算设备和实体计算设备两者。
例如,分布式计算环境155可以包括在多个远程计算节点之间的虚拟局域网络或其它虚拟网络,该虚拟局域网络或其它虚拟网络通过在分离该多个计算节点的一个或多个中间实体网络上创建重叠网而提供。在各实施方案中,可以以不同的方式实施重叠网,所述方式诸如通过在一个或多个中间实体网络的连网协议所使用的较大的实体网络地址空间中嵌入虚拟网络的虚拟网络地址信息而实现的无包封通信(without encapsulating communication)。作为一个说明性示例,虚拟网络可以使用32位IPv4(“网际协议版本4”)网络地址来实施,并且诸如通过为通信分组或其它数据传输重新加标题(reheadering)(例如,使用无状态IP/ICMP转换、或SIIT)、或以其它方式修改这样的数据传输以将它们从它们被配置的第一连网协议转换成不同的第二连网协议,那些32位虚拟网络地址可以作为由一个或多个中间实体网络使用的128位IPv6(“网际协议版本6”)网络地址的部分而嵌入。更一般地,在一些实施方案中,根据第一网络寻址协议指定的N位网络地址可以作为根据第二网络寻址协议指定的另一个M位网络地址的部分而嵌入,其中“N”和“M”是对应于网络寻址协议的任意整数。此外,在至少一些实施方案中,诸如如果一组所感兴趣的N位网络地址可以使用较小的位数来表示,则可以使用多于或少于N位的另一个网络地址将N位网络地址嵌入另一个网络地址中(例如,L位标签或标识符映射到具体的N位网络地址且嵌入在另一网络地址中,其中“L”小于“N”)。与SIIT相关的其它细节可在2000年2月的“Request For Comments2765—Stateless IP/ICMP TranslationAlgorithm(请求评论2765-无状态IP/ICMP转换算法)”(http://tools.ietf.org/html/rfc2765)中获得,其以整体据此通过引用并入。可以从将虚拟网络地址信息嵌入下面的实体底层网络的实体网络地址而获得各种益处,所述益处包括使得虚拟网络能够叠加在实体底层网络上,无包封通信或构成实体底层网络的连网设备。此外,在至少一些实施方案和情况中,其它信息同样可以嵌入较大实体网络地址空间中以便在计算节点之间通信,诸如针对包括那些计算节点的具体虚拟网络(例如,以其为代表那些计算节点运行的实体的虚拟网络)的标识符。
此外,在至少一些实施方案中,在其间配置通信的计算节点可以是实体计算系统和/或可以是各自被托管在一个或多个实体计算系统上的虚拟机,并且通信可以包括各种格式的数据(例如,消息、数据包、帧、流等)的传输。此外,在至少一些实施方案中,计算节点中至少一些可以是代表服务的多个客户或其它用户执行多个程序的程序执行服务(或“PES”)的部分,所述程序执行服务诸如使用多个实体网络(例如,数据中心内的多个实体计算系统和网络)上的多个计算系统的程序执行服务。在至少一些这样的实施方案中,用于程序执行服务的一个或多个系统管理器模块可以诸如基于代表客户或其它实体执行程序的计算节点来跟踪和/或管理哪个计算节点属于哪个虚拟网络,如下文更详细地讨论的。分布式计算环境的进一步的示例在2011年1月4日发行的且标题为“Configuring CommunicationsBetween Computing Nodes(在计算节点之间配置通信)”的美国专利No.7,865,586中给出,该美国专利以其整体据此通过引用并入。分布式计算环境也可以被称为云计算环境。
进一步参照图2,现在将讨论电子市场150的说明性部件。市场服务器156可以使得能够浏览和获取可从电子市场150获得的音频内容和/或关于音频内容的补充信息。此外,市场服务器156可以将音频内容和/或补充信息传输至用户计算设备100。
内容目录152可以包括关于可从电子市场150获得的音频内容的信息。补充信息目录154可以包括可从电子市场150获得的补充信息。借助非限制性示例,这样的补充信息可以包括由作者、编者、出版者、电子市场150的用户、或其它第三方提供或生成的补充信息。因此,市场服务器156可以获得由电子市场150提供的音频内容的音频内容信息以及由电子市场150提供的补充信息,并且可以使得这样的音频内容和补充信息对来自诸如网站的单个网络资源的用户有用。用户可以因此从电子市场150获取音频内容和/或补充信息。
用作说明地,市场服务器156可以产生一个或多个用户接口,利用用户计算设备100或不同的计算设备的用户通过所述一个或多个用户接口可以浏览由电子市场150提供的音频内容和/或补充信息,上传用于匹配音频内容和/或补充信息、视图信息和关于特定音频内容和/或补充信息的细节的查询,并且获取音频内容和/或补充信息。
在用户从电子市场150选择期望的音频内容和/或补充信息之后,市场服务器156可以促进音频内容和/或补充信息的获取。就这点而言,市场服务器156可以从用户计算设备100或不同的计算设备接收支付信息。此外,市场服务器156可以将音频内容和/或补充信息传输至用户计算设备100。
在一些实施方案中,市场服务器156在获取音频内容项之后可以通知用户计算设备100或与音频内容相关联的最新可用的补充信息。在更多实施方案中,市场服务器156可以使得音频内容和/或补充信息能够从内容目录152或补充信息目录154流到用户计算设备100。
虽然本文中的描述参考与电子市场150相关联的目录,但是在一些实施方案中,回放设备可以获得来自附加或替代源的音频信息或补充信息,诸如第三方内容目录或补充信息目录。
图3为包括补充信息的音频内容的说明性图解表示或可视化。如图3中所示,音频内容对应于音频书“The Adventures of Tom Sawyer(《汤姆·索亚历险记》)”。主音频内容204代表音频书的除补充信息以外的内容。用作说明地,主音频内容204能够代表音频内容的视觉地图,使得音频内容204的持续时间从左到右显示。如图3还示出,主音频内容204与补充信息206-214相关联。各补充信息项206-214与主音频内容204或另一个补充信息项206-214中的一个或多个点X1-X6相关联。尽管本文的描述参考音频内容204中的特定点,但在一些实施方案中,补充信息可以与音频内容204内的一系列点或与音频内容204的指定的持续时间相关联。如上所讨论的,补充信息可以包括脚注(补充信息206和210)、编者评论(补充信息208和212)、或附加内容(补充信息214)。附加内容可以对应于上文描述的其它类型的补充信息,诸如作者评论或音频内容的其它读者的评论。
现在将参考图3描述与音频内容202的说明性用户交互。用作说明地,书202的音频内容可以由计算设备(诸如,图1的设备100)播放,在204的左边开始并且继续进行到右边。在点X1处;计算设备100可以向用户指示补充信息206可用于回放。用户可以输入应播放补充信息206的命令。在该点,音频内容202的回放可以临时停止,并且补充信息206的回放可以开始。在完成补充信息206的回放之后,音频内容204的回放可以恢复。如上所讨论的,回放可以在点X1处或靠近点X1处(诸如,在X1之前的设定时间量(例如,3秒),或包含X1的句子或段落的开头)恢复。
随着回放进入到X2,设备100能够指示补充信息208的可用性。如上所述,这样的指示可以对应于视觉指示、音频指示,触觉指示、或其中的任意组合。如上所述,可以给用户一段时间(例如,10秒)来命令补充信息的回放。在该示例中,如果用户不输入播放补充信息208的命令,则音频内容202的回放继续。
在点X3处,设备100可以指示补充信息210的可用性,并且接收播放内容210的用户命令。如在图3中所显示,补充信息210本身与补充信息212相关联。在补充信息210的回放期间在点X6处,设备100能够指示补充信息212的可用性并且接收播放内容212的命令。在补充信息212的回放期间,设备100可以从用户接收停止补充信息212的回放的命令。在一些实施方案中,这可以在点X6处或靠近点X6处终止内容212的回放并且恢复内容210的回放。在其它实施方案中,在补充信息212的回放期间接收的命令可以在点X3处或靠近点X3处恢复主音频内容204的回放,所述点X3为音频内容204的最后一个播放点。
随着主音频内容的回放继续,可能遇到与先前播放的补充信息项210相关联的点X4。在一些实施方案中,如果补充信息210已经被播放,则设备100可以不指示补充信息210在X4处的存在。在其它实施方案中,只有在补充信息210完全被播放的情况下,才可以抑制指示。在又一些其它实施方案中,指示可以总是被播放。
在点X5处,设备100可以指示补充信息214的存在。如上所述,用户可以向设备100输入命令以指示希望播放补充信息214。如果该输入被接收,则补充信息214被播放。否则,主音频内容204的回放继续进行,直至它到达音频内容204的结尾或直至促使音频内容204停止播放的用户输入被接收为止。
图4A-4C描绘由允许回放以及和补充的音频内容互动的计算设备(诸如,图1的计算设备100)显示的说明性用户接口300。在这些示例中,音频内容说明性地对应于图3的音频内容204。音频内容204的标题显示为“The Adventures of Tom Sawyer(《汤姆·索亚历险记》)”301。用户接口300包含多个输入控件302-304,这些输入控件302-304中的每一个可以由用户选择以显示用户接口300的不同的方面。如图4A中所图示,对应于“现在播放”的输入控件302当前被选择。进一步的输入控件316-320允许由用户进行各种输入,诸如利用输入控件316倒回回放一段时间,利用输入控件318(取决于回放状态,输入控件318的显示可以在播放和暂停符号之间更改)开始和停止回放,和利用输入控件320对当前位置标书签。接口包括:音频内容信息312,诸如与音频内容、标题、作者、和讲述人信息相关联的图形;和章指示符309,其显示准备回放的音频内容204的当前章。
接口300还包括:内容指示符310,其指示章的当前内容;以及进程指示符311,其指示在当前选择的章内的回放位置。用作说明地,进程指示符311的位置可以对应于图3的与补充信息206相关联的位置X1。因此,用户接口300还包括指示补充信息206的可用性的输入控件314。如上所述,输入控件314可以在位置X1之前或之后显示一段时间,以允许用户有时间请求补充信息206的回放。在输入控件314的选择之后,音频内容204的回放可以临时终止,并且补充信息206的回放可以开始。
图4B描绘在补充信息(诸如,补充信息206)项的回放期间的说明性用户接口300。如图3B中所示,可以更改内容指示符310以指示主音频内容的回放已经被临时停止。此外,用户接口300可以包括描述当前播放的补充信息的补充信息标题指示符402。可以提供显示当前播放补充信息内的内容和位置的补充信息指示符404。用户接口300还包括允许用户停止回放当前补充信息并且返回到主音频内容的输入控件406。如上所述,主音频内容的回放可以在它终止的点或附近的点(诸如段落或句子的开头,或一段时间(例如,3秒)之前的点)处恢复。尽管图4B的用户接口300显示仅输入控件406返回到主音频内容,但在一些实施方案中,附加输入控件可以被提供以播放与当前播放的补充信息相关联的附加补充信息,如上文所描述的。
图4C描绘在用户选择输入控件308之后的说明性用户接口300,该输入控件308被配置成促使显示与当前加载的音频内容相关联的补充信息。在当前的示例中,各输入控件506-510可由用户选择以播放独立于主音频内容的相关联的补充信息。在一些实施方案中,经输入控件502-510选择补充信息项可以促使独立于音频内容的内容被播放。在其它实施方案中,经输入控件502-510选择补充信息可以促使所选择的内容被播放,并且进一步促使音频内容的回放从与补充内容相关联的点开始。图4C的用户接口300可以还包括输入控件520,该输入控件520可由用户选择以显示用户接口300的不同的方面,诸如用户接口300的使得用户能够指定关于补充信息的偏好的一部分。
图4D描绘在用户选择输入控件520之后的说明性用户接口300,该输入控件520被配置成促使显示用户接口300的使得用户能够指定关于补充信息偏好的一部分。在一些实施方案中,这样的用户偏好可以针对当前描绘的音频内容(例如,“The Adventures of Tom Sawyer(《汤姆·索亚历险记》)”)。在其它实施方案中,可以为所有音频内容或为音频内容的特定设置指定用户偏好。
图4D的说明性用户接口300包含使得用户能够指定应提供的各种类型的补充信息的用户可选的输入控件552-558。例如,输入控件552对应于作者提供的补充信息,所述补充信息可以包括例如脚注、尾注、术语表信息、或作者评论。输入控件554对应于出版者提供的补充信息,所述补充信息可以包括由音频内容的出版者提供的编者评论或附加信息。输入控件556和558对应于与电子市场150的其它用户相关联的补充信息。具体地,输入控件556对应于与用户接口300的当前用户相关联的用户。在一些实施方案中,这些相关联的用户可以对应于电子市场150中的被指定为联系人或“朋友”的用户。在其它实施方案中,这些相关联的用户可以对应于经外部系统(诸如,与电子市场150通信的一个或多个社交连网系统)被指定为联系人或“朋友”的用户。此外,输入控件558对应于电子市场150的不一定被指定为当前用户的联系人或“朋友”的一般用户。
用作说明地,在与补充信息相关联的音频内容的回放期间或之前,选择输入控件552-558中的一个或多个可以促使计算设备100检索由对应的源(例如,作者、出版者、朋友或其它用户)提供的补充信息。可以经网络130例如从图2的电子市场150检索补充信息。在一些实施方案中,可以从电子市场150检索补充信息,无论输入控件552-558的用户选择如何。例如,在回放对应的音频内容之前检索补充信息的情况下,无论输入控件552-558的用户选择如何,对补充信息的检索可以使得用户能够立即选择新的补充信息以便回放,无需等待检索新的补充信息。在更多实施方案中,在音频内容的回放期间,输入控件552-558中的一个或多个的用户选择可以使得启用或禁用相关联的补充信息的可用性。例如,取消选择输入控件552可以禁用对由音频内容的作者产生的补充内容的回放。
如图4D中所描绘的用户接口300还包括输入控件560,该输入控件560可以使得用户能够指定期望的补充信息的种类。例如,各补充信息项可以被归类为“最受好评的”、“搞笑的”、“有深刻见解的”、“信息量大的”、或“有趣的”中的一个或多个。在一些实施方案中,这样的分类可以由电子市场150的操作员来完成。在进一步的实施方案中,这样的分类可以由电子市场150的用户来完成。用作说明地,取消选择输入控件160中的一个或多个可以禁用对相应地标记的补充信息的回放。例如,如果特定的补充信息项由电子市场150归类为“搞笑的”,并且计算设备100的用户取消选择对应于“搞笑的”的输入控件560,那么那个特定的补充内容项在音频内容的回放期间可能是不可用的。作为进一步的示例,如果特定的补充信息项由电子市场150归类为“最受好评的”,并且计算设备100的用户选择对应于“最受好评的”的输入控件560,那么可以使得那个特定的补充内容项在音频内容的回放期间是可用的。在一些实施方案中,仅特定类型的补充信息可以被分类。例如,可以对由联系人或一般用户生成的补充信息进行分类,而不可以对由作者或出版者生成的补充信息进行分类。在这些实施方案中,输入控件560可以仅适用于被分类的补充信息。在其它实施方案中,输入控件560可以适用于所有的补充信息。
如图4D中所描绘的用户接口300还包括输入控件562和563,所述输入控件562和563可以使得用户能够指定在音频内容的回放期间提供的补充信息量的限制。例如,输入控件562可以使得用户能够指定在音频回放的任意一分钟期间应显示不多于三个补充信息项。作为进一步的示例,输入控件563可以使得用户能够指定补充信息应被显示的最长持续时间。除了限制每个时间段(例如,分钟、小时等)之外,可以例如在段落、页、章、书、或其它测量周期的过程中施加限制。
在指定关于补充信息的一个或多个偏好之后,用户可以通过选择输入控件564而返回到图4C中所显示的用户接口300的部分。
虽然在图4中未示出,但是在一些实施方案中,用户可以提供指示应被自动地显示的补充信息的一个或多个项、种类、或类型的偏好,无需指示的输出且无需用户输入。例如,用户可以指定,所有的“最爱好评的”补充信息项应被自动地显示,应为“搞笑的”补充信息提供指示符,并且不应为仅被标记为“有趣的”的补充信息提供指示符。如本领域的技术人员将理解的,可以合并这样的偏好以指定任意给定补充信息项应被自动地显示,被指示用于显示或回放,或被指示不用于显示或回放。
图5为描绘用于补充音频内容的回放的说明性例程600的流程图。例程600可以用作说明地由计算设备100的补充信息模块118实施。例程600在框602处开始,其促使主音频内容(诸如,音频内容204)的回放。回放可以例如响应于图4A-4C的输入控件318的用户选择而开始。
在框604处,计算设备100判定补充信息是否与主音频内容内的当前位置相关联。如上所述,可以使补充信息与主音频内容内的位置的范围(例如,连续的10秒范围)相关联。如果没有可用的补充信息,则回放在框614处继续,描述如下。如果当前回放位置是在这样的范围内,并且补充信息因此是可用的,则例程600进入框606,其向用户输出补充信息是可用的指示。如上所述,该指示可以对应于由设备100输出的音频,诸如音调、铃声、语音、或声音,对应于视觉输出,诸如显示器上输入控件的外观,或对应于触觉反馈,诸如设备100的振动。在框608,计算设备100测试用户是否已经输入播放检测到的补充信息的命令。如上所述,这样的命令可以对应于经显示设备或其它输入控件(诸如,计算设备100上的实体按钮或连接到计算设备100的附件(例如,耳机))的输入。在一些实施方案中,命令可以进一步对应于来自用户的语音命令。如果命令未被接收,则回放在框614处继续,描述如下。如果命令被接收,则例程600继续到框610,其促使补充信息的回放(和主音频内容的回放的临时停止)。在补充信息的回放完成之后,主音频内容的回放在框614处恢复。可选地,例程600还可以被配置成接收在框610处停止补充信息的回放和立即恢复主音频内容的回放的用户命令。
另外,如上文所描述的,一些补充信息本身可以与补充信息相关联。在这些实施方案中,例程600的附加实例可以在框610处执行,使得用户可以指示应播放次补充音频内容。如本领域的技术人员将理解的,框610的各附加实例可以创造例程600的实例,使得可以促进补充信息的任意回放配置。
在框614处,主音频内容的回放恢复。如上所讨论的,回放可以在它终止的点或该点附近恢复。例如,回放可以在回放终止之前的点(诸如先前的段落的开头)处恢复。在框616处,例程600测试是否结束音频内容的回放。例如,响应于用户命令或音频内容项的完成,可以结束回放。如果回放未结束,则例程在框604处继续,如上文所描述的。如果回放结束,则例程600可以结束。
需理解的是,不一定所有的目的或优势可以根据任意本文中所描述的具体实施方案实现。因此,例如,本领域的技术人员将认识到,某些实施方案可以被配置成以实现或优化如本文所教导的一个优点或一组优点的方式操作,不一定实现如本文所教导或建议的其它目的或优点。
本文中所描述的所有过程可以在由一个或多个通用计算机或处理器执行的软件代码模块中实现或经所述软件代码模块充分地自动化,从而将通用计算机或处理器转换成特定配置的设备。代码模块可以存储在任意类型的计算机可读介质或其它计算机存储设备中。一些或所有方法可以在专门的计算机硬件中选择地被实现。此外,本文所提及的部件可以在硬件、软件、固件或其组合中被实施。
除非特别地陈述之外,否则尤其诸如“能够(can)”、“能够(could)”、“可能”或“可以”的条件语言在上下文内被理解为一般用以表达某些实施方案包括而其它实施方案不包括某些特征、元件和/或步骤。因此,这样的条件语言大体不旨在暗示,特征、元件和/或步骤以任何方式是一个或多个实施方案所需的,或一个或多个实施方案必然地包括决定(在有或无用户输入或提示的情况下)这些特征、元件和/或步骤是否被包括在任意具体实施方案中或将在任意具体实施方案中被执行的逻辑。
如短语“X、Y以及Z中的至少一个”之类的连接性语言,除非特别说明,否则使用时根据文中内容理解,通常用于表达项目、项等可为X、Y或Z。因此,这种连接性语言通常并不旨在暗示某些实施方案需要X中至少一个、Y中至少一个以及Z中至少一个的每一个存在。
本文中所描述的和/或在附图中描绘的流程图中的任意过程描述、元件或框应理解为潜在地表示模块、片段、或代码的包括用于实施过程中的特定逻辑功能或元件的一个或多个可执行指令的部分。替代实施方式被包括在本文中所描述的实施方案的范围内,其中,元件或功能可以被删除、以与示出或论述的顺序不同的顺序(包括大致同时或以颠倒的顺序)被执行,这取决于所涉及的功能性,如将由本领域的技术人员所理解的。
应强调,可以对上述实施方案作出许多变化和修改,其元件将被理解为在其它容许的示例当中。所有这样的修改和变化指在被包括在本公开的范围内并且受到所附权利要求的保护。
条款
1.一种用于补充音频信息的输出的系统,所述系统包括:
一个或多个数据存储区,其存储音频内容和一个或多个补充音频信息项,其中,所述一个或多个补充音频信息项中的每一个与所述音频内容内的一个或多个回放位置相关联;
输入设备,其获得用户的输入;
显示设备,其显示关于所述音频内容的信息;
输出设备,其输出所述音频内容;以及
处理器,其与所述一个或多个数据存储区、所述输入设备和所述输出设备通信,所述处理器可工作以:
促使所述音频内容经所述输出设备输出;
判定所述一个或多个补充音频信息项中的一个与所述音频内容内的当前回放位置相关联;
促使补充音频信息可用于回放的指示经所述输出设备和所述显示设备中的至少一个输出;
从所述用户获得指示应播放所述判定的补充音频信息项的输入;以及
促使所述判定的补充音频信息项经所述输出设备输出。
2.根据条款1所述的系统,其中,所述处理器还可工作以响应于所述获得的输入暂停所述音频内容的输出,以及在所述判定的补充音频信息项的输出之后恢复所述音频内容的输出。
3.根据条款2所述的系统,其中,所述音频内容的输出在先于所述音频内容的输出被暂停的点的点处恢复。
4.根据条款2所述的系统,其中,所述音频内容的输出在所述音频内容的输出被暂停的点处恢复。
5.根据条款1所述的系统,其中,所述系统包括个人音乐播放器、个人计算设备、膝上型计算机、平板计算机、电子书阅读器、和移动电话中的至少一个。
6.根据条款1所述的系统,其中,所述一个或多个补充音频信息项包括脚注、编者评论、作家评论、用户评论、尾注、术语表信息、和附录中的至少一个。
7.根据条款1所述的系统,其中,所述判定的补充音频信息项与至少一个信息种类相关联。
8.根据条款1所述的系统,其中,所述处理器还可工作以从所述用户获得指示期望的信息种类的输入;以及其中,与所述判定的补充音频信息项相关联的信息种类对应于所述期望的信息种类。
9.根据条款1所述的系统,其中,所述指示为声音、视觉指示、和振动中的至少一个。
10.一种用于将补充音频信息回放给用户的计算机实施的方法,其中,所述补充音频信息包括主音频内容和一个或多个补充音频信息项,并且其中,各补充音频信息项与所述主音频内容中的至少一个和所述一个或多个补充音频信息项中的一个内的至少一个回放位置相关联,所述计算机实施的方法包括:
在一个或多个计算设备的控制下,
促使所述主音频内容经输出设备输出;
判定所述一个或多个补充音频信息项中的一个与经所述输出设备输出的所述主音频内容内的当前回放位置相关联;
从所述用户经输入设备获得指示应播放所述判定的补充音频信息项的输入;和
促使所述判定的补充音频信息项经所述输出设备输出。
11.根据条款10所述的计算机实施的方法,其还包括从不同的计算设备经网络接收所述判定的补充音频信息项。
12.根据条款10所述的计算机实施的方法,其中,响应于输出所述判定的补充音频信息项可用于回放的指示,获得所述输入。
13.根据条款10所述的计算机实施的方法,其中,所述一个或多个补充音频信息项中的每一个与所述主音频内容内的回放位置的范围相关联。
14.根据条款10所述的计算机实施的方法,其还包括:在完成所述判定的补充音频信息项的输出之后,响应于获得所述输入和恢复所述音频内容的输出,暂停所述音频内容的输出。
15.根据条款14所述的计算机实施的方法,其中,恢复所述音频内容的输出包括在先于暂停所述音频内容的输出的点的点处恢复所述音频内容的输出。
16.根据条款15所述的计算机实施的方法,其中,所述先于暂停所述音频内容的输出的点的点为先于暂停所述音频内容的输出的点的指定持续时间。
17.根据条款15所述的计算机实施的方法,其中,所述先于暂停所述音频内容的输出的点的点至少部分地基于对应于所述音频内容的文本来判定。
18.根据条款10所述的计算机实施的方法,其中,所述计算机实施的方法由个人音乐播放器、个人计算设备、膝上型计算机、平板计算机、电子书阅读器、和移动电话中的至少一个来执行。
19.根据条款10所述的计算机实施的方法,其中,在所述判定的补充音频信息项内的位置与一个或多个次补充音频信息项相关联,所述计算机实施的方法还包括:
判定所述一个或多个次补充音频信息项中的一个与所述判定的补充音频信息项内的当前回放位置相关联;
促使次补充音频信息可用于回放的指示的输出;
从所述用户获得指示应播放所述判定的次补充音频信息项的输入;以及
促使所述判定的次补充音频信息项的输出。
20.一种用于输出补充音频信息的系统,所述系统包括:
一个或多个数据存储区,其存储音频内容和一个或多个补充音频信息项,其中,所述一个或多个补充音频信息项中的每一个与所述音频内容和所述一个或多个补充音频信息项中的一个中的至少一个内的一个或多个回放位置相关联;
与所述数据存储区通信的处理器,所述处理器可工作以:
促使音频内容经输出设备输出;
从所述用户经输入设备获得指示应播放所述判定的补充音频信息项的输入;
判定与所述音频内容内的当前回放位置相关联的一个或多个补充音频信息项中的一个经所述输出设备输出;
促使所述判定的补充音频信息项经所述输出设备输出。
21.根据条款20所述的系统,其中,所述处理器还可工作以:响应于所述补充音频信息项与所述音频内容内的当前回放位置相关联的判定,促使补充音频信息可用于回放的指示的输出。
22.根据条款20所述的系统,其中,所述处理器还可工作以判定对应于所述音频内容内的当前回放位置的文本,并且其中,所述一个或多个补充音频信息项中的一个与当前回放位置相关联的判定至少部分地基于所述判定的对应于所述当前回放位置的文本。
23.根据条款20所述的系统,其中,所述一个或多个补充音频信息项中的至少一个与至少一个信息种类相关联。
24.一种具有用于提供补充音频信息的至少一个计算机执行模块的计算机可读非暂态存储介质,所述至少一个计算机执行模块包括:
补充音频信息模块,其可工作以:
促使主音频内容的输出,其中,所述主音频内容与一个或多个补充音频信息项相关联,并且其中,所述一个或多个补充音频信息项中的每一个与所述音频内容和所述一个或多个补充音频信息项中的一个中的至少一个内的一个或多个回放位置相关联;
获得指示应播放所述判定的补充音频信息项的输入;
判定所述一个或多个补充音频信息项与所述主音频内容内的当前回放位置相关联;以及
促使所述判定的补充音频信息项的输出。
25.根据条款24所述的计算机可读非暂态存储介质,其中,所述补充音频信息模块还可工作以:响应于所述补充音频信息项与所述主音频内容内的当前回放位置相关联的判定,促使补充音频信息可用于回放的指示的输出。
26.根据条款24所述的计算机可读非暂态存储介质,其中,所述一个或多个补充音频信息项包括脚注、编者评论、作家评论、用户评论、尾注、术语表信息、和附录中的至少一个。
27.根据条款24所述的计算机可读非暂态存储介质,其中,所述补充音频信息模块还可工作以:响应于在所述判定的补充主音频信息项的输出完成之后获得所述输入和恢复所述主音频内容的输出,暂停所述主音频内容的输出。
28.根据条款27所述的计算机可读非暂态存储介质,其中,恢复所述主音频内容的输出包括在先于暂停所述主音频内容的输出的点的点处恢复所述主音频内容的输出。
29.根据条款27所述的计算机可读非暂态存储介质,其中,所述先于暂停所述音频内容的输出的点的点至少部分地基于对应于所述主音频内容的文本来判定。
30.根据条款24所述的计算机可读非暂态存储介质,其中,所述一个或多个补充音频信息项包括由所述用户的联系人产生的评论。
31.根据条款30所述的计算机可读非暂态存储介质,其中,所述联系人包括与所述主音频内容的提供者相关联的联系人和与社交网络系统相关联的联系人。

Claims (13)

1.一种用于补充音频信息的输出的系统,所述系统包括:
一个或多个数据存储区,其存储音频内容和一个或多个补充音频信息项,其中,所述一个或多个补充音频信息项中的每一个与所述音频内容内的一个或多个回放位置相关联;
输入设备,其获得用户的输入;
显示设备,其显示关于所述音频内容的信息;
输出设备,其输出所述音频内容;以及
处理器,其与所述一个或多个数据存储区、所述输入设备和所述输出设备通信,所述处理器可工作以:
促使所述音频内容经所述输出设备输出;
判定所述一个或多个补充音频信息项中的一个与所述音频内容内的当前回放位置相关联;
促使补充音频信息可用于回放的指示经所述输出设备和所述显示设备中的至少一个输出;
从所述用户获得指示应播放所述判定的补充音频信息项的输入;以及
促使所述判定的补充音频信息项经所述输出设备输出。
2.根据权利要求1所述的系统,其中,所述处理器还可工作以响应于所述获得的输入暂停所述音频内容的输出,以及在所述判定的补充音频信息项的输出之后恢复所述音频内容的输出。
3.根据权利要求2所述的系统,其中,所述音频内容的输出在先于所述音频内容的输出被暂停的点的点处恢复。
4.根据权利要求2所述的系统,其中,所述音频内容的输出在所述音频内容的输出被暂停的点处恢复。
5.根据权利要求1所述的系统,其中,所述系统包括个人音乐播放器、个人计算设备、膝上型计算机、平板计算机、电子书阅读器、和移动电话中的至少一个。
6.根据权利要求1所述的系统,其中,所述一个或多个补充音频信息项包括脚注、编者评论、作家评论、用户评论、尾注、术语表信息、和附录中的至少一个。
7.根据权利要求1所述的系统,其中,所述判定的补充音频信息项与至少一个信息种类相关联。
8.根据权利要求1所述的系统,其中,所述处理器还可工作以从所述用户获得指示期望的信息种类的输入;以及其中,与所述判定的补充音频信息项相关联的信息种类对应于所述期望的信息种类。
9.根据权利要求1所述的系统,其中,所述指示为声音、视觉指示、和振动中的至少一个。
10.一种用于输出补充音频信息的系统,所述系统包括:
一个或多个数据存储区,其存储音频内容和一个或多个补充音频信息项,其中,所述一个或多个补充音频信息项中的每一个与所述音频内容和所述一个或多个补充音频信息项中的一个中的至少一个内的一个或多个回放位置相关联;
与所述数据存储区通信的处理器,所述处理器可工作以:
促使音频内容经输出设备输出;
从所述用户经输入设备获得指示应播放补充音频信息项的输入;
判定与所述音频内容内的当前回放位置相关联的一个或多个补充音频信息项中的一个经所述输出设备输出;
促使所述判定的补充音频信息项经所述输出设备输出。
11.根据权利要求10所述的系统,其中,所述处理器还可工作以:响应于所述补充音频信息项与所述音频内容内的当前回放位置相关联的判定,促使补充音频信息可用于回放的指示的输出。
12.根据权利要求10所述的系统,其中,所述处理器还可工作以判定对应于所述音频内容内的当前回放位置的文本,并且其中,所述一个或多个补充音频信息项中的一个与所述音频内容内的当前回放位置相关联的判定至少部分地基于所述判定的对应于所述当前回放位置的文本。
13.根据权利要求10所述的系统,其中,所述一个或多个补充音频信息项中的至少一个与至少一个信息种类相关联。
CN201280063654.8A 2011-12-20 2012-12-19 管理补充信息的回放 Pending CN104205791A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/332,157 US9348554B2 (en) 2011-12-20 2011-12-20 Managing playback of supplemental information
US13/332,157 2011-12-20
PCT/US2012/070565 WO2013096422A1 (en) 2011-12-20 2012-12-19 Managing playback of supplemental information

Publications (1)

Publication Number Publication Date
CN104205791A true CN104205791A (zh) 2014-12-10

Family

ID=48611538

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280063654.8A Pending CN104205791A (zh) 2011-12-20 2012-12-19 管理补充信息的回放

Country Status (6)

Country Link
US (1) US9348554B2 (zh)
EP (1) EP2795885B1 (zh)
JP (1) JP2015510602A (zh)
CN (1) CN104205791A (zh)
AU (1) AU2012359080B2 (zh)
WO (1) WO2013096422A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108885869A (zh) * 2016-03-16 2018-11-23 索尼移动通讯有限公司 控制包含语音的音频数据的回放
CN112424853A (zh) * 2018-07-24 2021-02-26 谷歌有限责任公司 以对文本文档的音频回放进行补充的视觉内容为特点的文本到语音界面
CN112712806A (zh) * 2020-12-31 2021-04-27 南方科技大学 一种视障人群辅助阅读方法、装置、移动终端及存储介质
CN113196384A (zh) * 2019-11-26 2021-07-30 谷歌有限责任公司 在请求时间将补充音频内容动态插入到音频记录中

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140040715A1 (en) * 2012-07-25 2014-02-06 Oliver S. Younge Application for synchronizing e-books with original or custom-created scores
US20140115449A1 (en) * 2012-10-22 2014-04-24 Apple Inc. Generating sample documents
US9727544B2 (en) * 2013-05-06 2017-08-08 Dropbox, Inc. Animating edits to documents
US9678637B1 (en) 2013-06-11 2017-06-13 Audible, Inc. Providing context-based portions of content
WO2014210034A1 (en) * 2013-06-25 2014-12-31 Audible, Inc. Synchronous presentation of content with a braille translation
US9378651B2 (en) * 2013-12-17 2016-06-28 Google Inc. Audio book smart pause
EP2924595A1 (en) 2014-03-28 2015-09-30 Acast AB Method for associating media files with additional content
US9927957B1 (en) * 2014-12-11 2018-03-27 Audible, Inc. Rotary navigation of synchronized content
FR3050293A1 (fr) * 2016-04-18 2017-10-20 Orange Procede d'assistance sonore d'interface de controle d'un terminal, un programme et un terminal
US11803590B2 (en) * 2018-11-16 2023-10-31 Dell Products L.P. Smart and interactive book audio services
US11095949B2 (en) * 2019-12-19 2021-08-17 Rovi Guides, Inc. Systems and methods for providing timeline of content items on a user interface
US11650867B2 (en) * 2020-06-18 2023-05-16 Apple Inc. Providing access to related content in media presentations
GB202212523D0 (en) * 2022-08-30 2022-10-12 Kullar Varinder Book apparatus
US20240196054A1 (en) * 2022-12-12 2024-06-13 Dish Network Technologies India Private Limited Dynamic supplemental content based on viewer analytics

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050193335A1 (en) * 2001-06-22 2005-09-01 International Business Machines Corporation Method and system for personalized content conditioning
US20090251440A1 (en) * 2008-04-03 2009-10-08 Livescribe, Inc. Audio Bookmarking
CN101681350A (zh) * 2007-03-29 2010-03-24 亚马逊技术股份有限公司 提供数字作品的注解
US20100251386A1 (en) * 2009-03-30 2010-09-30 International Business Machines Corporation Method for creating audio-based annotations for audiobooks

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6073589A (ja) * 1983-09-30 1985-04-25 株式会社日立製作所 音声合成装置
JPH04217023A (ja) * 1990-12-17 1992-08-07 Fujitsu Ltd ソースプログラム提示装置
JP3446758B2 (ja) * 1991-09-18 2003-09-16 ソニー株式会社 メモ機能付きビデオテープレコーダ
US6601103B1 (en) * 1996-08-22 2003-07-29 Intel Corporation Method and apparatus for providing personalized supplemental programming
US20020120925A1 (en) * 2000-03-28 2002-08-29 Logan James D. Audio and video program recording, editing and playback systems using metadata
WO1999027681A2 (en) * 1997-11-25 1999-06-03 Motorola Inc. Audio content player methods, systems, and articles of manufacture
US8028314B1 (en) * 2000-05-26 2011-09-27 Sharp Laboratories Of America, Inc. Audiovisual information management system
US20020099552A1 (en) * 2001-01-25 2002-07-25 Darryl Rubin Annotating electronic information with audio clips
US8949902B1 (en) * 2001-02-06 2015-02-03 Rovi Guides, Inc. Systems and methods for providing audio-based guidance
WO2002102052A2 (en) * 2001-02-07 2002-12-19 Infosphere Incorporated Method and apparatus for providing interactive media presentation
US8046689B2 (en) * 2004-11-04 2011-10-25 Apple Inc. Media presentation with supplementary media
JP2003308341A (ja) * 2002-04-17 2003-10-31 Brother Ind Ltd 文章提供装置、文章提供方法、及びプログラム
US7321887B2 (en) * 2002-09-30 2008-01-22 Sap Aktiengesellschaft Enriching information streams with contextual content
JP3998187B2 (ja) * 2002-10-09 2007-10-24 日本放送協会 コンテンツ解説データ生成装置、その方法及びそのプログラム、並びに、コンテンツ解説データ提示装置、その方法及びそのプログラム
JP2004157457A (ja) * 2002-11-08 2004-06-03 Nissan Motor Co Ltd 音声提示装置
JP4384074B2 (ja) * 2005-03-18 2009-12-16 キヤノン株式会社 放送コンテンツ処理装置及びその制御方法
US20080120330A1 (en) * 2005-04-07 2008-05-22 Iofy Corporation System and Method for Linking User Generated Data Pertaining to Sequential Content
JP5649303B2 (ja) * 2006-03-30 2015-01-07 エスアールアイ インターナショナルSRI International メディア・ストリームに注釈を付ける方法および装置
US7934160B2 (en) * 2006-07-31 2011-04-26 Litrell Bros. Limited Liability Company Slide kit creation and collaboration system with multimedia interface
JP2008051883A (ja) * 2006-08-22 2008-03-06 Canon Inc 音声合成制御方法および装置
US7941092B2 (en) * 2006-11-22 2011-05-10 Bindu Rama Rao Media distribution server that presents interactive media to a mobile device
US8316302B2 (en) * 2007-05-11 2012-11-20 General Instrument Corporation Method and apparatus for annotating video content with metadata generated using speech recognition technology
US8112702B2 (en) * 2008-02-19 2012-02-07 Google Inc. Annotating video intervals
US7865586B2 (en) 2008-03-31 2011-01-04 Amazon Technologies, Inc. Configuring communications between computing nodes
US20100017694A1 (en) * 2008-07-18 2010-01-21 Electronic Data Systems Corporation Apparatus, and associated method, for creating and annotating content
US20100049741A1 (en) * 2008-08-22 2010-02-25 Ensequence, Inc. Method and system for providing supplementary content to the user of a stored-media-content device
US20100324709A1 (en) * 2009-06-22 2010-12-23 Tree Of Life Publishing E-book reader with voice annotation
US8316303B2 (en) * 2009-11-10 2012-11-20 At&T Intellectual Property I, L.P. Method and apparatus for presenting media programs
US8392186B2 (en) * 2010-05-18 2013-03-05 K-Nfb Reading Technology, Inc. Audio synchronization for document narration with user-selected playback
US20120197648A1 (en) * 2011-01-27 2012-08-02 David Moloney Audio annotation
US8543454B2 (en) * 2011-02-18 2013-09-24 Bluefin Labs, Inc. Generating audience response metrics and ratings from social interest in time-based media

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050193335A1 (en) * 2001-06-22 2005-09-01 International Business Machines Corporation Method and system for personalized content conditioning
CN101681350A (zh) * 2007-03-29 2010-03-24 亚马逊技术股份有限公司 提供数字作品的注解
US20090251440A1 (en) * 2008-04-03 2009-10-08 Livescribe, Inc. Audio Bookmarking
US20100251386A1 (en) * 2009-03-30 2010-09-30 International Business Machines Corporation Method for creating audio-based annotations for audiobooks

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108885869A (zh) * 2016-03-16 2018-11-23 索尼移动通讯有限公司 控制包含语音的音频数据的回放
CN108885869B (zh) * 2016-03-16 2023-07-18 索尼移动通讯有限公司 控制包含语音的音频数据的回放的方法、计算设备和介质
CN112424853A (zh) * 2018-07-24 2021-02-26 谷歌有限责任公司 以对文本文档的音频回放进行补充的视觉内容为特点的文本到语音界面
CN113196384A (zh) * 2019-11-26 2021-07-30 谷歌有限责任公司 在请求时间将补充音频内容动态插入到音频记录中
CN112712806A (zh) * 2020-12-31 2021-04-27 南方科技大学 一种视障人群辅助阅读方法、装置、移动终端及存储介质

Also Published As

Publication number Publication date
AU2012359080B2 (en) 2015-09-17
EP2795885A4 (en) 2015-08-12
WO2013096422A1 (en) 2013-06-27
AU2012359080A1 (en) 2014-07-03
US20130159853A1 (en) 2013-06-20
EP2795885A1 (en) 2014-10-29
US9348554B2 (en) 2016-05-24
JP2015510602A (ja) 2015-04-09
EP2795885B1 (en) 2020-05-20

Similar Documents

Publication Publication Date Title
CN104205791A (zh) 管理补充信息的回放
US10880098B2 (en) Collaborative document editing
CN105378817B (zh) 将外部动态内容合并到白板中
CN104685470B (zh) 用于从模板生成用户界面的设备和方法
CN102662919B (zh) 对内容片段设置书签
CN108733438A (zh) 应用程序与数字助理集成
CN1672178B (zh) 用于动画即时通信的方法和装置
CN103733159B (zh) 同步数字内容
CN107924679A (zh) 输入理解处理期间在响应选择中的延迟绑定
CN109635130A (zh) 用于媒体探索的智能自动化助理
CN107480161A (zh) 用于媒体探究的智能自动化助理
CN109463004A (zh) 数字助理服务的远场延伸
CN108604449A (zh) 说话者识别
CN106104528A (zh) 用于屏幕上项目选择和消歧的基于模型的方法
CN107195306A (zh) 识别提供凭据的语音输入
CN108292203A (zh) 基于设备间对话通信的主动协助
CN107257950A (zh) 虚拟助理连续性
CN107210033A (zh) 基于众包来更新用于数字个人助理的语言理解分类器模型
CN107209668A (zh) 反应型代理开发环境
CN104685444A (zh) 具有触觉反馈的方法和显示设备
CN109597976A (zh) 一种文档编辑方法及装置
CN102693155A (zh) 应用商店主题
WO2017157174A1 (zh) 一种信息处理方法、设备和终端设备
CN109313668B (zh) 构建会话理解系统的系统和方法
CN104035995A (zh) 群标签生成方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20141210

WD01 Invention patent application deemed withdrawn after publication