CN102687182A - 用于电子视觉作品的配音的动态音频重放 - Google Patents

用于电子视觉作品的配音的动态音频重放 Download PDF

Info

Publication number
CN102687182A
CN102687182A CN2010800607993A CN201080060799A CN102687182A CN 102687182 A CN102687182 A CN 102687182A CN 2010800607993 A CN2010800607993 A CN 2010800607993A CN 201080060799 A CN201080060799 A CN 201080060799A CN 102687182 A CN102687182 A CN 102687182A
Authority
CN
China
Prior art keywords
audio
works
prompting
book
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010800607993A
Other languages
English (en)
Inventor
威廉·拉塞尔·亨歇尔
格雷厄姆·爱德华·柳斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dulcetta Inc
Original Assignee
Dulcetta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dulcetta Inc filed Critical Dulcetta Inc
Publication of CN102687182A publication Critical patent/CN102687182A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • G09B5/062Combinations of audio and printed presentations, e.g. magnetically striped cards, talking books, magnetic tapes with printed texts thereon
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

一种电子书具有配音,读者可在阅读电子书的同时听配音。配音伴随并提高阅读体验,其中读者通常基于作为电子书一部分的故事或其它视觉媒体而在他们的头脑中形成图像。配音的重放与电子书的视觉显示同步。音频提示与文本中的不同点相关联,且这些提示基于用户与电子书的互动而与电子书的视觉显示同步地动态重放。动态重放包括编辑并播放音频提示,使得音频提示具有一持续时间,该持续时间是基于对电子书中与提示同步的部分的持续时间的预测。当系统开始播放音频提示时,系统预测下一个音频提示应该何时开始。播放当前提示达预测的持续时间,且在适当时间起始到下一个音频提示的转变。

Description

用于电子视觉作品的配音的动态音频重放
相关申请案的交叉参考
本申请案是根据35U.S.C.§119主张2009年11月10日申请的美国临时专利申请案第61/259,995号的优先权和权利的非临时申请案,其以引用的方式并入本文中。
技术领域
背景技术
电子书是一种主要包括文本但也可包含其它视觉媒体(例如图形和图像)的多媒体作品。虽然电子书中的文本可伴随有其它视觉媒体,但通常希望从头到尾阅读电子书,但未必一口气阅读完。
存在若干用于电子书的文件格式,其包含但不限于各种类型的标示语言文档类型(举例来说,SGML、HTML、XML、LaTex等等),和其它数据文件类型,例如.pdf文件,纯文本文件等等。各种文件格式与电子书阅读器一起使用,电子书阅读器是例如来自Amazon.com的KINDLE阅读器。这种电子书阅读器通常为经设计成在平台上运行的计算机程序,平台是例如个人计算机、笔记本计算机、膝上型计算机、平板计算机、移动装置或用于阅读电子书的专用硬件系统(例如KINDLE阅读器)。
发明内容
一种电子书具有配音,读者可在阅读电子书的同时听配音。配音的目的是伴随并提高阅读体验,其中读者通常基于为电子书的部分的故事或其它视觉媒体而在他们的头脑中形成图像。配音的重放与电子书的视觉显示同步。
在读者阅读电子书的同时使配音的重放与电子书的视觉显示同步是一个挑战性问题。不同个人以不同速度阅读,且不同个人将在不同时间以不同速度阅读。电子书的部分的视觉显示的持续时间在从读者到读者的持续时间方面变化,且在不同时间点之间变化。换句话说,取决于用户与电子书的互动,电子书的部分的视觉显示的持续时间可变。然而,配音(一种时间相依媒体)的重放与此视觉显示同步。
为了以适用于多个读者的方式用配音提供良好的阅读体验,使音频提示与文本中的不同点相关联,且基于用户与电子书的互动而与电子书的视觉显示同步地动态重放这些提示。动态重放包括编辑并播放音频提示,使得音频提示具有一持续时间,所述持续时间是基于对电子书中提示与之同步的部分的持续时间的预测。当系统开始播放音频提示时,系统预测下一个音频提示应该何时开始。播放当前提示达预测的持续时间,且在适当时间起始到下一个音频提示的转变。
这种配音通常不只是任何音乐或声音;一些音乐和声音可分散读者注意力而非提高阅读体验。取而代之,配音包含经设计成在读者中所唤起的情感类似于由文本所唤起的那些情感的的音乐和声音。通常,当存在很少欢快的瞬时声音、无杂音且存在备用的有点催眠感觉的音乐时,用于电子书的配音受益。太快或太激烈的流派型音乐可分散注意力或难以阅读。
在本发明的各种方面中,本发明可体现于计算机实施过程、机器(例如电子装置,或通用计算机,或提供可供执行计算机程序的平台的其它装置)、由这些机器执行的过程或制造物品中。这些物品可包含计算机程序产品或数字信息产品(其中计算机可读存储媒体含有存储于其上的计算机程序指令或计算机可读数据),和建立并使用这些制造物品的过程和机器。
因此,在一方面中,音频动态重放包括接收有关用户与电子视觉作品的部分的互动的数据。根据用户与电子视觉作品的互动而使待重放的与电子视觉作品的部分相关联的音频区段动态调整长度。在一个实施方案中,根据有关用户与电子视觉作品的部分的互动的接收数据来估计电子视觉作品的部分的视觉显示的持续时间。选择与电子视觉作品的部分相关联的音频的次混合序列,以便提供将匹配估计的持续时间的音频要素。此估计可使用阅读速度的历史记录而进行。
在另一方面中,与电子视觉作品的显示同步地播放配音。将电子视觉作品接收到存储器中,也将使电子视觉作品的部分与标签相关联的信息接收到存储器中。响应于用户互动而显示电子视觉作品的部分。存取具有标签的音频文件。根据与电子视觉作品的部分相关联的标签来选择待与电子视觉作品的部分相关联的音频文件。接收有关用户与电子视觉作品的部分的互动的数据,且根据用户互动来动态调整与电子视觉作品的那个特定部分相关联的音频重放的持续时间。
在另一方面中,产生用于电子视觉作品的配音。将电子视觉作品接收到存储器中。在存储器中处理电子视觉作品,使得用将与加标签的音频文件的特定部分相关联的标签来标记电子视觉作品的部分。然后存取具有适当标签的音频文件,且选择电子视觉作品的部分的目标音频文件并使目标音频文件相关联以建立并重放所得配音。电子视觉作品可包含文本且处理包含处理文本。标签可包含情感描述符。
在另一方面中,对于电子视觉作品的每一部分,提示列表包含情感描述符,其中情感描述符对应于也与音频数据相关联的情感描述符。
在另一方面中,音频提示包含用于音乐作品的多个次混合(被称作“符干”)的音频数据,其可被混合以提供指示符干可如何被重复并组合以建立由读者听到的最终结果的音频数据和信息。
在另一方面中,配音和其关联电子视觉作品的分配以使能够观看电子视觉作品的方式而进行,观看方式如同配音不可用的观看方式。在读者存取电子视觉作品之后,识别并阅读提示列表。作为背景任务,下载音频数据,同时与电子视觉作品的显示同步地播放配音中的第一提示。
其它方面在以下详细描述中予以阐明,且由本发明的这些不同方面的各种组合所提供。
附图说明
图1是具有动态音频播放器的电子书阅读器的数据流程图。
图2是图1的动态音频播放器的更多细节的数据流程图。
图3是提示列表的说明。
图4是音频提示文件的说明。
图5是当开启电子书时的设置过程的流程图。
图6是描述音频提示文件如何用于建立所需持续时间的音频数据的流程图。
图7是描述如何计算阅读速度的流程图。
图8是描述可如何为电子书自动产生配音的数据流程图。
图9是计算机系统的方块图。
具体实施方式
在以下描述中,给出特定细节以提供对实施例的透彻理解。然而,所属领域的技术人员将理解,可在不含这些特定细节的情况下实行实施例。举例来说,可在方块图中展示软件模块、函数、电路等等,以便不会以不必要的细节使实施例晦涩难懂。在其它情况下,可能不详细地展示熟知的模块、结构和技术,以便不会使实施例晦涩难懂。
此外,应注意,实施例可被描述为过程,其被描绘为流程图、结构图或方块图。虽然流程图可将操作描述为连续个过程,但许多操作可并行地或同时地执行。另外,可重新排列操作的次序。过程在其操作完成时终止。在计算机程序中,过程可对应于方法、函数、程序、子例程、子程序等等。当过程对应于函数时,其终止对应于函数的返回至调用函数或主函数。
下文所描述的系统和方法的方面可在任何类型的通用计算机系统或计算装置(包含但不限于桌上型计算机、膝上型计算机、笔记本计算机、平板计算机或移动装置)上是可操作的。术语“移动装置”包含但不限于无线装置、移动电话、移动通信装置、用户通信装置、个人数字助理、移动手持型计算机、膝上型计算机、电子书阅读器,和能够阅读电子内容的阅读装置,和/或通常由个人携带和/或具有某一形式的通信能力(举例来说,无线、红外线、近程无线电等等)的其它类型的移动装置。
图9是说明可与下文进一步详细地描述的系统和方法的一个或多个方面一起使用的计算机系统900的内部功能架构的方块图。如图9所示,计算机系统900可包含用于执行计算机可执行过程步骤的中央处理单元(CPU)914和与计算机总线916的接口。图9中也展示网络接口918、显示装置接口920、键盘或输入接口922、指向装置接口924、音频接口926、视频接口932和硬磁盘驱动器934或其它持久存储器。
如上文所描述,磁盘934可存储操作系统程序文件、应用程序文件、网页浏览器、和其它文件。这些文件中的一些可使用安装程序而存储在磁盘934上。举例来说,CPU914可执行安装程序的计算机可执行过程步骤,使得CPU 914可适当地执行应用程序。
随机存取主存储器(“RAM”)936也可对接到计算机总线916以向CPU 914提供对存储器的存取。当执行来自磁盘934的所存储的计算机可执行过程步骤时,CPU 914存储并执行在RAM 936外的过程步骤。待处理的步骤也可从这种存储器936或存储器934予以读取,且存储于这种存储器936或存储器934中。可提供只读存储器(“ROM”)938以存储不变指令序列,例如起动指令序列或用于操作键盘922的基本输入/输出操作系统(BIOS)序列。
电子书阅读器或用于提供电子书和其它多媒体作品的视觉显示的其它应用程序可在例如图9所描述的平台上实施。
在以下描述中,电子书和电子书阅读器被用作多媒体作品和可与配音的重放同步的对应观看器的种类的实例。其它种类的多媒体作品(其中作品的部分的视觉显示的持续时间取决于用户与作品的互动)也可使用此种类的同步。术语“电子书”意欲涵盖书籍、杂志、新闻通讯、报纸、期刊、地图、物品和主要为文本或伴随有图形或其它视觉媒体的文本的其它作品。
配音可与各种各样的电子视觉作品(包含电子书)中任何一者相关联。可使用的音乐或音频的类型也有可能取决于作品的类型。举例来说,对于小说作品,配音在目的上将类似于电影配音,即,为了支持故事——制造悬念、巩固爱情趣味,或达到大的高潮。对于儿童书籍,音乐可类似于用于卡通片的音乐,可能包含更多的声音效果,例如当翻页的时候。对于教科书,配音可包含用以加强知识保持的已知韵律和音调,例如每分钟约128或132节拍的材料和使用明显的模态音调。经设计以支持冥想的一些书籍可具有带有自然声音的配音、周围稀疏音乐、带有软音调的乐器等等。旅游书籍可带有源于所描述的位置的音乐和声音。对于杂志和报纸,不同章节或文章可具有不同配音和/或具有不同音乐风格。甚至阅读同一书页的不同段落可具有不同配音。广告商也可使其音频主题在这些作品的阅读期间播放。在这些状况下,可以类似于如何选择基于广告的文本以伴随其它材料的方式来选择配音。
特别地,现在参考图1,电子书110被输入到电子书阅读器112,电子书阅读器112向终端用户或读者提供电子书的视觉显示。电子书110是一个或多个至少含有文本且呈文件格式的计算机数据文件,所述文件格式经设计以使计算机程序能够读取、格式化和显示文本。电子书中存在各种文件格式,包含但不限于各种形式的标示语言文档类型(举例来说,SGML、HTML、XML、LaTex等等),和其它文档类型,其实例包含但不限于EPUB、FictionBook、plucker、PalmDoc、zTxt、TCR、CHM、RTF、OEB、PDF、mobipocket、Calibre、Stanza和纯文本。一些文件格式是专有的且经设计以与专用电子书阅读器一起使用。本发明不限于任何特定文件格式。
电子书阅读器112可为任何经设计以在计算机平台上运行的计算机程序,计算机平台是例如上文结合图9所描述,其实例包含但不限于个人计算机、平板计算机、移动装置,或用于阅读电子书且接收并显示电子书110的内容的专用硬件系统。存在许多种商业或公开可购得的电子书阅读器,其实例包含但不限于来自Amazon.com的KINDLE阅读器、来自Barnes&Noble的Nook阅读器、Stanza阅读器和FBReader软件(一开源项目)。然而,本发明不限于任何特定电子书阅读器。
电子书阅读器112也输出指示用户与电子书阅读器112的互动的数据114,使得这些数据可由动态音频播放器116使用。商业或公共可得的电子书阅读器可根据本文中的描述而修改以提供这些输出。
有关用户与文本的互动的数据可呈各种各样的形式。举例来说,所阅读的书的识别符(例如ISBN、e-ISBN数字或散列码),且可提供文本中的当前位置。通常,由电子书阅读器将当前位置追踪为所显示的电子书的当前“页”或部分。当此信息改变时,电子书阅读器可输出此信息。其它可有用的信息(如果由电子书阅读器112提供)包含但不限于所显示的文档的当前范围的字计数、用户何时已退出电子书阅读器应用程序的指示,和读者是否已暂停阅读或在暂停之后恢复阅读的指示。
在电子书阅读器与动态音频播放器之间所交换的信息和指令可通过应用程序设计接口(API)而实施,使得动态音频播放器可请求电子书阅读器提供状态信息或执行某一动作,或使得电子书阅读器可控制其它应用程序。动态音频播放器也可经程序设计以实施此API。API的实例实施方案包含但不限于两个接口,一个接口用于来自电子书阅读器应用程序的调用,且另一个接口用于至电子书阅读器应用程序的调用。
电子书阅读器可对动态音频播放器进行的实例调用包含:
“ebookOpenedwithUniqueID”——当应用程序开启电子书时由电子书阅读器调用此函数。此函数具有指定电子书的唯一识别符且电子书在之前是否已被开启的参数。响应于此信息,动态音频播放器设定当前提示。在电子书被开启的第一时间,当前位置将被设定为第一提示的开始。
“ebookClosed”——当应用程序关闭电子书时由电子书阅读器调用此函数。响应于此调用,动态音频播放器可释放存储器并重设内部数据。
“ebookRemoved”——当电子书阅读器已从其程序库移除电子书时调用此函数,以便也可移除配音和音频文件。
“displayPositionRangeChanged”——当电子书阅读器改变其显示(举例来说,归因于翻页、方位改变、字体改变等等)且提供新显示的作品范围的参数时调用此函数。响应于此调用,动态音频播放器为新显示的作品范围设置音频提示。
“readingResumed”——当在长时间不活动之后用户已恢复阅读时调用此函数,电子书阅读器通过在阅读已被确定为“暂停”之后从用户接收各种输入中的任一种来检测不活动周期。
“fetchSoundtrack”——由电子书阅读器调用此函数以命令动态音频播放器提取并输入用于具有指定唯一识别符(作为此函数的参数而提供)的电子书的配音文件或提示列表。
“audioVolume”——由电子书阅读器调用此函数以命令动态音频播放器设定音频重放的音量。
“getCueLists”——由电子书阅读器调用此函数以从动态音频播放器检索有关可用于当前开启的电子书的提示列表和群组的信息。举例来说,此函数也允许电子书阅读器将此信息呈现给读者。
“cueListEnabled”——由电子书阅读器调用此函数以命令动态音频播放器启用或停用特定提示列表,例如,替代性配音、声音效果、已记录的阅读器或文本/语音转换。
“audioIntensity”——由电子书阅读器调用此函数以命令动态音频播放器设定音频重放的强度,例如降低音频成分音量或使鼓符干(次混合)静音。
“audioPreloadDefault”——调用此函数以设定下载音频并为所有电子书保留在手头的默认时数。
“audioPreloadForEbook”——调用此函数以设定下载音频并为特定电子书保留的时数。
“downloadEnabled”——调用此函数以启用或停用音频下载。
动态音频播放器可对电子书阅读器进行的实例调用包含:
“readingPaused”——如果此函数在预期时间内尚未从电子书阅读器接收“displayedPositionRangeChanged”调用,那么由动态音频播放器调用此函数。从这个信息,由动态音频播放器假定用户不再阅读。在调用此函数之后,当用户再次开始阅读时,电子书阅读器应调用“readingResumed”函数。
“gotoPosition”——由动态音频播放器调用此函数以命令电子书阅读器在书中设定当前位置,通常在响应于所调用的“ebookOpendedAtPath”函数而开启电子书的第一时间的第一提示的开始点处。
“wordCountForRange”——由动态音频播放器调用此函数以命令电子书阅读器为电子书的指定范围提供大量的字,用于如下文更详细地所描述的调度播放列表并追踪阅读速度。
下文更详细地描述这些API调用的使用。
电子书110具有下文结合图3详细地所描述的关联提示列表118,其使文本的部分与音频提示120相关联。通常,用于唯一地识别电子书110的识别符用于通过将识别符嵌入到提示列表中或具有使书的识别符与提示列表118相关联的查找表或地图的形式而使提示列表118与书相关联。音频提示120是包含音频数据的计算机数据文件。通常,在读者阅读文本的部分的同时重放通过提示列表118而与文本的那个部分相关联的音频提示120。举例来说,文本的部分可由文本中的某一点表示,在这个点周围音频提示应开始播放,或文本的部分可由文本中的某一范围表示,在这个范围期间应播放音频提示。动态音频播放器116确定何时并如何停止播放一个音频提示且开始播放另一个音频提示。
动态音频播放器116接收有关用户与电子书阅读器112互动的数据114,以及提示120和提示列表118。如下文将更详细地描述,动态音频播放器116使用用户互动数据114和提示列表118以选择待播放的音频提示120,和何时并如何播放音频提示120,以提供输出音频信号122。
在配音的重放期间,动态音频播放器播放与当前阅读的文本的部分相关联的当前提示,且基于有关用户与文本的互动的数据而确定如何并何时转变下一个待播放的提示。如图2更详细地所示,动态音频播放器200因此使用当前提示204和下一个提示210以产生音频206。通过提示查找208使用有关用户互动的数据212和提示列表202来确定待播放的提示204和210。在动态音频播放器播放当前提示204的同时,动态音频播放器监视传入数据212以确定应何时播放下一个提示。当前提示204可能需要播放达比提示的实际持续时间更长或更短的时间。如下文更详细地所描述,动态音频播放器增长或缩短当前提示,以便配合用户阅读文本的关联部分所花费的时间量,且然后在用户达到与下一个提示相关联的文本的估计时间实施转变,例如交叉衰落。
现在参考图3,现在将更详细地描述图1中提示列表118的实例实施方案。音频提示(例如图1中的120和图2中的204、210)指派给文本的部分。此指派可使用使文本的部分与音频文件相关联的元标签信息文件而进行。与音频文件的关联可为直接的或间接的,且可被静态或动态定义。举例来说,文本的不同部分可被指派指示待与文本的那些部分相关联的音乐情感、心情或风格的不同字或其它标志。音频文件因而可与这些字或标志相关联。如下文更详细地所描述,可选择音频文件且使音频文件与文本静态相关联,或可在重放时间动态选择音频文件。或者,文本中的不同点可与音频文件直接相关联。
图3展示实例元标签信息文件。元标签信息文件是代表提示的数据对302的列表300。代表提示的每一对302包含对文本的参考304,例如对在文本文档内的标示语言要素、与文本文档开始的偏移或在文本文档内的范围的参考。对302也包含指定提示的数据306。此数据可为字或标志,例如情感标签,或此数据可为音频文件的指示,例如文件名称或任何其它可用于选择音频文件的数据。下文将更详细地描述作曲家或计算机程序可如何建立这些提示列表。
元标签信息文件可实施为是含有若干元数据文件的档案的文件。这些文件可呈Java描述语言对象记法(JSON)格式。元标签信息文件可包含含有有关配音的一般信息的声明文件,例如与配音相关联的电子书的唯一识别符、电子书的标题、计划版本(为了兼容性的目的,万一格式将来改变),和档案中其它文件的列表,其中检查和用于完整性检查。除了声明文件之外,元标签信息文件也包含提示列表文件,其含有配音中可用的提示列表描述符列表。每一提示列表描述符包含显示名称、用于查找目的的唯一识别符和提示列表的可选群组名称。作为实例,可存在若干互斥主要提示列表,其仅对单一播放有意义。这些提示列表可能具有名为“主要”的群组名称,然而带有声音效果或“读给我听”提示列表能够同时播放这些提示列表,且因此将不利用群组名称。
元标签信息文件也包含含有全部提示列表的提示描述符列表的提示文件。每一提示描述符包含由制作者给予提示描述符的描述性名称。此描述符可使用为此目的的另一应用程序输入,且可包含例如提示文件名称的信息,其用于查找提示文件列表中的提示文件的位置,和在电子书中的内点和外点。
最后,元标签信息文件包含“提示文件”文件,其含有提示文件描述符列表。提示文件指定提示文件的网络位置。每一文件描述符包含由制作者给予提示文件且用作提示描述符中的提示文件名称、用于检索提示文件的统一资源定位符(URL)和提示文件的原始文件名称的描述性名称。
这种提示列表中所提到的音频提示(图1中的120)含有音频数据,其可存储为音频文件格式,例如AIFF、MP3、AAC、m4a或其它文件类型。现在参考图4,将描述音频提示文件的实例实施方案。音频提示文件400可包含多个“符干”(次混合)402,其中每一符干是为提示提供多部分音频混合的一部分的单独音频文件。这些符干的使用允许动态音频播放器从符干当中选择加以重复,以便增长提示的重放时间。音频提示文件也可包含有助于动态音频播放器修改音频提示被播放的持续时间的信息,例如循环标记404、栏位置406和推荐混合信息408。推荐混合信息包含用于组合音频符干的指令列表,其中每一指令指示待使用的符干和区段,和待应用任何音频效果处理。也可提供其它信息,例如指示意欲由指示流派、风格、乐器、情感、气氛、地点、时代的音频或数据所唤起的情感或心情的字或标志——被称作描述符410。也可包含甚至更多的额外信息,例如替代性关键字、提示音量、交叉衰落或淡入/淡出形状/强度和用于连续提示的推荐调和级数。
作为实例,音频提示文件可实施为含有呈JSON格式的元数据文件和的提示符干的一个或多个音频文件的档案。元数据文件含有与音频文件相关联的元数据的描述符,其包含栏位置、循环标记、推荐混合信息、emode(情感内容元标签)、音频动态控制元数据(动态范围压缩)、乐器、气氛和流派。音频文件可包含每一符干的数据压缩音频文件和高分辨率原始音频文件。保持每一符干的高分辨率版本会支援稍后使用音乐制作工具进行编辑。可制造不含原始音频文件的音频提示文件的副本以少量下载到电子书阅读器。提示文件含有每一符干的压缩音频文件,其是用于在终端用户应用程序中重放的文件。
可使用软件工具来建立提示文件,软件工具输入一组标准音频符干、添加描述符、循环点和推荐混合元信息作为分离的文本文件、最优化并压缩用于网络递送的音频,且输出可上传到数据库的单独封装文件。可使用各种分析技术来分析音频文件以定位区段、节拍、响度信息、衰落、循环点和链接。可使用描述符“流派、风格、乐器、情感、地点、时代”来选择提示,且在由读者使用提示在网络上递送提示。
提示列表和提示文件可被个别地加密并链接到它们在其中为配音的特定作品。可使用相同密钥以存取作品和其配音。因此,文件可束缚于特定作品或供存取作品的特定观看装置,且可使用与作品相关联的数字版权管理信息。
考虑到对提示列表、音频提示和可用于与电子书阅读器的互动,先前理解,现在将结合图5到7来更详细地描述动态音频播放器。
为了在读者第一次开启(500)书时起始重放,电子书阅读器调用502“ebookOpenedwithUqiqueID”函数,其指示书的唯一识别符及书过去是否已被开启。动态音频播放器接收504电子书的识别符,且下载或读取506所识别书的提示列表。电子书阅读器通过调用508“getCueList”函数而提示动态音频播放器注意有关提示列表的信息。动态音频播放器发送510提示列表,电子书阅读器将提示列表呈现给用户以选择512书的配音中的一者(如果存在一个以上配音)。可通过使用允许用户评定配音的客户反馈评定系统来提高这种选择,且当由系统请求选择配音时可将这些评定显示给用户。然后调用514“cueListEnable”函数以向动态音频播放器通知选定提示列表,动态音频播放器通过函数调用而接收516选定提示列表。调用518“fetchSoundtrack”函数以命令动态音频播放器提取520提示供重放。
在此设置过程完成之后,动态音频播放器具有开始提示和提示列表且具有当前提示以用于起始重放。大约在电子书阅读器显示电子书的此部分的时间可开始重放。动态播放器然后基于有关用户与书籍的互动的数据而确定下一个待播放的提示、何时播放所述提示和如何从当前提示转变到下一个提示。
动态音频播放器延长或缩短提示的音频符干文件的重放时间以配合估计的总提示持续时间。此估计的提示持续时间可以若干方式计算。实例实施方案使用阅读速度的估计,下文将更详细地描述阅读速度的估计的计算。当前提示持续时间是响应于描述用户与电子书阅读器的互动的数据而更新,例如在每一翻页时通过“displayPositionRangeChanged”调用函数而提供。
通常,通过自动循环音频符干文件的区段、改变个别符干混合且动态增加各种效果(例如混响、延迟和合唱)而修改提示的音频符干文件的重放时间。音频符干文件所特有的循环点和其它混合自动化数据存储于提示文件的元数据中。在提示文件中可存在若干不同循环点。可选择音频符干的区段,使得当循环并再混合时其提供最有效的且有趣的音乐终端用户体验。此过程避免了产生含有明显重复的音乐并最大化音乐内容以递送持续时间可为原始音频片段的持续时间的许多倍的音乐上愉悦的结果。当触发下一个提示时,传出音频与传入音频之间的转变也由相同过程所管理,其是通过使用提示文件元数据定义适当交叉衰落的风格和布置以产生无缝的音乐转变而进行。
作为实例,假定提示文件含有四个音频符干(旋律音轨、持续和弦或“垫”音轨、节奏敲击(通常为鼓)音轨和节奏和声音轨),如果以单次播放,那么其将运行四分钟。进一步假定此记录具有三个相异区段A、B和C。提示文件中的元信息将包含:
1.如何从先前提示转变到所述提示。此包含转变风格(即,慢、中等或快淡入,或以混响尾部停止先前提示且从提示开始起动新提示)、音乐栏和节拍标记,使得交叉衰落在音节上无缝。
2.A、B和C区段中每一者的时间位置可循环。
3.提示制作者的关于四个符干可如何再混合的输入。举例来说,只使用区段A播放符干1、2和3,然后只使用区段A播放符干1、3和4,将混响添加到符干3,且使用区段B播放符干3,然后从区段B播放符干3和4等等。使用这些种类的乐器意味着典型的四分钟的音频片段可被延长到40分钟或更长而不含明显的重复。此外,每一混合对于用户是唯一的且在重放时间产生,因此更难复制未经授权的配音。
作为实例,现在参考图6,将更详细地描述此过程。考虑到提示和开始点,确定(600)直到播放下一个提示的持续时间。下文更详细地提供计算此持续时间的实例方式。考虑到持续时间,处理提示制作者的输入以产生所需持续时间的播放列表。换句话说,选择602再混合信息中的第一指令并添加到播放列表。如果在604处确定音频符干的此区段具有小于所需持续时间的持续时间,那么然后选择606下一个指令,且重复此过程直到完成608所需持续时间的列表。在提示结束时,使用下一个提示的元数据中的转变信息以选择610当前列表中的开始点以实施从当前提示到下一个提示的交叉衰落。
估计提示的持续时间的一种方式是估计读者的阅读速度(每分钟的字数),且考虑到在提示中字数而确定读者大概需要花费多长时间完成阅读书的此部分。此估计可从读者的阅读速度信息的历史记录中计算得出。
当用户开始阅读书时,假定每分钟特定字数的初始阅读速度。此初始速度可从各种有关用户从阅读先前书的先前阅读速度的历史记录的数据中计算得出,其可由作者、流派、当天时间、位置并跨越全部书而组织。如果不存在先前的阅读历史记录,那么可使用其它用户如何阅读此标题的匿名的全部记录。如果不存在历史记录,那么可使用典型的每分钟400字。
现在参考图7,每当显示位置范围改变时就追踪用户的阅读速度,如由“displayedPositionRangeChanged”调用函数所指示。如果接收(700)此函数调用,那么随后检查702若干条件。这些条件包含但不限于全部要求:用户主动地阅读,即,不在阅读暂停状态;新显示位置范围大于先前的显示位置范围;新显示位置范围的开始触及到先前显示位置范围的结束;和字计数高于最小量(当前为150字)。自从最后改变以来的时间也应在易察觉的范围内,例如检查平均阅读速度的平均阅读速度的标准偏差在常规的预期变化量内。如果满足这些条件,那么记录704当前时间。计算并存储706自从对显示位置范围的最后改变以来的时间,以及先前显示位置范围的字计数。计算708对此区段的阅读速度。从所测量的阅读速度的历史数据,可计算平均阅读速度并用于估计提示持续时间。
用于计算对页p的阅读速度(每秒的字数)Sp的公式为:
S P = W P T P
其中Wp为页的字计数且Tp为阅读页所花费的时间(以秒为单位)。在一个实施方案中,用于平均阅读速度的统计为20周期指数移动平均值(EMA),其消除速度中的波动,同时仍更重要地考虑当前页数速度。
计算EMA的公式是:
M0=S0
M p = n - 1 n + 1 × M p - 1 + 2 n + 1 × S p
其中n是周期的数目,即20。
为了计算阅读速度中的变化量,遍及最后20个值,我们使用计算变化量的维尔福德方法:
初始化M1=Ti和S1=0
对于T的后续值,使用递推公式
M k = M k - 1 + T k - M k - 1 k
Sk=Sk-1+(Tk-Mk-1)×(Tk-Mk)
对于≤k≤n,变化量的kth估计为:
S 2 = S k k - 1
此阅读速度信息可局部地存储于用户的电子书阅读器应用程序平台上。对于多个用户而言这种信息可被编译并以匿名方式存储于服务器上。应用程序可查找阅读速度信息统计以确定其它人是如何快速地阅读作品或作品的部分。
可使用代替阅读速度或除了阅读速度之外的其它类型的用户互动以控制重放。
在一个实施方案中,有关用户与电子书的互动的数据指示读者已经从书中的某一点开始阅读。这经常发生,读者通常不会一口气从开始到结束阅读书。在一些状况下,当读者开始从书中某一点开始阅读时,音频位准或那一点处配音中音频的“刺激”的其它位准可能不适当。即,音频可实际上在那一点处转移注意力。动态音频播放器可使用读者已开始从书中的某一位置开始阅读的指示作为一种机会,从已为包含当前阅读位置的书的部分中选择的音频提示中选择替代性音频提示。
作为另一实例,读者可跳跃地从章节到章节来阅读书。其它多媒体作品可鼓励这种阅读方式。在这种状况下,当起始所播放的作品的区段的显示时,播放与那个区段相关联的音频提示。可执行从先前显示区段的音频到新显示区段的音频的简短交叉衰落。在一些应用(其中作品的性质使得任何特定区段的观看时间很难预测)中,动态重放引擎可简单地假设持续时间是不定的且其可继续产生基于提示文件中的指令的音频直到接收到开始另一个音频提示的指令。
作为另一个实例,可使用音频提示文件以响应于用户输入而重放提示文件中的不同区段。举例来说,流行歌曲可被划分成区段。可提供用户接口用于控制音频重放,其可响应于用户输入而命令播放器跳跃到下一个区段或跳跃到指定区段。
现在已描述如何建立这些作品和伴随配音后,现在将论述其分配。
建立用于电子书的配音包括使音频文件与电子书的文本的部分相关联。存在建立配音的若干方式。
在一个实施方案中,作曲家为文本的每一部分撰写并记录原始音乐。文本的每一部分可与如此撰写并记录的个别音频文件相关联。或者,可选择先前记录音乐并与文本的部分直接相关联。在这些实施方案中,音频文件静态且直接指派到文本的部分。
在另一实施方案中,音频文件间接指派到文本的部分。标签(例如字或其它标志)与文本的部分相关联。这些标签可存储于计算机数据文件或数据库中且与电子书相关联,其类似于上文所描述的提示列表。对应标签也与音频文件相关联。一个或多个作曲家撰写并记录意欲唤起特定情感和心情的原始音乐。或者,可选择先前记录音乐。这些音频文件也与这些标签相关联,且可存储于数据库中。与文本的部分相关联的标签可用于自动选择带有相同标签的对应音频文件。在对于书中的标签识别多个音频文件的情况下,可由计算机或通过人为干涉来选择音频文件中的一者。此实施方允许音频文件收集中于数据库中,且半自动完成配音的建立,其是通过使考虑到与电子书和音频文件相关联的标签而选择音频文件的过程自动化而进行。
在音频文件与电子书间接相关联的实施方案中,可在较接近重放的时间使用标签来动态选择音频文件。
使标签与电子书相关联的过程可为自动化的。特定而言,可由计算机处理文本以基于文本的字的语义分析而使情感描述符与文本的部分相关联。这种语义分析的实例技术包含但不限于由塞西莉亚·欧伏斯德特在“来自文本的情感:机器学习基于文本的情感预测”中所描述的技术,579页到586页人类语言科技的进程讨论会和自然语言处理经验方法的讨论会(2005年10月),并以引用的方式并入到文本中。这些标签可描述支援所观看的作品的区段的情感感觉或其它情绪。举例来说,这些情感感觉包含但不限于中度紧张、爱情趣味、紧张、洋洋得意、男子气概、阴暗、沉思、害怕、高兴、悲哀、忧郁、迷人的瞬间、欢快和快乐。
图8是说明建立用于电子书的配音的完全自动化过程的实例的数据流程图,其考虑到音频文件具有与其相关联的标签。电子书800输入到情感描述符产生器802,其输出情感描述符和书的文本范围804。情感描述符用于在音频数据库806中查找音频文件810,其匹配书中的每一范围的情感描述符。音频选择器808允许为每一文本范围自动、随机或半自动选择音频文件以产生提示列表812。可为电子书产生唯一识别符并与提示列表812一起予以存储。
这些电子书和其配音可以各种方式分配,包含但不限于用于电子书商业分配的当前使用方式。在一个实施方案中,电子书和电子书阅读器使用常规技术分配到终端用户。分离地完成额外配音和动态音频播放器的分配。配音的分配通常以两步来完成:首先下载提示列表,且然后下载每一音频文件。音频文件可在要求时下载。动态音频播放器可包含文件管理器,其维持关于可存储于供电子书阅读器操作的同一装置上或可远程地存储的可用提示文件的信息。
在一个实施方案中,电子书与提示列表和动态音频播放器一起分配给终端用户。
在另一实施方案中,电子书和其关联提示列表一起分配。提示列表然后作为背景任务用于为配音下载音频文件。在一个实施方案中,首先下载电子书且起始提示列表的下载作为背景任务,且然后立即下载第一提示的第一音频文件。
在另一实施方案中,电子书阅读器是含有包含局部通用提示的局部存储器的装置,其具有各种可根据提示列表重放而选择的情感描述符。如果远程音频文件不可用,那么这些通用提示允许音频的重放。
在一个实施方案中,电子书阅读器应用程序被加载至能够存取网络的平台上,例如因特网,平台可通过网络而与电子媒体的分配器通信。这种分配器可从用户接收购买和/或下载电子媒体的请求。在接收请求之后,分配器可从数据库检索经请求作品和其伴随配音信息。所检索的电子媒体可被加密并发送给电子书阅读器应用程序的用户。电子媒体可被加密,使得电子媒体仅可在单一的电子书阅读器上播放。通常,与作品相关联的数字版权管理信息可被应用于配音信息。
在前述内容中,存储媒体可代表一个或多个用于存储数据的装置,包含只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储媒体、光学存储媒体、快闪存储器和/或其它用于存储信息的机器可读媒体。术语“机器可读媒体”和“计算机可读媒体”包含但不限于便携式或固定存储装置、光学存储装置和/或各种其它能够存储、包含或携带指令和/或数据的媒体。
此外,可由硬件、软件、固件、中间件、微代码或其组合物实施实施例。当在软件、固件、中间件或微代码中实施时,用以执行必要任务的程序代码或代码段可存储于机器可读媒体(例如存储媒体或其它存储器)中。处理器可执行必要的任务。代码段可代表程序、函数、子程序、程序、例程、子例程、模块、软件封装、类别或任何指令、数据结构或程序语句的任何组合。代码段可通过传递和/或接收信息、数据、自变量、参数或存储器内容而耦合到另一代码段或硬件电路。信息、自变量、参数、数据等等可经由任何合适的方式来传递、转发或传输,包括存储器共享、消息传递、符记传递、网络传输等等。
结合本文中所揭示的实例而描述的各种说明性逻辑块、模块、电路、元件和/或组件可使用经设计以执行本文中所描述的函数的通用处理器、数字信号处理器(DSP)、特殊应用集成电路(ASIC)、场效应可程式化栅阵列(FPGA)或其它可程式化逻辑组件、离散栅或晶体管逻辑、离散硬件组件或其任何组合而实施或执行。通用处理器可为微处理器,但或者,处理器可为任何常规处理器、控制器、微控制器、电路和/或状态机。处理器也可作为计算机组件的组合而实施,例如,DSP和微处理器、多个微处理器、与DSP芯片连接的一个或多个微处理器或任何其它这种配置的组合。
结合本文中所揭示的实例而描述的方法和算法可直接体现于处理器可执行的软件模块中,或体现于两者的组合中、体现为处理单元、程序设计指令或其它指导的形式,且可包含于单一装置中或跨越多个装置而分散。软件模块可驻存于RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬磁盘、可移动磁盘、CD-ROM或此项技术中人员所知的任何其它形式的存储媒体中。存储媒体可耦合到处理器,使得处理器可从存储媒体读取信息或将信息写入到存储媒体。或者,存储媒体可与处理器成整体。
诸图所说明的一个或多个组件和函数可在不背离本发明的情况下再配置和/或组合到单一组件中或嵌入到若干组件中。也可在不背离本发明的情况下添加额外元件或组件。另外,本文中所描述的特征可实施于软件中、实施于硬件中、作为商业方法而实施,和/或其组合。
虽然已描述并在附图中展示某些示范性实施例,但应理解,这些实施例仅仅是说明性的且并不限制本发明,因为所属领域的技术人员可想到各种其它修改,所以本发明仅以实例的方式呈现且本发明不限于所示和所描述的特定构造和配置。

Claims (9)

1.一种用于音频动态重放的计算机实施方法,它包括:
接收有关用户与电子视觉作品的一部分的互动的数据;及
根据所述用户互动来动态调整与所述电子视觉作品的所述部分相关联的音频重放的持续时间。
2.根据权利要求1所述的计算机实施方法,它还包括:
根据所述接收到的有关用户与所述电子视觉作品的所述部分的互动的数据来估计所述电子视觉作品的所述部分的视觉显示的持续时间;及
选择与所述电子视觉作品的所述部分相关联的音频符干的混合序列,以便提供具有所述估计持续时间的音频。
3.根据权利要求2所述的计算机实施方法,其特征在于,使用阅读速度的历史来估计所述持续时间。
4.一种用于与电子视觉作品的显示同步地播放配音的计算机实施方法,它包括:
将所述电子视觉作品接收到存储器中;
将使所述电子视觉作品的部分与标签相关联的信息接收到存储器中;
响应于用户互动而显示所述电子视觉作品的部分;
存取具有标签的音频文件;
使用处理器根据与所述电子视觉作品的部分相关联的所述标签来选择与所述电子视觉作品的所述部分相关联的音频文件;
接收有关用户与电子视觉作品的部分的互动的数据;及
根据所述用户互动来动态调整与所述电子视觉作品的所述部分相关联的音频重放的持续时间。
5.一种用于产生电子视觉作品的配音的计算机实施方法,它包括:
将所述电子视觉作品接收到存储器中;
由处理器处理所述存储器中的所述电子视觉作品,以通过在存储器中使标签与所述电子视觉作品的部分相关联来标记所述电子视觉作品的部分;
存取具有标签的音频文件;
使用所述处理器根据与所述电子视觉作品的部分相关联的所述标签来选择所述电子视觉作品的所述部分的音频文件。
6.根据权利要求5所述的计算机实施方法,其特征在于,所述电子视觉作品包含文本,且所述处理包含处理所述文本。
7.根据权利要求6所述的计算机实施方法,其特征在于,所述标签包含情感描述符。
8.一种数字信息产品,它包括:
计算机可读媒体;
存储于所述计算机可读媒体上的计算机可读数据,当由计算机处理时,所述计算机可读数据由所述计算机解译以界定包含提示列表的计算机可读文件,对于电子视觉作品的每一部分,所述提示列表包含情感描述符,其特征在于,所述情感描述符对应于同样与音频数据相关联的情感描述符。
9.一种数字信息产品,它包括:
计算机可读媒体;
存储于所述计算机可读媒体上的计算机可读数据,当由计算机处理时,所述计算机可读数据由所述计算机解译以界定包含界定音频提示的数据的计算机可读文件,所述音频提示包含用于多个可被混合以提供音频数据的符干的音频数据和指示所述符干可如何被重复及组合的信息。
CN2010800607993A 2009-11-10 2010-11-10 用于电子视觉作品的配音的动态音频重放 Pending CN102687182A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US25999509P 2009-11-10 2009-11-10
US61/259,995 2009-11-10
PCT/US2010/056281 WO2011060106A1 (en) 2009-11-10 2010-11-10 Dynamic audio playback of soundtracks for electronic visual works

Publications (1)

Publication Number Publication Date
CN102687182A true CN102687182A (zh) 2012-09-19

Family

ID=43868382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010800607993A Pending CN102687182A (zh) 2009-11-10 2010-11-10 用于电子视觉作品的配音的动态音频重放

Country Status (6)

Country Link
US (2) US8527859B2 (zh)
EP (1) EP2499626A1 (zh)
JP (1) JP2013511214A (zh)
KR (1) KR20120091325A (zh)
CN (1) CN102687182A (zh)
WO (1) WO2011060106A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104166689A (zh) * 2014-07-28 2014-11-26 小米科技有限责任公司 电子书籍的呈现方法及装置
CN104299631A (zh) * 2013-07-17 2015-01-21 布克查克控股有限公司 电子媒体内容的同步声道的传送
CN105261374A (zh) * 2015-09-23 2016-01-20 海信集团有限公司 跨媒体的情感关联方法和系统
CN106708894A (zh) * 2015-11-17 2017-05-24 腾讯科技(深圳)有限公司 电子书配置背景音乐的方法和装置
CN106960051A (zh) * 2017-03-31 2017-07-18 掌阅科技股份有限公司 基于电子书的音频播放方法、装置和终端设备
CN108604242A (zh) * 2016-01-04 2018-09-28 格雷斯诺特公司 生成和分发具有相关音乐和故事的播放列表
CN109493839A (zh) * 2018-11-12 2019-03-19 平安科技(深圳)有限公司 基于语音合成的空气质量展示方法、装置及终端设备
CN109994000A (zh) * 2019-03-28 2019-07-09 掌阅科技股份有限公司 一种伴读方法、电子设备及计算机存储介质

Families Citing this family (223)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
JP5816085B2 (ja) * 2008-07-04 2015-11-17 ブックトラック ホールディングス リミテッド サウンドトラックを作成してプレイする方法及びシステム
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
KR101702659B1 (ko) * 2009-10-30 2017-02-06 삼성전자주식회사 동영상 콘텐츠와 전자책 콘텐츠의 동기화 장치와 방법 및 시스템
CN102687182A (zh) * 2009-11-10 2012-09-19 杜尔塞塔有限公司 用于电子视觉作品的配音的动态音频重放
US20130297599A1 (en) * 2009-11-10 2013-11-07 Dulcetta Inc. Music management for adaptive distraction reduction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US20120001923A1 (en) * 2010-07-03 2012-01-05 Sara Weinzimmer Sound-enhanced ebook with sound events triggered by reader progress
KR101058268B1 (ko) * 2010-08-03 2011-08-22 안명환 비가독부를 구비한 이동단말기
US9535884B1 (en) 2010-09-30 2017-01-03 Amazon Technologies, Inc. Finding an end-of-body within content
US9645986B2 (en) 2011-02-24 2017-05-09 Google Inc. Method, medium, and system for creating an electronic book with an umbrella policy
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US20120310642A1 (en) * 2011-06-03 2012-12-06 Apple Inc. Automatically creating a mapping between text data and audio data
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8935259B2 (en) 2011-06-20 2015-01-13 Google Inc Text suggestions for images
US9666227B2 (en) * 2011-07-26 2017-05-30 Booktrack Holdings Limited Soundtrack for electronic text
US8612584B2 (en) * 2011-08-29 2013-12-17 Google Inc. Using eBook reading data to generate time-based information
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US9141404B2 (en) 2011-10-24 2015-09-22 Google Inc. Extensible framework for ereader tools
GB2510744A (en) * 2011-11-04 2014-08-13 Barnesandnoble Com Llc System and method for creating recordings associated with electronic publication
US20130117670A1 (en) * 2011-11-04 2013-05-09 Barnesandnoble.Com Llc System and method for creating recordings associated with electronic publication
US9031493B2 (en) 2011-11-18 2015-05-12 Google Inc. Custom narration of electronic books
US20130131849A1 (en) * 2011-11-21 2013-05-23 Shadi Mere System for adapting music and sound to digital text, for electronic devices
US9182815B2 (en) 2011-12-07 2015-11-10 Microsoft Technology Licensing, Llc Making static printed content dynamic with virtual data
US9229231B2 (en) 2011-12-07 2016-01-05 Microsoft Technology Licensing, Llc Updating printed content with personalized virtual data
US9183807B2 (en) 2011-12-07 2015-11-10 Microsoft Technology Licensing, Llc Displaying virtual data as printed content
US9213705B1 (en) 2011-12-19 2015-12-15 Audible, Inc. Presenting content related to primary audio content
EP2608002A1 (en) * 2011-12-21 2013-06-26 France Telecom Method for determining a reading speed of a section of an electronic content
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US20130268826A1 (en) * 2012-04-06 2013-10-10 Google Inc. Synchronizing progress in audio and text versions of electronic books
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9165381B2 (en) 2012-05-31 2015-10-20 Microsoft Technology Licensing, Llc Augmented books in a mixed reality environment
US8933312B2 (en) * 2012-06-01 2015-01-13 Makemusic, Inc. Distribution of audio sheet music as an electronic book
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9141257B1 (en) * 2012-06-18 2015-09-22 Audible, Inc. Selecting and conveying supplemental content
US9535885B2 (en) 2012-06-28 2017-01-03 International Business Machines Corporation Dynamically customizing a digital publication
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US20140040715A1 (en) * 2012-07-25 2014-02-06 Oliver S. Younge Application for synchronizing e-books with original or custom-created scores
CN103680562B (zh) * 2012-09-03 2017-03-22 腾讯科技(深圳)有限公司 音频文件的布点实现方法和装置
US9047356B2 (en) 2012-09-05 2015-06-02 Google Inc. Synchronizing multiple reading positions in electronic books
US9575960B1 (en) * 2012-09-17 2017-02-21 Amazon Technologies, Inc. Auditory enhancement using word analysis
US9544204B1 (en) * 2012-09-17 2017-01-10 Amazon Technologies, Inc. Determining the average reading speed of a user
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9123053B2 (en) * 2012-12-10 2015-09-01 Google Inc. Analyzing reading metrics to generate action information
CN103020226A (zh) * 2012-12-12 2013-04-03 北京百度网讯科技有限公司 一种获取搜索结果的方法和装置
US20140173441A1 (en) * 2012-12-19 2014-06-19 Hcl Technologies Limited Method and system for inserting immersive contents into eBook
KR20150104615A (ko) 2013-02-07 2015-09-15 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014160717A1 (en) * 2013-03-28 2014-10-02 Dolby Laboratories Licensing Corporation Using single bitstream to produce tailored audio device mixes
CN104168174A (zh) * 2013-05-16 2014-11-26 阿里巴巴集团控股有限公司 一种传输信息的方法及装置
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US9317486B1 (en) 2013-06-07 2016-04-19 Audible, Inc. Synchronizing playback of digital content with captured physical content
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
CN105453026A (zh) 2013-08-06 2016-03-30 苹果公司 基于来自远程设备的活动自动激活智能响应
IN2014DE02666A (zh) * 2013-09-18 2015-06-26 Booktrack Holdings Ltd
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US20150269133A1 (en) * 2014-03-19 2015-09-24 International Business Machines Corporation Electronic book reading incorporating added environmental feel factors
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10049477B1 (en) 2014-06-27 2018-08-14 Google Llc Computer-assisted text and visual styling for images
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US20160182435A1 (en) * 2014-12-23 2016-06-23 Sony Corporation Socially acceptable display of messaging
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US20170116047A1 (en) * 2015-10-25 2017-04-27 Khozem Z. Dohadwala Further applications of Reading State control - A method for repositioning reading material on electronic devices
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10042880B1 (en) * 2016-01-06 2018-08-07 Amazon Technologies, Inc. Automated identification of start-of-reading location for ebooks
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US20180032611A1 (en) * 2016-07-29 2018-02-01 Paul Charles Cameron Systems and methods for automatic-generation of soundtracks for live speech audio
US10698951B2 (en) * 2016-07-29 2020-06-30 Booktrack Holdings Limited Systems and methods for automatic-creation of soundtracks for speech audio
US20180032305A1 (en) * 2016-07-29 2018-02-01 Paul Charles Cameron Systems and methods for automatic-creation of soundtracks for text
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770411A1 (en) 2017-05-15 2018-12-20 Apple Inc. MULTI-MODAL INTERFACES
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
CN113724744B (zh) * 2017-06-29 2023-05-05 杜比国际公司 用于使外部内容适配视频流的方法、系统和计算机可读媒体
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
CN109543671B (zh) * 2018-09-30 2021-03-02 阿里巴巴(中国)有限公司 点读方法、点读笔、服务器数据处理方法及点读系统
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11227599B2 (en) 2019-06-01 2022-01-18 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
US11043220B1 (en) 2020-05-11 2021-06-22 Apple Inc. Digital assistant hardware abstraction
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US20220383559A1 (en) * 2021-06-01 2022-12-01 Apple Inc. Color Treatment and Color Normalization for Digital Assets

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020082007A1 (en) * 2000-12-22 2002-06-27 Jyrki Hoisko Method and system for expressing affective state in communication by telephone
US20070183753A1 (en) * 2006-01-24 2007-08-09 Sharp Kabushiki Kaisha Data outputting device, data outputting method, data outputting program, and recording medium
US20080141180A1 (en) * 2005-04-07 2008-06-12 Iofy Corporation Apparatus and Method for Utilizing an Information Unit to Provide Navigation Features on a Device
WO2009024626A1 (es) * 2007-08-23 2009-02-26 Tunes4Books, S.L. Método y sistema para adaptar la velocidad de reproducción de la banda sonora asociada a un texto a la velocidad de lectura de un usuario
US20090191531A1 (en) * 2007-12-21 2009-07-30 Joseph Saccocci Method and Apparatus for Integrating Audio and/or Video With a Book

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4305131A (en) * 1979-02-05 1981-12-08 Best Robert M Dialog between TV movies and human viewers
US5484292A (en) * 1989-08-21 1996-01-16 Mctaggart; Stephen I. Apparatus for combining audio and visual indicia
US5209665A (en) * 1989-10-12 1993-05-11 Sight & Sound Incorporated Interactive audio visual work
JP3120085B2 (ja) * 1991-11-21 2000-12-25 株式会社セガ 電子装置及び情報担体
US5437552A (en) * 1993-08-13 1995-08-01 Western Publishing Co., Inc. Interactive audio-visual work
US5649234A (en) * 1994-07-07 1997-07-15 Time Warner Interactive Group, Inc. Method and apparatus for encoding graphical cues on a compact disc synchronized with the lyrics of a song to be played back
US6199076B1 (en) * 1996-10-02 2001-03-06 James Logan Audio program player including a dynamic program selection controller
US5897324A (en) * 1997-02-03 1999-04-27 Atop Technologies, Inc. Multimedia-book operable with removable data storage media implemented with universal interfacing book-adapting processor
US6424996B1 (en) * 1998-11-25 2002-07-23 Nexsys Electronics, Inc. Medical network system and method for transfer of information
US6529920B1 (en) * 1999-03-05 2003-03-04 Audiovelocity, Inc. Multimedia linking device and method
US7149690B2 (en) * 1999-09-09 2006-12-12 Lucent Technologies Inc. Method and apparatus for interactive language instruction
US6598074B1 (en) * 1999-09-23 2003-07-22 Rocket Network, Inc. System and method for enabling multimedia production collaboration over a network
WO2001091028A1 (en) * 2000-05-20 2001-11-29 Leem Young Hie On demand contents providing method and system
WO2002037471A2 (en) * 2000-11-03 2002-05-10 Zoesis, Inc. Interactive character system
US20060292049A1 (en) * 2003-09-04 2006-12-28 Tetsuya Nagasaka Process for producing rutile
US20050186548A1 (en) * 2004-02-25 2005-08-25 Barbara Tomlinson Multimedia interactive role play system
NO320758B1 (no) * 2004-07-23 2006-01-23 Telenor Asa Anordning og fremgangsmate for gjengivelse av audiovisuelt innhold
US7735012B2 (en) * 2004-11-04 2010-06-08 Apple Inc. Audio user interface for computing devices
US20080120342A1 (en) * 2005-04-07 2008-05-22 Iofy Corporation System and Method for Providing Data to be Used in a Presentation on a Device
US7790974B2 (en) * 2006-05-01 2010-09-07 Microsoft Corporation Metadata-based song creation and editing
JP5816085B2 (ja) 2008-07-04 2015-11-17 ブックトラック ホールディングス リミテッド サウンドトラックを作成してプレイする方法及びシステム
US9386139B2 (en) * 2009-03-20 2016-07-05 Nokia Technologies Oy Method and apparatus for providing an emotion-based user interface
US20100332225A1 (en) * 2009-06-29 2010-12-30 Nexidia Inc. Transcript alignment
CN102687182A (zh) * 2009-11-10 2012-09-19 杜尔塞塔有限公司 用于电子视觉作品的配音的动态音频重放
US20110153330A1 (en) * 2009-11-27 2011-06-23 i-SCROLL System and method for rendering text synchronized audio
US8634701B2 (en) * 2009-12-04 2014-01-21 Lg Electronics Inc. Digital data reproducing apparatus and corresponding method for reproducing content based on user characteristics
US8564421B2 (en) * 2010-04-30 2013-10-22 Blackberry Limited Method and apparatus for generating an audio notification file
US8434001B2 (en) * 2010-06-03 2013-04-30 Rhonda Enterprises, Llc Systems and methods for presenting a content summary of a media item to a user based on a position within the media item

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020082007A1 (en) * 2000-12-22 2002-06-27 Jyrki Hoisko Method and system for expressing affective state in communication by telephone
US20080141180A1 (en) * 2005-04-07 2008-06-12 Iofy Corporation Apparatus and Method for Utilizing an Information Unit to Provide Navigation Features on a Device
US20070183753A1 (en) * 2006-01-24 2007-08-09 Sharp Kabushiki Kaisha Data outputting device, data outputting method, data outputting program, and recording medium
WO2009024626A1 (es) * 2007-08-23 2009-02-26 Tunes4Books, S.L. Método y sistema para adaptar la velocidad de reproducción de la banda sonora asociada a un texto a la velocidad de lectura de un usuario
US20090191531A1 (en) * 2007-12-21 2009-07-30 Joseph Saccocci Method and Apparatus for Integrating Audio and/or Video With a Book

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104299631A (zh) * 2013-07-17 2015-01-21 布克查克控股有限公司 电子媒体内容的同步声道的传送
CN104166689A (zh) * 2014-07-28 2014-11-26 小米科技有限责任公司 电子书籍的呈现方法及装置
CN104166689B (zh) * 2014-07-28 2018-04-06 小米科技有限责任公司 电子书籍的呈现方法及装置
CN105261374A (zh) * 2015-09-23 2016-01-20 海信集团有限公司 跨媒体的情感关联方法和系统
CN106708894A (zh) * 2015-11-17 2017-05-24 腾讯科技(深圳)有限公司 电子书配置背景音乐的方法和装置
CN106708894B (zh) * 2015-11-17 2019-12-20 腾讯科技(深圳)有限公司 电子书配置背景音乐的方法和装置
CN108604242A (zh) * 2016-01-04 2018-09-28 格雷斯诺特公司 生成和分发具有相关音乐和故事的播放列表
CN106960051B (zh) * 2017-03-31 2019-12-10 掌阅科技股份有限公司 基于电子书的音频播放方法、装置和终端设备
CN106960051A (zh) * 2017-03-31 2017-07-18 掌阅科技股份有限公司 基于电子书的音频播放方法、装置和终端设备
CN109493839A (zh) * 2018-11-12 2019-03-19 平安科技(深圳)有限公司 基于语音合成的空气质量展示方法、装置及终端设备
CN109493839B (zh) * 2018-11-12 2024-01-23 平安科技(深圳)有限公司 基于语音合成的空气质量展示方法、装置及终端设备
CN109994000A (zh) * 2019-03-28 2019-07-09 掌阅科技股份有限公司 一种伴读方法、电子设备及计算机存储介质
CN109994000B (zh) * 2019-03-28 2021-10-19 掌阅科技股份有限公司 一种伴读方法、电子设备及计算机存储介质

Also Published As

Publication number Publication date
US20110195388A1 (en) 2011-08-11
WO2011060106A1 (en) 2011-05-19
EP2499626A1 (en) 2012-09-19
US20130346838A1 (en) 2013-12-26
US8527859B2 (en) 2013-09-03
KR20120091325A (ko) 2012-08-17
JP2013511214A (ja) 2013-03-28

Similar Documents

Publication Publication Date Title
CN102687182A (zh) 用于电子视觉作品的配音的动态音频重放
US20200168197A1 (en) Method of composing a piece of digital music using musical experience descriptors to indicate what, when and how musical events should appear in the piece of digital music automatically composed and generated by an automated music composition and generation system
CN106708894B (zh) 电子书配置背景音乐的方法和装置
Ben-Tal et al. How music AI is useful: engagements with composers, performers and audiences
CN108292411A (zh) 使用对象资产生成视频内容项目
Levitin Why music moves us
Gelineck et al. Longitudinal evaluation of the integration of digital musical instruments into existing compositional work processes
CN102163220B (zh) 歌曲过渡元数据
Hyung et al. Utilizing context-relevant keywords extracted from a large collection of user-generated documents for music discovery
KR20090017414A (ko) 사용자 단어검색 이력을 통한 학습컨텐츠 제공 시스템
Knotts et al. AI-Lectronica: Music AI in clubs and studio production
Uitdenbogerd World cloud: A prototype data choralification of text documents
Bayley et al. Creative layers and continuities: A case study of Nicole Lizée and the Kronos Quartet
Navarro-Cáceres et al. A user controlled system for the generation of melodies applying case based reasoning
CN113611268A (zh) 音乐作品生成、合成方法及其装置、设备、介质、产品
Andra Performance anxiety in piano playing
Cross Digital media in the music classroom
Rubisch et al. RaPScoM-a framework for rapid prototyping of semantically enhanced score music
Gover et al. Choir Singers Pilot–An online platform for choir singers practice
CN113797541B (zh) 一种音乐游戏关卡生成方法、装置、设备及存储介质
Crowdy Code musicology: From hardwired to software
Cooper Rock and Roll Music! The Songs of Chuck Berry
Baggi et al. NINA-Navigating and Interacting with Notation and Audio
Müller et al. Multimodal music processing (dagstuhl seminar 11041)
Kobel ‘Just a man singing’: Scott Walker and the voice of another

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120919