CN104471512A - 内容定制化 - Google Patents

内容定制化 Download PDF

Info

Publication number
CN104471512A
CN104471512A CN201380035935.7A CN201380035935A CN104471512A CN 104471512 A CN104471512 A CN 104471512A CN 201380035935 A CN201380035935 A CN 201380035935A CN 104471512 A CN104471512 A CN 104471512A
Authority
CN
China
Prior art keywords
user
describe
file
computing equipment
describing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201380035935.7A
Other languages
English (en)
Inventor
道格拉斯·黄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Order C Compaq
Audible Inc
Original Assignee
Order C Compaq
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/465,871 external-priority patent/US9075760B2/en
Priority claimed from US13/465,853 external-priority patent/US20140258858A1/en
Application filed by Order C Compaq filed Critical Order C Compaq
Publication of CN104471512A publication Critical patent/CN104471512A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • G09B5/062Combinations of audio and printed presentations, e.g. magnetically striped cards, talking books, magnetic tapes with printed texts thereon
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants

Abstract

本发明公开内容定制服务。用户计算设备和/或内容定制服务器可在收听者或权利持有者的请求下定制与内容项相关联的叙述。可提供一个或多个用户接口以促进这些请求。定制的一些实例包括指定用于叙述的语言、口音、语气或说话者的设置。定制的其它实例包括指定用于叙述的低音、高音、音高、语速或对比的设置。所述内容定制服务可选择计算设备以执行所述定制。例如,所述用户计算设备可自身修改所述叙述,或所述用户计算设备可将对所修改的叙述的请求传输到所述内容定制服务器,所述内容定制服务器接着可将所修改的叙述传输到所述用户计算设备。

Description

内容定制化
背景
许多形式的数字内容含有音频内容。例如,电子书、有声读物、音乐、电影和计算机游戏可能均含有音频内容。这种音频内容可包括例如一个或多个口语部分。通常,这种音频内容是预先记录的且不可由内容消费者定制。相反,音频内容的完全新记录经常需要产生定制的音频内容。出于多种原因,不太可能获得针对用户的收听兴趣的新记录。例如,产生音频内容的新记录的成本可为高昂的。用户针对他或她的爱好精确地定制音频内容也可能是困难、耗时并且昂贵的:例如,用户可能必须监督音频内容的新记录的产生。
实施例将是示例性的。用户可能对购买某个叙述者叙述的有声读物有兴趣。用户可为有声读物优选不同叙述者的声音。用户也可能希望收听另一种语言的有声读物。在前一种情况下,用户可能必须支付由他或她优选的叙述者完成的有声读物的全新记录。在后一种情况下,用户可能必须支付有声读物的翻译并且支付其他语言的有声读物的新记录。用户可能还想要定制叙述的其他方面,但是可能发现这样做是不切实际的。
当许多用户以不同方式要求内容的定制时,可混合这些问题。例如,一个用户可能希望对有声读物叙述进行一组修改,而第二用户希望对相同有声读物叙述进行第二组修改。满足两种用户的品味由于记录修改或定制的叙述的成本而在经济上可能是不可行的。当然,这些问题和其它问题不仅仅限于有声读物内容,还存在于包括音频内容的许多形式的数字内容中。
附图简述
结合附图时参考以下详细描述,可更好地理解前述方面以及许多伴随优点,因此同样将更易于了解所述方面以及优点,在附图中:
图1是用于修改与内容项相关联的叙述的示例性网络环境的方块图。
图2是可实施内容定制服务的示例性服务器的示意图。
图3A是描绘用于产生叙述的设置并且将所述设置提交到内容定制服务器的示例性例程的状态图。
图3B是描绘用于产生叙述的设置并且将所述设置提交到内容定制服务器的示例性例程的状态图。
图3C是描绘用于产生叙述的设置并且将所述设置提交到人类交互任务系统的示例性例程的状态图。
图4是描绘用于从内容定制服务器获得叙述设置和/或修改的叙述的示例性例程的状态图。
图5是描绘用于产生修改的叙述的示例性例程的流程图。
图6是可用来产生叙述设置的示例性用户接口的示意图。
图7是可用来产生叙述设置的示例性用户接口的示意图。
图8是包括视觉指示器的示例性用户接口的示意图。
详述
一般来说,本公开的方面涉及计算机实施的音频叙述的修改和定制。内容项可包括音频叙述,如电子书、有声读物、音乐、电影和计算机游戏,在此仅举几个例子。本文中称为“叙述参数”的音频叙述的许多方面可被修改来提供定制收听体验。因此,希望定制他或她的收听体验的人通过他或她的用户计算设备上的用户接口指定对一个或多个叙述参数的设置或改变。在一些实施方案中,动态地进行这些设置和改变,例如,在播放将要定制的音频叙述时进行设置或修改。这些设置和改变可作为叙述设置信息存储,所述叙述设置信息接着可在网络上与其它计算设备共享,如果需要。
本领域技术人员将认识到叙述可包括例如单词、短语或句子,并且叙述可由如叙述者、解说员或人物角色等说话者说、唱、呼喊等等。叙述也可包括如人物角色在内容项中说过的对话、旁白或说出的想法等单词、短语或句子。
叙述参数可包括叙述的各种定量方面,如说话者声音的音高、高音、低音、对比和语速。叙述参数也可包括叙述的各种定性方面,如说话者的口音、说话者的语言或方言、说话者的语气、说话者的性别、说话者的韵律等等。
在一些实施方案中,用户使用他或她的用户计算设备产生用于音频叙述的一个或多个叙述参数的设置。一个或多个用户接口可经提供用于产生这些设置。用户接口可包括允许用户设置或改变音频叙述的各种参数的元素。在一个实施方案中,滑动条用来设置或改变定量叙述参数,如音高、语速、对比等等,同时下拉菜单用来设置或改变定性叙述参数,如语气、口音、语言等等。其他用户接口元素(如软件旋钮、转盘、混合器、声音板、复选框、单选按钮等等)同样可并入用户接口中。
一个或多个用户接口同样可允许用户为叙述的不同部分指定不同叙述参数。例如,有声读物可被分解成对应于章节的部分。一组叙述参数可用于章节1,第二组叙述参数用于章节2,第三组叙述参数用于章节3等等。叙述同样可以其它方式分解,如通过时间增量或人物角色对话。
经由本文所述的用户接口指定的叙述参数可被实施来通过计算设备修改叙述。内容定制服务可引起用户计算设备显示用户接口并且提示用户经由所述用户接口指定或设置一个或多个叙述参数。在一个实施方案中,这些用户接口可显示为内容页的一部分(如“网站”)。在另一个实施方案中,移动计算应用(如“app”)将这些用户接口显示在用户计算设备上,并且引起用户计算设备所接收的用户输入在网络上传输到内容定制服务器。内容定制服务器可在网络上接收用户输入、修改叙述并且将已修改的叙述的一部分或所有在网络上传输到用户计算设备。在其它实施方案中,内容定制服务完全由单一用户计算设备而不是由内容定制服务器执行。因此,用户接口可通过用户计算设备上的软件或硬件产生并且显示给用户。用户计算设备可根据用户输入修改叙述并且播放已修改的叙述。
在一些实施方案中,产生叙述设置信息以供一个或多个叙述使用或供一个或多个计算设备使用。在一个实施方案中,叙述设置信息被存储为叙述设置文件。叙述设置文件可由用户计算设备、权利持有者计算设备、内容定制服务器或其任何组合产生。叙述设置文件可包括用于叙述的一个或多个部分的一个或多个叙述参数的规范。如上所述,这些规范可经由用户接口制作。叙述参数的相同设置可用于整个叙述,或叙述的不同部分可具有针对每个叙述参数的不同设置。叙述设置文件可能任选地经历人类分析,以便确定其如何准确地捕获语气、语言或口音。另外,可基于例如谁上传或下载叙述设置文件、叙述设置文件可能会补足何种类型的内容和叙述设置文件的流行性(在此仅举几个实施例)来将叙述设置文件推荐给内容定制服务的用户。叙述设置信息的创建可涉及多于一个计算设备。例如,多个用户可与其各自的用户计算设备交互以编辑存储在内容定制服务器或甚到是另一个用户计算设备上的单一叙述设置文件。单一叙述设置文件的个别参数可由不同用户修改。同样,针对叙述的个别部分的叙述设置也可由不同用户修改。
在一些实施方案中,内容定制服务根据叙述设置文件定制叙述。内容定制服务接着可将根据叙述设置文件定制的叙述的一部分或所有传输到用户计算设备。在一个实施方案中,用户计算设备将叙述设置文件与根据叙述设置文件定制叙述的请求一起传输到内容定制服务器。在另一个实施方案中,用户计算设备仅将针对将要根据存储在数据存储器中的叙述设置文件定制的叙述的请求传输到内容定制服务器。内容定制服务器可从数据存储器选择叙述设置文件、根据叙述设置文件定制叙述并且接着将修改的叙述传输到用户计算设备。在用户计算设备修改叙述的内容定制服务的实施方案中,用户计算设备可从与上述内容定制服务相关联的内容定制服务器获得叙述设置文件。用户计算设备接着可根据叙述设置文件指定的叙述参数修改叙述自身。在其它实施方案中,叙述设置文件存储在用户计算设备上,并且用户计算设备使用叙述设置文件独立产生修改的叙述。
在一些实施方案中,叙述设置文件与用于具体内容项的叙述相关联。例如,指定用于具体内容项的叙述的不同部分的不同叙述设置的叙述设置文件仅可与那个具体内容项一起使用,并且不可与其它内容项一起使用。在其它实施方案中,叙述设置文件可与许多不同叙述或许多不同内容项一起使用。例如,特别叙述设置文件可能仅指定用户的语言和口音偏好而不参照任何特别内容项。在另一个实施例中,这种叙述设置文件可能包括针对定量叙述参数的特别设置。例如,用户可优选,叙述以特别语速进行而不参照任何特别内容项。
本领域技术人员将认识到,叙述设置文件不需要是任何特别的文件类型。在一些实施方案中,叙述设置文件具有供用于内容定制服务的特别文件类型,所述文件可仅经由内容定制服务解释并编辑。在其它实施方案中,叙述设置文件可在许多不同环境中(例如,通过许多不同软件应用)解释和编辑。例如,叙述设置文件可为可由许多不同软件应用打开并编辑的文件类型,如ASCII文本文件、标准文本(.txt)文件、富文本文件(RTF)、可扩展标记语言(XML)文件或其它文件类型。
另外,本领域技术人员将认识到,叙述设置信息可不仅表示为叙述设置文件,而且表示为适用于指定叙述参数的设置的任何形式的数字信息。在一个实施方案中,叙述设置信息被表示为计算机可执行代码,所述代码在运行时根据计算机可执行代码中指定的参数修改叙述。在另一个实施方案中,叙述设置信息被表示为网络上主存的内容页。用户可经由用户计算设备访问内容页。当用户访问内容页时,内容页可指导用户计算设备改变一个或多个叙述参数。存储并应用叙述设置信息的其它形式是可能的。一般来说,可利用或根据叙述设置文件由内容定制服务执行的操作可利用或根据所有形式的叙述设置信息执行。
另外,在一些实施方案中,可在用户计算设备上选择并显示视觉指示器作为对音频叙述的补充。可基于例如叙述或内容项的上下文分析、与叙述或内容项相关联的标记或通过用户输入选择视觉指示器。在一些实施方案中,标记可为分配到项目或其它信息条的术语或关键字(如数字图像、书签、图像、文本部分、感兴趣的项等等)。标记可帮助描述项目并允许所述项目由浏览或搜索再次发现。标记也可以称作标签。
转向图1,示出示例性网络环境100。网络环境100可包括数据存储器102、内容定制服务器104、权利持有者计算设备106、网络108和任何数目的用户计算设备110A、110B、110N等等。网络环境100的组分可本地或通过网络108彼此通信。
数据存储器102可存储与一个或多个内容项相关联的一个或多个音频文件。例如,音频文件可包括包含叙述的有声读物。可将相同内容项的多个叙述存储在数据存储器102中,所述叙述例如相同内容项的英语叙述、法语叙述和西班牙语叙述或相同语言以不同口音口述的多个版本。数据存储器102也可存储可用来定制内容项的叙述的叙述设置信息,如叙述设置文件。叙述设置文件可指定与一个或多个内容项相关联的叙述的一个或多个部分的各种叙述参数的设置。叙述设置文件也可被组织、编目、分类等等,如果需要。例如,数据存储器102中的叙述设置文件可由产生叙述设置文件的用户、叙述设置文件可能需要的叙述类型或叙述设置文件可能需要的一个或多个特别项目分类。其它分类是可能的并且处于本公开的范围内。可执行文件或内容页形式的叙述设置信息可根据需要以类似方式组织。
在一些实施方案中,数据存储器102也存储一个或多个叙述者声音库。叙述者声音库可包括音频文件,所述音频文件包括原始内容项中一个或多个叙述者或人物角色口述的一个或多个剪辑。音频剪辑可包括例如个别音素或音节、单词、短语或句子。在一些实施方案中,由叙述者或人物角色口述的一组音频剪辑可包括足够的音频剪辑,使得内容定制服务运行的语音合成程序可以叙述者或人物角色的声音构建任何需要的音节、单词、短语、句子等等。这种语音合成程序(如拼接语音合成或共振峰语音合成的程序)在本领域中已知并且在此不会进一步详细描述。
数据存储器102也可以存储用来动态产生新叙述的数据。例如,数据存储器102可存储叙述的一个或多个文本抄本,如叙述脚本。数据存储器102也可以存储文本形式的内容项,如电子书。数据存储器102也可以存储用于产生新叙述的规则,例如,叙述被修改来具有口音。关于口音的实施例规则可能是“利用‘ah’音素替换叙述中的所有‘ar’音素”以达成波士顿口音,使得叙述中“car”的变成“cah”。
数据存储器102可以硬盘驱动器、固态存储器和/或任何其它类型的非暂时性计算机可读媒体具体化。在不脱离本公开的精神和范围的情况下,如本领域已知的,可在多个存储设备上分布或划分数据存储器102。此外,虽然存储器102在图1中被描绘为对于内容定制服务器104是本地的,但是本领域技术人员将理解,数据存储器102对于内容定制服务器104可以是远程的。
内容定制服务可在许多电子环境中实现。在一些实施方案中,内容定制服务在由一个或多个用户计算设备110A-110N通过网络108访问的内容定制服务器104中实现。在其它实施方案中,内容定制服务整体在用户计算设备110A-110N中实现。
内容定制服务器104可能够将数据传输到用户计算设备110A-110N并且从所述用户计算设备接收数据。例如,内容定制服务器104可能够从一个或多个用户计算设备110A-110N接收对所修改的叙述和/或叙述设置信息的请求。内容定制服务器104也可执行所请求的修改以产生所修改的叙述。内容定制服务器104也可能够将叙述设置信息、内容项、原始叙述和所修改的叙述传输到一个或多个用户计算设备110A-110N。
权利持有者计算设备106和每个用户计算设备110A-110N可为能够通过网络108通信的任何计算设备,如膝上型计算机或平板计算机、个人计算机、个人数字助理(PDA)、混合PDA/移动电话、移动电话、电子书阅读器、机顶盒、照相机、有声读物播放器、数字媒体播放器、视频游戏控制台、信息服务站、电视、一个或多个处理器、包括在计算设备中的集成部件、电器、包括在车辆或机械中的电子设备、游戏设备等等。权利持有者计算设备106和每个用户计算设备110A-110N可操作来产生或显示用户接口,以用于根据用户输入定制叙述。这些计算设备接着可存储叙述设置信息(例如,作为用户产生的叙述设置文件或作为权利持有者产生的叙述设置文件)并且通过网络108传输所述信息。
内容定制服务器104、权利持有者计算设备106和用户计算设备110A-110N可各自跨多个计算设备实现,从而各自执行各自的内容定制服务器104、权利持有者计算设备106和用户计算设备110A-110N的实例。实施内容定制服务器104、权利持有者计算设备106和用户计算设备110A-110N的服务器或其它计算系统可包括网络接口、存储器、处理单元和非暂时性计算机可读媒体驱动器,所有这些可通过通信总线彼此通信。此外,处理单元自身可被称为计算设备。网络接口可通过网络108和/或其它网络或计算机系统提供连通性。处理单元可向并从含有程序指令的存储器通信,所述处理单元执行所述指令以便操作内容定制服务器104、权利持有者计算设备106和用户计算设备110A-110N。存储器大体包括RAM、ROM和/或其它持久和/或辅助的非暂时性计算机可读媒体。
本领域技术人员将理解,网络108可以是任何有线网络、无线网络或其组合。此外,网络108可以是个人区域网、局域网、广域网、电缆网络、卫星网络、蜂窝电话网络或其组合。用于经由因特网或任何其它前述类型的通信网络进行通信的协议和部件对于计算机通信领域中的技术人员来说是众所周知的,并且因此不必在本文中更详细地进行描述。
将认识到,上述许多设备是可选的并且环境100的各实施方案可或可不联合设备。此外,部件不需要是不同或分立的。设备也可以在环境100中进行重组。例如,内容定制服务器104可以单个物理服务器表示或可选择地可分成多个物理服务器。整个内容定制服务同样可以单个用户计算设备110A、110B、110N等等表示。
图2是示例性内容定制服务器104的示意图。内容定制服务器104可包括叙述修改部件202、联网部件204、目录部件206和用户接口部件208。这些部件可彼此通信。内容定制服务器104可连接到数据存储器102并且可能够通过网路108通信。图1中示出的网络环境的其它元件在这幅图中已省略,以便于不会模糊内容定制服务器104。然而,内容定制服务器104也可能够与图1中示出的权利持有者计算设备106和一个或多个用户计算设备110A-110N进行本地或通过电子网络108通信。
叙述修改部件202可操作来产生所修改的叙述。在一个实施方案中,叙述修改部件202从数据存储器102检索叙述和叙述设置文件。在另一个实施方案中,叙述修改部件从数据存储器102检索叙述并且从接收用户输入的用户计算设备动态接收叙述设置。叙述修改部件202接着将叙述设置文件或用户输入指定的设置施加到叙述。接着可通过网络108将所修改的叙述传输到用户计算设备。在通过网络108传输所修改的叙述的实施方案中,所修改的叙述可以整体、一个或多个部分或连续流传输到用户计算设备,如本领域已知。
取决于将要改变的叙述参数,可以不同方式修改叙述。以下参考图6论述对叙述参数的具体修改和用于执行那些修改的示例性过程。本领域技术人员将理解,这些过程可由内容定制服务器104或用户计算设备或两者执行。例如,内容定制服务器104可修改叙述的一个部分并且使所修改的叙述流传输到用户计算设备,同时用户计算设备修改存储在用户计算设备上的叙述的第二部分。
目录部件204可操作来识别并标记叙述设置文件的各种特征。这些特征可包括例如产生叙述设置文件的用户、叙述设置文件可能需要的叙述类型或叙述设置文件可能需要的一个或多个特别项目。目录部件204可存储每个叙述设置文件的特征,以便有助于来自数据存储器102的叙述设置文件的未来检索或帮助用户选择将要从内容定制服务获得的叙述设置文件。例如,目录部件204可识别,特别的叙述设置文件与一系列中的内容项相关联。如果用户计算设备的用户下载用于所述系列中的一个内容项的叙述设置文件,那么目录部件204可指导内容定制服务器104通过网络108将推荐传输到用户计算设备,从而建议所述用户下载用于所述系列中的另一个内容项的第二叙述设置文件。其它推荐是可能的。例如,用户可通过持有内容项的权利的特别作者在他或她的用户计算设备上具有内容项。所述作者可已产生叙述设置文件以用于与内容项的叙述一起使用。目录部件204可指导内容定制服务器104通过网络108将推荐传输到用户计算设备,从而建议用户下载由作者产生的叙述设置文件。根据需要,其它形式的叙述设置信息(如可执行文件或内容页)可以类似方式编目。
目录部件204也可操作来标记与内容项相关联的叙述。标记可并入叙述或内容项中,所述叙述基于标记以便帮助内容定制服务通过机器选择叙述参数或协助用户选择叙述参数。标记可对应于叙述的一部分并且可建议用于叙述的语气以及其它叙述参数,如音高、高音、低音等等。
在一个实施方案中,内容定制服务可使叙述与其附属的文本内容项同步、基于文本内容项的上下文分析产生标记并且接着将那些标记建议的叙述参数应用到所述叙述。2011年3月23日提交并且标题是“同步数字内容(SYNCHRONIZING DIGITAL CONTENT)”的美国专利申请号13/070,313(本公开以全文引用方式并入本文)描述叙述和文本内容项可同步的许多方法。例如,文本内容项的一部分可陈述:“史蒂夫和我吸入氦气”。内容定制服务可将命名为“氦气”的标签附加到叙述中立即发生在单词“吸入氦气”之后的一部分。叙述中立即发生在单词“吸入氦气”之后的一部分的音高可响应于标签而增加,因为氦气使吸入它的人以高音高语音说话。在其它实施方案中,用于叙述的一部分的标签可由内容定制服务器104从通过网络108访问的网络资源获得。例如,目录部件204可通过在与叙述相关联的文本内容项的每个章节的概述上执行上下文分析来确定用于叙述的每个章节的语气。例如,概述可由基于网络的百科全书或知识库主存。
联网部件206可操作来通过网络108与一个或多个用户计算设备交互。例如,联网部件206可从用户计算设备接收针对叙述设置信息(如叙述设置文件)的请求。这个请求可被中继到目录部件204,所述目录部件接着可选择或推荐来自数据存储器102的将要传输到用户计算设备的叙述设置信息。联网部件206接着可使内容定制服务器104通过网络108将所选择的叙述设置信息传输到用户计算设备。
联网部件206也可通过网络108将叙述设置信息或所修改的叙述传输到用户计算设备。在通过网络108传输所修改的叙述的实施方案中,所修改的叙述可以整体、一个或多个部分或连续流传输到用户计算设备,如本领域已知。例如,当叙述修改部件202完成它对叙述的一部分的修改时,可将所修改的叙述部分传输到用户计算设备。
联网部件206也可能够分析多个个体和/或与内容定制服务器104交互的他们的用户计算设备之间的关系。例如,第一用户计算设备的第一用户可将叙述设置文件上传到内容定制服务器104。目录部件204在由第一用户计算设备的第一用户产生所上传的叙述设置文件时识别它。联网部件206接着可通过网络108访问与第一用户相关联的社交图形,所述社交图形由社交联网服务维持。联网部件206可识别第一用户的社交图形中的数个个体。例如,联网部件206可识别,第二用户计算设备的第二用户与社交图形中的第一用户相关或相关联(例如,作为“朋友”或“联系人”或作为相同“组”或“圈子”的成员)。因此,联网部件206可指导内容定制服务器104通过网络108将推荐传输到第二计算设备的用户,以便下载由第一用户产生的叙述设置文件。在另一个实施例中,联网部件206可指导内容定制服务器104将推荐传输到第二用户计算设备,从而建议第二用户下载由社交图形中与所述第二用户相关的第一用户先前下载的叙述设置文件。基于社交图形其它方面的其它推荐是可能的:例如,基于“共同朋友”(例如,出现在多个用户的社交图形中的个体)或共同组成员资格的推荐。
联网部件206也可包括用于选择计算设备以执行对叙述的修改的决策逻辑。例如,一些用户计算设备可能不适合执行对叙述的修改。例如,叙述修改可能需要用户计算设备的大量能量(例如,存储在电池中的电能)以用于执行。如果用户计算设备的能量储备低于处理修改所需的能量,那么可在可插上电源(且因此具有功能上无限的能量储备)的内容定制服务器104上进行修改。用户计算设备也可具有相对慢的处理器,以使得用户计算设备耗费不可接受的长时间来实行叙述修改。使内容定制服务器104修改叙述并且将所修改的叙述传输到用户计算设备可为有利的。卸载更多计算上要求的叙述修改可为特别有利的,所述叙述修改如涉及大部分叙述的那些或可能需要语音到文本或文本到语音转换的那些叙述修改(例如,对叙述的语言或口音的改变)。
联网部件206也可通过网络108与一个或多个用户计算设备通信,以便确定哪些用户计算设备与哪些内容项相关联。例如,用户可具有存储在他或她的用户计算设备上的特别有声读物。因此,联网部件206可识别存储在用户计算设备上的有声读物、指导内容定制服务器104检索(如由目录部件204确定)与有声读物相关联的叙述设置信息并且通过网络108将叙述设置信息传输到用户计算设备。
联网部件206也可基于关于用户叙述偏好的信息自动指导叙述设置信息到用户计算设备的传输。例如,内容定制服务可确定用户计算设备与特别内容项(如有声读物)相关联的用户先前已产生用于许多不同叙述的类似叙述设置。例如,用户可能先前已指示,他或她优选以慢语速口述并且具有南方口音的叙述。联网部件206可识别用户先前已使用的叙述设置,并且指导内容定制服务器104检索针对有声读物定制并且匹配用户先前产生的叙述设置的叙述设置文件。
用户接口部件208可操作来产生一个或多个用户接口以供与内容定制服务一起使用。这些用户接口可例如在由内容定制服务的实施方案主存在网络108上的内容页(或“网页”)上产生。用户可使用他或她的计算设备通过网络108访问内容页,以便与用户接口部件208产生的一个或多个用户接口交互。这些交互可包括用户指定用于叙述的一个或多个叙述参数的设置、用户要求用于叙述的叙述设置信息(如叙述设置文件)或用户要求内容定制服务器104产生将要传输到用户计算设备的修改叙述。关于图6、图7和图8进一步论述示例性用户接口和它们的操作。
本领域技术人员将认识到,内容定制服务可以单个用户计算设备具体化,如上论述。因此,用户计算设备可包括可被包括在示例性内容定制服务器104中的部件的一些或所有。例如,用户计算设备可包括叙述修改部件202和用户接口部件208,以便用户计算设备可获得来自用户的改变或设置。用户计算设备也可包括由联网部件206使用以确定哪个设备实行叙述修改的决策逻辑。例如,用户计算设备可经由用户接口接收针对修改的请求并且接着例如如果到内容定制服务器104的网络连接不可用,那么实行那些修改。如果用户计算设备处于与网络服务提供商的有限数据计划上,那么用户计算设备也可实行针对大部分叙述的修改,以使得流传输大部分所修改的叙述对于用户可能是昂贵的。
图3A描绘示例性状态图,通过所述状态图可由用户计算设备110A产生设置并且由内容定制服务存储以供使用。用户可使用他或她的用户计算设备110A产生如叙述设置文件的叙述设置信息,所述叙述设置信息指定或设置用于叙述的一个或多个部分的一个或多个叙述参数。内容定制服务可在用户计算设备110A上提供一个或多个用户接口,以便促进叙述设置文件的产生。已产生叙述设置文件,用户接着可通过网络108将所述文件提交到内容定制服务器104。内容定制服务器104接着可吸入那些设置。在吸入例程期间,内容定制服务器104可编目、分类或另外归类所产生的叙述设置文件。例如,内容定制服务器104可使叙述设置文件与产生叙述设置文件的用户;用户产生叙述设置文件所针对的内容项;用户产生叙述设置文件所针对的内容项的类型等等相关联。已在叙述设置文件上执行吸入例程,内容定制服务器104接着可将叙述设置文件存储到数据存储器102,以用于未来检索和例如到用户计算设备110B-110N的传输。这个吸入例程也可在叙述设置文件上以可执行文件或内容页的形式加以执行。
图3B描绘示例性状态图,通过所述状态图可由权利持有者计算设备106产生设置并且由内容定制服务器104存储以供使用。权利持有者可为持有内容项或原始叙述中的知识产权(例如,商标权、版权、公开权或精神权利)的任何个体、群组或商业实体。在一些实施方案中,权利持有者是内容项的发布者。在其它实施方案中,权利持有者是原始叙述的叙述者。在其它实施方案中,权利持有者是内容项的作者。权利持有者也可是来自发布者、作者、叙述者等等的权利的受让人或被许可人。
权利持有者可使用权利持有者计算设备106产生如叙述设置文件的叙述设置信息,所述叙述设置信息指定或设置用于叙述的一个或多个部分的一个或多个叙述参数。虽然以下论述叙述设置文件,但是可遵循相同例程来产生可执行叙述设置信息或内容页形式的叙述设置信息。内容定制服务可在权利持有者计算设备106上提供一个或多个用户接口,以便促进叙述设置信息的产生。这些用户接口可类似于内容定制服务在用户计算设备110A-110N上提供的那些。
内容定制服务也可容许权利持有者计算设备106的用户锁定叙述中与具有权利的权利持有者相关的一个或多个部分。例如,内容项的作者可希望执行内容项的叙述并且接着产生针对他或她的叙述的叙述设置文件,在所述叙述设置文件中,整个叙述的所有叙述参数均被锁定。以这种方式,权利持有者可选择防止任何人对他或她的叙述的叙述参数进行任何修改。
或者,权利持有者可选择仅锁定叙述的一部分或仅锁定某些叙述参数。例如,内容项的作者可执行他或她的内容项的叙述。作者可希望允许用户收听他或她的使用许多语言的内容项叙述,但是可能不希望允许任何其它改变。因此,作者可产生特别针对他或她的内容项的他或她的叙述的叙述设置文件,在所述叙述设置文件中,除了语言参数之外所有叙述参数均被锁定。
已产生叙述设置文件,权利持有者接着可通过网络108将所述文件提交到内容定制服务器104。内容定制服务器104接着可吸入如上述的那些设置,从而使叙述设置文件与权利持有者、与权利持有者具有权利的内容项或叙述等等相关联。已在叙述设置文件上执行吸入例程,内容定制服务器104接着可将叙述设置文件存储到数据存储器102,以用于未来检索和使用。
除了使用用户产生的和权利持有者产生的叙述设置文件之外,内容定制服务也可自动产生用于一个或多个内容项的叙述设置文件。图3C描绘示例性状态图,在所述状态图中,内容定制服务器104经由机器分析产生叙述设置文件。
在一些实施方案中,内容定制服务器104产生可与许多不同叙述和/或许多不同内容项一起使用的叙述设置文件。例如,内容定制服务器104可产生可与特别类型的内容项一起使用的叙述设置文件、可与相同作者的多个内容项一起使用的叙述设置文件、可与特别叙述者的语音一起使用的叙述设置文件等等。可与特别叙述者的语音一起使用的叙述设置文件可有利地用来避免对叙述者记录多个有声读物的需要。在其它实施方案中,叙述设置文件是机器产生的,以供包括叙述的特定有声读物或内容项使用。例如,内容定制服务器104可将其自身的设置分配给特定叙述的每个被标记部分。
在产生叙述设置文件时,内容定制服务器104也可从人类交互任务系统112接收输入。一般来说,人类交互任务系统112是用电子方法处理人类交互任务(HIT)的计算机化系统,所述系统包括一个或多个计算设备。HIT可为计算设备要执行的困难、耗时或昂贵的任务。然而,人类可能相对容易和快速地执行HIT。因此,人类交互任务系统112可能请求人类工作者执行HIT(例如用于收集信息或回答询问)并且将结果或答案返回到人类交互任务系统112,以用于进一步处理和/或对请求者的展示。人类工作者可能非常适合做出关于一组叙述参数有多匹配叙述者口述的单词、叙述的语气、内容项的语气等等的主观决定。人类工作者可志愿回答这些和其它询问并且将其它信息提供到人类交互任务系统112,以使得答案和信息可提供到内容定制服务器104。
可由内容定制服务器104产生HIT,以便改进叙述的机器修改。HIT的实施例可为“这个叙述是否捕获文本的语气?”接着可播放叙述的一部分。如果人类工作者指示,叙述并未捕获文本的语气,那么人类工作者可以被提示建议对叙述参数进行一个或多个改变。例如,内容定制服务器104可显示一个或多个用户接口(如图6和图7中所示出)并且请求人类工作者改变叙述参数,以便产生更多适当的叙述设置文件。
图4描绘内容定制服务在其执行叙述修改操作时的示例性状态图。本文将参考这个状态图描述四个示例性叙述修改操作。本领域技术人员将理解其它操作是可能的。另外,虽然以下论述关于叙述设置文件的实施例,但是这些操作一般可与任何形式的叙述设置信息一起使用。
在第一示例性操作中,内容项的原始叙述被存储在用户计算设备110上。用户在用户计算设备110上产生对所修改叙述或本地存储的叙述设置文件的请求(1)。例如,用户可经由显示在用户计算设备110上的用户接口指定数个叙述参数,或用户可导入存储在用户计算设备110上的叙述设置文件。作为响应,用户计算设备可基于用户输入或基于应用于原始叙述的所导入的叙述设置文件产生所修改的叙述(6)。
在第二示例性操作中,内容项的原始叙述被存储在用户计算设备110上。用户在用户计算设备110上产生对叙述设置文件的请求(1)并且通过网络108将请求传输到内容定制服务器104(2)。响应于请求,内容定制服务器104可从数据存储器102检索叙述设置文件(3)并且通过网络108将叙述设置文件传输到用户计算设备110(5)。用户计算设备110接着可使用叙述设置文件从存储在用户计算设备110上的原始叙述产生所修改的叙述(6)。
在第三示例性操作中,用户在他或她的用户计算设备110上产生对叙述设置文件的请求(1)并且通过网络108将请求传输到内容定制服务器104(2)。响应于请求,内容定制服务器104可从数据存储器102检索内容项的原始叙述和叙述设置文件(3)并且将叙述设置文件应用于原始叙述以产生所修改的叙述(4)。内容定制服务器接着可将所修改的叙述传输到用户计算设备110(5)。
在第四示例性操作中,用户在他或她的用户计算设备110上通过将一个或多个改变指定到原始叙述的一个或多个叙述参数来产生对所修改的叙述的请求(1),其中将原始叙述从内容定制服务器104传输到用户计算设备110以用于回放。可通过网络108将请求传输到内容定制服务器104(2)。响应于请求,内容定制服务器104可从数据存储器102(或从内容定制服务器104上的存储缓冲器)检索原始叙述(3)并且应用用户所请求的改变以产生所修改的叙述(4)。内容定制服务器接着可经由网络108将所修改的叙述传输到用户计算设备110(5)。
内容定制服务可基于各种因素选择遵循哪种叙述修改操作(例如,哪种计算设备执行哪些叙述修改),并且可针对叙述的不同部分遵循多个操作。可基于许多因素做出对叙述的一部分进行一些或所有需要的修改的计算设备的选择。
在一个实施方案中,内容定制服务访问关于通过网络108连接的一个或多个计算设备的硬件信息(例如,用户计算设备110和内容定制服务器104),以便评估这些值并且相应地作出决定。例如,内容定制服务可确定,被选择来进行所请求的叙述修改的计算设备应该具有至少约500MHz、至少约800MHz或至少约1GHz(仅举几个示例性阈值)的处理器速度。如果用户计算设备110具有高于内容定制服务所设置的阈值的处理器速度,那么用户计算设备110可形成所修改的叙述。如果不高于,那么内容定制服务器104可形成所修改的叙述并且通过网络108将所修改的叙述传输到用户计算设备110。其它因素可同样用来引导设备的选择,所述因素如通过网络108连接的可用性、用户计算设备110的能量储备(例如,电池电平)或安装在用户计算设备110中的RAM数量,仅举几个实施例。
计算设备的选择也可由将要执行的对叙述的修改确定。在一个实施方案中,通过内容定制服务选择用户计算设备110来对叙述的一部分的定量叙述参数进行修改,所述参数如低音、高音、音高、语速或对比。在另一个实施方案中,通过内容定制服务选择内容定制服务器104来对叙述的一部分的定性叙述参数进行修改,所述参数如语言、口音、语气或说话者。这些计算设备选择反映的是,用户计算设备110对定量叙述参数做出改变并将改变应用于其可为相对容易的,但是使用户计算设备110也对定性叙述参数做出改变并将改变应用于其可为相对困难或不切实际的。例如,内容定制服务器104可更适合于产生所修改的叙述,其中为叙述选择新的说话者,因为利用新的说话者产生所修改的叙述可涉及从原始叙述产生文本副本、接着使用存储在数据存储器102上的新说话者的语音的剪辑从文本副本合成新叙述。
图5描绘用于将要在用户计算设备上播放的叙述的一部分进行修改的示例性流程500。在块502中,内容定制服务可选择哪个计算设备对叙述的一部分处理任何需要的修改。如上论述,在一些实施方案中,用户计算设备将产生所修改的叙述的请求传输到内容定制服务器,如图2所示出。内容定制服务器接着可修改叙述的一部分并且将所修改的叙述传输到用户计算设备。在其它实施方案中,用户计算设备在用户的请求后对叙述进行修改。在其它实施方案中,修改设备的选择不是必要的,例如,在内容定制服务以单个用户计算设备或信息服务站具体化的实施方案中不必要。
在块504中,内容定制服务确定叙述设置信息是否已被导入用于将要播放的叙述的一部分。例如,用户计算设备可导入存储在用户计算设备上或存储在由内容定制服务维持的外部数据存储器中的叙述设置文件。如果已导入叙述设置信息,那么在块506中内容定制服务可根据叙述设置信息设置或指定叙述参数。
如果没有导入设置文件,那么内容定制服务可对叙述的部分检查指定什么叙述参数应该是针对被标记部分的任何标签,如块508中所示出。如果部分被标记,那么在块510中,内容定制服务可设置由标签指定的叙述参数。返回到以上“氦气标签”的实施例,可增加叙述中与氦气标签相关的部分的音高。
如果不存在标签,那么在块512中,内容定制服务可任选地产生默认叙述设置并将其应用于叙述中将要修改的部分。例如,对于叙述的未加标签的部分来说,内容定制服务可基于例如叙述的文本版本的上下文分析(例如由语音到文本程序产生)或与叙述相关联的文本内容项来选择默认叙述参数。在先前以引用方式并入本文中的美国专利申请第13/070,313号中描述用于使叙述和文本内容项关联并同步的方法。例如,叙述中将要修改的部分或与叙述同步的文本内容项中的单词可能指示愉快语气。如“微笑”、“大笑”或“庆祝”的单词可提示内容定制服务将默认“愉快”语气分配给叙述的那个部分。
在一些实施方案中,默认叙述设置是基于由内容定制服务针对特别用户应用的先前叙述设置。例如,内容定制服务可确定,用户已使用针对许多不同部分的特别叙述设置。例如,用户可能先前已指示,他或她优选以慢语速口述并且具有南方口音的叙述。他或她可能已将这些叙述设置应用于他或她先前收听的许多不同叙述。因此,内容定制服务可确定,慢语速和南方口音设置应该是针对那个用户的默认叙述设置。因此,内容定制服务可应用这些默认叙述设置来使用户可能收听的随后叙述的一部分以慢语速口述并具有南方口音。
在块514中,用户接着可得到指定用于叙述参数的进一步设置的机会。例如,内容定制服务可使用户的计算设备显示用于指定叙述参数的一个或多个用户接口。这些其它修改可用来产生将要用于叙述的最后一组叙述参数。
在块516中,可播放所修改的叙述。本领域技术人员将理解,如其它块中描述的对叙述参数的改变可与播放叙述基本上同时进行,例如,动态地修改叙述同时用户输入改变。然而,在其它实施方案中,不播放叙述的所修改的部分直到已设置叙述参数之后为止。
图6描绘示例性用户接口600,通过所述用户接口,用户可请求或输入对叙述的改变。这个用户接口600(和其它用户接口)可作为软件程序的一部分或作为由内容定制服务器主存的内容页(如“网页”)的一部分显示在用户计算设备上。取决于显示用户接口600的计算设备,用户可以许多方式与用户接口600交互。在一个实施方案中,用户使用如鼠标或轨迹球的输入设备来与用户接口600的元件交互。在其它实施方案中,用户接口600显示在具有触摸屏的用户计算设备上,以便用户可通过在显示元件的位置处触摸触摸屏来与用户接口600的元件交互。接收用户输入的其它结构和方法处于本公开的精神内。
用户接口600可包括用于显示关于内容项和叙述的信息的一个或多个元件。例如,用户接口600可包括标题指示器602,以便显示内容项的标题。用户接口600也可包括时间指示器604,所述时间指示器可包括正在播放叙述的哪一部分的指示(例如,章节)和与正播放的叙述相关联的时间戳。如果在使用用户接口600时播放叙述,那么时间指示器604中的时间戳可递增。可根据需要并入其它指示器。例如,可显示对应于内容项的作者、内容项的类型、内容项的公布日期等等的指示器。
如上论述,在一些实施方案中,在播放叙述时改变叙述的参数。然而,用户可能希望在暂停叙述时改变叙述参数,并且在将叙述参数设置成他或她的喜好之后接着继续叙述。因此,用户接口600可具有开始或重新开始叙述的播放按钮606和暂停叙述的暂停按钮608。这些按钮被突出、倒置或另外标记来指示它们的状态。例如,暂停按钮608可在暂停叙述时突出,并且播放按钮606可在播放叙述时突出。用户接口600可具有用于控制叙述的回放的其它按钮,如快进、倒带和跳过按钮。
用户接口600可包括用于控制叙述的定量参数的元件。一般来说,叙述的定量参数包括叙述中可测量或量化的方面。例如,音高可由叙述中叙述者语音的平均频率(以赫兹计)测量;低音和高音可由叙述者语音的低频谱和高频谱部分的振幅测量;语速可由叙述者在给定时帧内口述多少音节来测量;并且对比可由叙述的安静部分与叙述的吵闹部分之间的强度差异(例如以分贝计)测量。因此,可提供用于调整(例如,增加或减小)这些定量叙述参数的滑动条:调整音高的滑动条610A、调整低音的滑动条610B、调整高音的滑动条610C、调整语速的滑动条610D和调整对比的滑动条610E。本领域技术人员将认识到,用于输入定量值的任何用户接口将适用于调整这些和其它定量叙述参数。例如,软件旋钮、转盘、文本输入区域、数字输入区域等等可用来指定各种定量叙述参数的等级。
用户接口600也可包括用于控制叙述的定性参数的元件。一般来说,叙述的定性参数包括叙述中不必测量或量化而是与叙述的主观质量或叙述的特定类型相关的方面。定性叙述参数可包括例如叙述的语言、口述所述叙述的叙述者的声音、叙述者的口音和叙述者的语气。在图6中示出的用户接口600中,可通过与下拉菜单交互来指定定性叙述参数。
语言菜单612A允许用户选择他或她优选哪种语言用于叙述。例如,用户可使用语言菜单612A来在英语、法语、西班牙语或另一种语言之间选择。语言菜单612A可包括相同语言的一种或多种方言作为不同的语言选择。例如,语言菜单612A可提供美国口语(美式英语)与英国口语之间或西班牙的西班牙语与拉丁美洲的西班牙语之间的选择。在一些实施方案中,从语言菜单612A选择语言也确定呈现其它用户接口元件的语言。例如,如果用户从语言菜单612A选择法语,那么标题指示器602可以法语而不是英语呈现。标题指示器602可从显示亚历山大大仲马小说的英语标题“The Count of Monte Cristo”改变成显示它的法语标题“Le Comte de Monte Cristo”。
在一个实施方案中,选择语言提示内容定制服务使用户计算设备以所选择的语言播放预产生的音频叙述。例如,可以英语和法语预记录有声读物。如果用户从语言菜单612A选择法语,那么可播放以法语预记录的有声读物。在另一个实施方案中,选择语言提示内容定制服务产生叙述的机器翻译。例如,使用语音到文本程序,内容定制服务可以英语产生音频叙述的预记录版本的文本副本。或者,内容定制服务可依赖于音频叙述的预产生的英语文本副本,如叙述脚本。内容定制也可使用电子书的文本作为文本源。在任一情况下,如果用户从语言菜单612A选择法语,那么内容定制服务可使用本领域已知的机器翻译算法来将英语文本副本翻译成法语文本副本。内容定制服务接着可经由使用文本到语音转换器来从法语文本副本产生新音频叙述或音频叙述的新部分。
除了语言菜单612A之外,用户接口600也可包括口音菜单612B。口音菜单612B可允许用户在用于叙述的一种或多种口音之间选择。口音可与通常讲述所选择的语言的特别区域相关,如利用来自美国南方的口音讲述的美式英语。口音也可与通常不讲述所选择的语言的区域相关,如利用法语口音讲述的美式英语。口音也可与讲述所选择的语言的特别人物或亚文化群有关,如海盗口音或冲浪者口音,仅举两个实施例。
在一些实施方案中,内容定制服务使用语音波形分析和过滤器来将口音应用于音频叙述。例如,用户可从口音菜单612B选择波士顿口音。在波士顿口音中,经常用音素“ah”替换音素“ar”,以使得单词“car”和“yard”可发音成“cah”和“yahd”。因此,内容定制服务可通过使用本领域已知的声音分析技术确定叙述中何处讲音素“ar”。已识别叙述波形中讲述音素“ar”部分的内容定制服务可在叙述者声音中拼接出“ar”波形并且拼接入“ah”音频剪辑,在一些实施方案中,其可从收藏有叙述者声音库的数据存储器获得。在其它实施方案中,可应用音频过滤器来将“ar”波形转换成“ah”波形。
在其它实施方案中,内容定制服务基于叙述的文本分析来替代音素,以便应用口音。例如,使用语音到文本程序,内容定制服务可产生音频叙述的文本副本。或者,内容定制服务可依赖于音频叙述的预产生的文本副本,如叙述脚本。在任一情况下,这种文本副本可例如包括语音副本。返回至波士顿口音的以上实施例,内容定制服务接着可搜索用于音素“ar”的语音叙述副本并且用音素“ah”替换它。内容定制服务接着可利用文本到语音转换器从语音副本产生新叙述或叙述的新的部分。内容定制服务或者可使语音副本与原始音频叙述同步,并且当叙述播放时,内容定制服务可在“ah”音素出现在语音副本中时动态地拼接出原始叙述中讲述的“ar”音素。
用来创建带口音叙述的规则可存储在数据存储器中并且在针对定制的用户请求后通过内容定制服务访问。这些规则可应用于叙述的文本版本(如副本或电子书)或可基于叙述的波形分析和处理来应用。这些规则可包括上述查找和替换音素规则;反映区域惯用语的查找和替换单词或短语(例如,将原始叙述中的“you guys”转换成南方口音中的用于叙述的“y’all”);用于强调个别音素和/或基于口音改变单词发音的规则(例如,对于单词“pecan”,南方口音中将它发音成“PEE-can”和在其它区域口音中发音成“puh-KAWN”)或其它规则。
在一些实施方案中,从语言菜单612A选择语言影响哪些口音在口音菜单612B中可用。例如,如果在语言菜单612A中选择美式英语,那么仅与美式英语相关的口音可出现在口音菜单612B中。此类口音可能包括例如南方口音、波士顿口音、中西部口音和与美国相关联的其它区域口音。
用户接口600也可包括语音菜单612C。语音菜单612C可允许用户选择讲述叙述的语音。语音菜单612C中的每个条目可包括语音的说话者的名称以及说话者性别的指示。例如,命名为Sam讲述者的男性在语音菜单612C的一个条目中可列举为“Sam讲述者(M)”,而命名为Nora叙述者的女性在语音菜单612C的另一个条目中可列举为“Nora叙述者(F)”。
本领域技术人员将认识到,存在为音频内容的消费者提供选择用于那个内容的声音的机会的许多可用方法。例如,假定有声读物的原始音频叙述由Sam讲述者口述。相反,用户优选Nora叙述者的音频叙述。因此,在一个实施方案中,从语音菜单612C选择Nora叙述者提示播放由Nora叙述者口述的有声读物的记录版本,而不是Sam讲述者的版本。在另一个实施方案中,选择Nora叙述者的声音提示内容定制服务分析和/或产生与有声读物相关联的文本内容项。内容项可存储在数据存储器中并且可包括例如有声读物的电子书版本、与有声读物的Sam讲述者版本相关联的脚本或由语音到文本例程产生的有声读物的Sam讲述者版本的副本。内容定制服务可识别叙述在有声读物中的当前位置并且确定叙述者在与有声读物相关联的文本内容项中的位置。在先前以引用方式并入本文的美国专利申请第13/070,313号中公开用于将音频内容与文本内容对齐的方法。内容定制服务接着可使用存储在数据存储器和文本到语音合成器中的Nora叙述者声音的剪辑产生以Nora叙述者声音的有声读物的一部分或所有的新叙述。用户接着可使用用户接口600的其它元件修改合成的叙述。
用户接口600也可具备语气菜单612D。语气大体可包括与内容项相关联的主观情绪。例如,语气可包括愉快语气、紧张语气、愤怒语气、悲伤语气、困倦语气、疯狂语气等等。在一些实施方案中,从语气菜单612D选择语气影响针对一个或多个定量叙述参数的设置,如可由移动滑动条610A-610E设置的那些参数。例如,如果从语气菜单612D选择紧张语气,那么可移动音高滑动条610A来以较高音高设置叙述,并且可移动语速滑动条610D来以较快语速设置叙述,以便反映紧张说话者可以较高声音和较快语速讲话。在其它实施方案中,从语气菜单612D选择语气可提示内容定制服务将一个或多个波形过滤器或效果应用于音频叙述。例如,如果从语气菜单612D选择紧张语气,那么内容定制服务可调制音频叙述以添加颤音效果(类似于由电吉他上的“打击条”产生的颤音效果),以便使它听起来类似于叙述者的声音在颤抖。在其它实施方案中,从语气菜单612D选择语气可提示内容定制服务将与语气相关联的声音效果插入叙述中。例如,快乐叹息的声音可以愉快语气添加到叙述;跺脚的声音可以愤怒语气添加到叙述;或哭喊的声音可以悲伤语气添加到叙述。
用户接口600同样可包括一个或多个按钮。可提供默认按钮614。在一个实施方案中,与默认按钮614的用户交互提示内容定制服务将一个或多个定量叙述参数设置成中间值。例如,可设置音高滑动条610A,以便所述音高滑动条处于零值处,而不是处于产生较高音高的正值或产生较低音高的负值处。在另一个实施方案中,与默认按钮614的用户交互提示内容定制服务器将一个或多个定性叙述参数设置成中立值或预置值。例如,叙述的默认语言和声音可以是叙述的原始说话者记录音频叙述的语言。可设置口音和语气设置以便通过默认,没有语气或口音过滤器应用于叙述。在其它实施方案中,用户可指定将要用作默认的叙述参数的一个或多个设置。当用户与默认按钮614交互时,可根据用户指定的默认设置来设置叙述参数。
用户接口600也可包括还原按钮616。当用户与还原按钮616交互时,可还原用户指定的先前设置。例如,用户可主要对用于叙述参数的第一组设置满意。然而,用户可改变一些叙述参数以进一步定制叙述。如果用户对进一步定制不满意,那么他或她可与还原按钮616交互以返回到用于叙述参数的第一组设置。
用户接口600也可包括应用按钮618。在一些实施方案中,用户可在播放叙述时指定用于各种叙述参数的设置。在一个实施方案中,如果用户改变用于叙述参数的设置,那么所述改变在播放叙述时立即被应用。在另一个实施方案中,不应用所述改变直到用户与应用按钮618交互。
如上论述,内容处理服务可允许用户通过电子网络传输或访问叙述设置信息。因此,用户接口600可具备导入按钮620和导出按钮622。通过与导入按钮620交互,用户可例如从与内容定制服务相关联的内容定制服务器或数据存储器请求叙述设置信息,如关于图3所示出并描述。响应于所述请求,内容定制服务接着可将叙述设置信息传输到用户计算设备。用户也可与导入按钮620交互以访问存储在他或她的用户计算设备上的数据存储器上的叙述设置信息。
通过与导出按钮622交互,用户可保存他或她的用于叙述参数的设置,并且接着任选地将所述设置存储在他或她的用户计算设备上或将所述设置通过电子网络传输。例如,用户可将他或她的设置传输到与内容定制服务相关联的内容定制服务器或数据存储器,如关于图3A中所示出并描述。用户也可将他或她的叙述设置信息直接传输到另一个用户计算设备。
图7描绘示例性用户接口700,所述用户接口可用来设置用于叙述的不同部分的叙述参数。用户接口700可包括标题指示器702以及用户如何与用户接口交互的指令。在所示出的用户接口700中,例如,用户可通过轻敲与一些元件交互并且通过拖动与其它元件交互。用户可选择叙述中将要修改的一部分,并且接着将设置拖动到对应于那个章节的狭槽。
在这个示例性用户接口700中,通过章节分解与内容项相关联的叙述。因此,对于含有四个章节的叙述来说,可存在四个狭槽,如此处示出狭槽704A-704D。例如,用户可选择先前产生的设置706A-706C,并且接着将所选择的设置拖动到所需的章节狭槽。例如,此处,用户选择设置A来填充狭槽704A。用户也具有通过与新设置按钮708交互来产生新设置的选项。通过选择新设置按钮708,可将用户带至用户接口(如用户接口600)以设置用于叙述的一部分的叙述参数。所产生的设置接着可出现在先前产生的设置706A-706C的后面并且被拖动到狭槽704A-704D。
在一些实施方案中,为狭槽选择默认或标签设置。如上关于图5论述,叙述的一部分可被标记以指示用于那个部分的合乎需要的叙述设置。在这个实施例中,叙述的章节2可由内容定制服务以“愉快”标签标记。如上也关于图5论述,默认设置可基于叙述的上下文分析或与叙述相关联的文本内容项。例如,可基于叙述或文本内容项中单词“大笑”、“微笑”或“庆祝”的存在来选择“愉快”语气作为默认。在一些实施方案中,用户可通过按压推荐按钮710来将默认和/或被标记设置应用于叙述的所有部分。
如果已为狭槽选择设置,那么用户可与所分配的设置交互以进行其它修改。例如,在用户接口700中,可由用户将设置B分配给狭槽704C。用户接着可与被填充的狭槽704C交互(可能通过点击所述狭槽或轻敲所述狭槽)以对用于那个狭槽的设置B进行其它修改,从而产生设置B’。例如,通过与被填充狭槽704C交互,用户可被带至图6中所示出的示例性用户接口600并且被提示以设置一个或多个叙述参数。用户也可与默认设置交互并且修改所述默认设置,如狭槽704B中所示出的默认设置。可锁定叙述的一些部分以使得叙述的那个部分的叙述参数不可被改变。例如,权利持有者可将“被锁定”标签放置在叙述的一部分上,以使得叙述的那个部分的叙述参数不可被用户改变。如狭槽704D中所示出,可不允许用户对章节4做出改变,所述章节4上可被放置被锁定标签。另外,被锁定标签的存在可妨碍用户将先前产生的设置应用于叙述的那个部分。如上论述,可提供内容定制服务以提供用于内容项的完全锁定、部分锁定或完全未锁定叙述。
虽然叙述在用户接口700中被分解成对应于章节的部分,但是本领域技术人员将理解,可选择对应于其它测量的其它叙述部分。例如,叙述可被分解成对应于时间增量的部分,如一个或多个秒、分钟或小时。叙述也可由叙述的说话者分解。因此,如果需要,那么用户可以人物对人物(character-by-character)为基础指定将要应用的叙述参数。例如,叙述的第一部分可对应于男性人物对话,并且叙述的第二部分可对应于女性人物对话。用户可能想要Sam讲述者的声音用于叙述的第一部分并且Nora叙述者的声音用于叙述的第二部分,并且可为每个部分相应地设置叙述参数。
用户接口700可包括导入按钮712和导出按钮714。如上论述,指定用于叙述的一个或多个部分的叙述参数的叙述设置信息可存储在与内容定制服务相关联的内容定制服务器上或存储在用户计算设备上。通过与导入按钮712交互,用户可从与内容定制服务相关联的内容定制服务器请求叙述设置信息,如关于图4所示出并描述。内容定制服务器接着可将叙述设置信息传输到用户计算设备。用户也可与导入按钮712交互以访问存储在他或她的用户计算设备上的数据存储器上的叙述设置信息。
在一些实施方案中,叙述设置信息包括用于特定内容项的许多不同部分的设置。因此,用户与导入按钮712的交互可提示用户选择叙述设置信息,所述叙述设置信息的设置可被传播于一个或多个狭槽704A-704D中。在其它实施方案中,叙述设置信息可与许多内容项一起使用。用户与导入按钮712的交互可提示用户选择将要导入的叙述设置信息。在用户选择叙述设置信息之后,用户接口700可显示例如“设置D”,所述设置D可出现在先前产生的设置706A-706C后面。用户接着可将设置D拖动到狭槽704A-704D。
导出按钮714可用来通过电子网络传输指定用于叙述的一个或多个部分的叙述参数的叙述设置信息。例如,可将存储在用户计算设备上的叙述设置文件传输到与内容定制服务相关联的内容定制服务器或传输到第二用户计算设备。
用户可希望保存他或她的用于叙述的每个部分的叙述参数的定制设置。因此,用户可与保存和继续按钮716交互以保存定制设置并且播放音频叙述。用户也可与稍后保存按钮718交互以保存定制设置而不播放音频叙述。用户也可希望从狭槽704A-704D清除所有设置并且可与全部清除按钮720交互以完成这样的清除。
除了图6和图7中所示出的用于产生叙述设置的用户接口之外,可提供包括一个或多个视觉指示器或文本指示器的用户接口,所述指示器可补充或预示叙述。图8描绘包括视觉指示器802的示例性用户接口800。在一些实施方案中,视觉指示器802是与叙述相关的图像。例如,对于与闹鬼地窖相关的叙述来说,可显示包括鬼线的视觉指示器802。视觉指示器的其它实施例可包括一种或多种颜色的光。例如,对于与火山爆发相关的叙述来说,红色光或橙色光可显示在用户接口800或用户计算设备上,以便补充熔岩流的图像。对于与闪电风暴相关的叙述来说,白色光可闪过以补充闪电的图像。
内容定制服务可基于正播放的叙述的特别部分的标签、基于图像的用户选择或基于正播放的叙述的上下文分析来确定视觉指示器显示什么。对于基于上下文分析选择视觉指示器的实施例来说,内容定制服务可使叙述与叙述所附属的内容项的文本版本同步并且接着查找文本叙述中的图像单词。当叙述播放时,内容定制服务跟随文本。当内容定制服务命中文本中的图像单词时并且当叙述者讲述图像单词时,可显示对应于图像单词的视觉指示器802。因此,当叙述者说单词“鬼线”时,可显示鬼线视觉指示器802。可在先前以引用方式并入本文的美国专利申请第13/070,313号中发现关于使音频与文本内容同步的更多信息。
用户接口800可任选地包括文本显示器804。以这种方式,用户可在收听叙述的音频版本时阅读叙述的文本版本。如上所述,在显示器804中显示的文本部分可同步至音频叙述。在一些实施方案中,可显示在文本被叙述时跟随文本的指示器。例如,文本部分可在文本显示器804中逐渐加下划线标注,以便在所述文本部分在叙述中讲述时每个单词均被加下划线标注。在其它实施方案中,文本部分在文本显示器804中逐渐加粗,以便在所述文本部分在叙述的部分中讲述时每个单词均被加粗。帮助用户将叙述与文本对齐的其它方式是可能的,如在所述文本在叙述中讲述时跳过每个单词的“跳动的小球”。在一些实施方案中,用户选择文本显示器804是被允许还是被禁止(例如,文本显示器804是出现在用户接口800中还是不出现在用户接口800中)。
用户接口800也可包括音频设置按钮806和视觉设置按钮808。通过与这些按钮交互,用户被带至用户接口以用于指定叙述设置或视觉指示器设置。例如,通过音频设置按钮806交互,用户可被带至图6中所示出的用户接口600或图7中所示出的用户接口700。通过与视觉设置按钮808交互,用户可被引导至允许他或她选择用于视觉指示器802的图像或照明以及选择文本显示器804是被允许还是被禁止的用户接口。
本领域技术人员将认识到,关于图6、图7和图8所示出并描述的用户接口也可显示在权利持有者计算设备上,以便权利持有者可创建用于内容项的定制叙述。以这种方式,权利持有者可通过选择权利持有者需要的设置来创建叙述的“权威”版本。权利持有者也可能够通过使用用户接口来选定叙述中将要锁定的一个或多个部分,例如通过与图7中所示出的用户接口700交互将被锁定标签分配到一个或多个章节(如狭槽704D中所示出的章节4)。用户计算设备不能够改变由权利持有者在叙述的被锁定部分中指定或设置的叙述参数。
关于图6、图7和图8中所示出并描述的用户接口可另外并入前端接口,所述前端接口将输入或定制指令引导到内容定制服务。在一个实施方案中,上述用户接口显示在网络上主存的内容页上。当用户经由用户计算设备(或权利持有者在权力持有者计算设备上)访问内容页时,可经由这些用户接口制作用于叙述参数的规范或设置。响应于接收用户输入,内容页可经由应用编程接口(API)调用内容定制服务的一个或多个功能。例如,内容定制服务器可经由远程程序调用被引导来执行一个或多个叙述修改。本领域技术人员将认识到,内容页不需要由内容定制服务器主存。
在另一个实施方案中,关于图6、图7和图8中所示出并描述的用户接口被并入安装在用户计算设备或权利持有者计算设备上的客户端软件中。客户端软件可经由这些用户接口接收输入,并且作为响应,引导远程程序调用至内容定制服务器。例如,内容定制服务器可经由远程程序调用被引导来执行一个或多个叙述修改。
上述所有方法和过程可以在由一个或多个通用计算机或处理器执行的软件代码模块中具体化并且经由所述软件代码模块来完全自动化。所述代码模块可存储在任何类型的非暂时性计算机可读媒体或其它计算机存储设备中。所述方法中的一些或所有可以可替代地在专用计算机硬件中具体化。
除非另外特别说明,否则如“能够”、“可以”、“可能”或“也许”等的条件语言在上下文中通常应理解为用于传达:尽管其它实施方案不包括某些特征、元件和/或步骤,但某些实施方案包括某些特征、元件和/或步骤。因此,此类条件语言通常并非意图暗示无论如何所述特征、元件和/或步骤都是一个或多个实施方案必需的,或者并非暗示一个或多个实施方案必须包括用于在借助或不借助用户输入或提示下决定是否包括这些特征、元件和/或步骤或者是否在任何特定实施方案中执行这些特征、元件和/或步骤的逻辑。
除非另外特别说明,否则诸如短语“X、Y以及Z中的至少一个”的连接性语言在上下文中通常应理解为用于传达项目、术语等可以是X、Y和/或Z的任意组合。因此,此类连接性语言通常不意图暗示某些实施方案要求X中的至少一个、Y中的至少一个以及Z中的至少一个以每个存在。
本文所述流程图和/或附图中示出的任何过程说明、元素或方框应理解成潜在地代表包括用于实施过程中的特定逻辑功能或元素的一个或多个可执行指令的代码模块、代码片段或代码部分。替代的实施被包括在本文所述实施方案的范围内,其中如与本领域中的技术人员所理解的那样,元件或功能可以删除、不按照所示出或描述的顺序执行,包括基本上同时执行或者逆序执行,具体取决于所涉及的功能。
应强调,可以对上述实施方案做出许多改变和修改,这些改变和修改的要素应被理解为包含在其它可接受的实施例当中。在本文中,所有此类修改和变化意欲包括于本公开的范围内并且受以下条款和所附权利要求保护。
本公开的各种示例实施方案可以关于以下条款进行描述:
条款1.一种用于定制有声读物叙述的系统,所述系统包括:
被配置以存储有声读物的电子数据存储器,所述有声读物包括叙述;和
与所述电子数据存储器通信的计算设备,所述计算设备被配置以:
显示用户接口,所述用户接口被配置以从用户接收对所述叙述的一个或多个叙述参数的改变;
经由所述用户接口接收用户输入,其中所述用户输入指定对所述一个或多个叙述参数的改变;
响应于经由所述用户接口进行的用户输入而改变所述一个或多个叙述参数;以及
根据所改变的一个或多个叙述参数修改所述叙述。
条款2.如条款1所述的用于定制有声读物叙述的系统,其中对所述一个或多个叙述参数的所述改变包括对所述叙述的高音、低音、音高、语速和对比中至少一个的改变。
条款3.如条款1所述的用于定制有声读物叙述的系统,其中对所述一个或多个叙述参数的所述改变包括对所述叙述的口音、所述叙述的语气和所述叙述的语言中至少一个的改变。
条款4.如条款1所述的用于定制有声读物叙述的系统,其中对所述一个或多个叙述参数的所述改变包括对所述叙述的声音的改变。
条款5.如条款1所述的用于定制有声读物叙述的系统,其中所述计算设备还被配置以将用于所改变的叙述参数的设置作为有声读物叙述设置文件存储到所述电子数据存储器。
条款6.一种用于定制包括叙述的内容项的计算机实施方法,所述计算机实施方法包括:
在用特定计算机可执行指令配置的一个或多个计算设备的控制下,
设置将要应用于所述叙述的一部分的一个或多个叙述参数;
根据所述设置的叙述参数修改所述叙述的一部分,以便形成所述叙述的所修改部分;以及
使所述叙述的所修改部分回放。
条款7.如条款6所述的计算机实施方法,其中至少基于所述叙述的一部分的上下文分析来设置所述叙述参数。
条款8.如条款6所述的计算机实施方法,其中:
所述叙述的一部分被分配标签,所述标签指定用于所述叙述的一部分的一个或多个叙述参数的设置;以及
至少部分基于所述标签设置用于所述叙述的一部分的所述一个或多个叙述参数。
条款9.如条款8所述的计算机实施方法,其中通过人类交互任务系统将所述标签分配至所述叙述的一部分。
条款10.如条款8所述的计算机实施方法,其中通过所述内容项的权利持有者将所述标签分配至所述叙述的一部分。
条款11.如条款10所述的计算机实施方法,其中由所述标签指定的用于所述叙述的一部分的所述一个或多个叙述参数的所述设置被锁定。
条款12.如条款6所述的计算机实施方法,其中至少基于用户输入来设置所述叙述参数。
条款13.如条款6所述的计算机实施方法,其还包括:
根据所述设置的叙述参数修改所述叙述的第二部分,以便形成所述叙述的所修改的第二部分;以及
使所述叙述的所修改的第二部分回放。
条款14.如条款6所述的计算机实施方法,其还包括:
根据所述设置的叙述参数修改第二内容项的第二叙述的一部分,以便形成所述第二叙述的所修改部分;以及
使所述第二叙述的所修改部分回放。
条款15.如条款6所述的计算机实施方法,其还包括导入叙述设置信息,所述叙述设置信息包括用于一个或多个叙述参数的设置;并且其中至少部分基于所述叙述设置信息设置所述一个或多个叙述参数。
条款16.一种用于定制叙述的系统,所述系统包括:
被配置以存储叙述的电子数据存储器;以及
与所述电子数据存储器通信的服务器计算设备,所述服务器计算设备被配置以:
从用户计算设备接收改变所述叙述的第一部分的一个或多个叙述参数的请求;
改变所述叙述的第一部分的所述一个或多个叙述参数,以便形成所述叙述的所修改的第一部分;以及
将所述叙述的所修改的第一部分传输到所述用户计算设备。
条款17.如条款16所述的用于定制叙述的系统,其中所述服务器计算设备还被配置以:
从所述用户计算设备接收改变所述叙述的第二部分的一个或多个叙述参数的请求;
改变所述叙述的第二部分的所述一个或多个叙述参数,以便形成所述叙述的所修改的第二部分;以及
将所述叙述的所修改的第二部分传输到所述用户计算设备。
条款18.如条款17所述的用于定制叙述的系统,其中通过所述服务器计算设备改变所述叙述的第二部分的所述一个或多个叙述参数,同时所述服务器计算设备将所述叙述的所修改的第一部分传输到所述用户计算设备。
条款19.如条款18所述的用于定制叙述的系统,其中所述叙述的第一部分和所述叙述的第二部分是连续的。
条款20.如条款16所述的用于定制叙述的系统,其中所述服务器计算设备还被配置以从被配置存储叙述设置信息的电子数据存储器获得所述叙述设置信息,所述叙述设置信息指定对所述叙述的第一部分的所述一个或多个叙述参数的改变。
条款21.一种用于定制叙述的非暂时性计算机可读媒体,所述非暂时性计算机可读媒体具有计算机可执行部件,所述计算机可执行部件被配置以:
将显示所述叙述的一部分的一个或多个叙述参数的用户接口呈现在用户计算设备上;
经由所述用户接口接收改变所述一个或多个叙述参数的指令;
从通过电子网络连接的多个计算设备选择计算设备,所述多个计算设备包括所述用户计算设备;以及
指导所选择的计算设备根据所述指令改变所述一个或多个叙述参数,以便形成所述叙述的所修改的部分。
条款22.如条款21所述的非暂时性计算机可读媒体,其中:
所选择的计算设备包括服务器计算设备;以及
所述服务器计算设备还被配置以通过电子网络将所述叙述的所修改的部分传输到用户计算设备。
条款23.如条款21所述的非暂时性计算机可读媒体,其中:
所选择的计算设备包括所述用户计算设备;以及
所述用户计算设备还被配置以播放所述叙述的所修改的部分。
条款24.如条款21所述的非暂时性计算机可读媒体,其中至少部分基于所述叙述中将要修改的部分的大小来选择所述计算设备。
条款25.如条款21所述的非暂时性计算机可读媒体,其中至少部分基于将要改变的所述一个或多个叙述参数来选择所述计算设备。
条款26.如条款21所述的非暂时性计算机可读媒体,其中所选择的计算设备具有满足阈值的处理器速度。
条款27.如条款21所述的非暂时性计算机可读媒体,其中所选择的计算设备具有满足阈值的能量储备。
条款28.如条款27所述的非暂时性计算机可读媒体,其中:
所述计算机可执行部件还被配置以估计用于形成叙述的所修改部分的能量消耗值;以及
至少部分基于所估计的能量消耗值来确定所述阈值。
条款29.一种用于共享有声读物定制的系统,所述系统包括:
被配置以存储一个或多个有声读物叙述设置文件的电子数据存储器;以及
与所述电子数据存储器通信的服务器计算设备,所述服务器计算设备被配置以:
从第一用户计算设备接收对有声读物叙述设置文件的请求;
响应于所述请求,访问第一社交图形,所述第一社交图形附属于所述第一用户计算设备的用户并且包括与所述第一用户计算设备的用户相关的多个个体;
识别由所述第一社交图形中的第一个体产生的有声读物叙述设置文件;
从所述电子数据存储器检索所识别的有声读物叙述设置文件;以及
将所识别的有声读物叙述设置文件传输到所述第一用户计算设备。
条款30.如条款29所述的系统,其中所述服务器计算设备还被配置以:
识别所述第一社交图形中的第二个体,其中所述第二个体是第二用户计算设备的用户;
将对请求所识别的有声读物叙述设置文件的推荐传输到所述第二用户计算设备,
从所述第二用户计算设备接收对所识别的有声读物叙述设置文件的请求;
响应于所述请求,从所述电子数据存储器检索所识别的有声读物叙述设置文件;以及
将所识别的有声读物叙述设置文件传输到所述第二用户计算设备。
条款31.如条款29所述的系统,其中所述服务器计算设备还被配置以:
访问第二社交图形,所述第二社交图形附属于所述第二计算设备的用户并且包括与所述第二计算设备的用户相关的多个个体;
如果所述第一社交图形中的所述第一个体也处于所述第二社交图形中,
那么将对请求所识别的有声读物叙述设置文件的推荐传输到所述第二用户计算设备,
从所述第二用户计算设备接收对所识别的有声读物叙述设置文件的请求;
响应于所述请求,从所述电子数据存储器检索所识别的有声读物叙述设置文件;以及
将所识别的有声读物叙述设置文件传输到所述第二用户计算设备。
条款32.如条款29所述的系统,其中所述服务器计算设备还被配置以:
访问第三社交图形,所述第三社交图形附属于所述第一个体并且包括与所述第一个体相关的多个个体;
如果第二计算设备的用户处于所述第一社交图形和所述第三社交图形中,
那么将对请求所识别的有声读物叙述设置文件的推荐传输到所述第二用户计算设备,
从所述第二用户计算设备接收对所识别的有声读物叙述设置文件的请求;
响应于所述请求,从所述电子数据存储器检索所识别的有声读物叙述设置文件;以及
将所识别的有声读物叙述设置文件传输到所述第二用户计算设备。
条款33.一种用于分布叙述定制的计算机实施方法,所述计算机实施方法包括:
在用特定计算机可执行指令配置的一个或多个计算设备的控制下:
获得多个叙述设置文件;
将目录信息分配到所述多个叙述设置文件中的每一个,所述目录信息识别所述叙述设置文件的创建者;
将所述多个叙述设置文件存储到电子数据存储器;
响应于由用户计算设备产生的对叙述设置文件的请求,至少部分基于所述目录信息选择叙述设置文件;以及
将所选择的叙述设置文件通过电子网络提供到所述用户计算设备。
条款34.如条款33所述的计算机实施方法,其还包括:
访问与所述用户计算设备的用户相关联的社交图形,所述社交图形包括多个个体;以及
识别创建者是所述用户的社交图形中的个体的叙述设置文件;
其中所选择的叙述设置文件是所识别的叙述设置文件。
条款35.如条款33所述的计算机实施方法,其还包括将关于第二叙述设置文件的通知发送到所述用户计算设备。
条款36.如条款35所述的计算机实施方法,其中所选择的叙述设置文件和所述第二叙述设置文件具有相同创建者。
条款37.如条款35所述的计算机实施方法,其中所述目录信息另外识别与每个叙述设置文件相关联的内容项。
条款38.如条款37所述的计算机实施方法,其还包括:
所选择的叙述设置文件与第一内容项的叙述相关联;以及
所述第二叙述设置文件与第二内容项的叙述相关联。
条款39.如条款38所述的计算机实施方法,其中所述第一内容项和所述第二内容项共享共同作者、共同系列和共同类型中的至少一个。
条款40.如条款37所述的计算机实施方法,其中所述第二叙述设置文件的创建者是与所述叙述设置文件相关联的所述内容项的叙述者和与所述叙述设置文件相关联的所述内容项的作者中的至少一个。
条款41.如条款33所述的计算机实施方法,其中所选择的叙述设置文件包括用于将要由所述用户计算设备显示的一个或多个视觉指示器的设置。
条款42.一种用于定制包括原始叙述的内容项的系统,所述系统包括:
被配置以存储所述内容项的电子数据存储器;以及
与所述电子数据存储器通信的计算设备,所述计算设备被配置以:
从所述电子数据存储器访问所述原始叙述;
获得指定一个或多个叙述参数的叙述设置信息;以及
根据所述叙述设置信息修改所述原始叙述的一个或多个叙述参数,以便形成所修改的叙述。
条款43.如条款42所述的用于定制内容项的系统,其中所述计算设备还被配置以将所修改的叙述传输到第二计算设备。
条款44.如条款43所述的用于定制内容项的系统,其中从所述第二计算设备获得所述叙述设置信息。
条款45.如条款42所述的用于定制内容项的系统,其中从所述内容项的权利持有者获得所述叙述设置信息。
条款46.如条款45所述的用于定制内容项的系统,其中所述计算设备还被配置以锁定所修改叙述的至少一部分的一个或多个叙述参数。
条款47.如条款46所述的用于定制内容项的系统,其中所述计算设备还被配置以锁定所述整个修改的叙述的所有叙述参数。
条款48.如条款42所述的用于定制内容项的系统,其中所述计算设备还被配置以锁定所述原始叙述的至少一部分的一个或多个叙述参数。
条款49.一种用于定制内容的非暂时性计算机可读媒体,所述非暂时性计算机可读媒体具有计算机可执行部件,所述计算机可执行部件被配置以:
从用户计算设备接收定制原始叙述的请求;
响应于所述请求,从被配置以存储多个叙述设置文件的电子数据存储器选择叙述设置文件;
接收对所述一个或多个叙述参数的一个或多个其它修改,其中经由显示在所述用户计算设备上的用户接口指定所述一个或多个其它修改;
形成包括所述原始叙述设置文件和对所述一个或多个叙述参数的所述一个或多个其它修改的所修改的叙述设置文件;
根据所修改的叙述设置文件修改一个或多个叙述参数,以便形成所述内容项的所修改的叙述;以及
将所修改的叙述设置文件存储到所述电子数据存储器。
条款50.如条款49所述的非暂时性计算机可读媒体,其中至少部分基于来自人类交互任务系统的输入从所述电子数据存储器选择所述叙述设置文件。
条款51.如条款49所述的非暂时性计算机可读媒体,其中至少部分基于所述叙述设置文件的等级从所述电子数据存储器选择所述叙述设置文件。
条款52.如条款49所述的非暂时性计算机可读媒体,其中至少部分基于通过所述用户计算设备进行的用户输入从所述电子数据存储器选择所述叙述设置文件。
条款53.如条款49所述的非暂时性计算机可读媒体,其中所述计算机可执行部件还被配置以通过电子网络将所修改的叙述设置文件传输到服务器计算设备。

Claims (15)

1.一种用于定制包括叙述的内容项的计算机实施方法,所述计算机实施方法包括:
在用特定计算机可执行指令配置的一个或多个计算设备的控制下,
设置将要应用于所述叙述的一部分的一个或多个叙述参数;
根据所述设置的叙述参数修改所述叙述的所述部分,以便形成所述叙述的所修改部分;以及
使所述叙述的所述修改部分回放。
2.如权利要求1所述的计算机实施方法,其中至少部分基于所述叙述的所述部分的上下文分析设置所述叙述参数。
3.如权利要求1所述的计算机实施方法,其中:
所述叙述的所述部分被分配标签,所述标签指定用于所述叙述的所述部分的一个或多个叙述参数的设置;以及
至少部分基于所述标签设置用于所述叙述的所述部分的所述一个或多个叙述参数。
4.如权利要求1所述的计算机实施方法,其还包括:
根据所述设置的叙述参数修改所述叙述的第二部分,以便形成所述叙述的所修改的第二部分;以及
使所述叙述的所述修改的第二部分回放。
5.如权利要求1所述的计算机实施方法,其还包括:
根据所述设置的叙述参数修改第二内容项的第二叙述的一部分,以便形成所述第二叙述的所修改部分;以及
使所述第二叙述的所述修改部分回放。
6.一种用于定制叙述的系统,所述系统包括:
电子数据存储器,其被配置以存储叙述;以及
服务器计算设备,其与所述电子数据存储器通信,所述服务器计算设备被配置以:
从用户计算设备接收改变所述叙述的第一部分的一个或多个叙述参数的请求;
改变所述叙述的所述第一部分的所述一个或多个叙述参数,以便形成所述叙述的所修改的第一部分;以及
将所述叙述的所述修改的第一部分传输到所述用户计算设备。
7.如权利要求6所述的用于定制叙述的系统,其中所述服务器计算设备还被配置以:
从所述用户计算设备接收改变所述叙述的第二部分的一个或多个叙述参数的请求;
改变所述叙述的所述第二部分的所述一个或多个叙述参数,以便形成所述叙述的所修改的第二部分;以及
将所述叙述的所述修改的第二部分传输到所述用户计算设备。
8.如权利要求7所述的用于定制叙述的系统,其中通过所述服务器计算设备改变所述叙述的所述第二部分的所述一个或多个叙述参数,同时所述服务器计算设备将所述叙述的所述修改的第一部分传输到所述用户计算设备。
9.如权利要求6所述的用于定制叙述的系统,其中所述服务器计算设备还被配置以从被配置存储叙述设置信息的电子数据存储器获得所述叙述设置信息,所述叙述设置信息指定对所述叙述的所述第一部分的所述一个或多个叙述参数的改变。
10.一种用于定制包括原始叙述的内容项的系统,所述系统包括:
电子数据存储器,其被配置以存储叙述设置文件;以及
计算设备,其与所述电子数据存储器通信,所述计算设备被配置以:
获得多个叙述设置文件;
将目录信息分配到所述多个叙述设置文件中的每一个,所述目录信息识别所述叙述设置文件的创建者;
将所述多个叙述设置文件存储到所述电子数据存储器;
响应于来自用户计算设备的对叙述设置文件的请求,至少部分基于所述目录信息选择叙述设置文件;以及
将所述选择的叙述设置文件通过电子网络提供到所述用户计算设备。
11.如权利要求10所述的系统,其中所述计算设备还被配置以:
访问与所述用户计算设备的用户相关联的社交图形,所述社交图形包括多个个体;以及
识别创建者是所述用户的社交图形中的个体的叙述设置文件;
其中所述选择的叙述设置文件是所述识别的叙述设置文件。
12.如权利要求10所述的系统,其中所述计算设备还被配置以将关于第二叙述设置文件的通知发送到所述用户计算设备。
13.如权利要求12所述的系统,其中所述选择的叙述设置文件和所述第二叙述设置文件具有相同创建者。
14.如权利要求12所述的系统,其中所述目录信息另外识别与每个叙述设置文件相关联的内容项。
15.如权利要求14所述的系统,其中:
所述选择的叙述设置文件与第一内容项的叙述相关联;以及
所述第二叙述设置文件与第二内容项的叙述相关联。
CN201380035935.7A 2012-05-07 2013-05-06 内容定制化 Pending CN104471512A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US13/465,871 US9075760B2 (en) 2012-05-07 2012-05-07 Narration settings distribution for content customization
US13/465,853 2012-05-07
US13/465,853 US20140258858A1 (en) 2012-05-07 2012-05-07 Content customization
US13/465,871 2012-05-07
PCT/US2013/039757 WO2013169670A2 (en) 2012-05-07 2013-05-06 Content customization

Publications (1)

Publication Number Publication Date
CN104471512A true CN104471512A (zh) 2015-03-25

Family

ID=49551427

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380035935.7A Pending CN104471512A (zh) 2012-05-07 2013-05-06 内容定制化

Country Status (5)

Country Link
EP (1) EP2847652A4 (zh)
JP (1) JP2015517684A (zh)
CN (1) CN104471512A (zh)
AU (1) AU2013259799A1 (zh)
WO (1) WO2013169670A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107155154A (zh) * 2017-05-27 2017-09-12 成都小鸟冲冲冲科技有限公司 一种具有听力保护功能的音效定制方法及系统
CN108320741A (zh) * 2018-01-15 2018-07-24 珠海格力电器股份有限公司 智能设备的声音控制方法、装置、存储介质和处理器
CN110134305A (zh) * 2019-04-02 2019-08-16 北京搜狗科技发展有限公司 一种语速调节方法、装置和用于语速调节的装置
CN112541147A (zh) * 2019-09-23 2021-03-23 北京轻享科技有限公司 一种内容发布管理方法及系统

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9706247B2 (en) 2011-03-23 2017-07-11 Audible, Inc. Synchronized digital content samples
US8948892B2 (en) 2011-03-23 2015-02-03 Audible, Inc. Managing playback of synchronized content
US8855797B2 (en) 2011-03-23 2014-10-07 Audible, Inc. Managing playback of synchronized content
US9734153B2 (en) 2011-03-23 2017-08-15 Audible, Inc. Managing related digital content
US8862255B2 (en) 2011-03-23 2014-10-14 Audible, Inc. Managing playback of synchronized content
US9703781B2 (en) 2011-03-23 2017-07-11 Audible, Inc. Managing related digital content
US9760920B2 (en) 2011-03-23 2017-09-12 Audible, Inc. Synchronizing digital content
US9075760B2 (en) 2012-05-07 2015-07-07 Audible, Inc. Narration settings distribution for content customization
US9317500B2 (en) 2012-05-30 2016-04-19 Audible, Inc. Synchronizing translated digital content
US8972265B1 (en) 2012-06-18 2015-03-03 Audible, Inc. Multiple voices in audio content
US9141257B1 (en) 2012-06-18 2015-09-22 Audible, Inc. Selecting and conveying supplemental content
US9536439B1 (en) 2012-06-27 2017-01-03 Audible, Inc. Conveying questions with content
US9679608B2 (en) 2012-06-28 2017-06-13 Audible, Inc. Pacing content
US10109278B2 (en) 2012-08-02 2018-10-23 Audible, Inc. Aligning body matter across content formats
US9367196B1 (en) 2012-09-26 2016-06-14 Audible, Inc. Conveying branched content
US9632647B1 (en) 2012-10-09 2017-04-25 Audible, Inc. Selecting presentation positions in dynamic content
US9223830B1 (en) 2012-10-26 2015-12-29 Audible, Inc. Content presentation analysis
US9280906B2 (en) 2013-02-04 2016-03-08 Audible. Inc. Prompting a user for input during a synchronous presentation of audio content and textual content
US9472113B1 (en) 2013-02-05 2016-10-18 Audible, Inc. Synchronizing playback of digital content with physical content
US9317486B1 (en) 2013-06-07 2016-04-19 Audible, Inc. Synchronizing playback of digital content with captured physical content
US9489360B2 (en) 2013-09-05 2016-11-08 Audible, Inc. Identifying extra material in companion content
JP2017004122A (ja) * 2015-06-05 2017-01-05 キヤノン株式会社 情報処理装置、情報処理方法およびコンピュータプログラム
JP7273866B2 (ja) * 2021-01-04 2023-05-15 ヤフー株式会社 配信装置、配信方法及び配信プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110066438A1 (en) * 2009-09-15 2011-03-17 Apple Inc. Contextual voiceover
US20110067099A1 (en) * 2009-09-14 2011-03-17 Barton James M Multifunction Multimedia Device
US20110173214A1 (en) * 2010-01-14 2011-07-14 Mobdub, Llc Crowdsourced multi-media data relationships
TW201214413A (en) * 2010-07-16 2012-04-01 Ibm Modification of speech quality in conversations over voice channels

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11231885A (ja) * 1998-02-19 1999-08-27 Fujitsu Ten Ltd 音声合成装置
JP2002023781A (ja) * 2000-07-12 2002-01-25 Sanyo Electric Co Ltd 音声合成装置、音声合成装置におけるフレーズ単位修正方法、音声合成装置における韻律パターン編集方法、音声合成装置における音設定方法および音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3372532B2 (ja) * 2000-10-11 2003-02-04 日本電信電話株式会社 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体
US8108509B2 (en) * 2001-04-30 2012-01-31 Sony Computer Entertainment America Llc Altering network transmitted content data based upon user specified characteristics
JP2004077738A (ja) * 2002-08-16 2004-03-11 Oki Electric Ind Co Ltd コンテンツ音声化提供システム
US8856030B2 (en) * 2003-04-07 2014-10-07 Sevenecho, Llc Method, system and software for associating attributes within digital media presentations
JP2004325692A (ja) * 2003-04-23 2004-11-18 Sharp Corp テキスト音声合成装置、テキスト処理装置、テキスト処理プログラムおよびこのプログラムの記録媒体
JP2005283788A (ja) * 2004-03-29 2005-10-13 Yamaha Corp 表示制御装置およびプログラム
JP2005345699A (ja) * 2004-06-02 2005-12-15 Toshiba Corp 音声編集装置、音声編集方法および音声編集プログラム
US20080201141A1 (en) * 2007-02-15 2008-08-21 Igor Abramov Speech filters
US20080201369A1 (en) * 2007-02-16 2008-08-21 At&T Knowledge Ventures, Lp System and method of modifying media content
US8140340B2 (en) * 2008-01-18 2012-03-20 International Business Machines Corporation Using voice biometrics across virtual environments in association with an avatar's movements
CN102124523B (zh) * 2008-07-04 2014-08-27 布克查克控股有限公司 制作并播放音带的方法和系统
US20110219940A1 (en) * 2010-03-11 2011-09-15 Hubin Jiang System and method for generating custom songs
US20120105719A1 (en) * 2010-10-29 2012-05-03 Lsi Corporation Speech substitution of a real-time multimedia presentation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110067099A1 (en) * 2009-09-14 2011-03-17 Barton James M Multifunction Multimedia Device
US20110066438A1 (en) * 2009-09-15 2011-03-17 Apple Inc. Contextual voiceover
US20110173214A1 (en) * 2010-01-14 2011-07-14 Mobdub, Llc Crowdsourced multi-media data relationships
TW201214413A (en) * 2010-07-16 2012-04-01 Ibm Modification of speech quality in conversations over voice channels

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107155154A (zh) * 2017-05-27 2017-09-12 成都小鸟冲冲冲科技有限公司 一种具有听力保护功能的音效定制方法及系统
CN108320741A (zh) * 2018-01-15 2018-07-24 珠海格力电器股份有限公司 智能设备的声音控制方法、装置、存储介质和处理器
CN110134305A (zh) * 2019-04-02 2019-08-16 北京搜狗科技发展有限公司 一种语速调节方法、装置和用于语速调节的装置
CN112541147A (zh) * 2019-09-23 2021-03-23 北京轻享科技有限公司 一种内容发布管理方法及系统

Also Published As

Publication number Publication date
EP2847652A2 (en) 2015-03-18
WO2013169670A2 (en) 2013-11-14
JP2015517684A (ja) 2015-06-22
WO2013169670A3 (en) 2014-01-16
AU2013259799A1 (en) 2014-11-27
EP2847652A4 (en) 2016-05-11

Similar Documents

Publication Publication Date Title
CN104471512A (zh) 内容定制化
CN107871500B (zh) 一种播放多媒体的方法和装置
US20140258858A1 (en) Content customization
US20240153401A1 (en) Facilitating a social network of a group of performers
US9075760B2 (en) Narration settings distribution for content customization
CN108962219B (zh) 用于处理文本的方法和装置
US10229669B2 (en) Apparatus, process, and program for combining speech and audio data
CN108806655B (zh) 歌曲的自动生成
US10333876B2 (en) Method and system for communicating between a sender and a recipient via a personalized message including an audio clip extracted from a pre-existing recording
US8352268B2 (en) Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US8712776B2 (en) Systems and methods for selective text to speech synthesis
US8355919B2 (en) Systems and methods for text normalization for text to speech synthesis
US8352272B2 (en) Systems and methods for text to speech synthesis
US10560410B2 (en) Method and system for communicating between a sender and a recipient via a personalized message including an audio clip extracted from a pre-existing recording
US20150373455A1 (en) Presenting and creating audiolinks
CN107918653A (zh) 一种基于喜好反馈的智能播放方法和装置
CN109272984A (zh) 用于语音交互的方法和装置
JP2004347943A (ja) データ処理装置、楽曲再生装置、データ処理装置の制御プログラムおよび楽曲再生装置の制御プログラム
KR101164379B1 (ko) 사용자 맞춤형 컨텐츠 제작이 가능한 학습 장치 및 이를 이용한 학습 방법
KR20070070217A (ko) 미디어 콘텐트 아이템의 카테고리에 대하여 사용자에게통지하는 데이터 프로세싱 장치 및 방법
JP2013072957A (ja) 文書読み上げ支援装置、方法及びプログラム
US20200137011A1 (en) Method and system for communicating between a sender and a recipient via a personalized message including an audio clip extracted from a pre-existing recording
CN112995736A (zh) 语音字幕合成方法、装置、计算机设备及存储介质
CN114023301A (zh) 音频编辑方法、电子设备及存储介质
Pauletto et al. Exploring expressivity and emotion with artificial voice and speech technologies

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150325