CN104205209B9 - 回放控制设备、回放控制方法 - Google Patents

回放控制设备、回放控制方法 Download PDF

Info

Publication number
CN104205209B9
CN104205209B9 CN201380017151.1A CN201380017151A CN104205209B9 CN 104205209 B9 CN104205209 B9 CN 104205209B9 CN 201380017151 A CN201380017151 A CN 201380017151A CN 104205209 B9 CN104205209 B9 CN 104205209B9
Authority
CN
China
Prior art keywords
content
playback
program
segment
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201380017151.1A
Other languages
English (en)
Other versions
CN104205209A (zh
CN104205209B (zh
Inventor
佐伯高明
广濑幸由
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to US201261619677P priority Critical
Priority to US61/619,677 priority
Priority to US13/687,844 priority patent/US9159313B2/en
Priority to US13/687,844 priority
Application filed by Sony Corp filed Critical Sony Corp
Priority to PCT/JP2013/002073 priority patent/WO2013150743A1/en
Publication of CN104205209A publication Critical patent/CN104205209A/zh
Application granted granted Critical
Publication of CN104205209B publication Critical patent/CN104205209B/zh
Publication of CN104205209B9 publication Critical patent/CN104205209B9/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS
    • G10H2220/00Input/output interfacing specifically adapted for electrophonic musical tools or instruments

Abstract

一种回放控制设备包括:回放控制器,被配置为控制对第一内容和第二内容的回放。第一内容用于输出使用语音合成处理、基于文本信息而生成的第一声音。第二内容用于输出未使用语音合成处理生成的第二声音,回放控制器使得要回放的内容的属性显示在屏幕上,该属性表示内容是否用以输出使用语音合成处理基于文本信息而生成的声音。

Description

回放控制设备、回放控制方法
技术领域
[0001] 本技术涉及回放控制设备、回放控制方法和程序,更具体地,涉及可以通过使用文 本转语音功能来提供新娱乐形式的回放控制设备、回放控制方法和程序。
背景技术
[0002] 近年来,将数字化音频数据累积在高级移动电话(例如,智能电话)、平板式终端 等中并在奔波在外或出门在外时播放所累积的音频数据以享受音乐的用户的数量已增加。
[0003] 智能电话、平板式终端等也具有允许用户观看期望的网页的网络连接功能。然而, 在难以观看屏幕的状况下(诸如在移动时),该功能难以使用。
[0004] 迄今为止,已具有语音合成系统(“文本转语音”功能),其通过使用语音合成程序 来提供诸如接收到的电子邮件的文本信息和网站上的文本(例如,新闻和天气信息)的语 音输出(例如,参见PTL1)。
[0005] 引用列表
[0006] 专利文献
[0007] PTL1:日本未审查专利申请公布第2009-265279号
发明内容
[0008] 技术问题
[0009] 然而,在现有技术中,文本转语音功能针对指定为朗读的一种特定类型的项(诸 如新闻或接收到的电子邮件),并且难以朗读用户期望的多种类型的项或者合并要朗读的 项与不要朗读的项。
[0010] 因此,期望通过使用文本转语音功能来提供新的娱乐形式。
[0011] 针对问题的解决方案
[0012] 在本技术的一个实施例中,一种回放控制设备,包括:回放控制器,被配置为控制 第一内容和第二内容的回放,所述第一内容用于输出使用语音合成处理基于文本信息而生 成的第一声音,所述第二内容用于输出未使用所述语音合成处理生成的第二声音,其中所 述回放控制器使得要回放的内容的属性显示在屏幕上,所述属性表示该内容是否用以输出 使用语音合成处理基于文本信息而生成的声音。
[0013] 在本技术的另一实施例中,一种回放控制方法,包括:控制第一内容和第二内容的 回放,所述第一内容用于输出使用语音合成处理基于文本信息而生成的第一声音,所述第 二内容用于输出未使用所述语音合成处理生成的第二声音;以及在屏幕上显示要回放的 内容的属性,所述属性表示该内容是否用以输出使用语音合成处理基于文本信息生成的声 首。
[0014] 在本技术的又一实施例中,一种程序,用于使得计算机执行包括如下步骤的处理: 控制第一内容和第二内容的回放,所述第一内容用于输出使用语音合成处理基于文本信息 而生成的第一声音,所述第二内容用于输出未使用所述语音合成处理生成的第二声音;以 及在屏幕上显示要回放的内容的属性,所述属性表示所述内容是否用以输出使用语音合成 处理基于文本信息生成的声音。
[0015] 在本技术的实施例中,控制对第一内容和第二内容的回放,该第一内容用于输出 使用语音合成处理基于文本信息而生成的第一声音,第二内容用于输出未使用语音合成处 理生成的第二声音;以及在屏幕上显示要回放的内容的属性,该属性表示内容是否用以输 出使用语音合成处理基于文本信息而生成的声音。
[0016] 可以通过经由传输介质传送或者记录在记录介质上来提供该程序。
[0017] 回放控制设备可以是独立的设备或者可以是包括在单个设备中的内部块。
[0018] 发明的有益效果
[0019] 本技术的实施例可以通过使用文本转语音功能来提供新的娱乐形式。
附图说明
[0020] [图1]图1是示出根据本技术的实施例的节目分发系统的示例配置的图。
[0021] [图2]图2是示出用作用户可观看和收听的内容的节目的结构的图。
[0022] [图3]图3是示出登录画面的示例画面配置的图。
[0023] [图4]图4是示出主页画面的示例画面配置的图。
[0024] [图5]图5是示出节目编辑画面的示例画面配置的图。
[0025] [图6]图6是示出附加片段(segment)风格选择画面的示例画面配置的图。
[0026] [图7]图7是示出附加片段选择画面的示例画面配置的图。
[0027] [图8]图8是示出回放历史画面的示例画面配置的图。
[0028] [图9]图9是示出菜单画面的示例画面配置的图。
[0029] [图10]图10是示出节目列表画面的示例画面配置的图。
[0030][图11]图11是示出画面的画面转变序列的图。
[0031][图12]图12是示出节目回放处理的流程图。
[0032][图13]图13是示出主页画面的第一具体示例的图。
[0033][图14]图14是示出主页画面的第一具体示例的图。
[0034] [图15]图15是示出主页画面的第一具体示例的图。
[0035] [图I6]图I6是示出主页画面的第一具体示例的图。
[0036] [图I7]图17是示出主页画面的第一具体示例的图。
[0037] [图18]图18是示出节目“晨间拿铁(Morning Latte) ”的整个结构的图。
[0038] [图19]图19是示出主页画面的第二具体示例的图。
[0039][图20]图20是示出主页画面的第二具体示例的图。
[0040][图21]图21是示出主页画面的第二具体示例的图。
[0041][图22]图22是示出用于确定关于音乐的朗读的介绍文本的处理的流程图。 [0042][图23]图23是示出移动终端的硬件配置的框图。
[0043][图24]图24是示出服务器装置的硬件配置的框图。
具体实施方式
[0044]〈节目分发系统的示例配置〉
[0045] 图1示出了根据本技术的实施例的节目分发系统1的示例配置。
[0046] 图1所示的节目分发系统i是如下系统,其提供用于向用户的移动终端n分发节 目(内容)的服务,该节目是通过将作为经由网站上的文本(诸如,新闻、天气和推特简讯 (或推特))提供的信息的各种文本信息与诸如音乐的音频数据合并而创建的。当在移动终 端11上回放节目时,在屏幕上显示构成节目的信息(诸如,新闻、天气和推特简讯),并且还 通过使用文本转语音功能(语音合成处理)将该信息输出为语音。因而,用户能够通过经 由语音收听该信息以及通过观看移动终端11的屏幕上的信息来享受在某一网站上提供的 伯息。
[0047] 在节目分发系统1中,可以将由节目分发公司创建的节目分发给用户(的移动终 端11)。另外,节目分发系统1可以允许用户根据其偏好创建节目,以观看并收听节目,并且 将节目提供(或分发)给其他用户。
[0048] 在图1所示的节目分发系统1中,用户操作的移动终端11、节目分发公司管理的用 户信息管理服务器12、脚本(script)分析服务器I3、语音合成服务器15和媒体文件服务 器16经由网络17-1(诸如,有线或无线局域网(LAN)、移动电话网络、公共无线电通信网络 或互联网)彼此连接。
[0049] 脚本分析服务器13还经由网络17-2(诸如,有线或无线LAN、移动电话网络、公共 无线电通信网络或互联网)连接到多个(在所示的示例中为N)脚本源服务器14-1至14-N。 网络17-1和17-2可以是共同的(S卩,相同的)或不同的。
[0050] 移动终端11是例如被称为智能电话的高级移动电话、平板式终端、移动游戏台、 移动音乐视频播放器等。移动终端11中已存储(或安装)有节目回放应用(或者有时简 称为“app”)21,该节目回放应用是用于回放节目分发公司等创建的节目的应用程序(软 件)。节目回放应用21设置有用于控制节目的回放的回放控制器,并且回放控制器包括通 信控制器22、显示控制器23和语音控制器24。通信控制器22被配置为控制与节目分发公 司的每个服务器的通信。显示控制器23被配置为控制节目在移动终端11的显示器上的显 示。语音控制器24被配置为控制节目的语音输出。
[0051] 用户信息管理服务器12管理与使用节目分发服务的用户有关的信息。具体地,用 户信息管理服务器12基于每个用户来管理表示用户可用观看和收听的节目的内容的登记 节目信息以及表示用户己观看和收听(或回放)的节目的历史的先前播放节目信息。用户 信息管理服务器12还基于每个用户来管理包括用户用以登录的用户ID和密码的认证信 息、用户的偏好信息、设置信息等。
[0052] 将参照图2描述作为节目分发系统1中用户可观看和收听的内容的节目的结构。
[0053] 用户可观看和收听的节目由一个或多个片段构成。每个片段包括一个或多个话题 (topic)。应注意,有时可仅将由一个话题构成的片段定义为片段。
[0054] 话题的示例可以包括在诸如报纸和杂志发行方的信息分发公司主办的特定网页 上所提供的关于新闻、天气预报、占卜服务等的分发信息。一部分这样的分发信息仅包括文 本(文本信息),而其他这样的分发信息包括文本和视频(静止图像、运动图像)。
[0055] 每个话题均可以包括音乐、视频、背景音乐(BGM)、声效和音频广告(CM)的音频数 据(音频文件)。每个话题还可以包括音频数据和文本信息(诸如音乐及其介绍文本)。音 频数据可以是可存储在云服务器、本地存储器(用户的终端的存储装置)等中的、用户创建 的音频数据,或者可以是另一用户创建的音频数据,诸如,经由播客(podcast)等可利用的 音乐、在视频发布网站上发布的项目或者可从音乐分发公司得到而进行试用的项目。音频 数据还可以是作为书的朗读音频文件的有声读物。
[0056] 每个话题还可以包括诸如留言板、博客和推特简讯的社交网络服务(SNS)中的评 论信息。话题的其他示例可以包括作为与人们过去或将来的活动有关的信息的日程安排信 息,以及表示电子邮件的内容的电子邮件信息。
[0057] 在上述的话题之中,可以将可从相同网络服务器得到的诸如多篇新闻文章和天气 信息的多个话题合并成单个片段。另外,还可以将可从相同网络服务器得到的诸如博客信 息和推特简讯信息的多个话题合并成单个片段。换言之,片段是以共同主题(诸如信息分 发公司、分发服务器和提供信息类型)统一了一个或多个话题的子分类项,而话题是从片 段划分出的子-子分类项。
[0058] 返回参照图1,脚本分析服务器13访问脚本源服务器14-1至14-N以获取作为构 成节目(内容)的话题的数据的内容数据(诸如新闻、天气和博客信息),并且存储所获取 的内容数据。另外,脚本分析服务器13分析并修改从脚本源服务器14-A至14-N获取的内 容数据以创建用于朗读所获取的内容数据的文本转语音数据,并且存储所创建的文本转语 音数据。脚本分析服务器13定期地或不定期地访问脚本源服务器14-1至14-N中的每一 个以获取最新的内容数据。
[0059] 在从移动终端11的节目回放应用21接收到对构成节目的话题的内容数据的请求 时,脚本分析服务器13将预先从脚本源服务器14-1至14-N(下文中统称为“脚本源服务器 14”)中的每一个获取并存储在脚本分析服务器I3中的内容数据传送(返回)到节目回放 应用21。如果要传送到节目回放应用21的内容数据包含文本信息,则脚本分析服务器13 还将为了将文本信息朗读为语音而处理的文本转语音数据作为内容数据的一部分传送到 节目回放应用21。
[0060] 每个脚本源服务器14向脚本分析服务器13提供用于构成节目的话题或片段的内 容数据。脚本源服务器14对应于例如诸如报纸或杂志发行方的信息分发公司的网络服务 器、SNS提供服务器等。
[0061] 语音合成服务器15是用于执行用以将文本信息转换成语音并输出语音的语音合 成处理的服务器。当从移动终端11的节目回放应用21传送了给定话题的文本转语音数据 时,语音合成服务器15使用文本转语音数据来执行语音合成处理以产生音频数据,并且将 音频数据传送(返回)到节目回放应用21。
[0062] 移动终端11的节目回放应用21可以具有文本转语音功能并且可以执行语音合成 处理。在这种情况下,可以省略语音合成服务器15。替选地,可以根据节目回放应用21的 设置来确定是使用节目回放应用21的文本转语音功能还是语音合成服务器I5的文本转语 音功能,或者可以使用语音合成服务器15的文本转语音功能作为补充。
[0063] 媒体文件服务器16存储音乐、视频、BGM、声效和音频CM的音频数据(音频文件)。 在从移动终端11的节目回放应用21接收到对构成节目的话题的音频数据的请求时,媒体 文件服务器16将所请求的音频数据传送(或返回)到节目回放应用21。媒体文件服务器 16还可以存储具有视频和音频的CM、音乐视频以及在运动图像发布网站上发布的运动图 像的音频/视频数据(AV数据),并且响应于来自节目回放应用21的请求而传送这样的数 据。
[0064] 从语音合成服务器15或媒体文件服务器16传送的音频数据可以是例如流数据。
[0065] 节目分发系统1具有上述配置。
[0066]节目分发公司管理的用户信息管理服务器12、脚本分析服务器13、语音合成服务 器15和媒体文件服务器16可由单个服务器或者两个、三个或多于四个的服务器实现。另 夕卜,每个服务器的一些功能可由与节目分发公司不同的公司运行。
[0067] 此外,由脚本分析服务器13、语音合成服务器15等执行的处理的全部或部分可由 移动终端11的节目回放应用21执行。也就是说,可以根据移动终端11的处理能力来适当 地确定每个服务器执行的处理与移动终端11的节目回放应用21执行的处理的分担。
[0068]〈节目回放应用的UI>
[0069] 接下来,将参照图3至图11描述可以在移动终端11的显示器上显示的节目回放 应用21的用户界面(UI)画面。
[0070]〈登录画面〉
[0071]图3示出了启动节目回放应用21时显示的登录画面的示例画面配置。
[0072] 在图3所示的登录画面41中心呈现节目回放应用21的名称(“应用标题”)。还 在登录画面41的预定位置呈现用户ID输入字段似和密码输入字段43。用户ID输入字段 42允许用户键入用于标识用户的用户ID,以及密码输入字段43允许用户键入密码。
[0073] 用户ID输入字段42中键入的用户ID及密码输入字段43中键入的密码被传送到 用户信息管理服务器12,并且用户信息管理服务器I2相对于与所登记的用户有关的认证 信息对该用户ID和密码进行检验。
[0074] 主页画面的示例画面配置
[0075] 图4示出回放节目期间所显示的主页画面的示例画面配置。
[0076] 在图4所示的主页画面51上部呈现菜单跳转按钮52和回放历史跳转按钮53。当 用户希望画面转变至菜单画面121 (图9)时,操作菜单跳转按钮M。当用户希望画面转变 至显示用户的简档和回放历史的回放历史画面11 (图8)时,操作回放历史跳转按钮53。 [0077]主页画面51还呈现顺序地显示构成节目的片段的片段显示部54。在片段显示部 54中,按回放的顺序竖直地布置构成节目的片段60,诸如片段60-1和片段60-2。
[0078]每个片段60均包括片段图像61、片段图标62、片段标题63和片段跳转按钮64。 片段图像61是帮助用户理解片段的内容的照片或图示。片段图标62表示片段的风格(属 性)。当用户希望跳转到片段以立即开始回放时,操作片段跳转按钮64。在构成节目的片 段60当中,利用片段跳转按钮64附近的节目编辑跳转按钮65呈现用户可以编辑(诸如添 加或删除)的片段6〇,以使得画面转变至节目编辑画面71 (图5)。
[0079]更具体地,片段6〇_1设置有片段图像6卜1、片段图标62_1、片段标题63—丨和片段 跳转按钮1。片段6〇-2设置有片段图像ei-2、片段图标e2-2、片段标题63_3、片段跳转 按钮G4-2和节目编辑跳转按钮65-2。
[0080]片段显示部54包括明确表示当前回放位置的时间线66。时间线66被设置成在片 段60上延伸。
[0081]用户通过用其一个或多个手指触摸显示器上的片段显示部54并且在片段60布置 的竖直方向上滑动其一个或多个手指来做出手势。这使得由于有限的显示区域而隐藏的其 他片段6〇能够显示。用户可以通过检查各个片段60的内容并轻击(tap)期望片段60的 片段跳转按钮64来开始回放期望的一个片段60。
[0082] 节目编辑画面的示例画面配置
[0083] 图5示出响应于对图4所示的节目编辑跳转按钮65的轻击而显示的节目编辑画 面71的示例画面配置。
[0084]图5所示的节目编辑画面71具有主页跳转按钮72、“完成”按钮73和节目结构显 示部74。当用户希望画面转变至主页画面51 (图4)时,操作主页跳转按钮72。“完成’,按 钮73用于完成节目的编辑并且反映所编辑的节目的内容。节目结构显示部74是显示节目 的结构的区域。
[0085] 节目结构显示部M包括用于显示节目的标题和回放持续时间的节目标题显示部 81以及示出构成节目的片段的片段显示部82。
[0086]在片段显示部82中,针对构成节目的每个片段布置图标83、片段标题显示部84、 详情设置按钮85和改变按钮86。
[0087]每个图标83均表示相关联片段的风格(属性)。以与在主页画面51 (图4)上的 方式类似的方式沿着时间线87布置图标83。
[0088]每个片段标题显示部別呈现相关联片段的标题和回放持续时间。操作详情设置 按钮85以设置片段的详情。例如,对于占卜服务片段,详情设置按钮85可以用于设置显示 与该片段有关的信息所需的信息,诸如,用户的星座或血型。利用改变按钮86,用户可以改 变节目中的片段的顺序及删除片段。
[0089]在片段显示部82上的预定位置处进一步设置有用于添加片段的“添加片段”按钮 88。响应于用户对“添加片段”按钮88的轻击(或按压),在显示器上显示图6所示的附加 片段风格选择画面91。
[0090] 添加片段风格选择画面的示例画面配置
[oo:1] 一图6示出允许用户选择用户希望添加的片段的风格的附加片段风格选择画面91 的示例画面配置。
[0092]附加片段风格选择画面91呈现表示可选择风格的风格按钮92。在图6所示的示 例中,显不有表不“片头(‘〇P’)”、“新闻”、“娱乐(‘Ent’)”和“音乐’,的风格按钮92。用 户轻击表示用户希望添加的片段的风格的风格按钮92。
[0093]当用户希望返回到图5所不的节目编辑画面71时,操作位于附加片段风格选择画 面91的左上角的节目编辑跳转按钮93。
[0094]一例如,用户希望添加属于“新闻”风格的片段并且轻击了 “新闻,,风格按钮92。因 而,显示图7所示的附加片段选择画面1〇1。
[0095] 附加片段选择画面的示例画面配置 ^〇96]图7示出允许用户添加属于“新闻”风格的片段的附加片段选择画面101的示例 画面配置。
[00972图7所示的附加片段选择画面101呈现片段按钮102,片段按钮102表示属于在图 6所示的加片段风格选择画面gi上所选择的“新闻,,风格的可用片段。在图7所示的示 例中,显示有表示二晚间时段”、“东部经济时间”、“媒体时间,,和“IT新闻,,的片段按钮102。 响应于用户对表示用户希望添加的-个片段的片段按钮搬的轻击,添加对应的片段作为 正編辑的节目的一个片段。然后,显示器的画面返回到图5所示的节目编辑画面71。 [0098]当用户希望返回到图6所示的附加片段风格选择画面91时,操作位于附加片段选 择画面101的左上角的风格选择跳转按钮104。
[0099] 回放历史画面的示例画面配置
[0100]图8示出其上显示用户先前已回放的节目的历史的回放历史画面111的示例画面 配置。
[0101] 如图8所示,回放历史画面111包括简档显示部112、播放节目显示部113和主页 跳转按钮114。
[0102]简档显示部112呈现用户的简档(诸如,名字、正面照片(面部图像)、生日和星 座)。还可以在简档显示部112中显示用户的登记的偏好信息。
[0103] 在播放节目显示部113中显示用户先前已回放的节目的历史。在图8所示的示例 中,显示被设计为在早晨观看和收听的节目“晨间拿铁”以及被设计为在晚上观看和收听的 节目“夜间拿铁”作为用户先前己回放(或者观看和收听)的节目。
[0104] 当用户希望画面转变至图4所示的主页画面51时,操作主页跳转按钮114。
[0105] 菜单画面的示例画面配置
[0106] 图9示出菜单画面121的示例画面配置。
[0107] 如图9所示,菜单画面121包括主页画面跳转按钮122、节目列表画面跳转按钮 123、回放历史画面跳转按钮124和设置画面跳转按钮125。主页画面跳转按钮122被操作 用以显示主页画面51 (图4)。节目列表画面跳转按钮123被操作用以显示节目列表画面 131 (图10)。回放历史画面跳转按钮124被操作用以显示回放历史画面111 (图8)。设置画 面跳转按钮125被操作用以显示允许用户进行节目回放应用21的设置的设置画面151 (图 11)。
[0108] 节目列表画面的示例画面配置。
[0109] 图10示出节目列表画面131的示例画面配置。
[0110] 图10所示的节目列表画面131呈现用户可观看和收听的节目的列表。用户可观 看和收听的节目包括用户创建的节目和节目分发公司或任何其他用户免费或付费提供的 节目。节目回放应用21访问用户信息管理服务器12以基于登记节目信息显示用户可观 看和收听的节目的列表,该登记节目信息包括作为用户可观看和收听的节目的列表的登记 节目列表。
[0111] 节目列表画面131针对用户可观看和收听的每个节目呈现节目描述部132。
[0112] 每个节目描述部132呈现节目标题141、节目内容描述142和代表构成节目的片段 的片段图标143。类似于作为表明当前正回放节目的画面的主页画面51上的片段图标62, 片段的片段图标143代表片段的风格(属性),并且按节目中回放的顺序布置。如果已登记 对应于节目的照片(缩略图像),则显示照片作为背景图像,使得以叠加方式显示照片、节 目标题141和节目内容描述142。
[0113] 当用户希望画面转变至图4所示的主页画面51时,操作位于节目列表画面131的 左上角的主页跳转按钮133。当用户希望画面转变至图8所示的回放历史画面111时,操作 位于节目列表画面131的右上角的回放历史跳转按钮134。
[0114] 用户可以通过轻击与节目列表画面131上的期望节目相关联的节目描述部132来 回放期望的节目。响应于用户对与用户希望回放的节目相关联的节目描述部132的轻击, 开始节目的回放,并且移动终端11的画面转变至图4所示的要回放的节目的主页画面51。
[0115] 〈画面转变序列〉
[0116] 图11示出图3至图10所示的画面的画面转变序列。
[0117]当启动节目回放应用21时,最初,显示图3所示的登录画面41。当在登录画面41 上输入了用户ID和密码并且对用户进行了认证时,显示图4所示的主页画面51。
[0118]主页画面51可转变至图5所示的节目编辑画面71、图8所示的回放历史画面111、 图9所示的菜单画面121、图10所示的节目列表画面131和设置画面151。
[0119]节目编辑画面71可转变至图6所示的附加片段风格选择画面91,并且附加片段风 格选择画面91可转变至图7所示的附加片段选择画面1〇1。
[0120] 图9所示的菜单画面121可以转变至图4所示的主页画面51、图10所示的节目列 表画面131、图8所示的回放历史画面111以及设置画面151。
[0121] 设置画面151是允许用户进行应用的常规设置(诸如,节目回放应用21的UI画 面的显示方法、行为等)的画面。
[0122] 〈节目回放处理的流程图〉
[0123] 接下来,将参照图12的流程图来描述通过使用移动终端11的节目回放应用21来 回放给定的节目的处理。例如当激活节目回放应用21时,启动该处理。
[0124] 在步骤S1中,节目回放应用21在移动终端11的显示器上显示图3所示的登录画 面41。登录画面41设置有用户ID输入字段42和密码输入字段43。
[0125] 在步骤S2中,节目回放应用21将用户输入的用户ID和密码传送到用户信息管理 服务器12。
[0126] 在步骤S3中,用户信息管理服务器12接收从节目回放应用21传送的用户ID和 密码,并且基于该用户ID和密码对用户进行认证。在对用户进行认证之后,用户信息管理 服务器12基于用户的登记节目信息来将作为用户可观看和收听的节目的列表的登记节目 列表传送到节目回放应用21。
[0127] 在步骤S4中,节目回放应用21获取从用户信息管理服务器12传送的登记节目列 表,并且基于登记节目列表在显示器上显示图10所示的节目列表画面131。
[0128] 在步骤S5中,节目回放应用21确定是否已从显示器上所显示的一个或多个节目 当中选择了某一节目作为要回放的节目,并且等待直到确定已选择节目为止。
[0129] 如果在步骤Sf5中确定已选择某一节目,则处理进入步骤S6。然后,节目回放应用 21在显示器上显示被指示回放的节目的主页画面51 (图4)。
[0130] 如果用户仅保留一个节目或者如果通过预约要回放的节目等来预先指定了要回 放的节目,则省略上述的步骤S4和S5中用于选择要回放的节目的处理。在这种情况下,如 在图11所示的画面转变序列中,登录画面41立即改变为要回放的节目的主页画面51。
[0131] 在步骤S7中,节目回放应用21从用户信息管理服务器12获取与构成选择被回放 的节目的一个或多个话题当中接下来要回放的话题有关的访问信息。
[0132] 在用户信息管理服务器12中,针对构成选择被回放的节目的一个或多个话题存 储了表示从其获取每个话题的内容数据的地址的访问信息。如果话题是例如脚本源服务器 14分发的新闻,则访问信息可以是表示脚本分析服务器13中的存储有从脚本源服务器14 获取的新闻的文件夹的信息。如果话题是例如存储在媒体文件服务器16中的音乐,则访问 信息可以是表示媒体文件服务器16中的存储有音乐的音频数据的文件夹的信息。用户信 息管理服务器12将与在构成选择被回放的节目的一个或多个话题当中接下来要回放的话 题有关的访问信息传送到节目回放应用21,并且节目回放应用21接收访问信息。
[0133] 在步骤S8中,节目回放应用21根据在步骤S7中所获取的与话题有关的访问信息 来访问由访问信息指定的服务器,并且获取内容数据。
[0134] 例如,如果话题是脚本源服务器14分发的新闻,则节目回放应用21基于访问信息 来访问脚本分析服务器13中的文件夹,并且获取内容数据。
[0135] 例如,如果话题是存储在媒体文件服务器16中的音乐,则节目回放应用21基于访 问信息访问媒体文件服务器16中的文件夹,并且获取音乐的音频数据。
[0136] 在步骤S9中,节目回放应用21确定所获取的内容数据是否包括文本转语音数据。
[0137] 如果在步骤S9中确定所获取的内容数据包括文本转语音数据,则处理进入步骤 S10。在步骤S10中,节目回放应用21将文本转语音数据传送到语音合成服务器15,获取经 过语音合成服务器15的语音合成处理的语音数据,并且对画面显示和基于内容数据、经过 文本转语音的语音输出执行同步操作。例如,如果话题是脚本源服务器14分发的新闻,则 节目回放应用21在移动终端11的显示器上显示从脚本分析服务器13中的文件夹获取的 新闻稿,并且还输出新闻稿的朗读的语音。
[0138] 如果在步骤S9中确定所获取的内容数据不包括文本转语音数据,则处理进入步 骤S11。然后,节目回放应用21回放内容数据。例如,如果话题是存储在媒体文件服务器 16中的音乐,则节目回放应用21回放音乐的音频数据。
[0139] 在步骤S12中,节目回放应用21基于用户信息管理服务器12中的登记节目信息 来确定在当前回放话题之后是否存在要回放的话题。
[0140] 如果在步骤S12中确定存在接下来要回放的话题,则处理返回到步骤S7,并且再 次执行随后的处理。即,执行获取接下来要回放的话题的内容数据并且回放内容数据的处 理。
[0141] 如果在步骤S12中确定不存在接下来要回放的话题,则节目回放处理结束。
[0142] 因此,节目回放应用21通过以构成节目的话题为单元获取内容数据来回放节目。 因此,回放了该节目。
[0143] 在上述示例中,为了便于描述,在当前话题的回放结束之后,获取下一话题的内容 数据。实际上,在回放当前话题的同时预先获取下一话题的内容数据,使得可以在当前话题 的回放完成之后立即开始下一话题的回放。
[0144] 〈主页画面的第一具体示例〉
[0145] 接下来,将描述主页画面的两个具体示例。
[0146] 图13示出主页画面的第一具体示例,其中,在主页画面上回放具有节目标题“晨 间拿铁”的节目。
[0147] 该主页画面在其左部呈现时间线201。时间线201是使得能够从视觉上识别整个 节目和每个片段(话题)的时间长度以及回放点的时间位置的时域内的表征。
[0148] 多个片段显示部211布置在时间线201的右侧以按各个片段的回放顺序从上向下 布置。每个片段显示部211均包括代表相关联片段的风格(属性)的图标221、片段的标题 矛回放1¾时间222以及当用户希望跳转到片段以开始回放时所操作的跳转按钮223。
[0149]对于包括一个或多个话题的片段,还显示话题的话题标题231和当用户希望跳转 到话题以进行回放时所操作的跳转按钮232。
[0150]在图13所不的主页画面上,显示包括话题“今日天气”的“片头’,片段的片段显示 部211以^示要第一回放的片段,显示包括两个话题的“ ^数码新闻,,片段的片段显示部 211以表不要第二回放的片段,显示“音乐#1 ”片段的片段显示部2n以表示要第三回放的 f段,并且显示“CM”片段的片段显示部211以表示要第四回放的片段。以该方式,片段显 示部211按构成节目的片段的回放顺序在时间线2〇1的右侧的布置使得用户能够对整个节 目和每个片段的结构、各个片段的回放顺序等一目了然。这可以有助于用户容易地了解整 个节目。
[0151]从片段显示部211中的回放起始时间222可以看出,在开始回放节目之后立即 (之后0分0秒)回放第一片段“片头”,在开始回放节目之后〇分33秒回放第二片段“ IT 数码新闻”,以及在开始回放节目之后11分57秒回放第三片段“音乐#1”。因此,用户可以 了解回放每个片段的定时及其回放持续时间。替代从节目的开头起测量的回放每个片段的 时间,每个片段的回放持续时间的长度可显示在回放起始时间222中。
[0152]位于主页画面的下部中的播放/停止按钮241、跳过按钮242和设置画面跳转按钮 243是主页画面所共有的操作按钮,并且无论回放哪个节目均显示。播放/停止按钮241被 操作(通过轻击)用以开始或停止节目的回放。跳过按钮242被操作用以将回放目标移动 到下一话题或片段。设置画面跳转按钮243被操作用以输入节目回放应用21的设置画面。 W153] 在当前正回放节目“晨间拿铁”的第一片段“片头”中的话题“今日天气”时,显示 图14所示的主页画面。具体地,指示当前回放位置的指示符202在时间线201上移动并且 显不在话题“今日天气”的位置处。
[0154] 在回放“片头”片段中的话题“今日天气”时,节目回放应用21从脚本源服务器14 获取话题“今日天气”的文本转语音数据,并且提供“今日天气”的语音输出。
[0155]当完成了对话题“今日天气”的朗读并且开始下一片段“IT数码新闻”中的第一话 题(即,“在内阁改组之后执政党和反对党会见内阁官方长官”)的回放时,显示图15所示 的主页画面。
[0156] 具体地,表示当前回放位置的指示符202在时间线201上移动至如下位置,即话题 “在内阁改组之后执政党和反对党会见内阁官方长官”。然后,如图15所示,节目回放应用 21在话题标题231下面显示网页画面261,其与在从其获取了话题“在内阁改组之后执政党 和反对党会见内阁官方长官”的网站上所显示的画面相同。
[0157] 当在前一片段“片头”的回放结束之后开始“ H数码新闻”片段的回放时,可经由 诸如“接下来是新闻片段”的语音向用户呈现接下来要回放的片段的风格。
[0158] 替选地,在“IT数码新闻”片段的片段显示部211中可以靠近例如标题和回放起始 时间222显示从其获取了数码新闻”片段的脚本源服务器14的网站名或统一资源定位 符(URL),以明确示出与所显示的内容有关的源信息。另外,可以在“IT数码新闻”片段的 回放开始或结束时朗读要回放的片段的源信息,诸如“该片段从IT新闻提供”。
[0159] 节目回放应用21基于文本转语音数据朗读网页画面261上的新闻稿(或者经由 语音输出新闻稿)。
[0160] 在朗读网页画面261上的新闻稿时,节目回放应用21将画面上的朗读部分划分成 诸如句子的预定单位并且与句子的朗读语音同步地以突出(或强调)方式显示句子。这允 许用户容易地识别正在朗读网页画面261上的新闻稿的哪个部分。
[0161] 如图I6所不,在以与在从其获取了数据的网站上所显示的画面类似的方式所显 示的网页画面261下面设置有浏览器启动按钮262。用户可以轻击浏览器启动按钮262以访 问从其获取了正朗读的话题的脚本源服务器14,以在网络浏览器上显示正朗读的新闻稿。 表示从其获取了正朗读的新闻稿的源的对脚本源服务器14的访问信息包括在例如从脚本 分析服务器13获取的内容数据中。
[0162] 当“IT数码新闻”片段中的两个话题的回放结束并且下一片段“音乐#1”的回放 开始时,显示图17所示的主页画面。具体地,已显示的网页画面消失,并且指示符2〇2 在时间线201上移动至“音乐#1”片段的位置。
[0163] 图18示出节目“晨间拿铁”的整个结构。
[0164] 节目“晨间拿铁”由五个片段(即,第一片段“片头”、第二片段“几数码新闻,,、第 三片段“音乐#1”、第四片段“CM”和第五片段“片尾”)组成。
[0165] 在“片头”片段的回放中,节目回放应用21从脚本源服务器14获取话题“今日天 气”的内容数据(文本转语音数据),并且在需要时经由语音合成服务器15提供话题“今日 天气”的语音输出。可以通过根据天气的内容切换朗读者(的话音音调)、BGM等来提供话 题“今日天气”的语音输出,以允许用户了解根据除文字因素外的因素的信息。
[0166] 在回放“IT数码新闻”片段时,节目回放应用21从脚本源服务器14获取话题“在 内阁改组之后执政党和反对党会见内阁官方长官”和“新闻文本”的内容数据。然后,节目 回放应用21显示与在用户访问脚本源服务器14时提供新闻稿的脚本源服务器14上所显 示的网页画面相同的网页画面,并且通过执行语音合成处理来提供网页画面261上所呈现 的新闻稿的语音输出。
[0167] 用户可以开启或关闭节目回放应用21的、用以朗读主页画面上所呈现的内容的 文本转语音功能。
[0168] 在回放“音乐#1”片段时,节目回放应用21回放存储在移动终端11的本地存储 器中的音乐“音乐#1”。在“音乐#1”片段的回放期间,可显示音乐的封面照片(的缩略图 像)等。
[0169] 在回放“CM”片段时,节目回放应用21访问媒体文件服务器16以获取广告的音频 数据,并且回放该音频数据。如果广告是具有视频的运动图像,则还同时回放视频。要回放 的广告可以在服务器侧预先确定,或者可以根据登记在用户信息管理服务器12中的用户 的偏好信息等而随着用户不同而不同。可以根据诸如用户按照兴趣已参考的网页以及用户 已收听的音乐的内容的内容来学习用户的偏好信息,并且可以对其进行登记。
[0170] 在回放“片尾”片段时,节目回放应用21访问媒体文件服务器16以获取“片尾”片 段的音频数据,并且回放音频数据。
[0171]另外,例如,在使用移动终端11中的日程数据来回放“今日日程安排”片段时,节 目回放应用21可以通过执行语音合成处理来朗读今日日程安排或者显示用于启动日历应 用的启动按钮等。
[0172] 另外,例如,在回放“占卜服务”片段时,节目回放应用21基于所登记的用户的简 档来朗读对于用户的星座占卜。因而,甚至在同一节目中,在“占卜服务”片段中要朗读的 内容可能根据用户(的星座)而不同。 _
[0173] 另外,例如,在使用移动终端11中的邮箱数据来回放显示有新送达的电子邮件的 “新送达电子邮件”片段时,节目回放应用2丨可以通过执行语音合成处理来朗读新送达的电 子邮件,或者显示用于启动邮箱的启动按钮等以创建回复电子邮件。
[0174] 因此,在利用根据该实施例的节目分发系统1所分发的节目中,诸如从预定网站 收集的新闻稿、天气预报、博客文章、推特简讯信息、音乐(服务器内容、本地内容)、日程安 排以及新送达电子邮件的各类信息被呈现为片段或话题。在现有技术中,在屏幕上观看诸 如网页上的信息的内容之前,不了解该内容。相反,节目回放应用21允许通过使用文本转 语音功能将这样的内容收听为语音,并且因此可以通过使用文本转语音功能来向用户提供 新的娱乐形式。
[0175] 当通过执行语音合成处理来朗读文本信息时,节目回放应用21可以使用于语音 合成的语音(朗读者的话音)等的音调根据每个片段或风格而不同。例如,可以对新闻片 段进行语音合成处理使得以40多岁的男性声音呈现新闻片段,可以对天气片段进行语音 合成处理使得以20多岁的女性声音呈现天气片段,并且对体育片段进行语音合成处理使 得以30多岁的男性声音呈现体育片段。节目回放应用21可以允许用户以片段或风格为单 位设置用于语音合成的声音,并且可以基于设置的参数来执行语音合成处理。替选地,节目 回放应用21或语音合成服务器15可以基于用户的简档信息或偏好信息来以片段或风格为 单位自动改变用于语音合成的声音。
[0176] 由于主页画面上的每个片段显示部211呈现代表片段的风格的图标221,因此即 使节目由包括诸如新闻稿、博客文章、音乐和日程安排的各种信息的片段组成,用户也可以 容易地了解片段属于哪个风格。
[0177] 片段显示部211中的图标221可以如在前述示例中那样基于风格,或者替选地或 附加地基于任意其他分类方法。
[0178] 例如,可以将节目中的片段分类成:包括要通过语音合成处理经由语音输出的文 本信息的片段,以及包括要通过回放经由音频输出的音乐的音频数据的片段,并且可以由 图标221可区分地标识这些片段。由于通过语音合成处理所获得的语音可能是人工的(或 者机械的),因此可以按实际用途准备利用人声朗读的文本的语音录音的音频数据。在这种 情况下,可以利用图标221进一步区分语音输出是否是基于真人语音录音。
[0179] 此外,还可以将节目中的片段分类成:经过了移动终端11中的封闭(cl〇sed)处理 的片段,以及通过将片段的数据传送到外部服务器等使用外部装置处理的片段,并且可以 利用图标221可区分地标识节目中的片段。
[0180] 例如,在片段中,通过语音合成处理朗读存储在移动终端11中的电子邮件。在这 种情况下,电子邮件可经历移动终端11的语音合成处理,或者可以传送到语音合成服务器 I5并且经历语音合成服务器15的语音合成处理。如果电子邮件的内容具有高保密性或高 隐私度,则在将电子邮件发送到语音合成服务器15的情况下电子邮件的内容可能通过拦 截、窃听等而泄漏到外部。相反,如果电子邮件经历移动终端11的语音合成处理,则可以防 止或减少这样的担心。因此,用于可区分地标识移动终端11中的封闭处理或者使用外部装 置的处理的图标221可用于隐私保护或保密性保护。
[0181] 替选地,可以将节目中的片段分类成:(仅)使用存储在移动终端11的本地存储 器中的内容数据的片段,以及使用从外部服务器获取的内容数据的片段,并且可以利用图 标221可区分地标识节目中的片段。
[0182] 例如,在基于音频数据回放音乐的情况下,可以使用存储在移动终端11的本地存 储器中的音频数据来回放音乐,或者可以使用从媒体文件服务器16下载的流数据来回放 音乐。当用户在乘火车旅行等时回放节目及回放作为节目中的片段的音乐时,通信可能在 火车穿过隧道时暂时断开。在这样的状况下,如果音乐使用本地数据,则可以不中断音乐的 回放,而如果音乐使用流数据,则可能中断音乐的回放。因此,用于可区分地标识使用存储 在移动终端11的本地存储器中的内容数据还是使用从外部服务器获得的内容数据的图标 221允许预测回放中断的风险。
[0183] 如参照图12的流程图所述,在移动终端11的节目回放应用21执行的节目回放处 理中,如果每个片段均包括多个话题,则以片段为单位或以话题为单位获取内容数据。
[0184] 在通信由于火车穿过隧道、通信堵塞等而暂时断开的状况下,可以不按时间获取 下一片段(或话题)的内容数据而开始回放,或者可以在片段(或话题)的回放期间暂时 中断回放。在这种情况下,节目回放应用21可以输出诸如“通信状态差以及将替代地回放 本地内容”的消息或画面,从而以使用移动终端11中的本地内容数据的片段替代使用从外 部服务器获得的内容数据的片段。
[0185] 另外,节目回放应用21具有用于在用户处于网络可访问环境中时(诸如在用户在 家的晚上)将构成节目的每个片段的内容数据累积在移动终端11的本地存储器中的功能, 使得甚至在难以访问服务器的通信环境下也能回放节目。该功能允许用户甚至在难以访问 服务器的通信环境中也能通过使用存储在移动终端11中的节目的内容数据来连续地观看 -++» 口
[0186] 如上所述,构成节目的每个片段或话题的内容包括在服务器侧(例如,脚本分析 服务器13)所生成的服务器生成的内容(诸如在某些网站上的新闻稿)以及在本地侧所生 成的本地生成的内容(诸如,基于在移动终端n中的日程安排的今日日程安排以及音乐文 件)。
[0187] 节目回放应用21可以通过将服务器生成的内容与本地生成的内容合并来生成一 个片段或话题。在这种情况下,用户保持为从服务器侧获取的内容数据的内容数据包含用 于合并到内容数据中的指令作为节目结构信息。
[0188] 例如,在“今日天气”片段中,可以将对在服务器侧所生成的“今日天气”的脚本的 朗读与作为BGM存储在移动终端U中的音频数据合并,以在朗读“今日天气”的同时广播 作为BGM的本地数据的音乐。在这种情况下,从脚本分析服务器13获取的“今日天气”的 内容数据包含用于“将使用本地数据的BGM插入”内容数据中的指令作为节目结构信息。
[0189] 例如,在显示预定网页上的新闻稿的服务器侦彳所创建的“新闻”片段包含用于“将 使用本地数据的具有三分钟内的持续时间的BGM插入”到“新闻”片段中的指令作为节目结 构信息。在这种情况下,节目回放应用21在存储在移动终端11中的本地数据中搜索具有 三分钟内的回放持续时间的音乐,并且在回放“新闻”片段时从听觉上输出该音乐作为BGM。
[0190] 脚本分析服务器13还可以进一步分析要分发作为内容数据的新闻稿,并将音乐 的特征(诸如,欢快、快乐和悲伤)作为参数。当选择音乐作为BGM时,节目回放应用21可 以基于特征值来在本地数据中搜索与参数相匹配的音乐,作为本地音乐的分析结果,并且 从听觉上输出音乐。替选地,可以在服务器侧作出用于插入音乐的指令或者节目回放应用 21可以根据用户的使用环境选择可以使人们快乐的音乐(诸如,快节奏音乐)作为在早晨 要回放的音乐或者选择可以使人的思维冷静的慢节奏音乐作为在睡觉前夜间要播放的音 乐。
[0191] 用于将音乐插入节目中的指令可以包括从本地数据选择音乐所基于的准则,诸如 音乐作品的数量、每个音乐作品的回放持续时间、全部音乐作品的回放持续时间。
[0192] 例如,使用本地数据广播音乐的“音乐”片段包含用于“将使用本地数据的每一个 均具有三分钟以上的持续时间(20分钟的持续时间)的五个音乐作品插入”到“音频”片段 中的指令作为节目结构信息。在这种情况下,节目回放应用21在存储在移动终端中的数据 中搜索每一个均具有三分钟以上的回放持续时间的五段音乐数据,布置五段音乐数据以使 得总回放持续时间变为20分钟,并且从听觉上输出所获得的各段音乐数据。
[0193] 如果不存在满足所指定的条件的音乐数据,则节目回放应用21可以提供“我们由 于没有音乐而将结束音乐片段”的语音输出。
[0194] 〈主页画面的第二具体示例〉
[0195] 接下来,将参照图19至图21描述主页画面的第二具体示例。
[0196] 在第二具体示例中,在回放节目之前以初始状态显示图I9所示的主页画面,并且 在回放节目期间显示图20和图21所示的主页画面。
[0197] 图19示出处于初始状态的节目“晨间拿铁”的主页画面301的示例。
[0198] 处于初始状态的图19所示的主页画面301呈现显示了节目的标题的标题显示部 311、允许画面转变至节目编辑画面71 (图5)的“编辑”按钮312以及用于开始节目的回放 的节目回放按钮313。
[0199] 处于初始状态的主页画面301还呈现节目概况显示部314、用于允许画面转变至 节目列表画面131 (图10)的节目列表跳转按钮315以及用于允许画面转变至设置画面 151 (图11)的设置跳转按钮316。节目概况显示部314呈现构成节目的片段的标题321以 及从其提供了各个片段的源(或者脚本源)322。
[0200] 当用户轻击图19所示的处于初始状态的主页画面301上的节目回放按钮313时, 画面转变至处于回放状态的图20或图21所示的主页画面331。
[0201] 将参照图20和图21描述处于回放状态的主页画面331。
[0202] 主页画面331具有节目标题条341、片段条342、话题条343和话题内容显示部 344 〇
[0203] 节目标题条341呈现节目标题和回放持续时间。片段条342以片段为单位提供整 个节目的显示。话题条343以话题为单位提供整个节目的显示。话题内容显示部344提供 每个话题的内容的显示。
[0204] 除了节目标题和回放持续时间之外,节目标题条341还呈现用于允许画面转变至 处于初始状态的主页画面301 (图19)的主页跳转画面361的主页跳转按钮361,以及用于 允许画面转变至节目编辑画面71 (图5)的“编辑”按钮362。
[0205] 在片段条342中,按回放的顺序从左至右顺序地布置与构成节目的多个片段相对 应的片段块363,并且与当前回放的片段相对应的一个片段块3似显示在屏幕上。在图20 中,显示对应于“头条”片段的片段块363,以及在图21中,显示对应于“音乐”片段的片段 块363。当“头条”片段的回放完成时,对应于“头条”片段的片段块363移动至左边(画面 之外),并且如图21所示,对应于“音乐”片段的片段块363移动至屏幕的中心。
[0206]片段条342中的每个片段块363呈现诸如“头条”和“音乐”的片段标题364以及 表示正回放的片段的进度(诸如当前回放的标题位于片段中的位置)的指示符365。在第 二具体示例中,每个片段标题364表示片段的风格(属性)。
[0207] 在话题条343中,话题块366按回放的顺序从左至右顺序地布置。每个话题块366 位于与话题所属的片段相对应的片段块363下面。话题块366呈现话题标题。
[0208] 在话题条343中,在水平方向上布置的多个话题块3明当中位于画面中心的话题 块3册对应于当前回放的话题。当前回放的话题的内容显示在话题内容显示部344中。 [0209] 在图2〇中,与话题标题“MZ,10月29日(GMT)举行’ Windowz Phone 9 ‘发布会,, 相对应的新闻稿显不在话题内谷显不部344中。在图21中,话题标题(音乐)“打击乐专 题”的封面照片显示在话题内容显示部344中。
[0210] 节目列表跳转按钮345、回放/停止按钮346、跳过按钮347和设置画面跳转按钮 348布置在话题内容显示部344下面。当用户希望画面转变至节目列表画面131 (图1〇) 时,操作节目列表跳转按钮345。播放/停止按钮346被操作用以开始或停止节目的回放。 跳过按钮347被操作用以将回放目标移动至下一话题或片段。当用户希望画面转变至设置 画面151 (图11)时,操作设置画面跳转按钮348。
[0211] 用户可以轻击主页画面331上的跳过按钮347以执行片段或话题的前向扫描,从 而回放所期望的片段或话题。
[0212] 用户还可以将片段条342或话题条343轻拂(或者触摸并滑动)至左边或右边以 显示片段块363或话题块366中所期望的一个,然后轻击话题块366,从而回放(跳转并回 放)期望话题。
[0213] 在图20所示的主页画面331上,从网站获取的新闻稿显示在话题内容显示部344 中,并且在回放话题期间也输出正显示的新闻稿的朗读语音。
[0214] 在话题内容显示部344中要显示从网站获取的内容的情况下,如图20所示,所显 不的文本可以包括至另一网页的链接,诸如“详情见WWW. nicrozoft. com/ja-jp/release. html”。在这种情况下,在直接朗读文本时逐一读出字母数字字符,并且这样的读出可能在 收听时没有意义。
[0215] 因此,节目回放应用21朗读链接部分、同时用链接目的地的报头中的标题替代链 接部分。因而,可以提供例如语音输出“‘发行Winsowz Phone 9’的链接目的地的详情”,并 且该语音输出可能使得所显示的文本的内容和在链接目的地处的内容更不可理解。
[0216] 替选地,节目回放应用21可以获取在链接目的地的网页,并且使用子画面来显示 所获取的网页以将其叠加在主页画面上。当用户轻击子画面时,可以启动网络浏览器以显 示链接目的地的网页。替选地,当用户轻击子画面时,可以添加在链接目的地处的网页的内 容作为下一个文本转语音内容(片段),并且在正显示在话题内容显示部344中的新闻稿的 朗读完成之后朗读该内容。替选地,两个附加图标(即,用于启动网络浏览器的图标以及用 于添加朗读的图标)可显示在链接部分附近以允许用户选择下一动作。
[0217] 以此方式,节目回放应用21还可以提供与当前回放的内容(片段或话题)相关联 的1目息的幽囬显不或i咅音输出。
[0218]另外,从网站获取的网页的文本可以包含短语‘‘第2页,,或“下一页”。在这种情况 下,节目回放应用21可以用下一页或所指定的页面上的标题替代短语“第2页”或“下一 页”,并且朗读标题。
[0219] 此外,从网站获取的网页的文本可以包含图形。在这种情况下,节目回放应用21 可以插入伴随图形的字幕并且朗读字幕。例如,在网页包含文本“今天举行的记者招待会 (图形1)”以及在网页上的图形1下面放置的读为“图形i :运动员冲击金牌”字幕的情况 下,节目回放应用21朗读“今天举行的记者招待会。在页面上示出“运动员冲击金牌的图 形”。这允许用户了解在网页上的文本中的图形或照片的内容而无需观看网页。
[0220]另外,从网站获取的网页上的文本可以包含表示注释的存在的标记(例如, “(*1)”),并且注释的内容可以在网页上的另一地方呈现。在这种情况下,节目回放应用21 在注释标记的位置处插入注释的内容,并且当朗读网页时朗读所插入的内容。
[0221]仅当用户没有在移动终端11上的前台显示节目回放应用21时或者当关断移动终 端11的画面显示时,可以朗读这样的替代项目。
[0222] 在图21所示的主页画面331上,存储在移动终端11的本地存储器中的具有标题 “打击乐专辑”的音乐的封面照片(缩略图像)显示在话题内容显示部344中。在回放话题 时,在朗读具有标题“打击乐专辑”的音乐的标题和艺术家名字之后是音乐输出(音频)。 [0223] 如果在朗读音乐的标题和艺术家名字时用了很长时间,则在开始回放音乐以前花 费一定量的时间,这可能损害用户感受。因而,节目回放应用21根据图22所示的用于确定 关于音乐的介绍文本的处理来确定要朗读的文本以介绍音乐。
[0224]〈用于确定关于音乐的朗读介绍文本的处理〉
[0225] 图22是用于确定关于音乐的朗读介绍文本的处理的流程图。
[0226] 在步骤S21中,节目回放应用21确定要回放的音乐的标题和艺术家名字的字符总 数是否超过预定的指定的字符数Lmax。
[0227] 如果在步骤S21中确定标题和艺术家名字的字符总数没有超过指定的字符数 LmaX,则处理进入步骤S22。然后,节目回放应用21确定要朗读的标题和艺术家名字这二 者,并且处理结束。
[0228] 如果在步骤S21中确定标题和艺术家名字的总字符数超过指定的字符数Lmax,则 处理进入步骤S23。然后,节目回放应用21确定标题的字符数是否超过指定的字符数Lmax。 [0229] 如果在步骤S23中确定标题的字符数未超过所指定的字符数Lmax,则处理进入步 骤S24。然后,节目回放应用21确定仅朗读标题,并且处理结束。
[0230] 如果在步骤S23中确定标题的字符数超过所指定的字符数Lmax,则处理进入步骤 S25。然后,节目回放应用21确定艺术家名字的字符数是否超过所指定的字符数Lmax。 [0231] 如果在步骤S25中确定艺术家名字的字符数未超过所指定的字符数Lmax,则处理 进入步骤S26。然后,节目回放应用21确定仅朗读艺术家名字,并且处理结束。
[0232] 如果在步骤S25中确定艺术家名字的字符数超过所指定的字符数Lmax,则处理进 入步骤S27。然后,节目回放应用21确定所准备的可用于任意类型的音乐的介绍文本(诸 如,“我们将进入我们的下一首歌曲”)以进行朗读,而不使用标题或艺术家名字。然后,处 理结束。
[0233] 通过上述处理确定用以介绍要回放的音乐的要朗读的文本,并且经由语音朗读该 文本。因而,即使音乐的标题和艺术家名字的字符数较大并且朗读标题和艺术家名字花费 较长时间,也不会削弱观看和收听节目的舒适度。
[0234] 在以上对根据本实施例的节目分发系统1的描述中,可以通过将包括存储在服务 器侧上的内容和本地内容(诸如,从预定网站收集的新闻稿、博客文章、推特简讯信息、音 乐、日程安排和新送达电子邮件)的各种内容信息进行合并来创建节目,并且回放该节目。
[0235] 甚至在具有相同结构的节目(或者具有相同结构的片段或话题)中,用户保持作 为本地数据的内容、用户的偏好信息、简档(诸如星座)、使用环境等可以根据将回放节目 的用户而不同。因而,使得要回放的节目的内容根据用户的不同而不同。因此,在本实施例 中的节目分发系统1可以允许用户创建节目以使得节目的内容(内容)动态地改变,并且 回放所创建的节目。
[0236] 移动终端的示例配置
[0237] 图23是示出执行节目回放应用21的移动终端11的整体硬件配置的框图。
[0238] 在图23中,通信天线401例如是内置天线,并且被配置为经由移动电话网络或公 共无线电通信网络进行呼叫或者收发电子邮件,下载各种应用程序,并且发送和接收无线 电波信号以与互联网等进行通信。
[0239] 天线电路4〇2包括天线切换装置、匹配电路、滤波电路等。发送和接收单元403经 由移动电话网络或公共无线电通信网络执行处理,诸如对发送信号和接收信号进行频率转 换、调制以及解调。
[0240] 扬声器416用于例如回放音乐、输出来电铃音、输出振铃器声音(或铃声)等。麦 克风417用于从移动终端11周围收集声音或者收集通过移动终端11发出的语音等。音频 信号处理单兀415包括用于扬声器416的放大器电路、用于麦克风417的放大器电路、用于 对从控制和计算单元404提供的经压缩和编码的视频数据进行扩展和解码的扩展和解码 电路、用于将经扩展和解码的数字音频数据转换成模拟音频信号的数模转换电路、用于将 从麦克风417输入的模拟音频信号转换成数字音频数据的模数转换电路、用于对数字音频 数据进行压缩和编码的压缩和编码电路等。
[0241]视频信号处理单元411包括用于对从控制和计算单元404提供的经压缩和编码的 视频数据进行扩展和解码的扩展和解码电路、用于允许在触摸面板显示器413上显示经扩 展和解码的数字视频、以下所述的数字广播接收模块409接收到的数字广播视频的显示面 板驱动电路等。
[0242]另外,视频信号处理单元411生成显示数据以显示从控制和计算单元404提供的 桌面图像或各种菜单图像、与触摸面板显示器413上的位置相对应的虚拟触摸区域图像 等,并且允许在触摸面板显示器413上显示这些图像。
[0243]触摸面板显不器413具有能够检测用户执行的输入操作的触摸传感器单元。触摸 面板信号处理单元412测量触摸面板显示器上的检测触摸位置、触摸轨迹、触摸持续时间、 关于触摸的时间间隔等,并且将所测量的数据作为检测触摸数据发送到控制和计算单元 404。用户可以用用户的手指以及用诸如附接到移动终端u的记录笔的任意其他根据来在 触摸面板显示器413的显示屏上输入任意触摸输入。触摸面板显示器413和触摸面板信号 处理单元412被配置为支持多触摸手势。
[0244] 键操作单元420包括设置在移动终端11的壳体上的硬键、其外围电路等。键操作 单元420将用户对硬键的按压转换成电信号,对操作输入信号进行放大,执行模数转换,并 将在模数转换之后所获得的操作输入数据发送到控制和计算单元404。
[0245] 外部输入/输出终端单元419包括用于经由例如线缆进行数据通信的线缆连接连 接器和外部接口电路、用于经由电力线缆等对内部电池进行充电的其充电终端和充电接口 电路等。包括上述的节目回放应用21的各种应用程序可经由外部输入/输出终端单元419 获取。
[0246] 外部存储器接口(I/F) 410包括通过其可移动地插入诸如外部存储的存储介质的 外部存储器插槽、外部存储器数据通信接口电路等。包括节目回放应用21的各种应用程序 可经由插入外部存储器I/F单元410中的存储介质410A (诸如外部存储器)获取。
[0247] 近场通信模块408包括用于接收无线LAN、蓝牙(注册商标)等的近场无线电波的 通信天线以及近场通信电路。包括节目回放应用21的各种应用程序可经由近场通信模块 408获取。
[0248] 数字广播接收模块409包括用于接收数字电视广播、数字无线电广播和任意其他 期望广播的天线以及调谐器。数字广播接收模块409被配置为能够接收一个频道上的数字 广播,并且还同时接收多个频道上的数字广播。数字广播接收模块409还被配置为能够接 收关于数字广播所复用的数据。可以对数字广播接收模块409接收到的数字广播数据进行 处理(诸如通过例如控制和计算单元404压缩、然后存储在(或记录在)存储器单元405 中等)。
[0249] 摄像头单元414包括用于捕获静止图像或运动图像的成像元件、光学系统等、其 外围电路、用于驱动灯以发射辅助光来进行成像的电路等。摄像头单元414捕获的静止图 像数据或运动图像数据作为预览视频数据被发送到视频信号处理单元411。因而,当摄像 头单元414要捕获图像时,在触摸面板显示器413上显示预览视频。另外,当要记录摄像头 单元414捕获的静止图像数据或运动图像数据时,将捕获的静止图像数据或运动图像数据 发送到控制和计算单元404并且在其存储在存储器单元405或连接到外部存储器I/F单元 410的存储介质410A之前对其进行压缩。
[0250] 非接触式通信模块4〇7经由非接触式通信天线执行用于例如射频标识(RFID)、非 接触式1C卡等的非接触式通信。
[0251] 全球定位系统(GPS)模块406具有GPS天线,并且使用从GPS大地测量卫星测量 系统发送的GPS信号来确定移动终端11的当前位置的纬度和经度。从GPS模块406获得 的GPS数据(表示纬度和经度的信息)被发送到控制和计算单元404。因而,控制和计算单 元404可辨识移动终端11的当前位置、移动等。
[0252] 传感器单元418包括各种检测传感器(诸如用于检测移动终端11的状态的终端 状态检测传感器)及其外围电路。传感器单元418可以包括例如倾斜度传感器、加速度传 感器、方位角传感器、温度传感器、湿度传感器和照明强度传感器。传感器单元418获得的 检测信号被发送到控制和计算单元404。因此,控制和计算单元404可以辨识移动终端11 的状态(诸如,倾斜度、加速度、方位角、温度、湿度和照明强度)。
[0253] 存储器单元405包括布置在移动终端11中的内置存储器、卡式可移动存储器等。 卡式可移动存储器的示例可以包括存储所谓的用户标识模块(S頂)信息等的卡。内置存储 器包括只读存储器(ROM)以及随机存取存储器(RAM)。ROM存储操作系统(OS)、用于允许控 制和计算单元404控制各个单元的控制程序、各种初始设置值、词典数据、短语预测/转换 字典数据、各种音频数据、包括节目回放应用21的各种应用程序等。ROM包括NAND型闪存 或可重写ROM (诸如,电可擦除可编程只读存储器(EEPR0M)),并且被配置为能够存储电子 邮件数据、电话目录或电子邮件地址薄数据、静止图像或运动图像内容的数据、其他各种用 户设置值等。RAM用作当控制和计算单元404执行各种数据处理时所使用的工作区或缓冲 区,并且在任意适当时间存储数据。
[0254] 控制和计算单元404由中央处理单元(CPU)构成,并且控制各个单元,诸如发送和 接收单元403、视频信号处理单元411、音频信号处理单元415、GPS模块406、非接触式通信 模块407、近场通信模块408、数字广播接收模块409、外部存储器I/F单元410、摄像头单元 414、传感器单元418、外部输入/输出终端单元419、键操作单元420和触摸面板信号处理 单元似1,以在需要时执行各种计算。另外,控制和计算单元404执行存储在存储器单元405 中的各种应用程序,包括节目回放应用21。
[0255] 另外,移动终端11包括典型的移动终端11中所包括的构成元件,诸如测量时间段 或时间点的时钟单元、将电力提供至各个单元的电池以及控制要提供的电力的电力管理集 成电路(1C)。
[0256] 服务器装置的示例配置
[0257] 图24是示出每个上述服务器装置(诸如,用户信息管理服务器12、脚本分析服务 器13、语音合成服务器15和媒体文件服务器16)的硬件的示例配置的框图。
[0258] 在服务器装置中,CPU 441、ROM 442和RAM 443经由总线444彼此连接。
[0259] 输入/输出接口 445还连接到总线444。输入单元446、输出单元447、存储单元 448、通信单元449和驱动器450也连接到输入/输出接口 445。
[0260] 输入单元446包括键盘、鼠标、麦克风等。输出单元447包括显示器、扬声器等。存 储单元448包括硬盘、非易失性存储器等。通信单元449包括网络接口等。驱动器450驱 动可移动的记录介质451,诸如磁盘、光盘、磁光盘或半导体存储器。
[0261] 在具有上述配置的服务器装置中,CPU 441经由输入/输出接口 4妨和总线444将 例如存储在存储单元448中的程序加载到RAM 443中,并且执行程序,从而执行上述一系列 处理。
[0262] 在服务器装置中,可通过将可移动记录介质451放置在驱动器450中来经由输入/ 输出接口 445将程序安装到存储单元448中。程序可以经由有线或无线传输介质(诸如, 局域网、互联网或数字卫星广播)由通信单元449接收,并且可以安装到存储单元448中。 程序还可以预先安装在ROM 442或存储单元448中。
[0263] 服务器装置的CPU 441要执行的每个程序以及节目回放应用21可以是按本文中 所述的顺序以时序方式执行处理的程序,或者可以是并行地或者在诸如调用时的需要时 候执行处理的程序。
[0264] 在本说明书中,术语“系统,,是指一组构成元件(设备、模块(部件)等),而与所 有构成元件是否容纳在同一壳体中无关。因而,容纳在分离的壳体中并且经由网络连接的 多个设备以及包括容纳在单个壳体中的多个模块的单个设备可以被定义为系统。
[0265] 本技术的实施例不限于上述实施例,并且可以在背离本技术的范围的情况下进行 各种改变。
[0266] 例如,可以组合使用多个实施例和上述的功能中的全部或部分。
[0267] 例如,本技术的实施例可以提供多个设备经由网络彼此协作地共享并处理单个功 能的云计算配置。
[0268] 另外,上述流程图中所示的步骤可以由单个设备执行或者可以由多个设备共享并 执行。
[0269] 另外,如果单个步骤包括多个处理,则单个步骤中包括的处理可由单个设备执行, 或者可由多个设备共享并执行。
[0270] 本技术的实施例还可以提供以下配置。
[0271] ⑴一种回放控制设备,包括:
[0272] 回放控制器,被配置为控制第一内容和第二内容的回放,所述第一内容用于输出 使用语音合成处理基于文本信息而生成的第一声音,所述第二内容用于输出未使用所述 语音合成处理生成的第二声音,其中所述回放控制器使得要回放的内容的属性显示在屏幕 上,所述属性表示该内容是否用以输出使用语音合成处理基于文本信息而生成的声音。
[0273] (2)根据⑴所述的回放控制设备,其中,所述回放控制器还使得以突出状态显示 与该时间输出的声音相关联的显不部分。
[0274] (3)根据⑴所述的回放控制设备,其中,所述回放控制器还根据在生成声音时所 使用的文本信息的内容来改变作为所述声音的一部分的朗读者或背景音乐。
[0275] (4)根据⑴所述的回放控制设备,其中,用于使用所述语音合成处理基于所述文 本信息生成声音的文本转语音功能被配置为开启或关闭,以及
[0276] 所述回放控制器使得根据对于开启或关闭所述文本转语音功能的设置来朗读所 述第一内容。
[0277] (5)根据⑴所述的回放控制设备,其中,要朗读的所述第一内容的文本信息的一 部分根据用户的偏好信息或简档随用户不同而不同。
[0278] (6)根据⑶所述的回放控制设备,其中,所述内容的属性还表示该内容是要使用 所述语音合成处理来朗读还是通过回放音乐的音频数据而经由音频输出。
[0279] (7)根据(1)所述的回放控制设备,其中,所述内容的属性还表示该内容是否要在 所述回放控制设备中经历闭合处理。
[0280] (8)根据(1)所述的回放控制设备,其中,所述内容的属性还表示该内容是否是仅 使用所述回放控制设备中的本地数据的内容。
[0281] (9)根据⑴所述的回放控制设备,其中,所述内容是使用外部服务器中的内容数 据的内容,并且所述回放控制器还执行控制,以利用使用所述回放控制设备中的本地数据 的内容替换使用外部服务器中的内容数据的内容。
[0282] (10)根据⑴所述的回放控制设备,其中,所述回放控制器从外部服务器获取作 为所述内容的数据的内容数据,并且使得通过将从所述外部服务器获取的内容数据与所述 回放控制设备中的内容数据相合并来回放所述内容,所获取的内容数据包括用于将所述回 放控制设备中的内容数据并入所获取的内容数据中的指令作为节目结构信息。
[0283] (11)根据⑴所述的回放控制设备,其中,所述第一内容的文本信息包括链接部 分,并且所述回放控制器利用包括在从所述链接部分链接的链接目的地中的标题替换所述 链接部分,并且朗读替换后的标题。
[0284] (12)根据(11)所述的回放控制设备,其中,所述第一内容的文本信息包括链接 部分,并且所述回放控制器使得在子画面上显示由所述链接部分标识的链接目的地处的网 页。
[0285] (13)根据⑴所述的回放控制设备,其中,
[0286] 所述内容包括多个片段,并且
[0287] 所述回放控制器使得在所述屏幕上显示所述内容的多个片段当中要回放的片段 的属性。
[0288] (14)根据⑴所述的回放控制设备,其中,
[0289] 所述内容包括多个片段,并且
[0290]当要回放所述内容的多个片段当中的片段时,所述回放控制器使得该片段的属性 经由音频输出。
[0291] (15) —种回放控制方法,包括:
[0292] 控制第一内容和第二内容的回放,所述第一内容用于输出使用语音合成处理基于 文本信息而生成的第一声音,所述第二内容用于输出未使用所述语音合成处理生成的第二 声音;以及
[0293] 在屏幕上显示要回放的内容的属性,所述属性表示该内容是否用以输出使用语音 合成处理基于文本信息生成的声音。
[0294] (16) —种程序,用于使得计算机执行包括如下步骤的处理:
[0295] 控制第一内容和第二内容的回放,所述第一内容用于输出使用语音合成处理基于 文本信息而生成的第一声音,所述第二内容用于输出未使用所述语音合成处理生成的第二 声音;以及
[0296]在屏幕上显示要回放的内容的属性,所述属性表示所述内容是否用以输出使用语 音合成处理基于文本信息生成的声音。
[0297] 本公开包含与2012年4月3日提交的美国临时申请第61/619,677号和2012年 11月28日提交的美国专利申请第13/687,844号中所公开的主题相关的主题,其全部内容 通过引用合并于此。
[0298]本领域的技术人员应理解,在所附权利要求或其等同方案的范围内,根据设计要 求和其它因素,可进行各种修改、组合、子组合和变更。
[0299] 附图标记列表
[0300] 1 节目分发系统
[0301] 11移动终端
[0302] 21节目回放应用
[0303] 22通信控制器
[0304] 23显示控制器
[0305] 24语音控制器

Claims (14)

1. 一种回放控制设备,包括: 电路,被配置为控制用户定义的节目的连续回放,所述节目包括第一内容、第二内容和 第三内容,所述第一内容包括使用语音合成处理基于从第一源接收到的文本信息而生成的 第一声音,所述第二内容包括使用语音合成处理、基于从不同于所述第一源的第二源接收 到的文本信息而生成的第二声音,而所述第三内容包括不是使用语音合成处理生成的第三 声音, 其中,所述电路显示要回放的内容的属性,所述属性表示该内容是否包括使用语音合 成处理基于文本信息而生成的声音, 其中,在所述节目包括多个片段的情况下,所述电路使得在屏幕上显示所述节目的多 个片段当中要回放的片段的属性。
2. 根据权利要求1所述的回放控制设备,其中,所述电路还使得以突出状态显示与当 前输出的声音相关联的显示部分。
3. 根据权利要求1所述的回放控制设备,其中,所述电路还根据在生成声音时所使用 的文本信息的内容来改变作为该声音的一部分的朗读者或背景音乐。
4. 根据权利要求1所述的回放控制设备,其中,用于使用语音合成处理基于文本信息 生成声音的文本转语音功能被配置为开启或关闭,以及 所述电路使得根据对于开启或关闭所述文本转语音功能的设置来朗读所述第一内容。
5. 根据权利要求1所述的回放控制设备,其中,要朗读的所述第一内容的文本信息的 一部分根据用户的偏好信息或简档随用户不同而不同。
6. 根据权利要求1所述的回放控制设备,其中,所述内容的属性还表示该内容是要使 用语音合成处理来朗读还是通过回放音乐的音频数据而经由音频输出。
7. 根据权利要求1所述的回放控制设备,其中,所述内容的属性还表示该内容是否要 在所述回放控制设备中经历闭合处理。
8. 根据权利要求1所述的回放控制设备,其中,所述内容的属性还表示该内容是否是 仅使用所述回放控制设备中的本地数据的内容。
9. 根据权利要求1所述的回放控制设备,其中,所述内容是使用外部服务器中的内容 数据的内容,并且所述电路还执行控制,以利用使用所述回放控制设备中的本地数据的内 容替换使用外部服务器中的内容数据的内容。
10. 根据权利要求1所述的回放控制设备,其中,所述电路从外部服务器获取作为所述 内容的数据的内容数据,并且使得通过将从所述外部服务器获取的内容数据与所述回放控 制设备中的内容数据相合并来回放所述内容,所获取的内容数据包括用于将所述回放控制 设备中的内容数据并入所获取的内容数据中的指令作为节目结构信息。
11. 根据权利要求1所述的回放控制设备,其中,所述第一内容的文本信息包括链接部 分,并且所述电路利用包括在从所述链接部分链接的链接目的地中的标题替换所述链接部 分,并且朗读替换后的标题。
12. 根据权利要求1所述的回放控制设备,其中,所述第一内容的文本信息包括链接部 分,并且所述电路使得在子画面上显示由所述链接部分标识的链接目的地处的网页。
13. 根据权利要求1所述的回放控制设备,其中, 当要回放所述节目的多个片段当中的片段时,所述电路使得该片段的属性经由音频输 出。
14. 一种回放控制方法,包括: 控制用户定义的节目的连续回放,所述节目包括第一内容、第二内容和第三内容,所述 第一内容包括使用语音合成处理基于从第一源接收到的文本信息而生成的第一声音,所述 第二内容包括使用语音合成处理、基于从不同于所述第一源的第二源接收到的文本信息而 生成的第二声音,而所述第三内容包括不是使用语音合成处理生成的第三声音;以及 显示要回放的内容的属性,所述属性表示该内容是否包括使用语音合成处理基于文本 信息生成的声音, 其中,在所述节目包括多个片段的情况下,显示所述节目的多个片段当中要回放的片 段的属性。
CN201380017151.1A 2012-04-03 2013-03-27 回放控制设备、回放控制方法 Active CN104205209B9 (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
US201261619677P true 2012-04-03 2012-04-03
US61/619,677 2012-04-03
US13/687,844 US9159313B2 (en) 2012-04-03 2012-11-28 Playback control apparatus, playback control method, and medium for playing a program including segments generated using speech synthesis and segments not generated using speech synthesis
US13/687,844 2012-11-28
PCT/JP2013/002073 WO2013150743A1 (en) 2012-04-03 2013-03-27 Playback control apparatus, playback control method, and program

Publications (3)

Publication Number Publication Date
CN104205209A CN104205209A (zh) 2014-12-10
CN104205209B CN104205209B (zh) 2018-02-02
CN104205209B9 true CN104205209B9 (zh) 2018-07-31

Family

ID=49236222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380017151.1A Active CN104205209B9 (zh) 2012-04-03 2013-03-27 回放控制设备、回放控制方法

Country Status (5)

Country Link
US (2) US9159313B2 (zh)
EP (1) EP2834810B1 (zh)
JP (1) JP6065019B2 (zh)
CN (1) CN104205209B9 (zh)
WO (1) WO2013150743A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8948734B2 (en) 2012-10-05 2015-02-03 Cerner Innovation, Inc. Attaching patient context to a call history associated with voice communication
US10275570B2 (en) 2012-12-31 2019-04-30 Cerner Innovation, Inc. Closed loop alert management
US9185202B2 (en) 2012-12-31 2015-11-10 Cerner Innovation, Inc. Alert management utilizing mobile devices
US9413795B2 (en) * 2013-07-18 2016-08-09 Facebook, Inc. Method and system for providing media action buttons for viewing media content
US9230542B2 (en) * 2014-04-01 2016-01-05 Zoom International S.R.O. Language-independent, non-semantic speech analytics
JP6628217B2 (ja) * 2015-04-22 2020-01-08 株式会社プロフィールド 音声再生装置、音声再生方法、およびプログラム
US10607728B2 (en) 2015-10-06 2020-03-31 Cerner Innovation, Inc. Alert optimizer
US10037411B2 (en) 2015-12-30 2018-07-31 Cerner Innovation, Inc. Intelligent alert suppression
CN105872811A (zh) * 2015-12-31 2016-08-17 乐视网信息技术(北京)股份有限公司 一种视频关联音乐短片的处理方法以及视频播放装置
CN105959271A (zh) * 2016-04-25 2016-09-21 乐视控股(北京)有限公司 一种文字内容信息的语音转换方法、播放方法及装置
JP6289563B2 (ja) * 2016-08-19 2018-03-07 ヤフー株式会社 ナビゲーションプログラム、広告管理サーバ、および広告管理方法
US10957445B2 (en) 2017-10-05 2021-03-23 Hill-Rom Services, Inc. Caregiver and staff information system
USD897361S1 (en) * 2018-05-18 2020-09-29 Carefusion 303, Inc. Display screen of a modular infusion device with transitional graphical user interface
USD921017S1 (en) * 2018-05-18 2021-06-01 Carefusion 303, Inc. Display screen with graphical user interface for a modular device
CN108777747B (zh) * 2018-08-09 2021-02-26 瑞声科技(新加坡)有限公司 一种振动方法、移动终端和计算机可读存储介质
USD895656S1 (en) * 2018-12-26 2020-09-08 Michael Allen Display panel portion with a computer-generated icon
WO2021111872A1 (ja) * 2019-12-02 2021-06-10 ソニーグループ株式会社 コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体
WO2021111906A1 (ja) * 2019-12-06 2021-06-10 ソニーグループ株式会社 コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1341155A2 (en) * 2002-02-15 2003-09-03 Canon Kabushiki Kaisha Information processing apparatus and method with speech synthesis function
CN1658566A (zh) * 2004-02-06 2005-08-24 微软公司 连接的时钟收音机

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11272442A (ja) * 1998-03-24 1999-10-08 Canon Inc 音声合成装置およびプログラムを記憶した媒体
JP2001054076A (ja) * 1999-08-17 2001-02-23 Matsushita Electric Ind Co Ltd 番組情報表示装置及びプログラム記録媒体
US6810379B1 (en) * 2000-04-24 2004-10-26 Sensory, Inc. Client/server architecture for text-to-speech synthesis
US7043432B2 (en) * 2001-08-29 2006-05-09 International Business Machines Corporation Method and system for text-to-speech caching
NO316480B1 (no) * 2001-11-15 2004-01-26 Forinnova As Fremgangsmåte og system for tekstuell granskning og oppdagelse
JP3733322B2 (ja) 2001-11-21 2006-01-11 キヤノン株式会社 マルチモーダル文書受信装置及びマルチモーダル文書送信装置、マルチモーダル文書送受信システム及びそれらの制御方法、プログラム
US7072477B1 (en) * 2002-07-09 2006-07-04 Apple Computer, Inc. Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file
US20040260551A1 (en) * 2003-06-19 2004-12-23 International Business Machines Corporation System and method for configuring voice readers using semantic analysis
US20060008256A1 (en) * 2003-10-01 2006-01-12 Khedouri Robert K Audio visual player apparatus and system and method of content distribution using the same
US8146156B2 (en) * 2004-04-01 2012-03-27 Google Inc. Archive of text captures from rendered documents
US8442331B2 (en) * 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US8620083B2 (en) * 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US8874504B2 (en) * 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US20110096174A1 (en) * 2006-02-28 2011-04-28 King Martin T Accessing resources based on capturing information from a rendered document
JP2006030384A (ja) 2004-07-13 2006-02-02 Sony Corp テキスト音声合成装置及びテキスト音声合成方法
US20080189099A1 (en) * 2005-01-12 2008-08-07 Howard Friedman Customizable Delivery of Audio Information
CN1991826A (zh) * 2005-12-27 2007-07-04 鸿富锦精密工业(深圳)有限公司 电子书检索系统及方法
US20070260460A1 (en) 2006-05-05 2007-11-08 Hyatt Edward C Method and system for announcing audio and video content to a user of a mobile radio terminal
JP4169087B1 (ja) * 2007-07-02 2008-10-22 オンキヨー株式会社 コンテンツタイプ登録装置及びコンテンツタイプ登録プログラム
JP4384683B2 (ja) * 2007-08-22 2009-12-16 株式会社コナミデジタルエンタテインメント 映像再生装置、映像再生装置の制御方法及びプログラム
US20090204243A1 (en) * 2008-01-09 2009-08-13 8 Figure, Llc Method and apparatus for creating customized text-to-speech podcasts and videos incorporating associated media
JP5095455B2 (ja) * 2008-03-17 2012-12-12 シャープ株式会社 コンテンツ再生装置、コンテンツ再生方法、プログラム、および記録媒体
JP2009265279A (ja) 2008-04-23 2009-11-12 Sony Ericsson Mobilecommunications Japan Inc 音声合成装置、音声合成方法、音声合成プログラム、携帯情報端末、および音声合成システム
US8712776B2 (en) * 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US20100082328A1 (en) * 2008-09-29 2010-04-01 Apple Inc. Systems and methods for speech preprocessing in text to speech synthesis
JP2010160316A (ja) 2009-01-08 2010-07-22 Alpine Electronics Inc 情報処理装置及びテキスト読み上げ方法
US8325974B1 (en) * 2009-03-31 2012-12-04 Amazon Technologies Inc. Recognition of characters and their significance within written works
US8150695B1 (en) * 2009-06-18 2012-04-03 Amazon Technologies, Inc. Presentation of written works based on character identities and attributes
US8451238B2 (en) * 2009-09-02 2013-05-28 Amazon Technologies, Inc. Touch-screen user interface
US8392186B2 (en) * 2010-05-18 2013-03-05 K-Nfb Reading Technology, Inc. Audio synchronization for document narration with user-selected playback
JP2012003610A (ja) 2010-06-18 2012-01-05 Fujitsu Toshiba Mobile Communications Ltd 情報処理装置
US9104670B2 (en) * 2010-07-21 2015-08-11 Apple Inc. Customized search or acquisition of digital media assets
US8849676B2 (en) * 2012-03-29 2014-09-30 Audible, Inc. Content customization
JP6109927B2 (ja) * 2012-05-04 2017-04-05 カオニックス ラブス リミテッド ライアビリティ カンパニー 源信号分離のためのシステム及び方法
US9075760B2 (en) * 2012-05-07 2015-07-07 Audible, Inc. Narration settings distribution for content customization
US9378739B2 (en) * 2013-03-13 2016-06-28 Nuance Communications, Inc. Identifying corresponding positions in different representations of a textual work
US9368115B2 (en) * 2013-03-13 2016-06-14 Nuance Communications, Inc. Identifying corresponding positions in different representations of a textual work
US9613641B2 (en) * 2013-03-13 2017-04-04 Nuance Communications, Inc. Identifying corresponding positions in different representations of a textual work
CA2904359A1 (en) * 2013-03-15 2014-09-25 JIBO, Inc. Apparatus and methods for providing a persistent companion device
US20140357450A1 (en) * 2013-05-31 2014-12-04 Jean Sylvain Exercise devices and methods of operation thereof
US9355094B2 (en) * 2013-08-14 2016-05-31 Google Inc. Motion responsive user interface for realtime language translation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1341155A2 (en) * 2002-02-15 2003-09-03 Canon Kabushiki Kaisha Information processing apparatus and method with speech synthesis function
CN1658566A (zh) * 2004-02-06 2005-08-24 微软公司 连接的时钟收音机

Also Published As

Publication number Publication date
US20150248272A1 (en) 2015-09-03
US9159313B2 (en) 2015-10-13
EP2834810A1 (en) 2015-02-11
CN104205209B (zh) 2018-02-02
EP2834810B1 (en) 2017-05-03
US20130262118A1 (en) 2013-10-03
EP2834810A4 (en) 2015-09-30
CN104205209A (zh) 2014-12-10
WO2013150743A1 (en) 2013-10-10
JP6065019B2 (ja) 2017-01-25
JP2015518171A (ja) 2015-06-25
US9576569B2 (en) 2017-02-21

Similar Documents

Publication Publication Date Title
CN104205209B9 (zh) 回放控制设备、回放控制方法
US20140136979A1 (en) Information processing apparatus, information processing method, information processing program and recording medium for storing the program
CN103988496A (zh) 用于从多个源创建合成视频的方法和装置
CN104038774B (zh) 生成铃声文件的方法及装置
TWI522823B (zh) 用於跨多種裝置之智慧型媒體展示技術
US10333876B2 (en) Method and system for communicating between a sender and a recipient via a personalized message including an audio clip extracted from a pre-existing recording
US20190306100A1 (en) Method and system for communicating between a sender and a recipient via a personalized message including an audio clip extracted from a pre-existing recording
CN110267113A (zh) 视频文件加工方法、系统、介质和电子设备
JP2012178028A (ja) アルバム作成装置、アルバム作成装置の制御方法、及びプログラム
CN109117233A (zh) 用于处理信息的方法和装置
CN103200451A (zh) 电子设备和音频输出方法
JP5463990B2 (ja) 通信システムおよび議事録作成プログラム
JP5964722B2 (ja) カラオケシステム
JP2008523759A (ja) 映像メッセージを合成する方法及びシステム
CN110324718A (zh) 音视频生成方法、装置、电子设备及可读介质
CN103136277A (zh) 多媒体文件播放方法与电子装置
CN106055671A (zh) 一种多媒体数据处理方法及其设备
CN104079948B (zh) 生成铃声文件的方法及装置
KR101554662B1 (ko) 디지털 오디오 데이터에 대한 코드 제공 방법 및 이에 의한 사용자 단말
JP2009017417A (ja) コンテンツ配信サーバ、コンテンツ配信プログラム、及びコンテンツ配信システム
US20200137011A1 (en) Method and system for communicating between a sender and a recipient via a personalized message including an audio clip extracted from a pre-existing recording
WO2019047850A1 (zh) 标识的显示方法和装置、请求的响应方法和装置
JP5981867B2 (ja) カラオケシステム
CN107317817A (zh) 生成索引文件的方法、标识用户发言状态的方法和终端
CN110781417A (zh) 一种基于二维码的朗读作品传播方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CI03 Correction of invention patent
CI03 Correction of invention patent

Correction item: Drawings

Correct: Zheng Que

False: Cuo Wu

Number: 05-02

Page: Quan Wen

Volume: 34