CN104205209B

CN104205209B - 回放控制设备、回放控制方法

Info

Publication number: CN104205209B
Application number: CN201380017151.1A
Authority: CN
Inventors: 佐伯高明; 广濑幸由
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2012-04-03
Filing date: 2013-03-27
Publication date: 2018-02-02
Anticipated expiration: 2033-03-27
Also published as: CN104205209B9; EP2834810B1; EP2834810A1; EP2834810A4; US9159313B2; JP2015518171A; US20130262118A1; WO2013150743A1; JP6065019B2; US20150248272A1; CN104205209A; US9576569B2

Abstract

一种回放控制设备包括：回放控制器，被配置为控制对第一内容和第二内容的回放。第一内容用于输出使用语音合成处理、基于文本信息而生成的第一声音。第二内容用于输出未使用语音合成处理生成的第二声音，回放控制器使得要回放的内容的属性显示在屏幕上，该属性表示内容是否用以输出使用语音合成处理基于文本信息而生成的声音。

Description

回放控制设备、回放控制方法

技术领域

本技术涉及回放控制设备、回放控制方法和程序，更具体地，涉及可以通过使用文本转语音功能来提供新娱乐形式的回放控制设备、回放控制方法和程序。

背景技术

近年来，将数字化音频数据累积在高级移动电话(例如，智能电话)、平板式终端等中并在奔波在外或出门在外时播放所累积的音频数据以享受音乐的用户的数量已增加。

智能电话、平板式终端等也具有允许用户观看期望的网页的网络连接功能。然而，在难以观看屏幕的状况下(诸如在移动时)，该功能难以使用。

迄今为止，已具有语音合成系统(“文本转语音”功能)，其通过使用语音合成程序来提供诸如接收到的电子邮件的文本信息和网站上的文本(例如，新闻和天气信息)的语音输出(例如，参见PTL1)。

引用列表

专利文献

PTL1:日本未审查专利申请公布第2009-265279号

发明内容

技术问题

然而，在现有技术中，文本转语音功能针对指定为朗读的一种特定类型的项(诸如新闻或接收到的电子邮件)，并且难以朗读用户期望的多种类型的项或者合并要朗读的项与不要朗读的项。

因此，期望通过使用文本转语音功能来提供新的娱乐形式。

针对问题的解决方案

在本技术的一个实施例中，一种回放控制设备，包括：回放控制器，被配置为控制第一内容和第二内容的回放，所述第一内容用于输出使用语音合成处理基于文本信息而生成的第一声音，所述第二内容用于输出未使用所述语音合成处理生成的第二声音，其中所述回放控制器使得要回放的内容的属性显示在屏幕上，所述属性表示该内容是否用以输出使用语音合成处理基于文本信息而生成的声音。

在本技术的另一实施例中，一种回放控制方法，包括：控制第一内容和第二内容的回放，所述第一内容用于输出使用语音合成处理基于文本信息而生成的第一声音，所述第二内容用于输出未使用所述语音合成处理生成的第二声音；以及在屏幕上显示要回放的内容的属性，所述属性表示该内容是否用以输出使用语音合成处理基于文本信息生成的声音。

在本技术的又一实施例中，一种程序，用于使得计算机执行包括如下步骤的处理：控制第一内容和第二内容的回放，所述第一内容用于输出使用语音合成处理基于文本信息而生成的第一声音，所述第二内容用于输出未使用所述语音合成处理生成的第二声音；以及在屏幕上显示要回放的内容的属性，所述属性表示所述内容是否用以输出使用语音合成处理基于文本信息生成的声音。

在本技术的实施例中，控制对第一内容和第二内容的回放，该第一内容用于输出使用语音合成处理基于文本信息而生成的第一声音，第二内容用于输出未使用语音合成处理生成的第二声音；以及在屏幕上显示要回放的内容的属性，该属性表示内容是否用以输出使用语音合成处理基于文本信息而生成的声音。

可以通过经由传输介质传送或者记录在记录介质上来提供该程序。

回放控制设备可以是独立的设备或者可以是包括在单个设备中的内部块。

发明的有益效果

本技术的实施例可以通过使用文本转语音功能来提供新的娱乐形式。

附图说明

[图1]图1是示出根据本技术的实施例的节目分发系统的示例配置的图。

[图2]图2是示出用作用户可观看和收听的内容的节目的结构的图。

[图3]图3是示出登录画面的示例画面配置的图。

[图4]图4是示出主页画面的示例画面配置的图。

[图5]图5是示出节目编辑画面的示例画面配置的图。

[图6]图6是示出附加片段(segment)风格选择画面的示例画面配置的图。

[图7]图7是示出附加片段选择画面的示例画面配置的图。

[图8]图8是示出回放历史画面的示例画面配置的图。

[图9]图9是示出菜单画面的示例画面配置的图。

[图10]图10是示出节目列表画面的示例画面配置的图。

[图11]图11是示出画面的画面转变序列的图。

[图12]图12是示出节目回放处理的流程图。

[图13]图13是示出主页画面的第一具体示例的图。

[图14]图14是示出主页画面的第一具体示例的图。

[图15]图15是示出主页画面的第一具体示例的图。

[图16]图16是示出主页画面的第一具体示例的图。

[图17]图17是示出主页画面的第一具体示例的图。

[图18]图18是示出节目“晨间拿铁(Morning Latte)”的整个结构的图。

[图19]图19是示出主页画面的第二具体示例的图。

[图20]图20是示出主页画面的第二具体示例的图。

[图21]图21是示出主页画面的第二具体示例的图。

[图22]图22是示出用于确定关于音乐的朗读的介绍文本的处理的流程图。

[图23]图23是示出移动终端的硬件配置的框图。

[图24]图24是示出服务器装置的硬件配置的框图。

具体实施方式

<节目分发系统的示例配置>

图1示出了根据本技术的实施例的节目分发系统1的示例配置。

图1所示的节目分发系统1是如下系统，其提供用于向用户的移动终端11分发节目(内容)的服务，该节目是通过将作为经由网站上的文本(诸如，新闻、天气和推特简讯(或推特))提供的信息的各种文本信息与诸如音乐的音频数据合并而创建的。当在移动终端11上回放节目时，在屏幕上显示构成节目的信息(诸如，新闻、天气和推特简讯)，并且还通过使用文本转语音功能(语音合成处理)将该信息输出为语音。因而，用户能够通过经由语音收听该信息以及通过观看移动终端11的屏幕上的信息来享受在某一网站上提供的信息。

在节目分发系统1中，可以将由节目分发公司创建的节目分发给用户(的移动终端11)。另外，节目分发系统1可以允许用户根据其偏好创建节目，以观看并收听节目，并且将节目提供(或分发)给其他用户。

在图1所示的节目分发系统1中，用户操作的移动终端11、节目分发公司管理的用户信息管理服务器12、脚本(script)分析服务器13、语音合成服务器15和媒体文件服务器16经由网络17-1(诸如，有线或无线局域网(LAN)、移动电话网络、公共无线电通信网络或互联网)彼此连接。

脚本分析服务器13还经由网络17-2(诸如，有线或无线LAN、移动电话网络、公共无线电通信网络或互联网)连接到多个(在所示的示例中为N)脚本源服务器14-1至14-N。网络17-1和17-2可以是共同的(即，相同的)或不同的。

移动终端11是例如被称为智能电话的高级移动电话、平板式终端、移动游戏台、移动音乐视频播放器等。移动终端11中已存储(或安装)有节目回放应用(或者有时简称为“app”)21，该节目回放应用是用于回放节目分发公司等创建的节目的应用程序(软件)。节目回放应用21设置有用于控制节目的回放的回放控制器，并且回放控制器包括通信控制器22、显示控制器23和语音控制器24。通信控制器22被配置为控制与节目分发公司的每个服务器的通信。显示控制器23被配置为控制节目在移动终端11的显示器上的显示。语音控制器24被配置为控制节目的语音输出。

用户信息管理服务器12管理与使用节目分发服务的用户有关的信息。具体地，用户信息管理服务器12基于每个用户来管理表示用户可用观看和收听的节目的内容的登记节目信息以及表示用户已观看和收听(或回放)的节目的历史的先前播放节目信息。用户信息管理服务器12还基于每个用户来管理包括用户用以登录的用户ID和密码的认证信息、用户的偏好信息、设置信息等。

将参照图2描述作为节目分发系统1中用户可观看和收听的内容的节目的结构。

用户可观看和收听的节目由一个或多个片段构成。每个片段包括一个或多个话题(topic)。应注意，有时可仅将由一个话题构成的片段定义为片段。

话题的示例可以包括在诸如报纸和杂志发行方的信息分发公司主办的特定网页上所提供的关于新闻、天气预报、占卜服务等的分发信息。一部分这样的分发信息仅包括文本(文本信息)，而其他这样的分发信息包括文本和视频(静止图像、运动图像)。

每个话题均可以包括音乐、视频、背景音乐(BGM)、声效和音频广告(CM)的音频数据(音频文件)。每个话题还可以包括音频数据和文本信息(诸如音乐及其介绍文本)。音频数据可以是可存储在云服务器、本地存储器(用户的终端的存储装置)等中的、用户创建的音频数据，或者可以是另一用户创建的音频数据，诸如，经由播客(podcast)等可利用的音乐、在视频发布网站上发布的项目或者可从音乐分发公司得到而进行试用的项目。音频数据还可以是作为书的朗读音频文件的有声读物。

每个话题还可以包括诸如留言板、博客和推特简讯的社交网络服务(SNS)中的评论信息。话题的其他示例可以包括作为与人们过去或将来的活动有关的信息的日程安排信息，以及表示电子邮件的内容的电子邮件信息。

在上述的话题之中，可以将可从相同网络服务器得到的诸如多篇新闻文章和天气信息的多个话题合并成单个片段。另外，还可以将可从相同网络服务器得到的诸如博客信息和推特简讯信息的多个话题合并成单个片段。换言之，片段是以共同主题(诸如信息分发公司、分发服务器和提供信息类型)统一了一个或多个话题的子分类项，而话题是从片段划分出的子-子分类项。

返回参照图1，脚本分析服务器13访问脚本源服务器14-1至14-N以获取作为构成节目(内容)的话题的数据的内容数据(诸如新闻、天气和博客信息)，并且存储所获取的内容数据。另外，脚本分析服务器13分析并修改从脚本源服务器14-A至14-N获取的内容数据以创建用于朗读所获取的内容数据的文本转语音数据，并且存储所创建的文本转语音数据。脚本分析服务器13定期地或不定期地访问脚本源服务器14-1至14-N中的每一个以获取最新的内容数据。

在从移动终端11的节目回放应用21接收到对构成节目的话题的内容数据的请求时，脚本分析服务器13将预先从脚本源服务器14-1至14-N(下文中统称为“脚本源服务器14”)中的每一个获取并存储在脚本分析服务器13中的内容数据传送(返回)到节目回放应用21。如果要传送到节目回放应用21的内容数据包含文本信息，则脚本分析服务器13还将为了将文本信息朗读为语音而处理的文本转语音数据作为内容数据的一部分传送到节目回放应用21。

每个脚本源服务器14向脚本分析服务器13提供用于构成节目的话题或片段的内容数据。脚本源服务器14对应于例如诸如报纸或杂志发行方的信息分发公司的网络服务器、SNS提供服务器等。

语音合成服务器15是用于执行用以将文本信息转换成语音并输出语音的语音合成处理的服务器。当从移动终端11的节目回放应用21传送了给定话题的文本转语音数据时，语音合成服务器15使用文本转语音数据来执行语音合成处理以产生音频数据，并且将音频数据传送(返回)到节目回放应用21。

移动终端11的节目回放应用21可以具有文本转语音功能并且可以执行语音合成处理。在这种情况下，可以省略语音合成服务器15。替选地，可以根据节目回放应用21的设置来确定是使用节目回放应用21的文本转语音功能还是语音合成服务器15的文本转语音功能，或者可以使用语音合成服务器15的文本转语音功能作为补充。

媒体文件服务器16存储音乐、视频、BGM、声效和音频CM的音频数据(音频文件)。在从移动终端11的节目回放应用21接收到对构成节目的话题的音频数据的请求时，媒体文件服务器16将所请求的音频数据传送(或返回)到节目回放应用21。媒体文件服务器16还可以存储具有视频和音频的CM、音乐视频以及在运动图像发布网站上发布的运动图像的音频/视频数据(AV数据)，并且响应于来自节目回放应用21的请求而传送这样的数据。

从语音合成服务器15或媒体文件服务器16传送的音频数据可以是例如流数据。

节目分发系统1具有上述配置。

节目分发公司管理的用户信息管理服务器12、脚本分析服务器13、语音合成服务器15和媒体文件服务器16可由单个服务器或者两个、三个或多于四个的服务器实现。另外，每个服务器的一些功能可由与节目分发公司不同的公司运行。

此外，由脚本分析服务器13、语音合成服务器15等执行的处理的全部或部分可由移动终端11的节目回放应用21执行。也就是说，可以根据移动终端11的处理能力来适当地确定每个服务器执行的处理与移动终端11的节目回放应用21执行的处理的分担。

<节目回放应用的UI>

接下来，将参照图3至图11描述可以在移动终端11的显示器上显示的节目回放应用21的用户界面(UI)画面。

<登录画面>

图3示出了启动节目回放应用21时显示的登录画面的示例画面配置。

在图3所示的登录画面41中心呈现节目回放应用21的名称(“应用标题”)。还在登录画面41的预定位置呈现用户ID输入字段42和密码输入字段43。用户ID输入字段42允许用户键入用于标识用户的用户ID，以及密码输入字段43允许用户键入密码。

用户ID输入字段42中键入的用户ID及密码输入字段43中键入的密码被传送到用户信息管理服务器12，并且用户信息管理服务器12相对于与所登记的用户有关的认证信息对该用户ID和密码进行检验。

主页画面的示例画面配置

图4示出回放节目期间所显示的主页画面的示例画面配置。

在图4所示的主页画面51上部呈现菜单跳转按钮52和回放历史跳转按钮53。当用户希望画面转变至菜单画面121(图9)时，操作菜单跳转按钮52。当用户希望画面转变至显示用户的简档和回放历史的回放历史画面11(图8)时，操作回放历史跳转按钮53。

主页画面51还呈现顺序地显示构成节目的片段的片段显示部54。在片段显示部54中，按回放的顺序竖直地布置构成节目的片段60，诸如片段60-1和片段60-2。

每个片段60均包括片段图像61、片段图标62、片段标题63和片段跳转按钮64。片段图像61是帮助用户理解片段的内容的照片或图示。片段图标62表示片段的风格(属性)。当用户希望跳转到片段以立即开始回放时，操作片段跳转按钮64。在构成节目的片段60当中，利用片段跳转按钮64附近的节目编辑跳转按钮65呈现用户可以编辑(诸如添加或删除)的片段60，以使得画面转变至节目编辑画面71(图5)。

更具体地，片段60-1设置有片段图像61-1、片段图标62-1、片段标题63-1和片段跳转按钮64-1。片段60-2设置有片段图像61-2、片段图标62-2、片段标题63-3、片段跳转按钮64-2和节目编辑跳转按钮65-2。

片段显示部54包括明确表示当前回放位置的时间线66。时间线66被设置成在片段60上延伸。

用户通过用其一个或多个手指触摸显示器上的片段显示部54并且在片段60布置的竖直方向上滑动其一个或多个手指来做出手势。这使得由于有限的显示区域而隐藏的其他片段60能够显示。用户可以通过检查各个片段60的内容并轻击(tap)期望片段60的片段跳转按钮64来开始回放期望的一个片段60。

节目编辑画面的示例画面配置

图5示出响应于对图4所示的节目编辑跳转按钮65的轻击而显示的节目编辑画面71的示例画面配置。

图5所示的节目编辑画面71具有主页跳转按钮72、“完成”按钮73和节目结构显示部74。当用户希望画面转变至主页画面51(图4)时，操作主页跳转按钮72。“完成”按钮73用于完成节目的编辑并且反映所编辑的节目的内容。节目结构显示部74是显示节目的结构的区域。

节目结构显示部74包括用于显示节目的标题和回放持续时间的节目标题显示部81以及示出构成节目的片段的片段显示部82。

在片段显示部82中，针对构成节目的每个片段布置图标83、片段标题显示部84、详情设置按钮85和改变按钮86。

每个图标83均表示相关联片段的风格(属性)。以与在主页画面51(图4)上的方式类似的方式沿着时间线87布置图标83。

每个片段标题显示部84呈现相关联片段的标题和回放持续时间。操作详情设置按钮85以设置片段的详情。例如，对于占卜服务片段，详情设置按钮85可以用于设置显示与该片段有关的信息所需的信息，诸如，用户的星座或血型。利用改变按钮86，用户可以改变节目中的片段的顺序及删除片段。

在片段显示部82上的预定位置处进一步设置有用于添加片段的“添加片段”按钮88。响应于用户对“添加片段”按钮88的轻击(或按压)，在显示器上显示图6所示的附加片段风格选择画面91。

添加片段风格选择画面的示例画面配置

图6示出允许用户选择用户希望添加的片段的风格的附加片段风格选择画面91的示例画面配置。

附加片段风格选择画面91呈现表示可选择风格的风格按钮92。在图6所示的示例中，显示有表示“片头(‘OP’)”、“新闻”、“娱乐(‘Ent’)”和“音乐”的风格按钮92。用户轻击表示用户希望添加的片段的风格的风格按钮92。

当用户希望返回到图5所示的节目编辑画面71时，操作位于附加片段风格选择画面91的左上角的节目编辑跳转按钮93。

例如，用户希望添加属于“新闻”风格的片段并且轻击了“新闻”风格按钮92。因而，显示图7所示的附加片段选择画面101。

附加片段选择画面的示例画面配置

图7示出允许用户添加属于“新闻”风格的片段的附加片段选择画面101的示例画面配置。

图7所示的附加片段选择画面101呈现片段按钮102，片段按钮102表示属于在图6所示的附加片段风格选择画面91上所选择的“新闻”风格的可用片段。在图7所示的示例中，显示有表示“晚间时段”、“东部经济时间”、“媒体时间”和“IT新闻”的片段按钮102。响应于用户对表示用户希望添加的一个片段的片段按钮102的轻击，添加对应的片段作为正编辑的节目的一个片段。然后，显示器的画面返回到图5所示的节目编辑画面71。

当用户希望返回到图6所示的附加片段风格选择画面91时，操作位于附加片段选择画面101的左上角的风格选择跳转按钮104。

回放历史画面的示例画面配置

图8示出其上显示用户先前已回放的节目的历史的回放历史画面111的示例画面配置。

如图8所示，回放历史画面111包括简档显示部112、播放节目显示部113和主页跳转按钮114。

简档显示部112呈现用户的简档(诸如，名字、正面照片(面部图像)、生日和星座)。还可以在简档显示部112中显示用户的登记的偏好信息。

在播放节目显示部113中显示用户先前已回放的节目的历史。在图8所示的示例中，显示被设计为在早晨观看和收听的节目“晨间拿铁”以及被设计为在晚上观看和收听的节目“夜间拿铁”作为用户先前已回放(或者观看和收听)的节目。

当用户希望画面转变至图4所示的主页画面51时，操作主页跳转按钮114。

菜单画面的示例画面配置

图9示出菜单画面121的示例画面配置。

如图9所示，菜单画面121包括主页画面跳转按钮122、节目列表画面跳转按钮123、回放历史画面跳转按钮124和设置画面跳转按钮125。主页画面跳转按钮122被操作用以显示主页画面51(图4)。节目列表画面跳转按钮123被操作用以显示节目列表画面131(图10)。回放历史画面跳转按钮124被操作用以显示回放历史画面111(图8)。设置画面跳转按钮125被操作用以显示允许用户进行节目回放应用21的设置的设置画面151(图11)。

节目列表画面的示例画面配置。

图10示出节目列表画面131的示例画面配置。

图10所示的节目列表画面131呈现用户可观看和收听的节目的列表。用户可观看和收听的节目包括用户创建的节目和节目分发公司或任何其他用户免费或付费提供的节目。节目回放应用21访问用户信息管理服务器12以基于登记节目信息显示用户可观看和收听的节目的列表，该登记节目信息包括作为用户可观看和收听的节目的列表的登记节目列表。

节目列表画面131针对用户可观看和收听的每个节目呈现节目描述部132。

每个节目描述部132呈现节目标题141、节目内容描述142和代表构成节目的片段的片段图标143。类似于作为表明当前正回放节目的画面的主页画面51上的片段图标62，片段的片段图标143代表片段的风格(属性)，并且按节目中回放的顺序布置。如果已登记对应于节目的照片(缩略图像)，则显示照片作为背景图像，使得以叠加方式显示照片、节目标题141和节目内容描述142。

当用户希望画面转变至图4所示的主页画面51时，操作位于节目列表画面131的左上角的主页跳转按钮133。当用户希望画面转变至图8所示的回放历史画面111时，操作位于节目列表画面131的右上角的回放历史跳转按钮134。

用户可以通过轻击与节目列表画面131上的期望节目相关联的节目描述部132来回放期望的节目。响应于用户对与用户希望回放的节目相关联的节目描述部132的轻击，开始节目的回放，并且移动终端11的画面转变至图4所示的要回放的节目的主页画面51。

<画面转变序列>

图11示出图3至图10所示的画面的画面转变序列。

当启动节目回放应用21时，最初，显示图3所示的登录画面41。当在登录画面41上输入了用户ID和密码并且对用户进行了认证时，显示图4所示的主页画面51。

主页画面51可转变至图5所示的节目编辑画面71、图8所示的回放历史画面111、图9所示的菜单画面121、图10所示的节目列表画面131和设置画面151。

节目编辑画面71可转变至图6所示的附加片段风格选择画面91，并且附加片段风格选择画面91可转变至图7所示的附加片段选择画面101。

图9所示的菜单画面121可以转变至图4所示的主页画面51、图10所示的节目列表画面131、图8所示的回放历史画面111以及设置画面151。

设置画面151是允许用户进行应用的常规设置(诸如，节目回放应用21的UI画面的显示方法、行为等)的画面。

<节目回放处理的流程图>

接下来，将参照图12的流程图来描述通过使用移动终端11的节目回放应用21来回放给定的节目的处理。例如当激活节目回放应用21时，启动该处理。

在步骤S1中，节目回放应用21在移动终端11的显示器上显示图3所示的登录画面41。登录画面41设置有用户ID输入字段42和密码输入字段43。

在步骤S2中，节目回放应用21将用户输入的用户ID和密码传送到用户信息管理服务器12。

在步骤S3中，用户信息管理服务器12接收从节目回放应用21传送的用户ID和密码，并且基于该用户ID和密码对用户进行认证。在对用户进行认证之后，用户信息管理服务器12基于用户的登记节目信息来将作为用户可观看和收听的节目的列表的登记节目列表传送到节目回放应用21。

在步骤S4中，节目回放应用21获取从用户信息管理服务器12传送的登记节目列表，并且基于登记节目列表在显示器上显示图10所示的节目列表画面131。

在步骤S5中，节目回放应用21确定是否已从显示器上所显示的一个或多个节目当中选择了某一节目作为要回放的节目，并且等待直到确定已选择节目为止。

如果在步骤S5中确定已选择某一节目，则处理进入步骤S6。然后，节目回放应用21在显示器上显示被指示回放的节目的主页画面51(图4)。

如果用户仅保留一个节目或者如果通过预约要回放的节目等来预先指定了要回放的节目，则省略上述的步骤S4和S5中用于选择要回放的节目的处理。在这种情况下，如在图11所示的画面转变序列中，登录画面41立即改变为要回放的节目的主页画面51。

在步骤S7中，节目回放应用21从用户信息管理服务器12获取与构成选择被回放的节目的一个或多个话题当中接下来要回放的话题有关的访问信息。

在用户信息管理服务器12中，针对构成选择被回放的节目的一个或多个话题存储了表示从其获取每个话题的内容数据的地址的访问信息。如果话题是例如脚本源服务器14分发的新闻，则访问信息可以是表示脚本分析服务器13中的存储有从脚本源服务器14获取的新闻的文件夹的信息。如果话题是例如存储在媒体文件服务器16中的音乐，则访问信息可以是表示媒体文件服务器16中的存储有音乐的音频数据的文件夹的信息。用户信息管理服务器12将与在构成选择被回放的节目的一个或多个话题当中接下来要回放的话题有关的访问信息传送到节目回放应用21，并且节目回放应用21接收访问信息。

在步骤S8中，节目回放应用21根据在步骤S7中所获取的与话题有关的访问信息来访问由访问信息指定的服务器，并且获取内容数据。

例如，如果话题是脚本源服务器14分发的新闻，则节目回放应用21基于访问信息来访问脚本分析服务器13中的文件夹，并且获取内容数据。

例如，如果话题是存储在媒体文件服务器16中的音乐，则节目回放应用21基于访问信息访问媒体文件服务器16中的文件夹，并且获取音乐的音频数据。

在步骤S9中，节目回放应用21确定所获取的内容数据是否包括文本转语音数据。

如果在步骤S9中确定所获取的内容数据包括文本转语音数据，则处理进入步骤S10。在步骤S10中，节目回放应用21将文本转语音数据传送到语音合成服务器15，获取经过语音合成服务器15的语音合成处理的语音数据，并且对画面显示和基于内容数据、经过文本转语音的语音输出执行同步操作。例如，如果话题是脚本源服务器14分发的新闻，则节目回放应用21在移动终端11的显示器上显示从脚本分析服务器13中的文件夹获取的新闻稿，并且还输出新闻稿的朗读的语音。

如果在步骤S9中确定所获取的内容数据不包括文本转语音数据，则处理进入步骤S11。然后，节目回放应用21回放内容数据。例如，如果话题是存储在媒体文件服务器16中的音乐，则节目回放应用21回放音乐的音频数据。

在步骤S12中，节目回放应用21基于用户信息管理服务器12中的登记节目信息来确定在当前回放话题之后是否存在要回放的话题。

如果在步骤S12中确定存在接下来要回放的话题，则处理返回到步骤 S7，并且再次执行随后的处理。即，执行获取接下来要回放的话题的内容数据并且回放内容数据的处理。

如果在步骤S12中确定不存在接下来要回放的话题，则节目回放处理结束。

因此，节目回放应用21通过以构成节目的话题为单元获取内容数据来回放节目。因此，回放了该节目。

在上述示例中，为了便于描述，在当前话题的回放结束之后，获取下一话题的内容数据。实际上，在回放当前话题的同时预先获取下一话题的内容数据，使得可以在当前话题的回放完成之后立即开始下一话题的回放。

<主页画面的第一具体示例>

接下来，将描述主页画面的两个具体示例。

图13示出主页画面的第一具体示例，其中，在主页画面上回放具有节目标题“晨间拿铁”的节目。

该主页画面在其左部呈现时间线201。时间线201是使得能够从视觉上识别整个节目和每个片段(话题)的时间长度以及回放点的时间位置的时域内的表征。

多个片段显示部211布置在时间线201的右侧以按各个片段的回放顺序从上向下布置。每个片段显示部211均包括代表相关联片段的风格(属性)的图标221、片段的标题和回放起始时间222以及当用户希望跳转到片段以开始回放时所操作的跳转按钮223。

对于包括一个或多个话题的片段，还显示话题的话题标题231和当用户希望跳转到话题以进行回放时所操作的跳转按钮232。

在图13所示的主页画面上，显示包括话题“今日天气”的“片头”片段的片段显示部211以表示要第一回放的片段，显示包括两个话题的“IT数码新闻”片段的片段显示部211以表示要第二回放的片段，显示“音乐#1”片段的片段显示部211以表示要第三回放的片段，并且显示“CM”片段的片段显示部211以表示要第四回放的片段。以该方式，片段显示部211按构成节目的片段的回放顺序在时间线201的右侧的布置使得用户能够对整个节目和每个片段的结构、各个片段的回放顺序等一目了然。这可以有助于用户容易地了解整个节目。

从片段显示部211中的回放起始时间222可以看出，在开始回放节目之后立即(之后0分0秒)回放第一片段“片头”，在开始回放节目之后0分33秒回放第二片段“IT数码新闻”，以及在开始回放节目之后11分57秒回放第三片段“音乐#1”。因此，用户可以了解回放每个片段的定时及其回放持续时间。替代从节目的开头起测量的回放每个片段的时间，每个片段的回放持续时间的长度可显示在回放起始时间222中。

位于主页画面的下部中的播放/停止按钮241、跳过按钮242和设置画面跳转按钮243是主页画面所共有的操作按钮，并且无论回放哪个节目均显示。播放/停止按钮241被操作(通过轻击)用以开始或停止节目的回放。跳过按钮242被操作用以将回放目标移动到下一话题或片段。设置画面跳转按钮243被操作用以输入节目回放应用21的设置画面。

在当前正回放节目“晨间拿铁”的第一片段“片头”中的话题“今日天气”时，显示图14所示的主页画面。具体地，指示当前回放位置的指示符202在时间线201上移动并且显示在话题“今日天气”的位置处。

在回放“片头”片段中的话题“今日天气”时，节目回放应用21从脚本源服务器14获取话题“今日天气”的文本转语音数据，并且提供“今日天气”的语音输出。

当完成了对话题“今日天气”的朗读并且开始下一片段“IT数码新闻”中的第一话题(即，“在内阁改组之后执政党和反对党会见内阁官方长官”)的回放时，显示图15所示的主页画面。

具体地，表示当前回放位置的指示符202在时间线201上移动至如下位置，即话题“在内阁改组之后执政党和反对党会见内阁官方长官”。然后，如图15所示，节目回放应用21在话题标题231下面显示网页画面261，其与在从其获取了话题“在内阁改组之后执政党和反对党会见内阁官方长官”的网站上所显示的画面相同。

当在前一片段“片头”的回放结束之后开始“IT数码新闻”片段的回放时，可经由诸如“接下来是新闻片段”的语音向用户呈现接下来要回放的片段的风格。

替选地，在“IT数码新闻”片段的片段显示部211中可以靠近例如标题和回放起始时间222显示从其获取了“IT数码新闻”片段的脚本源服务器14的网站名或统一资源定位符(URL)，以明确示出与所显示的内容有关的源信息。另外，可以在“IT数码新闻”片段的回放开始或结束时朗读要回放的片段的源信息，诸如“该片段从IT新闻提供”。

节目回放应用21基于文本转语音数据朗读网页画面261上的新闻稿(或者经由语音输出新闻稿)。

在朗读网页画面261上的新闻稿时，节目回放应用21将画面上的朗读部分划分成诸如句子的预定单位并且与句子的朗读语音同步地以突出(或强调)方式显示句子。这允许用户容易地识别正在朗读网页画面261上的新闻稿的哪个部分。

如图16所示，在以与在从其获取了数据的网站上所显示的画面类似的方式所显示的网页画面261下面设置有浏览器启动按钮262。用户可以轻击浏览器启动按钮262以访问从其获取了正朗读的话题的脚本源服务器14，以在网络浏览器上显示正朗读的新闻稿。表示从其获取了正朗读的新闻稿的源的对脚本源服务器14的访问信息包括在例如从脚本分析服务器13获取的内容数据中。

当“IT数码新闻”片段中的两个话题的回放结束并且下一片段“音乐#1”的回放开始时，显示图17所示的主页画面。具体地，已显示的网页画面261消失，并且指示符202在时间线201上移动至“音乐#1”片段的位置。

图18示出节目“晨间拿铁”的整个结构。

节目“晨间拿铁”由五个片段(即，第一片段“片头”、第二片段“IT数码新闻”、第三片段“音乐#1”、第四片段“CM”和第五片段“片尾”)组成。

在“片头”片段的回放中，节目回放应用21从脚本源服务器14获取话题“今日天气”的内容数据(文本转语音数据)，并且在需要时经由语音合成服务器15提供话题“今日天气”的语音输出。可以通过根据天气的内容切换朗读者(的话音音调)、BGM等来提供话题“今日天气”的语音输出，以允许用户了解根据除文字因素外的因素的信息。

在回放“IT数码新闻”片段时，节目回放应用21从脚本源服务器14获取话题“在内阁改组之后执政党和反对党会见内阁官方长官”和“新闻文本”的内容数据。然后，节目回放应用21显示与在用户访问脚本源服务器14时提供新闻稿的脚本源服务器14上所显示的网页画面相同的网页画面，并且通过执行语音合成处理来提供网页画面261上所呈现的新闻稿的语音输出。

用户可以开启或关闭节目回放应用21的、用以朗读主页画面上所呈现的内容的文本转语音功能。

在回放“音乐#1”片段时，节目回放应用21回放存储在移动终端11的本地存储器中的音乐“音乐#1”。在“音乐#1”片段的回放期间，可显示音乐的封面照片(的缩略图像)等。

在回放“CM”片段时，节目回放应用21访问媒体文件服务器16以获取广告的音频数据，并且回放该音频数据。如果广告是具有视频的运动图像，则还同时回放视频。要回放的广告可以在服务器侧预先确定，或者可以根据登记在用户信息管理服务器12中的用户的偏好信息等而随着用户不同而不同。可以根据诸如用户按照兴趣已参考的网页以及用户已收听的音乐的内容的内容来学习用户的偏好信息，并且可以对其进行登记。

在回放“片尾”片段时，节目回放应用21访问媒体文件服务器16以获取“片尾”片段的音频数据，并且回放音频数据。

另外，例如，在使用移动终端11中的日程数据来回放“今日日程安排”片段时，节目回放应用21可以通过执行语音合成处理来朗读今日日程安排或者显示用于启动日历应用的启动按钮等。

另外，例如，在回放“占卜服务”片段时，节目回放应用21基于所登记的用户的简档来朗读对于用户的星座占卜。因而，甚至在同一节目中，在“占卜服务”片段中要朗读的内容可能根据用户(的星座)而不同。

另外，例如，在使用移动终端11中的邮箱数据来回放显示有新送达的电子邮件的“新送达电子邮件”片段时，节目回放应用21可以通过执行语音合成处理来朗读新送达的电子邮件，或者显示用于启动邮箱的启动按钮等以创建回复电子邮件。

因此，在利用根据该实施例的节目分发系统1所分发的节目中，诸如从预定网站收集的新闻稿、天气预报、博客文章、推特简讯信息、音乐(服务器内容、本地内容)、日程安排以及新送达电子邮件的各类信息被呈现为片段或话题。在现有技术中，在屏幕上观看诸如网页上的信息的内容之前，不了解该内容。相反，节目回放应用21允许通过使用文本转语音功能将这样的内容收听为语音，并且因此可以通过使用文本转语音功能来向用户提供新的娱乐形式。

当通过执行语音合成处理来朗读文本信息时，节目回放应用21可以使用于语音合成的语音(朗读者的话音)等的音调根据每个片段或风格而不同。例如，可以对新闻片段进行语音合成处理使得以40多岁的男性声音呈现新闻片段，可以对天气片段进行语音合成处理使得以20多岁的女性声音呈现天气片段，并且对体育片段进行语音合成处理使得以30多岁的男性声音呈现体育片段。节目回放应用21可以允许用户以片段或风格为单位设置用于语音合成的声音，并且可以基于设置的参数来执行语音合成处理。替选地，节目回放应用21或语音合成服务器15可以基于用户的简档信息或偏好信息来以片段或风格为单位自动改变用于语音合成的声音。

由于主页画面上的每个片段显示部211呈现代表片段的风格的图标221，因此即使节目由包括诸如新闻稿、博客文章、音乐和日程安排的各种信息的片段组成，用户也可以容易地了解片段属于哪个风格。

片段显示部211中的图标221可以如在前述示例中那样基于风格，或者替选地或附加地基于任意其他分类方法。

例如，可以将节目中的片段分类成：包括要通过语音合成处理经由语音输出的文本信息的片段，以及包括要通过回放经由音频输出的音乐的音频数据的片段，并且可以由图标221可区分地标识这些片段。由于通过语音合成处理所获得的语音可能是人工的(或者机械的)，因此可以按实际用途准备利用人声朗读的文本的语音录音的音频数据。在这种情况下，可以利用图标221进一步区分语音输出是否是基于真人语音录音。

此外，还可以将节目中的片段分类成：经过了移动终端11中的封闭(closed)处理的片段，以及通过将片段的数据传送到外部服务器等使用外部装置处理的片段，并且可以利用图标221可区分地标识节目中的片段。

例如，在片段中，通过语音合成处理朗读存储在移动终端11中的电子邮件。在这种情况下，电子邮件可经历移动终端11的语音合成处理，或者可以传送到语音合成服务器15并且经历语音合成服务器15的语音合成处理。如果电子邮件的内容具有高保密性或高隐私度，则在将电子邮件发送到语音合成服务器15的情况下电子邮件的内容可能通过拦截、窃听等而泄漏到外部。相反，如果电子邮件经历移动终端11的语音合成处理，则可以防止或减少这样的担心。因此，用于可区分地标识移动终端11中的封闭处理或者使用外部装置的处理的图标221可用于隐私保护或保密性保护。

替选地，可以将节目中的片段分类成：(仅)使用存储在移动终端11的本地存储器中的内容数据的片段，以及使用从外部服务器获取的内容数据的片段，并且可以利用图标221可区分地标识节目中的片段。

例如，在基于音频数据回放音乐的情况下，可以使用存储在移动终端11的本地存储器中的音频数据来回放音乐，或者可以使用从媒体文件服务器16下载的流数据来回放音乐。当用户在乘火车旅行等时回放节目及回放作为节目中的片段的音乐时，通信可能在火车穿过隧道时暂时断开。在这样的状况下，如果音乐使用本地数据，则可以不中断音乐的回放，而如果音乐使用流数据，则可能中断音乐的回放。因此，用于可区分地标识使用存储在移动终端11的本地存储器中的内容数据还是使用从外部服务器获得的内容数据的图标221允许预测回放中断的风险。

如参照图12的流程图所述，在移动终端11的节目回放应用21执行的节目回放处理中，如果每个片段均包括多个话题，则以片段为单位或以话题为单位获取内容数据。

在通信由于火车穿过隧道、通信堵塞等而暂时断开的状况下，可以不按时间获取下一片段(或话题)的内容数据而开始回放，或者可以在片段(或话题)的回放期间暂时中断回放。在这种情况下，节目回放应用21可以输出诸如“通信状态差以及将替代地回放本地内容”的消息或画面，从而以使用移动终端11中的本地内容数据的片段替代使用从外部服务器获得的内容数据的片段。

另外，节目回放应用21具有用于在用户处于网络可访问环境中时(诸如在用户在家的晚上)将构成节目的每个片段的内容数据累积在移动终端11的本地存储器中的功能，使得甚至在难以访问服务器的通信环境下也能回放节目。该功能允许用户甚至在难以访问服务器的通信环境中也能通过使用存储在移动终端11中的节目的内容数据来连续地观看节目。

如上所述，构成节目的每个片段或话题的内容包括在服务器侧(例如，脚本分析服务器13)所生成的服务器生成的内容(诸如在某些网站上的新闻稿)以及在本地侧所生成的本地生成的内容(诸如，基于在移动终端11中的日程安排的今日日程安排以及音乐文件)。

节目回放应用21可以通过将服务器生成的内容与本地生成的内容合并来生成一个片段或话题。在这种情况下，用户保持为从服务器侧获取的内容数据的内容数据包含用于合并到内容数据中的指令作为节目结构信息。

例如，在“今日天气”片段中，可以将对在服务器侧所生成的“今日天气”的脚本的朗读与作为BGM存储在移动终端11中的音频数据合并，以在朗读“今日天气”的同时广播作为BGM的本地数据的音乐。在这种情况下，从脚本分析服务器13获取的“今日天气”的内容数据包含用于“将使用本地数据的BGM插入”内容数据中的指令作为节目结构信息。

例如，在显示预定网页上的新闻稿的服务器侧所创建的“新闻”片段包含用于“将使用本地数据的具有三分钟内的持续时间的BGM插入”到“新闻”片段中的指令作为节目结构信息。在这种情况下，节目回放应用21在存储在移动终端11中的本地数据中搜索具有三分钟内的回放持续时间的音乐，并且在回放“新闻”片段时从听觉上输出该音乐作为BGM。

脚本分析服务器13还可以进一步分析要分发作为内容数据的新闻稿，并将音乐的特征(诸如，欢快、快乐和悲伤)作为参数。当选择音乐作为BGM时，节目回放应用21可以基于特征值来在本地数据中搜索与参数相匹配的音乐，作为本地音乐的分析结果，并且从听觉上输出音乐。替选地，可以在服务器侧作出用于插入音乐的指令或者节目回放应用21可以根据用户的使用环境选择可以使人们快乐的音乐(诸如，快节奏音乐)作为在早晨要回放的音乐或者选择可以使人的思维冷静的慢节奏音乐作为在睡觉前夜间要播放的音乐。

用于将音乐插入节目中的指令可以包括从本地数据选择音乐所基于的准则，诸如音乐作品的数量、每个音乐作品的回放持续时间、全部音乐作品的回放持续时间。

例如，使用本地数据广播音乐的“音乐”片段包含用于“将使用本地数据的每一个均具有三分钟以上的持续时间(20分钟的持续时间)的五个音乐作品插入”到“音频”片段中的指令作为节目结构信息。在这种情况下，节目回放应用21在存储在移动终端中的数据中搜索每一个均具有三分钟以上的回放持续时间的五段音乐数据，布置五段音乐数据以使得总回放持续时间变为20分钟，并且从听觉上输出所获得的各段音乐数据。

如果不存在满足所指定的条件的音乐数据，则节目回放应用21可以提供“我们由于没有音乐而将结束音乐片段”的语音输出。

<主页画面的第二具体示例>

接下来，将参照图19至图21描述主页画面的第二具体示例。

在第二具体示例中，在回放节目之前以初始状态显示图19所示的主页画面，并且在回放节目期间显示图20和图21所示的主页画面。

图19示出处于初始状态的节目“晨间拿铁”的主页画面301的示例。

处于初始状态的图19所示的主页画面301呈现显示了节目的标题的标题显示部311、允许画面转变至节目编辑画面71(图5)的“编辑”按钮312以及用于开始节目的回放的节目回放按钮313。

处于初始状态的主页画面301还呈现节目概况显示部314、用于允许画面转变至节目列表画面131(图10)的节目列表跳转按钮315以及用于允许画面转变至设置画面151(图11)的设置跳转按钮316。节目概况显示部314呈现构成节目的片段的标题321以及从其提供了各个片段的源(或者脚本源)322。

当用户轻击图19所示的处于初始状态的主页画面301上的节目回放按钮313时，画面转变至处于回放状态的图20或图21所示的主页画面331。

将参照图20和图21描述处于回放状态的主页画面331。

主页画面331具有节目标题条341、片段条342、话题条343和话题内容显示部344。

节目标题条341呈现节目标题和回放持续时间。片段条342以片段为单位提供整个节目的显示。话题条343以话题为单位提供整个节目的显示。话题内容显示部344提供每个话题的内容的显示。

除了节目标题和回放持续时间之外，节目标题条341还呈现用于允许画面转变至处于初始状态的主页画面301(图19)的主页跳转画面361的主页跳转按钮361，以及用于允许画面转变至节目编辑画面71(图5)的“编辑”按钮362。

在片段条342中，按回放的顺序从左至右顺序地布置与构成节目的多个片段相对应的片段块363，并且与当前回放的片段相对应的一个片段块363显示在屏幕上。在图20中，显示对应于“头条”片段的片段块363，以及在图21中，显示对应于“音乐”片段的片段块363。当“头条”片段的回放完成时，对应于“头条”片段的片段块363移动至左边(画面之外)，并且如图21所示，对应于“音乐”片段的片段块363移动至屏幕的中心。

片段条342中的每个片段块363呈现诸如“头条”和“音乐”的片段标题364以及表示正回放的片段的进度(诸如当前回放的标题位于片段中的位置)的指示符365。在第二具体示例中，每个片段标题364表示片段的风格(属性)。

在话题条343中，话题块366按回放的顺序从左至右顺序地布置。每个话题块366位于与话题所属的片段相对应的片段块363下面。话题块366呈现话题标题。

在话题条343中，在水平方向上布置的多个话题块366当中位于画面中心的话题块366对应于当前回放的话题。当前回放的话题的内容显示在话题内容显示部344中。

在图20中，与话题标题“MZ，10月29日(GMT)举行’Windowz Phone 9‘发布会”相对应的新闻稿显示在话题内容显示部344中。在图21中，话题标题(音乐)“打击乐专题”的封面照片显示在话题内容显示部344中。

节目列表跳转按钮345、回放/停止按钮346、跳过按钮347和设置画面跳转按钮348布置在话题内容显示部344下面。当用户希望画面转变至节目列表画面131(图10)时，操作节目列表跳转按钮345。播放/停止按钮346被操作用以开始或停止节目的回放。跳过按钮347被操作用以将回放目标移动至下一话题或片段。当用户希望画面转变至设置画面151(图11)时，操作设置画面跳转按钮348。

用户可以轻击主页画面331上的跳过按钮347以执行片段或话题的前向扫描，从而回放所期望的片段或话题。

用户还可以将片段条342或话题条343轻拂(或者触摸并滑动)至左边或右边以显示片段块363或话题块366中所期望的一个，然后轻击话题块366，从而回放(跳转并回放)期望话题。

在图20所示的主页画面331上，从网站获取的新闻稿显示在话题内容显示部344中，并且在回放话题期间也输出正显示的新闻稿的朗读语音。

在话题内容显示部344中要显示从网站获取的内容的情况下，如图20所示，所显示的文本可以包括至另一网页的链接，诸如“详情见www.nicrozoft.com/ja-jp/release.html”。在这种情况下，在直接朗读文本时逐一读出字母数字字符，并且这样的读出可能在收听时没有意义。

因此，节目回放应用21朗读链接部分、同时用链接目的地的报头中的标题替代链接部分。因而，可以提供例如语音输出“‘发行Winsowz Phone 9’的链接目的地的详情”，并且该语音输出可能使得所显示的文本的内容和在链接目的地处的内容更不可理解。

替选地，节目回放应用21可以获取在链接目的地的网页，并且使用子画面来显示所获取的网页以将其叠加在主页画面上。当用户轻击子画面时，可以启动网络浏览器以显示链接目的地的网页。替选地，当用户轻击子画面时，可以添加在链接目的地处的网页的内容作为下一个文本转语音内容(片段)，并且在正显示在话题内容显示部344中的新闻稿的朗读完成之后朗读该内容。替选地，两个附加图标(即，用于启动网络浏览器的图标以及用于添加朗读的图标)可显示在链接部分附近以允许用户选择下一动作。

以此方式，节目回放应用21还可以提供与当前回放的内容(片段或话题)相关联的信息的画面显示或语音输出。

另外，从网站获取的网页的文本可以包含短语“第2页”或“下一页”。在这种情况下，节目回放应用21可以用下一页或所指定的页面上的标题替代短语“第2页”或“下一页”，并且朗读标题。

此外，从网站获取的网页的文本可以包含图形。在这种情况下，节目回放应用21可以插入伴随图形的字幕并且朗读字幕。例如，在网页包含文本“今天举行的记者招待会(图形1)”以及在网页上的图形1下面放置的读为“图形1：运动员冲击金牌”字幕的情况下，节目回放应用21朗读“今天举行的记者招待会。在页面上示出“运动员冲击金牌的图形”。这允许用户了解在网页上的文本中的图形或照片的内容而无需观看网页。

另外，从网站获取的网页上的文本可以包含表示注释的存在的标记(例如，“(*1)”)，并且注释的内容可以在网页上的另一地方呈现。在这种情况下，节目回放应用21在注释标记的位置处插入注释的内容，并且当朗读网页时朗读所插入的内容。

仅当用户没有在移动终端11上的前台显示节目回放应用21时或者当关断移动终端11的画面显示时，可以朗读这样的替代项目。

在图21所示的主页画面331上，存储在移动终端11的本地存储器中的具有标题“打击乐专辑”的音乐的封面照片(缩略图像)显示在话题内容显示部344中。在回放话题时，在朗读具有标题“打击乐专辑”的音乐的标题和艺术家名字之后是音乐输出(音频)。

如果在朗读音乐的标题和艺术家名字时用了很长时间，则在开始回放音乐以前花费一定量的时间，这可能损害用户感受。因而，节目回放应用21根据图22所示的用于确定关于音乐的介绍文本的处理来确定要朗读的文本以介绍音乐。

<用于确定关于音乐的朗读介绍文本的处理>

图22是用于确定关于音乐的朗读介绍文本的处理的流程图。

在步骤S21中，节目回放应用21确定要回放的音乐的标题和艺术家名字的字符总数是否超过预定的指定的字符数Lmax。

如果在步骤S21中确定标题和艺术家名字的字符总数没有超过指定的字符数Lmax，则处理进入步骤S22。然后，节目回放应用21确定要朗读的标题和艺术家名字这二者，并且处理结束。

如果在步骤S21中确定标题和艺术家名字的总字符数超过指定的字符数Lmax，则处理进入步骤S23。然后，节目回放应用21确定标题的字符数是否超过指定的字符数Lmax。

如果在步骤S23中确定标题的字符数未超过所指定的字符数Lmax，则处理进入步骤S24。然后，节目回放应用21确定仅朗读标题，并且处理结束。

如果在步骤S23中确定标题的字符数超过所指定的字符数Lmax，则处理进入步骤S25。然后，节目回放应用21确定艺术家名字的字符数是否超过所指定的字符数Lmax。

如果在步骤S25中确定艺术家名字的字符数未超过所指定的字符数Lmax，则处理进入步骤S26。然后，节目回放应用21确定仅朗读艺术家名字，并且处理结束。

如果在步骤S25中确定艺术家名字的字符数超过所指定的字符数Lmax，则处理进入步骤S27。然后，节目回放应用21确定所准备的可用于任意类型的音乐的介绍文本(诸如，“我们将进入我们的下一首歌曲”)以进行朗读，而不使用标题或艺术家名字。然后，处理结束。

通过上述处理确定用以介绍要回放的音乐的要朗读的文本，并且经由语音朗读该文本。因而，即使音乐的标题和艺术家名字的字符数较大并且朗读标题和艺术家名字花费较长时间，也不会削弱观看和收听节目的舒适度。

在以上对根据本实施例的节目分发系统1的描述中，可以通过将包括存储在服务器侧上的内容和本地内容(诸如，从预定网站收集的新闻稿、博客文章、推特简讯信息、音乐、日程安排和新送达电子邮件)的各种内容信息进行合并来创建节目，并且回放该节目。

甚至在具有相同结构的节目(或者具有相同结构的片段或话题)中，用户保持作为本地数据的内容、用户的偏好信息、简档(诸如星座)、使用环境等可以根据将回放节目的用户而不同。因而，使得要回放的节目的内容根据用户的不同而不同。因此，在本实施例中的节目分发系统1可以允许用户创建节目以使得节目的内容(内容)动态地改变，并且回放所创建的节目。

移动终端的示例配置

图23是示出执行节目回放应用21的移动终端11的整体硬件配置的框图。

在图23中，通信天线401例如是内置天线，并且被配置为经由移动电话网络或公共无线电通信网络进行呼叫或者收发电子邮件，下载各种应用程序，并且发送和接收无线电波信号以与互联网等进行通信。

天线电路402包括天线切换装置、匹配电路、滤波电路等。发送和接收单元403经由移动电话网络或公共无线电通信网络执行处理，诸如对发送信号和接收信号进行频率转换、调制以及解调。

扬声器416用于例如回放音乐、输出来电铃音、输出振铃器声音(或铃声)等。麦克风417用于从移动终端11周围收集声音或者收集通过移动终端11发出的语音等。音频信号处理单元415包括用于扬声器416的放大器电路、用于麦克风417的放大器电路、用于对从控制和计算单元404提供的经压缩和编码的视频数据进行扩展和解码的扩展和解码电路、用于将经扩展和解码的数字音频数据转换成模拟音频信号的数模转换电路、用于将从麦克风417输入的模拟音频信号转换成数字音频数据的模数转换电路、用于对数字音频数据进行压缩和编码的压缩和编码电路等。

视频信号处理单元411包括用于对从控制和计算单元404提供的经压缩和编码的视频数据进行扩展和解码的扩展和解码电路、用于允许在触摸面板显示器413上显示经扩展和解码的数字视频、以下所述的数字广播接收模块409接收到的数字广播视频的显示面板驱动电路等。

另外，视频信号处理单元411生成显示数据以显示从控制和计算单元404提供的桌面图像或各种菜单图像、与触摸面板显示器413上的位置相对应的虚拟触摸区域图像等，并且允许在触摸面板显示器413上显示这些图像。

触摸面板显示器413具有能够检测用户执行的输入操作的触摸传感器单元。触摸面板信号处理单元412测量触摸面板显示器上的检测触摸位置、触摸轨迹、触摸持续时间、关于触摸的时间间隔等，并且将所测量的数据作为检测触摸数据发送到控制和计算单元404。用户可以用用户的手指以及用诸如附接到移动终端11的记录笔的任意其他根据来在触摸面板显示器413的显示屏上输入任意触摸输入。触摸面板显示器413和触摸面板信号处理单元412被配置为支持多触摸手势。

键操作单元420包括设置在移动终端11的壳体上的硬键、其外围电路等。键操作单元420将用户对硬键的按压转换成电信号，对操作输入信号进行放大，执行模数转换，并将在模数转换之后所获得的操作输入数据发送到控制和计算单元404。

外部输入/输出终端单元419包括用于经由例如线缆进行数据通信的线缆连接连接器和外部接口电路、用于经由电力线缆等对内部电池进行充电的其充电终端和充电接口电路等。包括上述的节目回放应用21的各种应用程序可经由外部输入/输出终端单元419获取。

外部存储器接口(I/F)410包括通过其可移动地插入诸如外部存储的存储介质的外部存储器插槽、外部存储器数据通信接口电路等。包括节目回放应用21的各种应用程序可经由插入外部存储器I/F单元410中的存储介质410A(诸如外部存储器)获取。

近场通信模块408包括用于接收无线LAN、蓝牙(注册商标)等的近场无线电波的通信天线以及近场通信电路。包括节目回放应用21的各种应用程序可经由近场通信模块408获取。

数字广播接收模块409包括用于接收数字电视广播、数字无线电广播和任意其他期望广播的天线以及调谐器。数字广播接收模块409被配置为能够接收一个频道上的数字广播，并且还同时接收多个频道上的数字广播。数字广播接收模块409还被配置为能够接收关于数字广播所复用的数据。可以对数字广播接收模块409接收到的数字广播数据进行处理(诸如通过例如控制和计算单元404压缩、然后存储在(或记录在)存储器单元 405中等)。

摄像头单元414包括用于捕获静止图像或运动图像的成像元件、光学系统等、其外围电路、用于驱动灯以发射辅助光来进行成像的电路等。摄像头单元414捕获的静止图像数据或运动图像数据作为预览视频数据被发送到视频信号处理单元411。因而，当摄像头单元414要捕获图像时，在触摸面板显示器413上显示预览视频。另外，当要记录摄像头单元414捕获的静止图像数据或运动图像数据时，将捕获的静止图像数据或运动图像数据发送到控制和计算单元404并且在其存储在存储器单元405或连接到外部存储器I/F单元410的存储介质410A之前对其进行压缩。

非接触式通信模块407经由非接触式通信天线执行用于例如射频标识(RFID)、非接触式IC卡等的非接触式通信。

全球定位系统(GPS)模块406具有GPS天线，并且使用从GPS大地测量卫星测量系统发送的GPS信号来确定移动终端11的当前位置的纬度和经度。从GPS模块406获得的GPS数据(表示纬度和经度的信息)被发送到控制和计算单元404。因而，控制和计算单元404可辨识移动终端11的当前位置、移动等。

传感器单元418包括各种检测传感器(诸如用于检测移动终端11的状态的终端状态检测传感器)及其外围电路。传感器单元418可以包括例如倾斜度传感器、加速度传感器、方位角传感器、温度传感器、湿度传感器和照明强度传感器。传感器单元418获得的检测信号被发送到控制和计算单元404。因此，控制和计算单元404可以辨识移动终端11的状态(诸如，倾斜度、加速度、方位角、温度、湿度和照明强度)。

存储器单元405包括布置在移动终端11中的内置存储器、卡式可移动存储器等。卡式可移动存储器的示例可以包括存储所谓的用户标识模块(SIM)信息等的卡。内置存储器包括只读存储器(ROM)以及随机存取存储器(RAM)。ROM存储操作系统(OS)、用于允许控制和计算单元404控制各个单元的控制程序、各种初始设置值、词典数据、短语预测/转换字典数据、各种音频数据、包括节目回放应用21的各种应用程序等。ROM包括NAND型闪存或可重写ROM(诸如，电可擦除可编程只读存储器(EEPROM))，并且被配置为能够存储电子邮件数据、电话目录或电子邮件地址薄数据、静止图像或运动图像内容的数据、其他各种用户设置值等。RAM用作当控制和计算单元404执行各种数据处理时所使用的工作区或缓冲区，并且在任意适当时间存储数据。

控制和计算单元404由中央处理单元(CPU)构成，并且控制各个单元，诸如发送和接收单元403、视频信号处理单元411、音频信号处理单元415、GPS模块406、非接触式通信模块407、近场通信模块408、数字广播接收模块409、外部存储器I/F单元410、摄像头单元414、传感器单元418、外部输入/输出终端单元419、键操作单元420和触摸面板信号处理单元421，以在需要时执行各种计算。另外，控制和计算单元404执行存储在存储器单元405中的各种应用程序，包括节目回放应用21。

另外，移动终端11包括典型的移动终端11中所包括的构成元件，诸如测量时间段或时间点的时钟单元、将电力提供至各个单元的电池以及控制要提供的电力的电力管理集成电路(IC)。

服务器装置的示例配置

图24是示出每个上述服务器装置(诸如，用户信息管理服务器12、脚本分析服务器13、语音合成服务器15和媒体文件服务器16)的硬件的示例配置的框图。

在服务器装置中，CPU 441、ROM 442和RAM 443经由总线444彼此连接。

输入/输出接口445还连接到总线444。输入单元446、输出单元447、存储单元448、通信单元449和驱动器450也连接到输入/输出接口445。

输入单元446包括键盘、鼠标、麦克风等。输出单元447包括显示器、扬声器等。存储单元448包括硬盘、非易失性存储器等。通信单元449包括网络接口等。驱动器450驱动可移动的记录介质451，诸如磁盘、光盘、磁光盘或半导体存储器。

在具有上述配置的服务器装置中，CPU 441经由输入/输出接口445和总线444将例如存储在存储单元448中的程序加载到RAM 443中，并且执行程序，从而执行上述一系列处理。

在服务器装置中，可通过将可移动记录介质451放置在驱动器450中来经由输入/输出接口445将程序安装到存储单元448中。程序可以经由有线或无线传输介质(诸如，局域网、互联网或数字卫星广播)由通信单元449接收，并且可以安装到存储单元448中。程序还可以预先安装在ROM 442或存储单元448中。

服务器装置的CPU 441要执行的每个程序以及节目回放应用21可以是按本文中所述的顺序以时序方式执行处理的程序，或者可以是并行地或者在诸如调用时的需要时候执行处理的程序。

在本说明书中，术语“系统”是指一组构成元件(设备、模块(部件)等)，而与所有构成元件是否容纳在同一壳体中无关。因而，容纳在分离的壳体中并且经由网络连接的多个设备以及包括容纳在单个壳体中的多个模块的单个设备可以被定义为系统。

本技术的实施例不限于上述实施例，并且可以在背离本技术的范围的情况下进行各种改变。

例如，可以组合使用多个实施例和上述的功能中的全部或部分。

例如，本技术的实施例可以提供多个设备经由网络彼此协作地共享并处理单个功能的云计算配置。

另外，上述流程图中所示的步骤可以由单个设备执行或者可以由多个设备共享并执行。

另外，如果单个步骤包括多个处理，则单个步骤中包括的处理可由单个设备执行，或者可由多个设备共享并执行。

本技术的实施例还可以提供以下配置。

(1)一种回放控制设备，包括：

回放控制器，被配置为控制第一内容和第二内容的回放，所述第一内容用于输出使用语音合成处理基于文本信息而生成的第一声音，所述第二内容用于输出未使用所述语音合成处理生成的第二声音，其中所述回放控制器使得要回放的内容的属性显示在屏幕上，所述属性表示该内容是否用以输出使用语音合成处理基于文本信息而生成的声音。

(2)根据(1)所述的回放控制设备，其中，所述回放控制器还使得以突出状态显示与该时间输出的声音相关联的显示部分。

(3)根据(1)所述的回放控制设备，其中，所述回放控制器还根据在生成声音时所使用的文本信息的内容来改变作为所述声音的一部分的朗读者或背景音乐。

(4)根据(1)所述的回放控制设备，其中，用于使用所述语音合成处理基于所述文本信息生成声音的文本转语音功能被配置为开启或关闭，以及

所述回放控制器使得根据对于开启或关闭所述文本转语音功能的设置来朗读所述第一内容。

(5)根据(1)所述的回放控制设备，其中，要朗读的所述第一内容的文本信息的一部分根据用户的偏好信息或简档随用户不同而不同。

(6)根据(3)所述的回放控制设备，其中，所述内容的属性还表示该内容是要使用所述语音合成处理来朗读还是通过回放音乐的音频数据而经由音频输出。

(7)根据(1)所述的回放控制设备，其中，所述内容的属性还表示该内容是否要在所述回放控制设备中经历闭合处理。

(8)根据(1)所述的回放控制设备，其中，所述内容的属性还表示该内容是否是仅使用所述回放控制设备中的本地数据的内容。

(9)根据(1)所述的回放控制设备，其中，所述内容是使用外部服务器中的内容数据的内容，并且所述回放控制器还执行控制，以利用使用所述回放控制设备中的本地数据的内容替换使用外部服务器中的内容数据的内容。

(10)根据(1)所述的回放控制设备，其中，所述回放控制器从外部服务器获取作为所述内容的数据的内容数据，并且使得通过将从所述外部服务器获取的内容数据与所述回放控制设备中的内容数据相合并来回放所述内容，所获取的内容数据包括用于将所述回放控制设备中的内容数据并入所获取的内容数据中的指令作为节目结构信息。

(11)根据(1)所述的回放控制设备，其中，所述第一内容的文本信息包括链接部分，并且所述回放控制器利用包括在从所述链接部分链接的链接目的地中的标题替换所述链接部分，并且朗读替换后的标题。

(12)根据(11)所述的回放控制设备，其中，所述第一内容的文本信息包括链接部分，并且所述回放控制器使得在子画面上显示由所述链接部分标识的链接目的地处的网页。

(13)根据(1)所述的回放控制设备，其中，

所述内容包括多个片段，并且

所述回放控制器使得在所述屏幕上显示所述内容的多个片段当中要回放的片段的属性。

(14)根据(1)所述的回放控制设备，其中，

所述内容包括多个片段，并且

当要回放所述内容的多个片段当中的片段时，所述回放控制器使得该片段的属性经由音频输出。

(15)一种回放控制方法，包括：

控制第一内容和第二内容的回放，所述第一内容用于输出使用语音合成处理基于文本信息而生成的第一声音，所述第二内容用于输出未使用所述语音合成处理生成的第二声音；以及

在屏幕上显示要回放的内容的属性，所述属性表示该内容是否用以输出使用语音合成处理基于文本信息生成的声音。

(16)一种程序，用于使得计算机执行包括如下步骤的处理：

在屏幕上显示要回放的内容的属性，所述属性表示所述内容是否用以输出使用语音合成处理基于文本信息生成的声音。

本公开包含与2012年4月3日提交的美国临时申请第61/619,677号和2012年11月28日提交的美国专利申请第13/687,844号中所公开的主题相关的主题，其全部内容通过引用合并于此。

本领域的技术人员应理解，在所附权利要求或其等同方案的范围内，根据设计要求和其它因素，可进行各种修改、组合、子组合和变更。

附图标记列表

1 节目分发系统

11 移动终端

21 节目回放应用

22 通信控制器

23 显示控制器

24 语音控制器

Claims

1.一种回放控制设备，包括：

电路，被配置为控制用户定义的节目的连续回放，所述节目包括第一内容、第二内容和第三内容，所述第一内容包括使用语音合成处理基于从第一源接收到的文本信息而生成的第一声音，所述第二内容包括使用语音合成处理、基于从不同于所述第一源的第二源接收到的文本信息而生成的第二声音，而所述第三内容包括不是使用语音合成处理生成的第三声音，

其中，所述电路显示要回放的内容的属性，所述属性表示该内容是否包括使用语音合成处理基于文本信息而生成的声音，

其中，在所述节目包括多个片段的情况下，所述电路使得在屏幕上显示所述节目的多个片段当中要回放的片段的属性。

2.根据权利要求1所述的回放控制设备，其中，所述电路还使得以突出状态显示与当前输出的声音相关联的显示部分。

3.根据权利要求1所述的回放控制设备，其中，所述电路还根据在生成声音时所使用的文本信息的内容来改变作为该声音的一部分的朗读者或背景音乐。

4.根据权利要求1所述的回放控制设备，其中，用于使用语音合成处理基于文本信息生成声音的文本转语音功能被配置为开启或关闭，以及

所述电路使得根据对于开启或关闭所述文本转语音功能的设置来朗读所述第一内容。

5.根据权利要求1所述的回放控制设备，其中，要朗读的所述第一内容的文本信息的一部分根据用户的偏好信息或简档随用户不同而不同。

6.根据权利要求1所述的回放控制设备，其中，所述内容的属性还表示该内容是要使用语音合成处理来朗读还是通过回放音乐的音频数据而经由音频输出。

7.根据权利要求1所述的回放控制设备，其中，所述内容的属性还表示该内容是否要在所述回放控制设备中经历闭合处理。

8.根据权利要求1所述的回放控制设备，其中，所述内容的属性还表示该内容是否是仅使用所述回放控制设备中的本地数据的内容。

9.根据权利要求1所述的回放控制设备，其中，所述内容是使用外部服务器中的内容数据的内容，并且所述电路还执行控制，以利用使用所述回放控制设备中的本地数据的内容替换使用外部服务器中的内容数据的内容。

10.根据权利要求1所述的回放控制设备，其中，所述电路从外部服务器获取作为所述内容的数据的内容数据，并且使得通过将从所述外部服务器获取的内容数据与所述回放控制设备中的内容数据相合并来回放所述内容，所获取的内容数据包括用于将所述回放控制设备中的内容数据并入所获取的内容数据中的指令作为节目结构信息。

11.根据权利要求1所述的回放控制设备，其中，所述第一内容的文本信息包括链接部分，并且所述电路利用包括在从所述链接部分链接的链接目的地中的标题替换所述链接部分，并且朗读替换后的标题。

12.根据权利要求1所述的回放控制设备，其中，所述第一内容的文本信息包括链接部分，并且所述电路使得在子画面上显示由所述链接部分标识的链接目的地处的网页。

13.根据权利要求1所述的回放控制设备，其中，

当要回放所述节目的多个片段当中的片段时，所述电路使得该片段的属性经由音频输出。

14.一种回放控制方法，包括：

控制用户定义的节目的连续回放，所述节目包括第一内容、第二内容和第三内容，所述第一内容包括使用语音合成处理基于从第一源接收到的文本信息而生成的第一声音，所述第二内容包括使用语音合成处理、基于从不同于所述第一源的第二源接收到的文本信息而生成的第二声音，而所述第三内容包括不是使用语音合成处理生成的第三声音；以及

显示要回放的内容的属性，所述属性表示该内容是否包括使用语音合成处理基于文本信息生成的声音，

其中，在所述节目包括多个片段的情况下，显示所述节目的多个片段当中要回放的片段的属性。