CN108053696A

CN108053696A - 一种根据阅读内容进行声音播放的方法、装置和终端设备

Info

Publication number: CN108053696A
Application number: CN201810008014.6A
Authority: CN
Inventors: 李洪
Original assignee: Guangzhou Alibaba Literature Information Technology Co Ltd
Current assignee: Alibaba China Co Ltd
Priority date: 2018-01-04
Filing date: 2018-01-04
Publication date: 2018-05-18

Abstract

本申请实施例提供了一种根据阅读内容进行声音播放的方法、装置和终端设备，所述方法包括：获得阅读对象的阅读内容，并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型；根据所述声音类型，设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。本申请实施例改善听书功能的声音播放效果，增强听书功能的情景代入感。

Description

一种根据阅读内容进行声音播放的方法、装置和终端设备

技术领域

本申请实施例涉及互联网技术领域，尤其涉及一种根据阅读内容进行声音播放的方法、装置和终端设备。

背景技术

随着电子阅读的发展，主要阅读应用程序(APP)都有听书的功能，也就是把文字通过语音识别的技术，转换成语音。听书的功能对于不方便进行文字阅读的用户非常有用，用户也可以基于阅读环境以及护眼的需求选择开启听书的功能。

但通常听书的功能都存在一些体验不好的问题，例如播放的声音语气单调，不流畅等。此外，在听书的功能中的发音人设定后不能动态变更，各种阅读内容的采用同一发音人造成听书过程枯燥，无法实现阅读内容的情景代入。

因此，如何改善听书功能的声音播放效果成为现有技术中亟需解决的技术问题。

发明内容

本申请实施例提供了一种根据阅读内容进行声音播放的方法、装置和终端设备，其改善听书功能的声音播放效果，增强听书功能的情景代入感。

根据本申请实施例的一个方面，提供了一种根据阅读内容进行声音播放的方法，所述方法包括：

获得阅读对象的阅读内容，并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型；

根据所述声音类型，设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。

根据本申请实施例的另一个方面，还提供了一种根据阅读内容进行声音播放的装置，所述装置包括：

类型确定模块，用于获得阅读对象的阅读内容，并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型；

声音播放模块，用于根据所述声音类型，设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。

根据本申请实施例的又一个方面，还提供了一种终端设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如上所述的根据阅读内容进行声音播放的方法对应的操作。

根据本申请实施例提供的技术方案，本申请获得阅读对象的阅读内容，并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。从而，根据所述声音类型，设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。由此，本申请输出的声音类型为根据阅读内容的情节信息确定的。因此，本申请改善听书功能的声音播放效果，增强听书功能的情景代入感，提升了用户体验，增强了用户黏性。

附图说明

图1是根据本申请实施例一的一种根据阅读内容进行声音播放的方法的步骤流程图；

图2是根据本申请实施例一的一种根据阅读内容进行声音播放的方法的步骤S2的步骤流程图；

图3是根据本申请实施例二的一种根据阅读内容进行声音播放的方法的步骤流程图；

图4是根据本申请实施例三的一种根据阅读内容进行声音播放的装置的结构框图；

图5是根据本申请实施例三的一种根据阅读内容进行声音播放的装置的声音播放模块结构框图；

图6是根据本申请实施例四的一种根据阅读内容进行声音播放的装置的结构框图；

图7是根据本申请实施例五的一种终端设备的结构框图。

具体实施方式

下面结合附图(若干附图中相同的标号表示相同的元素)和实施例，对本申请实施例的具体实施方式作进一步详细说明。以下实施例用于说明本申请，但不用来限制本申请的范围。

本领域技术人员可以理解，本申请实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等，既不代表任何特定技术含义，也不表示它们之间的必然逻辑顺序。

实施例一

参照图1，示出了根据本申请实施例一的一种根据阅读内容进行声音播放的方法的步骤流程图。

值得说明的是，本申请所述步骤S101至S102并不代表其执行的先后顺序。

本实施例的根据阅读内容进行声音播放的方法包括以下步骤：

步骤S101：获得阅读对象的阅读内容，并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。

在本实施例一具体实现中，所述阅读对象为可以为电子书等可阅读文件，本实施例用户在进行电子书阅读时，将阅读的电子书章节作为阅读内容。

具体地，所述阅读内容可以为一章内容，一节内容或者一段对话等。

本实施例根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。所述阅读内容的情节信息包括：

场景信息、人物性别、人物年龄、人物情绪中至少其一。

比如，根据所述阅读内容为庆祝场景，则采用欢快声音类型；根据所述阅读内容为分离场景，则采用悲伤声音类型；根据所述阅读内容为男生或者女生，则分别采用男女声音类型；根据所述阅读内容涉及的老人还是儿童，则分别采用老人儿童声音类型；根据所述阅读内容伤心或者高兴，则分别采用伤心或者高兴声音类型等。

步骤S102：根据所述声音类型，设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。

在本申请实施例的具体实现中，参见图2，所述步骤S102包括：

步骤S1021：动态选择与所述声音类型匹配的声音参数设置所述语音合成器。

步骤S1022：令所述语音合成器根据所述声音参数输出声音以播放所述阅读内容。

因此本实施例可以通过动态选择与所述声音类型匹配的声音参数设置所述语音合成器，从而实现动态的根据所述阅读内容，播放不同声音类型的声音，进一步增强了听书功能的情景代入感。例如，在对话的场景下，根据不同角色动态改变不同声音类型，输出不同的声音播放对话。

通过本实施例，本申请获得阅读对象的阅读内容，并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。从而，根据所述声音类型，设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。由此，本申请输出的声音类型为根据阅读内容的情节信息确定的。因此，本申请改善听书功能的声音播放效果，增强听书功能的情景代入感，提升了用户体验，增强了用户黏性。

本实施例的根据阅读内容进行声音播放的方法可以由任意适当的具有根据阅读内容进行声音播放的能力的设备执行，包括但不限于：各种终端设备或者服务器，包括但不限于PC机、平板电脑、移动终端等。

实施例二

参照图3，示出了根据本申请实施例二的一种根据阅读内容进行声音播放的方法的步骤流程图。

值得说明的是，本申请所述步骤S301至S303并不代表其执行的先后顺序。

步骤S301：对所述阅读对象的阅读内容配置情节信息，所述情节信息标识所述阅读内容对应的声音类型。

具体地，本实施例在文学编辑对所述阅读对象进行编辑审核时，对所述阅读对象的阅读内容配置情节信息，标识出发音人类型的声音类型。

此外，本实施例也可以采用其他方式对所述阅读内容配置情节信息，比如通过机器学习的方式等。

步骤S302：获得所述阅读对象的阅读内容，所述阅读内容数据中包含与所述阅读内容的情节信息对应的声音类型。

场景信息、人物性别、人物年龄、人物情绪中至少其一。

本实施例所述声音类型包含在阅读内容数据中，即本实施例获得阅读内容的同时可以获得所述阅读内容对应的声音类型，根据所述声音类型进行阅读内容播放。因此，由于所述阅读内容数据中包含与所述阅读内容的情节信息对应的声音类型，本实施例可以实时的获得所述阅读内容对应的声音类型，以便实时根据所述声音类型实现声音的切换。

本申请也可以在加载阅读内容时，再根据阅读内容读取所述阅读内容对应的声音类型，或者每次根据所述阅读内容判断其声音类型。

步骤S303：根据所述声音类型，设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。

在本申请实施例的具体实现中，动态选择与所述声音类型匹配的声音参数设置所述语音合成器，令所述语音合成器根据所述声音参数输出声音以播放所述阅读内容。

因此，本实施例可以通过动态选择与所述声音类型匹配的声音参数设置所述语音合成器，从而实现动态的根据所述阅读内容，播放不同声音类型的声音，进一步增强了听书功能的情景代入感。例如，在对话的场景下，根据不同角色动态改变不同声音类型，输出不同的声音播放对话。

实施例三

参照图4，示出了根据本申请实施例三的一种根据阅读内容进行声音播放的装置的结构框图。

本实施例的根据阅读内容进行声音播放的装置包括：

类型确定模块401，用于获得阅读对象的阅读内容，并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型；

声音播放模块402，用于根据所述声音类型，设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。

场景信息、人物性别、人物年龄、人物情绪中至少其一。

在本申请实施例的具体实现中，参见图5，所述声音播放模块402包括：

参数设定单元4021，用于动态选择与所述声音类型匹配的声音参数设置所述语音合成器。

声音输出单元4022，用于令所述语音合成器根据所述声音参数输出声音以播放所述阅读内容。

本实施例的根据阅读内容进行声音播放的装置可以由任意适当的具有根据阅读内容进行声音播放的能力的设备执行，包括但不限于：各种终端设备或者服务器，包括但不限于PC机、平板电脑、移动终端等。

实施例四

参照图6，示出了根据本申请实施例四的一种根据阅读内容进行声音播放的装置的结构框图。

本实施例的根据阅读内容进行声音播放的装置包括：

类型设定模块601，用于对所述阅读对象的阅读内容配置情节信息，所述情节信息标识所述阅读内容对应的声音类型。

类型确定模块602，用于获得阅读对象的阅读内容，并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型。

声音播放模块603，用于根据所述声音类型，设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。

场景信息、人物性别、人物年龄、人物情绪中至少其一。

实施例五

参照图7，示出了根据本申请实施例五的一种终端设备的结构框图，本申请具体实施例并不对终端设备的具体实现做限定。

如图7所示，该终端设备可以包括：处理器(processor)702、通信接口(Communications Interface)704、存储器(memory)706、以及通信总线708。

其中：

处理器702、通信接口704、以及存储器706通过通信总线708完成相互间的通信。

通信接口704，用于与其它设备比如其它终端或服务器等的网元通信。

处理器702，用于执行程序710，具体可以执行上述根据阅读内容进行声音播放的方法实施例中的相关步骤。

具体地，程序710可以包括程序代码，该程序代码包括计算机操作指令。

处理器702可能是中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本申请实施例的一个或多个集成电路。终端设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器706，用于存放程序710。存储器706可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序710具体可以用于使得处理器702执行以下操作：获得阅读对象的阅读内容，并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型；根据所述声音类型，设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容。

在一种可选的实施方式中，程序710还用于对所述阅读对象的阅读内容配置情节信息，所述情节信息标识所述阅读内容对应的声音类型。

在一种可选的实施方式中，程序710还用于获得所述阅读对象的阅读内容，所述阅读内容数据中包含与所述阅读内容的情节信息对应的声音类型。

在一种可选的实施方式中，所述情节信息包括：

场景信息、人物性别、人物年龄、人物情绪中至少其一。

在一种可选的实施方式中，程序710还用于动态选择与所述声音类型匹配的声音参数设置所述语音合成器；令所述语音合成器根据所述声音参数输出声音以播放所述阅读内容。

需要指出，根据实施的需要，可将本申请实施例中描述的各个部件/步骤拆分为更多部件/步骤，也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤，以实现本申请实施例的目的。

上述根据本申请实施例的方法可在硬件、固件中实现，或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码，或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码，从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解，计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如，RAM、ROM、闪存等)，当所述软件或计算机代码被计算机、处理器或硬件访问且执行时，实现在此描述的根据阅读内容进行声音播放的方法。此外，当通用计算机访问用于实现在此示出的根据阅读内容进行声音播放的方法的代码时，代码的执行将通用计算机转换为用于执行在此示出的根据阅读内容进行声音播放的方法的专用计算机。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请实施例的范围。

以上实施方式仅用于说明本申请实施例，而并非对本申请实施例的限制，有关技术领域的普通技术人员，在不脱离本申请实施例的精神和范围的情况下，还可以做出各种变化和变型，因此所有等同的技术方案也属于本申请实施例的范畴，本申请实施例的专利保护范围应由权利要求限定。

Claims

1.一种根据阅读内容进行声音播放的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获得阅读对象的阅读内容，并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型之前还包括：

对所述阅读对象的阅读内容配置情节信息，所述情节信息标识所述阅读内容对应的声音类型。

3.根据权利要求2所述的方法，其特征在于，所述获得阅读对象的阅读内容，并根据所述阅读内容的情节信息确定所述阅读内容对应的声音类型具体为：

获得所述阅读对象的阅读内容，所述阅读内容数据中包含与所述阅读内容的情节信息对应的声音类型。

4.根据权利要求3所述的方法，其特征在于，所述情节信息包括：

场景信息、人物性别、人物年龄、人物情绪中至少其一。

5.根据权利要求1至4中任一项所述的方法，其特征在于，所述根据所述声音类型，设置语音合成器输出与所述声音类型匹配的声音以播放所述阅读内容包括：

动态选择与所述声音类型匹配的声音参数设置所述语音合成器；

令所述语音合成器根据所述声音参数输出声音以播放所述阅读内容。

6.一种根据阅读内容进行声音播放的装置，其特征在于，所述装置包括：

7.根据权利要求6所述的装置，其特征在于，所述装置还包括：

类型设定模块，用于对所述阅读对象的阅读内容配置情节信息，所述情节信息标识所述阅读内容对应的声音类型。

8.根据权利要求7所述的装置，其特征在于，所述类型确定模块具体用于：

9.根据权利要求8所述的装置，其特征在于，所述情节信息包括：

场景信息、人物性别、人物年龄、人物情绪中至少其一。

10.根据权利要求6至9中任一项所述的装置，其特征在于，所述声音播放模块包括：

参数设定单元，用于动态选择与所述声音类型匹配的声音参数设置所述语音合成器；

声音输出单元，用于令所述语音合成器根据所述声音参数输出声音以播放所述阅读内容。

11.一种终端设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1-5中任一项对应的操作。