CN110032355B

CN110032355B - 语音播放方法、装置、终端设备及计算机存储介质

Info

Publication number: CN110032355B
Application number: CN201811582452.XA
Authority: CN
Inventors: 苏云琳
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2018-12-24
Filing date: 2018-12-24
Publication date: 2022-05-17
Anticipated expiration: 2038-12-24
Also published as: CN110032355A

Abstract

本发明实施例提供了一种语音播放方法、装置、终端设备及计算机存储介质，其中，语音播放方法包括：接收设定的语音播放指令，其中，所述语音播放指令用于指示使用设定语音对电子阅读对象中的内容进行语音播放；根据所述语音播放指令，获取待播放内容、所述待播放内容中的设定交互标记及所述设定交互标记对应的交互数据；使用所述语音播放指令所指示的设定语音对所述待播放内容进行语音播放，并在播放至所述设定交互标记时播放对应的所述交互数据。通过本发明实施例，即使家长不在阅读现场，也能实现家长与孩子的阅读交互，提升电子阅读对象的用户的使用体验。

Description

语音播放方法、装置、终端设备及计算机存储介质

技术领域

本发明实施例涉及计算机技术领域，尤其涉及一种用于电子阅读对象的语音播放方法、装置、终端设备及计算机存储介质。

背景技术

电子阅读对象如电子书是利用计算机技术将文字、图片、声音、影像等信息内容数字化的出版物。随着互联网技术应用的越来越广泛，传统的纸质阅读方式已逐渐被电子阅读方式取代，人们越来越趋向于利用互联网和计算机技术，通过电子方式进行阅读。

目前，电子阅读对象包括各种各样的类型和内容，童书是其中很重要的一个组成部分。基于此，现有的电子阅读方式的一种场景是：家长和孩子一同进行童书的电子阅读，由此，一方面，可以实现家长和孩子的互动，增进双方的感情交流；另一方面，对于不能识字的幼儿，也提高了其对读书的兴趣。

但在很多情况下，家长可能因各种原因无法陪伴在孩子身边，因此，如何使作为家长的用户即使不在阅读现场，也能实现与孩子的阅读交互，成为亟待解决的问题。

发明内容

有鉴于此，本发明实施例提供一种用于电子阅读对象的语音播放方案，以解决上述问题。

根据本发明实施例的第一方面，提供了一种语音播放方法，包括：接收设定的语音播放指令，其中，所述语音播放指令用于指示使用设定语音对电子阅读对象中的内容进行语音播放；根据所述语音播放指令，获取待播放内容、所述待播放内容中的设定交互标记及所述设定交互标记对应的交互数据；使用所述语音播放指令所指示的设定语音对所述待播放内容进行语音播放，并在播放至所述设定交互标记时播放对应的所述交互数据。

根据本发明实施例的第二方面，提供了一种语音播放装置，包括：第一接收模块，用于接收设定的语音播放指令，其中，所述语音播放指令用于指示使用设定语音对电子阅读对象中的内容进行语音播放；获取模块，用于根据所述语音播放指令，获取待播放内容、所述待播放内容中的设定交互标记及所述设定交互标记对应的交互数据；播放模块，用于使用所述语音播放指令所指示的设定语音对所述待播放内容进行语音播放，并在播放至所述设定交互标记时播放对应的所述交互数据。

根据本发明实施例的第三方面，提供了一种终端设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如第一方面所述的语音播放方法对应的操作。

根据本发明实施例的第四方面，提供了一种计算机存储介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面所述的语音播放方法。

根据本发明实施例提供的语音播放方案，在进行电子阅读对象的语音播放时，可以使用设定语音进行播放。其中，该设定语音可以是作为家长的用户的声音，由此，即使家长不在孩子身边，也可以实现家长为孩子读书的效果。此外，电子阅读对象的内容中还包含有设定交互标记，在语音播放至设定交互标记时，将会播放交互数据，该交互数据通常可以为家长与孩子之间常用的阅读沟通语句，由此，一方面使得家长为孩子阅读童书的场景更真实；另一方面，也可以提高孩子的阅读兴趣。从而，即使家长不在阅读现场，也能实现家长与孩子的阅读交互，提升电子阅读对象的用户的使用体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为根据本发明实施例一的一种语音播放方法的步骤流程图；

图2为根据本发明实施例二的一种语音播放方法的步骤流程图；

图3为图2所示实施例中的一种语音播放界面的示意图；

图4为根据本发明实施例三的一种语音播放装置的结构框图；

图5为根据本发明实施例四的一种语音播放装置的结构框图；

图6为根据本发明实施例五的一种终端设备的结构示意图。

具体实施方式

为了使本领域的人员更好地理解本发明实施例中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明实施例一部分实施例，而不是全部的实施例。基于本发明实施例中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于本发明实施例保护的范围。

下面结合本发明实施例附图进一步说明本发明实施例具体实现。

实施例一

参照图1，示出了根据本发明实施例一的一种语音播放方法的步骤流程图；

步骤S102：接收设定的语音播放指令。

其中，所述语音播放指令用于指示使用设定语音对电子阅读对象中的内容进行语音播放。

语音主要有音高、音强、音长、音色四要素构成，其中，音高对应声波频率，即每秒钟振动次数的多少；音强对应声波振幅的大小；音长对应声波振动持续时间的长短，也称为"时长"；音色对应声音的特色和本质，也称作"音质"。通过设定的音高、音强、音长、音色，即可形成具有一定特点的语音，如母亲或父亲的语音。在亲子阅读场景(即家长为孩子进行童书阅读的场景)中，设定语音可以是母亲或父亲的语音，但不限于此，也可以是其它与孩子有关系的人的语音，当然，也可以是孩子喜欢的其它人的语音。

设定语音可以通过适当方式生成，如语音模型、机器学习等等方式生成。在实际应用中，电子阅读对象所在的应用或程序可以提供生成所述设定语音的途径，如语音录制生成等，以为后续实现亲子阅读提供所需的真人语音。

步骤S104：根据语音播放指令，获取待播放内容、所述待播放内容中的设定交互标记及所述设定交互标记对应的交互数据。

其中，待播放内容为电子阅读对象中的内容，可以是文字内容和/或图片内容，如童书中的一页或多页内容等。

在待播放内容中设置有至少一个设定交互标记，每个设定交互标记对应有相应的交互数据，所述设定交互标记用于指示在标记位置处进行交互操作，包括但不限于语音播放所述交互数据。可选地，还可以接收交互指令或接收对所述交互数据的响应操作等，并进行相对应的处理。

在实际应用中，设定交互标记可以由本领域技术人员采用任意适当方式实现，本发明实施例对此不作限制。通常可以设置在待播放内容中的一个段落之前或之后，或者，一个页面之前或之后，或者，一个场景或一个情节片段之前或之后，或者，某个交互关键信息之前或之后，等等。

在亲子阅读场景中，交互数据通常可以为家长与孩子之间的日常阅读交互常用语句，可以为文字数据，也可以为语音数据。若为文字数据，则可以转换成设定语音进行播放；若本身即为使用设定语音生成的语音数据，则可以直接进行语音播放；若虽为语音数据但并非使用设定语音生成，则可以将其调整为设定语音后播放。

步骤S106：使用语音播放指令所指示的设定语音对待播放内容进行语音播放，并在播放至设定交互标记时播放对应的交互数据。

例如，待播放内容为文字“有一天，猪妈妈对小猪说：‘现在，你们已经长大了，应该学一些本领。你们各自去盖一座房子吧！’。三只小猪问：‘妈妈，用什么东西盖房子呢？’”，其中，在“妈妈，用什么东西盖房子呢？”之后有一个设定交互标记，在对上述内容进行语音播放时，可以使用母亲的语音朗读上述内容，在朗读完“妈妈，用什么东西盖房子呢？”之后，播放交互数据“宝贝，你知道怎么盖房子吗？我们继续往下读，看看小猪们是怎么盖房子的吧？”，然后继续后续内容的朗读。可选地,不限于上述单向播放交互数据，还可以接收孩子的语音回复，在孩子进行了肯定回复如回复“好”后，再继续后续内容的朗读。

可见，通过本实施例，在进行电子阅读对象的语音播放时，可以使用设定语音进行播放。其中，该设定语音可以是作为家长的用户的声音，由此，即使家长不在孩子身边，也可以实现家长为孩子读书的效果。此外，电子阅读对象的内容中还包含有设定交互标记，在语音播放至设定交互标记时，将会播放交互数据，该交互数据通常可以为家长与孩子之间常用的阅读沟通语句，由此，一方面使得家长为孩子阅读童书的场景更真实；另一方面，也可以提高孩子的阅读兴趣。从而，即使家长不在阅读现场，也能实现家长与孩子的阅读交互，提升电子阅读对象的用户的使用体验。

本实施例的语音播放方法可以由任意适当的具有数据处理能力的终端设备执行，包括但不限于：移动终端(如平板电脑、手机等)和PC机。

实施例二

参照图2，示出了根据本发明实施例二的一种语音播放方法的步骤流程图。

本实施例的语音播放方法包括以下步骤：

步骤S202：生成设定语音。

在一种可行方式中，本步骤可以实现为：接收用于生成与所述设定语音对应的语音模型的语音录制触发操作；根据语音录制触发操作展示相应的语音示例数据；接收根据语音示例数据录制的语音样本数据，并根据录制的语音样本数据生成所述语音模型，通过所述语音模型生成所述设定语音。

本实施例中采用语音模型生成设定语音，在建立语音模型时，需要有相应的样本数据，如，家长的语音样本数据。为此，本实施例的语音播放方案中提供了语音录制功能，当用户输入相应的语音录制触发操作，电子阅读对象所在的应用或程序接收到该语音录制触发操作，即可展示相应的一个或多个语音示例数据，作为家长的用户朗读这样语音示例数据并进行录制以作为语音样本数据；电子阅读对象所在的应用或程序接收到该语音样本数据后，可以根据该语音样本数据生成进行语音录制的用户的语音模型。

其中，语音示例数据可以由本领域技术人员根据实际需求适当选择设置，可以为需要分别录制的多句话，也可以为一段文字，本发明实施例对此不作限制。此外，根据语音样本数据生成语音模型的方式也可以由本领域技术人员根据实际需求采用任意适当的算法或方式，如，通过激励模型、声道模型、辐射模型等，或者通过对语音样本数据进行语音特征提取生成，等等，本发明实施例对此也不作限制。

由此，可以实现家长的真人语音的语音模型的建立，后续使用该语音模型即可生成该家长的语音(即所述设定语音)。

通过语音模型生成设定语音的方式，设定语音与真人声音的相似度更高，更易被设定语音的听众如孩子接受，也更易于适应不同待播放内容的语音播放。

需要说明的是，本步骤为可选步骤，在实际应用中，本领域技术人中也可以采用其它方式生成所述设定语音，或者，也可以通过第三方应用获得所述设定语音。

步骤S204：接收设定的语音播放指令。

其中，所述语音播放指令用于指示使用所述设定语音对电子阅读对象中的内容进行语音播放。

例如，可以在电子阅读对象的展示界面展示“妈妈的声音”的语音播放选项按钮，当用户点击该按钮时，即生成语音播放指令，指示使用“妈妈的声音”对该电子阅读对象的内容进行语音播放。

步骤S206：根据语音播放指令，获取待播放内容、所述待播放内容中的设定交互标记及所述设定交互标记对应的交互数据。

如前所述，待播放内容包括但不限于文字内容和/或图片内容，待播放内容中可以设定一个或多个(两个及两个以上)设定交互标记，设定交互标记可以实现为任意适当的形式，如设定符号或设定标识等，每个设定交互标记都对应有相应的交互数据，所述交互数据可以是文字数据也可以是语音数据。

在一种可行方式中，所述交互数据可以通过以下方式生成：方式一，根据预设的交互内容生成所述交互数据；和/或，方式二，获取待播放内容中的交互关键词，根据所述交互关键词和预设的交互模板生成所述交互数据。

方式一中预设的交互内容可以是通过收集海量的家长与孩子进行阅读交互时使用的交互语句，对这些交互语音进行分类和分析处理后获得，如，“宝贝喜不喜欢这个故事呀？”、“宝贝要不要继续读？”等等较为通用、与待播放的具体内容无关的语句，这样的交互内容可适用于绝大部分的电子阅读对象，可以有效提高交互数据的通用性和利用效率。

方式二中，需要针对待播放的具体内容，根据其中的交互关键词，使用预设的交互模板生成交互数据。其中，所述交互关键词可以由本领域技术人员根据实际需求适当设置，如，可以为待播放内容中的名称，如动物名字、植物名字、物品名字、人名等，也可以为动作，如盖房子、开火车等，还可以是待播放内容中的部分语句，如用什么东西盖房子，等。在亲子阅读场景中，预设的交互模板可以根据家长与孩子的常用阅读交互语句生成，如“宝贝喜不喜欢XXX？”，其中的“XXX”在语音播放待播放内容时，可以由待播放内容中的前述交互关键词替换。通过这种方式生成的交互数据与待播放内容的关联性更强，可以更接近真实的亲子阅读场景。

可选地，所述交互模板可以通过以下方式生成：接收输入的交互样本数据，根据所述交互样本数据生成所述交互模板。其中，所述交互样本数据可以是文字数据，也可以是语音数据。该交互样本数据可以在初始时由作为家长的用户录制语音输入或者通过文字输入。根据所述交互样本数据生成的所述交互模板，与家长实际使用的交互语句更为接近，提高亲子阅读场景下的交互效果。但不限于此，在实际应用中，交互模板也可以由电子阅读对象所在的应用或程序预先设置，无需用户输入样本数据，简化用户操作。

步骤S208：使用语音播放指令所指示的设定语音对待播放内容进行语音播放，并在播放至设定交互标记时播放对应的交互数据。

例如，当设定交互标记为设定符号时，在使用设定语音播放待播放内容的过程中，若发现下一待播放内容数据为设定符号，则获取与该设定符号对应的交互数据，进而使用设定语音播放该交互数据，在播放完该交互数据后，再接续播放设定符号后的内容。

至此，可实现亲子阅读场景下的语音播放。但为了提升用户体验，还可以进一步执行下述可选步骤。

步骤S210：接收对播放的交互数据的响应操作，执行所述响应操作所指示的处理。

其中，所述响应操作包括但不限于以下至少之一：用于指示重复播放待播放内容中的全部或部分内容的操作、用于指示获取新的待播放内容的操作、用于指示暂停语音播放的操作、用于指示退出语音播放的操作。相应地，所述响应操作所指示的处理对应包括但不限于：重复播放前次播放内容中的全部或部分内容、获取新的待播放内容、暂停当前语音播放、退出当前语音播放。

例如，语音播放交互数据“宝贝，我们接着往下看好不好啊？”，若接收到语音“再看一遍”，则可以将其确定为用于指示重复播放待播放内容中的全部或部分内容的操作，将会将前次语音播放的全部内容再次播放一遍；若接收到语音“小猪盖房”(前次播放内容中的内容)，则也可以将其确定为用于指示重复播放待播放内容中的全部或部分内容的操作，将会将前次语音播放的内容中与“小猪盖房”有关的那部分内容再次播放一遍；若接收到语音“好”，则可以将其确定为用于指示获取新的待播放内容的操作，则会获取新的内容并进行播放；若接收到语音“停”，则可以将其确定为用于指示暂停语音播放的操作，则会暂停当前的语音播放；若接收到语音“不想看了”，则可以将其确定为用于指示退出语音播放的操作，可以停止当前的语音播放，并且退出当前的电子阅读对象和/或退出电子阅读对象所在的应用或程序。

其中，在判断接收到的响应操作到底为何种具体响应操作时，可以通过语义分析接收到的响应内容，进而根据语义分析结果确定其为何种具体响应操作；或者，也可以通过关键词匹配的方式，判断接收到的响应内容中是否存在设定的响应关键词，并将其与具体响应操作进行匹配，当然，本领域技术人员也可以采用其它适当的方式实现具体响应操作的确定。

但不限于此，在实际应用中，响应操作还可以以在电子阅读对象的展示界面中展示相应的选项的方式实现，如设置相应的响应操作按钮，通过点击按钮触发具体的响应操作，并进行与该具体的响应操作相对应的处理。

此外，可选地，在播放所述交互数据的过程中，还可能接收到通信触发操作；进而根据所述通信触发操作，获取预设的通信用户的通信联系信息；根据通信联系信息，与所述通信用户建立通信连接。其中，所述通信连接包括但不限于：普通通话连接(如打电话)、即时通讯连接(如钉钉或微信)。对于年纪较小的幼儿，虽然前述语音播放方式可以实现母亲或父亲的声音为其读书，但仍然有可能出现在阅读过程中想要母亲或父亲陪伴的情况，此种情况下，可以通过语音或者展示的通信选项实现通信触发操作，进而根据预设的通信用户如母亲或父亲的通信联系信息，进行相应的通信连接。

例如，若在电子阅读对象所在的应用或程序中预设了母亲的联系电话，若在语音播放过程中，接收到孩子的语音“我要妈妈”，则可以弹出联系电话，在接收到进行通信连接的指令(如接收到“拨打”按钮被点击的操作)后，拨打联系电话，以建立孩子与母亲的电话连接。当母亲的通信联系信息为钉钉号时，若在语音播放过程中，接收到孩子的语音“我要妈妈”，则可以调用本地的钉钉APP，通过钉钉APP展示相应的可建立通信连接的界面，进而通过对该界面中的相应选项的操作实现即时通讯连接。

一种在语音播放过程中进行通信连接的语音播放界面如图3所示，图3示意性地示出了在孩子阅读绘画本童书的过程中，发出“我要妈妈”的语音时，电子阅读对象的当前界面中弹出母亲的联系电话及建立电话连接的相应选项，包括“拨打”和“取消”，若“拨打”按钮被按下，则将建立当前电子终端与母亲侧电子终端的电话连接，实现孩子与母亲的电话通话。

通过这种方式，可以有效应对亲子阅读场景中家长不在孩子身边时的突发情况，提升用户使用体验。

通过本实施例，在进行电子阅读对象的语音播放时，可以使用设定语音进行播放。其中，该设定语音可以是作为家长的用户的声音，由此，即使家长不在孩子身边，也可以实现家长为孩子读书的效果。此外，电子阅读对象的内容中还包含有设定交互标记，在语音播放至设定交互标记时，将会播放交互数据，该交互数据通常可以为家长与孩子之间常用的阅读沟通语句，由此，一方面使得家长为孩子阅读童书的场景更真实；另一方面，也可以提高孩子的阅读兴趣。从而，即使家长不在阅读现场，也能实现家长与孩子的阅读交互，提升电子阅读对象的用户的使用体验。

实施例三

参照图4，示出了根据本发明实施例三的一种语音播放装置的结构框图。

本实施例的语音播放装置包括：第一接收模块302，用于接收设定的语音播放指令，其中，所述语音播放指令用于指示使用设定语音对电子阅读对象中的内容进行语音播放；获取模块304，用于根据语音播放指令，获取待播放内容、所述待播放内容中的设定交互标记及所述设定交互标记对应的交互数据；播放模块306，用于使用语音播放指令所指示的设定语音对待播放内容进行语音播放，并在播放至设定交互标记时播放对应的交互数据。

例如，第一接收模块302接收到了用户通过点击“妈妈的声音”按钮而生成的语音播放指令后，获取模块304将根据该指令，获取待播放的某页童书的内容、该内容中的设定交互标记及对应的交互数据，然后，播放模块306即可使用与“妈妈的声音”对应的语音开始进行该页童书内容的播放，在播放过程中若遇到设定交互标记，如在某段播放完后遇到设定交互标记，则使用与“妈妈的声音”对应的语音播放与该设定交互标记对应的交互数据，如交互语音，等。

需要说明的是，本实施例的语音播放装置用于实现前述多个方法实施例中相应的语音播放方法，并具有相应的方法实施例的有益效果，在此不再赘述。

实施例四

参照图5，示出了根据本发明实施例四的一种语音播放装置的结构框图。

本实施例的语音播放装置包括：第一接收模块402，用于接收设定的语音播放指令，其中，所述语音播放指令用于指示使用设定语音对电子阅读对象中的内容进行语音播放；获取模块404，用于根据语音播放指令，获取待播放内容、所述待播放内容中的设定交互标记及所述设定交互标记对应的交互数据；播放模块406，用于使用语音播放指令所指示的设定语音对待播放内容进行语音播放，并在播放至设定交互标记时播放对应的交互数据。

可选地，本实施例的语音播放装置还包括：第二接收模块408，用于接收对播放的交互数据的响应操作，执行所述响应操作所指示的处理。

可选地，所述响应操作包括以下至少之一：用于指示重复播放所述待播放内容中的全部或部分内容的操作、用于指示获取新的待播放内容的操作、用于指示暂停语音播放的操作、用于指示退出语音播放的操作。

可选地，本实施例的语音播放装置还包括：通信模块410，用于在播放交互数据的过程中，接收到通信触发操作；根据所述通信触发操作，获取预设的通信用户的通信联系信息；根据所述通信联系信息，与所述通信用户建立通信连接。

可选地，本实施例的语音播放装置还包括第一生成模块412，用于根据预设的交互内容生成所述交互数据；和/或，获取待播放内容中的交互关键词，根据所述交互关键词和预设的交互模板生成所述交互数据。

可选地，第一生成模块412通过接收输入的交互样本数据，根据所述交互样本数据生成所述交互模板。

可选地，本实施例的语音播放装置还包括：第二生成模块414，用于在第一接收模块402接收设定的语音播放指令之前，接收用于生成与所述设定语音对应的语音模型的语音录制触发操作；根据语音录制触发操作展示相应的语音示例数据；接收根据语音示例数据录制的语音样本数据，并根据录制的语音样本数据生成语音模型，通过语音模型生成所述设定语音。

例如，用户在使用设定语音进行语音播放前，先通过第二生成模块414生成语音模型，进而生成所述设定语音，此外，用户还可以通过第一生成模块412生成相应的交互数据；接着，在第一接收模块402在接收到设定的语音播放指令后，获取模块404获取相应的待播放内容、待播放内容中的设定交互标记及对应的交互数据；继而，播放模块406使用第二生成模块414生成的设定语音播放待播放内容，并在播放至设定交互标记时播放对应的交互数据；然后，若第二接收模块408接收到对播放的交互数据的响应操作，则执行相应的处理，如，重复播放前次内容中的部分或全部内容，或者获取新的待播放内容进行播放，或者暂停或退出语音播放。此外，在交互数据的语音播放的过程中，若通信模块410接收到通信触发操作，则获取预设的通信用户的通信联系信息，并与所述通信用户建立通信连接，以应对亲子阅读场景下的突发情况。

需要说明的是，上述各模块均为逻辑划分模块，在实际应用中，上述各模块可以单独设置，也可以合并设置，还可以通过多个子模块实现一个模块的功能。

本实施例的语音播放装置用于实现前述多个方法实施例中相应的语音播放方法，并具有相应的方法实施例的有益效果，在此不再赘述。

实施例五

参照图6，示出了根据本发明实施例五的一种终端设备的结构示意图，本发明具体实施例并不对终端设备的具体实现做限定。

如图6所示，该终端设备可以包括：处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。

其中：

处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。

通信接口504，用于与其它终端设备或服务器进行通信。

处理器502，用于执行程序510，具体可以执行上述语音播放方法实施例中的相关步骤。

具体地，程序510可以包括程序代码，该程序代码包括计算机操作指令。

处理器502可能是中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。终端设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器506，用于存放程序510。存储器506可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序510具体可以用于使得处理器502执行以下操作：接收设定的语音播放指令，其中，所述语音播放指令用于指示使用设定语音对电子阅读对象中的内容进行语音播放；根据所述语音播放指令，获取待播放内容、所述待播放内容中的设定交互标记及所述设定交互标记对应的交互数据；使用所述语音播放指令所指示的设定语音对所述待播放内容进行语音播放，并在播放至所述设定交互标记时播放对应的所述交互数据。

在一种可选的实施方式中，程序510还用于使得处理器502接收对播放的所述交互数据的响应操作，执行所述响应操作所指示的处理。

在一种可选的实施方式中，所述响应操作包括以下至少之一：用于指示重复播放所述待播放内容中的全部或部分内容的操作、用于指示获取新的待播放内容的操作、用于指示暂停语音播放的操作、用于指示退出语音播放的操作。

在一种可选的实施方式中，程序510还用于使得处理器502在播放所述交互数据的过程中，接收到通信触发操作；根据所述通信触发操作，获取预设的通信用户的通信联系信息；根据所述通信联系信息，与所述通信用户建立通信连接。

在一种可选的实施方式中，所述交互数据通过以下方式生成：根据预设的交互内容生成所述交互数据；和/或，获取所述待播放内容中的交互关键词，根据所述交互关键词和预设的交互模板生成所述交互数据。

在一种可选的实施方式中，所述交互模板通过以下方式生成：接收输入的交互样本数据，根据所述交互样本数据生成所述交互模板。

在一种可选的实施方式中，程序510还用于使得处理器502在接收设定的语音播放指令之前，接收用于生成与所述设定语音对应的语音模型的语音录制触发操作；根据所述语音录制触发操作展示相应的语音示例数据；接收根据所述语音示例数据录制的语音样本数据，并根据录制的所述语音样本数据生成所述语音模型，通过所述语音模型生成所述设定语音。

程序510中各步骤的具体实现可以参见上述语音播放方法实施例中的相应步骤和单元中对应的描述，在此不赘述。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的设备和模块的具体工作过程，可以参考前述方法实施例中的对应过程描述，在此不再赘述。

通过本实施例的终端设备，在进行电子阅读对象的语音播放时，可以使用设定语音进行播放。其中，该设定语音可以是作为家长的用户的声音，由此，即使家长不在孩子身边，也可以实现家长为孩子读书的效果。此外，电子阅读对象的内容中还包含有设定交互标记，在语音播放至设定交互标记时，将会播放交互数据，该交互数据通常可以为家长与孩子之间常用的阅读沟通语句，由此，一方面使得家长为孩子阅读童书的场景更真实；另一方面，也可以提高孩子的阅读兴趣。从而，即使家长不在阅读现场，也能实现家长与孩子的阅读交互，提升电子阅读对象的用户的使用体验。

需要指出，根据实施的需要，可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤，也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤，以实现本发明实施例的目的。

上述根据本发明实施例的方法可在硬件、固件中实现，或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码，或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码，从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解，计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如，RAM、ROM、闪存等)，当所述软件或计算机代码被计算机、处理器或硬件访问且执行时，实现在此描述的语音播放方法。此外，当通用计算机访问用于实现在此示出的语音播放方法的代码时，代码的执行将通用计算机转换为用于执行在此示出的语音播放方法的专用计算机。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明实施例的范围。

以上实施方式仅用于说明本发明实施例，而并非对本发明实施例的限制，有关技术领域的普通技术人员，在不脱离本发明实施例的精神和范围的情况下，还可以做出各种变化和变型，因此所有等同的技术方案也属于本发明实施例的范畴，本发明实施例的专利保护范围应由权利要求限定。

Claims

1.一种语音播放方法，包括：

接收设定的语音播放指令，其中，所述语音播放指令用于指示使用设定语音对电子阅读对象中的内容进行语音播放；

根据所述语音播放指令，获取待播放内容、所述待播放内容中的设定交互标记及所述设定交互标记对应的交互数据；

使用所述语音播放指令所指示的设定语音对所述待播放内容进行语音播放，并在播放至所述设定交互标记时播放对应的所述交互数据；

其中，所述交互数据通过以下方式生成：根据收集的家长与孩子进行阅读交互时使用的交互语句生成所述交互数据；和/或，获取所述待播放内容中的交互关键词，根据所述交互关键词和基于家长与孩子的常用阅读交互语句生成的交互模板生成所述交互数据。

2.根据权利要求1所述的方法，其中，所述方法还包括：

接收对播放的所述交互数据的响应操作，执行所述响应操作所指示的处理。

3.根据权利要求2所述的方法，其中，

所述响应操作包括以下至少之一：用于指示重复播放所述待播放内容中的全部或部分内容的操作、用于指示获取新的待播放内容的操作、用于指示暂停语音播放的操作、用于指示退出语音播放的操作。

4.根据权利要求1所述的方法，其中，所述方法还包括：

在播放所述交互数据的过程中，接收到通信触发操作；

根据所述通信触发操作，获取预设的通信用户的通信联系信息；

根据所述通信联系信息，与所述通信用户建立通信连接。

5.根据权利要求1所述的方法，其中，所述交互模板通过以下方式生成：

接收输入的交互样本数据，根据所述交互样本数据生成所述交互模板。

6.根据权利要求1-4任一项所述的方法，其中，在所述接收设定的语音播放指令之前，所述方法还包括：

接收用于生成与所述设定语音对应的语音模型的语音录制触发操作；

根据所述语音录制触发操作展示相应的语音示例数据；

接收根据所述语音示例数据录制的语音样本数据，并根据录制的所述语音样本数据生成所述语音模型，通过所述语音模型生成所述设定语音。

7.一种语音播放装置，包括：

第一接收模块，用于接收设定的语音播放指令，其中，所述语音播放指令用于指示使用设定语音对电子阅读对象中的内容进行语音播放；

获取模块，用于根据所述语音播放指令，获取待播放内容、所述待播放内容中的设定交互标记及所述设定交互标记对应的交互数据；

播放模块，用于使用所述语音播放指令所指示的设定语音对所述待播放内容进行语音播放，并在播放至所述设定交互标记时播放对应的所述交互数据；

所述装置还包括第一生成模块，用于根据收集的家长与孩子进行阅读交互时使用的交互语句生成所述交互数据；和/或，获取所述待播放内容中的交互关键词，根据所述交互关键词和基于家长与孩子的常用阅读交互语句生成的交互模板生成所述交互数据。

8.根据权利要求7所述的装置，其中，所述装置还包括：

第二接收模块，用于接收对播放的所述交互数据的响应操作，执行所述响应操作所指示的处理。

9.根据权利要求8所述的装置，其中，

10.根据权利要求7所述的装置，其中，所述装置还包括：

通信模块，用于在播放所述交互数据的过程中，接收到通信触发操作；根据所述通信触发操作，获取预设的通信用户的通信联系信息；根据所述通信联系信息，与所述通信用户建立通信连接。

11.根据权利要求7所述的装置，其中，所述第一生成模块通过接收输入的交互样本数据，根据所述交互样本数据生成所述交互模板。

12.根据权利要求7-10任一项所述的装置，其中，所述装置还包括：

第二生成模块，用于在所述第一接收模块接收设定的语音播放指令之前，接收用于生成与所述设定语音对应的语音模型的语音录制触发操作；根据所述语音录制触发操作展示相应的语音示例数据；接收根据所述语音示例数据录制的语音样本数据，并根据录制的所述语音样本数据生成所述语音模型，通过所述语音模型生成所述设定语音。

13.一种终端设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1-6中任一项所述的语音播放方法对应的操作。

14.一种计算机存储介质，其上存储有计算机程序，该程序被处理器执行时实现如权利要求1-6中任一所述的语音播放方法。