CN106210323A

CN106210323A - 一种语音播放方法及终端设备

Info

Publication number: CN106210323A
Application number: CN201610557300.9A
Authority: CN
Inventors: 成军
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2016-07-13
Filing date: 2016-07-13
Publication date: 2016-12-07
Anticipated expiration: 2036-07-13
Also published as: CN106210323B

Abstract

本发明公开了一种语音播放方法，包括：当检测到用户对语音消息的第一点击操作，确定在预设时段内所述语音消息的播放次数是否超过预设阈值；若在预设时段内所述语音消息的播放次数超过预设阈值，确定目标播放音量和目标播放速度，所述目标播放音量大于当前播放语音消息的播放音量，所述目标播放速度小于当前播放语音消息的播放速度；根据所述目标播放音量和所述目标播放速度播放所述语音消息。本发明实施例还提供了一种终端设备。采用本发明实施例可提高语音消息的收听效率。

Description

一种语音播放方法及终端设备

技术领域

本发明涉及电子技术领域，尤其涉及一种语音播放方法及终端设备。

背景技术

目前流行的社交APP(比如微信、QQ等)，通常都支持语音消息功能。如果终端设备接收到的某个语音消息语速过快或声音较小，该种情况下，用户需要将终端设备的音量适当调高，然后反复播放该语音消息，才有可能听清语音消息的内容，这样会降低语音消息的收听效率。

发明内容

本发明实施例提供一种语音播放方法及终端设备，以期提高语音消息的收听效率。

第一方面，本发明实施例提供一种语音播放方法，包括：

当检测到用户对语音消息的第一点击操作，确定在预设时段内所述语音消息的播放次数是否超过预设阈值；

若在预设时段内所述语音消息的播放次数超过预设阈值，确定目标播放音量和目标播放速度，所述目标播放音量大于当前播放语音消息的播放音量，所述目标播放速度小于当前播放语音消息的播放速度；

根据所述目标播放音量和所述目标播放速度播放所述语音消息。

在一些可能的实现方式中，所述确定目标播放音量和目标播放速度，包括：

获取当前环境的声音信息，以及根据所述声音信息确定当前环境的噪声音量值；

根据所述噪声音量值确定目标播放音量，以及根据所述语音消息的播放次数确定目标播放速度。

在一些可能的实现方式中，所述根据所述目标播放音量和所述目标播放速度播放所述语音消息之后，所述方法还包括：

若检测到用户对所述语音消息的第二点击操作，对所述语音消息进行去噪处理；

根据所述目标播放音量和所述目标播放速度播放去噪处理后的所述语音消息。

在一些可能的实现方式中，所述根据所述目标播放音量和所述目标播放速度播放所述语音消息之前，所述方法还包括：

对所述语音消息进行语音识别，得到第一文本；

在播放所述语音消息时同步显示所述第一文本。

对所述语音消息进行拆分，得到N段语音数据，所述N为大于1的整数；

获取所述N段语音数据中噪声音量值大于预设噪声音量值的M段语音数据，所述M为大于或等于1的整数；

对所述M段语音数据进行语音识别，得到第二文本；

在播放所述M段语音数据时同步显示所述第二文本。

第二方面，本发明实施例提供一种终端设备，包括：

第一确定模块，用于当检测到用户对语音消息的第一点击操作，确定在预设时段内所述语音消息的播放次数是否超过预设阈值；

第二确定模块，用于若在预设时段内所述语音消息的播放次数超过预设阈值，确定目标播放音量和目标播放速度，所述目标播放音量大于当前播放语音消息的播放音量，所述目标播放速度小于当前播放语音消息的播放速度；

播放模块，用于根据所述目标播放音量和所述目标播放速度播放所述语音消息。

在一些可能的实现方式中，所述第二确定模块具有用于：

在一些可能的实现方式中，所述终端设备还包括：

去噪模块，用于若检测到用户对所述语音消息的第二点击操作，对所述语音消息进行去噪处理；

所述播放模块，还用于根据所述目标播放音量和所述目标播放速度播放去噪处理后的所述语音消息。

在一些可能的实现方式中，所述终端设备还包括：

第一语音识别模块，用于对所述语音消息进行语音识别，得到第一文本；

第一文本显示模块，用于在播放所述语音消息时同步显示所述第一文本。

在一些可能的实现方式中，所述终端设备还包括：

语音数据分段模块，用于对所述语音消息进行拆分，得到N段语音数据，所述N为大于1的整数；

语音数据选取模块，用于获取所述N段语音数据中噪声音量值大于预设噪声音量值的M段语音数据，所述M为大于或等于1的整数；

第二语音识别模块，用于对所述M段语音数据进行语音识别，得到第二文本；

第二文本显示模块，用于在播放所述M段语音数据时同步显示所述第二文本。

第三方面，本发明实施例提供了一种终端设备，包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行如本发明实施例第一方面任一方法中所描述的部分或全部步骤。

第四方面，本发明提供一种计算机存储介质，用于储存为本发明实施例第二方面提供的终端设备所用的计算机软件指令，其包含用于执行上述方面所设计的程序。

本发明提供的方案的语音消息在一段时段内来回播放的次数超过预设阈值，有可能是因为该语音消息的语速过快或声音较小等原因导致用户来回听了好几遍，该种情况下终端设备调高播放语音消息的播放音量以及调慢语音消息的播放速度，这样能够使得用户更容易的听清该语音消息的内容，进而提高了语音消息的收听效率。

本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明第一实施例提供的一种语音播放方法的流程示意图；

图2为本发明第二实施例提供的一种语音播放方法的流程示意图；

图3为本发明第一实施例提供的一种终端设备的结构示意图；

图4为本发明第二实施例提供的一种终端设备的结构示意图；

图5为本发明第三实施例提供的一种终端设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

以下分别进行详细说明。

本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

请参见图1，图1为本发明实施例提供的一种语音播放方法的流程示意图，包括以下步骤：

S101、当检测到用户对语音消息的第一点击操作，终端设备确定在预设时段内所述语音消息的播放次数是否超过预设阈值。

S102、若在预设时段内所述语音消息的播放次数超过预设阈值，确定目标播放音量和目标播放速度，所述目标播放音量大于当前播放语音消息的播放音量，所述目标播放速度小于当前播放语音消息的播放速度。

S103、所述终端设备根据所述目标播放音量和所述目标播放速度播放所述语音消息。

其中，上述预设时段例如可以是小于1分钟内、小于2分钟内、小于5分钟内或是其他值。

其中，上述预设阈值例如可以等于1、2、3、5、6、8或是其他值。

其中，以上步骤S102的具体实施方式可以是：目标播放音量＝a*当前音量，目标播放速度＝b*当前播放速度。其中a和b为两个系数，a>1，b<1，a和b的实际值可以有软件设计者定义。如a＝1.5，b＝0.8也可以是其他值，本发明不作限定。比如，当播放次数大于预设阈值时，假设预设阈值＝5，则增大系数a和减小系数b，以此来达到更大播放音量和更慢播放速度的效果。

其中，a和b的设定不能超过某个阈值A和B，避免放大声音过大或播放声音太慢导致的声音变形。阈值A和B可以有软件设计者定义，如A＝2，B＝0.5也可以是其他值，本发明不作限定。

本发明提供的方案的语音消息在一段时段内来回播放的次数超过预设阈值，有可能是因为该语音消息的语速过快或声音较小等原因导致用户来回听了好几遍，该种情况下终端设备可调整播放语音消息的播放音量和播放速度，然后再基于调整后的播放音量和播放速度播放该语音消息，这样能够使得用户更容易的听清该语音消息的内容，进而提高了语音消息的收听效率。

可选的，以上步骤S102的具体实施方式为：

终端设备获取当前环境的声音信息，以及根据所述声音信息确定当前环境的噪声音量值；所述终端设备根据所述噪声音量值确定目标播放音量，以及根据所述语音消息的播放次数确定目标播放速度。

本发明实施例中，终端设备获取当前环境的声音信息包括当前环境中终端设备能够采集到的所有声音，比如自然界的声音，人发出的声音，音乐声或其他类型的人耳能听到的或不能听到的声音。另外，终端设备将终端设备采集到的声音信息均认为是环境噪声，在终端设备获取到的当前环境的声音信息后，终端的设备获取该声音信息对应的环境噪声值。另外，终端设备根据环境噪声值与播放音量的映射关系，确定该环境噪声对应的目标播放音量(比如，环境噪声值越大对应的播放音量越大)，然后终端设备根据播放次数与播放速度的映射关系，确定该语音消息的播放次数对应的目标播放速度(比如，播放次数越大对应的播放速度越慢)。

可选的，以上步骤S103之后，上述方法还包括：

若检测到用户对所述语音消息的第二点击操作，终端设备对所述语音消息进行去噪处理；所述终端设备根据所述目标播放音量和所述目标播放速度播放去噪处理后的所述语音消息。

本发明实施例中，在以上步骤S103之后，若终端设备再次检测到用户对该语音消息的点击操作时，表示在调整语音播放速度和播放音量后，播放该语音消息用户还是没有听清该语音消息的内容，该种情况下，终端设备在播放该语音消息之前，先对该语音信息进行去噪处理，这样可进一步的提高语音播放的效率。需要说明的是，将语音信息进行去噪处理可以采用现有技术，在此不再叙述。

可选的，以上步骤S103之前，上述方法还包括：

终端设备对所述语音消息进行语音识别，得到第一文本；终端设备在播放所述语音消息时同步显示所述第一文本。

本发明实施例中，用户之所以来回听该语音消息，大多数情况下是因为没有听清该语音消息的内容，为了进一步的提高语音播放的效率，在以上步骤S103之前，终端设备先对该语音消息进行语音识别，得到与该语音消息对应的第一文本，然后在播放该语音消息的时候同步显示该第一文本，这样可使得用户在收听语音消息时，可通过该第一文本大概了解到该语音消息的内容。需要说明的是，语音识别技术可以采用现有技术，在此不再叙述。

进一步的，举例来说，以上步骤S103之前，上述方法还包括：

终端设备对语音消息进行拆分，得到W段语音数据，假设W＝3，终端设备对第一目标语音数据进行语音识别，得到第一目标文本，第一目标语音数据对应的时间点早于该3段语音数据中除了第一目标语音数据之外的所有语音数据对应的时间点；在播放第一目标语音数据时同步显示第一目标文本，以及在播放第一目标语音数据的过程中，终端设备对第二目标语音数据进行语音识别，第二目标语音数据对应的时间点晚于第一目标语音数据对应的时间点，且第二目标语音数据对应的时间点与第一目标语音数据对应的时间点相邻；然后在播放第二目标语音数据时同步显示第二目标文本，以及在播放第二目标语音数据的过程中，对第三目标语音数据进行语音识别，以得到第三目标文本，第三目标语音数据对应的时间点晚于第二目标语音数据对应的时间点，且第三目标语音数据对应的时间点与第二目标语音数据对应的时间点相邻；在播放第三目标语音数据时同步显示第三目标文本。

其中，对语音消息进行拆分可以是按照预设时长将该语音消息进行拆分，比如，假设该语音消息的时长为30s，预设时长为3s，则将该语音消息拆分为时长为3s的10段语音数据。

可选的，以上步骤S102之前，上述方法还包括：

终端设备对所述语音消息进行拆分，得到N段语音数据，所述N为大于1的整数；所述终端设备获取所述N段语音数据中噪声音量值大于预设噪声音量值的M段语音数据，所述M为大于或等于1的整数；所述终端设备对所述M段语音数据进行语音识别，得到第二文本；所述终端设备在播放所述M段语音数据时同步显示所述第二文本。

本发明实施例中，用户之所以来回听该语音消息，大多数情况下可能是因为对方用户在录制语音消息时，某个时段有噪音，而导致用户该时段的内容没听清，因此，在以上步骤S103之前，终端设备可对该语音消息进行拆分，然后只对噪声音量值大于预设噪声音量值的多段语音数据进行语音识别，然后在播放这多段语音数据时显示这多段语音数据的文本，相对于对整个语音消息进行语音识别，本实施例只对该语音消息的部分语音数据进行语音识别，所需要的时间较短，且用户可通过该多段语音数据的文本大概了解到该多段语音数据的内容，进而进一步的提高语音播放的效率。

本发明实施例还提供了另一更为详细的方法流程，如图2所示，包括：

S201、终端设备检测用户对语音消息的点击操作。

S202、终端设备确定在预设时段内所述语音消息的播放次数是否超过预设阈值。

若是，则执行步骤S203。

若否，则不作任何操作。

S203、终端设备获取当前环境的声音信息，以及根据所述声音信息确定当前环境的噪声音量值。

S204、终端设备根据所述噪声音量值确定目标播放音量，以及根据所述语音消息的播放次数确定目标播放速度。

S205、终端设备将播放语音消息的播放音量调整为所述目标播放音量，以及将播放语音消息的播放速度调整为所述目标播放速度。

S206、终端设备对所述语音消息进行语音识别，得到第一文本。

S207、终端设备根据所述目标播放音量和所述目标播放速度播放所述语音消息，以及在播放所述语音消息时同步显示所述第一文本。

S208、终端设备再次检测用户对语音消息的点击操作。

S209、终端设备对所述语音消息进行去噪处理。

S210、终端设备根据所述目标播放音量和所述目标播放速度播放去噪处理后的所述语音消息。

需要说明的是，上述步骤S206可在步骤S203-步骤S205的执行过程中执行，这样可节省前期准备工作的时间，另外，图2所示的方法的各个步骤的具体实现过程可参见上述方法所述的具体实现过程，在此不再叙述。

本发明实施例还提供了一种终端设备300，如图3所示，包括：

第一确定模块301，用于当检测到用户对语音消息的第一点击操作，确定在预设时段内所述语音消息的播放次数是否超过预设阈值；

第二确定模块301，用于若在预设时段内所述语音消息的播放次数超过预设阈值，确定目标播放音量和目标播放速度，所述目标播放音量大于当前播放语音消息的播放音量，所述目标播放速度小于当前播放语音消息的播放速度；

播放模块303，用于根据所述目标播放音量和所述目标播放速度播放所述语音消息。

可选的，第二确定模块301具有用于：

获取当前环境的声音信息，以及根据所述声音信息确定当前环境的噪声音量值；根据所述噪声音量值确定目标播放音量，以及根据所述语音消息的播放次数确定目标播放速度；将播放语音消息的播放音量调整为所述目标播放音量，以及将播放语音消息的播放速度调整为所述目标播放速度。

可选的，播放模块303根据调整后的播放音量和播放速度播放所述语音消息之后，上述终端设备还包括：

去噪模块304，用于若检测到用户对所述语音消息的第二点击操作，对所述语音消息进行去噪处理；

所述播放模块303，还用于根据所述目标播放音量和所述目标播放速度播放去噪处理后的所述语音消息。

可选的，调整模块302调整播放语音消息的播放音量和播放速度之前，上述终端设备还包括：

第一语音识别模块305，用于对所述语音消息进行语音识别，得到第一文本；

第一文本显示模块306，用于在播放所述语音消息时同步显示所述第一文本。

语音数据分段模块307，用于对所述语音消息进行拆分，得到N段语音数据，所述N为大于1的整数；

语音数据选取模块308，用于获取所述N段语音数据中噪声音量值大于预设噪声音量值的M段语音数据，所述M为大于或等于1的整数；

第二语音识别模块309，用于对所述M段语音数据进行语音识别，得到第二文本；

第二文本显示模块310，用于在播放所述M段语音数据时同步显示所述第二文本。

需要说明的是，上述各模块(第一确定模块301、第二确定模块301、播放模块303、去噪模块304、第一语音识别模块305、第一文本显示模块306、语音数据分段模块307、语音数据选取模块308、第二语音识别模块309以及第二文本显示模块310)用于执行上述方法的相关步骤。

在本实施例中，终端设备300是以模块的形式来呈现。这里的“模块”可以指特定应用集成电路(application-specific integrated circuit，ASIC)，执行一个或多个软件或固件程序的处理器和存储器，集成逻辑电路，和/或其他可以提供上述功能的器件。此外，以上第一确定模块301、第二确定模块301、播放模块303、去噪模块304、第一语音识别模块305、第一文本显示模块306、语音数据分段模块307、语音数据选取模块308、第二语音识别模块309以及第二文本显示模块310可通过图4所示的终端设备的处理器401来实现。

如图4所示，终端设备400可以以图4中的结构来实现，该终端设备400包括至少一个处理器401，至少一个存储器402以及至少一个通信接口403。所述处理器401、所述存储器402和所述通信接口403通过所述通信总线连接并完成相互间的通信。

处理器401可以是通用中央处理器(CPU)，微处理器，特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制以上方案程序执行的集成电路。

通信接口403，用于与其他设备或通信网络通信，如以太网，无线接入网(RAN)，无线局域网(Wireless Local Area Networks，WLAN)等。

存储器402可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(randomaccess memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory，EEPROM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，通过总线与处理器相连接。存储器也可以和处理器集成在一起。

其中，所述存储器402用于存储执行以上方案的应用程序代码，并由处理器401来控制执行。所述处理器401用于执行所述存储器402中存储的应用程序代码。

存储器402存储的代码可执行以上提供的终端设备执行的图1-图2的语音播放方法，比如当检测到用户对语音消息的点击操作时，确定在预设时段内所述语音消息的播放次数是否超过预设阈值；若在预设时段内所述语音消息的播放次数超过预设阈值，调整播放语音消息的播放音量和播放速度，以及根据调整后的播放音量和播放速度播放所述语音消息。

本发明实施例还提供了一个更为具体的应用场景，如下：上述终端设备为手机，下面结合图5对手机的各个构成部件进行具体的介绍：

RF电路510可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器580处理；另外，将设计上行的数据发送给基站。通常，RF电路510包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier，LNA)、双工器等。此外，RF电路510还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(GlobalSystem of Mobile communication，GSM)、通用分组无线服务(General Packet RadioService，GPRS)、码分多址(Code Division Multiple Access，CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution，LTE)、电子邮件、短消息服务(Short Messaging Service，SMS)等。

存储器520可用于存储软件程序以及模块，处理器580通过运行存储在存储器520的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器520可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如播放音量调节功能、播放速度调节功能、当前环境的噪声音量值确定功能)等；存储数据区可存储根据手机的使用所创建的数据(比如噪声音量值与播放音量的映射关系、解析语音消息得到的第一文本等。此外，存储器520可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元530可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元530可包括触控面板531、其他输入设备532。触控面板531，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板531上或在触控面板531附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板531可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器580，并能接收处理器580发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板531。除以了触控面板531，输入单元530还可以包括其他输入设备532。具体地，其他输入设备532可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的至少一种。

显示单元540可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元540可包括显示面板541，可选的，可以采用液晶显示器(Liquid CrystalDisplay，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板541。进一步的，触控面板531可覆盖显示面板541，当触控面板531检测到在其上或附近的触摸操作后，传送给处理器580以确定触摸事件的类型，随后处理器580根据触摸事件的类型在显示面板541上提供相应的视觉输出。虽然在图5中，触控面板531与显示面板541是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板531与显示面板541集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器550，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板541的亮度，接近传感器可在手机移动到耳边时，关闭显示面板541和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路560、扬声器561，传声器562可提供用户与手机之间的音频接口。音频电路560可将接收到的音频数据转换后的电信号，传输到扬声器561，由扬声器561转换为声音信号输出；另一方面，传声器562将收集的声音信号转换为电信号，由音频电路560接收后转换为音频数据，再将音频数据输出处理器580处理后，经RF电路510以发送给比如另一手机，或者将音频数据输出至存储器520以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块570可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图5示出了WiFi模块570，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器580是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器520内的软件程序和/或模块，以及调用存储在存储器520内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器580可包括一个或多个处理单元；优选的，处理器580可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器580中。

手机还包括给各个部件供电的电源590(比如电池)，优选的，电源可以通过电源管理系统与处理器580逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

前述实施例中，各步骤方法流程可以基于图5所示的终端设备的结构实现。

本发明实施例还提供一种计算机存储介质，其中，该计算机存储介质可存储有程序，该程序执行时包括上述方法实施例中记载的任何一种语音播放方法的部分或全部步骤。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，RandomAccess Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器(英文：Read-Only Memory，简称：ROM)、随机存取器(英文：RandomAccess Memory，简称：RAM)、磁盘或光盘等。

以上对本发明实施例进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上上述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种语音播放方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述确定目标播放音量和目标播放速度，包括：

3.根据权利要求1或2所述的方法，其特征在于，所述根据所述目标播放音量和所述目标播放速度播放所述语音消息之后，所述方法还包括：

4.根据权利要求1或2所述的方法，其特征在于，所述根据所述目标播放音量和所述目标播放速度播放所述语音消息之前，所述方法还包括：

对所述语音消息进行语音识别，得到第一文本；

在播放所述语音消息时同步显示所述第一文本。

5.根据权利要求1或2所述的方法，其特征在于，所述根据所述目标播放音量和所述目标播放速度播放所述语音消息之前，所述方法还包括：

对所述M段语音数据进行语音识别，得到第二文本；

在播放所述M段语音数据时同步显示所述第二文本。

6.一种终端设备，其特征在于，包括：

7.根据权利要求6所述的终端设备，其特征在于，所述第二确定模块具有用于：

8.根据权利要求6或7所述的终端设备，其特征在于，所述终端设备还包括：

9.根据权利要求6或7所述的终端设备，其特征在于，所述终端设备还包括：

10.根据权利要求6或7所述的终端设备，其特征在于，所述终端设备还包括：

11.一种终端设备，其特征在于，包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行如权利要求1至5任一项所述的方法。