CN111899576A

CN111899576A - 发音测试应用的控制方法、装置、存储介质和电子设备

Info

Publication number: CN111899576A
Application number: CN202010717405.2A
Authority: CN
Inventors: 柳青; 黄羿衡
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-07-23
Filing date: 2020-07-23
Publication date: 2020-11-06

Abstract

本申请提供一种发音测试应用的控制方法、装置、存储介质和电子设备，属于计算机技术领域。本申请在等级选择界面中显示有多个不同等级的发音测试对应的等级启动控件，响应针对任意一个目标等级对应的等级启动控件的触发操作，显示该目标等级对应的发音练习界面，发音练习界面中显示有发音测试文本，获取用户输入的朗读发音测试文本的语音数据，显示根据获取的语音数据与测试文本对应的参考语音数据确定的发音准确度信息。该方法可以反映用户在语言学习过程中的发音水平，且可以显示用户针对目标等级的发音测试文本的发音准确度信息，有利于用户根据显示的发音准确度信息针对性地进行语言发音学习。

Description

发音测试应用的控制方法、装置、存储介质和电子设备

技术领域

本申请实施例涉及计算机技术领域，尤其涉及一种发音测试应用的控制方法、装置、存储介质和电子设备。

背景技术

随着计算机技术和互联网的发展，学员通过电子设备进行语言学习的现象越来越多。例如，学员可以通过音频教学或视频教学的应用进行语言学习。

对于语言学习，除了学习语法和词汇等之外，一个重要的方面是提高听说能力，尤其是说的能力。提高学习语言中说的能力，就需要提高发音准确度。例如，学习普通话时，发音准确度越高，说普通话的能力就越高。

目前大多数音频教学或视频教学的应用在进行语言教学时，通常采用填鸭式的教学方法，对于提高说语言的能力帮助较小。也有一些在线教学应用支持学员将发音练习的音频或视频发送至老师的教学端，老师收听后对学员的拼读错误进行指正，效率较低。

发明内容

为解决现有存在的技术问题，本申请实施例提供一种发音测试应用的控制方法、装置、存储介质和电子设备，可以及时根据发音练习显示发音的准确度信息，提高了发音学习的效率。

为达到上述目的，本申请实施例的技术方案是这样实现的：

第一方面，本申请实施例提供了一种发音测试应用的控制方法，包括：

响应进入应用操作，显示等级选择界面；所述等级选择界面中显示有多个不同测试等级的发音测试对应的等级启动控件；

响应针对任意一个目标等级对应的等级启动控件的触发操作，显示所述目标等级对应的发音练习界面；所述发音练习界面包括文本展示区域，所述文本展示区域显示有所述目标等级的发音测试文本；

响应通过所述发音练习界面触发的录音操作，获取语音数据；

响应录音完成的结束操作，在所述发音练习界面上显示所述语音数据的发音准确度信息以及是否通过所述目标等级的指示信息；所述发音准确度信息是将获取的语音数据与所述测试文本对应的参考语音数据进行比对得到的，所述指示信息是根据所述发音准确度信息确定的。

第二方面，本申请实施例还提供了一种发音测试应用的控制方法，应用于服务器，所述方法包括：

接收终端设备发送的准确度确定请求；所述准确度确定请求中包含语音数据和对应的测试文本信息；所述语音数据为通过所述目标等级的发音练习界面触发的录音操作获取的语音数据；所述测试文本信息为所述目标等级的发音练习界面中显示的测试文本的信息；

将所述语音数据与所述测试文本信息对应的参考语音数据进行比对，确定所述语音数据的发音准确度信息；

将所述语音数据的发音准确度信息发送至所述终端设备。

第三方面，本申请实施例还提供了一种发音测试应用的控制装置，包括：

主题选择控制单元，用于响应进入应用操作，显示等级选择界面；所述等级选择界面中显示有多个不同测试等级的发音测试对应的等级启动控件；

等级选择控制单元，用于响应针对任意一个目标等级对应的等级启动控件的触发操作，显示所述目标等级对应的发音练习界面；所述发音练习界面包括文本展示区域，所述文本展示区域显示有所述目标等级的发音测试文本；

语音采集单元，用于响应通过所述发音练习界面触发的录音操作，获取语音数据；

信息显示单元，用于响应录音完成的结束操作，在所述发音练习界面上显示所述语音数据的发音准确度信息以及是否通过所述目标等级的指示信息；所述发音准确度信息是将获取的语音数据与所述测试文本对应的参考语音数据进行比对得到的，所述指示信息是根据所述发音准确度信息确定的。

在一种可选的实施例中，所述等级选择界面中显示有多个不同测试等级的发音测试对应的等级启动控件，具体包括：相邻上一级测试等级为已经通过状态的测试等级对应的等级启动控件，显示为可触发状态，相邻上一级测试等级为未通过状态的测试等级对应的等级启动控件，显示为不可触发状态；

所述等级选择控制单元，具体用于：当所述目标等级对应的等级启动控件为可触发状态时，显示所述目标等级对应的发音练习界面。

在一种可选的实施例中，所述主题选择控制单元，具体用于：

响应进入应用操作，显示主题选择界面；所述主题选择界面中显示有多个不同主题的发音测试对应的主题启动控件；

响应针对任意一个目标主题对应的主题启动控件的触发操作，显示所述目标主题对应的等级选择界面。

在一种可选的实施例中，所述发音测试应用的控制装置还包括请求发送单元和信息接收单元，

所述请求发送单元，用于：生成包含所述语音数据和对应的测试文本信息的准确度确定请求，并将所述准确度确定请求发送至服务器；

所述信息接收单元，用于：接收所述服务器返回的所述语音数据的发音准确度信息；所述发音准确度信息为所述服务器根据所述准确度确定请求确定的。

在一种可选的实施例中，所述发音准确度信息包括所述语音数据对应的各维度属性值和发音准确度级别，所述是否通过所述目标等级的指示信息是根据发音准确度级别确定的。

在一种可选的实施例中，所述发音测试为普通话发音测试，所述语音数据的发音准确度信息包括如下维度属性值中的至少一种：声母准确度值、韵母准确度值、声调准确度值、语句正确度值、语句流畅度值；

所述信息显示单元，具体用于：

根据设定的显示模式，分别显示各个维度属性值；

显示根据各个维度属性值确定的发音准确度级别。

在一种可选的实施例中，所述语音数据的发音准确度信息，包括如下五个维度的属性值：声母准确度值、韵母准确度值、声调准确度值、语句正确度值、语句流畅度值。

在一种可选的实施例中，所述发音测试应用的控制装置还包括准确度确定单元，用于：

获取所述语音数据中包含的各个单字语音，并将各个单字语音与标准声母音进行比对，确定是否存在单字声母错误；根据各个单字语音对应的声母音比对结果，确定所述语音数据对应的声母准确度值；

以及用于：

获取所述语音数据中包含的各个单字语音，并将各个单字语音与标准韵母音进行比对，确定是否存在单字韵母错误；根据各个单字语音对应的韵母音比对结果，确定所述语音数据对应的韵母准确度值；

以及用于：

获取所述语音数据中包含的各个单字语音，并将各个单字语音与对应的单字标准语音进行声调比对，确定是否存在声调错误；根据各个单字语音对应的声调比对结果，确定所述语音数据对应的声调准确度值。

在一种可选的实施例中，所述准确度确定单元，还用于：

获取所述语音数据中包含的各个单字语音，将所述语音数据中的各个单字语音与所述参考语音数据中的各个单字语音进行比对，根据存在的错字、漏字或添字错误的数量，确定所述语音数据对应的语句正确度值。

在一种可选的实施例中，所述准确度确定单元，还用于：

根据所述语音数据中相邻的单字语音之间存在的停顿语音的数量确定所述语音数据对应的语句流畅度值。

第四方面，本申请实施例还提供了一种发音测试应用的控制装置，包括：

请求接收单元，用于接收终端设备发送的准确度确定请求；所述准确度确定请求中包含语音数据和对应的测试文本信息；所述语音数据为通过所述目标等级的发音练习界面触发的录音操作获取的语音数据；所述测试文本信息为所述目标等级的发音练习界面中显示的测试文本的信息；

数据分析单元，用于将所述语音数据与所述测试文本信息对应的参考语音数据进行比对，确定所述语音数据的发音准确度信息；

信息发送单元，用于将所述语音数据的发音准确度信息发送至所述终端设备。

第五方面，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时，实现上述第一方面或第二方面任一种的发音测试应用的控制方法。

第六方面，本申请实施例还提供了一种电子设备，包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机程序，当所述计算机程序被所述处理器执行时，使得所述处理器实现上述第一方面或第二方面任一种的发音测试应用的控制方法。

本申请实施例提供的发音测试应用的控制方法、装置、存储介质和电子设备，在等级选择界面中显示有多个不同等级的发音测试对应的等级启动控件，响应针对任意一个目标等级对应的等级启动控件的触发操作，显示该目标等级对应的发音练习界面，发音练习界面中显示有发音测试文本，获取用户输入的朗读发音测试文本的语音数据，显示根据获取的语音数据与测试文本对应的参考语音数据确定的发音准确度信息，相比现有技术，可以及时向用户反馈发音准确度，激励用户继续学习，提高了发音学习的效率和效果。进一步的，该方法通过设置不同的等级对用户的发音准确度进行测试，可以反映用户在语言学习过程中的发音水平及发音水平的提高过程，该方法可以显示用户针对目标等级的发音测试文本的发音准确度信息，有利于用户根据显示的发音准确度信息针对性地进行语言发音学习。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种发音测试应用的控制方法的应用场景图；

图2为本申请实施例提供的一种发音测试应用的控制方法的流程示意图；

图3为本申请实施例提供的另一种发音测试应用的控制方法的流程示意图；

图4为本申请实施例提供的一种主题选择界面的示意图；

图5为本申请实施例提供的一种等级选择界面的示意图；

图6为本申请实施例提供的一种发音练习界面的示意图；

图7为本申请实施例提供的另一种发音练习界面的示意图；

图8为本申请实施例提供的另一种发音练习界面的示意图；

图9为本申请实施例提供的一种终端设备与服务器的交互图；

图10为本申请实施例提供的另一种发音测试应用的控制方法的流程示意图；

图11为本申请实施例提供的一种发音测试应用的控制装置的结构示意图；

图12为本申请实施例提供的另一种发音测试应用的控制装置的结构示意图；

图13为本申请实施例提供的另一种发音测试应用的控制装置的结构示意图；

图14为本申请实施例提供的另一种发音测试应用的控制装置的结构示意图；

图15为本申请实施例提供的一种电子设备的结构示意图；

图16为本申请实施例提供的另一种电子设备的结构示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

需要说明的是，本申请的文件中涉及的术语“包括”和“具有”以及它们的变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

以下对本申请实施例中的部分用语进行解释说明，以便于本领域技术人员理解。

(1)客户端：一种安装在终端设备上的软件，例如，安装在手机等移动终端上的APP，属于终端设备中的软件资源。本申请实施例提供了一种发音测试应用的客户端，该客户端具有用于在运行时与用户进行交互的可视化的操作界面，不同的操作界面上设置有不同的控件。

(2)控件：一种软件中逻辑函数的外在表现形式，在客户端的操作界面上具有可视化的图标，用户触发控件对应的图标后，控件调用对应的逻辑函数执行相应的动作，如跳转页面等。部分控件也可以与其他控件之间进行协同工作。

(3)普通话(Standard Mandarin)：中华人民共和国通用的现代标准汉语，是现代标准汉语的另一个称呼，是以北京语音为标准音，以北方官话为基础方言，以典范的现代白话文著作为语法规范的通用语。

(4)终端设备：可以安装各类客户端，包括发音测试应用客户端、社交应用客户端等，并且能够将已安装的客户端中提供的各个操作界面及操作界面中的各个对象进行显示的电子设备，该电子设备可以是移动的，也可以是固定的。例如，手机、平板电脑、各类可穿戴设备、车载设备、个人数字助理(personal digital assistant，PDA)或其它能够实现上述功能的电子设备等。

下文中所用的词语“示例性”的意思为“用作例子、实施例或说明性”。作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

文中的术语“第一”、“第二”仅用于描述目的，而不能理解为明示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征，在本申请实施例的描述中，除非另有说明，“多个”的含义是两个或两个以上。

下面结合附图及具体实施例对本申请作进一步详细的说明。

目前，很多用户通过电子设备进行语言发音的训练和学习，为了使用户可以有效地进行语言学习，快速提高发音水平，本申请实施例提供了一种发音测试应用的控制方法、装置及电子设备。

本申请实施例所提供发音测试应用的控制方法可以应用于图1示出的一种应用场景中，参见图1所示，服务器100通过网络200与终端设备300进行通信连接，其中，网络200可以是但不限于局域网、城域网或广域网等，与服务器100连接的终端设备300的数量可以是多个。终端设备300可以通过网络200和服务器100相互传输通信数据和消息。终端设备300可以是便携设备(例如：手机、平板电脑、笔记本电脑等)，也可以是计算机、智能屏或个人电脑(PC，Personal Computer)等。终端设备300上可以安装发音测试应用的客户端，用户可以通过发音测试应用的客户端进行发音练习和测试，终端设备300可以将用户操控发音测试应用的过程中产生的游戏相关数据发送至服务器100，由服务器100进行处理。服务器100用于处理各个终端设备发送的游戏相关数据，可以是任何具有联网功能并能提供数据处理能力的设备，示例性地，服务器100可以是云端服务器，可以是一台或多台服务器组成的服务器集合。

示例性地，终端设备300上安装的发音测试应用可以是普通话发音测试应用，也可以是其他语种的发音测试应用。下述实施例以普通话发音测试应用为例进行说明。终端设备上安装发音测试应用的客户端后，可以在终端设备的桌面上显示发音测试应用的应用图标，用户点击或双击桌面上的发音测试应用的应用图标，终端设备将启动发音测试应用，用户可以通过发音测试应用进行普通话发音练习，以逐步提高普通话发音水平。

本申请实施例提供的发音测试应用的控制方法，在客户端的等级选择界面中显示有多个不同测试等级的发音测试对应的等级启动控件，响应针对任意一个目标等级对应的等级启动控件的触发操作，显示该目标等级对应的发音练习界面，发音练习界面中显示有发音测试文本，获取用户输入的朗读发音测试文本的语音数据，显示根据获取的语音数据与测试文本对应的参考语音数据确定的发音准确度信息。该方法通过设置不同的等级对用户的发音准确度进行测试，可以反映用户在语言学习过程中的发音水平及发音水平的提高过程，该方法可以显示用户针对目标等级的发音测试文本的发音准确度信息，有利于用户根据显示的发音准确度信息针对性地进行语言发音学习。

图2为本申请实施例提供的一种发音测试应用的控制方法的流程图。该控制方法可以由终端设备300单独执行，即由安装在终端设备上的发音测试应用的客户端执行，或者由终端设备300与服务器100协同执行。也可以说，本申请实施例提供的发音测试应用可以是单机游戏，也可以是联网游戏。如图2所示，该方法包括如下步骤：

步骤S201，响应进入应用操作，显示等级选择界面。

用户点击发音测试应用的应用图标，终端设备接收到用户输入的进入应用操作，响应该进入应用操作，显示等级选择界面。等级选择界面中显示有多个等级启动控件，该等级启动控件可以理解为关卡图标。不同的等级启动控件对应的发音测试的等级不同。用户可以自主选择等级选择界面中显示的任意一个等级启动控件。

在一种可选的实施例中，可以在发音测试应用中针对不同主题设置测试文本，将相同主题的测试文本设置在该主题对应的关卡中，方便用户根据自己感兴趣的主题选择对应的测试文本进行发音练习，更能激发用户的学习兴趣。

具体地说，终端设备接收到用户输入的进入应用操作，在显示等级选择界面之前，可以先显示主题选择界面，主题选择界面中显示有多个不同主题的发音测试对应的主题启动控件。用户可以选择其中的一个主题启动控件，终端设备响应用户针对任意一个目标主题对应的主题启动控件的触发操作，显示该目标主题对应的等级选择界面。

步骤S202，响应针对任意一个目标等级对应的等级启动控件的触发操作，显示目标等级对应的发音练习界面。

当用户等级选择界面中的任意一个目标等级对应的等级启动控件(关卡图标)时，终端设备显示该目标等级对应的发音练习界面。发音练习界面中可以包括文本展示区域，文本展示区域显示有目标等级的发音测试文本。

在一些实施例中，每个等级可以对应有多个发音测试文本，终端设备可以从多个发音测试文本中选择一个发音测试文本显示在文本展示区域，或者，终端设备可以通过发音练习界面显示目标等级对应的多个发音测试文本的摘要信息，用户可以根据发音测试文本的摘要信息从多个发音测试文本中选择一个发音测试文本，终端设备将用户选择的发音测试文本显示在文本展示区域。

在另一些实施例中，每个等级可以对应有一个发音测试文本，用户点击某一个目标等级对应的等级启动控件后，终端设备会将该发音测试文本显示在文本展示区域。

步骤S203，响应通过发音练习界面触发的录音操作，获取语音数据。

示例性地，发音练习界面中显示有录音按键，用户通过点击录音按键触发录音操作，终端设备响应用户触发的录音操作，获取到用户输入的语音数据。

步骤S204，响应录音完成的结束操作，在发音练习界面上显示语音数据的发音准确度信息以及是否通过目标等级的指示信息。

其中，发音准确度信息是将获取的语音数据与测试文本对应的参考语音数据进行比对得到的，指示信息是根据发音准确度信息确定的。

在一些实施例中，终端设备可以将获取的语音数据与测试文本对应的参考语音数据进行比对，确定该语音数据的发音准确度信息。

在另一些实施例中，终端设备可以生成包含语音数据和对应的测试文本信息的准确度确定请求，将生成的准确度确定请求发送至服务器，由服务器确定语音数据的发音准确度信息。终端设备接收服务器返回的语音数据的发音准确度信息并进行显示。

示例性地，发音准确度信息包括语音数据对应的各维度属性值和发音准确度级别，是否通过目标等级的指示信息是根据发音准确度级别确定的。例如，发音测试为普通话发音测试时，语音数据的发音准确度信息可以包括如下维度属性值中的至少一种：声母准确度值、韵母准确度值、声调准确度值、语句正确度值、语句流畅度值。终端设备可以根据设定的显示模式，分别显示各个维度属性值以及根据各个维度属性值确定的发音准确度级别。

上述发音测试应用的控制方法，通过在应用中设置不同的等级，可以让用户在学习语言发音的过程中享受到游戏进阶的乐趣，进而提高语音发音学习的积极性。在游戏过程中，终端设备可以在获取语音数据后及时显示用户输入的语音数据的发音准确度信息，对用户的学习结果及时进行反馈。并且，发音准确度信息通过各个不同维度的属性值来体现用户的语言发音水平，更准确和精细地对用户的发音水平进行分析，使用户可以直观地看到每个维度的属性值，清楚地了解自身存在哪个维度的发音问题，有针对性地进行改进，有利于快速提高用户的语言发音水平，取得明显的学习效果。

在一种实施例中，语音数据的发音准确度信息可以包括声母准确度值，终端设备或服务器可以通过如下方式获取语音数据的声母准确度值：获取语音数据中包含的各个单字语音，并将各个单字语音与标准声母音进行比对，确定是否存在单字声母错误；根据各个单字语音对应的声母音比对结果，确定语音数据对应的声母准确度值。

具体地说，可以通过声学模型中的解码网络，如FST(Finite State Transducers，有穷状态转换器)网络，对获取的语音数据进行单字分割，得到各个单字语音。解码网络可以通过训练得到，训练使用的语音样本数据为预先标注有每个字的起始语音帧和结束语音帧的语音数据。将获取的语音数据输入已训练的解码网络，确定每个字的起始语音帧和结束语音帧，得到解码网络输出的各个单字语音。例如，语音数据中包括10个字的语音，则解码网络将输出10个字的单字语音。

得到语音数据的各个单字语音之后，可以通过声学模型中的声母音网络将各个单字语音与标准声母音进行比对，确定是否存在单字声母错误。示例性地，声母音网络可以采用分类网络实现，每个标准声母音为一个类别，该分类网络可以确定单字语音中的声母音对应的类别，输出单字语音中的声母音分别对应于每个标准声母音的概率值，该概率值表明了单字语音中的声母音与对应的标准声母音的相似度，如果分类网络输出的概率值中存在两个概率值的差值较为接近，或者说在设定差值范围内，则认为该单字语音相对于两个声母存在声母音混淆，两个声母为上述两个较为接近概率值相应的标准声母音对应的声母。若某个单字语音中存在声母音混淆，说明该单字语音存在单字声母错误。对分类网络进行训练时采用的标准声母音可以是播音员的语音。

根据上述步骤中确定的各个单字语音对应的声母音比对结果，确定语音数据对应的声母准确度值。例如，如果每个单字语音对应的声母音比对结果均为比对正确，不存在单字声母错误，则确定语音数据对应的声母准确度值为满分100分。每存在一个单字语音的声母音比对结果为单字声母错误，从满分中扣除设定分值，得到语音数据对应的声母准确度值。假设每一个单字声母错误扣10分，如果语音数据对应的单字语音中有两个单字语音的声母音比对结果为单字声母错误，则从满分100分中扣除20分，最终的语音数据对应的声母准确度值为80分。

在另一种实施例中，语音数据的发音准确度信息可以包括韵母准确度值，终端设备或服务器可以通过如下方式获取语音数据的韵母准确度值：获取语音数据中包含的各个单字语音，并将各个单字语音与标准韵母音进行比对，确定是否存在单字韵母错误；根据各个单字语音对应的韵母音比对结果，确定语音数据对应的韵母准确度值。

具体地说，可以通过声学模型中的解码网络获取语音数据对应的各个单字语音。然后通过声学模型中的韵母音网络将各个单字语音与标准韵母音进行比对，确定是否存在单字韵母错误。示例性地，韵母音网络可以采用分类网络实现，每个标准韵母音为一个类别，该分类网络可以确定单字语音中的韵母音对应的类别，输出单字语音中的韵母音分别对应于每个标准韵母音的概率值，该概率值表明了单字语音中的韵母音与对应的标准韵母音的相似度，如果分类网络输出的概率值中存在两个概率值的差值较为接近，或者说在设定差值范围内，则认为该单字语音相对于两个韵母存在韵母音混淆，两个韵母为上述两个较为接近概率值相应的标准韵母音对应的韵母。若某个单字语音中存在韵母音混淆，说明该单字语音存在单字韵母错误。

根据上述步骤中确定的各个单字语音对应的韵母音比对结果，确定语音数据对应的韵母准确度值。语音数据对应的韵母准确度值的确定过程可以参照上述声母准确度值的确定过程执行，在此不再赘述。

在另一种实施例中，语音数据的发音准确度信息可以包括声调准确度值，终端设备或服务器可以通过如下方式获取语音数据的声调准确度值：获取语音数据中包含的各个单字语音，并将各个单字语音与对应的单字标准语音进行声调比对，确定是否存在声调错误；根据各个单字语音对应的声调比对结果，确定语音数据对应的声调准确度值。

具体地说，可以通过声学模型中的解码网络获取语音数据对应的各个单字语音。然后通过声学模型中的声调比对网络将各个单字语音与单字标准语音进行比对，确定是否存在声调错误。示例性地，声调比对网络也可以采用分类网络实现，每个音调为一个类别，该分类网络可以确定输入的单字语音的音调对应的类别，输出单字语音的音调分别对应于每个音调的概率值。对于语音数据对应的各个单字语音，从语音数据对应的参考语音数据中获取该单字语音对应的单字标准语音，将该单字语音与对应的单字标准语音分别输入声调比对网络，得到声调比对网络输出的该单字语音对应于各音调的概率值，及单字标准语音对应于各音调的概率值。如果二者相对应的概率值中，存在至少一对概率值的差值大于设定值，确定该单字语音存在声调错误。例如，该单字语音对应于平声的概率值与单字标准语音对应于平声的概率值相差较大，超过了设定值，确定该单字语音存在声调错误。

根据上述步骤中确定的各个单字语音对应的声调比对结果，确定语音数据对应的声调准确度值。语音数据对应的声调准确度值的确定过程也可以参照上述声母准确度值的确定过程执行，在此不再赘述。

在另一种实施例中，语音数据的发音准确度信息可以包括语句正确度值，终端设备或服务器可以通过如下方式获取语音数据的语句正确度值：获取语音数据中包含的各个单字语音，将语音数据中的各个单字语音与参考语音数据中的各个单字语音进行比对，根据存在的错字、漏字或添字错误的数量，确定语音数据对应的语句正确度值。

具体地说，可以通过声学模型中的解码网络获取语音数据对应的各个单字语音。将语音数据中的各个单字语音与参考语音数据中的各个单字语音按顺序进行比对，如果某个单字语音与参考语音数据中对应的单字语音相差较大，而其前后的单字语音与参考语音数据中对应的单字语音相差较小，说明该单字语音读音错误，该单字为错字。如果语音数据中单字语音的数量少于参考语音数据中单字语音的数量，比对中存在某个单字语音与参考语音数据中对应的标准单字语音相差较大时，将该单字语音与参考语音数据中的下一标准单字语音进行比对，且相差较小，说明此处存在漏字错误。漏字错误也可以体现在参考语音数据中的某个单字语音在获取的语音数据中对应的语音帧很少。如果语音数据中单字语音的数量多于参考语音数据中单字语音的数量，比对中存在某个单字语音与参考语音数据中对应的标准单字语音相差较大时，将下一单字语音与参考语音数据中的该标准单字语音进行比对，且相差较小，说明此处存在添字错误。

根据存在的错字、漏字或添字错误的数量，确定语音数据对应的语句正确度值。例如，如果获取的语音数据中不存在错字、漏字及添字错误，则确定语音数据对应的语句正确度值为满分100分。每存在一处错误，无论是错字、漏字还是添字错误，均从满分中扣除设定分值，得到语音数据对应的语句正确度值。假设每一处错误扣10分，如果语音数据中存在一处错字和一处漏字错误，共两处错误，则从满分100分中扣除20分，最终的语音数据对应的语句正确度值为80分。

在另一种实施例中，语音数据的发音准确度信息可以包括语句流畅度值，终端设备或服务器可以通过如下方式获取语音数据的语句流畅度值：根据语音数据中相邻的单字语音之间存在的停顿语音的数量确定语音数据对应的语句流畅度值。

具体地说，可以通过声学模型中的解码网络获取语音数据对应的各个单字语音。确定相邻的单字语音直接是否存在空白语音，如果存在空白语音，并且空白语音的空白时长达到设定时长，则记作一次停顿语音。根据停顿语音的数量确定语音数据的语句流畅度值的过程也可以参照上述语句正确度值的确定过程执行，在此不再赘述。

在一些实施例中，语音数据的发音准确度信息可以包括上述五个维度中的任意两个维度、任意三个维度或任意四个维度的信息，或者可以包括多于上述五个维度的信息。

为了更方便理解，以下通过一具体实施例说明发音测试应用的控制过程。图3示出了终端设备启动发音测试应用对发音测试应用的控制过程的流程图。如图3所示，该过程包括如下步骤：

步骤S301，响应进入应用操作，显示主题选择界面。

其中，所述主题选择界面中显示有多个不同主题的发音测试对应的主题启动控件，每个主题启动控件为链接对应着该主题关联的等级选择界面的主题图标。

具体地说，终端设备安装发音测试应用的客户端之后，用户点击终端设备的桌面上的发音测试应用的应用图标，终端设备即启动发音测试应用，显示主题选择界面。在一种实施例中，终端设备启动发音测试应用后，可以先显示登录界面，用户在登录界面输入用户名和密码等登录信息，终端设备可以对用户输入的登录信息进行验证，或者，将用户输入的登录信息发送至服务器进行验证。验证通过后，终端设备再显示主题选择界面。

示例性地，终端设备上显示的主题选择界面可以如图4所示，包括对应不同主题的4个主题启动控件，每个主题启动控件为链接对应主题关联的游戏等级的游戏等级图标。为方便理解，在下文的介绍中，游戏等级称为关卡，游戏等级图标对应称为关卡图标。也可以说，发音测试应用中针对多个不同的主题对关卡进行分组设置，例如，针对美食主题，设置一些与美食相关的分组关卡，关卡中的测试文本均与美食相关；针对运动主题，设置一些与运动相关的分组关卡，关卡中的测试文本均与运动相关；针对购物主题，设置一些与购物相关的分组关卡，关卡中的测试文本均与购物相关，等等。

图4所示的菱形图案可以理解为一个棋盘，棋盘的四角的每个角上设置有一个主题启动控件，带有“闯关”字样的主题启动控件表明用户没有通过该闯关页面中的全部关卡，带有“已满级”字样的主题启动控件表明用户已经通过了该闯关页面中的全部关卡。

步骤S302，响应针对任意一个目标主题对应的主题启动控件的触发操作，显示目标主题对应的等级选择界面。

例如，用户点击图4所示的主题选择界面中最左侧的主题启动控件，设该主题启动控件为主题启动控件A。终端设备接收到用户针对主题启动控件A触发的操作，调取并显示主题启动控件A对应的等级选择界面，等级选择界面中显示有多个不同测试等级的发音测试对应的等级启动控件。在等级选择界面中，相邻上一级测试等级为已经通过状态的测试等级对应的等级启动控件，显示为可触发状态，或者称为已解锁状态。相邻上一级测试等级为未通过状态的测试等级对应的等级启动控件，显示为不可触发状态，或者称为未解锁状态。也可以说，对应测试等级已经通过以及已经通过的最高等级的下一级测试等级的启动控件，显示为可触发状态，其他测试等级的启动控件显示为不可触发状态。

示例性地，该等级选择界面可以如图5所示，等级选择界面中包括顺次排列的多个关卡的等级启动控件，每个关卡的等级启动控件为链接对应关卡关联的发音练习界面的关卡图标，如图5中所示的关卡图标1～关卡图标8，表明主题启动控件A对应的主题中共包括8个关卡，从关卡1至关卡8，关卡的难度逐渐提升。需要说明的是，上述说明仅为示例性说明，每个主题也可以设置多于8个关卡或少于8个关卡，在等级选择界面中，可以通过上滑或下滑操作显示更多关卡的关卡图标。

在一些实施例中，用户点击主题选择界面中的主题启动控件后，终端设备需要获取该主题启动控件对应的每个关卡对应的通过状态，如果某一个关卡为已经通过，则获取用户通过该关卡时对应的发音准确度级别，根据该发音准确度级别在对应的关卡处显示相应的星级。如果某一个关卡为未通过，且该关卡的前一关卡为已经通过，则在该关卡处显示用户图像标识，表明在该主题对应的关卡中，用户已经闯关至该关卡，如图5中的关卡5。显示有相应星级和用户图像标识的关卡为可触发状态的关卡，仅显示关卡标识(如关卡数字标识)未显示其它信息的关卡为不可触发状态的关卡。

步骤S303，接收到针对任意一个目标等级对应的等级启动控件的触发操作。

步骤S304，判断该触发操作对应的目标等级是否为可触发状态；如果是，执行步骤S305；如果否，执行步骤S306后，返回至步骤S303。

步骤S305，显示目标等级对应的发音练习界面。

步骤S306，弹出未解锁错误信息。

如果上述触发操作对应的目标等级为可触发状态，则显示目标等级对应的发音练习界面，发音练习界面中可以包括文本展示区域，文本展示区域显示有目标等级的发音测试文本。如果上述触发操作对应的目标等级为不可触发状态，则弹出未解锁错误信息。

例如，如果用户点击图5中的关卡图标4，由于关卡4为可触发状态，则终端设备显示如图6所示的发音练习界面，发音练习界面中的文本展示区域显示有关卡4中的发音测试文本，即带有拼音标注的“我爸妈开了一家豆腐店”的文本，用于对发音准确度进行测试。如果用户点击图5中的关卡图标7，由于关卡7为不可触发状态，则会弹出未解锁错误信息。例如，可以弹出对话框，对话框中显示“该关卡未解锁，请选择已解锁关卡”。

在一种可选的实施例中，发音练习界面中还包括跟读按键，如图6中所示的跟读按键。终端设备接收到用户点击跟读按键，播放上述测试文本信息对应的参考语音数据，用户可以收听正确的发音并进行跟读，以提高发音准确度。

步骤S307，响应通过发音练习界面触发的录音操作，获取语音数据。

示例性地，发音练习界面中显示有录音按键，如图6中所示的“录音”按键，用户点击“录音”按键，将自己的语音输入终端设备。具体地，终端设备接收到用户在发音练习界面中首次触发录音按键的操作后，会启动声音采集器采集用户输入的语音信号。终端设备接收到用户在发音练习界面中再次触发录音按键的操作后，会关闭声音采集器以停止采集用户输入的语音信号。客户端会根据声音采集器采集到的语音信号，得到用户输入的语音数据。

在一种实施例中，用户通过点击如图6所示的“录音”按键，开始录入测试文本“我爸妈开了一家豆腐店”的语音，在录入完毕后，松开“录音”按键，即停止录入。在一些实施例中，用户松开“录音”按键之后，终端设备会进入如图7所示的评分页面，等待对用户输入的测试文本语音数据进行评分。

步骤S308，确定获取的语音数据的发音准确度信息。

在一种实施例中，终端设备可以对采集到的语音数据进行发音准确度评估，具体方法可以参照上文中记载的确定语音数据的发音准确度信息的方法执行，在此不再赘述。在另一种实施例中，终端设备可以按照图9所示的交互流程图，请求服务器确定获取的语音数据的发音准确度信息，该方法将在下文中详细介绍。

步骤S309，根据发音准确度信息确定是否通过该触发操作对应的目标等级；如果是，执行步骤S310后，返回至步骤S305；如果否，执行步骤S311后，执行步骤S312。

步骤S310，在发音练习界面上显示发音准确度信息以及通过该目标等级的指示信息。

步骤S311，在发音练习界面上显示发音准确度信息以及未通过该目标等级的指示信息。

在本实施例中，发音准确度信息包括如下五个维度的属性值：声母准确度值、韵母准确度值、声调准确度值、语句正确度值、语句流畅度值，以及根据上述五个维度的属性值确定的发音准确度级别。通过发音准确度信息中的发音准确度级别可以确定是否通过该目标等级。

如果确定用户通过了该目标等级的测试，终端设备可以在发音练习界面上显示如图8所示的信息，包括挑战成功的信息和发音准确度级别，其中，发音准确度级别可以采用星级来表示，最高级别可以为3星级，最低级别可以为1星级。并且，该界面中还可以显示五个维度的属性值得分，图8中的测试结果显示五个维度的属性值得分均为70分。在该界面中，用户还可以点击“上一关”按键或“下一关”按键，直接进行其它关的游戏。

如果确定用户没有通过该目标等级的测试，终端设备可以在发音练习界面上显示通关失败的信息，包括挑战失败的信息，也可以显示五个维度的属性值得分，让用户了解自己在哪一个维度存在缺陷。

发音练习界面上还可以显示错误显示按键。用户点击错误显示按键后，可以将具体的错误展示给用户，例如，某个单字存在“z-zh”的声母错误，或者，某个单字存在“an-ang”的韵母错误，或者，某个单字存在声调错误；或者，添加了某个字或漏掉了某个字，等等。

步骤S312，接收到针对再次挑战按键的触发操作，返回至步骤S305。

如果用户没有通过该目标等级的测试，在显示通关失败的界面中，还可以显示再次挑战按键和返回按键。如果用户选择再次挑战按键，就会返回至显示目标等级对应的发音练习界面；如果用户选择返回按键，就会返回至显示目标主题对应的等级选择界面。

在一些实施例中，上述步骤S308中，终端设备可以按照图9所示的交互流程图，请求服务器确定获取的语音数据的发音准确度信息，具体包括如下步骤：

步骤S901，终端设备生成包含语音数据和对应的测试文本信息的准确度确定请求。

终端设备获取语音数据之后，生成包含该语音数据和对应的测试文本信息的准确度确定请求。其中，语音数据为通过某个目标等级对应的发音练习界面触发的录音操作获取的语音数据，测试文本信息为该目标等级发音练习界面中展示的测试文本的信息，例如，测试文本的编号或标识等。

步骤S902，终端设备向服务器发送准确度确定请求。

步骤S903，服务器根据接收到的准确度确定请求，将语音数据与测试文本信息对应的参考语音数据进行比对，确定语音数据的发音准确度信息。

服务器接收到终端设备发送的准确度确定请求，获取准确度确定请求中携带的语音数据和对应的测试文本信息，根据测试文本信息，调用该测试文本对应的参考语音数据，将语音数据与该参考语音数据进行比对，确定语音数据的发音准确度信息。语音数据的发音准确度信息可以包括发音准确度级别和如下五个维度的属性值：声母准确度值、韵母准确度值、声调准确度值、语句正确度值、语句流畅度值。五个维度的属性值的具体获取方法可以参照上文记载的方法执行，该方法也可以称为五象限评分方法。

示例性地，假设某一目标等级关联的测试文本的字数为x，每个维度的属性值满分均为100分，也可以按照如下方法确定每个维度的属性值和发音准确度级别。

声母准确度值：确定语音数据中的每个单字语音是否存在单字声母错误之后，在满分基础上，根据测试文本的字数x对声母准确度值进行动态加权扣分。具体地，如果x<3，则每个单字声母错误扣100/x分。如果x＞3，第一个单字声母错误扣30分，第二个单字声母错误扣20分，剩下的单字声母错误每个错误扣50/(x-2)分，最终得到的分值为语音数据的声母准确度值。其中，单字声母错误可以包括平翘舌不分，例如z-zh、c-ch、s-sh，以及n-l不分、f-h不分和z-zh-j不分等。

韵母准确度值：确定语音数据中的每个单字语音是否存在单字韵母错误之后，在满分基础上，根据测试文本的字数x对韵母准确度值进行动态加权扣分。具体方法可以参照上述确定声母准确度值的方法执行，在此不再赘述。其中，单字韵母错误可以包括前后鼻尾不分，例如an-ang、en-eng、in-ing、un-ong、ün-ong以及i-ü不分、三拼音节丢介音，例如ia-a、ua-a、uo-o、uai-ai、iao-ao、ian-an、iang-ang、uan-an、uang-ang、iong-ong、üan-an和复韵母单音化，例如ai-a+i、ei-e+i、ui-u+i、ao-a+o、ou-o+u、iu-i+u、ie-i+e、üe-ü+e等。

声调准确度值：确定语音数据中的每个单字语音是否存在单字声调错误之后，在满分基础上，每个单字声调错误扣100/x分，最终得到的分值为语音数据的声调准确度值。

语句正确度值：确定语音数据中存在的错字、漏字或添字错误的数量，在满分基础上，每个错误扣100/x分，最终得到的分值为语音数据的语句正确度值。

语句流畅度值：确定语音数据中存在的停顿语音的数量，在满分基础上，每处停顿语音扣100/x分，最终得到的分值为语音数据的语句流畅度值。

通过五个维度的属性值可以得到发音准确度级别，示例性地，发音准确度级别可以分为5个星级。当声母准确度值和韵母准确度值的总分在170分以上，且声调准确度值、语句正确度值和语句流畅度值均为满分时，可以评定为5星级；当声母准确度值和韵母准确度值的总分在170分以上，且声调准确度值和语句正确度值均为满分，语句流畅度值最多出现一次扣分时，可以评定为4星级；当声母准确度值和韵母准确度值的总分在140分以上，且声调准确度值、语句正确度值和语句流畅度值的扣分不超过1次时，可以评定为3星级；当声母准确度值和韵母准确度值的总分在100分以上，且声调准确度值大于等于50分，语句正确度值和语句流畅度值分别大于60分时，可以评定为2星级；其他情况都可以评定为1星级。

步骤S905，服务器向终端设备发送语音数据的发音准确度信息。

终端设备接收到服务器发送的语音数据的发音准确度信息，在发音练习界面上显示五个维度的属性值和发音准确度级别。

在上述实施例中，采用五个维度的属性值可以准确且精细地表现用户的发音准确度，有利于用户有针对性地改正某个维度的发音问题，有效地提高学习效果。另外，采用五个维度的属性值，在满足普通用户了解发音准确度需要的同时，其计算量较小，占用的计算资源少，且可以快速地得到发音准确度的结果，减少用户的等待时间。

在上述实施例中，服务器执行的方法如图10所示，包括如下步骤：

步骤S1001，接收终端设备发送的准确度确定请求。

该准确度确定请求中包含语音数据和对应的测试文本信息。其中，语音数据为通过用户选择的目标等级的发音练习界面触发的录音操作获取的语音数据，测试文本信息为该目标等级的发音练习界面中显示的测试文本的信息，如测试文本的编号等。

步骤S1002，将语音数据与测试文本信息对应的参考语音数据进行比对，确定语音数据的发音准确度信息。

步骤S1003，将语音数据的发音准确度信息发送至终端设备。

服务器将语音数据的发音准确度信息发送至终端设备，以使终端设备可以在发音练习界面上显示该语音数据的发音准确度信息，及时地对用户的发音准确度进行反馈。

与图2所示的发音测试应用的控制方法基于同一发明构思，本申请实施例中还提供了一种发音测试应用的控制装置，该发音测试应用的控制装置可以布设在终端设备中。由于该装置是本申请实施例发音测试应用的控制方法对应的装置，并且该装置解决问题的原理与该方法相似，因此该装置的实施可以参见上述方法的实施，重复之处不再赘述。

图11示出了本申请实施例提供的一种发音测试应用的控制装置的结构示意图，如图11所示，该发音测试应用的控制装置包括：主题选择控制单元111、等级选择控制单元112、语音采集单元113和信息显示单元114；其中，

主题选择控制单元111，用于响应进入应用操作，显示等级选择界面；等级选择界面中显示有多个不同测试等级的发音测试对应的等级启动控件；

等级选择控制单元112，用于响应针对任意一个目标等级对应的等级启动控件的触发操作，显示目标等级对应的发音练习界面；发音练习界面包括文本展示区域；文本展示区域显示有目标等级的发音测试文本；

语音采集单元113，用于响应通过发音练习界面触发的录音操作，获取语音数据；

信息显示单元114，用于响应录音完成的结束操作，在发音练习界面上显示语音数据的发音准确度信息以及是否通过目标等级的指示信息；发音准确度信息是将获取的语音数据与测试文本对应的参考语音数据进行比对得到的；指示信息是根据发音准确度信息确定的。

在一种可选的实施例中，等级选择界面中显示有多个不同测试等级的发音测试对应的等级启动控件，具体包括：相邻上一级测试等级为已经通过状态的测试等级对应的等级启动控件，显示为可触发状态，相邻上一级测试等级为未通过状态的测试等级对应的等级启动控件，显示为不可触发状态；

等级选择控制单元112，具体用于：

当目标等级对应的等级启动控件为可触发状态时，显示目标等级对应的发音练习界面。

在一种可选的实施例中，主题选择控制单元111，具体用于：

响应进入应用操作，显示主题选择界面；主题选择界面中显示有多个不同主题的发音测试对应的主题启动控件；

响应针对任意一个目标主题对应的主题启动控件的触发操作，显示目标主题对应的等级选择界面。在一种可选的实施例中，信息显示单元114，具体用于：

根据设定的显示模式，分别显示各个维度属性值；

显示根据各个维度属性值确定的发音准确度级别。

在一种可选的实施例中，发音准确度信息包括语音数据对应的各维度属性值和发音准确度级别，是否通过目标等级的指示信息是根据发音准确度级别确定的。

在一种可选的实施例中，发音测试为普通话发音测试，语音数据的发音准确度信息包括如下维度属性值中的至少一种：声母准确度值、韵母准确度值、声调准确度值、语句正确度值、语句流畅度值。

在一种可选的实施例中，语音数据的发音准确度信息，包括如下五个维度的属性值：声母准确度值、韵母准确度值、声调准确度值、语句正确度值、语句流畅度值。

在一种可选的实施例中，如图12所示，上述发音测试应用的控制装置还可以包括请求发送单元121和信息接收单元122；其中，请求发送单元121，用于生成包含语音数据和目标等级信息的准确度确定请求，并将准确度确定请求发送至服务器；

信息接收单元122，用于接收服务器返回的语音数据的发音准确度信息；发音准确度信息为服务器根据准确度确定请求确定的。

在一种可选的实施例中，如图13所示，上述发音测试应用的控制装置还可以包括准确度确定单元131，用于获取语音数据中包含的各个单字语音，并将各个单字语音与标准声母音进行比对，确定是否存在单字声母错误；根据各个单字语音对应的声母音比对结果，确定语音数据对应的声母准确度值。

在一种可选的实施例中，准确度确定单元131，还可以用于：

获取语音数据中包含的各个单字语音，并将各个单字语音与标准韵母音进行比对，确定是否存在单字韵母错误；根据各个单字语音对应的韵母音比对结果，确定语音数据对应的韵母准确度值。

在一种可选的实施例中，准确度确定单元131，还用于：

获取语音数据中包含的各个单字语音，并将各个单字语音与对应的单字标准语音进行声调比对，确定是否存在声调错误；根据各个单字语音对应的声调比对结果，确定语音数据对应的声调准确度值。

在一种可选的实施例中，准确度确定单元131，还用于：

获取语音数据中包含的各个单字语音，将语音数据中的各个单字语音与参考语音数据中的各个单字语音进行比对，根据存在的错字、漏字或添字错误的数量，确定语音数据对应的语句正确度值。

在一种可选的实施例中，准确度确定单元131，还用于：

根据语音数据中相邻的单字语音之间存在的停顿语音的数量确定语音数据对应的语句流畅度值。与上述实施例提供的发音测试应用的控制方法基于同一发明构思，本申请实施例中还提供了一种发音测试应用的控制装置，该发音测试应用的控制装置可以布设在服务器中。由于该装置是本申请实施例发音测试应用的控制方法对应的装置，并且该装置解决问题的原理与该方法相似，因此该装置的实施可以参见上述方法的实施，重复之处不再赘述。

与图10所示的发音测试应用的控制方法基于同一发明构思，本申请实施例中还提供了一种发音测试应用的控制装置，该发音测试应用的控制装置可以布设在服务器中。图14示出了该发音测试应用的控制装置的结构示意图，如图14所示，该发音测试应用的控制装置包括：请求接收单元141、数据分析单元142和信息发送单元143；其中，

请求接收单元141，用于接收终端设备发送的准确度确定请求；准确度确定请求中包含语音数据和对应的测试文本信息；语音数据为通过目标等级的发音练习界面触发的录音操作获取的语音数据；测试文本信息为目标等级的发音练习界面中显示的测试文本的信息；

数据分析单元142，用于将语音数据与测试文本信息对应的参考语音数据进行比对，确定语音数据的发音准确度信息；

信息发送单元143，用于将语音数据的发音准确度信息发送至终端设备。

与图2所示的发音测试应用的控制方法基于同一发明构思，本申请实施例还提供了一种电子设备。如图15所示，为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，可参照本申请方法实施例部分。该电子设备可以为手机、平板电脑、POS(Point of Sales，销售终端)、车载电脑、智能穿戴设备、PC机等任意电子设备，该电子设备也可以是图1中所示的终端设备300。

图15示出了一种本申请实施例提供的电子设备的结构框图。如图15所示，该电子设备包括：射频(Radio Frequency，RF)电路310、存储器320、输入单元330、显示单元340、传感器350、音频电路360、无线保真(wireless fidelity，WiFi)模块370、处理器380等部件。本领域技术人员可以理解，图15中示出的电子设备结构并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图15对电子设备的各个构成部件进行具体的介绍：

RF电路310可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器380处理；另外，将设计上行的数据发送给基站。

存储器320可用于存储软件程序以及模块，如本申请实施例中的发音测试应用的控制方法以及装置对应的程序指令/模块，处理器380通过运行存储在存储器320的软件程序以及模块，从而执行电子设备的各种功能应用以及数据处理，如本申请实施例提供的发音测试应用的控制方法。存储器320可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个应用的应用程序等；存储数据区可存储根据电子设备的使用所创建的数据(比如测试文本及参考语音数据)等。此外，存储器320可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元330可用于接收用户输入的数字或字符信息，以及产生与终端的用户设置以及功能控制有关的键信号输入。

可选的，输入单元330可包括触控面板331以及其他输入设备332。

其中，触控面板331，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板331上或在触控面板331附近的操作)，并根据预先设定的程式实现相应的操作，如用户点击功能模块的快捷标识的操作等。可选的，触控面板331可以包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器380，并能接收处理器380发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板331。

可选的，其他输入设备332可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元340可用于显示由用户输入的信息或展示给用户的界面信息以及电子设备的各种菜单。显示单元340即为终端设备的显示系统，用于呈现界面，如显示桌面、应用的操作界面或子应用的操作界面等。

显示单元340可以包括显示面板341。可选的，显示面板341可以采用液晶显示屏(Liquid Crystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode，OLED)等形式来配置。

进一步的，触控面板331可覆盖显示面板341，当触控面板331检测到在其上或附近的触摸操作后，传送给处理器380以确定触摸事件的类型，随后处理器380根据触摸事件的类型在显示面板341上提供相应的界面输出。

虽然在图15中，触控面板331与显示面板341是作为两个独立的部件来实现电子设备的输入和输入功能，但是在某些实施例中，可以将触控面板331与显示面板341集成而实现终端的输入和输出功能。

电子设备还可包括至少一种传感器350，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板341的亮度，接近传感器可在电子设备移动到耳边时，关闭显示面板341的背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别电子设备姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于电子设备还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路360、扬声器361，传声器362可提供用户与电子设备之间的音频接口。音频电路360可将接收到的音频数据转换后的电信号，传输到扬声器361，由扬声器361转换为声音信号输出；另一方面，传声器362将收集的声音信号转换为电信号，由音频电路360接收后转换为音频数据，再将音频数据输出处理器380处理后，经RF电路310以发送给比如另一电子设备，或者将音频数据输出至存储器320以便进一步处理。

WiFi属于短距离无线传输技术，电子设备通过WiFi模块370可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图15示出了WiFi模块370，但是可以理解的是，其并不属于电子设备的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器380是电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器320内的软件程序和/或模块，以及调用存储在存储器320内的数据，执行电子设备的各种功能和处理数据，从而对电子设备进行整体监控。可选的，处理器380可包括一个或多个处理单元；可选的，处理器380可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、应用及应用内部的功能模块等软件程序，如本申请实施例提供的发音测试应用的控制方法等。调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器380中。

可以理解，图15所示的结构仅为示意，电子设备还可包括比图15中所示更多或者更少的组件，或者具有与图15所示不同的配置。图15中所示的各组件可以采用硬件、软件或其组合实现。

与图10所示的发音测试应用的控制方法基于同一发明构思，本申请实施例还提供了一种电子设备。该电子设备可以是服务器，如图1所示的服务器100。在该实施例中，电子设备的结构可以如图16所示，包括存储器101，通讯模块103以及一个或多个处理器102。

存储器101，用于存储处理器102执行的计算机程序。存储器101可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统，以及运行即时通讯功能所需的程序等；存储数据区可存储各种即时通讯信息和操作指令集等。

处理器102，可以包括一个或多个中央处理单元(central processing unit，CPU)或者为数字处理单元等等。处理器102，用于调用存储器101中存储的计算机程序时实现上述控制方法。

通讯模块103用于与终端设备进行通信，获取语音数据。

本申请实施例中不限定上述存储器101、通讯模块103和处理器102之间的具体连接介质。本公开实施例在图16中以存储器101和处理器102之间通过总线104连接，总线104在图16中以粗线表示，其它部件之间的连接方式，仅是进行示意性说明，并不引以为限。总线104可以分为地址总线、数据总线、控制总线等。为便于表示，图16中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述实施例中的发音测试应用的控制方法。

另外，在本申请各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

以上仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。

Claims

1.一种发音测试应用的控制方法，其特征在于，包括：

响应进入应用操作，显示等级选择界面，所述等级选择界面中显示有多个不同测试等级的发音测试对应的等级启动控件；

响应针对任意一个目标等级对应的等级启动控件的触发操作，显示所述目标等级对应的发音练习界面，所述发音练习界面包括文本展示区域，所述文本展示区域显示有所述目标等级的发音测试文本；

响应录音完成的结束操作，在所述发音练习界面上显示所述语音数据的发音准确度信息以及是否通过所述目标等级的指示信息，所述发音准确度信息是将获取的语音数据与所述测试文本对应的参考语音数据进行比对得到的，所述指示信息是根据所述发音准确度信息确定的。

2.根据权利要求1所述的方法，其特征在于，所述响应进入应用操作，显示等级选择界面，具体包括：

3.根据权利要求1所述的方法，其特征在于，所述等级选择界面中显示有多个不同测试等级的发音测试对应的等级启动控件，具体包括：相邻上一级测试等级为已经通过状态的测试等级对应的等级启动控件，显示为可触发状态，相邻上一级测试等级为未通过状态的测试等级对应的等级启动控件，显示为不可触发状态；

所述响应针对任意一个目标等级对应的启动控件的触发操作，显示对应的发音练习界面，具体包括：当所述目标等级对应的等级启动控件为可触发状态时，显示所述目标等级对应的发音练习界面。

4.根据权利要求1所述的方法，其特征在于，所述语音数据的发音准确度信息通过如下方式获取：

生成包含所述语音数据和对应的测试文本信息的准确度确定请求，并将所述准确度确定请求发送至服务器；

接收所述服务器返回的所述语音数据的发音准确度信息，所述发音准确度信息为所述服务器根据所述准确度确定请求确定的。

5.根据权利要求1所述的方法，其特征在于，所述发音准确度信息包括所述语音数据对应的各维度属性值和发音准确度级别，所述是否通过所述目标等级的指示信息是根据发音准确度级别确定的。

6.根据权利要求5所述的方法，其特征在于，所述发音测试为普通话发音测试，所述语音数据的发音准确度信息包括如下维度属性值中的至少一种：声母准确度值、韵母准确度值、声调准确度值、语句正确度值、语句流畅度值；

所述显示所述语音数据的发音准确度信息，具体包括：

根据设定的显示模式，分别显示各个维度属性值；

显示根据各个维度属性值确定的发音准确度级别。

7.根据权利要求5所述的方法，其特征在于，所述语音数据的发音准确度信息，包括如下五个维度的属性值：声母准确度值、韵母准确度值、声调准确度值、语句正确度值、语句流畅度值。

8.根据权利要求6或7所述的方法，其特征在于，所述声母准确度值通过如下方式获取：

所述韵母准确度值通过如下方式获取：

所述声调准确度值通过如下方式获取：

9.根据权利要求6或7所述的方法，其特征在于，所述语句正确度值通过如下方式获取，包括：

10.根据权利要求6或7所述的方法，其特征在于，所述语句流畅度值通过如下方式获取：

11.一种发音测试应用的控制方法，其特征在于，包括：

接收终端设备发送的准确度确定请求，所述准确度确定请求中包含语音数据和对应的测试文本信息，所述语音数据为通过所述目标等级的发音练习界面触发的录音操作获取的语音数据，所述测试文本信息为所述目标等级的发音练习界面中显示的测试文本的信息；

将所述语音数据的发音准确度信息发送至所述终端设备。

12.一种发音测试应用的控制装置，其特征在于，包括：

等级选择控制单元，用于响应针对任意一个目标等级对应的等级启动控件的触发操作，显示所述目标等级对应的发音练习界面；所述发音练习界面包括文本展示区域；所述文本展示区域显示有所述目标等级的发音测试文本；

信息显示单元，用于响应录音完成的结束操作，在所述发音练习界面上显示所述语音数据的发音准确度信息以及是否通过所述目标等级的指示信息；所述发音准确度信息是将获取的语音数据与所述测试文本对应的参考语音数据进行比对得到的；所述指示信息是根据所述发音准确度信息确定的。

13.一种发音测试应用的控制装置，其特征在于，包括：

数据分析单元，将所述语音数据与所述测试文本信息对应的参考语音数据进行比对，确定所述语音数据的发音准确度信息；

14.一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，其特征在于：所述计算机程序被处理器执行时，实现权利要求1～10中任一项或权利要求11所述的方法。

15.一种电子设备，其特征在于，包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机程序，当所述计算机程序被所述处理器执行时，实现权利要求1～10中任一项或权利要求11所述的方法。