CN111968621B

CN111968621B - 一种音频测试方法、设备及计算机可读存储介质

Info

Publication number: CN111968621B
Application number: CN202010797553.XA
Authority: CN
Inventors: 柳青
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-08-10
Filing date: 2020-08-10
Publication date: 2022-08-30
Anticipated expiration: 2040-08-10
Also published as: CN111968621A

Abstract

本申请提供了一种音频测试方法、设备及计算机可读存储介质；该方法包括：接收口语练习指令，响应于口语练习指令，从当前显示界面跳转至移动控制界面；当接收到移动指令时，响应于移动指令，生成距离信息，并获取初始位置；基于初始位置和距离信息，向服务器发送比拼请求；接收服务器针对比拼请求返回的口语测试文本，从移动控制界面跳转至文本展示界面，并在文本展示界面展示口语测试文本；当接收到录音指令时，响应于录音指令，采集口语测试文本对应的当前音频数据，并将当前音频数据发送给服务器；接收服务器返回的比较结果，从文本展示界面跳转至结果展示界面，将比较结果展示在结果展示界面。通过本申请，能够提高测试的多样性。

Description

一种音频测试方法、设备及计算机可读存储介质

技术领域

本申请涉及人工智能技术，尤其涉及一种音频测试方法、设备及计算机可读存储介质。

背景技术

线上语言学习应用为用户提供了便捷的语言学习途径，使得用户可以随时随地进行语音学习，满足用户日益增强的语言学习需求。其中，大多数的语言学习应用会在够根据用户的需求，来为用户设置合适的教学内容之外，还会设置一些趣味测试，从而帮助用户巩固学习成果。

然而，相关技术中，语言学习应用中的趣味测试，主要集中在用户的词汇记忆方面或者是根据词汇造句方面等，测试形式较为单一，从而使得测试的多样性较低。

发明内容

本申请实施例提供一种音频测试方法、设备及计算机可读存储介质，能够提高测试的多样性。

本申请实施例的技术方案是这样实现的：

本申请实施例提供一种音频测试方法，包括：

在当前显示界面接收口语练习指令，响应于所述口语练习指令，从所述当前显示界面跳转至移动控制界面；

当接收到作用在所述移动控制界面的移动控制控件上的移动指令时，响应于所述移动指令，生成距离信息，并获取初始位置；

基于所述初始位置和所述距离信息，向服务器发送比拼请求；

接收所述服务器针对所述比拼请求返回的口语测试文本，从所述移动控制界面跳转至文本展示界面，并在所述文本展示界面展示所述口语测试文本；

当接收到作用在录音控件上的录音指令时，响应于所述录音指令，采集所述口语测试文本对应的当前音频数据，并将所述当前音频数据发送给所述服务器，以使所述服务器生成所述当前音频数据对应的比较结果；

接收所述服务器针对所述当前音频数据返回的比较结果，从所述文本展示界面跳转至结果展示界面，将所述比较结果展示在所述结果展示界面。

本申请实施例提供一种音频测试方法，包括：

接收终端发送的比拼请求；

响应于所述比拼请求，从所述测试文本数据库中，抽取出口语测试文本，并将所述口语测试文本返回给所述终端；

接收所述终端针对所述口语测试文本发送的当前音频数据；

基于所述口语测试文本，针对所述当前音频数据确定出比较结果；所述比较结果为比拼成功、比拼失败、比拼平局中的任意一种；

将所述比较结果发送给所述终端。

本申请实施例提供一种音频测试装置，包括：

第一接收模块，用于接收终端发送的比拼请求；接收所述终端针对所述口语测试文本发送的当前音频数据；

文本抽取模块，用于响应于所述比拼请求，从所述测试文本数据库中，抽取出口语测试文本；

第一发送模块，用于将所述口语测试文本返回给所述终端；将所述比较结果发送给所述终端；

结果确定模块，用于基于所述口语测试文本，针对所述当前音频数据确定出比较结果；所述比较结果为比拼成功、比拼失败、比拼平局中的任意一种。

本申请实施例提供一种结果展示装置，包括：

第二接收模块，用于在当前显示界面接收口语练习指令；接收作用在所述移动控制界面的移动控制控件上的移动指令；接收作用在录音控件上的录音指令；以及接收所述服务器针对所述当前音频数据返回的比较结果；

距离生成模块，用于当接收到作用在所述移动控制界面的控制控件区域中的移动控制控件上的移动指令时，响应于所述移动指令，生成距离信息，并获取初始位置；

第二发送模块，用于基于所述初始位置和所述距离信息，向服务器发送比拼请求；将所述当前音频数据发送给所述服务器，以使所述服务器生成所述当前音频数据对应的比较结果；

界面展示模块，用于响应于所述口语练习指令，从所述当前显示界面跳转至移动控制界面；从所述移动控制界面跳转至文本展示界面，并在所述文本展示界面展示所述口语测试文本；从所述文本展示界面跳转至结果展示界面，将所述比较结果展示在所述结果展示界面；

音频采集模块，用于当接收到作用在录音控件上的录音指令时，响应于所述录音指令，采集所述口语测试文本对应的当前音频数据。

本申请实施例提供一种服务器，包括：

第一存储器，用于存储可执行音频测试指令；

第一处理器，用于执行所述第一存储器中存储的可执行音频测试指令时，实现本申请实施例服务器侧提供的音频测试方法。

本申请实施例提供一种终端，包括：

第二存储器，用于存储可执行音频测试指令；

第二处理器，用于执行所述第二存储器中存储的可执行音频测试指令时，实现本申请实施例终端侧提供的音频测试方法。

本申请实施例提供一种计算机可读存储介质，存储有可执行音频测试指令，用于引起第一处理器执行时，实现本申请实施例服务器侧提供的音频测试方法；或者用于引起第二处理器执行时，实现本申请实施例终端侧提供的音频测试方法。

本申请实施例具有以下有益效果：

本申请实施例中，终端可以响应于使用对象所触发的移动指令，触发比拼事件，接收服务器针对比拼请求所发送的口语测试文本，然后录制使用对象针对口语测试文本的当前音频数据，从而使得服务器针对当前音频数据生成比较结果，从而使得使用对象在音频测试时可以与其他对象进行互动比拼，增加了趣味测试的形式，进而提高了测试的多样性。

附图说明

图1示出了相关技术中的单词记忆测试示例图；

图2示出了相关技术中的分数比拼示例图；

图3是本申请实施例提供的音频测试系统100的一个可选的架构示意图；

图4是本申请实施例提供的图3中的服务器200的结构示意图；

图5是本申请实施例提供的图3中的终端400的结构示意图；

图6是本申请实施例提供的音频测试方法的一个可选的流程示意图一；

图7是本申请实施例提供的移动控制界面的示例图；

图8是本申请实施例提供的文本展示界面的示例图一；

图9是本申请实施例提供的临时展示界面的示例图；

图10是本申请实施例提供的文本展示界面的示例图二；

图11是本申请实施例提供的展示当前音频数据的评分分数的示例图；

图12是本申请实施例提供的虚拟对象移动的过程示例图；

图13是本申请实施例提供的音频测试方法的一个可选的流程示意图二；

图14是本申请实施例提供的音频测试方法的一个可选的流程示意图三；

图15是本申请实施例提供的实际应用场景的普通话比拼事件过程示例图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述，所描述的实施例不应视为对本申请的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

在以下的描述中，所涉及的术语“第一\第二\第三\第四”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三\第四”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

对本申请实施例进行进一步详细说明之前，对本申请实施例中涉及的名词和术语进行说明，本申请实施例中涉及的名词和术语适用于如下的解释。

1)人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，设计领域广泛、既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件主要包括计算机视觉技术、语音处理技术、自然语音处理技术以及机器学习/深度学习等几大方向。

2)机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的指示结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。

3)语音识别技术(Automatic Speech Recognition，ASR)是为了将人类语音中的词汇转换为计算机可读的输入，从而便于计算机来对人类的语音进行识别、处理等。

4)比拼事件，是指在虚拟场景中，两个不同的用户所对应的虚拟角色按照同一个规则进行比拼的事件。

5)虚拟场景，可以理解为利用软件技术设计、搭建并渲染出的场景。虚拟场景中具有环境、建筑、道路、人物、动物、道具等元素，利用这些元素可以构建出一个精美的虚拟世界，为用户提供良好的视觉体验。

6)虚拟路径，可以理解为虚拟场景中的道路，用户可以通过控制虚拟场景中的人物等，沿着虚拟路径进行移动。

7)虚拟对象，是指用户在虚拟场景中可以控制的人物。可以理解的是，虚拟对象的外形并可以是多种多样的，例如，虚拟对象可以通过“变身”等方式，变化为其他的物体，例如，虚拟对象可以变化为小动物外形、变化为游戏中的预设人物(NPC)的外形等。

线上语言学习应用具有内容丰富，不受地点限制的特点，为用户提供的便捷的语言学习途径，从而使得用户可以随时随地的学习语言，满足用户日益增强的语音学习需求。目前，大多数语言学习应用都可以根据用户的需求，来为用户设置适合其自身的教学内容。除此之外，语言学习应用还会为额外设置一些趣味测试，通过趣味测试，来使用户进一步巩固学习成果。

相关技术中，语言学习应用中趣味测试，主要是集中在用户的词汇记忆方面或者是根据词汇造句等方面，例如，多个用户同时在线比较词汇记忆等，单个用户针对随机给出场景进行造句等。

示例性的，图1示出了相关技术中的单词记忆测试示例图。参见图1，用户1-A和用户1-B针对终端所显示的界面1-1的显示区域1-11所给出的中文词汇：社会责任，各自从显示区域1-12的四个选项，即选项1-121、选项1-122、选项1-123和选项1-124中选择出一个其认为是正确答案的选项。之后，在用户1-A和用户1-B均选择完选项，或者是到达预定时间时，终端会从界面1-1跳转至界面1-2中，并在界面1-2中的用户信息显示区域1-21中，分别显示用户1-A的头像1-211、用户1-B的头像1-212、用户1-A的昵称XXXXX1-213以及用户1-B的昵称XXX1-214。同时，终端还会在结果展示区域1-22中，分别展示用户1-A获得的分数1-221：1493，以及用户1-B获得的分数1-222：1469。由于分数1-221高于分数1-222，因此，终端还会在用户信息显示区域1-21中的用户1-A的头像1-211上，添加特效1-2111：胜利。

由此可见，相关技术中的语言学习应用的趣味测试的测试形式较为单一，与其他用户的互动也较少，从而使得语言学习的趣味性较低。

需要说明的是，在相关技术中，还可以具有利用用户的各项语言课程学习所取得的分数，直接与其他用户的分数进行比拼，从而增加用户与其他用户的互动。示例性的，图2示出了相关技术中的分数比拼示例图，如图2所示，终端可以依据各项语言课程学习的分数，创建对应的技能，以格斗的方式来实现趣味比拼，其中，显示区域2-1中，展示的是依据语言课程学习的分数所创建出的技能。

本申请实施例提供一种音频测试方法、设备和计算机可读存储介质，能够提高语言学习的趣味性。下面说明本申请实施例提供的音频测试设备的示例性应用，本申请实施例提供的音频测试设备可以实施为笔记本电脑，平板电脑，台式计算机，机顶盒，移动设备(例如，移动电话，便携式音乐播放器，个人数字助理，专用消息设备，便携式游戏设备)等各种类型的用户终端，也可以实施为服务器。下面，将说明音频测试设备分别实施为终端和服务器时示例性应用。

参见图3，图3是本申请实施例提供的音频测试系统100的一个可选的架构示意图，为实现支撑一个音频测试应用，终端400通过网络300连接服务器200，网络300可以是广域网或者局域网，又或者是二者的组合。

终端400在当前显示界面接收口语练习指令，响应于口语练习指令，从当前显示界面跳转至移动控制界面。之后，当终端400接收到作用在移动控制界面的控制控件区域中的距离控制控件上的移动指令时，响应于移动指令，生成距离信息，并获取初始位置。接着，终端400会基于初始位置和距离信息，通过网络300向服务器200发送比拼请求，服务器200响应于比拼请求，从测试文本数据库中，抽取出口语测试文本，并将口语测试文本返回给终端400。终端400接收到服务器200针对比拼请求返回的口语测试文本，从移动控制界面跳转至文本展示界面，并在文本展示界面展示展示口语测试文本。接着，当终端400接收到作用在录音控件上的录制指令时，响应于录音指令，采集口语测试文本对应的当前音频数据，并将当前音频数据发送给服务器200，以使服务器200生成当前，其中，录音控件位于文本展示界面的录音控件展示区域中。服务器200接收到终端400针对口语测试文本发送的当前音频数据之后，就会基于口语测试文本，针对当前音频数据确定出比较结果，比较结果为比拼成功、比拼失败、比拼平局中的任意一种，然后将比较结果发送给终端400。终端400接收到比较结果之后，会从文本展示界面跳转至结果展示界面，并将比较结果展示在结果展示界面，从而实现音频测试过程。

需要说明的是，在一些实施例中，服务器200可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端400可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请实施例中不做限制。

参见图4，图4是本申请实施例提供的图3中的服务器200的结构示意图，图4所示的服务器200包括：至少一个第一处理器210、第一存储器250、至少一个第一网络接口220和第一用户接口230。服务器200中的各个组件通过第一总线系统240耦合在一起。可理解，第一总线系统240用于实现这些组件之间的连接通信。第一总线系统240除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图4中将各种总线都标为第一总线系统240。

第一处理器210可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

第一用户接口230包括使得能够呈现媒体内容的一个或多个第一输出装置231，包括一个或多个扬声器和/或一个或多个视觉显示屏。第一用户接口230还包括一个或多个第一输入装置232，包括有助于用户输入的用户接口部件，比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。

第一存储器250可以是可移除的，不可移除的或其组合。示例性的硬件设备包括固态存储器，硬盘驱动器，光盘驱动器等。第一存储器250可选地包括在物理位置上远离第一处理器210的一个或多个存储设备。

第一存储器250包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM，Read Only Memory)，易失性存储器可以是随机存取存储器(RAM，Random Access Me mory)。本申请实施例描述的第一存储器250旨在包括任意适合类型的存储器。

在一些实施例中，第一存储器250能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。

第一操作系统251，包括用于处理各种基本系统服务和执行硬件相关任务的系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；

第一网络通信模块252，用于经由一个或多个(有线或无线)第一网络接口220到达其他计算设备，示例性的第一网络接口220包括：蓝牙、无线相容性认证(Wi-Fi)、和通用串行总线(USB，Universal Serial Bus)等；

第一显示模块253，用于经由一个或多个与第一用户接口230相关联的第一输出装置231(例如，显示屏、扬声器等)使得能够呈现信息(例如，用于操作外围设备和显示内容和信息的用户接口)；

第一输入处理模块254，用于对一个或多个来自一个或多个第一输入装置232之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。

在一些实施例中，本申请实施例提供的装置可以采用软件方式实现，图4示出了存储在第一存储器250中的音频测试装置255，其可以是程序和插件等形式的软件，包括以下软件模块：第一接收模块2551、文本抽取模块2552、第一发送模块2553和结果确定模块2554这些模块是逻辑上的，因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。

在另一些实施例中，本申请实施例提供的音频测试装置可以采用硬件方式实现，作为示例，本申请实施例提供的音频测试装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本申请实施例提供的音频测试方法，例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC，Application Specific IntegratedCircuit)、DSP、可编程逻辑器件(PLD，Progra mmable Logic Device)、复杂可编程逻辑器件(CPLD，Complex Programmabl e Logic Device)、现场可编程门阵列(FPGA，Field-Programmable Gate Array)或其他电子元件。

示例性的，本申请实施例提供一种服务器，包括：

第一存储器，用于存储可执行音频测试指令；

参见图5，图5是本申请实施例提供的图3中的终端400的结构示意图，图5所示的终端400包括：至少一个第二处理器410、第二存储器450、至少一个第二网络接口420和第二用户接口430。终端400中的各个组件通过第二总线系统440耦合在一起。可理解，第二总线系统440用于实现这些组件之间的连接通信。第二总线系统440除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图5中将各种总线都标为第二总线系统440。

第二处理器410可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

第二用户接口430包括使得能够呈现媒体内容的一个或多个第二输出装置431，包括一个或多个扬声器和/或一个或多个视觉显示屏。第二用户接口430还包括一个或多个第二输入装置432，包括有助于用户输入的用户接口部件，比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。

第二存储器450可以是可移除的，不可移除的或其组合。示例性的硬件设备包括固态存储器，硬盘驱动器，光盘驱动器等。第二存储器450可选地包括在物理位置上远离第二处理器410的一个或多个存储设备。

第二存储器450包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM，Read Only Memory)，易失性存储器可以是随机存取存储器(RAM，Random Access Me mory)。本申请实施例描述的第二存储器450旨在包括任意适合类型的存储器。

在一些实施例中，第二存储器450能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。

第二操作系统451，包括用于处理各种基本系统服务和执行硬件相关任务的系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；

第二网络通信模块452，用于经由一个或多个(有线或无线)第二网络接口420到达其他计算设备，示例性的第二网络接口420包括：蓝牙、无线相容性认证(Wi-Fi)、和通用串行总线(USB，Universal Serial Bus)等；

第二显示模块453，用于经由一个或多个与第二用户接口430相关联的第二输出装置431(例如，显示屏、扬声器等)使得能够呈现信息(例如，用于操作外围设备和显示内容和信息的用户接口)；

第二输入处理模块454，用于对一个或多个来自一个或多个第二输入装置432之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。

在一些实施例中，本申请实施例提供的结果展示装置可以采用软件方式实现，图5示出了存储在第二存储器450中的结果展示装置455，其可以是程序和插件等形式的软件，包括以下软件模块：第二接收模块4551、距离生成模块4552、第二发送模块4553、界面展示模块4554和和音频采集模块4555，这些模块是逻辑上的，因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。

在另一些实施例中，本申请实施例提供的结果展示装置可以采用硬件方式实现，作为示例，本申请实施例提供的结果展示装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本申请实施例提供的音频测试方法，例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC，Application Specific IntegratedCircuit)、DSP、可编程逻辑器件(PLD，Progra mmable Logic Device)、复杂可编程逻辑器件(CPLD，Complex Programmabl e Logic Device)、现场可编程门阵列(FPGA，Field-Programmable Gate Array)或其他电子元件。

示例性的，本申请实施例提供一种终端，包括：

第二存储器，用于存储可执行音频测试指令；

下面，将结合本申请实施例提供的服务器和终端的示例性应用和实施，说明本申请实施例提供的音频测试方法。

参见图6，图6是本申请实施例提供的音频测试方法的一个可选的流程示意图一，将结合图6示出的步骤进行说明。

S101、终端在当前显示界面接收口语练习指令，响应于口语练习指令，从当前显示界面跳转至移动控制界面。

本申请实施例是在语言学习时进行口语练习的场景下实现的，例如，在两个对象基于对同一文本的朗读发音进行比拼的场景下实现，或者是两个对象对同一文本朗读语速进行比拼的场景下实现。终端在被唤醒后，会实时监测使用对象在当前显示界面上的各种指令，当终端在当前显示界面上接收到口语练习指令时，就会明确其需要进入移动控制界面，从而响应于口语练习指令，先利用移动控制界面覆盖当前显示界面，从而便于使用对象在移动控制界面上触发口语比拼事件。

可以理解的是，当前显示界面可以是终端的显示屏上所展示的任意显示界面，例如，主菜单界面，或者是社交应用的聊天界面等，本申请实施例在此不作限定。

在本申请实施例中，口语练习指令可以是通过使用对象在终端在当前显示界面上的操作事件触发的，例如，使用对象点击主菜单上的进入口语练习的控件对应的图标时，触达口语练习指令。口语练习指令还可以是使用对象通过在当前显示界面上触发语音助手之后，通过语音所触发的，例如，使用对象点击主菜单上的语音助手对应的图标之后，说出“开始口语练习”的语句时，就触发了口语练习指令。当然，终端还可以通过其他方式触发口语练习指令，本申请实施例中在此不作限定。

需要说明的是，本申请实施例中，是通过虚拟对象在虚拟场景中的移动，来触发各种各样的事件，当触发口语比拼事件时，才会开始口语比拼过程。移动控制界面就是用来展示虚拟场景，并控制虚拟对象移动的。

进一步的，在本申请的一些实施例中，移动控制界面中设置有控制控件区域，以用来展示能够控制虚拟对象移动的移动控制控件；移动控制界面中还可以设置有虚拟场景展示区域，以用来展示虚拟场景。

可以理解的是，使用对象可以是任意使用终端的用户。

S102、当终端接收到作用在移动控制界面的移动控制控件上的移动指令时，响应于移动指令，生成距离信息，并获取初始位置。

终端在进入移动控制界面之后，会先在控制控件区域中加载出移动控制控件，然后实时监测使用对象在移动控制控件上是否触发操作事件，当监测到使用对象在移动控制控件上的操作事件时，就会触发移动指令，并响应于移动指令，为虚拟场景中的虚拟对象生成距离信息，同时获取虚拟对象的初始位置，以便于利用初始位置和距离信息计算出虚拟对象应当移动到的目标位置。

需要说明的是，本申请实施例中，移动控制控件设置在控制控件区域中，控制控件区域位于移动控制界面的第一预设区域中，其中，第一预设区域的位置、大小均可以根据实际情况进行设定，例如，将第一预设位置设置在移动控制界面的底部，大小设置为50×50像素等，本申请实施例在此不作限定。

本申请实施例中，终端还可以为移动控制控件设置对应的移动控件图标，其中，移动控件图标的外观可以设置为骰子，也可以设置为摇杆等，本申请实施例在此不作限定。

可以理解的是，在本申请的一些实施例中，距离信息中包括了虚拟对象要移动的距离点数，还包括了虚拟对象要移动的方向。距离信息中的距离点数和移动的方向，可以是响应于移动指令而随机生成的，也可以是直接获取设置好的点数和距离。示例性的，终端可以每触发一次移动指令，随机生成的距离点数和移动的方向，也可以在每个触发移动指令时，都生成相同的距离点数和移动的方向，本申请实施例在此不作限定。

示例性的，本申请实施例提供了移动控制界面的示例图，参见图7，在移动控制界面7-1中，设置控制控件区域7-11，在控制控件区域中，设置有移动控制控件7-12，只要使用对象在移动控制界面7-1中点击了移动控制控件7-12，就会生成距离信息。

S103、终端基于初始位置和距离信息，向服务器发送比拼请求。

终端在得到初始位置和距离信息之后，就可以依据初始位置和距离信息计算出虚拟对象的目标位置，然后在基于目标位置的事件的类型，确定是否要生成比拼请求，当生成比拼请求时，向服务器发送比拼请求。服务器接收终端发送的比拼请求，从而明确其需要配合终端来实现口语比拼过程。

S104、服务器响应于比拼请求，从测试文本数据库中，抽取出口语测试文本，并将口语测试文本返回给终端。

服务器在接收到终端所发送的比拼请求之后，就会响应于比拼请求，从测试文本数据库中，随机抽取出一个测试文本，被选中的测试文本，就是口语测试文本，然后通过网络将口语测试文本发送给终端。对于终端而言，口语测试文本是发送了比拼请求之后才返回的，因此，终端接收服务器针对比拼请求返回的口语测试文本，从移动控制界面跳转至文本展示界面，并在文本展示界面展示口语测试文本。

可以理解的是，在文本展示界面中，设置有文本展示区域，终端将口语测试文本显示在文本展示区域中，以完成对口语测试文本的展示。其中，文本展示区域位于文本展示界面的第二预设区域中，当然的，第二预设区域的位置和大小，也是可以根据实际情况进行设置的，例如，将第二预设区域设置在文本展示区域的上半部分，大小设置为200×200像素等，本申请实施例在此不作具体限定。

示例性的，本申请实施例提供了文本展示界面的示例图一，如图8所示，在文本展示界面8-1中，具有文本展示区域8-11，在其中，展示有口语测试文本：我爸妈开了一家豆腐店8-12。

需要说明的是，在本申请的一些实施例中，由于终端给服务器发送比拼请求，终端接收服务器返回的口语测试文本这一过程需要消耗一定的时间，而终端有在接收到口语测试文本之后才会跳转至文本展示界面中，为了避免在使用对象触发了移动指令，但是由于网络传输等原因使得显示界面一直停留在移动控制界面的情况，终端还可以在响应于移动指令，在基于初始位置和距离信息向服务器发送比拼请求的同时，进入临时展示界面中，当终端接收到口语测试文本中，再从临时展示界面跳转至文本展示界面。

在本申请的一些实施例中，临时展示界面中可以展示有进行口语比拼的两个对象的头像信息，也可以展示有“请等待题目”等文字提示，还可以展示有其他内容，本申请实施例在此不作限定。

示例性的，本申请实施例提供了临时展示界面的示例图，如图9所示，在临时展示界面9-1中，展示有进行口语比拼的两个对象的头像信息，即用户A的头像9-11和用户B的头像9-12，同时在两个头像中间还展示有“VS”字样，以提示要开始进行口语比拼了。

需要说明的是，口语测试文本用来录制使用对象的音频数据的，口语测试文本对应有标准读音，从而在后续可以利用标准读音来判断所录制的音频数据的发音的准确程度。

S105、当终端接收到作用在录音控件上的录音指令时，响应于录音指令，采集口语测试文本对应的当前音频数据，并将当前音频数据发送给服务器，以使服务器生成当前音频数据对应的比较结果。

当终端监测到使用对象在录音控件上触发了录音指令，就会响应于录音指令，调用音频采集装置来采集使用对象朗读口语测试文本的音频，从而得到口语测试文本所对应的当前音频数据。终端在得到当前音频数据之后，就会将当前音频数据通过网络发送给服务器，服务器接收终端针对口语测试文本发送的当前音频数据，以便于在后续来为当前音频数据生成对应的比较结果。

需要说明的是，录音控件位于文本展示界面的录音控件展示区域中，录音控制展示区域设置在文本展示界面的第三预设区域中。其中，第三预设区域的位置和大小均可以根据实际情况进行设置，本申请实施例在此不作具体限定，例如，将第三预设区域设置在文本展示界面的底部，大小设置为50×50等。

示例性的，本申请实施例提供了文本展示界面的示例图二，参见图10，在文本展示界面10-1中，设置有文本展示区域10-11和录音控件展示区域10-12。在录音控件展示区域10-12中，展示有录音控件10-13，当使用对象点击了录音控件10-13，即可触发录音过程。当录音过程开始之后，终端还会在文本展示界面10-1的录音控件展示区域10-12中，展示录音结束控件10-14，当使用对象触发此控件时，终端就会结束录音，从而得到使用对象的当前音频数据。

S106、服务器基于口语测试文本，针对当前音频数据确定出比较结果；比较结果为比拼成功、比拼失败、比拼平局中的任意一种。

服务器在接收到当前音频数据之后，就会获取口语测试文本所对应的标准发音，然后基于标准发音，来为当前音频数据进行评分，接着将当前音频数据对应的评分分数与其他对象针对口语测试文本的音频数据的评分分数进行比较，判断出当前音频数据是否比其他对对象的音频数据的发音更加标准，从而判断出当前音频数据是比拼成功、比拼失败，还是比拼平局，从而得到比较结果。

可以理解的是，本申请实施例中，当前音频数据和其他对象的音频数据，都是针对相同的测试文本所获取到的，即针对同一个口语测试文本所获取到的。也就是说，本申请实施例中的其他对象的音频数据，是在其他对象朗读口语测试文本时所录制到的音频。

在本申请的一些实施例中，服务器可以是将获取到其他对象针对口语测试文本的离线评分分数，来与当前音频数据的评分分数进行比较，得到比较结果，也可以是同时获取其他对象的音频数据，然后同时给其他对象的音频数据和当前音频数据进行评分并比较，从而得到比较结果，本申请实施例在此不作限定。

S107、服务器将比较结果发送给终端。

服务器在得到比较结果之后，就会通过网络将比较结果发送给终端。终端接收服务器针对当前音频数据返回的比较结果，从文本展示界面跳转至结果展示界面，将比较结果展示在结果展示界面。

需要说明的是，在本申请的一些实施例中，比较结果中还可以包括服务器对当前音频数据的评分分数，以及当前音频数据的比拼结果，当终端接收到服务器发送的比较结果之后，还可以从比较结果中先解析出当前音频数据对应的评分分数，然后将评分分数展示在文本展示界面的分数展示区域中，然后再从文本展示界面跳转至结果展示界面，来展示比拼结果和当前音频数据的评分分数。

示例性的，本申请实施例提供了展示当前音频数据的评分分数的示例图，参见图11，在文本展示界面11-1上，除了文本展示区域11-11、录音控件展示区域11-12之外，还设置有分数展示区域11-13。终端在文本展示区域11-11中展示文本：我爸妈开了一家豆腐店11-111，在分数展示区域11-13中展示所录制的当前音频数据的评分分数：1493。如此，就完成了对评分分数的展示。除此之外，终端还可以在录音控件展示区域11-12中展示重录控件11-14，以便使用对象在对评分不满意时可以通过触发该控件重新开始进行录音。

在本申请的一些实施例中，终端基于初始位置和距离信息，向服务器发送比拼请求，即S103的具体实现过程，可以包括：S1031-S1034，如下：

S1031、终端根据初始位置和距离信息，计算出目标位置。

S1032、终端获取目标位置对应的目标事件。

终端根据虚拟场景中的虚拟对象的初始位置，以及随机生成的距离信息，为虚拟对象计算出其应当移动到的目标位置，之后，终端会获取目标位置所对应的事件，将获取到的事件作为目标事件。

可以理解的是，由于距离信息中包括距离点数和移动的方向，因此，终端在实质上是根据初始位置、距离点数和移动的方向来确定目标位置的，即确定出从初始位置开始，沿着移动的方向，移动了距离点数之后，所到达的位置即为目标位置。

可以理解的是，终端在虚拟场景中的一些位置上设置了事件，例如设置了比拼事件，设置了继续前进的事件等，当然，在虚拟场景的另一些位置中，可能并没有设置事件，此时，终端所获得的目标事件就是空事件。

S1033、终端对目标事件进行类型判断，得到判断结果；判断结果表征目标事件是否是比拼事件。

当终端获取到目标事件之后，就会判断目标事件是属于什么类型的，从而判断出目标事件是不是比拼事件。当终端判断出目标事件是比拼事件时，会生成表征目标事件是比拼事件的判断结果，当终端判断出目标事件不是比拼事件时，会生成表征目标事件不是比拼事件的判断结果。

S1034、当判断结果表征目标事件为比拼事件时，终端向服务器发送比拼请求。

终端在得到判断结果之后，就会对判断结果进行读取，当终端发现判断结果是比拼事件时，就会生成比拼请求，然后将比拼请求通过网络发送给服务器，以便于通知服务器需要开始口语比拼过程了。

本申请实施例中，终端可以根据初始位置和距离信息，计算出目标位置，然后判断目标位置对于的目标事件是否是比拼事件，在目标事件是比拼事件时向服务器发送比拼请求，从而实现依据初始位置和距离信息，向服务器发送比拼请求的过程。

在本申请的一些实施例中，终端响应于移动指令，生成距离信息，即S102的具体实现过程，可以包括：S1021-S1022，如下：

S1021、终端响应于移动指令，在预设好的距离点数集合内，随机选取出距离点数。

S1022、终端利用距离点数和预设好的移动方向，整合出距离信息。

终端响应于移动指令，先获取预设好的距离点数集合，然后再在预设好的距离点数集合内，随机选取出一个距离点数。接着，终端再获取预设好的移动方向，然后将距离点数和预设好的移动方向打包，就整合出了距离信息。

可以理解的是，预设好的点数集合是由多个不同的距离点数组成的，其中，最大的距离点数、最小的距离点数以及各个距离点数之间的间距，都可以根据实际情况进行设定，本申请实施例中在此不作限定。例如，将最大的距离点数设置为6，将最小的距离点数设置为1，将距离点数之间的间隔设置为1，如此，就可以构造出具有6个不同的距离点数的预设好的距离点数集合了。

在本申请的一些实施例中，预设好的移动方向可以是顺时针方向，即虚拟场景中的虚拟对象，沿着虚拟场景中的路径进行顺时针的动；预设好的移动方向也可以是逆时针方向，即虚拟对象沿着虚拟场景中的路径进行逆时针的移动。具体的预设好的移动方向可以根据实际情况进行设置，本申请实施例在此不作限定。

本申请实施例中，终端可以先从预设好的距离点数集合内，随机选取出距离点数，然后再将距离点数和预设好的移动方向进行整合，得到距离信息，从而实现响应于移动方向，生成距离信息，以便于根据距离信息来向服务器发送比拼请求。

在本申请的一些实施例中，终端在根据初始位置和距离信息，计算出目标位置之后，即在S1031之后，该方法还可以包括：S1035-S1036，如下：

S1035、终端在移动控制界面的虚拟场景展示区域的虚拟路径中，控制虚拟对象从初始位置移动到目标位置。

其中，虚拟场景展示区域用于展示虚拟场景，虚拟路径为虚拟场景中的闭环路径，虚拟对象为使用对象在虚拟场景中所控制的对象。

终端在计算出虚拟对象应当移动到的目标位置之后，还应当在显示界面中显示虚拟对象的移动过程。此时，终端会在移动控制界面设置虚拟场景展示区域，以利用虚拟场景展示区域来展示虚拟场景。然后，终端会在虚拟场景展示区域中，展示虚拟对象在虚拟路径上的移动过程，即控制虚拟对象沿着虚拟路径，从初始位置移动到目标位置的过程。

可以理解的是，虚拟场景展示区域位于移动控制界面的第四预设区域中，其中，第四预设区域的大小和位置均可以根据实际情况进行设置，本申请实施例在此不作限定。值得注意的是，为了更清楚的展示移动过程，虚拟场景展示区域和控件控制区域不重叠。

示例性的，本申请实施例提供了虚拟对象移动的过程示例图，参见图12，在移动控制界面12-1中，设置有控制控件区域12-11，以及虚拟场景展示区域12-12。在控制控件区域12-11中，具有移动控制控件12-111；在虚拟场景展示区域12-12中，显示有虚拟的小镇场景，在小镇场景中，具有闭环路径12-121，该路径即是虚拟路径。初始位置12-122位于闭环路径12-121上，移动之前，虚拟对象12-123即位于初始位置12-122上。当终端计算出目标位置12-124之后，就会控制虚拟对象12-123移动到目标位置12-124上，从而实现控制虚拟对象的移动过程。

S1036、终端记录目标位置。

在虚拟对象移动到目标位置之后，终端会对目标位置进行记录，以便于后续当使用对象再次触发移动指令时，将目标位置作为信息的初始位置，开始对虚拟对象进行新一轮的移动控制过程。

本申请实施例中，终端能够对虚拟对象在虚拟场景中的移动过程进行展示，从而更能直观的比拼事件的触发过程，进一步增加了语言学习的趣味性，同时，终端还会对目标位置进行记录，以便于后续开始新的一轮移动控制过程。

参见图13，图13是本申请实施例提供的音频测试方法的一个可选的流程示意图二。在本申请的一些实施例中，服务器基于口语测试文本，针对当前音频数据确定出比较结果，即S106的具体实现过程，可以包括：S1061-S1063，如下：

S1061、服务器从匹配指标数据库中获取口语测试文本对应的第一匹配指标。

其中，第一匹配指标是对第一音频数据所确定出的指标，第一音频数据是除使用对象之外的其他对象在历史时间针对口语测试文本所录制的音频。

本申请实施例中，服务器是利用其它对象针对口语测试文本的音频数据的离线评分分数来实现口语比拼的。此时，服务器先会从匹配指标数据库中，任意获取一个指标，作为第一匹配指标。需要说明的是，匹配指标数据库中的各个匹配指标，都是针对其他对象在历史时间针对口语测试文本朗读时所录制到的音频进行评分所得到的指标，服务器任选出的第一匹配指标，即是针对其他对象在历史时间所录制的第一音频数据的评分分数。可以理解的是，本申请实施例中的口语测试文本，指的是已经从测试文本数据库中所选择出的测试文本，也就是说，使用对象针对口语测试文本所录制的当前音频数据，和其他对象针对口语测试文本所录制的第一音频数据，是针对测试文本数据库中的同一个测试文本录制的。

S1062、服务器针对当前音频数据确定出当前指标。

服务器利用口语测试文本所对应的标准音频数据，对当前音频数据进行评分，得到当前音频数据对应的评分分数，并将当前音频数据的评分分数作为当前音频数据对应的当前指标。

在本申请的一些实施例中，服务器可以利用标准音频数据的发音，来对当前音频数据进行评分，从而得到当前指标。

S1063、服务器将当前指标和第一匹配指标进行比较，得到比较结果。

服务器在得到当前指标和第一匹配指标之后，就会将当前指标和第一匹配指标进行大小比较，从而确定出是当前音频数据的发音更接近标准音频数据，还是第一音频数据的发音更接近标准音频数据。当第一匹配指标大于当前指标时，服务器就会生成当前音频数据比拼失败的比较结果，当第一匹配指标小于当前指标时，服务器就会生成当前音频数据比拼成功的比较结果，当第一匹配指标等于当前指标时，服务器就会生成当前音频数据与其他音频数为比拼平局的比较结果。

在本申请的一些实施例中，服务器在得到比较结果之后，还可以根据比较结果的具体内容，来决定是否向使用对象的终端发送奖励信息，例如，在比较结果为比拼成功或比拼平局时，向使用对象的终端发送金币奖励，在比较结果为比拼失败时，不向使用对象的终端发送金币奖励。

本申请实施例中，服务器可以对当前音频数据实现离线比较，从而在在线对象数目较少时，也可以对使用对象的当前音频数据完成比较，并且，离线比较的方式只需要对当前音频数据进行分析，从而使得分析的数据较少，提高了音频测试的效率。

在本申请的一些实施例中，服务器针对当前音频数据确定出当前指标，即S1062的具有实现过程，可以包括：S1062a-S1062c，如下：

S1062a、服务器对当前音频数据进行分解，得到当前发音序列。

服务器可以利用语音识别技术，来对当前音频数据进行识别、分解，从而得到当前音频数据对应的发音序列，并将该发音序列记为当前发音序列，以便于后续利用当前发音序列来对当前音频数据进行评分。

S1062b、服务器利用口语测试文本对应的标准发音序列对当前发音序列进行匹配，得到匹配结果。

其中，匹配结果表征当前发音序列和标准发音序列的匹配程度。

服务器在得到当前发音序列之后，就会获取口语测试文本所对应的标准发音序列，然后将标准发音序列中的每个音素，与当前发音序列中的每个音素进行匹配，来确定出当前发音序列和标准发音序列的匹配程度，将最终确定出的匹配程度，作为当前发音序列和标准发音序列的匹配结果。

S1062c、服务器利用匹配结果，构造出当前音频数据对应的当前指标。

服务器在得到匹配结果之后，就能够明确当前发音序列与标准发音序列的匹配程度，然后将匹配程度直接作为当前音频数据对应的当前指标。当然，在本申请的一些实施例中，服务器还可以对当前发音序列和标准发音序列的匹配程度乘上预设好的分数权重，将最终的相乘结果作为当前音频数据对应的当前指标。

示例性的，当标准发音序列和当前发音序列的匹配程度为70％时，服务器可以直接将当前指标设置为70分，也可以给70％乘上预设好的分数权重，例如乘上1000，得到700分，将700分作为当前指标。

本申请实施例中，服务器可以将当前音频数据分解为当前发音序列，然后用当前发音序列与标准发音序列进行匹配，从而基于匹配结果得到当前音频数据对应的当前指标。如此，服务器就能够实现为当前音频数据确定出当前指标的过程，从而便于后续基于当前指标来确定出比较结果。

参见图14，图14是本申请实施例提供的音频测试方法的一个可选的流程示意图三。在本申请的一些实施例中，服务器基于口语测试文本，针对当前音频数据确定出比较结果，即S106的具体实现过程，可以包括：S1064-S1066，如下：

S1064、服务器获取口语测试文本对应的第二音频数据；第二音频数据是与当前音频数据同时接收到的音频数据。

S1065、服务器对第二音频数据进行分析，得到第二匹配指标，对当前音频数据进行分析，得到当前指标。

本申请实施例中，服务器是对当前音频数据进行在线比较。此时，服务器会获取与当前音频数据同时接收到的针对口语测试文本的音频数据，或者是与当前音频数据在非常相近的时间(例如5秒中之内)内接收到的针对口语测试文本的音频数据，将获取到的音频数据作为第二音频数据。接着，服务器会分别对第二音频数据和当前音频数据进行分析，从而得到第二音频数据对应的第二匹配指标，得到当前音频数据对应的当前指标。

可以理解的是，服务器在对第二音频数据和当前音频数据进行分析时，是利用语音识别技术将第二音频数据线分解为第二音频序列，然后用标准音频序列对第二音频序列进行评分，同时利用语音识别技术将当前音频数据分解为当前音频序列，并利用标准音频序列对当前音频序列进行评分，从而得到第二匹配指标和当前指标。

S1066、服务器将当前指标和第二匹配指标进行比较，得到比较结果。

服务器在得到当前指标和第二匹配指标之后，就会比较当前指标和第二匹配指标的大小，当第二匹配指标大于当前指标时，服务器就会生成表征当前音频数据比拼失败的比较结果，当第二匹配指标小于当前指标时，服务器会生成表征当前音频数据比拼成功的比较结果，当第二匹配指标等于当前指标时，服务器会生成当前音频数据比拼平局的比较结果。这样，服务器就能够实现对当前音频数据进行在线比较的过程了。

本申请实施例中，服务器能够获取与当前音频数据同时接收到的第二音频数据，然后分别对第二音频数据和当前音频数据进行分析，得到第二匹配指标和当前指标，再将当前指标和第二匹配指标进行比较，得到比较结果，从而实现对当前音频数据进行在线比较，得到比较结果。

下面，将说明本申请实施例在一个实际的应用场景中的示例性应用。

本申请实施例是在通过比拼玩法练习普通话的场景下实现的。

首先，如图11所示，在终端显示的虚拟的小镇场景(虚拟场景)中，具有一条闭环式的路径(虚拟路径)，路径被分为一个个的格子，格子可以分为普通格子和事件格子，比拼事件为其中的一种。当用户在通过比拼玩法练习普通话时，可以通过点击图11所示出的终端的显示界面中骰子图标(移动控制控件)，获得一个随机点数(距离点数)，从而控制虚拟人物(虚拟对象)根据骰子点数沿着指定方向(预设好的移动方向)，移动相应的格子数(移动开始时在初始位置，移动完成后到达目标位置)。接着，终端会标记虚拟人物移动停止时所停留的格子位置(目标位置)，若停留的格子位置是比拼事件，则会触发比拼事件。当触发比拼事件时，服务器会接收终端的发送的用户触发比拼事件的消息(比拼请求)，从而开始口语比拼。

图15是本申请实施例提供的实际应用场景的普通话比拼事件过程示例图。当用户触发比拼事件15-1之后，服务器会在题库(测试文本数据库)中随机抽取一道普通话朗读题15-2(口语测试文本)，然后在已经完成该题目的其他用户中(其他对象)，随机匹配一个已完成该题目的其他用户的数据15-3(第一匹配指标)，接着返回比拼页面信息，即返回题目和双方信息15-4。接着，终端显示服务器返回的题目，录制用户朗读题目的录音(当前音频数据)15-5，并将录音上传给服务器15-6。接着，服务器对上传的录音进行普通话水平评分15-7，得到评分结果(当前指标)，然后，服务器将评分结果和之前随机抽取出的其他用户的数据进行数据对比15-8，从而判断出用户和其他用户的比拼胜负(比较结果)。当用户的评分结果大于其他用户的数据时，服务器向终端返回用户获胜的消息15-9；当用户的评分结果等于其他用户的数据时，服务器向终端返回平局的消息15-10；当用户的评分结果小于其他用户的数据时，服务器向终端返回失败的消息15-11。

终端接收到服务器返回的比拼胜负的消息之后，就会将该消息显示出来，以便于用户查看。这样，就实现了通过比拼玩法练习普通话的过程。

通过上述方式，终端能够根据用户掷骰子的操作，为用户对应的虚拟人物确定出移动的距离，从而确定出虚拟人物应当移动到的格子位置，然后判断格子位置对应的是否时比拼事件，当格子位置对应的是比拼事件时，向服务器发送触发比拼事件的消息，从而服务器开始随机抽取普通话题目，并对用户的普通话题目的朗读录音进行评分，然后将评分与其他用户的数据进行比较，从而实现将用户的普通话水平是否与其他用户的普通话水平进行比较。如此，能够在普通话学习过程中与其他用户进行互动比拼，增加了针对普通话学习的趣味测试的方式，也就增加了普通话学习的趣味性。

下面继续说明本申请实施例提供的音频测试装置255的实施为软件模块的示例性结构，在一些实施例中，如图4所示，存储在第一存储器250的音频测试装置255中的软件模块可以包括：

第一接收模块2551，用于接收终端发送的比拼请求；接收所述终端针对所述口语测试文本发送的当前音频数据；

文本抽取模块2552，用于响应于所述比拼请求，从所述测试文本数据库中，抽取出口语测试文本；

第一发送模块2553，用于将所述口语测试文本返回给所述终端；将所述比较结果发送给所述终端；

结果确定模块2554，用于基于所述口语测试文本，针对所述当前音频数据确定出比较结果；所述比较结果为比拼成功、比拼失败、比拼平局中的任意一种。

在本申请的一些实施例中，所述结果确定模块2554，具体用于从匹配指标数据库中获取所述口语测试文本对应的第一匹配指标；所述第一匹配指标是对第一音频数据所确定出的指标，所述第一音频数据是除使用对象之外的其他对象在历史时间针对所述口语测试文本所录制的音频；针对所述当前音频数据确定出当前指标；将所述当前指标和所述第一匹配指标进行比较，得到所述比较结果。

在本申请的一些实施例中，所述结果确定模块2554，具体用于对所述当前音频数据进行分解，得到当前发音序列；利用所述口语测试文本对应的标准发音序列对所述当前发音序列进行匹配，得到匹配结果；所述匹配结果表征所述当前发音序列和所述标准发音序列的匹配程度；利用所述匹配结果，构造出所述当前音频数据对应的当前指标。

在本申请的一些实施例中，所述结果确定模块2554，具体用于获取所述口语测试文本对应的第二音频数据；所述第二音频数据是与所述当前音频数据同时接收到的音频数据；对所述第二音频数据进行分析，得到第二匹配指标，对所述当前音频数据进行分析，得到当前指标；将所述当前指标和所述第二匹配指标进行比较，得到所述比较结果。

下面继续说明本申请实施例提供的结果展示装置455的实施为软件模块的示例性结构，在一些实施例中，如图5所示，存储在第二存储器450的结果展示装置455中的软件模块可以包括：

第二接收模块4551，用于在当前显示界面接收口语练习指令；接收作用在所述移动控制界面的移动控制控件上的移动指令；接收作用在录音控件上的录音指令；以及接收所述服务器针对所述当前音频数据返回的比较结果；

距离生成模块4552，用于当接收到作用在所述移动控制界面的移动控制控件上的移动指令时，响应于所述移动指令，生成距离信息，并获取初始位置；

第二发送模块4553，用于基于所述初始位置和所述距离信息，向服务器发送比拼请求；将所述当前音频数据发送给所述服务器，以使所述服务器生成所述当前音频数据对应的比较结果；

界面展示模块4554，用于响应于所述口语练习指令，从所述当前显示界面跳转至移动控制界面；从所述移动控制界面跳转至文本展示界面，并在所述文本展示界面展示所述口语测试文本；从所述文本展示界面跳转至结果展示界面，将所述比较结果展示在所述结果展示界面；

音频采集模块4555，用于当接收到作用在录音控件上的录音指令时，响应于所述录音指令，采集所述口语测试文本对应的当前音频数据。

在本申请的一些实施例中，所述第二发送模块4553，具体用于根据所述初始位置和所述距离信息，计算出目标位置；获取所述目标位置对应的目标事件；对所述目标事件进行类型判断，得到判断结果；所述判断结果表征所述目标事件是否是比拼事件；当所述判断结果表征所述目标事件为所述比拼事件时，向所述服务器发送所述比拼请求。

在本申请的一些实施例中，所述距离生成模块4552，具体用于响应于所述移动指令，在预设好的距离点数集合内，随机选取出距离点数；利用所述距离点数和预设好的移动方向，整合出所述距离信息。

在本申请的一些实施例中，所述界面展示模块4554，还用于在所述移动控制界面的虚拟场景展示区域的虚拟路径中，控制虚拟对象从所述初始位置移动到所述目标位置；其中，所述虚拟场景展示区域用于展示虚拟场景，所述虚拟路径为所述虚拟场景中的闭环路径，所述虚拟对象为所述使用对象在所述虚拟场景中所控制的对象；记录所述目标位置。

本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行本申请实施例上述的音频测试方法。

本申请实施例提供一种存储有可执行指令的计算机可读存储介质，其中存储有可执行音频测试指令，当可执行指令被第一处理器执行时，将引起第一处理器执行本申请实施例服务器侧提供的音频测试方法，当可执行音频测试指令被第二处理器执行时，将引起第二处理器执行本申请实施例终端侧提供的音频测试方法。

在一些实施例中，计算机可读存储介质可以是FRAM、ROM、PROM、EP ROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器；也可以是包括上述存储器之一或任意组合的各种设备。

在一些实施例中，可执行音频测试指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言(包括编译或解释语言，或者声明性或过程性语言)来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例，可执行音频测试指令可以但不一定对应于文件系统中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言(HTML，HyperText Markup Language)文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件(例如，存储一个或多个模块、子程序或代码部分的文件)中。

作为示例，可执行音频测试指令可被部署为在一个计算设备上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。

以上所述，仅为本申请的实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本申请的保护范围之内。

Claims

1.一种音频测试方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述初始位置和所述距离信息，向服务器发送比拼请求，包括：

根据所述初始位置和所述距离信息，计算出目标位置；

获取所述目标位置对应的目标事件；

对所述目标事件进行类型判断，得到判断结果；所述判断结果表征所述目标事件是否是比拼事件；

当所述判断结果表征所述目标事件为所述比拼事件时，向所述服务器发送所述比拼请求。

3.根据权利要求2所述的方法，其特征在于，在所述根据所述初始位置和所述距离信息，计算出目标位置之后，所述方法还包括：

在所述移动控制界面的虚拟场景展示区域的虚拟路径中，控制虚拟对象从所述初始位置移动到所述目标位置；

其中，所述虚拟场景展示区域用于展示虚拟场景，所述虚拟路径为所述虚拟场景中的闭环路径，所述虚拟对象为使用对象在所述虚拟场景中所控制的对象；

记录所述目标位置。

4.一种音频测试方法，其特征在于，包括：

接收终端发送的比拼请求，所述比拼请求是所述终端基于初始位置和距离信息向服务器发送的，所述初始位置为所述终端接收到作用在移动控制界面的移动控制控件上的移动指令时，所述移动控制界面中虚拟对象的位置；所述距离信息为所述终端响应于所述移动指令生成的信息，其中，所述终端能够基于接收到的口语练习指令由当前显示界面跳转至所述移动控制界面；

响应于所述比拼请求，从测试文本数据库中，抽取出口语测试文本，并将所述口语测试文本返回给所述终端；

接收所述终端针对所述口语测试文本发送的当前音频数据；

基于所述口语测试文本，针对所述当前音频数据确定出比较结果；所述比较结果为比拼成功、比拼失败、比拼平局中的任意一种，所述比较结果表征使用对象与其他对象之间的离线比较结果或者使用对象与其他对象之间的在线比较结果；

将所述比较结果发送给所述终端。

5.根据权利要求4所述的方法，其特征在于，所述基于所述口语测试文本，针对所述当前音频数据确定出比较结果，包括：

从匹配指标数据库中获取所述口语测试文本对应的第一匹配指标；所述第一匹配指标是对第一音频数据所确定出的指标，所述第一音频数据是除使用对象之外的其他对象在历史时间针对所述口语测试文本所录制的音频；

针对所述当前音频数据确定出当前指标；

将所述当前指标和所述第一匹配指标进行比较，得到所述比较结果。

6.根据权利要求5所述的方法，其特征在于，所述针对所述当前音频数据确定出当前指标，包括：

对所述当前音频数据进行分解，得到当前发音序列；

利用所述口语测试文本对应的标准发音序列对所述当前发音序列进行匹配，得到匹配结果；所述匹配结果表征所述当前发音序列和所述标准发音序列的匹配程度；

利用所述匹配结果，构造出所述当前音频数据对应的当前指标。

7.根据权利要求4所述的方法，其特征在于，所述基于所述口语测试文本，针对所述当前音频数据确定出比较结果，包括：

获取所述口语测试文本对应的第二音频数据；所述第二音频数据是与所述当前音频数据同时接收到的音频数据；

对所述第二音频数据进行分析，得到第二匹配指标，对所述当前音频数据进行分析，得到当前指标；

将所述当前指标和所述第二匹配指标进行比较，得到所述比较结果。

8.一种服务器，其特征在于，包括：

第一存储器，用于存储可执行音频测试指令；

第一处理器，用于执行所述第一存储器中存储的可执行音频测试指令时，实现权利要求4至7任一项所述的方法。

9.一种终端，其特征在于，包括：

第二存储器，用于存储可执行音频测试指令；

第二处理器，用于执行所述第二存储器中存储的可执行音频测试指令时，实现权利要求1至3任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，存储有可执行音频测试指令，用于被第一处理器执行时，实现权利要求4至7任一项所述的方法；或者用于被第二处理器执行时，实现权利要求1至3任一项所述的方法。