CN109785683A

CN109785683A - 用于模拟口语考试现场的方法、装置、电子设备以及介质

Info

Publication number: CN109785683A
Application number: CN201711111332.7A
Authority: CN
Inventors: 林晖
Original assignee: SHANGHAI LIULISHUO INFORMATION TECHNOLOGY Co Ltd
Current assignee: SHANGHAI LIULISHUO INFORMATION TECHNOLOGY Co Ltd
Priority date: 2017-11-13
Filing date: 2017-11-13
Publication date: 2019-05-21

Abstract

本发明的实施方式提供了一种用于模拟口语考试现场的方法，该方法包括：步骤一，根据考生选择信息和/或考生个人信息，获取相应的真人模考音视频文件；步骤二，根据所述真人模考音视频文件和随机抽取的题库中的题目播放对应的音视频；以及步骤三，当播放完当前题目的音视频时，采集所述当前题目的考生作答信息并同时播放所述真人模考音视频文件中考官听取考生作答时的对应视频。通过本发明的用于模拟口语考试现场的方法，可以使用户在互联网上进行口语考试，让考生在线也能够体验到真实的考试流程，提高了用户体验。此外，本发明实施方式还提供了一种介质、用于模拟口语考试现场的装置及电子设备。

Description

用于模拟口语考试现场的方法、装置、电子设备以及介质

技术领域

本发明的实施方式涉及计算机辅助教育领域，更具体地，本发明的实施方式涉及用于模拟口语考试现场的方法、装置、电子设备以及介质。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或者上下文。此处的描述不因为包括在本部分中就承认是现有技术。

现有技术中主要是通过线下预约各培训机构的模拟考试(以下简称“线下模考”)方式来实现口语考试或者模拟口语考试。但线下模考具有以下的缺点：

A、时间周期长、效率低：线下模考大多需要提前数周预约，并且限于场地和人员限制，对时间和空间的要求较高。同时相比较于浪费在路程和报名等待过程中的时间，考生花费在模考本身的时间比例较低。

B、专业性低：线下模考机构的考官水平难以保证，所有模考机构均为民间创办，考生容易受到不专业的模考误导。

C、花费金额高：线下模考花费为数百元至数千元不等，高额消费的同时不保证效果。

D、重复性、回顾性差：线下模考的口语考试后，考生难以回顾自己考试中的发挥和表现，不能反复聆听提高自己的回答并进行重复性学习。

因此，市面上出现了各种线上软件模考产品，进行非互动型的人机模拟考试。

发明内容

但是，现有的线上软件模考具有以下缺点：

A、模拟性差：线上软件提供的模拟考试环境均为静止图片或者卡通形象模拟，甚至仅提供问题语音和文字供用户回答。大部分的模拟仅呈现考试问题本身，对真实考试中存在的考生身份核实、题目说明、回答内容和时间长短等方面的提示并未做出模拟，考生带入感差。

B、专业性差：由于线上模考的使用量和体量较大，大部分的问题和语音提示为自动合成的机械录音，与真人考官的地道口语发音相比用户体验极差。

C、枯燥单调：线上模考的模板单一、过程固定以及流程机械化、反复使用，用户体验越来越差。

D、互动性差：针对模考中发生的未听清或理解问题希望重复，以及回答过短过长等问题无法进行互动反馈，与真实考试中的场景差别较大。

图8-10为现有技术中几种常见的线上软件模考形式。其中，图8为“小站雅思”的口语模拟产品；图9为“雅思哥”的口语练习产品；图10为“雅思easy姐”的口语练习产品。

因此在现有技术中，用户无法体验到真实的口语考试现场流程和外教老师的发音及互动，这是非常令人烦恼的技术问题。

为此，非常需要一种改进的用于模拟口语考试现场的技术方案，在一定程度上避免线上模考的真实度不够的问题，增强用户口语考试的现场带入感，从而能够提高用户体验，听到真实的外教老师的发音，实现考生和真实的考官的互动。

在本上下文中，本发明实施方式期望提供一种用于模拟口语考试现场的方法、介质、用于模拟口语考试现场的装置以及电子设备。

在本发明实施方式的第一方面中，提供了一种用于模拟口语考试现场的方法，包括：步骤一，根据考生选择信息和/或考生个人信息，获取相应的真人模考音视频文件；步骤二，根据所述真人模考音视频文件和随机抽取的题库中的题目播放对应的音视频；以及步骤三，当播放完当前题目的音视频时，采集所述当前题目的考生作答信息并同时播放所述真人模考音视频文件中考官听取考生作答时的对应视频。

在本发明的一个实施例中，所方法还包括：步骤四，当接收到所述当前题目的考生回答结束信息时，对所述当前题目的考生作答信息的长度进行判断；步骤五，当所述长度小于预设长度时，返回重新采集所述当前题目的考生作答信息；步骤六，当所述长度大于等于所述预设长度时，对所述当前题目的考生作答信息进行语音识别获取所述当前题目的识别结果；步骤七，当所述当前题目的识别结果为第一内容时，返回重新播放所述当前题目的音视频；以及步骤八，当所述当前题目的识别结果为第二内容时，返回上述步骤二播放下一题目的音视频直至本次口语考试的所抽取的全部题目的音视频播放完。

在本发明的另一个实施例中，所述方法还包括：步骤九，当超过预设时长未接收到所述当前题目的考生回答结束信息时，返回上述步骤二播放下一题目的音视频直至本次口语考试的所抽取的全部题目的音视频播放完。

在本发明的再一个实施例中，所述方法还包括：采集考官模考视频，其中所述考官模考视频包括流程视频和题目视频；以及根据所述考官模考视频和题库中的题目音频生成所述真人模考音视频文件。

在本发明的再一个实施例中，所述根据所述考官模考视频和题库中的题目音频生成所述真人模考音视频文件包括：根据所述口语考试的发生顺序将所述流程视频进行拼接；将所述流程视频中的考官反馈部分和所述题目视频中的题目说明、问题陈述进行动画化处理；根据触发条件编写各视频文件和动画的触发逻辑；利用音视频合成技术将各视频文件和动画进行合成；以及将所述题目视频所转化生成的动画与所述题库中的对应题目音频作定时统一。

在本发明的再一个实施例中，所述方法还包括：判断是否接收到显示字幕选择信息；以及当接收到所述显示字幕选择信息时，抽取当前播放的音视频对应的字幕进行显示。

在本发明的再一个实施例中，所述方法还包括：当所述当前题目答题阶段结束和/或本次口语考试结束后，调取所述真人模考音视频文件相应的流程视频进行播放。

在本发明实施方式的第二方面中，提供了一种介质，其上存储有程序，该程序被处理器执行时实现上述方法实施方式中的各步骤，例如，步骤一，根据考生选择信息和/或考生个人信息，获取相应的真人模考音视频文件；步骤二，根据所述真人模考音视频文件和随机抽取的题库中的题目播放对应的音视频；以及步骤三，当播放完当前题目的音视频时，采集所述当前题目的考生作答信息并同时播放所述真人模考音视频文件中考官听取考生作答时的对应视频。

在本发明实施方式的第三方面中，提供一种用于模拟口语考试现场的装置，包括：音视频文件获取模块，用于根据考生选择信息和/或考生个人信息，获取相应的真人模考音视频文件；音视频播放模块，用于根据所述真人模考音视频文件和随机抽取的题库中的题目播放对应的音视频；以及答题音频采集模块，用于当播放完当前题目的音视频时，采集所述当前题目的考生作答信息并同时播放所述真人模考音视频文件中考官听取考生作答时的对应视频。

在本发明的一个实施例中，所述装置还包括：作答长度判断模块以及语言识别模块。

其中，所述作答长度判断模块用于当接收到所述当前题目的考生回答结束信息时，对所述当前题目的考生作答信息的长度进行判断。当所述当前题目的考生作答信息的长度小于预设长度时，重新调用所述答题音频采集模块返回重新采集所述当前题目的考生作答信息。

其中，所述语音识别模块用于当所述当前题目的考生作答信息的长度大于等于所述预设长度时，对所述当前题目的考生作答信息进行语音识别获取所述当前题目的识别结果。

其中，当所述当前题目的识别结果为第一内容时，调用所述音视频播放模块返回重新播放所述当前题目的音视频。当所述当前题目的识别结果为第二内容时，调用所述音视频播放模块播放下一题目的音视频直至本次口语考试的所抽取的全部题目的音视频播放完。

在本发明的又一个实施例中，所述音视频播放模块还用于：当超过预设时长未接收到所述当前题目的考生回答结束信息时，返回播放下一题目的音视频直至本次口语考试的所抽取的全部题目的音视频播放完。

在本发明的另一个实施例中，所述装置还包括：考官模考视频采集模块以及真人模考音视频生成模块。

其中，所述考官模考视频采集模块用于采集考官模考视频。其中所述考官模考视频包括流程视频和题目视频。所述真人模考音视频生成模块用于根据所述考官模考视频和题库中的题目音频生成所述真人模考音视频文件。

在本发明的再一个实施例中，所述真人模考音视频生成模块包括：拼接单元、动画处理单元、编写单元、合成单元以及定时统一单元。

其中，所述拼接单元用于根据所述口语考试的发生顺序将所述流程视频进行拼接。所述动画处理单元用于将所述流程视频中的考官反馈部分和所述题目视频中的题目说明、问题陈述进行动画化处理。所述编写单元用于根据触发条件编写各视频文件和动画的触发逻辑。所述合成单元用于利用音视频合成技术将各视频文件和动画进行合成。所述定时统一单元用于将所述题目视频所转化生成的动画与所述题库中的对应题目音频作定时统一。

在本发明的再一个实施例中，所述装置还包括：字幕显示判断模块以及字幕显示模块。其中，所述字幕显示判断模块用于判断是否接收到显示字幕选择信息。所述字幕显示模块用于当接收到所述显示字幕选择信息时，抽取当前播放的音视频对应的字幕进行显示。

在本发明的再一个实施例中，所述音视频播放模块还用于当所述当前题目答题阶段结束和/或本次口语考试结束后，调取所述真人模考音视频文件相应的流程视频进行播放。

在本发明实施方式的第四方面中，提供一种电子设备，主要包括：存储器，用于存储计算机程序；处理器，用于执行所述存储器中存储的计算机程序，且所述计算机程序被执行时，下述指令被运行：步骤一，根据考生选择信息和/或考生个人信息，获取相应的真人模考音视频文件；步骤二，根据所述真人模考音视频文件和随机抽取的题库中的题目播放对应的音视频；步骤三，当播放完当前题目的音视频时，采集所述当前题目的考生作答信息并同时播放所述真人模考音视频文件中考官听取考生作答时的对应视频。

根据本发明实施方式提供的用于模拟口语考试现场的方法、介质、装置以及电子设备，通过这种互动型真人视频考试现场的技术解决了考生体验真实考试流程、考前模拟训练以及真题练习和记录等备考问题。

附图说明

通过参考附图阅读下文的详细描述，本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本发明的若干实施方式，其中：

图1示意性地示出了根据本发明实施方式的可以在其中实现的应用场景示意图；

图2示意性地示出了根据本发明一实施例的一种用于模拟口语考试现场的方法流程图；

图3示意性地示出了根据本发明另一实施例的一种用于模拟口语考试现场的方法流程图；

图4示意性地示出了根据本发明又一实施例的一种用于模拟口语考试现场的流程图；

图5示意性地示出了根据本发明一实施例的一种用于模拟口语考试现场的装置的结构示意图；

图6示意性地示出了根据本发明一实施例的电子设备的结构示意图；

图7示意性地示出了根据本发明一实施例的介质的示意图；

图8为现有技术中一种模拟口语考试的界面示意图；

图9为现有技术中另一种模拟口语考试的界面示意图；

图10为现有技术中又一种模拟口语考试的界面示意图。

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明，而并非以任何方式限制本发明的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术人员知道，本发明的实施方式可以实现为一种设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件或者完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

根据本发明的实施方式，提出了一种用于模拟口语考试现场的方法、装置、设备以及介质。

在本文中，需要理解的是，本发明附图中的任何元素数量均用于示例而非限制，以及任何命名都仅用于区分，而不具有任何限制含义。下面参考本发明的若干代表性的实施方式，详细阐释本发明的原理和精神。

发明概述

本发明人发现，现有技术中的线上软件模考模拟性差，线上软件提供的模拟考试环境均为静止图片或者卡通形象模拟甚至仅提供问题语音和文字供用户回答。大部分的模拟仅呈现考试问题本身，对真实考试中存在的考生身份核实、题目说明、回答内容和时间长短等方面的提示并未做出模拟，考生带入感差。此外，现有线上模考软件专业性差，由于线上模考的使用量和体量较大，大部分的问题和语音提示为自动合成的机械录音，与真人考官的地道口语发音相比用户体验极差。

因此针对现有技术中存在的的技术问题，本发明提供了用于模拟口语考试现场的方法、介质、装置以及电子设备，通过步骤一，根据考生选择信息和/或考生个人信息，获取相应的真人模考音视频文件；步骤二，根据所述真人模考音视频文件和随机抽取的题库中的题目播放对应的音视频；以及步骤三，当播放完当前题目的音视频时，采集所述当前题目的考生作答信息并同时播放所述真人模考音视频文件中考官听取考生作答时的对应视频，这样，本发明实施方式可以以这种互动型真人视频考试现场的方式，解决考生体验真实考试流程、考前模拟训练以及真题练习和记录等备考问题。

在介绍了本发明的基本原理之后，下面具体介绍本发明的各种非限制性实施方式。

应用场景总览

首先参考图1，示意性地示出了根据本发明实施方式的可以在其中实现的应用场景。

本发明实施例中的应用该用于模拟口语考试现场的方法的场景，其可以包括通信(无线和/或有线)连接的客户端(例如图1所示中的终端设备1、终端设备2、……终端设备n)以及服务器。

图1中，终端设备1、终端设备2、……终端设备n中均安装有能够访问在线模拟口语考试提供商(例如，流利说)所提供的页面的应用程序，例如，在终端设备1表现为台式计算机或者笔记型计算机的情况下，终端设备1中安装有能够访问在线模拟口语考试提供商所提供的页面的应用客户端或者浏览器等应用程序，再例如，在终端设备2表现为智能移动电话或者平板电脑的情况下，终端设备2中安装有能够访问在线模拟口语考试提供商所提供的页面的APP(Application，应用程序)或者浏览器等应用程序；不同用户均可以利用其终端设备中安装的相应应用程序访问相应服务器中在线模拟口语考试提供商所提供的页面，从而用户可以查看该在线模拟口语考试提供商所提供的模拟口语考试的流程、考官以及模考报告等信息；进一步的，不同用户可以根据其实际需求以及其了解到的不同发音风格考官的信息，基于该在线模拟口语考试提供商所提供的相应页面执行相应的模拟口语考试现场流程操作，以购买该在线模拟口语考试提供商所提供的相应模拟口语考试服务。然而，本领域技术人员完全可以理解，本发明实施方式的适用场景不受到该框架任何方面的限制。

其中，电脑、平板电脑、高端智能手机等均可以作为本发明的客户端，客户端必须具备独立的音频视频播放功能和独立的音频输入设备。所述客户端主要负责用户与系统的交互，实现语音信息的采集(例如可以通过网页调用录音插件进行录音，并生成wav格式的音频文件)、播放分别存放于客户端本地和服务器的测试语音和标准语音、传输wav格式的音频文件到服务器和语料文本、评分结果、综合评价报告例如发音反馈指导意见等的显示功能。客户端可以用于考生进行口语水平评测，包括试题发布、评测、收卷等，并处理和传输考生作答音频至服务器，对于考生作答音频，还可以对考生作答音频的格式转换与特征提取。评测结束后，考生的评测成绩即评分结果(或者还可以包括综合评价报告)也可以发布在客户端上。客户端上传的考生作答结果可以包括朗读题(客观性试题)的口语测评结果以及自发性口语表述题(主观性试题)的口语测评结果中的一种或者两种。

其中，服务器主要负责评测结果的整理、收集以及试卷的分发、机器自动评分，通过通讯模块将评测信息输出给客户端，其在特定时间提供试卷给客户端并控制评测时间，从客户端收集考生作答音频，对考生答卷进行识别、解码、评分，评分完成后将评测结果通过通讯模块及时反馈回客户端。服务器具有语料收集、语音信号预处理、语音识别和发音质量评分等功能。根据考生规模和计算任务量，服务器可以选择多台高性能计算机组建计算机集群的形式，以便加快评分与解码的速度。评测结束后对考生作答信息以及其得分情况做集中的分析与处理，将考生总分、单项得分与排名等信息统计出来，还可以让老师和学生们随时查询考生总分、单项得分与排名等信息。

系统可以包含三种不同权限的角色：考生、教师和管理员，考生主要负责评测与作答；教师主要负责制卷、发布评测、管理评测以及检查评测结果；管理员主要负责评测的管理、试卷分发的时间掌控以及整体评测系统的维护。

示例性方法

下面结合图1所示的应用场景，参考图2来描述根据本发明示例性实施方式的用于模拟口语考试现场的方法。需要注意的是，上述应用场景仅是为了便于理解本发明的精神和原理而示出，本发明的实施方式在此方面不受任何限制。相反，本发明的实施方式可以应用于适用的任何场景。

参见图2，示意性地示出了根据本发明一实施例的用于模拟口语考试现场的方法的流程图，该方法通常在可以运行计算机程序的设备中执行，例如，在台式计算机或者服务器等设备中执行，当然，也可以在笔记型计算机甚至平板电脑等设备中执行。

本发明实施方式的方法可以包括：步骤S200、步骤S210以及步骤S220；可选的，本发明实施方式的方法还可以包括：步骤S300、步骤S310以及步骤S320。

在步骤S200中，根据考生选择信息和/或考生个人信息，获取相应的真人模考音视频文件。

作为示例，本发明实施方式中的所述方法还可以包括：采集考官模考视频，其中所述考官模考视频可以包括流程视频和题目视频；以及根据所述考官模考视频和题库中的题目音频生成所述真人模考音视频文件。

在本发明的再一个实施例中，所述根据所述考官模考视频和题库中的题目音频生成所述真人模考音视频文件可以进一步包括：根据所述口语考试的发生顺序将所述流程视频进行拼接；将所述流程视频中的考官反馈部分和所述题目视频中的题目说明、问题陈述进行动画化处理；根据触发条件编写各视频文件和动画的触发逻辑；利用音视频合成技术将各视频文件和动画进行合成；以及将所述题目视频所转化生成的动画与所述题库中的对应题目音频作定时统一。

在步骤S210中，根据所述真人模考音视频文件和随机抽取的题库中的题目播放对应的音视频。

在步骤S220中，当播放完当前题目的音视频时，采集所述当前题目的考生作答信息并同时播放所述真人模考音视频文件中考官听取考生作答时的对应视频。

需要说明的是，本发明实施方式的口语考试可以是任意一种语言，例如英语、中文、法语、德语、俄语等的口语考试，该口语考试可以是通过在线网站或者应用程序进行口语水平模拟测试，也可以是正式的口语水平考试。下面的实施例中均以英语口语水平评测例如雅思考试为例进行举例说明，但本公开并不限定于此。相应的，针对不同语言以及不同口语考试类型，可以具有不同的考试题库，例如，雅思考试具有雅思的考试题库，当考生或者用户登录系统时，随机的从该考试题库中选择待测题目。

作为示例，本发明实施方式的所方法还可以包括步骤S230，当接收到所述当前题目的考生回答结束信息时，对所述当前题目的考生作答信息的长度进行判断。

作为示例，本发明实施方式的所方法还可以包括步骤S240，当所述长度小于预设长度时，返回重新采集所述当前题目的考生作答信息。

作为示例，本发明实施方式的所方法还可以包括步骤S250，当所述长度大于等于所述预设长度时，对所述当前题目的考生作答信息进行语音识别获取所述当前题目的识别结果。

作为示例，本发明实施方式的所方法还可以包括步骤S260，当所述当前题目的识别结果为第一内容时，返回重新播放所述当前题目的音视频。

作为示例，本发明实施方式的所方法还可以包括步骤S270，当所述当前题目的识别结果为第二内容时，返回上述步骤S210播放下一题目的音视频直至本次口语考试的所抽取的全部题目的音视频播放完。

在一个优选的实施方式中，所述方法还可以包括步骤S280，当超过预设时长未接收到所述当前题目的考生回答结束信息时，返回上述步骤S210播放下一题目的音视频直至本次口语考试的所抽取的全部题目的音视频播放完。

在一个优选的实施方式中，所述方法还可以包括：判断是否接收到显示字幕选择信息；以及当接收到所述显示字幕选择信息时，抽取当前播放的音视频对应的字幕进行显示。

在一个优选的实施方式中，所述方法还可以包括：当所述当前题目答题阶段结束和/或本次口语考试结束后，调取所述真人模考音视频文件相应的流程视频进行播放。

本发明实施方式提供的一种用于模拟口语考试现场的方法，可以通过这种互动型真人视频考试现场的技术，高效真实的模仿真人口语考试的现场，模拟真实口语考试现场，可以实现对大量题型的兼容，通过对应的音视频合成技术能够实现对口语考试过程的真实还原和流畅模拟，解决考生体验真实考试流程、考前模拟训练以及真题练习和记录等备考问题。本发明实施例所述方法可以应用在上海流利说信息技术有限公司出品的“雅思流利说”产品中，但本公开并不限定于此。本发明实施方式所述用于模拟口语考试现场的方法的一个具体例子如下述针对图3和图4的描述。

需要说明的是，图3和图4是以雅思模考(IELTS Speaking Practice Test) 进行举例说明的，但本领域技术人员可以理解，本发明的保护范围并不受其限制。

以所述方法应用于雅思流利说app的模考功能中为例进行示例性说明，接下来将依照产品中的用户使用流程展现所述方法的具体实现过程。

参考图3和4，在步骤S300中，模考开始前准备过程。

在步骤S301中，在用户登录后，服务端下载并配置用户个人资料，匹配用户个人设置。

本发明实施例中，所述方法还可以包括：下载用户已完成的模考报告。

在步骤S302中，在用户选择考官后，如果该考官为非默认且未下载至本地的考官，下载用户选择的考官所对应的Telis真人模考音视频文件。

本发明实施例中，所述Telis真人模考音视频文件可以根据用户的信息进行调取，也可以由用户登录APP后在考官数据库中进行自主选择，考官数据库中会给出各个考官的国籍、发音风格、个人特征等信息，以便于用户选择自己喜欢或者适合的考官。

在步骤S303中，在取得麦克风权限后，播放考试信息等相关流程对应视频。

具体的，可以通过以下流程得到的Telis真人模考音视频文件：

1、由专业考官和雅思研究人员进行多场地实地考察和整理研究，确定整个考试的流程，所使用的所有物品道具，所花时间和对考生不同反应的可能应对措施，并以此为基础制定雅思模考流程和各项细节。

具体的，可以由模考过程中所需的考官国籍和口音背景等安排专业的外籍考官进行培训以及录制。

2、录制内容对应两个部分：

A)第一部分为考试流程中固定的部分，包括开始考试阶段的考试信息，考生身份验证，考试内容提示；考试过程中各部分的题型说明，开始结束说明，考生回答时考官的回应集要点记录；考试结束的结束说明和感谢；过程中语音过长或者过短的提示等内容(该第一部分以下统称为流程视频)。

本发明实施例中，提示的方式可以包括用户语音时间过长/短警告(或者提示)。如果用户语音时间正常，就自动进行下一道题作答。

B)第二部分为答题过程中考官具体题目的说明和视频，该部分根据长度和内容分别录制多个视频，并整理储存(该第二部分以下统称为题目视频)。

3、通过Telis音视频合成技术将所录视频生成为所述Telis真人模考音视频文件：

A)按照视频顺序将流程视频按照真实考试的发生顺序进行整理拼接，将其中与题目说明，问题陈述和考官反馈的部分所对应的题目视频进行动画化处理，并将同样类别动画进行并列处理，并根据所对应触发条件编写触发逻辑。

本发明实施例中，可以按照以下触发条件来编写触发逻辑：套话开始—对应部分的音频调取—根据题目长短配置动画—根据回答长短，触发不同动画。

B)加入语音识别系统，以对考生所做出的回答进行语音识别，并将可触发不同反馈的语句文本编写对应触发逻辑。

C)利用Telis音视频合成技术将各部分视频文件和动画进行合成，去除各部分之间考官形象及背景差异造成的图像不连贯，考官动作跳跃等情况。

本发明实施例中所述音视频合成技术可以采用现有技术中的任意一种，可以参照现有技术中的内容，在此不再详述，通过音视频合成后使得画面更加自然流畅。具体采用何种音视频技术并不构成对本发明所述方法的限制。

D)对题目视频所转换生成的动画与题库所对应题目音频做定时统一，将各个题目音频做并列处理，并加入随机算法随机抽取题目及所对应音频、文案及动画。

在步骤S310中，模考做题中。该步骤S310可以进一步包括以下步骤。

在步骤S311中，从真题库中随机抽取题目，播放题目对应音频并选择播放对应动画；同时抽取题目对应字幕，在用户选择显示字幕时通过后台判断添加字幕。

在步骤S312中，播放题目录音和动画后进入用户答题步骤，播放考官听取考生回答时的对应动画。

在步骤S313中，用户点击回答结束后进行回答长度判定。

例如，假设设定3秒(该数值为一个可变参数，可以根据具体的应用场景进行灵活调整)以内回答被判定为回答过短，返回重新回答。如回答内容超过3秒则进行语音识别，判断考生回答内容：如果内容为考生未听清问题的相关回答，将重新返回到播放题目音频及动画阶段；如果内容不涉及未听清内容，则判断为本题回答结束。如果用户未回答时超过一定时间(每个问题对应时间不同)还未点击回答结束，则判断为回答过长并结束回答录音，进入本题回答结束阶段。

在步骤S320中，题目衔接阶段以及结束阶段。该步骤S320可以进一步包括以下步骤。

在步骤S321中，在某一题答题阶段结束后，引入通过Telis音视频处理技术加工的流程视频，并重复以上做题步骤；

在步骤S322中，在完成所有三个部分的题目后，引入并播放考试结束视频，由对应考官告知考试结束；

在步骤S323中，考官通知考试结束后退出整个模考页面同时弹出模考结束页。

在步骤S324中，模考过程结束。

具体的服务端和客户端之间的交互过程可以参考图4所示。

本发明实施方式公开的一种用于模拟口语考试现场的方法，可以对所应用产品(例如，雅思流利说)带来如下有益技术效果：

1、显著降低开发成本：

A、通过Telis音视频合成技术，本产品可以在有限的几段动画和视频的基础上完成大量题库的兼容而不需要重复录制外籍考官视频。

B、同时通过简单的更新部分视频和动画，达到增加新的外籍考官的效果(目前已有多位口音性格迥异的外籍考官可供选择)。

C、在更新题库和扩增题库时，仅需要更新新题对应的音频而不需要更换动画和视频本身，不需要重复开发，节约成本。

2、大幅提升用户体验，提升用户黏性：

作为雅思流利说主打功能之一的免费模考功能，本发明实施方式公开的一种用于模拟口语考试现场的方法可以提供给用户专业、真实、完整的互动性模考过程，对比别的模考产品，用户在体验后会产生强烈的认同感，很难再回到比较粗略的模考产品中。

3、形成产品核心竞争力：

本发明实施方式公开的一种用于模拟口语考试现场的方法注重互动性、真实性和专业性的模考理念及研究团队开发的各种技术革新，带给用户全新的模考体验，显著区别于市面上的同类产品；同时产品的模考功能为无限次免费使用，可以给大量用户带来良好的模考体验。

示例性装置

在介绍了本发明示例性实施方式的方法之后，接下来，参考图5对本发明示例性实施方式的用于模拟口语考试现场的装置进行说明。

参见图5，示意性地示出了根据本发明一实施例的用于模拟口语考试现场的装置的结构示意图，该装置通常设置于可以运行计算机程序的设备中，例如，本发明实施例中的该装置可以设置于台式计算机或者服务器等设备中，当然，该装置也可以设置于笔记型计算机甚至平板电脑等设备中。

本发明实施方式的装置主要包括：音视频文件获取模块500、音视频播放模块510以及答题音频采集模块520。下面对该装置所包括的各个模块分别进行说明。

音视频文件获取模块500主要用于根据考生选择信息和/或考生个人信息，获取相应的真人模考音视频文件。

音视频播放模块510主要用于根据所述真人模考音视频文件和随机抽取的题库中的题目播放对应的音视频。

答题音频采集模块520主要用于当播放完当前题目的音视频时，采集所述当前题目的考生作答信息并同时播放所述真人模考音视频文件中考官听取考生作答时的对应视频。

作为示例，本发明实施方式中的所述装置还可以包括：作答长度判断模块以及语言识别模块。

其中，所述作答长度判断模块可以用于当接收到所述当前题目的考生回答结束信息时，对所述当前题目的考生作答信息的长度进行判断。当所述当前题目的考生作答信息的长度小于预设长度时，重新调用所述答题音频采集模块520返回重新采集所述当前题目的考生作答信息。

其中，所述语音识别模块可以用于当所述当前题目的考生作答信息的长度大于等于所述预设长度时，对所述当前题目的考生作答信息进行语音识别获取所述当前题目的识别结果。

其中，当所述当前题目的识别结果为第一内容时，调用所述音视频播放模块510返回重新播放所述当前题目的音视频。当所述当前题目的识别结果为第二内容时，调用所述音视频播放模块510播放下一题目的音视频直至本次口语考试的所抽取的全部题目的音视频播放完。

作为示例，本发明实施方式中的所述音视频播放模块510还可以用于：当超过预设时长未接收到所述当前题目的考生回答结束信息时，返回播放下一题目的音视频直至本次口语考试的所抽取的全部题目的音视频播放完。

作为示例，本发明实施方式中的所述装置还可以包括：考官模考视频采集模块以及真人模考音视频生成模块。

其中，所述考官模考视频采集模块可以用于采集考官模考视频。其中所述考官模考视频可以包括流程视频和题目视频。所述真人模考音视频生成模块可以用于根据所述考官模考视频和题库中的题目音频生成所述真人模考音视频文件。

作为示例，本发明实施方式中的所述真人模考音视频生成模块可以包括：拼接单元、动画处理单元、编写单元、合成单元以及定时统一单元。

其中，所述拼接单元可以用于根据所述口语考试的发生顺序将所述流程视频进行拼接。所述动画处理单元可以用于将所述流程视频中的考官反馈部分和所述题目视频中的题目说明、问题陈述进行动画化处理。所述编写单元可以用于根据触发条件编写各视频文件和动画的触发逻辑。所述合成单元可以用于利用音视频合成技术将各视频文件和动画进行合成。所述定时统一单元可以用于将所述题目视频所转化生成的动画与所述题库中的对应题目音频作定时统一。

作为示例，本发明实施方式中的所述装置还可以包括：字幕显示判断模块以及字幕显示模块。其中，所述字幕显示判断模块可以用于判断是否接收到显示字幕选择信息。所述字幕显示模块可以用于当接收到所述显示字幕选择信息时，抽取当前播放的音视频对应的字幕进行显示。

作为示例，本发明实施方式中的所述音视频播放模块510还可以用于当所述当前题目答题阶段结束和/或本次口语考试结束后，调取所述真人模考音视频文件相应的流程视频进行播放。

上述各模块和/或单元所执行的具体操作可以参见上述方法实施方式中的各步骤的描述，在此不再重复说明。

图6示出了适于用来实现本发明实施方式的示例性计算机系统/服务器 60的框图。图6显示的计算机系统/服务器60仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示，计算机系统/服务器60以通用电子设备的形式表现。计算机系统/服务器60的组件可以包括但不限于：一个或者多个处理器或者处理单元601，系统存储器602，连接不同系统组件(包括系统存储器602和处理单元601)的总线603。

计算机系统/服务器60典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器60访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器602可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)6021和/或高速缓存存储器6022。计算机系统/ 服务器60可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，ROM 6023可以用于读写不可移动的、非易失性磁介质(图6中未显示，通常称为“硬盘驱动器”)。尽管未在图6中示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM，DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线603相连。系统存储器602中可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块6024的程序/实用工具6025，可以存储在例如系统存储器602中，且这样的程序模块6024包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块6024通常执行本发明所描述的实施例中的功能和/或方法。

计算机系统/服务器60也可以与一个或多个外部设备604(如键盘、指向设备、显示器等)通信。这种通信可以通过输入/输出(I/O)接口605进行。并且，计算机系统/服务器60还可以通过网络适配器606与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或者公共网络，例如因特网) 通信。如图6所示，网络适配器606通过总线603与计算机系统/服务器60 的其它模块(如处理单元601等)通信。应当明白，尽管图6中未示出，可以结合计算机系统/服务器60使用其它硬件和/或软件模块。

处理单元601通过运行存储在系统存储器602中的计算机程序，从而执行各种功能应用以及数据处理，例如，执行用于实现上述方法实施例中的各步骤的指令；具体而言，处理单元601可以执行系统存储器602中存储的计算机程序，且该计算机程序被执行时，下述指令被运行：步骤一，根据考生选择信息和/或考生个人信息，获取相应的真人模考音视频文件；步骤二，根据所述真人模考音视频文件和随机抽取的题库中的题目播放对应的音视频；以及步骤三，当播放完当前题目的音视频时，采集所述当前题目的考生作答信息并同时播放所述真人模考音视频文件中考官听取考生作答时的对应视频。

上述各指令所执行的具体操作可以参见上述方法实施方式中的各步骤的描述，在此均不再重复说明。

本发明实施方式的介质一个具体例子如图7所示。

图7的介质为光盘700，其上存储有计算机程序(即程序产品)，该程序被处理器执行时，会实现上述方法实施方式中所记载的各步骤，例如，步骤一，根据考生选择信息和/或考生个人信息，获取相应的真人模考音视频文件；步骤二，根据所述真人模考音视频文件和随机抽取的题库中的题目播放对应的音视频；步骤三，当播放完当前题目的音视频时，采集所述当前题目的考生作答信息并同时播放所述真人模考音视频文件中考官听取考生作答时的对应视频；各步骤的具体实现方式在此不再重复说明。

应当注意，尽管在上文详细描述中提及了用于模拟口语考试现场的装置的若干模块或单元，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多模块或单元的特征和功能可以在一个模块或单元中具体化。反之，上文描述的一个模块或单元的特征和功能可以进一步划分为由多个模块或单元来具体化。

此外，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本发明的精神和原理，但是应该理解，本发明并不限于所公开的具体实施方式，对各方面的划分也不意味着这些方面中的特征不能组合以进行受益，这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims

1.一种用于模拟口语考试现场的方法，包括：

步骤一，根据考生选择信息和/或考生个人信息，获取相应的真人模考音视频文件；

步骤二，根据所述真人模考音视频文件和随机抽取的题库中的题目播放对应的音视频；以及

步骤三，当播放完当前题目的音视频时，采集所述当前题目的考生作答信息并同时播放所述真人模考音视频文件中考官听取考生作答时的对应视频。

2.如权利要求1所述的方法，其中，所述方法还包括：

步骤四，当接收到所述当前题目的考生回答结束信息时，对所述当前题目的考生作答信息的长度进行判断；

步骤五，当所述长度小于预设长度时，返回重新采集所述当前题目的考生作答信息；

步骤六，当所述长度大于等于所述预设长度时，对所述当前题目的考生作答信息进行语音识别获取所述当前题目的识别结果；

步骤七，当所述当前题目的识别结果为第一内容时，返回重新播放所述当前题目的音视频；以及

步骤八，当所述当前题目的识别结果为第二内容时，返回上述步骤二播放下一题目的音视频直至本次口语考试的所抽取的全部题目的音视频播放完。

3.如权利要求1所述的方法，其中，所述方法还包括：

步骤九，当超过预设时长未接收到所述当前题目的考生回答结束信息时，返回上述步骤二播放下一题目的音视频直至本次口语考试的所抽取的全部题目的音视频播放完。

4.如权利要求1所述的方法，其中，所述方法还包括：

采集考官模考视频，其中所述考官模考视频包括流程视频和题目视频；以及

根据所述考官模考视频和题库中的题目音频生成所述真人模考音视频文件。

5.如权利要求4所述的方法，其中，所述根据所述考官模考视频和题库中的题目音频生成所述真人模考音视频文件包括：

根据所述口语考试的发生顺序将所述流程视频进行拼接；

将所述流程视频中的考官反馈部分和所述题目视频中的题目说明、问题陈述进行动画化处理；

根据触发条件编写各视频文件和动画的触发逻辑；

利用音视频合成技术将各视频文件和动画进行合成；以及

将所述题目视频所转化生成的动画与所述题库中的对应题目音频作定时统一。

6.如权利要求1至5任一项所述的方法，其中，所述方法还包括：

判断是否接收到显示字幕选择信息；以及

当接收到所述显示字幕选择信息时，抽取当前播放的音视频对应的字幕进行显示。

7.如权利要求1至5任一项所述的方法，其中，所述方法还包括：

当所述当前题目答题阶段结束和/或本次口语考试结束后，调取所述真人模考音视频文件相应的流程视频进行播放。

8.一种介质，其上存储有程序，该程序被处理器执行时实现上述权利要求1-7中任一项所述的方法。

9.一种用于模拟口语考试现场的装置，包括：

音视频文件获取模块，用于根据考生选择信息和/或考生个人信息，获取相应的真人模考音视频文件；

音视频播放模块，用于根据所述真人模考音视频文件和随机抽取的题库中的题目播放对应的音视频；以及

答题音频采集模块，用于当播放完当前题目的音视频时，采集所述当前题目的考生作答信息并同时播放所述真人模考音视频文件中考官听取考生作答时的对应视频。

10.一种电子设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述存储器中存储的计算机程序，且所述计算机程序被执行时，下述指令被运行：

步骤二，根据所述真人模考音视频文件和随机抽取的题库中的题目播放对应的音视频；