CN111290568A

CN111290568A - 交互方法、装置及计算机设备

Info

Publication number: CN111290568A
Application number: CN201811488500.9A
Authority: CN
Inventors: 侯飞跃; 傅业焘; 马金; 冒晶; 刘扬; 杨名远; 刘柳
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2018-12-06
Filing date: 2018-12-06
Publication date: 2020-06-16

Abstract

本发明公开了一种交互方法、装置及计算机设备。其中，该方法包括：接收用于触发教学交互开始的触发信息；播放虚拟教师，其中，虚拟教师依据真人教师的特征模拟得到；在虚拟教师与学生的教学交互场景中，通过虚拟教师进行教学交互。本发明解决了相关技术中的教学场景中的教学方式，缺乏与真人进行的教学交互，教学效果较低，而且体验性较差的技术问题。

Description

交互方法、装置及计算机设备

技术领域

本发明涉及虚拟仿真领域，具体而言，涉及一种交互方法、装置及计算机设备。

背景技术

相关技术中，在教学场景中，通常由终端设备通过应用软件APP播放教学视频来展现教师授课过程。但是，一般情况，在上述教学场景下，教学视频无法进行学生与教师的教学交互。还有的教学场景在远程教学场景下，由终端设备实时播放教学视频，在实时远程教学的场景下，可以采用文字进行教学交互，但是，上述教学场景容易受网络状况影响，而且教学交互方式传统，效率低，效果差。因此，相关技术中的教学场景中的教学方式，往往缺乏与真人进行教学互动，甚至无法进行学生与教师的教学交互，不仅教学效果较低，而且体验性较差。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种交互方法、装置及计算机设备，以至少解决相关技术中的教学场景中的教学方式，缺乏与真人进行的教学交互，教学效果较低，而且体验性较差的技术问题。

根据本发明实施例的一个方面，提供了一种交互方法，包括：接收用于触发教学交互开始的触发信息；播放虚拟教师，其中，所述虚拟教师依据真人教师的特征模拟得到；在虚拟教师与学生的教学交互场景中，通过所述虚拟教师进行教学交互。

根据本发明实施例的另一方面，还提供了另一种交互方法，包括：显示用于展示虚拟教师的设备处于待唤醒状态，其中，所述虚拟教师为依据真人教师的特征模拟得到；在接收到触发教学交互开始的触发信息时，显示所述虚拟教师进入交互状态；在虚拟教师与学生的教学交互场景中，显示所述虚拟教师与学生进行教学交互的交互内容。

根据本发明实施例的另一方面，还提供了一种交互装置，包括：接收模块，用于接收用于触发教学交互开始的触发信息；播放模块，用于播放虚拟教师，其中，所述虚拟教师依据真人教师的特征模拟得到；交互模块，用于在虚拟教师与学生的教学交互场景中，通过所述虚拟教师进行教学交互。

根据本发明实施例的另一方面，还提供了一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的交互方法。

根据本发明实施例的另一方面，还提供了一种计算机设备，包括：存储器和处理器，所述存储器存储有计算机程序；所述处理器，用于执行所述存储器中存储的计算机程序，所述计算机程序运行时执行上述中任意一项所述的交互方法。

在本发明实施例中，采用显示虚拟教师，由真人教师的特征模拟所得的虚拟教师与学生在教学交互场景中进行教学交互，达到了让学生与教师进行有效的教学交互，从而具有较高的体验性的目的，从而实现了提高教学交互的教学效果，并有效改善体验性的技术效果，进而解决了相关技术中的教学场景中的教学方式，缺乏与真人进行的教学交互，教学效果较低，而且体验性较差的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1示出了一种用于实现交互方法的计算机终端(或移动设备)的硬件结构框图；

图2是根据本发明实施例1的一种交互方法的流程图；

图3是根据本发明实施例1的另一种交互方法的流程图；

图4是根据本发明实施例1的另一种交互方法的流程图；

图5是根据本发明实施例1实施方式的一种交互方法的流程图；

图6是根据本发明实施例2的一种交互方法的流程图；

图7是根据本发明实施例2的另一种交互方法的流程图；

图8是根据本发明实施例3的一种交互装置的示意图；

图9是根据本发明实施例4的一种计算机终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先，在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释：

语音识别ASR：automatic speech recognition，也称自动语音识别，其目标是将人类语言转换为计算机可读的输入，从而实现人机交互中，人对机器的信息输入。例如，人按按键，人通过二进制编码空机器进行操作，人通过计算机语言编码对机器进行控制等。

自然语音处理NLP：natural language processing，是计算机科学领域与人工智能领域中的一个重要方向，主要是研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。

语音合成TTS：text to speech，是通过机械、电子方法产生人造语音的技术，又称文语转换技术，是将计算机产生的、或者外部输入的文字信息转变为人能够听懂的、流利的语言输出的技术。

实施例1

根据本发明实施例，还提供了一种交互方法的方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现交互方法的计算机终端(或移动设备)的硬件结构框图。如图1所示，计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b，……，102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104。除此以外，还可以包括：传输模块、显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的，该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器104可用于存储应用软件的软件程序以及模块，如本发明实施例中的交互方法对应的程序指令/数据存储装置，处理器102通过运行存储在存储器104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的应用程序的交互方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

上述传输模块用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中，传输模块包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输模块可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD)，该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。

图1示出的硬件结构框图，不仅可以作为上述计算机终端10(或移动设备)的示例性框图，还可以作为上述服务器的示例性框图，一种可选实施例中，上述图1所示的计算机终端10(或移动设备)作为(例如发送端、接收端等)一种实施例。计算机终端10(或移动设备)可以经由数据网络连接或电子连接到一个或多个服务器(例如安全服务器、资源服务器、游戏服务器等)。一种可选实施例中，上述计算机终端10(或移动设备)可以是(任意移动计算设备等)。数据网络连接可以是局域网连接、广域网连接、因特网连接，或其他类型的数据网络连接。计算机终端10(或移动设备)可以执行以连接到由一个服务器(例如安全服务器)或一组服务器执行的网络服务。网络服务器是基于网络的用户服务，诸如社交网络、云资源、电子邮件、在线支付或其他在线应用。

相关技术中，在教学交互场景下，通常都是由教师制作或选择教学视频进行播放，通常在播放教学视频的过程中只是单方面的交互，学生在播放视频中，无法与播放的视频进行交互。在一些远程教学场景中，通常与教师播放教学视频的方式类似，可以是将教师的教学过程录成视频，将该视频上传至网络，由学生主动通过网页或者应用软件APP等网络途径可以观看该视频，例如，网络线上课程。但是，上述方式中，该视频无法进行教学互动，学生体验感不强，导致教学效率不高。还有的远程教学场景中，可以实现实时的教师教学过程，在教师教学交互过程中，通过摄像装置连接互联网，实时向互联网传输视频数据，学生可以通过网页或应用软件APP实时观看教学视频，而且还可以通过打字，语音等方式与正在教学的教师进行简单的交互。但是上述方式，不仅受制于网络传输状况的影响较大，学生与教师的交互效率较低，而且教学交互的也不容易成功，例如，学生不能主动随时提问，教师的教学交互不能被随意打断。仅限于教师提问，教师允许学生提问等简单的交互方式。

交互仿真虚拟人通过整合面部重塑、语音识别(ASR)、语音合成(TTS)、机器问答等多领域的人工智能AI(Artificial Intelligence)技术，从视觉和听觉上，带来宛如和真人对话般的交互体验。通过面部重塑、机器阅读、远场语音识别技术，并率先整合了自然语言理解和图像渲染等多种技术。

在上述运行环境下，本申请提供了如图2所示的交互方法。图2是根据本发明实施例1的一种交互方法的流程图，如图2所示，该方法包括以下步骤：

步骤S202，接收用于触发教学交互开始的触发信息。

作为一种可选的实施例，上述步骤的执行主体可以是一种智能设备，该智能设备可以称之为虚拟教师，该虚拟教师可以用于教室教学，演讲，学术会议等多种教学交互场景，该虚拟教师用于与教学交互的对象进行教学交互。上述教学交互的对象可以为学生。

作为一种可选的实施例，上述触发信息可以主动触发信息，或者被动触发信息。上述主动触发信息可以是由该虚拟教师检测，在检测到满足教学交互开启的条件时，自动触发开始教学交互。例如，在教室教学的场景下，可以以上课铃声作为教学交互开始的触发信息，在上述虚拟教师检测到上述上课铃声的情况下，开始教学交互。

作为一种可选的实施例，上述被动触发信息可以是由教学交互的对象发起指令，控制虚拟教师开始教学交互。上述发起指令可以是发出控制语音，做出控制动作，或者通过控制装置发出控制指令等。例如，在教室教学的场景下，学生可以根据需求，选择是否开启虚拟教师，开始教学交互，可以是通过语音，“开始教学”作为控制指令，虚拟教师接受该控制语音后，根据该控制语音，控制开启教学交互。

作为一种可选的实施例，在上述触发信息为主动触发信息的情况下，上述用于触发教学交互开始的触发信息可以是由检测装置发送的，该检测装置可以属于该虚拟教师，检测装置用于检测触发信息是否满足开启教学交互的触发条件。在上述触发信息为被动触发的情况下，上述触发信息可以是由用于控制虚拟教师工作的控制装置，或者用于接收学生发送的信息的接收装置。在学生发出控制语音，或者做出控制动作的情况下，由上述接收装置接收，并转化为触发信息，触发虚拟教师开始教学交互。

步骤S204，播放虚拟教师，其中，虚拟教师依据真人教师的特征模拟得到。

作为一种可选的实施例，在上述触发信息触发虚拟教师开始教学交互后，虚拟教师进入交互状态，播放虚拟教师，使学生在视觉上感受到与真人教师类似的或者相同的体验。上述虚拟教师可以是依据真人教师进行模拟所得，还可以是根据预设的参数进行模拟所生成的二维图像或者三维图像，例如，卡通动漫形象，明星，动植物，自主编辑的形象等，从而有效满足多样化的需求。

作为一种可选的实施例，上述虚拟教师在具有视觉体验的基础上，还可以提供语音对话的听觉体验。也即是上述虚拟教师可以与学生进行语音交互。该语音交互方法可以是多种，例如，简单应答的语音交互，通过固定的对话模式进行简单应答。或者基于机器学习或者深度学习的语音交互，通过神经网络，进行智能应答和对话。

作为一种可选的实施例，在上述虚拟教师为真人教师形象的情况下，该虚拟教师是依据真人教师的特征模拟所得到。该特征可以是体型特征，外貌特征，脸型特征，五官特征等图像特征，在听觉交互场景下，上述特征还可以是声音特征，音色特征，语气特征，口音特征等声音特征。从而使该虚拟教师与真人教师对学生带来的感官体验更相接近。

步骤S206，在虚拟教师与学生的教学交互场景中，通过虚拟教师进行教学交互。

作为一种可选的实施例，上述教学交互场景可以是现实中的学生与教师的交互场景。该教学交互场景，可以具有一定的界限，在超出该交互界限的情况下，可以触发相应的操作。例如，教学交互场景可以限于上课，问答，或者其他的预设功能与操作等。但是一些超出交互界限的交流可以禁止进行，例如，谈论与教学内容无关的问题，进行与本学科内容无关的交流等。该交互界限可以根据具有修改权限的人进行修改。

作为一种可选的实施例，上述在教学交互场景下，通过虚拟教师与学生进行交互至少包括，视觉交互和听觉交互。视觉交互，是指在视觉上的交互，例如，该虚拟教师形象的面部表情的变化，身体姿态的变化，身体动作的变化等。听觉交互，是指在听觉上的交互，例如，该虚拟教师声音的声调的变化，语气的变化，语速的变化等。

需要说明的是，上述视觉交互和听觉交互可以是互相结合的，例如，在说话时，上述虚拟教师的嘴巴的口型与所说的文字、口音相对应，该虚拟教师的面部表情与说话时的不同的语气相对应。在虚拟教师与学生进行交互的方式还包括其他的交互方式时，可以是上述视觉交互、听觉交互以及其他交互方式结合进行交互，以使虚拟教师具有更高的仿真程度，从而提高目标对象的使用体验。

在本发明实施例中，通过上述步骤，采用显示虚拟教师，由真人教师的特征模拟所得的虚拟教师，与学生在教学交互场景中进行教学交互，达到了让学生与教师进行有效的教学交互，从而具有较高的体验性的目的，从而实现了提高教学交互的教学效果，并有效改善体验性的技术效果，进而解决了相关技术中的教学场景中的教学方式，缺乏与真人进行的教学交互，教学效果较低，而且体验性较差的技术问题。

作为一种可选的实施例，接收用于触发教学交互开始的触发信息包括：通过接收按键指令的方式，接收用于触发教学交互开始的触发信息；通过远程发送的触发消息的方式，接收用于触发教学交互开始的触发信息。

上述接收用于触发教学交互开始的触发信息可以是多种方式，从触发信息的角度而言，可以是通过主动触发信息触发，还可以是通过被动触发信息触发。从触发信息的发送端而言，可以是接收由近发送端发送的触发信息，例如，通过接收遥控器的控制信号，接收触发信息；通过接收按键指令，接收触发信息等，其中，上述按键指令可以设置在上述虚拟教师的实体设备上。还可以是接收由远发送端发送的触发信息，例如，通过远程发送的触发消息；通过无线网络发送的触发消息；通过互联网发送的触发消息等。上述接收用于触发教学交互开始的触发信息，从触发信息的传输方式而言，还可以是通过有线传输的触发信息，例如，电缆传输，光缆传输等；通过无线传输的触发信息，例如，无线电传输，声波传输等。

上述通过接收按键指令的方式，接收用于触发教学交互开始的触发信息，可以通过学生直接对上述虚拟教师的按键进行操作，达到控制虚拟教师开启教学交互的目的，操作方便简单，虚拟教师可以直接进行响应，响应时间较短。上述通过远程发送的触发消息的方式，接收用于触发教学交互开始的触发信息，可以由学生通过无线网络发送触发消息，由虚拟教师的接收装置接收到该触发消息后，对该触发消息进行响应，从而达到控制虚拟教师开启教学交互的目的，该操作方式不受限于空间，可以在任何具有信息网络连接的地方向虚拟教师发送触发信息。需要说明的是，虚拟教师还可以对该触发消息进行验证。

作为一种可选的实施例，播放虚拟教师包括：通过播放视频的方式，展示虚拟教师的声音，面部表情。

需要说明的是，本实施例中的视频，可以是二维视频，还可以是三维视频，还可以是二维视频和三维视频结合。

作为一种可选的实施例，该视频可以为预设视频，在教学交互场景下，有的交互场景可以是固定的交互模式，例如，在学生向虚拟教师提问的情况下，虚拟教师形象可以接收该问题，需要说明的是，虚拟教师在教学交互场景中，对于听觉交互可以保持倾听状态，以接收学生随时的提问。在接收该问题后，通过识别上述问题，进入知识库，匹配与该问题最合适的答案或者知识点，将答案或者知识点的图像或者视频展示出来，在答案或者知识点包括文本信息或者语音信息的情况下，由虚拟教师形象将该文本信息或者语音信息读出。在上述教学交互场景的情况下，可以依据真人教师可能会作出的反应，提取该反应的特征，依据特征模拟出虚拟教师的反应，从而在智能设备上通过视频播放的方式进行展示，从而实现教师与学生之间的交互。例如，在查阅到答案的情况下，虚拟教师形象可以是欣喜、愉悦的表情，在没有查阅到答案仅查阅到相关知识点的情况下，可虚拟教师形象可以是失望，沮丧的表情。

作为一种可选的实施例，上述视频包括展现虚拟教师的声音和面部表情。在虚拟教师的形象为真人教师的全身形象的情况下，还可以展现虚拟教师的姿态，动作等，例如，抬手，顿首，转身等。

作为一种可选的实施例，通过播放视频的方式，展示虚拟教师的声音包括：获取虚拟教师要说的文本；提取真人教师的语音特征；根据语音特征，将文本合成为合成语音，将合成语音作为虚拟教师的声音进行播放。

作为一种可选的实施例，上述展示虚拟教师的声音可以是多种方式，例如，在固定的教学交互场景的情况下，可以提前录音，录取该教学交互场景下的固定语音，在该固定教学交互场景下，直接播放该固定语音。还可以是根据虚拟教师生成的答案或知识点的文本信息，将该文本信息转化为语音信息。还可以是虚拟教师针对教学交互场景或者学生的问题，根据深度学习或者机器学习确定交互场景中的语音文本，将该语音文本转化为语音。

作为一种可选的实施例，上述通过文本转化为语音的过程中，可以是先提取真人教师的语音特征，例如，音色，音调范围，语速，频率等。然后根据语音特征将文本合成为合成语音，对该合成语音进行播放。上述通过文本转化为语音的方式还可以采用语音合成TTS技术来实现。

图3是根据本发明实施例1的另一种交互方法的流程图，如图3所示，通过播放视频的方式，展示虚拟教师的面部表情包括：

步骤S302，获取虚拟教师对应的底板视频，其中，底板视频中包括真人教师的面部表情；

步骤S304，从底板视频中抽取真人教师的面部表情的表情特征；

步骤S306，根据表情特征重塑虚拟教师的面部表情，通过播放视频的方式，展示虚拟教师重塑后的面部表情。

作为一种可选的实施例，上述展示虚拟教师的面部表情可以是多种方式，例如，在固定教学交互场景的情况下，可以提前录取教师的表情视频，录取该教学交互场景下的固定表情视频，在该固定教学交互场景下，播放该表情视频。还可以是根据虚拟教师的表情特征重塑虚拟教师的面部表情视频。

作为一种可选的实施例，上述根据虚拟教师的表情特征重塑虚拟教师的面部表情视频的过程中，可以是先获取虚拟教师对应的底板视频，其中，底板视频中包括真人教师的面部表情。然后，从底板视频中抽取真人教师的面部表情的表情特征。根据视觉交互场景的需求，以及该表情特征，重塑虚拟教师的面部表情视频。上述表情特征可以包括该表情下真人教师的面部特征。

作为一种可选的实施例，上述采用对面部表情进行重塑的方式，由于是根据底板视频中的真人教师的面部表情的表情特征进行重塑的，因此，重塑后的虚拟教师的面部表情视频可以具有真人教师的体验，另外，由于对面部表情进行重塑时，考虑了与学生的教学交互场景的教学交互过程中的交互细节，因此，相对于相关技术中简单的教学交互而言，能够有效体现与真人教师进行现场教学交互的体验。

需要说明的是，上述获得虚拟教师的语音合成以及对虚拟教师的面部表情进行重塑时，均可以通过对真人教师的多个语音，或者多个面部表情进行机器学习，从而模拟出与交互场景对应的语音和面部表情。例如，对于获得虚拟教师的合成语音时，可以先对多个优秀真人教师的在各种教学交互场景下的语音进行训练，从而得到一个语音模型，当虚拟教师与学生处于一个具体的教学场景下时，依据学生给出的交互语音，可以直接输出该场景下与学生给出的交互语音对应的虚拟教师的反应语音。类似的，对于获得虚拟教师的面部表情时，也可以采用先对多个优秀真人教师在各种教学交互场景下的面部表情进行训练，从而得到一个面部表情模型，当虚拟教师与学生处于一个具体的教学场景下时，依据学生给出的交互内容，可以直接输出该场景下与学生给出的交互内容对应的虚拟教师的面部表情。

图4是根据本发明实施例1的另一种交互方法的流程图，如图4所示，在虚拟教师与学生的教学交互场景中，通过虚拟教师进行教学交互包括：

步骤S402，确定与教学交互场景对应的交互模型，其中，交互模型通过多组数据训练得到，每组数据中均包括：学生向教师提出的问题，以及与该问题对应的答案；

步骤S404，接收到学生向虚拟教师提出的问题；

步骤S406，将接收的问题作为交互模型的输入，得到对应的输出答案；

步骤S408，通过虚拟教师展示得到的输出答案。

作为一种可选的实施例，上述通过虚拟教师与学生进行交互可以是通过机器学习或者深度学习模型进行交互。先确定与教学交互场景对应的交互模型，例如，物理教学交互场景下，可以采用物理教学交互模型。上述物理教学交互模型通过多组数据训练得到，每组数据中均包括：物理教学交互输入，以及与该物理教学交互输入对应的物理教学交互输出。

作为一种可选的实施例，上述教学交互输入可以是学生的语音，学生的动作，由学生发送的控制指令等；教学交互输出可以是虚拟教师的动作，虚拟教师的语音等，还可以是用于向学生进行图像展示的演示装置上的图像或视频，上述演示装置可以是显示器，黑板，或者投影光幕等。

需要说明的是，上述多组训练数据可以是依据一定的采集源获取的采集样本，例如，可以是从大量真实的监控视频中的教学交互场景中提取出来的交互片段，也可以是从多种真实的教学交互场景中模拟出来的。采集源越丰富，训练得到的交互模型则会更准确，后续得到的教学交互输出也会更真实。采用上述智能的交互模型的方式来确定交互输出，相对于节省了真人教师的成本，而且能够满足虚拟教师的智能需求。

作为一种可选的实施例，对学生的动作，和语音进行检测，或者接收学生发送的控制指令，从而获取教学交互输入，上述检测学生的动作、姿态和表情等，可以通过图像采集装置进行采集；上述检测学生的声音，例如接收到学生向虚拟教师提出的问题，可以通过声音采集装置进行采集。接收学生发送的控制指令，可以通过接收装置进行接收。

作为一种可选的实施例，将接收到学生向虚拟教师提出的问题作为交互模型的教学交互输入，由该交互模型输出与该教学交互输入对应的教学交互输出。上述学生向虚拟教师提出的问题，可以是通过学生的动作，和/或学生的声音体现，或者学生发送的控制指令体现。通过虚拟教师展示该教学交互输出，形成虚拟教师与学生之间的一轮交互。

需要说明的是，本实施例还提供了一种交互方法，作为本实施例的可选的实施方式，下面对该实施方式进行详细说明。

图5是根据本发明实施例1实施方式的一种交互方法的流程图，如图5所示，虚拟老师按照预定的知识提交讲授知识点。在学生提问时，按照以下流程：

1)学生通过按钮或者其他方式触发虚拟老师倾听，或者虚拟老师在教授的过程中一直处于倾听状态，可随时倾听学生说话。

2)然后根据学生说的话识别出学生的问题，进入知识库，匹配最合适的答案/知识点。

3)然后将文本答案或者图片或者视频展示出来，并根据实际课程需要，虚拟老师讲出这些答案/知识点。

4)以此方式与虚拟教师进行问答式学习。

在本实施方式中，可以说任何话语，包括各类可以讲述的知识点；教师形象包括仿真虚拟人，数字人、卡通、二次元、素描或简笔画人物(例如诗人李白)，表情包等的2D或3D虚拟形象)等；可以进行交互的学习方式；可呈现于移动端APP或者PC web端以及各类智能硬件中。

本实施方式主要技术效果包括：基于虚拟形象的交互方式，逼真，带给学生真实般的教学交互体验；具有强大的知识库和自然语言处理能力，足够智能化，是虚拟驾驶形象不呆板，更加真实化和人性化；具有实时交互能力，可类似于远程教育的教学，但比远程教学的交互能力大大提升，既能实现随时随地学习，又能实现双向互动的学习。

实施例2

根据本发明实施例，还提供了另一种交互方法的实施例，图6是根据本发明实施例2的一种交互方法的流程图，如图6所示，该方法包括以下步骤：

步骤S602，显示用于展示虚拟教师的设备处于待唤醒状态，其中，虚拟教师为依据真人教师的特征模拟得到。

作为一种可选的实施例，上述步骤的执行主体可以是虚拟教师的智能设备，该智能设备可以配置有显示装置，该显示装置可以是显示屏，触摸屏，或者投影屏等。上述投影屏可以是二维投影屏，还可以是三维投影设备等。

作为一种可选的实施例，上述待唤醒状态，类似于电器的待机状态，以低功率运行，仅保持用于触发虚拟教师开始教学交互的接收装置或检测装置，以及核心装置的运行。当虚拟教师接收触发信息，触发该虚拟教师开启教学交互，进入交互状态，与学生进行交互。

作为一种可选的实施例，上述虚拟教师的工作状态包括上述待唤醒状态，和交互状态，还可以包括在紧急情况下触发的紧急状态，在某些情况下触发的用于自我保护的锁定状态，等等。

作为一种可选的实施例，上述虚拟教师的状态可以进行显示，或者通过不同的指示装置进行指示，例如，不同位置的指示灯，或者不同颜色的指示灯等。

作为一种可选的实施例，在上述虚拟教师为真人教师的形象的情况下，该虚拟教师是依据真人教师的特征模拟所得到。该特征可以是体型特征，外貌特征，脸型特征，五官特征等图像特征，还可以是声音特征，音色特征，语气特征，口音特征等声音特征。从而使该虚拟教师与真人教师对用户带来的感官体验更相接近。

步骤S604，在接收到触发教学交互开始的触发信息时，显示虚拟教师进入交互状态。

作为一种可选的实施例，上述接收到触发教学交互开始的触发信息，可以是上述虚拟教师的触发条件，上述触发条件还可以是其他的方式。上触发条件是上述虚拟教师从待唤醒状态进入交互状态的跳转条件。

作为一种可选的实施例，在接收到触发教学交互开始的触发信息之后，该虚拟教师进入教学交互状态，播放虚拟教师，使学生在视觉上感受到与真人教师类似或者相同的体验。上述虚拟教师可以是依据真人教师进行模拟所得，还可以是根据预设的参数进行模拟所生成的二维图像或者三维图像，例如，卡通动漫形象，明星，动植物，自主编辑的形象等，从而有效满足多样化的需求。

作为一种可选的实施例，上述虚拟教师在具有视觉体验的基础上，还提供语音对话的听觉体验。也即是上述虚拟教师可以与该学生进行语音交互。该语音交互方法可以是多种，例如，简单应答的语音交互，通过固定的对话模式进行简单应答。再例如，基于机器学习或者深度学习的语音交互，通过神经网络，进行智能应答和对话。

作为一种可选的实施例，如图5所示，上述交互状态根据虚拟教师的动作可以分为，与学生进行对话的对话态，保持沉默的静置态，还可以包括接收学生的语音的倾听态，接收学生的图像的观察态，对学生进行回答的回答态等。

步骤S606，在虚拟教师与学生的教学交互场景中，显示虚拟教师与学生进行教学交互的交互内容。

作为一种可选的实施例，上述在教学交互场景下，通过虚拟教师与学生进行交互至少包括，视觉交互和听觉交互。视觉交互，是指在视觉上的交互，例如，该虚拟形象的面部表情的变化，身体姿态的变化，身体动作的变化等。听觉交互，是指在听觉上的交互，例如，声调的变化，语气的变化，语速的变化等。

需要说明的是，上述视觉交互和听觉交互可以是互相结合，例如，在说话时，上述虚拟教师的嘴巴的口型与所说的文字、口音相对应，该虚拟教师的面部表情与说话时的不同的语气相对应。在虚拟教师与学生进行交互的方式还包括其他的交互方式时，可以是上述视觉交互、听觉交互以及其他交互方式结合进行交互。

作为一种可选的实施例，上述教学交互场景可以针对教学内容，包括，数学教学交互场景、物理教学交互场景、英语教学交互场景等各个学科对应的教学交互场景。在虚拟教师与学生的教学交互场景中，显示虚拟教师与学生进行教学交互的交互内容。例如，英语交互场景中，虚拟教师可以根据教学进程，或者学生问题，对与该教学进程对应的图像、视频进行显示，对学生问题对应的答案或相关知识点的图片、视频进行显示。上述教学交互场景还可以包括对相关语音和文本进行发音。

在本发明实施例中，采用显示虚拟教师的待唤醒状态和交互状态，通过显示由真人教师的特征模拟所得的虚拟教师，与学生在教学交互场景中进行教学交互，达到了让学生与教师进行有效的教学交互，从而具有较高的体验性的目的，从而实现了提高教学交互的教学效果，并有效改善体验性的技术效果，进而解决了相关技术中的教学场景中的教学方式，缺乏与真人进行的教学交互，教学效果较低，而且体验性较差的技术问题。

图7是根据本发明实施例2的另一种交互方法的流程图，如图7所示，在虚拟教师与学生的教学交互场景中，显示虚拟教师与学生进行教学交互的交互内容包括：

步骤S702，在教学交互开始后，但还未检测到学生输入的问题时，控制虚拟教师处于静置状态；

步骤S704，检测到学生输入的问题，控制虚拟教师处于倾听状态；

步骤S706，在确定学生输入问题结束时，在将问题输入数据库后，控制虚拟教师进入回答状态，并接收数据库返回的问题答案；

步骤S708，通过虚拟教师展示问题答案。

作为一种可选的实施例，在上述交互状态为对话态的情况下，对话态可以包括用于倾听学生的倾听态和回答学生的回答态，以及等待学生说话的静置态。

作为一种可选的实施例，在对话态下，虚拟教师与学生的对话过程可以在教学交互开始之后，虚拟教师处于静置态，等待学生发问，从而触发虚拟教师的倾听态；虚拟教师在静置态下，检测到学生发声，则触发倾听态，接收学生的声音信息；在上述学生完成发声后，将接收的声音信息进行存储和处理，识别学生的问题，寻找该问题的答案或相关知识点，并触发回答态，在回答态中回答该接收的声音信息对应的问题的答案或者相关知识点；上述答案或者相关知识点可以通过视频播放的形式进行展示，可以通过语音进行展示，还可以通过其他方式进行展示。

需要说明的是，本实施例中的视频，可以是二维视频，还可以是三维视频。

作为一种可选的实施例，通过播放对应视频的方式，分别控制虚拟教师进入静置态，控制虚拟教师进入倾听态，控制虚拟教师进入回答态。

作为一种可选的实施例，上述虚拟教师在进入静置态、倾听态和回答态可以具有相应的动作和表情，也即是虚拟教师可以通过播放对应视频的方式进入上述静置态、倾听态和回答态，从而使该虚拟教师具有更高的仿真效果，以提高学生的体验。

作为一种可选的实施例，上述进入静置态，可以是微笑着期待的表情；进入倾听态，可以是认真倾听的表情；进入回答态，可以是微笑着回答的表情。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

实施例3

根据本发明实施例，还提供了一种用于实施上述实施例1的交互方法的交互装置，图8是根据本发明实施例3的一种教师交互装置的示意图，如图8所示，该装置包括：接收模块82，播放模块84和交互模块86，下面对该装置进行详细说明。

接收模块82，用于接收用于触发教学交互开始的触发信息；播放模块84，与上述接收模块82相连，用于播放虚拟教师，其中，所述虚拟教师依据真人教师的特征模拟得到；交互模块86，与上述播放模块84相连，用于在虚拟教师与学生的教学交互场景中，通过所述虚拟教师进行教学交互。

此处需要说明的是，上述接收模块82，播放模块84和交互模块86对应于实施例1中的步骤S202至步骤S206，三个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例1所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。

实施例4

本发明的实施例可以提供一种计算机终端，该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地，在本实施例中，上述计算机终端也可以替换为移动终端等终端设备。

可选地，在本实施例中，上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

在本实施例中，上述计算机终端可以执行应用程序的交互方法中以下步骤的程序代码：接收用于触发教学交互开始的触发信息；播放虚拟教师，其中，虚拟教师依据真人教师的特征模拟得到；在虚拟教师与学生的教学交互场景中，通过虚拟教师进行教学交互。

可选地，图9是根据本发明实施例4的一种计算机终端的结构框图。如图9所示，该计算机终端10可以包括：一个或多个(图中仅示出一个)处理器92、存储器94、以及外设接口。

其中，存储器可用于存储软件程序以及模块，如本发明实施例中的交互方法和装置对应的程序指令/模块，处理器通过运行存储在存储器内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的交互方法。存储器可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：接收用于触发教学交互开始的触发信息；播放虚拟教师，其中，虚拟教师依据真人教师的特征模拟得到；在虚拟教师与学生的教学交互场景中，通过虚拟教师进行教学交互。

可选的，上述处理器还可以执行如下步骤的程序代码：接收用于触发教学交互开始的触发信息包括：通过接收按键指令的方式，接收用于触发教学交互开始的触发信息；通过远程发送的触发消息的方式，接收用于触发教学交互开始的触发信息。

可选的，上述处理器还可以执行如下步骤的程序代码：播放虚拟教师包括：通过播放视频的方式，展示虚拟教师的声音，面部表情。

可选的，上述处理器还可以执行如下步骤的程序代码：通过播放视频的方式，展示虚拟教师的声音包括：获取虚拟教师要说的文本；提取真人教师的语音特征；根据语音特征，将文本合成为合成语音，将合成语音作为虚拟教师的声音进行播放。

可选的，上述处理器还可以执行如下步骤的程序代码：通过播放视频的方式，展示虚拟教师的面部表情包括：获取虚拟教师对应的底板视频，其中，底板视频中包括真人教师的面部表情；从底板视频中抽取真人教师的面部表情的表情特征；根据表情特征重塑虚拟教师的面部表情，通过播放视频的方式，展示虚拟教师重塑后的面部表情。

可选的，上述处理器还可以执行如下步骤的程序代码：在虚拟教师与学生的教学交互场景中，通过虚拟教师进行教学交互包括：确定与教学交互场景对应的交互模型，其中，交互模型通过多组数据训练得到，每组数据中均包括：学生向教师提出的问题，以及与该问题对应的答案；接收到学生向虚拟教师提出的问题；将接收的问题作为交互模型的输入，得到对应的输出答案；通过虚拟教师展示得到的输出答案。

可选的，上述处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：显示用于展示虚拟教师的设备处于待唤醒状态，其中，虚拟教师为依据真人教师的特征模拟得到；在接收到触发教学交互开始的触发信息时，显示虚拟教师进入交互状态；在虚拟教师与学生的教学交互场景中，显示虚拟教师与学生进行教学交互的交互内容。

可选的，上述处理器还可以执行如下步骤的程序代码：在虚拟教师与学生的教学交互场景中，显示虚拟教师与学生进行教学交互的交互内容包括：在教学交互开始后，但还未检测到学生输入的问题时，控制虚拟教师处于静置状态；检测到学生输入的问题，控制虚拟教师处于倾听状态；在确定学生输入问题结束时，在将问题输入数据库后，控制虚拟教师进入回答状态，并接收数据库返回的问题答案；通过虚拟教师展示问题答案。

可选的，上述处理器还可以执行如下步骤的程序代码：通过播放对应视频的方式，分别控制虚拟教师进入静置态，控制虚拟教师进入倾听态，控制虚拟教师进入回答态。

采用本发明实施例，提供了一种交互方法的方案。采用显示虚拟教师，由真人教师的特征模拟所得的虚拟教师，与学生在教学交互场景中进行教学交互，达到了让学生与教师进行有效的教学交互，从而具有较高的体验性的目的，从而实现了提高教学交互的教学效果，并有效改善体验性的技术效果，进而解决了相关技术中的教学场景中的教学方式，缺乏与真人进行的教学交互，教学效果较低，而且体验性较差的技术问题。

本领域普通技术人员可以理解，图9所示的结构仅为示意，计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices，MID)、PAD等终端设备。图9其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图9中所示更多或者更少的组件(如网络接口、显示装置等)，或者具有与图9所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(RandomAccess Memory，RAM)、磁盘或光盘等。

实施例5

本发明的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以用于保存上述实施例1所提供的交互方法所执行的程序代码。

可选地，在本实施例中，上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中，或者位于移动终端群中的任意一个移动终端中。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：接收用于触发教学交互开始的触发信息；播放虚拟教师，其中，虚拟教师依据真人教师的特征模拟得到；在虚拟教师与学生的教学交互场景中，通过虚拟教师进行教学交互。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：接收用于触发教学交互开始的触发信息包括：通过接收按键指令的方式，接收用于触发教学交互开始的触发信息；通过远程发送的触发消息的方式，接收用于触发教学交互开始的触发信息。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：播放虚拟教师包括：通过播放视频的方式，展示虚拟教师的声音，面部表情。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：通过播放视频的方式，展示虚拟教师的声音包括：获取虚拟教师要说的文本；提取真人教师的语音特征；根据语音特征，将文本合成为合成语音，将合成语音作为虚拟教师的声音进行播放。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：通过播放视频的方式，展示虚拟教师的面部表情包括：获取虚拟教师对应的底板视频，其中，底板视频中包括真人教师的面部表情；从底板视频中抽取真人教师的面部表情的表情特征；根据表情特征重塑虚拟教师的面部表情，通过播放视频的方式，展示虚拟教师重塑后的面部表情。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：在虚拟教师与学生的教学交互场景中，通过虚拟教师进行教学交互包括：确定与教学交互场景对应的交互模型，其中，交互模型通过多组数据训练得到，每组数据中均包括：学生向教师提出的问题，以及与该问题对应的答案；接收到学生向虚拟教师提出的问题；将接收的问题作为交互模型的输入，得到对应的输出答案；通过虚拟教师展示得到的输出答案。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：显示用于展示虚拟教师的设备处于待唤醒状态，其中，虚拟教师为依据真人教师的特征模拟得到；在接收到触发教学交互开始的触发信息时，显示虚拟教师进入交互状态；在虚拟教师与学生的教学交互场景中，显示虚拟教师与学生进行教学交互的交互内容。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：在虚拟教师与学生的教学交互场景中，显示虚拟教师与学生进行教学交互的交互内容包括：在教学交互开始后，但还未检测到学生输入的问题时，控制虚拟教师处于静置状态；检测到学生输入的问题，控制虚拟教师处于倾听状态；在确定学生输入问题结束时，在将问题输入数据库后，控制虚拟教师进入回答状态，并接收数据库返回的问题答案；通过虚拟教师展示问题答案。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：通过播放对应视频的方式，分别控制虚拟教师进入静置态，控制虚拟教师进入倾听态，控制虚拟教师进入回答态。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种交互方法，其特征在于，包括：

接收用于触发教学交互开始的触发信息；

播放虚拟教师，其中，所述虚拟教师依据真人教师的特征模拟得到；

在虚拟教师与学生的教学交互场景中，通过所述虚拟教师进行教学交互。

2.根据权利要求1所述的方法，其特征在于，接收用于触发教学交互开始的触发信息包括：

通过接收按键指令的方式，接收用于触发教学交互开始的触发信息；

通过远程发送的触发消息的方式，接收用于触发教学交互开始的触发信息。

3.根据权利要求1所述的方法，其特征在于，播放所述虚拟教师包括：

通过播放视频的方式，展示所述虚拟教师的声音，面部表情。

4.根据权利要求3所述的方法，其特征在于，通过播放视频的方式，展示所述虚拟教师的声音包括：

获取所述虚拟教师要说的文本；

提取真人教师的语音特征；

根据所述语音特征，将所述文本合成为合成语音，将所述合成语音作为所述虚拟教师的声音进行播放。

5.根据权利要求3所述的方法，其特征在于，通过播放视频的方式，展示所述虚拟教师的面部表情包括：

获取所述虚拟教师对应的底板视频，其中，所述底板视频中包括真人教师的面部表情；

从所述底板视频中抽取所述真人教师的面部表情的表情特征；

根据所述表情特征重塑虚拟教师的面部表情，通过播放视频的方式，展示所述虚拟教师重塑后的面部表情。

6.根据权利要求1所述的方法，其特征在于，在虚拟教师与学生的教学交互场景中，通过所述虚拟教师进行教学交互包括：

确定与所述教学交互场景对应的交互模型，其中，所述交互模型通过多组数据训练得到，每组数据中均包括：学生向教师提出的问题，以及与该问题对应的答案；

接收到学生向虚拟教师提出的问题；

将接收的所述问题作为所述交互模型的输入，得到对应的输出答案；

通过所述虚拟教师展示得到的输出答案。

7.一种交互方法，其特征在于，包括：

显示用于展示虚拟教师的设备处于待唤醒状态，其中，所述虚拟教师为依据真人教师的特征模拟得到；

在接收到触发教学交互开始的触发信息时，显示所述虚拟教师进入交互状态；

在虚拟教师与学生的教学交互场景中，显示所述虚拟教师与学生进行教学交互的交互内容。

8.根据权利要求7所述的方法，其特征在于，在虚拟教师与学生的教学交互场景中，显示所述虚拟教师与学生进行教学交互的交互内容包括：

在教学交互开始后，但还未检测到学生输入的问题时，控制所述虚拟教师处于静置状态；

检测到学生输入的问题，控制所述虚拟教师处于倾听状态；

在确定所述学生输入问题结束时，在将所述问题输入数据库后，控制所述虚拟教师进入回答状态，并接收所述数据库返回的问题答案；

通过所述虚拟教师展示所述问题答案。

9.根据权利要求8所述的方法，其特征在于，通过播放对应视频的方式，分别控制所述虚拟教师进入静置态，控制所述虚拟教师进入倾听态，控制所述虚拟教师进入回答态。

10.一种交互装置，其特征在于，包括：

接收模块，用于接收用于触发教学交互开始的触发信息；

播放模块，用于播放虚拟教师，其中，所述虚拟教师依据真人教师的特征模拟得到；

交互模块，用于在虚拟教师与学生的教学交互场景中，通过所述虚拟教师进行教学交互。

11.一种计算机设备，其特征在于，包括：存储器和处理器，

所述存储器存储有计算机程序；

所述处理器，用于执行所述存储器中存储的计算机程序，所述计算机程序运行时执行权利要求1至9中任意一项所述的交互方法。