CN112860214B

CN112860214B - 基于语音会话的动画展示方法、装置、存储介质及设备

Info

Publication number: CN112860214B
Application number: CN202110262222.0A
Authority: CN
Inventors: 冯高峰
Original assignee: Beijing CHJ Automobile Technology Co Ltd
Current assignee: Beijing CHJ Automobile Technology Co Ltd
Priority date: 2021-03-10
Filing date: 2021-03-10
Publication date: 2023-08-01
Anticipated expiration: 2041-03-10
Also published as: CN112860214A

Abstract

本公开涉及一种基于语音会话的动画展示方法、装置、存储介质及设备，以实现对语音会话的提示及引导。所述方法包括：响应于接收到语音唤醒事件，控制语音会话进入唤醒状态，并通过指定页面展示与所述语音唤醒事件对应的唤醒动画，以开启语音会话；在语音会话开启过程中，监听语音交互事件；若监听到语音交互事件，根据与监听到的语音交互事件对应的会话状态，以及预先设置的会话状态与展示优先级的对应关系，确定语音会话的目标会话状态以及与所述目标会话状态对应的目标动画；在语音会话处于所述目标会话状态时，通过指定页面展示所述目标动画。

Description

基于语音会话的动画展示方法、装置、存储介质及设备

技术领域

本公开涉及计算机技术领域，具体地，涉及一种基于语音会话的动画展示方法、装置、存储介质及设备。

背景技术

在语音会话过程中，用户通过唤醒词唤醒语音系统，之后语音系统进入收音状态，用户发出指令，设备理解用户指令并执行。在这个过程中，会发生一系列事件，如唤醒事件、录音事件、用户开始说话事件、用户结束说话事件、语义理解事件、执行结束事件等，这些事件可以将会话过程划分为各种状态，而语音形象需要展示对话过程中的各种状态，以提示用户，帮助其更好地使用语音功能。动画是一种展示动画状态非常直观且体检很好的方式。现有语音形象实现的技术方案，动画效果较为简单，大多仅仅是通过简单的循环动画来提示用户处于语音对话过程中，对用户的提示性不足，缺乏对用户的引导，视觉体验效果不佳，同时，由于语音交互的时间及状态切换的不可预知性，语音形象难以设计成体验及提示性更好的复杂动画。

发明内容

本公开的目的是提供一种基于语音会话的动画展示方法、装置、存储介质及设备，以更好地对语义会话进行引导、提示。

为了实现上述目的，根据本公开的第一方面，提供一种基于语音会话的动画展示方法，所述方法包括：

响应于接收到语音唤醒事件，控制语音会话进入唤醒状态，并通过指定页面展示与所述语音唤醒事件对应的唤醒动画，以开启语音会话；

在语音会话开启过程中，监听语音交互事件；

若监听到语音交互事件，根据与监听到的语音交互事件对应的会话状态，以及预先设置的会话状态与展示优先级的对应关系，确定语音会话的目标会话状态以及与所述目标会话状态对应的目标动画，其中，会话状态用于表征语音会话所处的状态，目标会话状态为语音会话结束当前的会话状态后即将所处的会话状态；

在语音会话处于所述目标会话状态时，通过指定页面展示所述目标动画。

可选地，所述若监听到语音交互事件，根据与监听到的语音交互事件对应的会话状态，以及预先设置的会话状态与展示优先级的对应关系，确定语音会话的目标会话状态以及与所述目标会话状态对应的目标动画，包括：

若监听到目标语音交互事件，获取语音会话当前所处的第一会话状态并确定是否已存在用于接续所述第一会话状态的第二会话状态；

若存在所述第二会话状态，根据预先设置的会话状态与展示优先级的对应关系，比较与所述目标语音交互事件对应的会话状态和所述第二会话状态的优先级；

将与所述目标语音交互事件对应的会话状态和所述第二会话状态中优先级较高的会话状态确定为目标会话状态；

根据预先设置会话状态与动画之间的对应关系，确定与所述目标会话状态对应的动画，作为目标动画。

可选地，所述方法还包括：

若不存在所述第二会话状态，将与所述目标语音交互事件对应的会话状态确定为目标会话状态。

可选地，所述方法还包括：

若不存在所述第二会话状态，判断所述第一会话状态是否可被中断；

若所述第一会话状态可被中断，将与所述目标语音交互事件对应的会话状态确定为目标会话状态；

若所述第一会话状态不可被中断，丢弃所述目标语音交互事件。

可选地，所述判断所述第一会话状态是否可被中断，包括：

若所述与所述目标语音交互事件对应的会话状态的展示优先级高于所述第一会话状态的展示优先级，确定所述第一会话状态可被中断；

若所述与所述目标语音交互事件对应的会话状态的展示优先级低于所述第一会话状态的展示优先级，确定所述第一会话状态不可被中断。

可选地，所述方法还包括：

在已确定所述目标会话状态和所述目标动画的情况下，控制语音会话当前所处的第一会话状态结束；

在确定所述第一会话状态已结束时，控制语音会话进入所述目标会话状态。

可选地，所述语音交互事件包括录音事件，所述录音事件对应于录音状态，以及所述录音事件对应于第一动画；

所述在语音会话处于所述目标会话状态时，通过指定页面展示所述目标动画，包括：

若所述目标会话状态为所述录音状态，在语音会话处于所述录音状态的过程中，循环展示所述第一动画。

可选地，所述语音交互事件包括语音输入事件，所述语音输入事件对应于语音输入状态，以及，所述语音输入状态对应于第二动画，所述第二动画包括开始部分、中间部分和结束部分；

若所述目标会话状态为所述语音输入状态，在语音会话进入所述语音输入状态后，展示所述第二动画的开始部分；

在所述第二动画的开始部分展示完毕后、且在接收到语音输入结束事件之前，循环展示所述第二动画的中间部分；

在接收到所述语音输入结束事件后，展示所述第二动画的结束部分。

可选地，所述方法还包括：

在所述第二动画的结束部分展示完毕后，退出所述语音输入状态。

可选地，所述语音交互事件包括语义理解事件，所述语义理解事件对应于语义理解状态，以及所述语义理解事件对应于第三动画；

若所述目标会话状态为所述语义理解状态，在语音会话处于所述语义理解状态的过程中，循环展示所述第三动画。

可选地，所述语音交互事件包括语音播报事件，所述语音播报事件对应于语音播报状态，以及，所述语音播报状态对应于第四动画，所述第四动画包括开始部分、中间部分和结束部分；

若所述目标会话状态为所述语音播报状态，在语音会话进入所述语音播报状态后，展示所述第四动画的开始部分；

在所述第四动画的开始部分展示完毕后、且在接收到语音播报结束事件之前，循环展示所述第四动画的中间部分；

在接收到所述语音播报结束事件后，展示所述第四动画的结束部分。

可选地，所述方法还包括：

在所述第四动画的结束部分展示完毕后，退出所述语音播报状态。

可选地，所述语音会话设置有默认会话状态和默认动画；

所述方法还包括：

若语音会话不存在目标会话状态、且未监听到新的语音交互事件，控制语音会话进入所述默认会话状态，并通过指定页面展示所述默认动画。

可选地，所述方法还包括：

若接收到会话结束事件，结束语音会话，并停止进行动画展示。

根据本公开的第二方面，提供一种基于语音会话的动画展示装置，所述装置包括：

唤醒模块，用于响应于接收到语音唤醒事件，控制语音会话进入唤醒状态，并通过指定页面展示与所述语音唤醒事件对应的唤醒动画，以开启语音会话；

监听模块，用于在语音会话开启过程中，监听语音交互事件；

确定模块，用于若监听到语音交互事件，根据与监听到的语音交互事件对应的会话状态，以及预先设置的会话状态与展示优先级的对应关系，确定语音会话的目标会话状态以及与所述目标会话状态对应的目标动画，其中，会话状态用于表征语音会话所处的状态，目标会话状态为语音会话结束当前的会话状态后即将所处的会话状态；

展示模块，用于在语音会话处于所述目标会话状态时，通过指定页面展示所述目标动画。

可选地，所述确定模块包括：

获取子模块，用于若监听到目标语音交互事件，获取语音会话当前所处的第一会话状态并确定是否已存在用于接续所述第一会话状态的第二会话状态；

比较子模块，用于若存在所述第二会话状态，根据预先设置的会话状态与展示优先级的对应关系，比较与所述目标语音交互事件对应的会话状态和所述第二会话状态的优先级；

第一确定子模块，用于将与所述目标语音交互事件对应的会话状态和所述第二会话状态中优先级较高的会话状态确定为目标会话状态；

第二确定子模块，用于根据预先设置会话状态与动画之间的对应关系，确定与所述目标会话状态对应的动画，作为目标动画。

可选地，所述确定模块还包括：

第三确定子模块，用于若不存在所述第二会话状态，将与所述目标语音交互事件对应的会话状态确定为目标会话状态。

可选地，所述确定模块还包括：

判断子模块，用于若不存在所述第二会话状态，判断所述第一会话状态是否可被中断；

第四确定模块，用于若所述第一会话状态可被中断，将与所述目标语音交互事件对应的会话状态确定为目标会话状态；

处理子模块，用于若所述第一会话状态不可被中断，丢弃所述目标语音交互事件。

可选地，所述判断子模块用于：

可选地，所述装置还包括：

第一控制模块，用于在已确定所述目标会话状态和所述目标动画的情况下，控制语音会话当前所处的第一会话状态结束；

第二控制模块，用于在确定所述第一会话状态已结束时，控制语音会话进入所述目标会话状态。

所述展示模块包括：

第一展示子模块，用于若所述目标会话状态为所述录音状态，在语音会话处于所述录音状态的过程中，循环展示所述第一动画。

所述展示模块包括：

第二展示子模块，用于若所述目标会话状态为所述语音输入状态，在语音会话进入所述语音输入状态后，展示所述第二动画的开始部分；

第三展示子模块，用于在所述第二动画的开始部分展示完毕后、且在接收到语音输入结束事件之前，循环展示所述第二动画的中间部分；

第四展示子模块，用于在接收到所述语音输入结束事件后，展示所述第二动画的结束部分。

可选地，所述装置还包括：

第三控制模块，用于在所述第二动画的结束部分展示完毕后，退出所述语音输入状态。

所述展示模块包括：

第五展示子模块，用于若所述目标会话状态为所述语义理解状态，在语音会话处于所述语义理解状态的过程中，循环展示所述第三动画。

所述展示模块包括：

第六展示子模块，用于若所述目标会话状态为所述语音播报状态，在语音会话进入所述语音播报状态后，展示所述第四动画的开始部分；

第七展示子模块，用于在所述第四动画的开始部分展示完毕后、且在接收到语音播报结束事件之前，循环展示所述第四动画的中间部分；

第八展示子模块，用于在接收到所述语音播报结束事件后，展示所述第四动画的结束部分。

可选地，所述装置还包括：

第四控制模块，用于在所述第四动画的结束部分展示完毕后，退出所述语音播报状态。

可选地，所述语音会话设置有默认会话状态和默认动画；

所述装置还包括：

第五控制模块，用于若语音会话不存在目标会话状态、且未监听到新的语音交互事件，控制语音会话进入所述默认会话状态，并通过指定页面展示所述默认动画。

可选地，所述装置还包括：

第六控制模块，用于若接收到会话结束事件，结束语音会话，并停止进行动画展示。

根据本公开的第三方面，提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本公开第一方面所述方法的步骤。

根据本公开的第四方面，提供一种电子设备，包括：

存储器，其上存储有计算机程序；

处理器，用于执行所述存储器中的所述计算机程序，以实现本公开第一方面所述方法的步骤。

通过上述技术方案，响应于接收到语音唤醒事件，控制语音会话进入唤醒状态，并通过指定页面展示与语音唤醒事件对应的唤醒动画，以开启语音会话，在语音会话开启过程中，监听语音交互事件，以及，若监听到语音交互事件，根据与监听到的语音交互事件对应的会话状态，以及预先设置的会话状态与展示优先级的对应关系，确定语音会话的目标会话状态以及与目标会话状态对应的目标动画，并在语音会话处于目标会话状态时，通过指定页面展示目标动画。其中，会话状态用于表征语音会话所处的状态，目标会话状态为语音会话结束当前的会话状态后即将所处的会话状态。这样，在语音会话过程中，根据接收到的语音交互事件，结合会话状态的优先级，对语音会话即将进入的下一会话状态进行决策，能够使语音会话能够在合适的时机播放合适的动画，通过动画反映当前的会话状态，对使用者进行引导和提示，提升使用者在语音会话过程中的使用体验。并且，可以根据实际的业务需求，灵活地对语音会话场景中的事件、动画进行设计，从而更好地在语义会话过程中进行提示和引导。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本公开的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本公开，但并不构成对本公开的限制。在附图中：

图1是根据本公开的一种实施方式提供的基于语音会话的动画展示方法的流程图；

图2是根据本公开提供的基于语音会话的动画展示方法中，确定语音会话的目标会话状态以及与目标会话状态对应的目标动画的步骤的一种示例性的流程图；

图3是根据本公开的一种实施方式提供的基于语音会话的动画展示装置的框图；

图4是根据一示例性实施例示出的一种电子设备的框图；

图5是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本公开，并不用于限制本公开。

图1是根据本公开的一种实施方式提供的基于语音会话的动画展示方法的流程图。如图1所示，本公开提供的方法可以包括如下步骤：

在步骤11中，响应于接收到语音唤醒事件，控制语音会话进入唤醒状态，并通过指定页面展示与语音唤醒事件对应的唤醒动画，以开启语音会话；

在步骤12中，在语音会话开启过程中，监听语音交互事件；

在步骤13中，若监听到语音交互事件，根据与监听到的语音交互事件对应的会话状态，以及预先设置的会话状态与展示优先级的对应关系，确定语音会话的目标会话状态以及与目标会话状态对应的目标动画；

在步骤14中，在语音会话处于目标会话状态时，通过指定页面展示目标动画。

在详细介绍本公开的方案之前，首先对本公开中的语音交互事件、会话状态、动画以及上述几者之间的关系进行说明。

如背景技术所述，在语音会话过程中，语音引擎会发出一系列事件，例如唤醒事件、录音事件、用户开始说话事件、用户结束说话事件、语义理解事件、执行结束事件等。在本公开的方案中，前期准备时，会对语音会话过程中的事件按照特点进行划分，并规定事件对应的会话状态，同时，设置会话状态对应的动画。其中，会话状态用于表征语音会话所处的状态，在实际应用中，可以根据实际的需求预先对会话状态进行划分、规定。

示例地，可以将语音会话过程中的事件划分为三类：成对事件、单一持续事件和单一瞬时事件，下面对本示例涉及到的三类事件进行说明。

成对事件可分为开始事件和结束事件，此类事件要求语音系统能够知悉该类事件的周期，能够清楚知晓会话状态开始、结束的时间点。例如，用户语音输入状态(表征用户正在进行语音输入)中的语音输入事件(用户开始进行语音输入)和语音输入结束事件(用户停止语音输入)，或者，语音播报状态(表征设备正在为用户进行语音播报)中的语音播报事件(开始进行播报)和语音播报结束事件(语音播报结束)，等等。

单一持续事件表示语音引擎或DM(Dialog Manager，会话管理)期望UI(UserInterface，用户界面)一直向用户展示某种状态，直到外部事件打断当前状态或者达到内部设置的超时时长，主要用于无法获悉事件对应的会话状态何时结束的情况。例如，录音事件和录音状态(无法知晓用户何时开始说话)、语义理解事件和语义理解状态(无法知晓语义理解何时完成)，等等。

单一瞬时事件表示语音引擎或DM期望UI为用户一个瞬时的提示。例如，语音唤醒事件和唤醒状态等。

参照上述事件、状态的特点，可以设计与状态对应的动画。例如，对于单一瞬时事件及其对应的会话状态，可以直接设计提示性的动画，在展示时，将该动画展示一次，以提示用户发生了该事件。再例如，对于单一持续事件及其对应的会话状态，可以设计一段便于循环播放的动画，在展示时，循环展示该动画，直至当前状态被打断。再例如，对于成对事件及其对应的会话状态，可以涉及三段式动画，包含开始部分、中间部分和结束部分，在检测到成对事件中的开始事件时展示一次动画的开始部分，在检测到成对事件中的结束事件时展示一次动画的结束部分，在检测到开始事件和结束事件中间的时间段循环展示动画的中间部分。其中，动画的循环播放能够有效解决会话状态持续时长不可预知的问题。

需要说明的是，每种动画的首帧及末帧可以保持相同，这样可以保持动画之间衔接的连续性。同时，每一小段动画的持续时间不应过长，以避免在会话状态之间切换时出现延迟。

下面将根据上述步骤11～步骤14对本公开进行详细说明。本公开提供的方法可以应用于语音处理场景，示例地，可以由语音引擎执行。

在步骤11中，响应于接收到语音唤醒事件，控制语音会话进入唤醒状态，并通过指定页面展示与语音唤醒事件对应的唤醒动画，以开启语音会话。

当用户需要进行语音会话时，可以通过说出唤醒词开启一段语音对话。当用户说出唤醒词后，唤醒词会激活语音唤醒事件，即接收到语音唤醒事件。响应于该事件，语音引擎控制语音会话进入唤醒状态，并通过指定页面展示与所述语音唤醒事件对应的唤醒动画，以开启语音会话。其中，如上文所述，语音唤醒事件属于单一瞬时事件，因此，唤醒动画可以设置为耗时较短的动画，例如，短时间的语音虚拟形象出现的动画。

在步骤12中，在语音会话开启过程中，监听语音交互事件。

在语音会话开启的过程中，需要时刻监听语音交互事件，以便于及时地对用户在语音会话中的操作进行响应，同时，监听到的语音交互事件将会进一步通过步骤13进行处理。

在步骤13中，若监听到语音交互事件，根据与监听到的语音交互事件对应的会话状态，以及预先设置的会话状态与展示优先级的对应关系，确定语音会话的目标会话状态以及与目标会话状态对应的目标动画。

其中，目标会话状态为语音会话结束当前的会话状态后即将所处的会话状态，换言之，若语音会话当前处于会话状态H1，目标会话状态为会话状态H2，则语音会话结束当前的H1状态之后，将会进入H2状态，进入H2状态后，语音会话处于状态H2，相当于语音会话从H1状态切换到了H2状态。

由于不同会话状态之间的切换存在延时，因此存在这样一种场景：在语音会话处于会话状态A时收到了进入会话状态B的事件，而在会话状态A的动画还未播放完毕时，又接收到了进入会话状态C的事件，此时，会话状态A结束后是进入会话状态B还是会话状态C需要进行取舍。因此，在一种可能的实施方式中，步骤13可以包括以下步骤，如图2所示：

在步骤21中，若监听到目标语音交互事件，获取语音会话当前所处的第一会话状态并确定是否已存在用于接续第一会话状态的第二会话状态；

在步骤22中，若存在第二会话状态，根据预先设置的会话状态与展示优先级的对应关系，比较与目标语音交互事件对应的会话状态和第二会话状态的优先级；

在步骤23中，将与目标语音交互事件对应的会话状态和第二会话状态中优先级较高的会话状态确定为目标会话状态；

在步骤24中，根据预先设置会话状态与动画之间的对应关系，确定与目标会话状态对应的动画，作为目标动画。

在语音会话过程中，步骤13是持续进行的，也就是说，若监听到新的语音交互事件，就可以将其作为目标语音交互事件，执行针对目标语音交互事件的一系列步骤。从而，在语音会话过程中，能够持续地针对监听到的语音交互事件对语音会话的会话状态进行切换，并展示相应的动画。

若监听到目标语音交互事件，在步骤21中，首先获取语音会话当前所处的第一会话状态，同时确定是否已存在用于接续第一会话状态的第二会话状态。若存在第二会话状态，说明在目标语音交互事件到来之前，已经确定好了用于接续第一会话状态的第二会话状态，而当前接收到的目标语义交互事件要求语音会话进入与目标语义交互事件对应的会话状态，二者出现了冲突，因此，到底进入哪一种会话状态需要进行裁决，裁决的步骤可以参见步骤22和步骤23。

在步骤22和步骤23中，根据预先设置的会话状态与展示优先级的对应关系，比较与目标语音交互事件对应的会话状态和第二会话状态的优先级，并将与目标语音交互事件对应的会话状态和第二会话状态中优先级较高的会话状态确定为目标会话状态。也就是说，在出现下一会话状态的冲突时，可以结合预先设置的会话状态与展示优先级的对应关系，选择优先级较高的会话状态，而舍弃优先级较低的会话状态。

可选地，若不存在第二会话状态，说明目前并没有会话状态接续当前的第一会话状态，因此可以直接将与目标语音交互事件对应的会话状态确定为目标会话状态。

若不存在第二会话状态，虽然说明目前并没有会话状态接续当前的第一会话状态，但是，在一些场景中，会话状态是不可被打断的，在这种情况下，即便不存在第二会话状态，也不会直接停止当前的第一会话状态。因此，可选地，步骤13还可以包括以下步骤：

判断第一会话状态是否可被中断；

若第一会话状态可被中断，将与目标语音交互事件对应的会话状态确定为目标会话状态；

若第一会话状态不可被中断，丢弃目标语音交互事件。

在一种可能的实施例中，第一会话状态是否可被中断可以是预先设置的。因此，在判断第一会话状态是否可被中断时，可以直接根据预先设置的有关第一会话状态是否可被中断的信息直接进行判断。例如，若预先设置第一会话状态始终是可以被中断的，则在需要判断第一会话状态是否可被中断时，依据这一预先设置的信息，可以确定第一会话状态是可以被中断的。

在另一种可能的实施例中，第一会话状态是否可被中断，与会话状态的展示优先级相关。相应地，在这一实施例中，可以通过以下方式判断第一会话状态是否可被中断：

若与目标语音交互事件对应的会话状态的展示优先级高于第一会话状态的展示优先级，确定第一会话状态可被中断；

若与目标语音交互事件对应的会话状态的展示优先级低于第一会话状态的展示优先级，确定第一会话状态不可被中断。

也就是说，若与目标语音交互事件对应的会话状态的展示优先级高于第一会话状态的展示优先级，与目标语音交互事件对应的会话状态可以中断第一会话状态，相反地，若与目标语音交互事件对应的会话状态的展示优先级低于第一会话状态的展示优先级，与目标语音交互事件对应的会话状态就无法中断第一会话状态。

若第一会话状态可被中断，则可以将与目标语音交互事件对应的会话状态确定为目标会话状态，同时，还可以发出控制第一会话状态结束的指令，以便进入下一会话状态。其中，在发出控制第一会话状态结束的指令，可以等待第一会话状态对应的动画展示完毕后，确认第一会话状态结束，从而进入确定的目标会话状态。而若第一会话状态不可被中断，则无法中断第一会话状态，从而无法相应当前的目标语音交互事件，因此，可以将目标语音交互事件丢弃，不再处理。

经过上述步骤确定好目标会话状态之后，由于预先设置了会话状态与动画之间的对应关系，从而可以直接从中确定出与目标会话状态对应的动画，将其作为目标动画。

通过上述方式，在语音会话过程中，若出现会话状态冲突的情况，可以结合预先设置的优先级对冲突情况进行决策，以更好地对语音会话进行提示、引导。

可选地，在已确定目标会话状态和目标动画的情况下，可以控制语音会话当前所处的第一会话状态结束，并在确定第一会话状态已结束时，控制语音会话进入目标会话状态。

在确定目标会话状态和目标动画的情况下，可控制语音会话当前所处的第一会话状态结束，例如，发出控制第一会话状态结束的指令，在发出该指令之后，还需等待第一会话状态对应的动画展示完毕，因此，在发出该指令之后可以实时确认第一会话状态是否已经结束，并在确定第一会话状态已结束时，再控制语音会话进入目标会话状态。

在语音会话处于目标会话状态时，执行步骤14。在步骤14中，在语音会话处于目标会话状态时，通过指定页面展示目标动画。

在一种可能的实施例中，语音交互事件可以包括录音事件，录音事件对应于录音状态，以及录音事件对应于第一动画。相应地，步骤14可以包括以下步骤：

若目标会话状态为录音状态，在语音会话处于录音状态的过程中，循环展示第一动画。

示例地，第一动画可以为能够表征当前正在录音的动画，从而，当用户看到第一动画，可以知晓当前语音会话的录音已经开启，用户可以随时进行语音输入。

在另一种可能的实施例中，语音交互事件可以包括语音输入事件，语音输入事件对应于语音输入状态，以及，语音输入状态对应于第二动画，第二动画包括开始部分、中间部分和结束部分。相应地，步骤14可以包括以下步骤：

若目标会话状态为语音输入状态，在语音会话进入语音输入状态后，展示第二动画的开始部分；

在第二动画的开始部分展示完毕后、且在接收到语音输入结束事件之前，循环展示第二动画的中间部分；

在接收到语音输入结束事件后，展示第二动画的结束部分。

也就是说，当进入语音输入状态后，首先播放第二动画的开始部分，表明当前语音会话已经进入语音输入状态，之后，循环播放第二动画的中间部分，表明当前正处于输入过程中，与此同时，持续监听是否接收到语音输入结束事件，若接收到语音输入结束事件，说明用户的语音输入已经输入完毕，可以退出语音输入状态，因此，需播放第二动画的结束部分，以表明当前语音会话已经结束语音输入，将进入下一会话状态。

其中，第二动画的开始部分可以为能够表征语音输入已开始的动画，第二动画的中间部分可以为能够表征当前正在语音输入的动画，第二动画的结束部分可以为能够表征当前语音输入已经结束的动画。示例地，第二动画的开始部分可以为虚拟形象由初始朝向转向用户，第二动画的中间部分可以为虚拟形象面向用户做出倾听动作(例如，点头、微笑等)，第二动画的结束部分可以为虚拟形象由面向用户转回初始朝向。

可选地，在第二动画的结束部分展示完毕后，可以退出语音输入状态，以使语音会话进入其他会话状态。

在另一种可能的实施例中，语音交互事件可以包括语义理解事件，语义理解事件对应于语义理解状态，以及语义理解事件对应于第三动画。相应地，步骤14可以包括以下步骤：

若目标会话状态为语义理解状态，在语音会话处于语义理解状态的过程中，循环展示第三动画。

示例地，第三动画可以为能够表征当前正在进行语义理解的动画，从而，当用户看到第三动画，可以知晓当前语音会话的正在进行语义理解，用户可以等待，以获得语义理解之后生成的响应结果。

在另一种可能的实施例中，语音交互事件包括语音播报事件，语音播报事件对应于语音播报状态，以及，语音播报状态对应于第四动画，第四动画包括开始部分、中间部分和结束部分。相应地，步骤14可以包括以下步骤：

若目标会话状态为语音播报状态，在语音会话进入语音播报状态后，展示第四动画的开始部分；

在第四动画的开始部分展示完毕后、且在接收到语音播报结束事件之前，循环展示第四动画的中间部分；

在接收到语音播报结束事件后，展示第四动画的结束部分。

也就是说，当进入语音播报状态后，首先播放第四动画的开始部分，表明当前语音会话已经进入语音播报状态，之后，循环播放第四动画的中间部分，表明当前正处于播报过程中，与此同时，持续监听是否接收到语音播报结束事件，若接收到语音播报结束事件，说明语音播报已经播报完毕，可以退出语音播报状态，因此，需播放第四动画的结束部分，以表明当前语音会话已经结束语音播报，将进入下一会话状态。

其中，第四动画的开始部分可以为能够表征语音播报已开始的动画，第四动画的中间部分可以为能够表征当前正在语音播报的动画，第四动画的结束部分可以为能够表征当前语音播报已经结束的动画。示例地，第四动画的开始部分可以为虚拟形象由初始朝向转向用户，第四动画的中间部分可以为虚拟形象面向用户做出说话动作，第四动画的结束部分可以为虚拟形象由面向用户转回初始朝向。

可选地，在第四动画的结束部分展示完毕后，可以退出语音播报状态，以使语音会话进入其他会话状态。

可选地，语音会话设置有默认会话状态和默认动画，因此，本公开提供的方法还可以包括以下步骤：

若语音会话不存在目标会话状态、且未监听到新的语音交互事件，控制语音会话进入默认会话状态，并通过指定页面展示默认动画。

在语音会话开启的情况下，若语音会话的当前会话状态已结束，且并不存在下一会话状态，同时，也未监听到新的语音交互事件，说明目前的语音会话不存在新的会话状态，因此，可以控制语音会话进入默认会话状态，并通过指定页面展示默认动画，以使用户知晓当前语音会话仍在开启。并且，在监听到新的语音交互事件之后，可以执行步骤13及后续步骤。

可选地，本公开提供的方法还可以包括以下步骤：

若接收到会话结束事件，说明当前的语音会话即将结束，因此，可以控制语音会话结束，同时停止展示动画。若需再次开启语音会话，需要再次进行唤醒。

图3是根据本公开的一种实施方式提供的基于语音会话的动画展示装置的框图，如图3所示，所述装置30包括：

唤醒模块31，用于响应于接收到语音唤醒事件，控制语音会话进入唤醒状态，并通过指定页面展示与所述语音唤醒事件对应的唤醒动画，以开启语音会话；

监听模块32，用于在语音会话开启过程中，监听语音交互事件；

确定模块33，用于若监听到语音交互事件，根据与监听到的语音交互事件对应的会话状态，以及预先设置的会话状态与展示优先级的对应关系，确定语音会话的目标会话状态以及与所述目标会话状态对应的目标动画，其中，会话状态用于表征语音会话所处的状态，目标会话状态为语音会话结束当前的会话状态后即将所处的会话状态；

展示模块34，用于在语音会话处于所述目标会话状态时，通过指定页面展示所述目标动画。

可选地，所述确定模块33包括：

可选地，所述确定模块33还包括：

可选地，所述判断子模块用于：

可选地，所述装置30还包括：

所述展示模块34包括：

可选地，所述装置30还包括：

所述展示模块34包括：

可选地，所述装置30还包括：

可选地，所述语音会话设置有默认会话状态和默认动画；

所述装置30还包括：

可选地，所述装置30还包括：

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图4是根据一示例性实施例示出的一种电子设备700的框图。如图4所示，该电子设备700可以包括：处理器701，存储器702。该电子设备700还可以包括多媒体组件703，输入/输出(I/O)接口704，以及通信组件705中的一者或多者。

其中，处理器701用于控制该电子设备700的整体操作，以完成上述的基于语音会话的动画展示方法中的全部或部分步骤。存储器702用于存储各种类型的数据以支持在该电子设备700的操作，这些数据例如可以包括用于在该电子设备700上操作的任何应用程序或方法的指令，以及应用程序相关的数据，例如联系人数据、收发的消息、图片、音频、视频等等。该存储器702可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(Static Random Access Memory，简称SRAM)，电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，简称EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，简称EPROM)，可编程只读存储器(Programmable Read-Only Memory，简称PROM)，只读存储器(Read-Only Memory，简称ROM)，磁存储器，快闪存储器，磁盘或光盘。多媒体组件703可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏，音频组件用于输出和/或输入音频信号。例如，音频组件可以包括一个麦克风，麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器702或通过通信组件705发送。音频组件还包括至少一个扬声器，用于输出音频信号。I/O接口704为处理器701和其他接口模块之间提供接口，上述其他接口模块可以是键盘，鼠标，按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件705用于该电子设备700与其他设备之间进行有线或无线通信。无线通信，例如Wi-Fi，蓝牙，近场通信(Near FieldCommunication，简称NFC)，2G、3G、4G、NB-IOT、eMTC、或其他5G等等，或它们中的一种或几种的组合，在此不做限定。因此相应的该通信组件705可以包括：Wi-Fi模块，蓝牙模块，NFC模块等等。

在一示例性实施例中，电子设备700可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit，简称ASIC)、数字信号处理器(DigitalSignal Processor，简称DSP)、数字信号处理设备(Digital Signal Processing Device，简称DSPD)、可编程逻辑器件(Programmable Logic Device，简称PLD)、现场可编程门阵列(Field Programmable Gate Array，简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述的基于语音会话的动画展示方法。

在另一示例性实施例中，还提供了一种包括程序指令的计算机可读存储介质，该程序指令被处理器执行时实现上述的基于语音会话的动画展示方法的步骤。例如，该计算机可读存储介质可以为上述包括程序指令的存储器702，上述程序指令可由电子设备700的处理器701执行以完成上述的基于语音会话的动画展示方法。

图5是根据一示例性实施例示出的一种电子设备1900的框图。例如，电子设备1900可以被提供为一服务器。参照图5，电子设备1900包括处理器1922，其数量可以为一个或多个，以及存储器1932，用于存储可由处理器1922执行的计算机程序。存储器1932中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理器1922可以被配置为执行该计算机程序，以执行上述的基于语音会话的动画展示方法。

另外，电子设备1900还可以包括电源组件1926和通信组件1950，该电源组件1926可以被配置为执行电子设备1900的电源管理，该通信组件1950可以被配置为实现电子设备1900的通信，例如，有线或无线通信。此外，该电子设备1900还可以包括输入/输出(I/O)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统，例如WindowsServer^TM，Mac OS X^TM，Unix^TM，Linux^TM等等。

在另一示例性实施例中，还提供了一种包括程序指令的计算机可读存储介质，该程序指令被处理器执行时实现上述的基于语音会话的动画展示方法的步骤。例如，该计算机可读存储介质可以为上述包括程序指令的存储器1932，上述程序指令可由电子设备1900的处理器1922执行以完成上述的基于语音会话的动画展示方法。

在另一示例性实施例中，还提供一种计算机程序产品，该计算机程序产品包含能够由可编程的装置执行的计算机程序，该计算机程序具有当由该可编程的装置执行时用于执行上述的基于语音会话的动画展示方法的代码部分。

以上结合附图详细描述了本公开的优选实施方式，但是，本公开并不限于上述实施方式中的具体细节，在本公开的技术构思范围内，可以对本公开的技术方案进行多种简单变型，这些简单变型均属于本公开的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合。为了避免不必要的重复，本公开对各种可能的组合方式不再另行说明。

此外，本公开的各种不同的实施方式之间也可以进行任意组合，只要其不违背本公开的思想，其同样应当视为本公开所公开的内容。

Claims

1.一种基于语音会话的动画展示方法，其特征在于，所述方法包括：

在语音会话开启过程中，监听语音交互事件，所述语音交互事件为录音事件、语音输入事件、语义理解事件或语音播报事件；

若监听到语音交互事件，根据与监听到的语音交互事件对应的会话状态，以及预先设置的会话状态与展示优先级的对应关系，确定语音会话的目标会话状态以及与所述目标会话状态对应的目标动画，其中，会话状态用于表征语音会话所处的状态，目标会话状态为语音会话结束当前的会话状态后即将所处的会话状态，所述会话状态为录音状态、语音输入状态、语义理解状态或语音播报状态；

在语音会话处于所述目标会话状态时，通过指定页面展示所述目标动画；

其中，所述若监听到语音交互事件，根据与监听到的语音交互事件对应的会话状态，以及预先设置的会话状态与展示优先级的对应关系，确定语音会话的目标会话状态以及与所述目标会话状态对应的目标动画，包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述判断所述第一会话状态是否可被中断，包括：

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

6.根据权利要求1所述的方法，其特征在于，所述语音交互事件包括录音事件，所述录音事件对应于录音状态，以及所述录音事件对应于第一动画；

7.根据权利要求1所述的方法，其特征在于，所述语音交互事件包括语音输入事件，所述语音输入事件对应于语音输入状态，以及，所述语音输入状态对应于第二动画，所述第二动画包括开始部分、中间部分和结束部分；

8.根据权利要求7所述的方法，其特征在于，所述方法还包括：

9.根据权利要求1所述的方法，其特征在于，所述语音交互事件包括语义理解事件，所述语义理解事件对应于语义理解状态，以及所述语义理解事件对应于第三动画；

10.根据权利要求1所述的方法，其特征在于，所述语音交互事件包括语音播报事件，所述语音播报事件对应于语音播报状态，以及，所述语音播报状态对应于第四动画，所述第四动画包括开始部分、中间部分和结束部分；

11.根据权利要求10所述的方法，其特征在于，所述方法还包括：

12.根据权利要求1所述的方法，其特征在于，所述语音会话设置有默认会话状态和默认动画；

所述方法还包括：

13.根据权利要求1所述的方法，其特征在于，所述方法还包括：

14.一种基于语音会话的动画展示装置，其特征在于，所述装置包括：

监听模块，用于在语音会话开启过程中，监听语音交互事件，所述语音交互事件为录音事件、语音输入事件、语义理解事件或语音播报事件；

确定模块，用于若监听到语音交互事件，根据与监听到的语音交互事件对应的会话状态，以及预先设置的会话状态与展示优先级的对应关系，确定语音会话的目标会话状态以及与所述目标会话状态对应的目标动画，其中，会话状态用于表征语音会话所处的状态，目标会话状态为语音会话结束当前的会话状态后即将所处的会话状态，所述会话状态为录音状态、语音输入状态、语义理解状态或语音播报状态；

展示模块，用于在语音会话处于所述目标会话状态时，通过指定页面展示所述目标动画；

所述确定模块包括：

15.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-13中任一项所述方法的步骤。

16.一种电子设备，其特征在于，包括：

存储器，其上存储有计算机程序；

处理器，用于执行所述存储器中的所述计算机程序，以实现权利要求1-13中任一项所述方法的步骤。