WO2014176983A1

WO2014176983A1 - 显示图像的方法、装置、移动终端及计算机存储介质

Info

Publication number: WO2014176983A1
Application number: PCT/CN2014/075626
Authority: WO
Inventors: 王少英
Original assignee: 中兴通讯股份有限公司
Priority date: 2013-09-25
Filing date: 2014-04-17
Publication date: 2014-11-06
Also published as: CN104468959A

Abstract

本发明实施例提供了一种显示图像的方法、装置、移动终端及计算机存储介质，所述方法包括：获取通话对方的语音数据；对所述语音数据进行分析得到通话对方的表情信息；确定与所述表情信息对应的虚拟人物头像，并在移动终端的通话界面上显示所述虚拟人物头像。

Description

显示图像的方法、装置、移动终端及计算机存储介质技术领域

本发明涉及移动通讯技术，特别是指一种移动终端通话过程中显示图像的方法、装置、移动终端及计算存储介质。背景技术

通话功能是移动终端的基本功能，在通话过程中，一般都是在移动终端的通话界面上显示一个静态的头像，用于标识来电人的身份，图像显示比较呆板，使得用户的通话过程比较无趣。发明内容

本发明实施例提供一种移动终端通话过程中显示图像的方法、装置、移动终端及计算机存储介质，能够在移动终端通话过程中，支持移动终端的通话界面上显示动态的图像来模拟通话对方的通话，提升了用户通话过程中的体验。

本发明实施例提供技术方案如下：

本发明实施例提供一种显示图像的方法，包括：

获取通话对方的语音数据；

对所述语音数据进行分析得到通话对方的表情信息；

确定与所述表情信息对应的虚拟人物头像，并在移动终端的通话界面上显示所述虚拟人物头像。

优选地，所述获取通话对方的语音数据之前，还包括：

建立虚拟人物头像数据库，并在所述虚拟人物头像数据库中存储虚拟人物头像与虚拟人物表情信息之间的对应关系。

优选地，所述对所述语音数据进行分析得到通话对方的表情信息，包括：

对所述语音数据进行文本转化得到语音文本；

对所述语音文本进行分析并提取出关键词，根据所述关键词确定通话对方的表情信息，所述表情信息至少包括有通话对方的情绪和口型。

优选地，所述对所述语音数据进行文本转化得到语音文本，包括：利用语音文本转化（ Speech-to-text )技术对所述语音数据进行文本转化，得到语音文本。

优选地，所述确定与所述表情信息对应的虚拟人物头像，包括：根据所述虚拟人物头像数据库存储的虚拟人物头像与虚拟人物表情信息之间的对应关系、以及所述通话对方的表情信息，所述通话对应的虚拟人物头像。

本发明实施例还提供了一种图像显示装置，包括：

获取模块，配置为获取通话对方的语音数据；

分析模块，配置为对所述语音数据进行分析得到通话对方的表情信息；处理模块，配置为确定与所述表情信息对应的虚拟人物头像，并在移动终端的通话界面上显示所述虚拟人物头像。

优选地，所述装置还包括：

数据库模块，配置为建立虚拟人物头像数据库，并在所述虚拟人物头像数据库中存储虚拟人物头像与虚拟人物表情信息之间的对应关系。

优选地，所述分析模块包括：

转化单元，配置为对所述语音数据进行文本转化得到语音文本；分析单元，配置为对所述语音文本进行分析并提取出关键词，根据所述关键词确定通话对方的表情信息，所述表情信息至少包括有通话对方的情绪和口型。

优选地，所述转化单元具体配置为利用语音文本转化技术对所述语音数据进行文本转化，得到语音文本。

优选地，所述处理模块包括：

查找单元，配置为根据虚拟人物头像与虚拟人物表情信息之间的对应关系、以及所述与通话对方的表情信息，确定所述通话对方对应的虚拟人物头像。

本发明实施例还提供一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行以上所述的显示图像的方法。

本发明实施例还提供了一种移动终端，包括如上所述的图像显示装置。本发明的实施例具有以下有益效果：

在通话过程中，通过语音文本转化和表情信息匹配，能够使通话界面上显示的虚拟人物头像，且虚拟人物的口型和情绪与通话对方的语音数据相对应，从而使移动终端用户看起来像是通话界面上显示的虚拟人物通话，克服了目前通话过程中只能显示单一的头像、不支持头像的动态显示和动画效果的缺陷，提升了用户通话过程中的体验。附图说明

图 1为本发明实施例中显示图像的方法流程示意图；

图 2为本发明实施例中图像显示装置的结构示意图；

图 3为设置通话过程中设置虚拟人物头像的示意图；

图 4为语音数据转化为语音文本的实现流程图；

图 5为语音文本与表情信息匹配的实现流程图；

图 6为虚拟人物头像数据库样式示意图；

图 7为情绪关键词数据库样式示意图；

图 8为口型关键词数据库样式示意图；

图 9为在通话界面上显示虚拟人物头像的实现流程图。具体实施方式

为使本发明的实施例要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

相关技术在通话过程中，一般都是在移动终端的通话界面上显示一个静态的头像，以标识来电人的身份，这种图像显示方式比较呆板；本发明实施例记载的技术方案，能够在移动终端通话过程中，支持移动终端的通话界面上显示动态的图像来模拟通话对方通话，提升用户通话过程中的体验。

本发明实施例记载了一种移动终端通话过程中显示图像的方法，如图 1 所示，包括以下步骤：

步骤 101 : 获取通话对方的语音数据。

所述语音数据的传输方式包括：包括基于传输控制协议 /网际协议

( TCP/IP ) 的网络传输；基于移动通信网络的传输。

步骤 102: 对所述语音数据进行分析得到通话对方的表情信息。

步骤 103: 确定与所述表情信息对应的虚拟人物头像，并在通话界面上显示所述虚拟人物头像。

作为本发明另一实施例，包括步骤 101至步骤 103的基础上，所述获取通话对方的语音数据之前，还包括：

作为本发明另一实施例，包括上述步骤 101至步骤 103的基础上，所述对所述语音数据进行分析得到通话对方的表情信息，包括：

对所述语音数据进行文本转化得到语音文本；

对所述语音文本进行分析并提取出关键词，根据所述关键词确定通话对方的表情信息，所述表情信息至少包括有通话对方的情绪和口型。例如，可以利用语音文本转化（ Speech-to-text )技术对所述语音数据进行文本转化得到语音文本。

作为本发明另一实施例，包括上述步骤 101至步骤 103的基础上，所述确定与所述表情信息对应的虚拟人物头像，包括：

根据虚拟人物头像与虚拟人物表情信息之间的对应关系，确定与通话对方的表情信息对应的虚拟人物头像。

本发明实施例在通话过程中，通过语音数据转换为文本，基于文本进行表情信息匹配，能够使通话界面上显示的虚拟人物头像，且虚拟人物的口型和情绪与通话过程中对方的语音数据相匹配，从而看起来像是通话界面上显示的虚拟人物在跟移动终端用户通话，克服了目前通话过程中只能显示单一的头像、不支持头像的动态显示和动画效果的局限，提升了用户通话过程中的体验。

本发明实施例还记载了一种图像显示装置，应用于移动终端通话过程中，如图 2所示，包括：

获取模块 21，配置为获取通话对方的语音数据；

分析模块 22，配置为对所述语音数据进行分析得到通话对方的表情信息；

处理模块 23，配置为确定与所述表情信息对应的虚拟人物头像，并在通话界面上显示所述虚拟人物头像。

其中，所述装置还包括：

ί史据库模块 24，配置为建立虚拟人物头像数据库，并在所述虚拟人物头像数据库中存储虚拟人物头像与虚拟人物表情信息之间的对应关系。

其中，所述分析模块 22包括转化单元和分析单元（图 2中未示出）：所述转化单元，配置为对所述语音数据进行文本转化得到语音文本；所述分析单元，配置为对所述语音文本进行分析并提取出关键词，根据所述关键词确定通话对方的表情信息，所述表情信息至少包括有通话对方的情绪和口型。

其中，所述转化单元还配置为利用语音文本转化技术对所述语音数据进行文本转化得到语音文本。

其中，所述处理模块 23包括：

查找单元（图 2中未示出），配置为所述虚拟人物头像数据库存储的虚拟人物头像与虚拟人物表情信息之间的对应关系、以及所述通话对方的表情信息，确定与所述通话对方的表情信息对应的虚拟人物头像。

通过本发明实施例，在通话过程中，将语音文本转化和表情信息匹配，能够使通话界面上显示的虚拟人物头像的口型和情绪，与通话过程中对方的语音内容相匹配，从而移动终端用户看起来像是通话界面上显示的虚拟人物通话，克服了目前通话过程中只能显示单一的头像、不支持头像的动态显示和动画效果的局限，提升了用户通话过程中的体验。

实际应用中，所述获取模块 21、分析模块 22、处理模块 23可由图像显示装置中的中央处理器（CPU， Central Processing Unit ) 实现；所述数据库模块 24可由图像显示装置中的非易失性存储介质和 CPU实现。

本发明实施例还记载了一种移动终端，包括如上所述的图像显示装置。本发明实施例还记载了一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行图 1 所示的显示图像的方法。

下面再对本发明实施例记载的显示图像的方法进行详细说明，在移动终端通话过程中显示图像的方法包括以下步骤：

步骤 A: 虚拟人物的格式与设置。

首先需要设置通话过程中使用的虚拟人物头像。由于虚拟人物的显示是动态的，涉及到多个头像。因此，所使用的虚拟人物头像可以放在移动终端上的某一个目录下，并用不同的后缀对文件名加以区分。例如，指定一个虚拟人物头像的位置为 /data/data/avatar/lions/，文件名可以为 OOl .png, 002.png, ...OlO.png等等， png为图像文件的格式。另外，这些虚拟人物头像表示了虚拟人物不同的情绪和口型，每一张图片代表对应的情绪和口型。在匹配虚拟人物头像的过程中，可以根据语音数据（需要转化成文本）匹配具体的虚拟人物头像。

例如，可以在用户界面上让用户输入一个虚拟人物头像名，它对应一个文件夹；或者从数据文件夹选择一个虚拟人物头像所在的文件夹。设置完成后，该虚拟人物头像信息（电话号码对应的虚拟人物头像等）将存于移动终端中，待保存到文件中以后即可生效。

图 3为通话过程中所用虚拟人物头像设置的一个示意图，如图 3所示，打开虚拟人物头像设置界面后，输入姓名：王；号码： 1234567890，然后虚拟人物头像所在的文件夹名：文件夹 1。简单起见，可以把虚拟人物头像文件夹和电话本记录文件存放在同一个目录下，这样只需要输入虚拟人物头像文件夹名即可，无需输入虚拟人物头像文件夹的路径。如果虚拟人物头像的所在文件夹和电话本记录文件不在同一个目录，则需要输入完整的路径。

步骤 B: 语音文本转化与表情信息匹配过程。

在通话过程中，移动终端会接收到通话对方持续发送的语音数据，如图 4所示，在步骤 401 中，获取通话对方的语音数据；在通话对方的语音数据传过来以后，步骤 402 中，对语音数据进行语音文本转化，转化成计算机可以理解的文本内容。转化的过程使用的是一种称为语音文本转换 ( Speech-to-text )的技术，这种技术目前比较成熟，其釆用的原理是对语音数据进行样本釆集，并与特征数据库内容进行比对，从而获得语音数据的对应文本。通过这些文本，可以解读出通话对方的语音数据中的表情信息，包括情绪和口型。解读的原理是基于文本、文本对应的语音数据的读音和语调，以及文本内容的上下文（以反映说话者的情绪等）进行分析，提取出文本中关键词，并匹配出通话对方的情绪和说话的口型等表情信息，匹配的处理流程如图 5所示，首先，在步骤 501 中解析语音文本中的关键词获得通话对方的情绪，之后在步骤 502 中解析语音文本中的关键词获得通话对方的口型，然后在步骤 503 中根据通话对方的情绪和口型确定对应的虚拟人物头像；步骤 501和步骤 502的执行顺序可以对调。

为了更加精确地实施匹配，可以预先建立图 6所示的虚拟人物头像数据库、图 7所示的情绪数据库、以及图 8所示的口型数据库；在执行图 5 所示的步骤时，使用相应的数据库进行操作；以执行图 5 所示的步骤 501 为例，利用解析语音数据后得到的语音文本与图 7所示的数据库进行匹配，如果匹配到【混蛋】【混账】等这些词，则获得愤怒的情绪信息，而匹配到【好吧】【那好吧】，则获得平和的情绪信息。通过将语音数据文本与预先建立的情绪数据库匹配，可以精确地匹配出通话对方的情绪。口型的匹配与上述匹配处理类似，由于语音文本中不同文字的口型是不一样的，因此通过将语音文本内容与口型数据库来匹配，可以获得不同文字对应的口型；基于所获取的口型和情绪信息，以及图 6所示的虚拟头像数据库，可以确定与所获得的口型和 /或情绪对应的虚拟人物头像。

步骤 C: 通话过程中虚拟人物头像显示。

如图 9所示，在确定通话对方的表情信息之后，匹配到与通话对方的表情信息相对应的虚拟人物头像，之后通过执行步骤 901，即可将对应的虚拟人物头像显示在通话界面。

对于某一种具体的虚拟人物头像，它对应的是一系列的头像，表示该虚拟人物的不同情绪和口型。如图 6 所示，每个图像表示虚拟人物的不同情绪和口型，例如，当前的虚拟人物的心情是惊讶，那么对应的虚拟人物头像就是 005.png。在获得通话对方的情绪和口型后，基于情绪和 /或口型获得对应的虚拟人物头像，并在通话界面上进行显示，整个匹配 -显示的过程不断重复执行，直到通话结束。例如，可以在通话对方说完一段话之后，对这一段话的语音数据进行转化成语音文本，匹配通话对方的情绪和口型，确定与通话对方的情绪和口型对应的虚拟人物头像，并在通话界面上进行显示；之后在通话对方再说完一段话之后，再获取新的虚拟人物头像，替换通话界面当前显示的虚拟人物头像；重复执行伤处处理直至通话结束。实际应用中，可以在每次接收到通话对方预设量（例如 2 兆）的语音数据之后，对接收的语音数据进行转化成语音文本，匹配通话对方的情绪和口型，确定与通话对方的情绪和口型对应的虚拟人物头像，并在通话界面上进行显示，之后在再次接收到通话对方预设量的语音数据之后，基于所获取的新的语音数据，获取新的虚拟人物头像，替换通话界面当前显示的虚拟人物头像；重复执行上述处理直至通话结束；

还可以在接收到预设时间长度（比如 2秒）的通话对方的语音数据之后，对接收的语音数据进行转化成语音文本，匹配通话对方的情绪和口型，确定与通话对方的情绪和口型对应的虚拟人物头像，并在通话界面上进行显示，之后在再接收到预设时间长度的通话对方的语音数据之后，基于所接收的新的语音数据，获取新的虚拟人物头像，替换通话界面当前显示的虚拟人物头像，重复上述处理直至通话结束

本发明实施例在通话过程中，通过语音文本转化和表情信息匹配，能够使通话界面上显示的虚拟人物头像，且虚拟人物的口型和情绪与通话过程中对方的说话内容相匹配，从而使移动终端用户看起来像是与通话界面上显示的虚拟人物通话，克服了目前通话过程中只能显示单一的头像、不支持头像的动态显示和动画效果的局限，提升了用户通话过程中的体验。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可釆用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可釆用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质 (包括但不限于磁盘存储器和光学存储器等 )上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备（系统）、和计算机程序产品的流程图和 /或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和 /或方框、以及流程图和 /或方框图中的流程和 /或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得在流程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅是本发明实施例的实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明实施例原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本发明实施例的保护范围。

Claims

权利要求书

1. 一种显示图像的方法，包括：

获取通话对方的语音数据；

对所述语音数据进行分析得到通话对方的表情信息；

2. 根据权利要求 1所述的显示图像的方法，其中，所述获取通话对方的语音数据之前，所述方法还包括：

3. 根据权利要求 2所述的显示图像的方法，其中，所述对所述语音数据进行分析得到通话对方的表情信息，包括：

对所述语音数据进行文本转化得到语音文本；

4. 根据权利要求 3所述的显示图像的方法，其中，所述对所述语音数据进行文本转化得到语音文本，包括：

利用语音文本转化 Speech-to-text技术对所述语音数据进行文本转化得到语音文本。

5. 根据权利要求 3所述的显示图像的方法，其中，所述确定与所述表情信息对应的虚拟人物头像，包括：

根据所述虚拟人物头像数据库存储的虚拟人物头像与虚拟人物表情信息之间的对应关系、以及所述通话对方的表情信息，确定与所述通话对方的表情信息对应的虚拟人物头像。

6. 一种图像显示装置，包括：获取模块，配置为获取通话对方的语音数据；

7. 根据权利要求 6所述的图像显示装置，其中，所述装置还包括：数据库模块，配置为建立虚拟人物头像数据库，并在所述虚拟人物头像数据库中存储虚拟人物头像与虚拟人物表情信息之间的对应关系。

8. 根据权利要求 7所述的图像显示装置，其中，所述分析模块包括：转化单元，配置为对所述语音数据进行文本转化得到语音文本；分析单元，配置为对所述语音文本进行分析并提取出关键词，根据所述关键词确定通话对方的表情信息，所述表情信息至少包括有通话对方的情绪和口型。

9. 根据权利要求 8所述的图像显示装置，其中，所述转化单元还配置为利用语音文本转化 Speech-to-text技术对所述语音数据进行文本转化得到语音文本。

10. 根据权利要求 8所述的图像显示装置，其中，所述处理模块包括：查找单元，配置为根据所述虚拟人物头像数据库存储的虚拟人物头像与虚拟人物表情信息之间的对应关系、以及所述通话对方的表情信息，确定所述通话对方对应的虚拟人物头像。

11. 一种移动终端，包括如权利要求 6至 10中任一项所述的图像显示装置。

12. 一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求 1至 5 中任一项所述的显示图像的方法。