WO2023087888A1

WO2023087888A1 - 表情包显示、关联声音获取方法、装置、设备及存储介质

Info

Publication number: WO2023087888A1
Application number: PCT/CN2022/119778
Authority: WO
Inventors: 陈晓丹
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2021-11-17
Filing date: 2022-09-20
Publication date: 2023-05-25
Also published as: CN116137617B; US20230300095A1; CN116137617A

Abstract

一种表情包显示、关联声音获取方法、装置、设备及存储介质，属于计算机和互联网技术领域。该方法包括：显示聊天会话界面(301)；响应于针对聊天会话界面的表情包选择操作，显示表情包选择界面(302)；响应于针对第一表情包的发送操作，在聊天会话界面中显示第一表情包对应的有声表情消息，第一表情包的关联声音信息是从声音信息数据库中匹配得到的与第一表情包相关联的声音信息(303)。本申请通过支持显示表情包对应的有声音表情，使得表情包的交流方式更加多样，为用户提供更好的聊天氛围，另外，由于无需录音操作即可获取关联声音信息，降低有声表情消息的生成成本，在表情包数量多的情况下，能够有效提高有声表情消息的生成效率。

Description

表情包显示、关联声音获取方法、装置、设备及存储介质

本申请要求于2021年11月17日提交的申请号为202111362112.8、发明名称为“表情包显示、关联声音获取方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机和互联网技术领域，特别涉及一种表情包显示、关联声音获取方法、装置、设备及存储介质。

背景技术

目前，在社交平台中，用户可以通过表情包进行相互交流。

在相关技术中，用户在与其他用户进行交流时，可以选择具体的表情包进行发送，在发送之后，聊天会话界面中显示用户所发送的表情包。

然而，在上述相关技术中，基于表情包的交流方式单一。

发明内容

本申请实施例提供了一种表情包显示、关联声音获取方法、装置、设备及存储介质，能够支持显示表情包对应的有声音消息，使得基于表情包的交流方式不局限于图像的交流，表情包的交流方式更加多样，从而为用户提供更好的聊天氛围。所述技术方案如下：

根据本申请实施例的一个方面，提供了一种表情包显示方法，所述方法由终端设备执行，所述方法包括：

在用户界面中显示虚拟模型，以及以第一显示样式显示所述虚拟模型的关联信息；

响应于针对所述虚拟模型的旋转操作，控制所述虚拟模型和所述关联信息进行同轴旋转；其中，在旋转过程中，所述虚拟模型和所述关联信息的相对位置保持不变，且所述关联信息的显示样式从所述第一显示样式逐渐变为第二显示样式；

在所述关联信息的显示样式变为所述第二显示样式的情况下，控制所述关联信息从所述第二显示样式切换为所述第一显示样式进行显示。

根据本申请实施例的一个方面，提供了一种表情包的关联声音获取方法，所述方法由计算机设备执行，所述方法包括：

获取第一表情包的特征信息；

根据所述特征信息，从声音信息数据库中匹配得到与所述第一表情包相关联的第一声音信息；

基于所述第一声音信息，生成所述第一表情包的关联声音信息；其中，所述第一表情包的关联声音信息用于生成所述第一表情包对应的有声表情消息。

根据本申请实施例的一个方面，提供了一种表情包显示装置，所述装置包括：

界面显示模块，用于显示聊天会话界面，所述聊天会话界面用于展示至少两个用户之间的聊天消息；

表情显示模块，用于响应于针对所述聊天会话界面的表情包选择操作，显示表情包选择界面，所述表情包选择界面中显示有至少一个表情包；

消息显示模块，用于响应于针对所述至少一个表情包中的第一表情包的发送操作，在所述聊天会话界面中显示所述第一表情包对应的有声表情消息；其中，所述第一表情包对应的有声表情消息用于展示所述第一表情包以及所述第一表情包的关联声音信息，所述第一表情包的关联声音信息是从声音信息数据库中匹配得到的与所述第一表情包相关联的声音信息。

根据本申请实施例的一个方面，提供了一种表情包的关联声音获取装置，所述装置包括：

特征获取模块，用于获取第一表情包的特征信息；

声音匹配模块，用于根据所述特征信息，从声音信息数据库中匹配得到与所述第一表情包相关联的第一声音信息；

声音生成模块，用于基于所述第一声音信息，生成所述第一表情包的关联声音信息；其中，所述第一表情包的关联声音信息用于生成所述第一表情包对应的有声表情消息。

根据本申请实施例的一个方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有计算机程序，所述计算机程序由所述处理器加载并执行以实现上述表情包显示方法，或实现上述表情包的关联声音获取方法。

示例性地，所述计算机设备包括终端设备或服务器。

根据本申请实施例的一个方面，提供了一种计算机可读存储介质，所述可读存储介质中存储有计算机程序，所述计算机程序由所述处理器加载并执行以实现上述表情包显示方法，或实现上述表情包的关联声音获取方法。

根据本申请实施例的一个方面，提供了计算机程序产品，所述计算机程序产品包括计算机程序，所述计算机程序存储在计算机可读存储介质中，处理器从所述计算机可读存储介质读取并执行所述计算机程序，以实现上述表情包显示方法，或实现上述表情包的关联声音获取方法。

本申请实施例提供的技术方案可以带来如下有益效果：

通过第一表情包对应的有声表情消息展示第一表情包以及第一表情包的关联声音信息，即用户在发送第一表情包时，能够同时通过第一表情包和第一表情包的关联声音信息进行交流，使得基于表情包的交流方式不局限于图像的交流，表情包的交流方式更加多样，从而为用户提供更好的聊天氛围；而且，第一表情包的关联声音信息是从声音信息数据库中匹配得到的与第一表情包相关联的声音信息，即不需要提前或实时对第一表情包进行录音操作，通过与已有的声音信息匹配即可生成第一表情包对应的有声表情消息，降低了关联声音信息的获取开销和时间成本，从而降低了有声表情消息的生成开销和时间成本；声音信息数据库中的声音信息也适用于多个表情包，不需要对每个表情包一一进行录音操作即可获取多个表情包分别对应的有声表情消息，在表情包数量多的情况下，能够有效提高有声表情消息的生成效率。

附图说明

图1是本申请一个实施例提供的表情包显示系统的示意图；

图2示例性示出了一种表情包显示系统的示意图；

图3是本申请一个实施例提供的表情包显示方法的流程图；

图4至图5示例性示出了聊天会话界面的示意图；

图6是本申请另一个实施例提供的表情包显示方法的流程图；

图7示例性示出了一种表情包选择界面的示意图；

图8示例性示出了另一种聊天会话界面的示意图；

图9是本申请一个实施例提供的表情包的关联声音获取方法的流程图；

图10示例性示出了一种功能设置界面的示意图；

图11示例性示出了一种表情包显示方式的流程的示意图；

图12是本申请一个实施例提供的表情包显示装置的框图；

图13是本申请另一个实施例提供的表情包显示装置的框图；

图14是本申请一个实施例提供的表情包的关联声音获取装置的框图；

图15是本申请另一个实施例提供的表情包的关联声音获取装置的框图；

图16是本申请一个实施例提供的终端设备的结构框图；

图17是本申请一个实施例提供的服务器的结构框图。

具体实施方式

请参考图1，其示出了本申请一个实施例提供的表情包显示系统的示意图。该表情包显示系统可以包括：终端10和服务器20。

终端10可以是诸如手机、平板电脑、游戏主机、电子书阅读器、多媒体播放设备、可穿戴设备、车载终端、PC(Personal Computer，个人计算机)等电子设备。终端10中可以安装应用程序的客户端。其中，该应用程序是指具有表情包显示功能的任意应用程序，如社交应用程序、购物应用程序、游戏应用程序等。可选地，该应用程序可以是需要下载安装的应用程序，也可以是即点即用的应用程序，本申请实施例对此不作限定。其中，上述表情包可以为静态图像，也可以为动态图像，本申请实施例对此不作限定。在本申请实施例中，终端设备也可以被称之为终端。

服务器20用于为终端10中的应用程序的客户端提供后台服务。例如，服务器20可以是上述应用程序的后台服务器。服务器20可以是一台服务器，也可以是由多台服务器组成的服务器集群，或者是一个云计算服务中心。可选地，服务器20同时为多个终端10中的应用程序提供后台服务。

终端10和服务器20之间可通过网络进行互相通信。

可选地，服务器20为终端10提供数据存储、数据处理和数据传输功能中的至少一种功能。

示例性地，如图2所示，服务器20中包括具有用于存储声音信息的数据库(即声音信息数据库)的服务器21、用于为表情包生成关联声音信息的服务器22，以及用于为多个终端10提供数据传输的服务器23。以第一终端11和第二终端12为例，在第一终端11与第二终端12之间的聊天会话过程中，在第一终端11的使用者将第一表情包的发生方式切换至第一发送方式时，由第一终端11向服务器22发送关联声音信息获取指令；服务器22在接收到该关联信息获取指令之后，从服务器21的声音信息数据库中的各个声音信息中，为第一表情包匹配相关联的第一声音信息，并根据该第一声音信息生成第一表情包的关联声音信息，以及向第一终端11发送该关联声音信息；之后，在第一终端11的使用者向第二终端12的使用者发送第一表情包时，由第一终端11将待发送的消息发送至服务器23，进而服务器23向第二终端12转发该待发送的消息。其中，该待发送的消息为用于展示第一表情包以及第一表情包的关联声音信息的消息。

可选地，上述服务器21、服务器22和服务器23可以是相同的服务器，也可以是不同的服务器，本申请实施例对此不作限定。

请参考图3，其示出了本申请一个实施例提供的表情包显示方法的流程图。该方法可应用于图1所示表情包显示系统的终端10中，如各步骤的执行主体可以是终端10中安装的应用程序的客户端。该方法可以包括以下几个步骤(301～303)中的至少一个步骤：

步骤301，显示聊天会话界面。

聊天会话界面用于展示至少两个用户之间的聊天消息。其中，该聊天消息包括但不限于以下至少一项：文字消息、图像消息、声音消息、视频消息等。可选地，不同的应用程序对应有不同的聊天会话界面。

在本申请实施例中，在用户发送消息时，客户端在聊天会话界面中显示用户所发送的消息。可选地，若该聊天会话界面包括已发送的聊天消息，则聊天会话界面中显示有该已发送的聊天消息的发送方帐号的标识信息。其中，该标识信息可以包括以下至少一项：帐号名称、帐号头像和帐号等级。

可选地，该聊天会话界面在显示用户之间的实时聊天消息时，也可以显示用户之间的历史聊天消息。

在一种可能的实施方式中，为了提高聊天消息显示效果的完整性，聊天会话界面包括上述历史聊天消息。可选地，客户端在显示上述聊天会话界面时，获取上述用户之间的历史聊天消息，并将该历史聊天消息显示在聊天会话界面中。其中，该历史聊天消息可以为实时获取的历史消息，也可以为预先存储在客户端的历史消息。

在另一种可能的实施方式中，为了提高聊天会话界面的简洁性，聊天会话界面不包括上述历史聊天消息。可选地，客户端在显示上述聊天会话界面时，不需要获取上述用户之间的历史聊天消息，直接显示聊天会话界面即可。

步骤302，响应于针对聊天会话界面的表情包选择操作，显示表情包选择界面。

在本申请实施例中，客户端在显示上述聊天会话界面之后，对该聊天会话界面进行检测，在检测到针对聊天会话界面的表情包选择操作的情况下，显示表情包选择界面。其中，上述表情包选择界面是指显示表情包以供用户进行选择的界面。可选地，该表情包选择界面中显示有至少一个表情包。本申请中的表情包除了上文中提到的静态图像和动态图像两种形式的表情包之外，还可以有其它形式的表情包，如视频表情包、动画表情包、视频动画表情包等。

可选地，客户端在显示上述表情包选择界面时，若表情包选择界面与聊天会话界面中存在相同的显示元素，则在保持该相同的显示元素不变的基础上，取消显示聊天会话界面的显示元素，并显示表情包选择界面的显示元素；若表情包选择界面与聊天会话界面中不存在相同的显示元素，则直接取消显示聊天会话界面的显示元素，并显示表情包选择界面的显示元素。如此可以避免聊天会话界面对表情包的显示以及选择的影响，从而提高了表情包的显示效果，以及表情包的选择直观性。

上述表情包选择操作即为用于召唤表情包选择界面的操作。

在一种可能的实施方式中，上述聊天会话界面中包括表情包选择控件，表情包选择操作为针对该表情包选择控件的触发操作，用户通过针对该表情包选择控件进行触发操作，以使得客户端显示表情包选择界面。其中，上述操作可以点击操作、长按操作、滑动操作等，本申请实施例对此不作限定。可选地，上述聊天会话界面中还可以包括其它操作控件，如聊天消息发送控件、历史消息查找控件、聊天消息分享控件等。

在另一种可能的实施方式中，为了提高聊天会话界面的简洁性，表情包选择操作为针对聊天会话界面的特定操作，即聊天会话界面中不需要显示表情包选择控件，用户通过在聊天会话界面中执行特定操作，以使得客户端显示表情包选择界面。其中，上述特定操作可以为特定次数的点击操作、特定时长的长按操作、特定轨迹的滑动操作、特定键位的按压操作等，本申请实施例对此不作限定。可选地，用户也可以通过针对聊天会话界面的其它特定操作，以执行其它操作，如聊天消息发送操作、历史消息查找操作、聊天消息分享操作等。

步骤303，响应于针对至少一个表情包中的第一表情包的发送操作，在聊天会话界面中显示第一表情包对应的有声表情消息。

可选地，上述表情包选择界面中包括表情包的选择项，不同的表情包对应有不同的选择项。其中，该选择项可以是表情包本身，也可以是表情包的缩略图、封面图、名称等，本申请实施例对此不作限定。可选地，用户通过针对该选择项的不同操作，触发生成针对表情包的不同操作。示例性地，通过点击选择项，以触发针对该选择项所对应的表情包的发送操作；通过长按选择项，以触发针对该选择项所对应的表情包的选择操作；通过拖拽选择项，以触发针对该选择项所对应的表情包的位置移动操作。

在本申请实施例中，客户端在显示上述表情包选择界面之后，对该表情包选择界面进行检测，在检测到针对至少一个表情包中的第一表情包的发送操作的情况下，在聊天会话界面中显示第一表情包对应的有声表情消息。

可选地，上述第一表情包可以为上述至少一个表情包中的任一表情包。在本申请实施例中，该第一表情包对应的有声表情消息用于展示上述第一表情包以及该第一表情包的关联声音信息，该第一表情包的关联声音信息是从声音信息数据库中匹配得到的与上述第一表情包相关联的声音信息，声音信息数据库预先存储有多个声音信息。

在一种可能的实施方式中，上述有声表情消息包括第一表情包，以及用于播放第一表情包的关联声音信息的声音播放控件。可选地，客户端在检测到针对上述第一表情包的发送操作时，向接收方帐号发送第一表情包和第一表情包的关联声音信息，并在聊天会话界面中显示该第一表情包和该第一表情包对应的声音播放控件。示例性地，如图4所示，在第一表情包对应的有声表情消息发送之后，在聊天会话界面40中显示第一表情包41和声音播放控件42。通过提供声音播放控件，使得用户能够根据需求进行关联声音信息的播放或不播放，从而提高了用户体验。

在另一种可能的实施方式中，上述有声表情消息包括第一表情包的有声视频。可选地，客户端在检测到针对上述第一表情包的发送操作时，根据该第一表情包，以及该第一表情包的关联声音信息，生成第一表情包的有声视频，向接收方帐号发送该有声视频，并在聊天会话界面中显示该第一表情包的有声视频。可选地，上述有声表情消息中还包括用于播放该有声视频的视频播放控件。示例性地，如图5所示，在第一表情包对应的有声表情消息发送之后，在聊天会话界面50中显示第一表情包的有声视频51和视频播放控件52。如此使得表情包不局限于图像的显示形式，从而丰富了表情包的显示多样性，进一步提高了用户体验。

可选地，上述有声表情消息还包括字幕信息。在一种可能的实施方式中，该字幕信息为第一表情包中的文字信息。其中，该文字信息可以是第一表情包制作者设置在第一表情包中的文字，也可以是有声表情消息的发送方帐号所输入的文本，本申请实施例对此不作限定。在另一种可能的实施方式中，该字幕信息为第一表情包的标记，基于该标记能够获取第一表情包的特征信息。其中，该标记可以是第一表情包制作者所设置的，也可以是有声表情消息的发送方帐号所输入的，本申请实施例对此不作限定。需要说明的一点是，上述标记也可以称为标识、描述、定义等。

可选地，客户端在发送上述有声表情消息时，可以直接将上述第一表情包和上述关联声音信息发送至对应的设备；或者，客户端也可以将上述第一表情包和上述关联声音信息的标识信息发送至对应的设备，进而由该设备根据关联声音信息的标识信息获取关联声音信息，并生成上述有声表情消息。其中，上述设备可以是接收方帐号所在的终端，也可以是消息中转服务器，本申请实施例对此不作限定。

综上所述，本申请实施例提供的技术方案中，通过第一表情包对应的有声表情消息展示第一表情包以及第一表情包的关联声音信息，即用户在发送第一表情包时，能够同时通过第一表情包和第一表情包的关联声音信息进行交流，使得基于表情包的交流方式不局限于图像的交流，表情包的交流方式更加多样，从而为用户提供更好的聊天氛围；而且，第一表情包的关联声音信息是从声音信息数据库中匹配得到的与第一表情包相关联的声音信息，即不需要提前或实时对第一表情包进行录音操作，通过与已有的声音信息匹配即可生成第一表情包对应的有声表情消息，降低了关联声音信息的获取开销和时间成本，从而降低了有声表情消息的生成开销和时间成本；声音信息数据库中的声音信息也适用于多个表情包，不需要对每个表情包一一进行录音操作即可获取多个表情包分别对应的有声表情消息，在表情包数量多的情况下，能够有效提高有声表情消息的生成效率。

请参考图6，其示出了本申请另一个实施例提供的表情包显示方法的流程图。该方法可应用于图1所示表情包显示系统的终端10中，如各步骤的执行主体可以是终端10中安装的应用程序的客户端。该方法可以包括以下几个步骤(601～608)中的至少一个步骤：

步骤601，显示聊天会话界面。

步骤602，响应于针对聊天会话界面的表情包选择操作，显示表情包选择界面。

上述步骤601和602与图3实施例中的步骤301和302相同，具体参见图3实施例，在此不作赘述。

步骤603，响应于针对第一表情包的选择操作，显示第一表情包的发送方式切换控件。

在本申请实施例中，客户端在显示上述表情包选择界面之后，对该表情包选择界面进行检测，在检测到针对第一表情包的选择操作的情况下，显示第一表情包的发送方式切换控件。可选地，表情包选择界面中包括表情包的选择项，不同的表情包对应有不同的选择项，用户通过该第一表情包的选择项来触发生成针对第一表情包的选择操作。

上述发送方式切换控件用于控制第一表情包的发送方式的切换。在本申请实施例中，客户端在显示发送方式切换控件之后，对该发送方式切换控件进行检测，在接收到针对发送方式切换控件的操作的情况下，对第一表情包的发送方式进行切换。可选地，若第一表情包的发送方式为第二发送方式，则客户端在接收到针对发送方式切换控件的操作后，控制该发送方式由第二发送方式切换至第一发送方式；若第一表情包的发送方式为第一发送方式，则客户端在接收到针对发送方式切换控件的操作后，控制发送方式由第一发送方式切换至所第二发送方式。其中，上述第一发送方式是指以有声表情消息的形式发送该第一表情包，上述第二发送方式是指以第一表情包的形式发送该第一表情包。

示例性地，如图7所示，在表情包选择界面70中包括多个表情包的选择项，用户通过长按第一表情包的选择项71触发生成针对第一表情包的选择操作，进而表情包选择界面70中显示第一表情包的发送方式切换控件72，进一步地，用户可以通过该发送方式切换控件72对第一表情包的发送方式进行切换。

本申请实施例通过提供发送方式切换控件，使得用户能够根据需求灵活设置第一表情包的发送方式，从而提高了表情包的发送灵活性。

步骤604，响应于针对第一表情包的发送操作，获取第一表情包的发送方式。

在本申请实施例中，客户端在显示上述表情包选择界面之后，对该表情包选择界面进行检测，在检测到针对第一表情包的发送操作，获取第一表情包的发送方式。可选地，用户通过该第一表情包的选择项来触发生成针对第一表情包的发送操作。

步骤605，根据第一表情包的发送方式，向聊天会话界面中的接收方帐号发送第一表情包。

在本申请实施例中，客户端在获取上述发送方式之后，根据该发送方式，向聊天会话界面中的接收方帐号发送第一表情包。

可选地，若上述发送方式为第一发送方式，则客户端向聊天会话界面中的接收方帐号发送第一表情包对应的有声表情消息，以及在该聊天会话界面中显示第一表情包对应的有声表情消息；若上述发送方式为第二发送方式，则客户端仅仅向聊天会话界面中的接收方帐号发送第一表情包，以及在该聊天会话界面中显示该第一表情包。客户端通过支持以第一发送方式或第二发送方式发送表情包，进一步提高了表情包的发送灵活性。

可选地，在上述发送方式为第一发送方式的情况下，若第一表情包未匹配到关联声音信息，则客户端向聊天会话界面中的接收方帐号发送第一表情包对应的无声表情消息，以及在该聊天会话界面中显示第一表情包对应的无声表情消息。其中，该无声表情消息包括第一表情包，以及声音匹配失败标识。示例性地，如图8所示，在第一表情包81未匹配到关联声音信息的情况下，在聊天会话界面82中显示第一表情包81和声音匹配失败标识83。

可选地，在聊天会话界面显示上述有声表情消息之后，用户可以根据实际情况控制关联声音信息的播放、暂停或更换。

步骤606，响应于针对有声表情消息的声音播放操作，播放第一表情包的关联声音信息。

在本申请实施例中，客户端在显示上述有声表情消息之后，对该有声表情消息进行检测，在检测到针对有声表情消息的声音播放操作，播放第一表情包的关联声音信息。其中，该声音播放操作可以是针对第一特定控件的操作，也可以是针对有声表情消息的第一特定操作，本申请实施例对此不作限定。示例性地，用户通过点击图4中的声音播放控件42来触发生成声音播放操作，以播放第一表情包的关联声音信息；或者，用户通过点击图5中的视频播放控件52来触发生成声音播放操作，播放第一表情包的关联声音信息。

在一个示例中，若第一表情包为多帧图像组成的视频动画，则客户端在检测到针对有声表情消息的声音播放操作后，在播放关联声音信息的同时播放第一表情包的视频动画。

步骤607，响应于针对有声表情消息的静音操作，停止播放第一表情包的关联声音信息。

在本申请实施例中，客户端在显示上述有声表情消息之后，对该有声表情消息进行检测，在检测到针对有声表情消息的静音操作，停止播放第一表情包的关联声音信息。其中，该静音操作可以是针对第二特定控件的操作，也可以是针对有声表情消息的第二特定操作，本申请实施例对此不作限定。

可选地，上述第一特定控件和上述第二特定控件可以是相同的操作控件，也可以是不同的操作控件，本申请实施例对此不作限定。可选地，若上述第一特定控件和上述第二特定控件为相同的操作控件，则上述声音播放操作和上述静音操作为针对同一操作控件的不同操作。示例性地，用户通过双击图4中的声音播放控件42来触发生成静音操作，以停止播放第一表情包的关联声音信息；而且，在用户触发生成静音操作之后，声音播放控件42的显示样式发生变化。

在一个示例中，若第一表情包为多帧图像组成的视频动画，则客户端在检测到针对有声表情消息的静音操作后，停止播放关联声音信息，但依旧播放第一表情包的视频动画。

步骤608，响应于针对有声表情消息的声音更换操作，更改第一表情包的关联声音信息。

在本申请实施例中，客户端在显示上述有声表情消息之后，对该有声表情消息进行检测，在检测到针对有声表情消息的声音更换操作，更改第一表情包的关联声音信息。其中，该声音更换操作可以是针对第三特定控件的操作，也可以是针对有声表情消息的第三特定操作，本申请实施例对此不作限定。示例性地，如图4所示，在聊天会话界面40中显示有声音更换控件43，用户通过点击该声音更换控件43，以更改第一表情包的关联声音信息。

可选地，上述第一特定控件、上述第二特定控件、上述第三特定控件可以是相同的操作控件，也可以是不同的操作控件，本申请实施例对此不作限定。可选地，若上述第一特定控件、上述第二特定控件和上述第三特定控件为相同的操作控件，则上述声音播放操作、上述静音操作和上述声音更换操作为针对同一操作控件的不同操作。

可选地，在更改第一表情包的关联声音信息时，客户端可以自动对该关联声音信息进行更改，也可以基于用户的选择对该关联声音信息进行更改。

在一种可能的实施方式中，客户端自动对关联声音信息进行更改。可选地，客户端在检测到上述声音更换操作之后，从至少一个候选声音信息中，选择满足第一条件的候选声音信息生成上述第一表情包的替换声音信息，并采用该第一表情包的替换声音信息，替换第一表情包的关联声音信息。其中，上述候选声音信息是根据第一表情包的特征信息，以及声音信息数据库中各个声音信息分别对应的标签匹配得到的；上述第一条件为针对候选声音信息的选择条件，示例性地，该第一条件为与第一表情包的特征信息的匹配度最高的候选声音信息。当然，在示例性实施例中，也可以随机从至少一个候选声音信息中，为第一表情包选择替换声音信息。

在另一种可能的实施方式中，客户端基于用户的选择对该关联声音信息进行更改。可选地，客户端在检测到上述声音更换操作之后，显示至少一个候选声音信息，并对各个候选声音信息进行检测，在检测到针对该至少一个候选声音信息中的目标声音信息的选择操作的情况下，根据该目标声音信息生成第一表情包的替换声音信息，并采用第一表情包的替换声音信息，替换第一表情包的关联声音信息。

需要说明的一点是，上述候选声音信息中不包括第一表情包的关联声音信息和历史关联声音信息。其中，该历史关联声音信息是指曾经为第一表情包的关联声音信息的声音信息。

还需要说明的一点是，在第一表情包的关联声音信息发生变化之后，需要将变化后的关联声音信息或者变化后的关联声音信息的标识信息同步至上述接收方帐号。

综上所述，本申请实施例提供的技术方案中，在第一表情包的发送方式为第一发送方式的情况下，才会在发送第一表情包时，向聊天会话界面中的接收方帐号发送第一表情包对应的有声表情消息，且该发送方式能够通过发送方式切换控件进行灵活切换，用户可以根据实际情况灵活设置第一表情包的发送方式，使得第一表清包的交流方式能够满足不同用户的需求。

另外，通过声音更换操作能够对第一表情包的关联声音信息进行更改，在获取第一表情包的关联声音信息时参考用户的意见对关联声音信息进行灵活更改，提高所获取的关联声音信息的准确性。

另外，由用户从候选声音信息中自行选择第一表情包的关联声音信息，提高关联声音信息的准确性，增强关联声音信息与第一表情包之间的联系，使得有声表情消息能够更好地表达用户的意愿。

请参考图9，其示出了本申请一个实施例提供的表情包的关联声音获取方法的流程图。该方法可应用于图1所示表情包显示系统的终端10，也可应用于图1所示表情包显示系统的服务器20中，还可以由终端10和服务器20交互实现，本申请实施例对此不作限定(以下将表情包的关联声音获取方法的执行主体统一称为“服务器”)。该方法可以包括以下几个步骤(901～903)中的至少一个步骤：

步骤901，获取第一表情包的特征信息。

第一表情包是指待匹配声音信息的表情包，其可以是应用程序所提供的多个表情包中的任一表情包。在本申请实施例中，服务器在为第一表情包匹配声音信息之前，获取第一表情包的特征信息。

可选地，上述特征信息可以是实时生成，也可以是预先生成的，本申请实施例对此不作限定。

在一种可能的实施方式中，上述特征信息为实时生成。可选地，服务器在确定对上述第一表情包进行声音信息的匹配时，实时生成该第一表情包的特征信息。

在另一种可能的实施方式中，上述特征信息为预先生成的。可选地，服务器在获取上述第一表情包之后，即生成该第一表情包的特征信息，并对该特征信息进行存储，进而在确定对上述第一表情包进行声音信息的匹配时，直接从特征信息的存储位置获取该特征信息。

可选地，上述特征信息包括但不限于以下至少一项：文字特征信息、场景特征信息、情绪特征信息等。其中，文字特征信息用于指示第一表情包所包含的文字；场景特征信息用于指示第一表情包的可能使用场景，如晚安表情包的场景特征信息可以为：夜晚睡觉前；情绪特征信息用于指示使用第一表情包时用户可能带有的情绪，例如，若表情包中包括“好难啊”字样，则情绪特征信息可以为：焦虑、难过。

在一种可能的实施方式中，特征信息包括上述文字特征信息。可选地，服务器在获取第一表情包的特征信息时，对第一表情包中的文字信息进行文字提取，得到第一表情包的文字特征信息。可选地，第一表情包中的文字信息包括以下至少一项：第一表情包中的文字、针对第一表情包的输入文本。其中，第一表情包中的文字是指预先存在于第一表情包中的文字，针对第一表情包的输入文本是指用于针对该第一表情包所输入的文字。可选地，在存在上述输入文本的情况下，可以忽略第一表情包中的文字。

在另一种可能的实施方式中，特征信息包括上述景特征信息。可选地，服务器在获取第一表情包的特征信息时，对第一表情包、第一表情包的关联聊天消息、第一表情包的关联聊天场景进行特征提取，得到第一表情包的场景特征信息。其中，第一表情包的关联聊天消息是指发送时刻与当前时刻之间的时间差小于阈值的历史聊天消息，第一表情包的关联聊天场景用于指示当前聊天时间和至少一个当前聊天帐号。可选地，上述关联聊天消息的数量可以预先进行设定，也可以不进行设定，本申请实施例对此不作限定；上述当前聊天帐号可以理解为上述接收方帐号。

在再一种可能的实施方式中，特征信息包括上述情绪特征信息。可选地，服务器在获取第一表情包的特征信息时，对第一表情包、第一表情包的关联聊天消息进行特征提取，得到第一表情包的情绪特征信息。

需要说明的一点是，上述第一表情包可以是任意表情包，也可以是满足特定要求的表情包。示例性地，为了提高特征信息获取的准确性，上述特定要求可以为：能够提取出文字的表情包。

本申请实施例通过将表情包的特征信息设置为包括但不限于以下至少一项：文字特征信息、场景特征信息和情绪特征信息，如此可以通过特征信息更准确地表征出表情包，从而有利于提高第一声音信息的匹配准确性。

步骤902，根据特征信息，从声音信息数据库中匹配得到与第一表情包相关联的第一声音信息。

在本申请实施例中，服务器在获取上述特征信息之后，根据该特征信息，从声音信息数据库中匹配得到与第一表情包相关的第一声音信息。其中，该声音信息数据库预先存储有多个声音信息。

在一种可能的实施方式中，上述声音信息数据库中存储的多个声音信息为来自第一表情包的发送方帐号的历史声音信息。

在另一种可能的实施方式中，上述声音信息数据库中存储的多个声音信息为来自不同帐号的历史声音信息。

需要说明的一点是，上述历史声音信息可以是在聊天会话过程中生成的，也可以是在录音场景中产生的，本申请实施例对此不作限定。

步骤903，基于第一声音信息，生成第一表情包的关联声音信息。

在本申请实施例中，服务器在获取上述第一声音信息之后，基于该第一声音信息，生成第一表情包的关联声音信息。其中，该第一表情包的关联声音信息用于生成上述第一表情包对应的有声表情消息。

可选地，服务器可以直接将第一声音信息作为关联声音信息，也可以对第一声音信息进行剪辑以获取关联声音信息。

在一种可能的实施方式中，服务器直接将第一声音信息作为关联声音信息。可选地，服务器在获取上述第一声音信息之后，获取第一表情包所包含的文字信息，并对该第一声音信息所包含的文字信息与第一表情包所包含的文字信息进行比较。在第一表情包所包含的文字信息即为第一声音信息所包含的全部文字信息的情况下，直接将该第一声音信息作为上述关联声音信息。

在另一种可能的实施方式中，服务器对第一声音信息进行剪辑以获取关联声音信息。可选地，服务器在获取上述第一声音信息之后，获取第一表情包所包含的文字信息，并对该第一声音信息所包含的文字信息与第一表情包所包含的文字信息进行比较。在第一表情包所包含的文字信息为第一声音信息所包含的部分文字信息的情况下，根据第一表情包所包含的文字信息，从第一声音信息中截取包含第一表情包所包含的文字信息的声音片段，并基于该声音片段，生成上述第一表情包的关联声音信息。通过文字信息进行声音片段的获取，可以提高声音片段与表情包之间匹配程度，进而提高声音片段获取的准确性和合理性。

可选地，服务器在获取上述声音片段之后，可以直接将声音片段作为关联声音信息，也可以对声音片段进行剪辑以获取关联声音信息。

在一种可能的实施方式中，服务器直接将声音片段作为关联声音信息。可选地，服务器在获取上述声音片段之后，若第一表情包为单帧图像，则直接将声音片段作为上述关联声音信息。

在另一种可能的实施方式中，服务器对声音片段进行剪辑以获取关联声音信息。可选地，服务器在获取上述声音片段之后，若第一表情包为视频动画，则基于第一表情包的播放时长，对声音片段的播放时长进行调整，得到第一表情包的关联声音信息。其中，第一表情包的关联声音信息的播放时长与第一表情包的播放时长相同。可选地，服务器通过对声音播放频率的调整来调整声音片段的播放时长。在表情包为视频动画的情况下，确保表情包的关联声音信息的播放时长与表情包的播放时长相同，使得关联声音信息与表情包更契合，从而有利于表情包的显示效果的提升。

综上所述，本申请实施例提供的技术方案中，通过第一表情包的特征信息匹配获取与第一表情包相关联的第一声音信息，提高第一声音信息与第一表情包之间的匹配度，使得后续基于第一声音信息生成的关联声音信息的准确度高；而且，通过声音信息数据库中已有的声音信息即可生成第一表情包的关联声音信息，不需要特地为第一声音信息进行配音录制，且声音信息数据库中的声音信息也适用于多个表情包，在获取多个表情包分别对应的关联声音信息时，不需要对每个表情包一一进行配音录制，提高关联声音信息的生成效率，降低关联声音信息的生成开销和时间成本。

下面，对第一声音信息的获取方式进行介绍。

在示例性实施例中，上述步骤902包括以下几个步骤：

1、获取声音信息数据库中各个声音信息分别对应的标签。

在本申请实施例中，服务器在为第一表情包匹配第一声音信息时，获取声音信息数据库中各个声音信息分别对应的标签。

可选地，上述标签可以是实时生成，也可以是预先生成的，本申请实施例对此不作限定。

在一种可能的实施方式中，上述标签为实时生成。可选地，服务器在确定对上述第一表情包进行声音信息的匹配时，获取声音信息数据库中的各个声音信息，并生成各个声音信息分别对应的标签。

在另一种可能的实施方式中，上述标签为预先生成的。可选地，服务器在获取声音信息之后，即生成该声音信息的标签，并对该声音信息的标签进行存储，进而在确定对上述第一表情包进行声音信息的匹配时，直接从声音信息的标签的存储位置获取该声音信息的标签。

在再一种可能的实施方式中，上述标签中，部分声音信息的标签是实时生成，部分声音信息的标签是预先生成的。可选地，服务器在对上述第一表情包进行声音信息的匹配时，获取声音信息数据库中的各个声音信息，并检测该声音信息是否存在标签，对于不存在标签的声音信息，实时生成标签，并将该标签存储在对应的位置便于下次使用。

可选地，上述标签包括但不限于以下至少一项：文字标签、场景标签、情绪标签等。其中，文字标签用于指示声音信息所对应的文字；场景标签用于指示声音信息所对应的发送场景，例如，场景标签为：在晚上20:11向第一聊天群中的目标用户发送；情绪标签用于指示声音信息所对应的情绪，即声音信息中所带有的情绪。

可选地，用户可以根据实际情况自行设定是否允许服务器收集自身的历史声音信息存储至声音信息数据库中。示例性地，如图10所示，功能设定界面100中包括语音识别开关101，用户通过该语音识别开关101控制历史声音信息收集功能的开启和关闭。

以第一表情包的发送方帐号为例，在历史声音信息收集功能开启之后，服务器收集第一表情包的发送方帐号所发送的多个历史声音信息；进一步地，对各个历史声音信息所包含的声音分别进行文字转换，得到各个历史声音信息分别对应的文字标签；基于各个历史声音信息分别对应的发送场景，得到各个历史声音信息分别对应的场景标签；基于各个历史声音信息分别对应的声音情绪，得到各个历史声音信息分别对应的情绪标签。

在一种可能的实施方式中，服务器在收集第一表情包的发送方帐号所发送的多个历史声音信息时，收集该发送方帐号在目标时段内发送的多个历史声音信息。其中，该目标时段可以是与当前时刻之间的差值小于目标值的时刻所组成的时段，也可以是发送消息频繁的时段，本申请实施例对此不作限定。可选地，不同的发送方帐号对应有不同的目标时段。

在另一种可能的实施方式中，服务器在收集第一表情包的发送方帐号所发送的多个历史声音信息时，收集该发送方帐号所发送的，播放总时长小于门限值的多个历史声音信息。其中，该门限值可以是任意数值，如10s、7s、5s、2s等，本申请实施例对此不作限定。

本申请实施例通过发送方帐号所发送的历史声音信息，进行声音信息数据库的构建，并将其选择为发送方帐号所发送的表情包对应的关联声音信息，使得表情包对应的有声表情消息更加符合发送方帐号的聊天风格，从而进一步提高了用户聊天体验。

2、根据各个声音信息分别对应的标签，从声音信息数据库中选择与特征信息相匹配的至少一个候选声音信息。

在本申请实施例中，服务器在获取各个声音信息分别对应的标签之后，根据各个声音信息分别对应的标签，从声音信息数据库中选择与特征信息相匹配的至少一个候选声音信息。

可选地，若特征信息包括文字特征信息，标签包括文字标签，则服务器根据特征信息中的文字特征信息以及各个声音信息分别对应的文字标签，从声音信息数据库中选择与文字特征信息相匹配的至少一个候选声音信息。

可选地，若特征信息包括场景特征信息，标签包括场景标签，则服务器根据特征信息中的场景特征信息以及各个声音信息分别对应的场景标签，从声音信息数据库中选择与场景特征信息相匹配的至少一个候选声音信息。

可选地，若特征信息包括情绪特征信息，标签包括情绪标签，则服务器根据特征信息中的情绪特征信息以及各个声音信息分别对应的情绪标签，从声音信息数据库中选择与情绪特征信息相匹配的至少一个候选声音信息。

本申请实施例通过提供文字特征匹配、场景特征匹配和情绪特征匹配等多种候选声音信息的选择方法，从而使得服务器能够获取更加全面的候选声音信息，从而有利于提高第一声音信息的获取合理性。

3、从至少一个候选声音信息中，选择满足第二条件的候选声音信息作为第一声音信息。

在本申请实施例中，服务器在获取上述至少一个候选声音信息之后，从该至少一个候选声音信息中，选择满足第二条件的候选声音信息作为第一声音信息。

上述第二条件为针对候选声音信息的选择条件。可选地，该第二条件为与第一表情包的特征信息的匹配度最高的候选声音信息，即服务器在获取第一声音信息时，从候选声音信息中，选择与特征信息匹配度最高的声音信息作为第一声音信息。当然，在示例性实施例中，服务器也可以随机从至少一个候选声音信息中，为第一表情包选择第一声音信息，以保证在候选声音信息的匹配度相同时也能够为第一表情包匹配第一声音信息。

本申请实施例通过从根据表情包的特征信息和声音信息对应的标签，匹配得到的与该表情包相关联的多个候选声音信息中选择第一声音信息，使得第一声音信息与该表情包之间的匹配程度更高，进而使得基于第一声音信息生成的关联声音信息的准确度高。

另外，结合参考图11，以客户端和服务器交互的角度，对本申请的完整方案进行介绍。具体步骤包括以下几个步骤中的至少一个步骤：

步骤1101，客户端显示聊天会话界面。

步骤1102，客户端在接收到针对聊天会话界面的表情包选择操作的情况下，显示表情包选择界面。其中，表情包选择界面中显示有至少一个表情包。

步骤1103，客户端在接收到针对第一表情包的发送操作，且第一表情包的发送方式为第一发送方式的情况下，获取第一表情包的特征信息。

步骤1104，客户端向服务器发送声音匹配指令。其中，声音匹配指令中包括第一表情包的特征信息。

步骤1105，服务器获取声音信息数据库中各个声音信息分别对应的标签。

步骤1106，服务器根据各个声音信息分别对应的标签，从声音信息数据库中选择与第一表情包的特征信息相匹配的至少一个候选声音信息。

步骤1107，服务器从至少一个候选声音信息中，选择满足第二条件的候选声音信息作为第一声音信息。

步骤1108，服务器基于第一声音信息，生成第一表情包的关联声音信息。

步骤1109，服务器向客户端发送关联声音信息。

步骤1110，客户端根据第一表情包和关联声音信息，生成第一表情包对应的有声表情信息，并向聊天会话界面中的接收方帐号发送有声表情消息。

步骤1111，客户端在聊天会话界面中显示第一表情包对应的有声表情信息。而且，接收方帐号的客户端也在聊天会话界面中显示第一表情包对应的有声表情信息。

步骤1112，客户端在接收到针对有声表情消息的声音播放操作的情况下，播放第一表情包的关联声音信息。而且，接收方帐号的客户端在接收到针对有声表情消息的声音播放操作的情况下，也播放第一表情包的关联声音信息。

步骤1113，客户端在接收到针对有声表情消息的静音操作的情况下，停止播放第一表情包的关联声音信息。而且，接收方帐号的客户端在接收到针对有声表情消息的静音操作的情况下，也停止播放第一表情包的关联声音信息。

步骤1114，客户端在接收到针对有声表情消息的声音更换操作的情况下，向服务器发送针对第一表情包的声音更改指令。

步骤1115，服务器基于至少一个候选声音信息生成第一表情包的替换声音信息。

步骤1116，服务器向客户端发送替换声音信息。

步骤1117，客户端采用第一表情包的替换声音信息，替换第一表情包的关联声音信息，并将变化后的关联声音信息同步至接收方帐号的客户端。而且，接收方帐号的客户端也采用第一表情包的替换声音信息，替换第一表情包的关联声音信息。

需要说明的一点是，上文中通过实施例对本申请的介绍，仅仅是示例性和解释性的，将上述实施例中的步骤进行任意组合形成的新的实施例，也在本申请的保护范围内。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

请参考图12，其示出了本申请一个实施例提供的表情包显示装置的框图。该装置具有实现上述表情包显示方法的功能，所述功能可以由硬件实现，也可以由硬件执行相应的软件实现。该装置可以是终端设备，也可以设置在终端设备中。该装置1200可以包括：界面显示模块1210、表情显示模块1220和消息显示模块1230。

界面显示模块1210，用于显示聊天会话界面，所述聊天会话界面用于展示至少两个用户之间的聊天消息。

表情显示模块1220，用于响应于针对所述聊天会话界面的表情包选择操作，显示表情包选择界面，所述表情包选择界面中显示有至少一个表情包。

消息显示模块1230，用于响应于针对所述至少一个表情包中的第一表情包的发送操作，在所述聊天会话界面中显示所述第一表情包对应的有声表情消息；其中，所述第一表情包对应的有声表情消息用于展示所述第一表情包以及所述第一表情包的关联声音信息，所述第一表情包的关联声音信息是从声音信息数据库中匹配得到的与所述第一表情包相关联的声音信息。

在示例性实施例中，所述消息显示模块1230，用于响应于针对所述第一表情包的发送操作，获取所述第一表情包的发送方式；若所述发送方式为第一发送方式，则向所述聊天会话界面中的接收方帐号发送所述第一表情包对应的有声表情消息，以及在所述聊天会话界面中显示所述第一表情包对应的有声表情消息。

在示例性实施例中，如图13所示，所述装置1200还包括：控件显示模块1240、操作接收模块1250和方式切换模块1260。

控件显示模块1240，用于响应于针对所述第一表情包的选择操作，显示所述第一表情包的发送方式切换控件。

操作接收模块1250，用于接收针对所述发送方式切换控件的操作。

方式切换模块1260，用于若所述第一表情包的发送方式为第二发送方式，则控制所述发送方式由所述第二发送方式切换至所述第一发送方式；若所述第一表情包的发送方式为所述第一发送方式，则控制所述发送方式由所述第一发送方式切换至所述第二发送方式。

在示例性实施例中，如图13所示，所述装置1200还包括：声音控件模块1270。

声音控制模块1270，用于响应于针对所述有声表情消息的声音播放操作，播放所述第一表情包的关联声音信息；或者，响应于针对所述有声表情消息的静音操作，停止播放所述第一表情包的关联声音信息；或者，响应于针对所述有声表情消息的声音更换操作，更改所述第一表情包的关联声音信息。

在示例性实施例中，所述声音控制模块1270，用于从至少一个候选声音信息中，选择满足第一条件的候选声音信息生成所述第一表情包的替换声音信息；其中，所述候选声音信息是根据所述第一表情包的特征信息，以及所述声音信息数据库中各个声音信息分别对应的标签匹配得到的；采用所述第一表情包的替换声音信息，替换所述第一表情包的关联声音信息。

在示例性实施例中，所述声音控制模块1270，用于显示至少一个候选声音信息；响应于针对所述至少一个候选声音信息中的目标声音信息的选择操作，根据所述目标声音信息生成所述第一表情包的替换声音信息；采用所述第一表情包的替换声音信息，替换所述第一表情包的关联声音信息。

在示例性实施例中，所述有声表情消息包括所述第一表情包，以及用于播放所述第一表情包的关联声音信息的声音播放控件；或者，所述有声表情消息包括所述第一表情包的有声视频，以及用于播放所述有声视频的视频播放控件。

请参考图14，其示出了本申请一个实施例提供的表情包的关联声音获取装置的框图。该装置具有实现上述表情包的关联声音获取方法的功能，所述功能可以由硬件实现，也可以由硬件执行相应的软件实现。该装置可以是服务器，也可以设置在服务器中。该装置1400可以包括：特征获取模块1410、声音匹配模块1420和声音生成模块1430。

特征获取模块1410，用于获取第一表情包的特征信息。

声音匹配模块1420，用于根据所述特征信息，从声音信息数据库中匹配得到与所述第一表情包相关联的第一声音信息。

声音生成模块1430，用于基于所述第一声音信息，生成所述第一表情包的关联声音信息；其中，所述第一表情包的关联声音信息用于生成所述第一表情包对应的有声表情消息。

在示例性实施例中，如图15所示，所述声音匹配模块1420，包括：标签获取单元1421、声音匹配单元1422和声音选择单元1423。

标签获取单元1421，用于获取所述声音信息数据库中各个声音信息分别对应的标签。

声音匹配单元1422，用于根据各个所述声音信息分别对应的标签，从所述声音信息数据库中选择与所述特征信息相匹配的至少一个候选声音信息。

声音选择单元1423，用于从所述至少一个候选声音信息中，选择满足第二条件的候选声音信息作为所述第一声音信息。

在示例性实施例中，所述声音匹配单元1422，用于根据所述特征信息中的文字特征信息以及各个所述声音信息分别对应的文字标签，从所述声音信息数据库中选择与所述文字特征信息相匹配的至少一个候选声音信息；其中，所述文字标签用于指示所述声音信息所对应的文字；或者，根据所述特征信息中的场景特征信息以及各个所述声音信息分别对应的场景标签，从所述声音信息数据库中选择与所述场景特征信息相匹配的至少一个候选声音信息；其中，所述场景标签用于指示所述声音信息所对应的发送场景；或者，根据所述特征信息中的情绪特征信息以及各个所述声音信息分别对应的情绪标签，从所述声音信息数据库中选择与所述情绪特征信息相匹配的至少一个候选声音信息；其中，所述情绪标签用于指示所述声音信息所对应的情绪。

在示例性实施例中，所述特征获取模块1410，用于对所述第一表情包中的文字信息进行文字提取，得到所述第一表情包的文字特征信息；其中，所述特征信息包括所述文字特征信息；或者，对所述第一表情包、所述第一表情包的关联聊天消息、所述第一表情包的关联聊天场景进行特征提取，得到所述第一表情包的场景特征信息；其中，所述特征信息包括所述场景特征信息；或者，对所述第一表情包、所述第一表情包的关联聊天消息进行特征提取，得到所述第一表情包的情绪特征信息；其中，所述特征信息包括所述情绪特征信息。

在示例性实施例中，如图15所示，所述声音生成模块1430，包括：文字获取单元1431、声音截取单元1432和声音生成单元1433。

文字获取单元1431，用于获取所述第一表情包所包含的文字信息。

声音截取单元1432，用于根据所述文字信息，从所述第一声音信息中截取包含所述文字信息的声音片段。

声音生成单元1433，用于基于所述声音片段，生成所述第一表情包的关联声音信息。

在示例性实施例中，所述声音生成单元1433，用于若所述第一表情包为视频动画，则基于所述第一表情包的播放时长，对所述声音片段的播放时长进行调整，得到所述第一表情包的关联声音信息；其中，所述第一表情包的关联声音信息的播放时长与所述第一表情包的播放时长相同。

在示例性实施例中，如图15所示，所述装置1400还包括：声音收集模块1440。

声音收集模块1440，用于收集所述第一表情包的发送方帐号所发送的多个历史声音信息；对各个所述历史声音信息所包含的声音分别进行文字转换，得到各个所述历史声音信息分别对应的文字标签；基于各个所述历史声音信息分别对应的发送场景，得到各个所述历史声音信息分别对应的场景标签；基于各个所述历史声音信息分别对应的声音情绪，得到各个所述历史声音信息分别对应的情绪标签。

需要说明的是，上述实施例提供的装置，在实现其功能时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的装置与方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

请参考图16，其示出了本申请一个实施例提供的终端设备1600的结构框图。该终端设备1600可以是诸如手机、平板电脑、游戏主机、电子书阅读器、多媒体播放设备、可穿戴设备、车载终端、PC等电子设备。该终端设备用于实施上述实施例中提供的表情包显示方法，或表情包的关联声音获取方法。具体来讲：

通常，终端设备1600包括有：处理器1601和存储器1602。

处理器1601可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1601可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1601也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central Processing Unit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1601可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1601还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器1602可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1602还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1602中的非暂态的计算机可读存储介质用于存储至少一条指令、至少一段程序、代码集或指令集，且经配置以由一个或者一个以上处理器执行，以实现上述表情包显示方法，或上述表情包的关联声音获取方法。

在一些实施例中，终端设备1600还可选包括有：外围设备接口1603和至少一个外围设备。处理器1601、存储器1602和外围设备接口1603之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1603相连。具体地，外围设备包括：射频电路1604、显示屏1605、摄像头组件1606、音频电路1607和电源1608中的至少一种。

本领域技术人员可以理解，图16中示出的结构并不构成对终端设备1600的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

请参考图17，其示出了本申请一个实施例提供的服务器的结构框图。该服务器用于实施上述实施例中提供的表情包的关联声音获取方法。具体来讲：

所述服务器1700包括CPU(Central Processing Unit，中央处理单元)1701、包括RAM(Random Access Memory，随机存取存储器)1702和ROM(Read-Only Memory，只读存储器)1703的系统存储器1704，以及连接系统存储器1704和中央处理单元1701的系统总线1705。所述服务器1700还包括帮助计算机内的各个器件之间传输信息的基本I/O(Input/Output，输入/输出)系统1706，和用于存储操作系统1713、应用程序1714和其他程序模块1715的大容量存储设备1707。

所述基本输入/输出系统1706包括有用于显示信息的显示器1708和用于用户输入信息的诸如鼠标、键盘之类的输入设备1709。其中所述显示器1708和输入设备1709都通过连接到系统总线1705的输入输出控制器1710连接到中央处理单元1701。所述基本输入/输出系统1706还可以包括输入输出控制器1710以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器1710还提供输出到显示屏、打印机或其他类型的输出设备。

所述大容量存储设备1707通过连接到系统总线1705的大容量存储控制器(未示出)连接到中央处理单元1701。所述大容量存储设备1707及其相关联的计算机可读介质为服务器 1700提供非易失性存储。也就是说，所述大容量存储设备1707可以包括诸如硬盘或者CD-ROM(Compact Disc Read-Only Memory，只读光盘)驱动器之类的计算机可读介质(未示出)。

不失一般性，所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM(Erasable Programmable Read Only Memory，可擦除可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read Only Memory，可擦除可编程只读存储器)、闪存或其他固态存储器技术，CD-ROM、DVD(Digital Video Disc，高密度数字视频光盘)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器1704和大容量存储设备1707可以统称为存储器。

根据本申请的各种实施例，所述服务器1700还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器1700可以通过连接在所述系统总线1705上的网络接口单元1711连接到网络1712，或者说，也可以使用网络接口单元1711来连接到其他类型的网络或远程计算机系统(未示出)。

在示例性实施例中，还提供了一种计算机可读存储介质，所述存储介质中存储有计算机程序，所述计算机程序在被处理器执行时以实现上述表情包显示方法，或实现上述表情包的关联声音获取方法。

可选地，该计算机可读存储介质可以包括：ROM(Read Only Memory，只读存储器)、RAM(Random Access Memory，随机存取记忆体)、SSD(Solid State Drives，固态硬盘)或光盘等。其中，随机存取记忆体可以包括ReRAM(Resistance Random Access Memory，电阻式随机存取记忆体)和DRAM(Dynamic Random Access Memory，动态随机存取存储器)。

在示例性实施例中，还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，所述计算机程序存储在计算机可读存储介质中，处理器从所述计算机可读存储介质读取并执行所述计算机程序，以实现上述表情包显示方法，或实现上述表情包的关联声音获取方法。

需要说明的是，本申请所涉及的信息(包括但不限于对象设备信息、对象个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号，均为经对象授权或者经过各方充分授权的，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如，本申请中涉及到的发送方帐号、接收方帐号、标识信息、历史声音信息等都是在充分授权的情况下获取的。

应当理解的是，在本文中提及的“多个”是指两个或两个以上。“和/或”，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。另外，本文中描述的步骤编号，仅示例性示出了步骤间的一种可能的执行先后顺序，在一些其它实施例中，上述步骤也可以不按照编号顺序来执行，如两个不同编号的步骤同时执行，或者两个不同编号的步骤按照与图示相反的顺序执行，本申请实施例对此不作限定。

以上所述仅为本申请的示例性实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种表情包显示方法，所述方法由终端设备执行，所述方法包括：

显示聊天会话界面，所述聊天会话界面用于展示至少两个用户之间的聊天消息；

响应于针对所述聊天会话界面的表情包选择操作，显示表情包选择界面，所述表情包选择界面中显示有至少一个表情包；

响应于针对所述至少一个表情包中的第一表情包的发送操作，在所述聊天会话界面中显示所述第一表情包对应的有声表情消息；其中，所述第一表情包对应的有声表情消息用于展示所述第一表情包以及所述第一表情包的关联声音信息，所述第一表情包的关联声音信息是从声音信息数据库中匹配得到的与所述第一表情包相关联的声音信息。
根据权利要求1所述的方法，其中，所述响应于针对所述至少一个表情包中的第一表情包的发送操作，在所述聊天会话界面中显示所述第一表情包对应的有声表情消息，包括：

响应于针对所述第一表情包的发送操作，获取所述第一表情包的发送方式；

若所述发送方式为第一发送方式，则向所述聊天会话界面中的接收方帐号发送所述第一表情包对应的有声表情消息，以及在所述聊天会话界面中显示所述第一表情包对应的有声表情消息。
根据权利要求2所述的方法，其中，所述显示表情包选择界面之后，还包括：

响应于针对所述第一表情包的选择操作，显示所述第一表情包的发送方式切换控件；

接收针对所述发送方式切换控件的操作；

若所述第一表情包的发送方式为第二发送方式，则控制所述发送方式由所述第二发送方式切换至所述第一发送方式；

若所述第一表情包的发送方式为所述第一发送方式，则控制所述发送方式由所述第一发送方式切换至所述第二发送方式。
根据权利要求1至3任一项所述的方法，其中，所述在所述聊天会话界面中显示所述第一表情包对应的有声表情消息之后，还包括：

响应于针对所述有声表情消息的声音播放操作，播放所述第一表情包的关联声音信息；

或者，

响应于针对所述有声表情消息的静音操作，停止播放所述第一表情包的关联声音信息；

或者，

响应于针对所述有声表情消息的声音更换操作，更改所述第一表情包的关联声音信息。
根据权利要求4所述的方法，其中，所述更改所述第一表情包的关联声音信息，包括：

从至少一个候选声音信息中，选择满足第一条件的候选声音信息生成所述第一表情包的替换声音信息；其中，所述候选声音信息是根据所述第一表情包的特征信息，以及所述声音信息数据库中各个声音信息分别对应的标签匹配得到的；

采用所述第一表情包的替换声音信息，替换所述第一表情包的关联声音信息。
根据权利要求4所述的方法，其中，所述更改所述第一表情包的关联声音信息，包括：

显示至少一个候选声音信息；

响应于针对所述至少一个候选声音信息中的目标声音信息的选择操作，根据所述目标声音信息生成所述第一表情包的替换声音信息；

采用所述第一表情包的替换声音信息，替换所述第一表情包的关联声音信息。
根据权利要求1至3任一项所述的方法，其中，

所述有声表情消息包括所述第一表情包，以及用于播放所述第一表情包的关联声音信息的声音播放控件；

或者，

所述有声表情消息包括所述第一表情包的有声视频，以及用于播放所述有声视频的视频播放控件。
一种表情包的关联声音获取方法，所述方法由计算机设备执行，所述方法包括：

获取第一表情包的特征信息；

根据所述特征信息，从声音信息数据库中匹配得到与所述第一表情包相关联的第一声音信息；

基于所述第一声音信息，生成所述第一表情包的关联声音信息；其中，所述第一表情包的关联声音信息用于生成所述第一表情包对应的有声表情消息。
根据权利要求8所述的方法，其中，所述根据所述特征信息，从声音信息数据库中匹配得到与所述第一表情包相关联的第一声音信息，包括：

获取所述声音信息数据库中各个声音信息分别对应的标签；

根据各个所述声音信息分别对应的标签，从所述声音信息数据库中选择与所述特征信息相匹配的至少一个候选声音信息；

从所述至少一个候选声音信息中，选择满足第二条件的候选声音信息作为所述第一声音信息。
根据权利要求9所述的方法，其中，所述根据各个所述声音信息分别对应的标签，从所述声音信息数据库中选择与所述特征信息相匹配的至少一个候选声音信息，包括以下至少一项：

根据所述特征信息中的文字特征信息以及各个所述声音信息分别对应的文字标签，从所述声音信息数据库中选择与所述文字特征信息相匹配的至少一个候选声音信息；其中，所述文字标签用于指示所述声音信息所对应的文字；

根据所述特征信息中的场景特征信息以及各个所述声音信息分别对应的场景标签，从所述声音信息数据库中选择与所述场景特征信息相匹配的至少一个候选声音信息；其中，所述场景标签用于指示所述声音信息所对应的发送场景；

根据所述特征信息中的情绪特征信息以及各个所述声音信息分别对应的情绪标签，从所述声音信息数据库中选择与所述情绪特征信息相匹配的至少一个候选声音信息；其中，所述情绪标签用于指示所述声音信息所对应的情绪。
根据权利要求8所述的方法，其中，所述获取第一表情包的特征信息，包括以下至少一项：

对所述第一表情包中的文字信息进行文字提取，得到所述第一表情包的文字特征信息；其中，所述特征信息包括所述文字特征信息；

对所述第一表情包、所述第一表情包的关联聊天消息、所述第一表情包的关联聊天场景进行特征提取，得到所述第一表情包的场景特征信息；其中，所述特征信息包括所述场景特征信息；

对所述第一表情包、所述第一表情包的关联聊天消息进行特征提取，得到所述第一表情包的情绪特征信息；其中，所述特征信息包括所述情绪特征信息。
根据权利要求8所述的方法，其中，所述基于所述第一声音信息，生成所述第一表情包的关联声音信息，包括：

获取所述第一表情包所包含的文字信息；

根据所述文字信息，从所述第一声音信息中截取包含所述文字信息的声音片段；

基于所述声音片段，生成所述第一表情包的关联声音信息。
根据权利要求12所述的方法，其中，所述基于所述声音片段，生成所述第一表情包的关联声音信息，包括：

若所述第一表情包为视频动画，则基于所述第一表情包的播放时长，对所述声音片段的播放时长进行调整，得到所述第一表情包的关联声音信息；

其中，所述第一表情包的关联声音信息的播放时长与所述第一表情包的播放时长相同。
根据权利要求8至13任一项所述的方法，其中，所述方法还包括：

收集所述第一表情包的发送方帐号所发送的多个历史声音信息；

对各个所述历史声音信息所包含的声音分别进行文字转换，得到各个所述历史声音信息分别对应的文字标签；

基于各个所述历史声音信息分别对应的发送场景，得到各个所述历史声音信息分别对应的场景标签；

基于各个所述历史声音信息分别对应的声音情绪，得到各个所述历史声音信息分别对应的情绪标签。
一种表情包显示装置，所述装置包括：

界面显示模块，用于显示聊天会话界面，所述聊天会话界面用于展示至少两个用户之间的聊天消息；

表情显示模块，用于响应于针对所述聊天会话界面的表情包选择操作，显示表情包选择界面，所述表情包选择界面中显示有至少一个表情包；

消息显示模块，用于响应于针对所述至少一个表情包中的第一表情包的发送操作，在所述聊天会话界面中显示所述第一表情包对应的有声表情消息；其中，所述第一表情包对应的有声表情消息用于展示所述第一表情包以及所述第一表情包的关联声音信息，所述第一表情包的关联声音信息是从声音信息数据库中匹配得到的与所述第一表情包相关联的声音信息。
一种表情包的关联声音获取装置，所述装置包括：

特征获取模块，用于获取第一表情包的特征信息；

声音匹配模块，用于根据所述特征信息，从声音信息数据库中匹配得到与所述第一表情包相关联的第一声音信息；

声音生成模块，用于基于所述第一声音信息，生成所述第一表情包的关联声音信息；其中，所述第一表情包的关联声音信息用于生成所述第一表情包对应的有声表情消息。
一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有计算机程序，所述计算机程序由所述处理器加载并执行以实现如权利要求1至7任一项所述的表情包显示方法，或实现如权利要求8至14任一项所述的表情包的关联声音获取方法。
一种计算机可读存储介质，所述存储介质中存储有计算机程序，所述计算机程序由处理器加载并执行以实现如权利要求1至7任一项所述的表情包显示方法，或实现如权利要求8至14任一项所述的表情包的关联声音获取方法。
一种计算机程序产品，所述计算机程序产品包括计算机程序，所述计算机程序存储在计算机可读存储介质中，处理器从所述计算机可读存储介质读取并执行所述计算机程序，以实现如权利要求1至7任一项所述的表情包显示方法，或实现如权利要求8至14任一项所述的表情包的关联声音获取方法。