WO2019085625A1

WO2019085625A1 - 表情图片推荐方法及设备

Info

Publication number: WO2019085625A1
Application number: PCT/CN2018/103180
Authority: WO
Inventors: 胡晨鹏
Original assignee: 上海掌门科技有限公司
Priority date: 2017-10-31
Filing date: 2018-08-30
Publication date: 2019-05-09
Also published as: CN107729543A

Abstract

本申请提供了一种表情图片推荐方案，该方案中用户设备获取用户图像，并将所述用户图像发送至服务设备，由服务设备根据所述用户图像，获取与所述用户图像的特征信息匹配的表情图片，在匹配到符合匹配规则的表情图片之后，将表情图片反馈给用户设备，呈现给用户来进行选择，由于用户图像中会包含用户的一些行为或表情，因此能够反映出用户部分表达的需求，因此在向用户推荐表情图片时以用户图像作为参考，能够满足用户的一些个性化需求，从而提高了推荐的灵活性，用户体验较好。

Description

表情图片推荐方法及设备

技术领域

本申请涉及信息技术领域，尤其涉及一种表情图片推荐方法及设备。

背景技术

随着互联网的发展，即时通信已成为人们日常生活中不可缺少的网络沟通方式。随着人们对即时通信软件的使用越来越频繁，即时通信工具推出了越来越多满足不同用户需求的功能。目前，在聊天过程中，当用户想表达自身当前的感受或者心情时，除了通过文字直接描述之外，也会通过诸如特殊符号、表情图片等来协助表达。因此，在使用即时通讯软件时，用户会希望获得各类丰富多彩的表情图片。

为了丰富用户可使用的表情，即时通信软件可以提供各类表情图片供用户下载使用。用户可通过即时通信软件提供的入口，如表情商城等，来浏览或文本搜索表情图片，并进行下载。

申请内容

本申请的一个目的是提供一种表情图片推荐方案。

为实现上述目的，本申请的一些实施例提供了一种服务设备端的表情图片推荐方法，该方法包括：获取用户设备上传的用户图像；根据所述用户图像，获取与所述用户图像的特征信息匹配的表情图片；将所述表情图片发送至所述用户设备。

本申请的一些实施例还提供了一种用户设备端的表情图片推荐方法，该方法包括：获取用户图像，并将所述用户图像发送至服务设备；接收所述服务设备响应于所述用户图像反馈的表情图片；向用户呈现所述表情图片。

本申请的一些实施例还提供了一种设备，该设备包括用于存储计算机程序指令的存储器和用于执行计算机程序指令的处理器，当该计算机程序指令被该处理器执行时，触发所述设备执行前述用户设备或者服务设备端的表情图片推荐方法。

本申请的一些实施例还提供了一种计算机可读介质，其上存储有计算机程序指令，所述计算机可读指令可被处理器执行以实现前述用户设备或者服务设备端的表情图片推荐方法。

本申请的一些实施例提供的方案中，用户设备获取用户图像，并将所述用户图像发送至服务设备，由服务设备根据所述用户图像，获取与所述用户图像的特征信息匹配的表情图片，在匹配到符合匹配规则的表情图片之后，将表情图片反馈给用户设备，呈现给用户来进行选择。通过用户图像，用户可以以与其自身有关的图像来表达文字难以描述的表情图片需求，以使用户更为方便地获得其希望获得的表情图片。此外，由于用户图像中会包含用户的一些行为或表情，因此能够反映出用户部分表达的需求，因此在向用户推荐表情图片时以用户图像作为参考，能够满足用户的一些个性化需求，从而提高了推荐的灵活性，用户体验较好。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1为本申请的一些实施例提供的一种实现表情图片推荐的系统的示意图；

图2为本申请一些实施例在实现表情图片推荐时用户设备和服务设备之间的交互流程图；

图3为本申请的一些实施例的方案应用于即时通信软件时的流程示意图；

图4为本申请的一些实施例提供的一种实现表情图片推荐的设备的示意图；

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在本申请一个典型的配置中，终端、服务网络的设备均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体，可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。

图1示出了本申请的一些实施例提供的一种实现表情图片推荐的系统的示意图，该系统包括了用户设备110和服务设备120，在实现表情图片推荐时，用户设备110和服务设备120之间的交互流程如图2所示，包括以下处理步骤：

步骤S201，用户设备获取用户图像。在实际场景中，所述用户设备可以是手机、平板电脑、计算机、可穿戴设备等各类电子设备，此类设备可以通过内置或者外接的摄像装置来拍摄并获取用户图像。用户设备获取的用户图像可以是用户脸部表情的图像，也可以是用户肢体动作的图像，可以根据不同的实现场景来设定。

例如，用户在使用手机中安装的即时通信软件与其它用户聊天时，若需要获取表情图片，可以打开即时通信软件的表情图片推荐功能，此时手机的前置摄像头启动，拍摄用户图像。由于用户一般会将手机等移动终端拿在手中，不便于拍摄肢体动作，则在该场景中，用户图像可以优先选择用户脸部表情的图像。若用户在使用计算机上安装的即时通信软件与其它用户聊天时，该计算机连接有一个可以拍摄全身图像的外接摄像头，则此时可以方便的获取用户肢体动作的图像，那么在该场景中，用户图像也可以优先选择用户肢体动作的图像。

由于用户设备在此时获取的用户图像是用于发送给服务设备来匹配表情图片，因此无需在用户设备中呈现给用户，即用户设备可以仅仅通过标记或者文字提示用户摄像装置已经启动，而不在界面中不显示此时摄像装置所拍摄到的画面。

在一些实施例中，用户设备可直接将摄像装置拍摄的图像作为用户图像；在一些实施例中，用户设备可将摄像装置拍摄的图像进行压缩处理后作为用户图像；在一些实施例中，用户设备获取的用户图像包括用户设备从摄像装置拍摄的图像中提取出的包含用户图像的多个关键帧，例如用户做出各种表情整个过程中的几个关键帧或者用户整个动作中的几个关键帧等。

由此，用户设备可以采用如下处理方式：首先，获取包含用户图像的连续图像，例如通过摄像头拍摄一段关于用户做出某个表情的完整过程的视频；然后，从所述连续图像中提取多个包含用户图像的多个关键帧，这几个关键帧可以是用户做出某个表情过程中的几个关键画面；最终，将包含用户图像的多个关键帧发送至服务设备，使得通过几个关键帧中包含的用户图像进行表情图片的匹配。该等提取出的关键帧可有助于服务设备提高基于用户图像进行匹配的准确度。

步骤S202，用户设备将所述用户图像发送至服务设备，使得服务设备可以根据用户图像匹配到合适的表情图片，进而实现表情图片推荐。

步骤S203，服务设备获取用户设备上传的用户图像。

步骤S204，服务设备根据所述用户图像，获取与所述用户图像的特征信息匹配的表情图片。其中，服务设备可以包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现。在此，云由基于云计算(Cloud Computing)的大量主机或网络服务器构成，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个超级虚拟计算机。在一些实施例中，服务设备接收到的用户图像可包括包含用户图像的多个关键帧；在一些实施例中，服务设备接收到的用户图像未包括包含用户图像的多个关键帧，在此情况下，服务设备可进行从接收到的用户图像中提取关键帧的操作。

服务设备在基于用户图像进行匹配时，预先配置符合应用场景需求的匹配规则，使得在获取到用户图像之后，可以准确地查找到合适的表情图片供用户使用。在本申请的一些实施例中，可以采用如下方式进行表情图片的匹配：

首先，确定用户图像的特征信息，所述特征信息可以是任意能够表示用户图像的相关特定的信息，例如图像的色彩特征、纹理特征、形状特征等各类图像特征值，通过图像特征值能够在相应的维度描述用户图像中所包含的内容。因此，以此作为依据进行表情图片的匹配能够使得匹配结果与用户图像的内容存在特定的关联关系，从而更好的满足用户对于表情图片的个性化需求，提高用户体验。

为了获取提高特征信息时的准确度，可以通过深度学习引擎对所述用户图像进行识别，来确定所述用户图像的特征信息。所述深度学习引擎以用户图像的图像数据为输入值，以用户图像的特征信息为输出值，可以预先设置各类判定条件，作为深度学习中各个隐层(hidden layers)的决策依据，从而精准地识别出用户图像的特征信息。

在确定用户图像的特征信息之后，再根据预设的匹配规则，确定与所述用户图像的特征信息匹配的表情图片。

在本申请的一些实施例中，预设的匹配规则可以是基于用户图像的特征信息与候选图片的特征信息，来获取匹配结果，并基于匹配结果确定与用户图像的特征信息匹配的表情图片。例如，匹配处理的过程可以是：若所述用户图像的特征信息与候选图片的特征信息的相似度超过阈值，将所述候选图片确定为与所述用户图像的特征信息匹配的表情图片。所述阈值可以根据实际需求设定，当阈值设定的低时，可以匹配得到更多的表情图片推荐给用户，给用户提供给更多的选择，而阈值设定的越高，则匹配结果会减少，但匹配出的表情图片与用户图像之间的相关度也将越高。又例如，匹配处理的过程可以是：基于用户图像的特征信息与候选图片的特征信息的相似度进行排序，并选取排序前N位的候选图片作为与用户图像的特征信息匹配的表情图片，N为预先设定的自然数。

在实际场景中，服务设备可以维护一个表情数据库，专门用于存储候选图片，该数据库中的候选图片可以由服务设备从互联网上获取，例如利用爬虫程序(web crawler)定期获取各类表情图片，并对其进行特征信息识别后，将连同特征信息一起保存于服务设备的表情数据库中。由此，在本申请的一些实施例中，服务设备在确定与所述用户图像的特征信息匹配的表情图片时，可以使用识别得到的用户图像的特征信息作为检索条件，在表情数据库中检索相似的表情图片。

在本申请的另一些实施例中，预设的匹配规则也可以是先基于用户图像特征信息得到其标签信息之后，再与候选图片的标签信息进行匹配，来获取匹配结果。用户图像的特征信息可以是对于图片内容的简要描述，例如通过用户图像的特征信息可以确定该用户图像中的内容是关于用户大笑的表情，则所述标签信息可以是“笑”、“开心”等。而候选图片的标签信息可以采用同样的表现方式；由服务设备对候选图片进行特征信息识别之后，根据其特征信息来确定其标签信息，或者也可以由该表情图片的相关用户设定，例如表情图片的制作者可以在制作该表情图片时，在表情图片文件中插入标签信息。

由此，服务设备在根据预设的匹配规则，确定与所述用户图像的特征信息匹配的表情图片时，可以是：根据用户图像的特征信息确定所述用户图像的标签信息；若所述用户图像的标签信息与候选图片的标签信息符合预设关系，将所述候选图片确定为与所述用户图像的特征信息匹配的表情图片。相应地，在此场景中，服务设备维护表情数据库中可以不保存表情图片的特征信息，而是直接保存表情图片的标签信息以便于完成匹配。

步骤S205，服务设备将匹配得到的表情图片发送至所述用户设备。

步骤S206，用户设备接收所述服务设备响应于所述用户图像反馈的表情图片。

步骤S207，用户设备向用户呈现所述表情图片。在本申请一些实施例的典型应用场景中，用户会在使用即时通信软件进行聊天时请求服务设备推荐表情图片，为了便于用户选择，用户设备在向用户呈现表情图片时，可以在聊天界面中以弹出气泡的形式显示。若服务设备推荐的表情图片的数量有多个，用户可以通过滑动弹出气泡中的图片来查看其它的表情图片。

在实际场景中，当服务设备匹配到的数量多的表情图片时，若同时发送给用户设备，在网络环境不佳的情况下，容易造成用户设备端接收延迟或者失败等情况发生，降低用户体验。因此，服务设备可以先发送表情图片的缩略图，以便于用户设备可以先将缩略图呈现给用户，当用户选定其中某个表情图片的缩略图时，用户设备可以获取到选择信息(例如用户点击某个缩略图所对应的信息)，然后根据该选择信息去向服务设备请求这个表情图片的完整数据。由此，在推荐的表情图片较多时，可以减少用户设备和服务设备之间交互的数据量，避免发生接收延迟、失败等情况，提高了用户体验。

图3示出了本申请的一些实施例的方案应用于即时通信软件时的流程示意图，其中，该即时通信软件向用户提供服务时采用C/S(Client/Server，客户端/服务端)的软件构架。客户端包括软件，并运行于用户设备，如运行于用户使用的各类终端设备，例如手机、平板电脑、计算机等；服务端包括软件，并运行于服务设备，例如可以运行于应用服务器、云等，以为客户端的各类功能提供支持。例如本实施例中表情图片推荐功能需要由服务端提供支持，在实现该功能时，具体交互流程如下：

步骤S301，用户A启动即时通信软件的客户端，进入聊天界面，聊天界面中可以包含表情推荐的选项

步骤S302，当用户选择该表情推荐选项后，客户端启动摄像头获取包含用户图像的连续图像。在一些实施例中，可以根据不同的应用场景选择拍摄用户全身的肢体动作或者是脸部表情。

步骤S303，客户端从连续图像中提取包含用户图像的多个关键帧，并上传到服务端。

步骤S304，服务端的深度学习引擎对用户图像进行识别处理，提取图像的特征值。

步骤S305，服务端根据提取的图像特征值在表情数据库中进行搜索，选择与用户A的脸部表情或者全身动作相似的表情图片，作为搜索结果，向客户端推荐。

步骤S306，服务端将搜索结果返回客户端。

步骤S307，客户端将服务端返回的搜索结果进行解码。

步骤S308，客户端的聊天界面的输入框附近显示解码后的结果，提示用户可以在聊天时使用这些表情图片。

综上，本申请的一些实施例提供的方案中，用户设备获取用户图像，并将所述用户图像发送至服务设备，由服务设备根据所述用户图像，获取与所述用户图像的特征信息匹配的表情图片，在匹配到符合匹配规则的表情图片之后，将表情图片反馈给用户设备，呈现给用户来进行选择。目前的现有技术中，搜索主要是基于用户主动输入的文本信息来进行的。而本申请的上述实施例打破了这种惯性思维，通过实时摄取用户图像来为用户推荐表情，因而，用户可以以与其自身有关的图像来表达文字难以描述的表情图片需求，使用户十分方便地获得其希望获得的表情图片。此外，由于用户图像中会包含用户的一些行为或表情，因此能够反映出用户部分表达的需求，因此在向用户推荐表情图片时以用户图像作为参考，能够满足用户的一些个性化需求，从而提高了推荐的灵活性，用户体验较好。

另外，本申请的一部分可被应用为计算机程序产品，例如计算机程序指令，当其被计算机执行时，通过该计算机的操作，可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令，可能被存储在固定的或可移动的记录介质中，和/或通过广播或其他信号承载媒体中的数据流而被传输，和/或被存储在根据程序指令运行的计算机设备的工作存储器中。在此，根据本申请的一些实施例包括一个如图4所示的设备，该设备包括存储有计算机可读指令的一个或多个存储器410和用于执行计算机可读指令的处理器420，其中，当该计算机可读指令被该处理器执行时，使得所述设备执行基于前述本申请的多个实施例的方法和/或技术方案。

此外，本申请的一些实施例还提供了一种计算机可读介质，其上存储有计算机程序指令，所述计算机可读指令可被处理器执行以实现前述本申请的多个实施例的方法和/或技术方案。

需要注意的是，本申请可在软件和/或软件与硬件的组合体中被实施，例如，可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一些实施例中，本申请的软件程序可以通过处理器执行以实现上文步骤或功能。同样地，本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。另外，本申请的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其他的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

一种服务设备端的表情图片推荐方法，其中，该方法包括：

获取用户设备上传的用户图像；

根据所述用户图像，获取与所述用户图像的特征信息匹配的表情图片；

将所述表情图片发送至所述用户设备。
根据权利要求1所述的方法，其中，获取用户设备上传的用户图像，包括：

获取用户设备上传的包含用户图像的多个关键帧，其中，所述关键帧来自于包含用户图像的连续图像。
根据权利要求1所述的方法，其中，根据所述用户图像，获取与所述用户图像的特征信息匹配的表情图片，包括：

确定所述用户图像的特征信息；

根据预设的匹配规则，确定与所述用户图像的特征信息匹配的表情图片。
根据权利要求3所述的方法，其中，确定所述用户图像的特征信息，包括：

通过深度学习引擎对所述用户图像进行识别，确定所述用户图像的特征信息。
根据权利要求3所述的方法，其中，根据预设的匹配规则，确定与所述用户图像的特征信息匹配的表情图片，包括：

若所述用户图像的特征信息与候选图片的特征信息的相似度超过阈值，将所述候选图片确定为与所述用户图像的特征信息匹配的表情图片。
根据权利要求3所述的方法，其中，根据预设的匹配规则，确定与所述用户图像的特征信息匹配的表情图片，包括：

根据用户图像的特征信息确定所述用户图像的标签信息；

若所述用户图像的标签信息与候选图片的标签信息符合预设关系，将所述候选图片确定为与所述用户图像的特征信息匹配的表情图片。
一种用户设备端的表情图片推荐方法，其中，该方法包括：

获取用户图像，并将所述用户图像发送至服务设备；

接收所述服务设备响应于所述用户图像反馈的表情图片；

向用户呈现所述表情图片。
根据权利要求7所述的方法，其中，获取用户图像，并将所述用户图像发送至服务设备，包括：

获取包含用户图像的连续图像；

从所述连续图像中提取多个包含用户图像的多个关键帧；

将包含用户图像的多个关键帧发送至服务设备。
根据权利要求1至8中任一项所述的方法，其中，所述用户图像包括用户脸部表情的图像和/或用户肢体动作的图像。
一种设备，该设备包括用于存储计算机程序指令的存储器和用于执行计算机程序指令的处理器，其中，当该计算机程序指令被该处理器执行时，触发所述设备执行权利要求1至9中任一项所述的方法。
一种计算机可读介质，其上存储有计算机程序指令，所述计算机可读指令可被处理器执行以实现如权利要求1至9中任一项所述的方法。