WO2022000991A1

WO2022000991A1 - 表情包生成方法及设备、电子设备和介质

Info

Publication number: WO2022000991A1
Application number: PCT/CN2020/133649
Authority: WO
Inventors: 徐传任
Original assignee: 北京百度网讯科技有限公司
Priority date: 2020-06-28
Filing date: 2020-12-03
Publication date: 2022-01-06
Also published as: CN111753131A

Abstract

一种表情包生成方法及设备、电子设备和介质，涉及多媒体技术领域，尤其涉及视频图像处理领域。所述表情包生成方法包括：获取目标视频的多个相关视频的至少一条目标反馈信息，所述目标视频和所述多个相关视频涉及同一视频播主（S101）；将所述至少一条目标反馈信息与所述目标视频进行匹配（S102）；基于匹配结果从所述目标视频中确定至少一个目标视频片段（S103）；以及至少基于所述至少一个目标视频片段生成专属表情包（S104）。

Description

表情包生成方法及设备、电子设备和介质

相关申请的交叉引用

本申请要求于2020年06月28日提交的中国专利申请202010601966.6的优先权，其全部内容通过引用整体结合在本申请中。

技术领域

本公开涉及多媒体技术领域，尤其涉及视频图像处理领域，特别涉及一种表情包生成方法及设备、电子设备和介质。

背景技术

近年来，随着智能手机的快速普及以及移动网速的显著提升，越来越多的用户开始使用视频类多媒体软件。通过多媒体软件可以上传自己制作的视频，也可以观看其它用户上传的视频。在制作视频时，很多用户喜欢从表情包中选择合适的表情添加到视频中。在观看其它用户上传的视频时，用户可以进行评论，也可以从表情包中选择合适的表情添加到评论中，或者仅使用从表情包中选择合适的表情来发表评论。

相关技术中，多媒体平台向所有用户推送统一的表情包，这些表情包中的表情主要是以明星、动漫、影视等作为素材。

在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被公认。

发明内容

根据本公开的一方面，提供一种表情包生成方法，包括：获取目标视频的多个相关视频的至少一条目标反馈信息，所述目标视频和所述多个相关视频涉及同一视频播主；将所述至少一条目标反馈信息与所述目标视频进行匹配；基于匹配结果从所述目标视频中确定至少一个目标视频片段；以及至少基于所述至少一个目标视频片段生成专属表情包。

根据本公开的另一方面，还提供一种表情包生成设备，包括：获取单元，被配置用于获取目标视频的多个相关视频的至少一条目标反馈信息；匹配单元，被配置用于将所述至少一条目标反馈信息与所述目标视频进行匹配；确定单元，被配置用于基于所述匹配单元的匹配结果从所述目标视频中确定至少一个目标视频片段；以及生成单元，被配置用于至少基于所述至少一个目标视频片段生成专属表情包。

根据本公开的另一方面，还提供一种电子设备，包括：处理器；以及存储程序的存储器，所述程序包括指令，所述指令在由所述处理器执行时使所述处理器执行根据上述的表情包生成方法。

根据本公开的另一方面，还提供一种存储程序的计算机可读存储介质，所述程序包括指令，所述指令在由电子设备的处理器执行时，致使所述电子设备执行根据上述的表情包生成方法。

附图说明

附图示例性地示出了实施例并且构成说明书的一部分，与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的，并不限制权利要求的范围。在所有附图中，相同的附图标记指代类似但不一定相同的要素。

图1是示出根据示例性实施例的表情包生成方法的流程图；

图2是示出根据示例性实施例的获取多个相关视频的至少一条目标反馈信息的方法流程图；

图3是示出根据示例性实施例的表情包生成方法的流程图；

图4是示出根据示例性实施例的表情包生成设备的示意性组成框图；

图5是示出能够应用于示例性实施例的示例性计算设备的结构框图。

具体实施方式

在本公开中，除非另有说明，否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系，这种术语只是用于将一个元件与另一元件区分开。在一些示例中，第一要素和第二要素可以指向该要素的同一实例，而在某些情况下，基于上下文的描述，它们也可以指代不同实例。

在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的，而并非旨在进行限制。除非上下文另外明确地表明，如果不特意限定要素的数量，则该要素可以是一个也可以是多个。此外，本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。

相关技术中，多媒体平台向所有用户推送统一的表情包，这些表情包中的表情主要是以明星、动漫、影视等作为素材。用户在评论或制作视频时，只能使用统一推送的表情包中的表情。这种无差异性的统一表情保与制作视频的用户(以下简称视频播主)没有任何关联，只能仅仅作为表情来使用。

基于对大数据的研究，发明人意识到，与出现次数最多的评论(可以是指语义相似度较高的多个评论)相关的视频片段基本是用户感兴趣的视频片段，这些视频片段最能吸引用户，也往往最能体现视频播主的个性特点。与评论相关的视频片段可以是指其它用户针对该视频片段的评论，也可以是指与该评论匹配的视频片段。与评论匹配的视频片段可以是指该评论与视频片段的字幕或音频相应的文本的至少一部分具有较高的语义相似度。

基于此，本公开提供一种表情包生成方法，通过获取目标视频的多个相关视频的目标反馈信息，并将目标反馈信息与目标视频进行匹配，以从目标视频中确定至少一个目标视频片段。从而能够将用户的反馈信息映射到目标视频中，获取与用户反馈信息相关的目标视频片段。其中，所述目标视频和所述多个相关视频涉及同一视频播主。然后，基于得到的目标视频片段生成视频播主的专属表情包，可以将视频播主的专属表情包推送给视频播主和其它用户，从而其它用户可以使用专属表情包中的专属表情对视频播主上传的视频进行评论，视频播主也可以从专属表情包中选择合适的专属表情添加到制作的视频中。通过上述技术方案生成的专属表情包能够符合其它用户的兴趣，也能够体现视频播主的个性特点，从而通过使用专属表情包能够加深其它用户对视频播主的印象，提升视频播主的认知度和影响力。

视频的反馈信息例如可以包括以下信息中的至少其中之一：弹幕、视频评论区的评论、点赞和转发。

所述目标视频可以为直播视频，也可以为录制视频。所述目标视频和多个相关视频例如可以由同一用户制作(可以直播或录制)。

本公开中，用户制作的视频可以是指制作得到的视频中包括该用户的音频和/或视频。

以下将结合附图对本公开的表情包生成方法进行进一步描述。

图1是示出根据本公开示例性实施例的表情包生成方法的流程图。如图1所示，所述表情包生成方法可以包括：步骤S101、获取目标视频的多个相关视频的至少一条目标反馈信息，所述目标视频和所述多个相关视频涉及同一视频播主；步骤S102、将所述至少一条目标反馈信息与所述目标视频进行匹配；步骤S103、基于匹配结果从所述目标视频中确定至少一个目标视频片段；以及步骤S104、至少基于所述至少一个目标视频片段生成专属表情包。

所述多个相关视频可以但不限于从视频库中获得。例如，也可以为从网络上抓取获得。

根据一些实施例，可以将所述多个相关视频的多条反馈信息中出现次数最多的至少一条反馈信息分别确定为所述目标反馈信息。也就是说，在所述多个相关视频的多条反馈信息中，所述至少一条目标反馈信息出现的次数大于剩余的反馈信息出现的次数。从而能够基于所述至少一条目标反馈信息确定用户最感兴趣的目标视频片段。

所述目标视频片段可以包括多个连续的视频帧，也可以为一个单独的视频帧，在此不作限定。

在一个示例性实施例中，如图2所示，步骤S101可以包括：步骤S1011、获取所述多个相关视频中的每一个所述相关视频的至少一条反馈信息；步骤S1012、对所述多个相关视频的多条反馈信息进行语义匹配；步骤S1013、基于语义匹配结果将所述多条反馈信息划分为多个反馈信息组；步骤S1014、将所述多个反馈信息组中所包括反馈信息的数量大于阈值的至少一个反馈信息组确定为目标反馈信息组；以及步骤S1015、基于每一个所述目标反馈信息组中的多条反馈信息确定该目标反馈信息组相应的所述目标反馈信息。从而能够实现所述至少一条目标反馈信息为出现次数最多的反馈信息。

可以但不限于为将每一个目标反馈信息组中的多条反馈信息中语义相似度最高的关键词作为所述目标反馈信息。所述关键词例如可以为“666”、“点赞”、“顶你”等等。例如，也可以将每一个目标反馈信息组中的其中一条反馈信息确定为所述目标反馈信息。

根据一些实施例，所述表情包生成方法还可以包括：在所述获取目标视频的多个相关视频的至少一条目标反馈信息之前，确定所述多个相关视频的反馈信息的总数量是否不小于设定值；响应于确定所述多个相关视频的反馈信息的总数量小于所述设定值，推送引导信息，以引导用户针对所述目标视频输入反馈信息。可以响应于确定所述多个相关视频的反馈信息的总数量不小于所述设定值，执行获取多个相关视频的至少一条目标反馈信息。由此，能够基于数量足够多的反馈信息来获取所需的目标反馈信息，使得得到的目标反馈信息能够更好得指示多数用户的兴趣。

所述推送引导信息例如可以为发送引导弹幕(例如，“一大波弹幕即将袭来”)。

在获取目标视频的多个相关视频的至少一条目标反馈信息之后，可以执行步骤S102和S103，得到至少一个目标视频片段。根据一些实施例，至少一个目标视频片段可以与所述至少一条目标反馈信息中的至少其中之一匹配。目标视频片段与目标反馈信息匹配可以是指：在所述目标视频中，目标视频片段的字幕或音频相应的文本与相应的目标反馈信息之间的语义相似度最高，并且语义相似度的分数大于设定的阈值。相应地，步骤S102可以包括：将所述至少一条目标反馈信息中的每一条所述目标反馈信息与所述目标视频的至少部分字幕或至少部分音频相应的文本进行语义匹配。从所述目标视频中确定至少一个目标视频片段为基于所述语义匹配结果而执行。

本公开中基于目标视频片段生成的专属表情包可以包括专属动效表情和/或专属贴纸。所述专属表情包可以推送给其它用户和视频播主，以使得其它用户在观看视频播主上传的视频时能够使用视频播主的专属表情包中的表情进行评论，视频播主也能够在制作视频时添加其专属表情包中的表情。

利用本公开的技术方案可以基于每一位视频播主上传的视频为该视频播主生成其专属表情包。

根据一些实施例，所述目标视频片段可以包括用于生成专属动效表情的第一目标视频片段。在这种情况下，如图3所示，所述表情包生成方法还可以包括：步骤S201、在所述生成专属表情包之前，对每一个所述目标视频片段进行目标识别(例如，人脸识别)；步骤S202、基于识别结果确定该目标视频片段中是否包括所述视频播主；以及步骤S203、响应于确定该目标视频片段中包括所述视频播主，将该目标视频片段确定为所述第一目标视频片段。相应地，步骤S104可以包括：步骤S1041、至少基于所述第一目标视频片段生成专属动效表情。从而能够基于包括视频播主的视频片段生成视频播主的专属动效表情，通过使用专属动效表情能够提高视频播主的认知度。

例如，某美食播主，经常在做一些特别好的美食时说一句今天啊，咱吃点好的。伴随着夸张的表情、搞笑的神气，用户经常会在评论中进行调侃。利用本公开的技术方案能够基于该视频片段(可以为字幕或音频“一句今天啊，咱吃点好的”对应的视频片段)生成一个对应的动效，可以向视频播主和其它用户推送该动效。通过使用该动效能够大大加深观看用户的印象，方便快速提高播主的人气。

根据一些实施例，步骤S104中至少基于所述第一目标视频片段生成专属动效表情可以包括：确定与所述第一目标视频片段相应的第一文本信息；基于所述第一目标视频片段和相应的第一文本信息生成专属动效表情。从而能够使得生成的专属动效表情更加形象生动。所述第一文本信息可以为基于所述第一目标视频片段中的字幕或音频相应的文本来确定。例如，所述第一文本信息可以为播放第一目标视频片段时相应的一句字幕或音频中的一句话相应的文本。当然，所述第一文本信息也可以基于与第一目标视频片段匹配的目标反馈信息来确定。

至少基于所述第一目标视频片段生成专属动效表情可以但不限于为响应于接收到第一触发指令而执行，从而可以根据视频播主的触发指令来选择性地生成专属动效表情，具有更好得灵活性。

根据一些实施例，所述目标视频片段还可以包括用于生成专属贴纸的第二目标视频片段。在这种情况下，如图3所示，所述表情包生成方法还可以包括：步骤S204、响应于确定所述目标视频片段中不包括所述视频播主(例如，不包括所述视频播主的人脸)，将该目标视频片段确定为所述第二目标视频片段。相应地，步骤S104、所述生成专属表情包还可以包括：步骤S1042、确定与所述第二目标视频片段相应的第二文本信息；步骤S1043、至少基于所述第二文本信息生成专属贴纸。从而能够基于不包括人脸的视频片段生成专属贴纸。所述第二文本信息可以为基于所述第二目标视频片段中的字幕或音频相应的文本来确定。例如，所述第二文本信息可以为播放第二目标视频片段时相应的一句字幕或音频中的一句话相应的文本。当然，所述第二文本信息也可以基于与第二目标视频片段匹配的目标反馈信息来确定。

至少基于所述第二文本信息生成专属贴纸可以包括：获取与所述目标视频相关的人脸图像；基于所述第二文本信息和所述人脸图像生成所述专属贴纸。从而能够生成包括人脸图像的专属贴纸。生成的专属贴纸例如可以使用视频播主指定的头像，也可以为从目标视频中获取的视频播主的头像。从而能够生成包括视频播主头像的专属贴纸，通过使用专属贴纸能够提高视频播主的认知度。

可以理解的是，也可以至少基于包括人脸的第一目标视频片段生成专属贴纸。具体的生成方法与第二目标视频片段相同，在此不再详述。

以上内容中是基于与目标反馈信息匹配的目标视频片段来生成专属表情包。

根据另一些实施例，所述表情包生成方法还可以包括：响应于接收到第二触发指令，基于选择的设定视频片段生成专属表情。从而用户能够主动选择指定的视频片段生成专属表情(可以包括专属表情和/或专属贴纸，具体的生成方法与上面内容中基于目标视频片段生成专属表情相同)，灵活性更高，进一步提高用户体验。例如，可以在视频的指定位置显示一键转换图标，视频播主可以通过点击一键转换图标来输入第二触发指令。

视频播主可以但不限于在已录制好的录制视频中选择所述设定视频片段，以用于生成专属表情。

以上内容中描述了在制作完成专属表情包之后，可以推送给视频播主和其它用户，以供选择使用。

根据另一些实施例，也可以自动从专属表情包中选择合适的专属表情添加到预设视频中。在这种情况下，所述表情包生成方法还可以包括：将所述专属表情包中的至少一部分专属表情与预设视频进行匹配；基于匹配结果确定与所述预设视频匹配的至少一个专属表情；以及基于匹配结果确定所述预设视频中与所述至少一个专属表情中的每一个专属表情匹配的匹配视频片段，从而在播放所述预设视频的过程中，能够在播放所述匹配视频片段时推送与该匹配视频片段相应的所述专属表情。由此，通过在预设视频与专属表情包之间建立关联，从而在播放视频时，能够自动在播放匹配视频片段时推送相应的专属表情。

所述预设视频可以与所述目标视频相关。例如，所述预设视频和所述目标视频可以涉及同一视频播主。从而能够在视频播主的预设视频与视频播主的专属表情包之间建立关联，在播放所述预设视频时，能够自动推送相应的专属表情。

所述预设视频可以为视频库中存储的历史视频，也可以为获取的视频播主当前上传的视频。多媒体平台可以每隔一段时间获取视频库中新增加的更新视频，并将相应的视频播主的专属表情包中的至少一部分专属表情与新增加的更新视频进行匹配，从而能够在视频播主上传的视频与其专属表情包之间建立关联。

根据一些实施例，所述表情包生成方法还可以包括：建立所述专属表情包的关联数据库，所述关联数据库包括所述至少一个专属表情与至少一个所述匹配视频片段之间的相应关系。从而能够便于后续播放该匹配视频片段的过程中，从关联数据库中获取并推送相应的专属表情。

在一个示例性实施例中，所述表情包生成方法还可以包括：获取所述至少一个匹配视频片段的播放时间信息。所述关联数据库还可以包括所述至少一个所述匹配视频片段与至少一个播放时间信息(即所述至少一个所述匹配视频片段各自相应的至少一个播放时间信息)之间的相应关系。从而在所述预设视频的播放过程中，可以根据播放时间信息来推送相应的专属表情，能够快速匹配到与所述至少一个专属表情相应的播放时间，提高推送效率。所述播放时间信息可以为在所述预设视频的播放过程中播放相应的匹配视频片段的时间段。

根据本公开的另一方面，还提供一种表情包生成设备。如图4所示，表情包生成设备100可以包括：获取单元101，被配置用于获取目标视频的多个相关视频的至少一条目标反馈信息，所述目标视频和所述多个相关视频涉及同一视频播主；匹配单元102，被配置用于将所述至少一条目标反馈信息与所述目标视频进行匹配；确定单元103，被配置用于基于所述匹配单元的匹配结果从所述目标视频中确定至少一个目标视频片段；以及生成单元104，被配置用于至少基于所述至少一个目标视频片段生成专属表情包。

这里，表情包生成设备100的上述各单元101-104的操作分别与前面描述的步骤S101-S104的操作类似，在此不再赘述。

根据本公开的另一方面，还提供一种电子设备，可以包括：处理器；以及存储程序的存储器，所述程序包括指令，所述指令在由所述处理器执行时使所述处理器执行根据上述的表情包生成方法。

参见图5所示，现将描述计算设备2000，其是可以应用于本公开的各方面的硬件设备(电子设备)的示例。计算设备2000可以是被配置为执行处理和/或计算的任何机器，可以是但不限于工作站、服务器、台式计算机、膝上型计算机、平板计算机、个人数字助理、机器人、智能电话、车载计算机或其任何组合。上述表情包生成方法可以全部或至少部分地由计算设备2000或类似设备或系统实现。

计算设备2000可以包括(可能经由一个或多个接口)与总线2002连接或与总线2002通信的元件。例如，计算设备2000可以包括总线2002、一个或多个处理器2004、一个或多个输入设备2006以及一个或多个输出设备2008。一个或多个处理器2004可以是任何类型的处理器，并且可以包括但不限于一个或多个通用处理器和/或一个或多个专用处理器(例如特殊处理芯片)。输入设备2006可以是能向计算设备2000输入信息的任何类型的设备，并且可以包括但不限于鼠标、键盘、触摸屏、麦克风和/或遥控器。输出设备2008可以是能呈现信息的任何类型的设备，并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。计算设备2000还可以包括非暂时性存储设备2010或者与非暂时性存储设备2010连接，非暂时性存储设备可以是非暂时性的并且可以实现数据存储的任何存储设备，并且可以包括但不限于磁盘驱动器、光学存储设备、固态存储器、软盘、柔性盘、硬盘、磁带或任何其他磁介质，光盘或任何其他光学介质、ROM(只读存储器)、RAM(随机存取存储器)、高速缓冲存储器和/或任何其他存储器芯片或盒、和/或计算机可从其读取数据、指令和/或代码的任何其他介质。非暂时性存储设备2010可以从接口拆卸。非暂时性存储设备2010可以具有用于实现上述方法和步骤的数据/程序(包括指令)/代码。计算设备2000还可以包括通信设备2012。通信设备2012可以是使得能够与外部设备和/或与网络通信的任何类型的设备或系统，并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信设备和/或芯片组，例如蓝牙 ^TM设备、1302.11设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。

计算设备2000还可以包括工作存储器2014，其可以是可以存储对处理器2004的工作有用的程序(包括指令)和/或数据的任何类型的工作存储器，并且可以包括但不限于随机存取存储器和/或只读存储器设备。

软件要素(程序)可以位于工作存储器2014中，包括但不限于操作系统2016、一个或多个应用程序2018、驱动程序和/或其他数据和代码。用于执行上述方法和步骤的指令可以被包括在一个或多个应用程序2018中，并且上述表情包生成方法可以通过由处理器2004读取和执行一个或多个应用程序2018的指令来实现。更具体地，上述表情包生成方法中，步骤S101-步骤S104可以例如通过处理器2004执行具有步骤S101-步骤S104的指令的应用程序2018而实现。此外，上述表情包生成方法中的其它步骤可以例如通过处理器2004执行具有执行相应步骤中的指令的应用程序2018而实现。软件要素(程序)的指令的可执行代码或源代码可以存储在非暂时性计算机可读存储介质(例如上述存储设备2010)中，并且在执行时可以被存入工作存储器2014中(可能被编译和/或安装)。软件要素(程序)的指令的可执行代码或源代码也可以从远程位置下载。

还应该理解，可以根据具体要求而进行各种变型。例如，也可以使用定制硬件，和/或可以用硬件、软件、固件、中间件、微代码，硬件描述语言或其任何组合来实现特定元件。例如，所公开的方法和设备中的一些或全部可以通过使用根据本公开的逻辑和算法，用汇编语言或硬件编程语言(诸如VERILOG，VHDL，C++)对硬件(例如，包括现场可编程门阵列(FPGA)和/或可编程逻辑阵列(PLA)的可编程逻辑电路)进行编程来实现。

还应该理解，前述方法可以通过服务器-客户端模式来实现。例如，客户端可以接收用户输入的数据并将所述数据发送到服务器。客户端也可以接收用户输入的数据，进行前述方法中的一部分处理，并将处理所得到的数据发送到服务器。服务器可以接收来自客户端的数据，并且执行前述方法或前述方法中的另一部分，并将执行结果返回给客户端。客户端可以从服务器接收到方法的执行结果，并例如可以通过输出设备呈现给用户。

还应该理解，计算设备2000的组件可以分布在网络上。例如，可以使用一个处理器执行一些处理，而同时可以由远离该一个处理器的另一个处理器执行其他处理。计算系统2000的其他组件也可以类似地分布。这样，计算设备2000可以被解释为在多个位置执行处理的分布式计算系统。

虽然已经参照附图描述了本公开的实施例或示例，但应理解，上述的方法、系统和设备仅仅是示例性的实施例或示例，本发明的范围并不由这些实施例或示例限制，而是仅由授权后的权利要求书及其等同范围来限定。实施例或示例中的各种要素可以被省略或者可由其等同要素替代。此外，可以通过不同于本公开中描述的次序来执行各步骤。进一步地，可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进，在此描述的很多要素可以由本公开之后出现的等同要素进行替换。

Claims

一种表情包生成方法，包括：

获取目标视频的多个相关视频的至少一条目标反馈信息，所述目标视频和所述多个相关视频涉及同一视频播主；

将所述至少一条目标反馈信息与所述目标视频进行匹配；

基于匹配结果从所述目标视频中确定至少一个目标视频片段；以及

至少基于所述至少一个目标视频片段生成专属表情包。
如权利要求1所述的表情包生成方法，其中，所述专属表情包包括专属动效表情，所述目标视频片段包括第一目标视频片段；

所述表情包生成方法还包括：

在所述生成专属表情包之前，对每一个所述目标视频片段进行目标识别；

基于识别结果确定该目标视频片段中是否包括所述视频播主；以及

响应于确定该目标视频片段中包括所述视频播主，将该目标视频片段确定为所述第一目标视频片段，

其中，所述生成专属表情包包括：至少基于所述第一目标视频片段生成专属动效表情。
如权利要求2所述的表情包生成方法，其中，至少基于所述第一目标视频片段生成专属动效表情包括：

确定与所述第一目标视频片段相应的第一文本信息；

基于所述第一目标视频片段和相应的第一文本信息生成专属动效表情。
如权利要求3所述的表情包生成方法，其中，所述第一文本信息为基于所述第一目标视频片段中的字幕或音频相应的文本来确定。
如权利要求2所述的表情包生成方法，其中，至少基于所述第一目标视频片段生成专属动效表情为响应于接收到第一触发指令而执行。
如权利要求2所述的表情包生成方法，其中，所述专属表情还包括专属贴纸，所述目标视频片段包括第二目标视频片段；

所述表情包生成方法还包括：

响应于确定所述目标视频片段中不包括所述视频播主，将该目标视频片段确定为所述第二目标视频片段，

其中，所述生成专属表情包还包括：

确定与所述第二目标视频片段相应的第二文本信息；以及

至少基于所述第二文本信息生成专属贴纸。
如权利要求6所述的表情包生成方法，其中，至少基于所述第二文本信息生成专属贴纸包括：

获取与所述目标视频相关的人脸图像；

基于所述第二文本信息和所述人脸图像生成所述专属贴纸。
如权利要求6所述的表情包生成方法，其中，所述第二文本信息为基于所述第二目标视频片段中的字幕或音频相应的文本来确定。
如权利要求1-8中任一项所述的表情包生成方法，所述表情包生成方法还包括：

响应于接收到第二触发指令，基于选择的设定视频片段生成专属表情。
如权利要求1-8中任一项所述的表情包生成方法，其中，获取目标视频的多个相关视频的至少一条目标反馈信息包括：

获取所述多个相关视频中的每一个所述相关视频的至少一条反馈信息；

对所述多个相关视频的多条反馈信息进行语义匹配；

基于语义匹配结果将所述多条反馈信息划分为多个反馈信息组；

将所述多个反馈信息组中所包括反馈信息的数量大于阈值的至少一个反馈信息组确定为目标反馈信息组；以及

基于每一个所述目标反馈信息组中的多条反馈信息确定该目标反馈信息组相应的所述目标反馈信息。
如权利要求1-8中任一项所述的表情包生成方法，还包括：

在所述获取目标视频的多个相关视频的至少一条目标反馈信息之前，确定所述多个相关视频的反馈信息的总数量是否不小于设定值；

响应于确定所述多个相关视频的反馈信息的总数量小于所述设定值，推送引导信息，以引导用户输入针对所述目标视频的反馈信息。
如权利要求1-8中任一项所述的表情包生成方法，其中，将所述至少一条目标反馈信息与所述目标视频进行匹配包括：

将所述至少一条目标反馈信息中的每一条所述目标反馈信息与所述目标视频的至少部分字幕或至少部分音频相应的文本进行语义匹配，

其中，从所述目标视频中确定至少一个目标视频片段为基于所述语义匹配结果而执行。
如权利要求1-8中任一项所述的表情包生成方法，还包括：

将所述专属表情包中的至少一部分专属表情与预设视频进行匹配；

基于匹配结果确定与所述预设视频匹配的至少一个专属表情；以及

基于匹配结果确定所述预设视频中与所述至少一个专属表情中的每一个专属表情匹配的匹配视频片段，从而在播放所述预设视频的过程中，能够在播放所述匹配视频片段时推送与该匹配视频片段相应的所述专属表情。
如权利要求13所述的表情包生成方法，还包括：

建立所述专属表情包的关联数据库，所述关联数据库包括所述至少一个专属表情与至少一个所述匹配视频片段之间的相应关系。
如权利要求14所述的表情包生成方法，还包括：

获取所述至少一个匹配视频片段的播放时间信息，

其中，所述关联数据库还包括所述至少一个所述匹配视频片段与至少一个播放时间信息之间的相应关系。
如权利要求13所述的表情包生成方法，其中，所述预设视频和所述目标视频涉及同一视频播主。
一种表情包生成设备，包括：

获取单元，被配置用于获取目标视频的多个相关视频的至少一条目标反馈信息，所述目标视频和所述多个相关视频涉及同一视频播主；

匹配单元，被配置用于将所述至少一条目标反馈信息与所述目标视频进行匹配；

确定单元，被配置用于基于所述匹配单元的匹配结果从所述目标视频中确定至少一个目标视频片段；以及

生成单元，被配置用于至少基于所述至少一个目标视频片段生成专属表情包。
一种电子设备，包括：

处理器；以及

存储程序的存储器，所述程序包括指令，所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-16中任一项所述的表情包生成方法。
一种存储程序的计算机可读存储介质，所述程序包括指令，所述指令在由电子设备的处理器执行时，致使所述电子设备执行根据权利要求1-16中任一项所述的表情包生成方法。