CN114827654B

CN114827654B - 一种视频搜索方法、装置、设备及存储介质

Info

Publication number: CN114827654B
Application number: CN202110066117.XA
Authority: CN
Inventors: 陈姿
Original assignee: Tencent Technology Beijing Co Ltd
Current assignee: Tencent Technology Beijing Co Ltd
Priority date: 2021-01-19
Filing date: 2021-01-19
Publication date: 2024-05-03
Anticipated expiration: 2041-01-19
Also published as: CN114827654A

Abstract

本申请实施例提供了一种视频搜索方法、装置、设备及存储介质，涉及人工智能技术领域，该方法具体为：终端设备向服务器发送携带视频搜索条件的搜索请求。服务器基于视频搜索条件，从搜索库中确定相应的至少一个匹配视频，以及至少一个匹配视频包含的与视频搜索条件匹配的至少一个视频片段的播放时间信息，并向终端设备返回至少一个匹配视频的提示信息以及至少一个视频片段的播放时间信息。终端设备展示服务器返回的提示信息和播放时间信息。将搜索库中包含至少一个与视频搜索条件匹配的视频片段的视频作为匹配视频，故搜索获得的匹配视频不仅限于运营人员上传与视频搜索条件匹配的视频片段，增加了搜索获得的视频量，进而提升用户观看视频的体验。

Description

一种视频搜索方法、装置、设备及存储介质

技术领域

本发明实施例涉及人工智能技术领域，尤其涉及一种视频搜索方法、装置、设备及存储介质。

背景技术

目前在搜索视频时，后台主要基于运营人员或者用户上传的视频片段的标题文字与搜索条件进行匹配，获得搜索内容。然而，运营人员或者用户上传的视频片段的数量一般较少，从而导致搜索获得视频较少。

发明内容

本申请实施例提供了一种视频搜索方法、装置、设备及存储介质，用于提高搜索获得的视频量，进而提升用户观看视频的体验。

一方面，本申请实施例提供了一种视频搜索方法，该方法包括：

终端设备响应于视频搜索操作，获得视频搜索条件；

所述终端设备向服务器发送携带所述视频搜索条件的搜索请求，以使所述服务器基于所述视频搜索条件，从搜索库中确定相应的至少一个匹配视频，以及所述至少一个匹配视频包含的与所述视频搜索条件匹配的至少一个视频片段的播放时间信息，并向所述终端设备返回所述至少一个匹配视频的提示信息，以及所述至少一个视频片段的播放时间信息；

所述终端设备在显示界面中，展示所述至少一个匹配视频的提示信息，以及展示所述至少一个视频片段的播放时间信息。

服务器接收终端设备发送的携带视频搜索条件的搜索请求，所述视频搜索条件是终端设备响应于视频搜索操作时获取的；

所述服务器基于所述视频搜索条件，从搜索库中确定相应的至少一个匹配视频，以及所述至少一个匹配视频包含的与所述视频搜索条件匹配的至少一个视频片段的播放时间信息；

所述服务器向所述终端设备返回所述至少一个匹配视频的提示信息，以及所述至少一个视频片段的播放时间信息，以使终端设备在显示界面中，展示所述至少一个匹配视频的提示信息，以及所述至少一个视频片段的播放时间信息。

一方面，本申请实施例提供了一种视频搜索装置，该装置包括：

获取模块，用于响应于视频搜索操作，获得视频搜索条件；

第一发送模块，用于向服务器发送携带所述视频搜索条件的搜索请求，以使所述服务器基于所述视频搜索条件，从搜索库中确定相应的至少一个匹配视频，以及所述至少一个匹配视频包含的与所述视频搜索条件匹配的至少一个视频片段的播放时间信息，并向所述终端设备返回所述至少一个匹配视频的提示信息，以及所述至少一个视频片段的播放时间信息；

展示模块，用于在显示界面中，展示所述至少一个匹配视频的提示信息，以及展示所述至少一个视频片段的播放时间信息。

可选地，所述获取模块还用于：

在显示界面中，展示所述至少一个匹配视频的提示信息，以及所述至少一个视频片段的播放时间信息之后，响应于在所述显示界面触发的点击播放时间信息的操作，从展示的各个播放时间信息中，确定被点击的目标播放时间信息；

所述第一发送模块，还用于向服务器发送携带所述目标播放时间信息的播放请求，以使所述服务器向所述终端设备返回所述目标播放时间信息对应的目标视频片段；

所述显示模块，还用于在显示界面中，播放所述目标视频片段。

可选地，所述展示模块具体用于：

针对所述至少一个匹配视频中的各个匹配视频，分别执行以下步骤：

针对一个匹配视频，从所述服务器获取所述一个匹配视频包含的与所述视频搜索条件匹配的各个视频片段对应的播放频率；

根据所述各个视频片段对应的播放频率，对所述各个视频片段进行排序，获得排序结果；

根据所述排序结果，展示所述各个视频片段在所述一个匹配视频中对应的播放时间信息。

接收模块，用于接收终端设备发送的携带视频搜索条件的搜索请求，所述视频搜索条件是终端设备响应于视频搜索操作时获取的；

搜索模块，用于基于所述视频搜索条件，从搜索库中确定相应的至少一个匹配视频，以及所述至少一个匹配视频包含的与所述视频搜索条件匹配的至少一个视频片段的播放时间信息；

第二发送模块，用于向所述终端设备返回所述至少一个匹配视频的提示信息，以及所述至少一个视频片段的播放时间信息，以使终端设备在显示界面中，展示所述至少一个匹配视频的提示信息，以及所述至少一个视频片段的播放时间信息。

可选地，还包括处理模块；

所述处理模块具体用于：

在所述接收模块接收终端设备发送的携带视频搜索条件的搜索请求之前，基于待搜索人物的人物标识，从搜索库中获取所述待搜索人物关联的至少一个视频；

所述服务器针对所述至少一个视频中的各个视频，分别执行以下步骤：

针对一个视频，识别所述一个视频包含的所述待搜索人物的至少一种人体特征信息；

基于所述至少一种人体特征信息，确定所述一个视频中包含所述至少一种人体特征信息的各个视频片段，以及所述各个视频片段分别在所述一个视频中的播放时间信息；

将所述至少一种人体特征信息作为视频搜索条件，和所述一个视频以及所述一个视频中包含所述至少一种人体特征信息的各个视频片段分别在所述一个视频中的播放时间信息，关联保存在所述搜索库中。

可选地，所述处理模块具体用于：

分别统计所述一个视频中包含所述至少一种人体特征信息的各个视频片段的播放频率；

将所述至少一种人体特征信息作为视频搜索条件，和所述一个视频、所述一个视频中包含所述至少一种人体特征信息的各个视频片段的播放频率以及所述各个视频片段在所述一个视频中对应的播放时间信息关联保存在所述搜索库中。

可选地，所述人体特征信息为以下信息中的任意一种或组合：

表情特征信息、动作特征信息。

可选地，所述视频搜索条件至少包括目标人物的目标人体特征信息；

所述搜索模块具体用于：

基于所述目标人物的人物标识从所述搜索库中，获取所述目标人物关联的至少一个视频；

针对所述至少一个视频中的各个视频，分别执行以下操作：

针对一个视频，在确定与所述一个视频关联保存的至少一种人体特征信息中，存在与所述目标人物的目标人体特征信息匹配的人体特征信息时，将所述一个视频作为匹配视频，并获取所述一个视频中包含所述目标人物的目标人体特征信息的各个视频片段在所述一个视频中对应的播放时间信息。

一方面，本申请实施例提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述视频搜索方法的步骤。

一方面，本申请实施例提供了一种计算机可读存储介质，其存储有可由计算机设备执行的计算机程序，当所述程序在计算机设备上运行时，使得所述计算机设备执行上述视频搜索方法的步骤。

本申请实施例中，服务器基于视频搜索条件进行搜索时，将搜索库中包含至少一个与视频搜索条件匹配的视频片段的视频作为匹配视频，故搜索获得的匹配视频不仅限于运营人员或者用户上传与视频搜索条件匹配的视频片段，还有包含与视频搜索条件匹配的视频片段的视频，从而大大增加了搜索获得的视频量，进而提升用户观看视频的体验。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种系统架构示意图；

图2为本申请实施例提供的一种视频搜索方法的流程示意图；

图3为本申请实施例提供的一种视频应用的显示界面示意图；

图4为本申请实施例提供的一种视频应用的显示界面示意图；

图5为本申请实施例提供的一种视频应用的显示界面示意图；

图6为本申请实施例提供的一种视频应用的显示界面示意图；

图7为本申请实施例提供的一种视频应用的显示界面示意图；

图8为本申请实施例提供的一种视频应用的显示界面示意图；

图9为本申请实施例提供的一种视频应用的显示界面示意图；

图10为本申请实施例提供的一种视频应用的显示界面示意图；

图11为本申请实施例提供的一种视频应用的显示界面示意图；

图12为本申请实施例提供的一种表情识别方法的流程示意图；

图13为本申请实施例提供的一种模型训练方法的流程示意图；

图14为本申请实施例提供的一种视频搜索装置的结构示意图；

图15为本申请实施例提供的一种视频搜索装置的结构示意图；

图16为本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

为了方便理解，下面对本发明实施例中涉及的名词进行解释。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。比如，本申请实施例中采用机器学习，识别视频中包含的目标人物的目标人体特征信息，进而确定视频中包含目标人物的目标人体特征信息的各个视频片段。

余弦相似度：又称为余弦相似性，是通过计算两个向量的夹角余弦值来评估他们的相似度。最常见的应用就是计算文本相似度。将两个文本根据他们词，建立两个向量，计算这两个向量的余弦值，就可以知道两个文本在统计学方法中他们的相似度情况。实践证明，这是一个非常有效的方法。

Adam优化算法：Adam是一种可以替代传统随机梯度下降过程的一阶优化算法，它能基于训练数据迭代地更新神经网络权重。

下面对本申请实施例的设计思想进行介绍。

目前在搜索视频时，后台主要基于运营人员或者用户上传的视频片段的标题文字与搜索条件进行匹配，获得搜索结果。然而，运营人员或者用户上传的视频片段的数量一般较少，从而导致搜索获得的视频较少。

考虑到视频搜索库中的视频并不仅仅是运营人员或者用户上传的视频片段，还包括各类其他视频，比如影视剧视频、纪录片、综艺视频等。这些视频中也包含与视频搜索条件匹配的视频片段。若将这些视频作为搜索结果返回给用户，将大大增加搜索获得的视频量，从而提升用户观看视频的体验。

鉴于此，本申请实施例提供了一种视频搜索方法，该方法具体为：终端设备响应于视频搜索操作，获得视频搜索条件，然后向服务器发送携带视频搜索条件的搜索请求。服务器基于视频搜索条件，从搜索库中确定相应的至少一个匹配视频，以及至少一个匹配视频包含的与视频搜索条件匹配的至少一个视频片段的播放时间信息，并向终端设备返回至少一个匹配视频的提示信息，以及至少一个视频片段的播放时间信息。终端设备在显示界面中，展示至少一个匹配视频的提示信息，以及展示至少一个视频片段的播放时间信息。

进一步地，终端设备响应于在显示界面触发的点击播放时间信息的操作，从展示的各个播放时间信息中，确定被点击的目标播放时间信息，然后向服务器发送携带目标播放时间信息的播放请求。服务器向终端设备返回目标播放时间信息对应的目标视频片段。终端设备在显示界面中，播放目标视频片段。

由于服务器不仅向终端设备返回了匹配视频的提示信息，还返回了匹配视频包含的与视频搜索条件匹配的至少一个视频片段的播放时间信息，故用户可以根据需要点击播放时间信息，来观看匹配视频中的视频片段，而不需要用户自己手动定位到想要观看的视频位置，减少用户手动搜索的时间，提高用户的观看体验。

参考图1，其为本申请实施例适用的一种系统架构图，该系统架构至少包括终端设备101、服务器102和搜索库103。

终端设备101预先安装视频应用，视频应用可以是预先安装的客户端应用、网页版应用、小程序等。终端设备101可以包括一个或多个处理器1011、存储器1012、与服务器102交互的I/O接口1013以及显示面板1014等。终端设备101可以是车载系统、智能音箱、智能电视、智能手机、平板电脑、笔记本电脑、台式计算机等，但并不局限于此。

服务器102为视频应用对应的后台服务器，为视频应用提供服务。服务器102可以包括一个或多个处理器1021、存储器1022以及与终端设备101交互的I/O接口1023等。此外，服务器102还可以配置数据库1024。服务器102可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备101与服务器102可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

终端设备101响应于视频搜索操作，获得视频搜索条件。然后向服务器102发送携带视频搜索条件的搜索请求。服务器102基于视频搜索条件，从搜索库103中确定相应的至少一个匹配视频，以及至少一个匹配视频包含的与视频搜索条件匹配的至少一个视频片段的播放时间信息，并向终端设备101返回至少一个匹配视频的提示信息，以及至少一个视频片段的播放时间信息。终端设备101在显示界面中，展示至少一个匹配视频的提示信息，以及展示至少一个视频片段的播放时间信息。

需要说明的是，搜索库103可以是独立于服务器102的搜索库，也可以是位于服务器102内的搜索库，对此，本申请不做具体限定。

基于图1所示的系统架构图，本申请实施例提供了一种视频搜索方法的流程，如图2所示，该方法的流程由终端设备101和服务器102交互执行，包括以下步骤：

步骤S201，终端设备响应于视频搜索操作，获得视频搜索条件。

具体地，视频搜索操作可以是基于文本的视频搜索操作，也可以是基于语音的视频搜索操作，视频搜索条件可以是人物标识、人体特征信息等，其中人体特征信息包括表情特征信息和/或动作特征信息。

示例性地，用户启动视频应用后，视频应用显示视频应用首页，如图3所示，视频应用首页中包括视频类别301、搜索框302以及推荐视频303。用户点击搜索框后，终端设备显示搜索界面，如图4所示，搜索界面中包括搜索框302、历史搜索401以及推荐搜索402。

用户可以基于文本进行视频搜索时，如图5所示，用户在搜索框302中输入搜索词条“王某大哭”后点击“搜索”按钮。

用户也可以基于语音进行视频搜索时，如图6所示，用户长按搜索框302中的麦克风图标，说出“王某大哭”的语音后结束长按操作。

步骤S202，终端设备向服务器发送携带视频搜索条件的搜索请求。

步骤S203，服务器基于视频搜索条件，从搜索库中确定相应的至少一个匹配视频，以及至少一个匹配视频包含的与视频搜索条件匹配的至少一个视频片段的播放时间信息。

具体地，匹配视频为包含至少一个与视频搜索条件匹配的视频片段的视频，匹配视频可以是影视剧视频、记录片、综艺视频等，也可以是运营人员或用户上传的剪辑过的视频片段。

步骤S204，服务器向终端设备返回至少一个匹配视频的提示信息，以及至少一个视频片段的播放时间信息。

步骤S205，终端设备在显示界面中，展示至少一个匹配视频的提示信息，以及展示至少一个视频片段的播放时间信息。

具体地，匹配视频的提示信息可以是匹配视频的封面图片、名称、简介、相关人物标识、视频时长、视频评分等。视频片段的播放时间信息可以是视频片段在对应的匹配视频中的起始播放时间点，也可以是视频片段在对应的匹配视频中的结束播放时间点，还可以是视频片段在对应的匹配视频中的播放时间段。

示例性地，设定基于视频搜索条件“王某大哭”获得的匹配视频为两个，分别为电影A和电影B，其中，电影A中包括3个与视频搜索条件“王某大哭”匹配的视频片段。电影B中包括2个与视频搜索条件“王某大哭”匹配的视频片段。

当匹配视频的提示信息为匹配视频的封面图片和名称，视频片段的播放时间信息为视频片段在对应的匹配视频中的起始播放时间点时，如图7所示，显示界面中显示电影A的封面图片，在电影A的封面图片下方显示电影A的名称以及电影A中3个匹配视频片段在电影A中的起始播放时间点，分别为00:10分、01:30分和01:40分三个起始播放时间点。显示界面中显示电影B的封面图片，在电影B的封面图片下方显示电影B的名称以及电影B中2个匹配视频片段在电影B中的起始播放时间点，分别为00:30分和01:20分两个起始播放时间点。

当匹配视频的提示信息为匹配视频的封面图片和名称，视频片段的播放时间信息为视频片段在对应的匹配视频中的播放时间段时，如图8所示，显示界面中显示电影A的封面图片，在电影A的封面图片下方显示电影A的名称以及电影A中3个匹配视频片段在电影A中的播放时间段，分别为00:10分～00:15分、01:30分～01:32分和01:40分～01:45分三个播放时间段。显示界面中显示电影B的封面图片，在电影B的封面图片下方显示电影B的名称以及电影B中2个匹配视频片段在电影B中的播放时间段，分别为00:30分～00:35分和01:20分～01:35分两个播放时间段。

本申请实施例中，服务器基于视频搜索条件进行搜索时，将搜索库中包含至少一个与视频搜索条件匹配的视频片段的视频作为匹配视频，故搜索获得的匹配视频不仅限于运营人员或者用户上传与视频搜索条件匹配的视频片段，还包括包含与视频搜索条件匹配的视频片段的视频，从而大大增加了搜索获得的视频量，进而提升用户观看视频的体验。

可选地，在上述步骤S205中，终端设备展示至少一个视频片段的播放时间信息时，本申请实施例至少提供以下两种实施方式：

实施方式一、针对至少一个匹配视频中的各个匹配视频，分别执行以下步骤：针对一个匹配视频，终端设备从服务器获取一个匹配视频包含的与视频搜索条件匹配的各个视频片段对应的播放频率。根据各个视频片段对应的播放频率，对各个视频片段进行排序，获得排序结果。然后根据排序结果，展示各个视频片段在一个匹配视频中对应的播放时间信息。

具体实施中，视频片段对应的播放频率是通过统计用户观看该视频片段的次数获得的。在统计过程中，可以当用户点击该视频片段对应的播放时间信息时，确定该视频片段被观看了一次。也可以当用户点击该视频片段对应的播放时间信息，并观看该视频片段的时长大于预设阈值时，确定该视频片段被观看了一次。对各个视频片段进行排序时，可以按照播放频率从大到小的顺序进行排序，也可以按照播放频率从小到大的顺序进行排序。

示例性地，如图9所示，设定基于视频搜索条件“王某大哭”获得的匹配视频为两个，分别为电影A和电影B，其中，电影A中包括3个与视频搜索条件“王某大哭”匹配的视频片段，分别为视频片段a1、视频片段a2和视频片段a3。视频片段a1的播放频率为4次，视频片段a2的播放频率为10次，视频片段a3的播放频率为5次。按照播放频率对3个视频片段进行排序，获得的排序结果为：视频片段a2、视频片段a3、视频片段a1。视频片段a1、视频片段a2和视频片段a3在电影A中对应的起始播放时间点分别为00:10分、01:30分和01:40分三个起始播放时间点。按照排序结果展示视频片段a1、视频片段a2和视频片段a3分别对应的起始播放时间点。

电影B中包括2个与视频搜索条件“王某大哭”匹配的视频片段，分别为视频片段b1和视频片段b2。视频片段b1的播放频率为6次，视频片段b2的播放频率为5次。按照播放频率对2个视频片段进行排序，获得的排序结果为：视频片段b1和视频片段b2。视频片段b1和视频片段b2在电影B中对应的起始播放时间点分别为00:30分和01:20分。按照排序结果展示视频片段b1和视频片段b2分别对应的起始播放时间点。

由于播放频率高的视频片段更有可能是用户想观看的视频片段，故按照各个视频片段对应的播放频率，对各个视频片段进行排序，获得排序结果，然后根据排序结果，展示各个视频片段在匹配视频中对应的播放时间信息，可以将播放频率高的视频片段的播放时间信息优先展示，便于用户快速找到想要观看的视频，既节约了用户观看视频的带宽资源，又提升用户的视频观看体验。

实施方式二、针对至少一个匹配视频中的各个匹配视频，分别执行以下步骤：针对一个匹配视频，终端设备从服务器获取一个匹配视频包含的与视频搜索条件匹配的各个视频片段对应的播放频率，以及各个视频片段与视频搜索条件的匹配度。根据各个视频片段对应的播放频率以及各个视频片段与视频搜索条件的匹配度，确定各个视频片段的展示影响值。根据各个视频片段的展示影响值对各个视频片段进行排序，获得排序结果。然后根据排序结果，展示各个视频片段在一个匹配视频中对应的播放时间信息。

具体实施中，预先设置播放频率以及匹配度分别对应的权重，然后针对每个视频片段，根据播放频率以及匹配度分别对应的权重对该视频片段对应的播放频率以及匹配度进行加权求和，获得该视频片段的展示影响值。对各个视频片段进行排序时，可以按照展示影响值从大到小的顺序进行排序，也可以按照展示影响值从小到大的顺序进行排序，对此，本申请不做具体限定。

示例性地，如图10所示，设定基于视频搜索条件“王某大哭”获得的匹配视频为两个，分别为电影A和电影B，其中，电影A中包括3个与视频搜索条件“王某大哭”匹配的视频片段，分别为视频片段a1、视频片段a2和视频片段a3。视频片段a1的播放频率为5次，视频片段a2的播放频率为10次，视频片段a3的播放频率为5次。对播放频率归一化处理后，获得视频片段a1的播放频率为0.25，视频片段a2的播放频率为0.5，视频片段a3的播放频率为0.25。视频片段a1、视频片段a2和视频片段a3与视频搜索条件“王某大哭”的匹配度分别为0.8、0.9、0.7。

设定播放频率的权重为0.8，匹配度的权重为0.2，则视频片段a1对应的展示影响值为0.8×0.25+0.2×0.8＝0.36，视频片段a2对应的展示影响值为0.8×0.5+0.2×0.9＝0.58，视频片段a3对应的展示影响值为0.8×0.25+0.2×0.7＝0.34。按照展示影响值对3个视频片段进行排序，获得的排序结果为：视频片段a2、视频片段a1、视频片段a3。视频片段a1、视频片段a2和视频片段a3在电影A中对应的起始播放时间点分别为00:10分、01:30分和01:40分三个起始播放时间点。按照排序结果展示视频片段a1、视频片段a2和视频片段a3分别对应的起始播放时间点。

电影B中包括2个与视频搜索条件“王某大哭”匹配的视频片段，分别为视频片段b1和视频片段b2。视频片段b1的播放频率为5次，视频片段b2的播放频率为15次。对播放频率归一化处理后，获得视频片段b1的播放频率为0.25，视频片段b2的播放频率为0.75。视频片段b1和视频片段b2与视频搜索条件“王某大哭”的匹配度分别为0.8、0.9。

设定播放频率的权重为0.8，匹配度的权重为0.2，则视频片段b1对应的展示影响值为0.8×0.25+0.2×0.8＝0.36，视频片段b2对应的展示影响值为0.8×0.75+0.2×0.9＝0.78，按照展示影响值对2个视频片段进行排序，获得的排序结果为：视频片段b2、视频片段b1。视频片段b1和视频片段b2在电影B中对应的起始播放时间点分别为00:30分和01:20分。按照排序结果展示视频片段b1和视频片段b2分别对应的起始播放时间点。

按照各个视频片段对应的播放频率和各个视频片段与视频搜索条件的匹配度，确定各个视频片段的展示影响值，然后基于展示影响值对各个视频片段进行排序，获得排序结果。根据排序结果，展示各个视频片段在匹配视频中对应的播放时间信息，可以将播放频率高，且匹配度高的视频片段的播放时间信息优先展示，便于用户快速找到想要观看的视频，既节约了用户观看视频的带宽资源，又提升用户的视频观看体验。

需要说明的是，本申请实施例中展示匹配视频中与视频搜索条件匹配的至少一个视频片段的播放时间信息的实施方式并不仅限于上述两种，还可以是其他实施方式，比如，按照时间先后顺序进行展示等，对此，本申请不做具体限定。

可选地，终端设备在显示界面中，展示至少一个匹配视频的提示信息，以及至少一个视频片段的播放时间信息之后，终端设备响应于在显示界面触发的点击播放时间信息的操作，从展示的各个播放时间信息中，确定被点击的目标播放时间信息。终端设备向服务器发送携带目标播放时间信息的播放请求，服务器向终端设备返回目标播放时间信息对应的目标视频片段。终端设备在显示界面中，播放目标视频片段。

具体地，用户可以点击显示界面中展示的任意一个视频片段的播放时间信息。当用户点击一个视频片段的播放时间信息时，从服务器获取该视频片段，然后从该视频片段在匹配视频中的起始播放时间点开始播放匹配视频。

示例性地，设定基于视频搜索条件“王某大哭”获得的匹配视频为两个，分别为电影A和电影B，其中，电影A中包括3个与视频搜索条件“王某大哭”匹配的视频片段，分别为视频片段a1、视频片段a2、视频片段a3。电影B中包括2个与视频搜索条件“王某大哭”匹配的视频片段，分别为视频片段b1、视频片段b2。

如图7所示，显示界面中显示电影A的封面图片，在电影A的封面图片下方显示电影A的名称以及电影A中3个匹配视频片段在电影A中的起始播放时间点，分别为00:10分、01:30分和01:40分三个起始播放时间点。显示界面中显示电影B的封面图片，在电影B的封面图片下方显示电影B的名称以及电影B中2个匹配视频片段在电影B中的起始播放时间点，分别为00:30分和01:20分两个起始播放时间点。

当用户点击电影A中的起始播放时间点00:10分时，显示界面跳转至电影A的播放界面，如图11所示，从电影A的时间点00:10分开始播放电影A，直至电影A中视频片段a1播放完毕时结束播放。

可选地，服务器接收终端设备发送的携带视频搜索条件的搜索请求之前，服务器基于待搜索人物的人物标识，从搜索库中获取待搜索人物关联的至少一个视频。服务器针对至少一个视频中的各个视频，分别执行以下步骤：

针对一个视频，识别一个视频包含的待搜索人物的至少一种人体特征信息，然后基于至少一种人体特征信息，确定一个视频中包含至少一种人体特征信息的各个视频片段，以及各个视频片段分别在一个视频中的播放时间信息。再将至少一种人体特征信息作为视频搜索条件，和一个视频以及一个视频中包含至少一种人体特征信息的各个视频片段分别在一个视频中的播放时间信息，关联保存在搜索库中。

具体地，针对一种人体特征信息，确定一个视频中包含待搜索人物的一种人体特征信息的各个视频片段，以及各个视频片段分别在一个视频中的播放时间信息。将待搜索人物的一种人体特征信息作为视频搜索条件，和一个视频以及一个视频中包含待搜索人物的一种人体特征信息的各个视频片段分别在一个视频中的播放时间信息，关联保存在搜索库中。

人体特征信息为以下信息中的任意一种或组合：表情特征信息和动作特征信息。

可选地，当人体特征信息为表情特征信息时，针对一个视频，识别一个视频包含的待搜索人物的至少一种表情特征信息，然后基于待搜索人物的至少一种表情特征信息，确定一个视频中包含待搜索人物的至少一种表情特征信息的各个视频片段，以及各个视频片段分别在一个视频中的播放时间信息。再将待搜索人物的至少一种表情特征信息作为视频搜索条件，和一个视频以及一个视频中包含待搜索人物的至少一种表情特征信息的各个视频片段分别在一个视频中的播放时间信息，关联保存在搜索库中。

具体地，预先获取表情数据库，表情数据库具体可以是JAFFE表情数据库，JAFFE数据库包括KA、KL、KM、KR、MK、NA、NM、TM、UY、YM共10个不同的日本女性，每个人有AN、DI、FE、HA、NE、SA、SU共7种不同表情的人脸图像，分别为愤怒、厌恶、害怕、快乐、无表情、悲哀、惊讶，每种表情有3、4张样本图像，总数是213张样本图像，原始图像为256×256像素。

每一种表情建立一个标准模板，针对一个视频中的每个视频帧，首先通过人脸识别算法，确定一个视频中包含待搜索人物的目标视频帧。然后针对包含待搜索人物的各个目标视频帧，计算目标视频帧中待搜索人物的表情特征与各种表情的标准模板之间的余弦相似度，将余弦相似度最大的标准模板所对应的表情信息作为目标视频帧中的待搜索人物的表情特征信息。

具体实施中，可以通过表情提取系统获得待搜索人物的表情特征信息，表情提取系统包括表情提取模块、特征训练模块、数据库模块、训练分类模块。基于表情提取系统获得待搜索人物的表情特征信息的流程如图12所示，具体包括以下步骤：

步骤S1201，表情提取模块响应于运营人员的表情提取请求操作，获取目标视频id。

步骤S1202，表情提取模块基于目标视频id加载目标视频。

步骤S1203，针对目标视频中的各个视频帧，表情提取模块对各个视频帧进行人脸检测，获取各个视频帧中的人脸区域。

步骤S1204，表情提取模块通过人脸识别算法，确定各个视频帧中包含待搜索人物的目标视频帧。

步骤S1205，表情提取模块提取各个目标视频帧中待搜索人物的表情特征。

步骤S1206，表情提取模块将各个目标视频帧中待搜索人物的表情特征发送给训练分类模块。

步骤S1207，特征训练模块从数据库模块中获取各种表情的标准模板。

步骤S1208，特征训练模块提取各种表情的标准模板的表情特征。

步骤S1209，特征训练模块将各种表情的标准模板的表情特征发送给训练分类模块。

步骤S1210，训练分类模块计算每个目标视频帧中待搜索人物的表情特征与各种表情的标准模板之间的余弦相似度，将余弦相似度最大的标准模板所对应的表情信息作为待搜索人物的表情特征信息。

进一步地，根据各个目标视频帧在视频中的播放时间信息，确定一个视频中包含待搜索人物的至少一种表情特征信息的各个视频片段，以及各个视频片段分别在一个视频中的播放时间信息。再将待搜索人物的至少一种表情特征信息作为视频搜索条件，和一个视频以及一个视频中包含待搜索人物的至少一种表情特征信息的各个视频片段分别在一个视频中的播放时间信息，关联保存在搜索库中。

可选地，当人体特征信息为动作特征信息时，针对一个视频，识别一个视频包含的待搜索人物的至少一种动作特征信息，然后基于待搜索人物的至少一种动作特征信息，确定一个视频中包含待搜索人物的至少一种动作特征信息的各个视频片段，以及各个视频片段分别在一个视频中的播放时间信息。再将待搜索人物的至少一种动作特征信息作为视频搜索条件，和一个视频以及一个视频中包含待搜索人物的至少一种动作特征信息的各个视频片段分别在一个视频中的播放时间信息，关联保存在搜索库中。

具体地，先训练用于识别待搜索人物的动作特征信息的神经网络模型，训练过程具体包括以下步骤，如图13所示：

步骤S1301，数据预处理。

具体地，预先获取动作数据集，动作数据集中包括预设的每一种动作对应的标准模板，动作包括摔倒、爬行、跳跃、拥抱等。将数据集划分为训练集、验证集和测试集，并将数据打乱次序，设置数据并行方式。

步骤S1302，神经网络构建。

具体地，神经网络构建包括网络设计、网络参数初始化及防止过拟合设计。

步骤S1303，分类函数和损失函数定义。

具体地，动作识别属于多标签分类，对于多标签来说最常用的就是Softmax回归，原理是处理多分类任务时将可以判定为某类的特征进行相加，然后将特征转化为判定。损失函数是描述模型对问题的分类精度，即分类结果与真实值的偏差，通过不断减小它达到全局最优或局部最优，也是训练过程的目标。常见的损失函数有最小均方误差(MSE)、合页损失函数(hinge loss)和交叉熵函数(cross entropy loss)。对于Softmax回归最常用的损失函数即是交叉熵函数。

步骤S1304，优化器定义。

采用Adam优化算法来作为默认的优化算法。

步骤S1305，训练与验证。

通过不断迭代，以批处理(mini-batch)为单位将数据输入模型，同时计算梯度，更新学习参数，返回本次的准确率和损失函数。每隔一段时间使用验证集进行验证，用以在训练阶段评估模型的预测性能。通常情况下用k-fold方法划分训练集和验证集，在每一回合(epoch)或每次批处理(mini-batch)训练后，在该训练集和验证集上分别作网络前向运算，预测训练集和验证集样本标记(label)，绘制学习曲线来检验模型泛化能力。验证集与训练集不必分开，但测试集需要完全分开。

步骤S1306，测试。

训练获得神经网络模型后，针对一个视频中包含待搜索人物的目标视频帧，采用神经网络模型识别目标视频帧中的待搜索人物的动作特征信息。之后再根据各个目标视频帧在视频中的播放时间信息，确定一个视频中包含待搜索人物的至少一种表情特征信息的各个视频片段，以及各个视频片段分别在一个视频中的播放时间信息。再将待搜索人物的至少一种动作特征信息作为视频搜索条件，和一个视频以及一个视频中包含待搜索人物的至少一种动作特征信息的各个视频片段分别在一个视频中的播放时间信息，关联保存在搜索库中。

可选地，分别统计一个视频中包含至少一种人体特征信息的各个视频片段的播放频率，然后将至少一种人体特征信息作为视频搜索条件，和一个视频、一个视频中包含至少一种人体特征信息的各个视频片段的播放频率以及各个视频片段在一个视频中对应的播放时间信息关联保存在搜索库中。

具体实施中，视频片段对应的播放频率是通过统计用户观看该视频片段的次数获得的。在统计过程中，可以当用户点击该视频片段对应的播放时间信息时，确定该视频片段被观看了一次。也可以当用户点击该视频片段对应的播放时间信息，并观看该视频片段的时长大于预设阈值时，确定该视频片段被观看了一次。

另外，服务器还可以在分别统计一个视频中包含至少一种人体特征信息的各个视频片段的播放频率后，按照各个视频片段的播放频率对各个视频片段在一个视频中对应的播放时间信息进行排序，获得排序结果。然后将至少一种人体特征信息作为视频搜索条件，和一个视频、一个视频中包含至少一种人体特征信息的各个视频片段在一个视频中对应的播放时间信息以及排序结果，关联保存在搜索库中，故在用户搜索视频时，终端设备可以直接按照服务器返回的排序结果，展示一个视频中包含至少一种人体特征信息的各个视频片段在一个视频中对应的播放时间信息，优先展示播放频率高的视频片段的播放时间信息，便于用户快速找到想要观看的视频，提升用户的视频观看体验。同时，不需要终端设备在获取各个视频片段的播放频率之后再进行排序，从而降低了终端资源的占用。

可选地，服务器获取一个视频中包含至少一种人体特征信息的各个视频片段分别与至少一种人体特征信息之间的匹配度，然后将至少一种人体特征信息作为视频搜索条件，和一个视频、一个视频中包含至少一种人体特征信息的各个视频片段的播放频率、各个视频片段在一个视频中对应的播放时间信息以及各个视频片段分别与视频搜索条件的匹配度关联保存在搜索库中。

具体地，各个视频片段分别与至少一种人体特征信息之间的匹配度可以是各个视频片段分别与至少一种人体特征信息之间的余弦相似度。具体实施中，针对一个视频片段中的一个视频帧，先计算该视频帧与至少一种人体特征信息之间的余弦相似度，然后根据视频片段中各个视频帧分别与至少一种人体特征信息之间的余弦相似度，确定视频片段与至少一种人体特征信息之间的余弦相似度。

另外，服务器也可以根据各个视频片段对应的播放频率以及各个视频片段与视频搜索条件的匹配度，确定各个视频片段的展示影响值。根据各个视频片段的展示影响值对各个视频片段进行排序，获得排序结果。然后将至少一种人体特征信息作为视频搜索条件，和一个视频、一个视频中包含至少一种人体特征信息的各个视频片段的播放时间信息以及排序结果，关联保存在搜索库中，故在用户搜索视频时，终端设备可以直接按照服务器返回的排序结果，展示一个视频中包含至少一种人体特征信息的各个视频片段在一个视频中对应的播放时间信息，优先展示播放频率高，且匹配度高的视频片段的播放时间信息，便于用户快速找到想要观看的视频，提升用户的视频观看体验。同时，不需要终端设备在获取各个视频片段的播放频率以及各个视频片段与视频搜索条件的匹配度之后再进行排序，从而降低了终端资源的占用。

可选地，在步骤S203中，视频搜索条件至少包括目标人物的目标人体特征信息。服务器基于目标人物的人物标识从搜索库中，获取目标人物关联的至少一个视频。针对至少一个视频中的各个视频，分别执行以下操作：

针对一个视频，在确定与一个视频关联保存的至少一种人体特征信息中，存在与目标人物的目标人体特征信息匹配的人体特征信息时，将一个视频作为匹配视频，并获取一个视频中包含目标人物的目标人体特征信息的各个视频片段在一个视频中对应的播放时间信息。

具体地，人物标识可以是人物名称、人物描述信息等，目标人物关联的视频中可以包含目标人物的视频片段，也可以不包含目标人物的视频片段，比如，王某关联的电影中包括王某主演的电影和王某作为幕后人员制作的电影。

示例性地，设定视频搜索条件为“王某哭泣”，服务器基于人物标识“王某”从搜索库中，获取王某关联的至少一个视频。针对获取的视频中的任意一个视频，若与该视频关联保存的表情特征信息中存在“王某哭泣”时，将该视频作为匹配视频，并获取该视频中包含“王某哭泣”的各个视频片段在该视频中对应的播放时间信息。

示例性地，设定视频搜索条件为“李某摔倒”，服务器基于人物标识“李某”从搜索库中，获取李某关联的至少一个视频。针对获取的视频中的任意一个视频，若与该视频关联保存的动作特征信息中存在“李某摔倒”时，将该视频作为匹配视频，并获取该视频中包含“李某摔倒”的各个视频片段在该视频中对应的播放时间信息。

示例性地，设定视频搜索条件为“李某摔倒哭泣”，服务器基于人物标识“李某”从搜索库中，获取李某关联的至少一个视频。针对获取的视频中的任意一个视频，若与该视频关联保存的表情动作特征信息中存在“李某摔倒哭泣”时，将该视频作为匹配视频，并获取该视频中包含“李某摔倒哭泣”的各个视频片段在该视频中对应的播放时间信息。

本申请实施例中，将搜索库中包含至少一个与视频搜索条件匹配的视频片段的视频作为匹配视频，故搜索获得的匹配视频不仅限于运营人员或者用户上传与视频搜索条件匹配的视频片段，还包括包含与视频搜索条件匹配的视频片段的视频，从而大大增加了搜索获得的视频量，进而提升用户观看视频的体验。

基于相同的技术构思，本申请实施例提供了一种视频搜索装置，如图14所示，该装置1400包括：

获取模块1401，用于响应于视频搜索操作，获得视频搜索条件；

第一发送模块1402，用于向服务器发送携带所述视频搜索条件的搜索请求，以使所述服务器基于所述视频搜索条件，从搜索库中确定相应的至少一个匹配视频，以及所述至少一个匹配视频包含的与所述视频搜索条件匹配的至少一个视频片段的播放时间信息，并向所述终端设备返回所述至少一个匹配视频的提示信息，以及所述至少一个视频片段的播放时间信息；

展示模块1403，用于在显示界面中，展示所述至少一个匹配视频的提示信息，以及展示所述至少一个视频片段的播放时间信息。

可选地，所述获取模块1401还用于：

所述第一发送模块1402，还用于向服务器发送携带所述目标播放时间信息的播放请求，以使所述服务器向所述终端设备返回所述目标播放时间信息对应的目标视频片段；

所述显示模块1403，还用于在显示界面中，播放所述目标视频片段。

可选地，所述展示模块1403具体用于：

基于相同的技术构思，本申请实施例提供了一种视频搜索装置，如图15所示，该装置1500包括：

接收模块1501，用于接收终端设备发送的携带视频搜索条件的搜索请求，所述视频搜索条件是终端设备响应于视频搜索操作时获取的；

搜索模块1502，用于基于所述视频搜索条件，从搜索库中确定相应的至少一个匹配视频，以及所述至少一个匹配视频包含的与所述视频搜索条件匹配的至少一个视频片段的播放时间信息；

第二发送模块1503，用于向所述终端设备返回所述至少一个匹配视频的提示信息，以及所述至少一个视频片段的播放时间信息，以使终端设备在显示界面中，展示所述至少一个匹配视频的提示信息，以及所述至少一个视频片段的播放时间信息。

可选地，还包括处理模块1504；

所述处理模块1504具体用于：

可选地，所述处理模块1504具体用于：

表情特征信息、动作特征信息。

所述搜索模块1502具体用于：

针对所述至少一个视频中的各个视频，分别执行以下操作：

基于相同的技术构思，本申请实施例提供了一种计算机设备，计算机设备可以是终端或服务器，如图16所示，包括至少一个处理器1601，以及与至少一个处理器连接的存储器1602，本申请实施例中不限定处理器1601与存储器1602之间的具体连接介质，图16中处理器1601和存储器1602之间通过总线连接为例。总线可以分为地址总线、数据总线、控制总线等。

在本申请实施例中，存储器1602存储有可被至少一个处理器1601执行的指令，至少一个处理器1601通过执行存储器1602存储的指令，可以执行前述视频搜索方法中所包括的步骤。

其中，处理器1601是计算机设备的控制中心，可以利用各种接口和线路连接计算机设备的各个部分，通过运行或执行存储在存储器1602内的指令以及调用存储在存储器1602内的数据，从而进行视频搜索。可选的，处理器1601可包括一个或多个处理单元，处理器1601可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1601中。在一些实施例中，处理器1601和存储器1602可以在同一芯片上实现，在一些实施例中，它们也可以在独立的芯片上分别实现。

处理器1601可以是通用处理器，例如中央处理器(CPU)、数字信号处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件，可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

存储器1602作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器1602可以包括至少一种类型的存储介质，例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory，RAM)、静态随机访问存储器(Static Random Access Memory，SRAM)、可编程只读存储器(Programmable Read Only Memory，PROM)、只读存储器(Read Only Memory，ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、磁性存储器、磁盘、光盘等等。存储器1602是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。本申请实施例中的存储器1602还可以是电路或者其它任意能够实现存储功能的装置，用于存储程序指令和/或数据。

基于同一发明构思，本申请实施例提供了一种计算机可读存储介质，其存储有可由计算机设备执行的计算机程序，当程序在计算机设备上运行时，使得计算机设备执行上述视频搜索方法的步骤。

本领域内的技术人员应明白，本发明的实施例可提供为方法、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种视频搜索方法，其特征在于，应用于终端设备，包括：

响应于视频搜索操作，获得视频搜索条件，所述视频搜索条件至少包括：目标人物的目标人体特征信息；

向服务器发送携带所述视频搜索条件的搜索请求，以使所述服务器基于所述目标人物的人物标识从搜索库中，获取关联的至少一个视频；并针对所述至少一个视频中的各个视频，分别执行以下操作：针对一个视频，在确定与所述一个视频关联保存的至少一种人体特征信息中，存在与所述目标人体特征信息匹配的人体特征信息时，将所述一个视频作为匹配视频，并获取所述一个视频中包含所述目标人体特征信息的各个视频片段在所述一个视频中的播放时间信息；向所述终端设备返回获得的至少一个匹配视频的提示信息，以及获取的各个视频片段的播放时间信息；

在显示界面中，展示所述至少一个匹配视频的提示信息，以及展示所述各个视频片段的播放时间信息。

2.如权利要求1所述的方法，其特征在于，所述在显示界面中，展示所述至少一个匹配视频的提示信息，以及所述各个视频片段的播放时间信息之后，还包括：

响应于在所述显示界面触发的点击播放时间信息的操作，从展示的各个播放时间信息中，确定被点击的目标播放时间信息；

向服务器发送携带所述目标播放时间信息的播放请求，以使所述服务器向所述终端设备返回所述目标播放时间信息对应的目标视频片段；

在显示界面中，播放所述目标视频片段。

3.如权利要求2所述的方法，其特征在于，所述展示所述各个视频片段的播放时间信息，包括：

4.一种视频搜索方法，其特征在于，应用于服务器，包括：

接收终端设备发送的携带视频搜索条件的搜索请求，所述视频搜索条件是终端设备响应于视频搜索操作时获取的，所述视频搜索条件至少包括：目标人物的目标人体特征信息；

基于所述目标人物的人物标识从搜索库中，获取关联的至少一个视频；

针对所述至少一个视频中的各个视频，分别执行以下操作：针对一个视频，在确定与所述一个视频关联保存的至少一种人体特征信息中，存在与所述目标人体特征信息匹配的人体特征信息时，将所述一个视频作为匹配视频，并获取所述一个视频中包含所述目标人体特征信息的各个视频片段在所述一个视频中的播放时间信息；

向所述终端设备返回获得的至少一个匹配视频的提示信息，以及获取的各个视频片段的播放时间信息，以使终端设备在显示界面中，展示所述至少一个匹配视频的提示信息，以及所述各个视频片段的播放时间信息。

5.如权利要求4所述的方法，其特征在于，所述接收终端设备发送的携带视频搜索条件的搜索请求之前，还包括：

基于待搜索人物的人物标识，从搜索库中获取所述待搜索人物关联的至少一个视频；

针对所述至少一个视频中的各个视频，分别执行以下步骤：

6.如权利要求5所述的方法，其特征在于，所述将所述至少一种人体特征信息作为视频搜索条件，和所述一个视频中包含所述至少一种人体特征信息的各个视频片段分别在所述一个视频中的播放时间信息，关联保存在所述搜索库中，包括：

7.如权利要求5或6所述的方法，其特征在于，所述人体特征信息为以下信息中的任意一种或组合：

表情特征信息、动作特征信息。

8.一种视频搜索装置，其特征在于，包括：

获取模块，用于响应于视频搜索操作，获得视频搜索条件，所述视频搜索条件至少包括：目标人物的目标人体特征信息；

第一发送模块，用于向服务器发送携带所述视频搜索条件的搜索请求，以使所述服务器基于所述目标人物的人物标识从搜索库中，获取关联的至少一个视频；针对所述至少一个视频中的各个视频，分别执行以下操作：针对一个视频，在确定与所述一个视频关联保存的至少一种人体特征信息中，存在与所述目标人体特征信息匹配的人体特征信息时，将所述一个视频作为匹配视频，并获取所述一个视频中包含所述目标人体特征信息的各个视频片段在所述一个视频中的播放时间信息；向终端设备返回获得的至少一个匹配视频的提示信息，以及获取的各个视频片段的播放时间信息；

展示模块，用于在显示界面中，展示所述至少一个匹配视频的提示信息，以及展示所述各个视频片段的播放时间信息。

9.一种视频搜索装置，其特征在于，包括：

接收模块，用于接收终端设备发送的携带视频搜索条件的搜索请求，所述视频搜索条件是终端设备响应于视频搜索操作时获取的，所述视频搜索条件至少包括：目标人物的目标人体特征信息；

搜索模块，用于基于所述目标人物的人物标识从搜索库中，获取关联的至少一个视频；针对所述至少一个视频中的各个视频，分别执行以下操作：针对一个视频，在确定与所述一个视频关联保存的至少一种人体特征信息中，存在与所述目标人体特征信息匹配的人体特征信息时，将所述一个视频作为匹配视频，并获取所述一个视频中包含所述目标人体特征信息的各个视频片段在所述一个视频中的播放时间信息；

第二发送模块，用于向所述终端设备返回获得的至少一个匹配视频的提示信息，以及获取的各个视频片段的播放时间信息，以使终端设备在显示界面中，展示所述至少一个匹配视频的提示信息，以及所述各个视频片段的播放时间信息。

10.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1～7任一所述方法的步骤。

11.一种计算机可读存储介质，其特征在于，其存储有可由计算机设备执行的计算机程序，当所述计算机程序在计算机设备上运行时，使得所述计算机设备执行权利要求1～7任一所述方法的步骤。