CN104731938A

CN104731938A - 一种视频搜索方法及装置

Info

Publication number: CN104731938A
Application number: CN201510145988.5A
Authority: CN
Inventors: 帅伟良
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2015-03-30
Filing date: 2015-03-30
Publication date: 2015-06-24

Abstract

本发明实施例公开了一种视频搜索方法及装置。一种视频搜索方法包括：接收用户输入的视频搜索请求，视频搜索请求中携带用户期望的视频台词文本；使用预设的分词规则对台词文本进行分词处理，获得至少一个分词单元；根据预设的倒排索引信息，判断所获得的所有分词单元是否出现在相同视频中的相同时间位置，如果是，则将所述视频确定为包含所述台词文本的视频；利用所确定的视频响应该视频搜索请求。本发明可以充分地利用视频的字幕信息，将用户期望搜索的视频的台词文本与视频的字幕信息中的字幕文本进行内容匹配，在台词文本与字幕文本内容完全相同的情况下，将该字幕文本所属的视频确定为用户期望搜索的视频，从而实现了基于台词文本的视频搜索。

Description

一种视频搜索方法及装置

技术领域

本发明涉及搜索技术领域，特别涉及一种视频搜索方法及装置。

背景技术

随着互联网技术的快速发展，互联网的业务不断增加，互联网中的数据类型也不断增加，互联网中的数据类型除文字之外还包括视频。

现有技术中，视频搜索是基于视频标题、导演名称或简介中的描述文字来进行搜索的。多数用户可以通过输入视频标题、导演名称或简介的方式搜索到相应的视频，但是有时候用户只记得一段视频台词，此时，现有技术不能够基于输入的视频台词搜索到相应的视频。

发明内容

为了解决上述问题，本发明实施例公开了一种视频搜索方法及装置，具体技术方案如下：

本发明提供的一种视频搜索方法，所述方法包括：

接收用户输入的视频搜索请求，所述视频搜索请求中，携带用户期望的视频台词文本；

使用预设的分词规则，对所述台词文本进行分词处理，获得至少一个分词单元；

根据预设的倒排索引信息，判断所获得的所有分词单元是否出现在相同视频中的相同时间位置，如果是，则将所述视频确定为包含所述台词文本的视频；

利用所确定的视频响应所述视频搜索请求；

其中，所述倒排索引信息中包括至少一条索引数据，每条索引数据i对应一个分词单元i，且每条索引数据i中，至少包括以下信息：

包含该分词单元i的视频的标识、该分词单元i在视频中所处的时间位置信息，i＝1,2,……N。

根据本发明提供的一种具体实施方式，所述所确定的视频包含：多个视频；

所述利用所确定的视频响应所述视频搜索请求，包括：

针对所确定的视频生成多条搜索结果，每条搜索结果对应一个视频；

根据所述预设的倒排索引信息，确定所述台词文本在所确定的各个视频中出现的次数；

按照出现次数由高到低的顺序，对所生成的搜索结果进行显示。

所述利用所确定的视频响应所述视频搜索请求，包括：

获取所确定的各个视频的用户点击量；

按照用户点击量由高到低的顺序，对所生成的搜索结果进行显示。

根据本发明提供的一种具体实施方式，所述每条搜索结果中，包括：所述台词文本出现在该条搜索结果所对应的视频中的时间位置信息。

根据本发明提供的一种具体实施方式，所述利用所确定的视频响应所述视频搜索请求，包括：

针对所确定的视频生成至少一条搜索结果，并显示；其中，每条搜索结果对应一个视频，每条搜索结果中，包括用于触发该搜索结果所对应的视频播放的操作标识；

所述方法还包括：

在接收到用户针对操作标识的选择操作后，确定出用户选择播放的视频；

根据所述预设的倒排索引信息，得到所述台词文本在所述用户选择播放的视频中出现的时间位置信息；

根据所得到的时间位置信息及预设的定位规则，定位所述用户选择播放的视频的播放时间点，从所定位的时间点开始播放该视频。

本发明提供的一种视频搜索装置，所述装置包括：

请求接收模块，用于接收用户输入的视频搜索请求，所述视频搜索请求中，携带用户期望的视频台词文本；

分词模块，用于使用预设的分词规则，对所述请求接收模块接收到的视频搜索请求中携带的用户期望的视频台词文本进行分词处理，获得至少一个分词单元；

第一视频确定模块，用于根据预设的倒排索引信息，判断所述分词模块分词处理获得的所有分词单元是否出现在相同视频中的相同时间位置，如果是，则将所述视频确定为包含所述台词文本的视频；

请求响应模块，用于利用所述第一视频确定模块确定出的视频响应所述视频搜索请求；

根据本发明提供的一种具体实施方式，所述第一视频确定模块确定出的视频包含：多个视频；所述请求响应模块，具体用于：

针对所述第一视频确定模块确定出的视频生成多条搜索结果，每条搜索结果对应一个视频；

根据所述预设的倒排索引信息，确定所述台词文本在所述第一视频确定模块确定出的各个视频中出现的次数；

获取所述第一视频确定模块确定出的各个视频的用户点击量；

根据本发明提供的一种具体实施方式，所述请求响应模块，具体用于：

针对所述第一视频确定模块确定出的视频生成至少一条搜索结果，并显示；其中，每条搜索结果对应一个视频，每条搜索结果中，包括用于触发该搜索结果所对应的视频播放的操作标识；

所述装置还包括：

第二视频确定模块，用于在接收到用户针对操作标识的选择操作后，确定出用户选择播放的视频；

时间位置信息获得模块，用于根据所述预设的倒排索引信息，得到所述台词文本在所述第二视频确定模块确定出的用户选择播放的视频中出现的时间位置信息；

视频播放模块，用于根据所得到的时间位置信息及预设的定位规则，定位所述第二视频确定模块确定出的用户选择播放的视频的播放时间点，从所定位的时间点开始播放该视频。

应用上述技术方案，本发明提供的视频搜索方法及装置，在接收用户输入的、携带有用户期望的视频台词文本的视频搜索请求后，可以使用预设的分词规则，对所述台词文本进行分词处理，获得至少一个分词单元；根据预设的倒排索引信息，判断所获得的所有分词单元是否出现在相同视频中的相同时间位置，如果是，则将所述视频确定为包含所述台词文本的视频；利用所确定的视频响应所述视频搜索请求。

与现有技术相比，本发明可以充分地利用视频的字幕信息，将用户期望搜索的视频的台词文本与视频的字幕信息中的字幕文本进行内容匹配，在台词文本与字幕文本内容完全相同的情况下，将该字幕文本所属的视频确定为用户期望搜索的视频，从而实现了基于台词文本的视频搜索。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种视频搜索方法的流程图；

图2为本发明实施提供的图1中S104的一种实施方式流程图；

图3为本发明实施提供的图1中S104的另一种实施方式流程图；

图4为本发明实施例提供的另一种视频搜索方法的流程图；

图5为本发明实施例提供的一种视频搜索装置的结构示意图；

图6为本发明实施例提供的另一种视频搜索装置的结构示意图。

具体实施方式

为了使本领域技术人员更好地理解本发明中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在现在的电视节目和视频中，字幕(或称为台词)已经成为电视、视频网站等传媒系统中不可缺少的一个组成部分，它与电视节目、视频的图像、声音、特技等一起组成了一种共时间共空间的多方位多信息渠道的传播手段，它不仅能够提高单位时间内信息传播的速度和质量，还能够从视、听两个方面强化重要信息，增强信息的准确性、明晰性，降低听觉误差。更为重要的是，它还可以作为电视画面构成的一部分参与到电视画面的构图中，除了对某些视觉部分气到有效的强调作用外，还能带给人们视觉上的美感。有时候，仅仅字幕本身就能达到表意的作用；而更多的时候，字幕则是与相应的声音、图像一起来完成表情达意的功能。

现有的视频搜索是基于视频标题、导演名称及简介中的描述文字实现的，多数情况下，用户可以准确地记住期望搜索的视频的标题、导演名称、简介信息，通过现有的视频搜索技术搜索到期望的视频；但是，有时候用户可能仅记得视频中一段经典台词，此时，通过现有的视频搜索技术并不能够搜索到期望的视频。

此外，区别于以图片的形式被镶嵌到了视频图像中的图像格式字幕，随着文本格式的字幕技术的发展，使得字幕与图像相分离变得更容易。基于上述技术，为了解决现有技术存在的问题，本发明实施例提供了一种视频搜索方法及装置。

下面，首先对本发明实施例提供的一种视频搜索方法进行介绍。

需要说明的是，本发明提供的视频搜索方法可以应用到视频客户端软件、搜索引擎软件及具备搜索功能的任意软件中。从产品的角度来说，在视频客户端软件的用户界面方面，视频搜索功能可以以“搜索内容出入框+搜索按钮”的呈现在该软件的用户界面上，在用户希望通过输入一段台词的方式搜索到期望的视频时，可以在前述“搜索内容出入框”中输入与期望视频相关的一段台词，点击前述“搜索按钮”，从而实现视频搜索请求的发送；在视频客户端软件的后台方面，在接收到用户输入的视频搜索请求(包含有用户期望搜索视频的台词)后，会将视频搜索请求中包含的台词发送至于该视频客户端软件配合使用的服务器中，以便服务器进行后续的处理。

如图1所示，本发明实施例提供的一种视频搜索方法，可以包括：

S101，接收用户输入的视频搜索请求，所述视频搜索请求中，携带用户期望的视频台词文本。

目前视频搜索局限于视频标题、描述、导演等一些元信息，这样限于非常准确的搜索。但有时候用户只记得一部电影中的经典台词，这些用户用到的是模糊搜索。目前来看，大多数都是通过知道问答的方式说出剧名，然后再通过剧名搜索出视频。

当用户只记得自己期望搜索的视频的一段台词时，可以输入前述一段台词，进而触发输入包含前述一段台词的视频搜索请求。

S102，使用预设的分词规则，对所述台词文本进行分词处理，获得至少一个分词单元。

示例性的，用户期望的视频台词文本为“如果世界上曾经有那个人出现过，其他人都会变成将就，而我不愿意将就”，对前述台词文本进行分词，可以获得3个分词单元，分别为：“如果世界上曾经有那个人出现过”、“其他人都会变成将就”、“而我不愿意将就”。

需要说明的是，本发明中的预设的分词规则，可以为：基于正向最大匹配的分词方法、基于逆向最大匹配的分词方法等等，本发明实施例对此不作限定。

S103，根据预设的倒排索引信息，判断所获得的所有分词单元是否出现在相同视频中的相同时间位置，如果是，则将所述视频确定为包含所述台词文本的视频；

首先，对本发明中预设的倒排索引信息的生成方法进行介绍：

从视频版权方或第三方网站获取视频的字幕信息，比如从豆瓣、时光网、射手网等网站获取；其中，字幕信息中携带有以下信息：包含字幕文本的视频的标识、字幕文本出现在视频的时间位置。

使用与S102中相同的分词规则，对获取到的字幕信息中携带的字幕文本进行分词处理，得到与每个字幕文本相对的至少一个分词单元。

可以理解的是，一段台词可能出现在多个视频中，或重复出现在同一视频中，相应的，对应一段台词的全部台词单元也可能出现在多个视频中，或重复出现在同一视频中。

示例性的，用户期望的视频台词文本为“如果世界上曾经有那个人出现过，其他人都会变成将就，而我不愿意将就”，对应该视频台词文本的台词单元包括台词单元1、台词单元2、台词单元3，前述3个台词单元的内容分别为：“如果世界上曾经有那个人出现过”、“其他人都会变成将就”、“而我不愿意将就”。

假设，通过查询预设的倒排索引信息，得出下表所列信息：

从上表中可以看出，台词单元1、台词单元2、台词单元3均出现在视频<1>的12分钟处，因此，可以判断用户期望的视频台词文本出现在视频<1>的12分钟处，此时，将视频<1>确定为用户期望搜索的视频。

S104，利用所确定的视频响应所述视频搜索请求。

综上所述，本发明提供的视频搜索方法，在接收用户输入的、携带有用户期望的视频台词文本的视频搜索请求后，可以使用预设的分词规则，对所述台词文本进行分词处理，获得至少一个分词单元；根据预设的倒排索引信息，判断所获得的所有分词单元是否出现在相同视频中的相同时间位置，如果是，则将所述视频确定为包含所述台词文本的视频；利用所确定的视频响应所述视频搜索请求。

可选的，在本发明的一个实施例中，所述所确定的视频可以包含：多个视频；此时，如图2所示，上述S104，可以包括：

S104a，针对所确定的视频生成多条搜索结果，每条搜索结果对应一个视频；

从产品的角度来说，区别于现有的搜索结果中包含视频的缩略图、名称、演员、导演或时长信息，本发明生成的每一条搜索结果中还可以包含有用户期望的视频台词文本出现在该视频中的时间位置，以方便用户直接从前述台词文本出现的时间位置进行观看。

S104b，根据所述预设的倒排索引信息，确定所述台词文本在所确定的各个视频中出现的次数；

S104c，按照出现次数由高到低的顺序，对所生成的搜索结果进行显示。

可以理解的是，一段台词多次出现在一个视频中，说明该段台词与该视频的剧情存在较为密切的关系，相应的，出现一个视频中一段台词出现的次数越多，该视频为用户的期望视频的可能性越大。

可选的，在本发明的另一个具体实施方式中，所述所确定的视频可以包含：多个视频；此时，如图3所示，上述S104，可以包括：

S104e，针对所确定的视频生成多条搜索结果，每条搜索结果对应一个视频；

S304f，获取所确定的各个视频的用户点击量；

示例性的，对于视频客户端软件而言，与该软件配合使用的服务器会记录该软件播放的视频的用户点击量；相应的，可以从与视频客户端软件配合使用的服务器获取视频的用户点击量。或者，也可以从第三方统计机构，获取视频的用户点击量。

S304g，按照用户点击量由高到低的顺序，对所生成的搜索结果进行显示。

可以理解的是，一个视频被点击的次数越多，该视频的用户的点击量越大，说明该视频的热度越高，相应的，出现一个视频的热度越高，该视频为用户的期望视频的可能性越大。

可选的，在本发明的另一个具体实施方式中，如图4所示，上述S104，可以包括：

S104h，针对所确定的视频生成至少一条搜索结果，并显示；其中，每条搜索结果对应一个视频，每条搜索结果中，包括用于触发该搜索结果所对应的视频播放的操作标识；

从产品的角度来说，用户点击本发明中的操作标识，就可以出发视频的播放。

此时，本发明提供的视频搜索方法，还可以包括：

S105，在接收到用户针对操作标识的选择操作后，确定出用户选择播放的视频；

可以理解的是，当显示有多条搜索结果时，相应的，也会存在多个操作标识，每个操作标识对应一个视频。

S106，根据所述预设的倒排索引信息，得到所述台词文本在所述用户选择播放的视频中出现的时间位置信息；

可以理解的是，如果所述台词文本多次出现用户选择播放的视频中，则可以根据所述预设的倒排索引信息，得到多个时间位置，比如台词文本出现在一个视频的12分钟、16分钟、20分钟处。

S107，根据所得到的时间位置信息及预设的定位规则，定位所述用户选择播放的视频的播放时间点，从所定位的时间点开始播放该视频。

对于用户期望的视频台词文本在用户选择播放的视频中仅出现一次的情况，可以直接将该台词文本出现的时间位置确定为播放时间点。

对于用户期望的视频台词文本多次出现在用户选择播放的视频中的情况，S106会得到多个时间位置；此时，可以将用户期望的视频台词文本第一次出现在用户选择播放的视频中的时间位置确定为播放时间点，或将用户期望的视频台词文本最后一次出现在用户选择播放的视频中的时间位置确定为播放时间点，本发明实施例对此不作限定。

由于用户记住的台词对应的内容通常为该用户感兴趣的内容，因此从用户期望的视频台词文本出现的时间位置开始播放用户选择播放的视频，可以更为准确地触及用户的兴趣所在。

可选的，本发明实施中的每条搜索结果中，可以包括：所述台词文本出现在该条搜索结果所对应的视频中的时间位置信息。

相应于上面介绍的方法实施例，本发明实施例还提供了一种视频搜索装置。

需要说明的是，本发明提供的视频搜索装置可以应用到视频客户端软件、搜索引擎软件及具备搜索功能的任意软件中。从产品的角度来说，在视频客户端软件的用户界面方面，视频搜索功能可以以“搜索内容出入框+搜索按钮”的呈现在该软件的用户界面上，在用户希望通过输入一段台词的方式搜索到期望的视频时，可以在前述“搜索内容出入框”中输入与期望视频相关的一段台词，点击前述“搜索按钮”，从而实现视频搜索请求的发送；在视频客户端软件的后台方面，在接收到用户输入的视频搜索请求(包含有用户期望搜索视频的台词)后，会将视频搜索请求中包含的台词发送至于该视频客户端软件配合使用的服务器中，以便服务器进行后续的处理。

如图5所示，本发明实施例提供的一种视频搜索装置，可以包括：

请求接收模块501，用于接收用户输入的视频搜索请求，所述视频搜索请求中，携带用户期望的视频台词文本；

分词模块502，用于使用预设的分词规则，对所述请求接收模块501接收到的视频搜索请求中携带的用户期望的视频台词文本进行分词处理，获得至少一个分词单元；

第一视频确定模块503，用于根据预设的倒排索引信息，判断所述分词模块502分词处理获得的所有分词单元是否出现在相同视频中的相同时间位置，如果是，则将所述视频确定为包含所述台词文本的视频；

请求响应模块504，用于利用所述第一视频确定模块503确定出的视频响应所述视频搜索请求；

综上所述，本发明提供的视频搜索装置，在接收用户输入的、携带有用户期望的视频台词文本的视频搜索请求后，可以使用预设的分词规则，对所述台词文本进行分词处理，获得至少一个分词单元；根据预设的倒排索引信息，判断所获得的所有分词单元是否出现在相同视频中的相同时间位置，如果是，则将所述视频确定为包含所述台词文本的视频；利用所确定的视频响应所述视频搜索请求。

可选的，在本发明的一个具体实施方式中，所述第一视频确定模块503确定出的视频包含：多个视频；所述请求响应模块504，具体可以用于：

针对所述第一视频确定模块503确定出的视频生成多条搜索结果，每条搜索结果对应一个视频；

根据所述预设的倒排索引信息，确定所述台词文本在所述第一视频确定模块503确定出的各个视频中出现的次数；

可选的，在本发明的另一个具体实施方式中，所述第一视频确定模块503确定出的视频包含：多个视频；所述请求响应模块504，具体可以用于：

获取所述第一视频确定模块503确定出的各个视频的用户点击量；

可选的，在本发明的另一个具体实施例中，所述请求响应模块504，具体可以用于：

针对所述第一视频确定模块503确定出的视频生成至少一条搜索结果，并显示；其中，每条搜索结果对应一个视频，每条搜索结果中，包括用于触发该搜索结果所对应的视频播放的操作标识；

本发明提供的视频搜索装置，如图6所示，还可以包括：

第二视频确定模块505，用于在接收到用户针对操作标识的选择操作后，确定出用户选择播放的视频；

时间位置信息获得模块506，用于根据所述预设的倒排索引信息，得到所述台词文本在所述第二视频确定模块505确定出的用户选择播放的视频中出现的时间位置信息；

视频播放模块507，用于根据所得到的时间位置信息及预设的定位规则，定位所述第二视频确定模块505确定出的用户选择播放的视频的播放时间点，从所定位的时间点开始播放该视频。

可以理解的是，由于用户记住的台词对应的内容通常为该用户感兴趣的内容，因此从用户期望的视频台词文本出现的时间位置开始播放用户选择播放的视频，可以更为准确地触及用户的兴趣所在。

对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本发明时可以把各模块的功能在同一个或多个软件和/或硬件中实现。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以存储于计算机可读取存储介质中，这里所称得的存储介质，如：ROM/RAM、磁碟、光盘等。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种视频搜索方法，其特征在于，所述方法包括：

利用所确定的视频响应所述视频搜索请求；

2.根据权利要求1所述的方法，其特征在于，所述所确定的视频包含：多个视频；

所述利用所确定的视频响应所述视频搜索请求，包括：

3.根据权利要求1所述的方法，其特征在于，所述所确定的视频包含：多个视频；

所述利用所确定的视频响应所述视频搜索请求，包括：

获取所确定的各个视频的用户点击量；

4.根据权利要求2或3所述的方法，其特征在于，所述每条搜索结果中，包括：所述台词文本出现在该条搜索结果所对应的视频中的时间位置信息。

5.根据权利要求1所述的方法，其特征在于，所述利用所确定的视频响应所述视频搜索请求，包括：

所述方法还包括：

6.一种视频搜索装置，其特征在于，所述装置包括：

7.根据权利要求6所述的装置，其特征在于，所述第一视频确定模块确定出的视频包含：多个视频；所述请求响应模块，具体用于：

8.根据权利要求6所述的装置，其特征在于，所述第一视频确定模块确定出的视频包含：多个视频；所述请求响应模块，具体用于：

9.根据权利要求7或8所述的装置，其特征在于，所述每条搜索结果中，包括：所述台词文本出现在该条搜索结果所对应的视频中的时间位置信息。

10.根据权利要求6所述的装置，其特征在于，所述请求响应模块，具体用于：

所述装置还包括：