CN103559286A - 视频搜索结果的处理方法及装置 - Google Patents
视频搜索结果的处理方法及装置 Download PDFInfo
- Publication number
- CN103559286A CN103559286A CN201310553384.5A CN201310553384A CN103559286A CN 103559286 A CN103559286 A CN 103559286A CN 201310553384 A CN201310553384 A CN 201310553384A CN 103559286 A CN103559286 A CN 103559286A
- Authority
- CN
- China
- Prior art keywords
- video
- series
- videos
- serial class
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/7867—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明公开了一种视频搜索结果的处理方法及装置,其中方法包括:从预设的视频索引库中提取出一个或多个系列类视频;对所述系列类视频分别进行整合排序,生成一个或多个系列视频包;接收用户通过客户端发送的搜索查询词,当所述搜索查询词命中所述一个或多个系列视频包时,按照匹配度级别将命中的一个或多个系列视频包整合到搜索结果页返回给客户端显示。根据该方案可以将密切关联的一系列视频在同一系列视频包内按顺序排列展示给用户,用户可以方便的在该系列视频包内查找所需要的视频,该方案提供的搜索方式更加便捷和直观。
Description
技术领域
本发明涉及互联网技术领域,具体涉及一种视频搜索结果的处理方法及装置。
背景技术
搜索技术是当今被应用最多的互联网应用之一,搜索引擎允许用户通过查询词检索整个互联网上的丰富数据。而视频搜索则是一种垂直搜索引擎,能够为用户提供纯粹的视频结果,可以使有视频需求的用户获得更好的满足。
互联网现存在视频资源可以根据其是否属于某个序列组而分为两类:一类是与其他视频没有直接关联的单视频,如《欢度中秋游乐园》是一个用户上传的单视频,与其他视频并无关联;一类是与其他视频存在密切关联的一系列视频,如《php视频教程54》则是“php视频教程”系列视频中的第54部,与其他的视频存在承前启后的作用,一个用户很可能希望按照该系列视频的集数顺序观看视频。而现有的视频搜索引擎不能将一系列关联视频按顺序排列展示给用户,用户需要进一步的在若干个杂乱无章的视频中自行查找所需要的视频,这种搜索方式不够简单直观。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的视频搜索结果的处理装置和相应的处理方法。
根据本发明的一个方面,提供了一种视频搜索结果的处理方法,包括:从预设的视频索引库中提取出一个或多个系列类视频;对所述系列类视频分别进行整合排序,生成一个或多个系列视频包;接收用户通过客户端发送的搜索查询词,当所述搜索查询词命中所述一个或多个系列视频包时,按照匹配度级别将命中的一个或多个系列视频包整合到搜索结果页返回给客户端显示。
可选地,所述从预设的视频索引库中提取出一个或多个系列类视频包括:若所述视频索引库中当前视频的视频信息中含有预设的特征字符集中的任一特征字符,则将该当前视频提取出作为所述系列类视频。
可选地,所述特征字符集包含视频剧集数字、视频剧集日期和视频剧集字符中的一项或多项。
可选地,所述对所述系列类视频分别进行整合排序,生成一个或多个系列视频包包括:
查找到与当前系列类视频的视频信息相似度大于预定值的系列类视频列表,将该系列类视频列表中的所有系列类视频与当前系列类视频整合在一起得到一个系列视频包,根据该系列视频包内所有系列类视频的视频标题确定该系列视频包的名称;
根据该系列视频包内所有系列类视频的视频标题的特征字符对这些系列类视频进行排重处理,按照所述特征字符对排重处理后的系列类视频进行排序处理。
可选地,所述查找到与当前系列类视频的视频信息相似度大于预定值的系列类视频列表进一步包括:通过计算两个系列类视频的视频标题中相同字符数与总字符数均值的比值得到两个系列类视频的视频信息相似度,与当前系列类视频的视频信息相似度大于预定值的所有系列类视频形成所述系列类视频列表。
可选地,所述按照匹配度级别将命中的一个或多个系列视频包整合到搜索结果页包括:根据匹配度级别由高至低的顺序对一个或多个系列视频包进行排名,按照排名先后将一个或多个系列视频包整合到搜索结果页。
可选地,所述方法还包括:当所述搜索查询词命中一个或多个视频时,按照匹配度级别一并将命中的一个或多个视频整合到所述搜索结果页,其中所述一个或多个视频的匹配度级别低于所述一个或多个系列视频包的匹配度级别。
根据本发明的另一方面,提供了一种视频搜索结果的处理装置,包括:视频索引库,适于存储多个视频;提取模块,适于从所述视频索引库中提取出一个或多个系列类视频;生成模块,适于对所述系列类视频分别进行整合排序,生成一个或多个系列视频包;处理模块,适于接收用户通过客户端发送的搜索查询词,当所述搜索查询词命中所述一个或多个系列视频包时,按照匹配度级别将命中的一个或多个系列视频包整合到搜索结果页;发送模块,适于将所述搜索结果页返回给客户端显示。
可选地,所述提取模块具体适于:若所述视频索引库中当前视频的视频信息中含有预设的特征字符集中的任一特征字符,则将该当前视频提取出作为所述系列类视频。
可选地,所述装置还包括:特征字符集存储模块,适于存储视频剧集数字、视频剧集日期和视频剧集字符中的一项或多项。
可选地,所述生成模块包括:
查找单元,适于查找到与当前系列类视频的视频信息相似度大于预定值的系列类视频列表,将该系列类视频列表中的所有系列类视频与当前系列类视频整合在一起得到一个系列视频包,根据该系列视频包内所有系列类视频的视频标题确定该系列视频包的名称;
排重单元,适于根据该系列视频包内所有系列类视频的视频标题的特征字符对这些系列类视频进行排重处理;
排序单元,适于按照所述特征字符对排重处理后的系列类视频进行排序处理。
可选地,所述查找单元具体适于:通过计算两个系列类视频的视频标题中相同字符数与总字符数均值的比值得到两个系列类视频的视频信息相似度,与当前系列类视频的视频信息相似度大于预定值的所有系列类视频形成所述系列类视频列表。
可选地,所述处理模块具体适于:根据匹配度级别由高至低的顺序对一个或多个系列视频包进行排名,按照排名先后将一个或多个系列视频包整合到搜索结果页。
可选地,所述处理模块还适于:当所述搜索查询词命中一个或多个视频时,按照匹配度级别一并将命中的一个或多个视频整合到所述搜索结果页,其中所述一个或多个视频的匹配度级别低于所述一个或多个系列视频包的匹配度级别。
根据本发明的视频搜索结果的处理方法及装置,通过从预设的视频索引库中提取出一个或多个系列类视频,并对系列类视频进行整合排序,生成一个或多个系列视频包,在接收到用户通过客户端发送的搜索查询词之后,如果搜索查询词命中一个或多个系列视频包,则按照匹配度级别将命中的一个或多个系列视频包整合到搜索结果页返回给客户端显示。根据该方案可以将密切关联的一系列视频在同一系列视频包内按顺序排列展示给用户,用户可以方便的在该系列视频包内查找所需要的视频,该方案提供的搜索方式更加便捷和直观。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的视频搜索结果的处理方法的流程图;
图2示出了根据本发明另一个实施例的视频搜索结果的处理方法的流程图;
图3示出了根据本发明一个实施例的视频搜索结果的处理装置的结构示意图;
图4示出了根据本发明一个实施例的搜索结果页面的展示图;
图5示出了根据本发明一个实施例的点击系列视频包后的搜索结果页面的展示图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的视频搜索结果的处理方法的流程图。如图1所示,该方法包括如下步骤:
步骤S101,从预设的视频索引库中提取出一个或多个系列类视频。
搜索引擎预先通过爬虫技术抓取目标视频站的视频相关信息,该视频相关信息包括视频标题、视频简介信息、播放时长等基本信息。然后,搜索引擎根据抓取到的信息建立视频索引库。
步骤S102,对系列类视频分别进行整合排序,生成一个或多个系列视频包。
搜索引擎根据视频相关信息对系列类视频进行整合排序,该整合排序具体为:将密切关联的多个系列类视频整合到同一个系列视频包内,然后对同一个系列视频包内的多个系列类视频进行排序。
步骤S103,接收用户通过客户端发送的搜索查询词,当搜索查询词命中一个或多个系列视频包时,按照匹配度级别将命中的一个或多个系列视频包整合到搜索结果页返回给客户端显示。
根据本发明上述实施例提供的方法,通过从预设的视频索引库中提取出一个或多个系列类视频,并对系列类视频进行整合排序,生成一个或多个系列视频包,在接收到用户通过客户端发送的搜索查询词之后,如搜索查询词命中一个或多个系列视频包,则按照匹配度级别将命中的一个或多个系列视频包整合到搜索结果页返回给客户端显示。根据该方法可以将密切关联的一系列视频在同一系列视频包内按顺序排列展示给用户,用户可以方便的在该系列视频包内查找所需要的视频,该方法提供的搜索方式更加便捷和直观。
图2示出了根据本发明另一个实施例的视频搜索结果的处理方法的流程图。如图2所示,该方法包括如下步骤:
步骤S201,从预设的视频索引库中提取出含有预设的特征字符集中的任一特征字符的一个或多个系列类视频。
搜索引擎预先通过爬虫技术抓取目标视频站的视频相关信息,该视频相关信息包括视频标题、视频简介信息、播放时长等基本信息。然后,搜索引擎根据抓取到的信息建立视频索引库。
在预先建立了视频索引库之后,搜索引擎在视频索引库中查询目标视频,提取出一个或多个系列类视频。系列类视频的视频标题中一般具有视频剧集数字(1、01、十五)、视频剧集日期(20130802、2012年9月15日)、剧集字符(上、中、下、第一集、第12集)等特征信息,这些特征信息使得系列类视频区分于其他单视频。因此本发明利用该特点预先建立了特征字符集,特征字符集包含但不限于视频剧集数字、视频剧集日期和视频剧集字符等特征字符。如果视频索引库中当前视频的视频标题中含有该特征字符集中的任一特征字符,则将该当前视频提取出作为系列类视频。如《php视频教程01》、《中秋赏月(上)》、《国医讲堂20130915》均会被识别为系列类视频。
本发明不仅限于根据视频标题中所包含的特征字符来识别系列类视频,还可以根据视频的其它相关信息来识别系列类视频,例如可以通过分析视频简介信息来识别系列类视频,密切关联的多个系列类视频的视频简介信息可能包含大部分重复的内容。
步骤S202,查找到与当前系列类视频的视频信息相似度大于预定值的系列类视频列表,将该系列类视频列表中的所有系列类视频与当前系列类视频整合在一起得到一个系列视频包,根据该系列视频包内所有系列类视频的视频标题确定该系列视频包的名称。
具体地,以步骤S201中已判断为系列类视频的视频标题作为出发点,寻找其所属系列的其它系列类视频,首先查找到与该系列类视频的视频标题具有较高相似度的视频列表,具体地,通过计算两个视频的视频标题中相同字符数与总字符数均值的比值得到两个视频的视频信息相似度,当视频信息相似度大于预先设定的阈值时,判定这两个视频属于同一个系列,由此可得到该系列类视频的一系列相关视频,用该视频系列的标题重合部分作为该系列的名称。举例来说,对于两个系列类视频《php视频教程1:集合的建立方法》和《php视频教程2:php编码案例》,这两个视频的视频标题中相同字符为“php视频教程”,相同字符数为7,字符数均值为两个视频总的字符数的二分之一,即为16,则这两个视频的视频信息相似度为7/16,大于预设阈值0.4,因此可判定这两个视频属于同一个系列。根据该方法,得到同属一个视频系列的标题列表为《php视频教程1:集合的建立方法》、《php视频教程2:php编码案例》、《php视频教程3:ci框架教学》,其中各标题的重合部分为“php视频教程”,则该视频系列的名称为“php视频教程”。
可选地,也可以以判断为系列类视频的视频简介信息作为出发点,寻找其所属系列的其它系列类视频。具体地,根据视频简介信息的重复性查找具有较高相似度的视频列表,将视频列表中的系列类视频整合在一起得到系列视频包。
步骤S203,根据该系列视频包内所有系列类视频的视频标题的特征字符对这些系列类视频进行排重处理,按照特征字符对排重处理后的系列类视频进行排序处理。
排重处理主要是根据视频标题中特征字符对系列视频包内相同视频进行处理。在步骤S202之后,若查找到一系列视频,如《php视频教程01》、《php视频教程1》、《php视频教程第一集》,根据特征字符可以判定这些视频为同一个视频,对它们进行排重处理,只保留一个视频如《php视频教程1》。依此方法对系列视频包内所有视频进行排重处理。
在对系列视频列表内所有视频进行排重处理之后,按照特征字符对视频进行排序,使视频以“1-N”或“上中下”的方式进行顺序排列。
步骤S204,接收用户通过客户端发送的搜索查询词,当搜索查询词命中一个或多个系列视频包时,根据匹配度级别由高至低的顺序对一个或多个系列视频包进行排名,按照排名先后将一个或多个系列视频包整合到搜索结果页。
用户在客户端输入搜索查询词之后,客户端将搜索查询词发送给搜索引擎,搜索引擎查找与搜索查询词相关的视频,当搜索查询词命中一个或多个系列视频包时,即搜索查询词与一个或多个系列视频包相匹配,则根据匹配度级别由高至低的顺序对一个或多个系列视频包进行排名,按照排名先后将一个或多个系列视频包整合到搜索结果页。
可选地,当搜索查询词命中一个或多个单视频时,即搜索查询词不仅与一个或多个系列视频包匹配,还与一个或多个单视频匹配,则按照匹配度级别一并将命中的一个或多个单视频整合到搜索结果页,其中一个或多个单视频的匹配度级别低于一个或多个系列视频包的匹配度级别。
例如,用户在客户端中输入“php教程”,搜索引擎查找到与“php教程”匹配的一个系列视频包:“视频集:php100视频教程(100个)”,以及多个单视频:“后盾PHP教程第一部javascript特效”、“后盾PHP视频教程javascript视频”、“php视频教程PHP基础语法自学PHP”等。将这些结果整合到搜索结果页,得到搜索结果页的展示如图4所示,但不限于该展示方式。当用户点击“视频集:php100视频教程(100个)”之后,其展示页面如图5所示。其中,“视频集:php100视频教程(100个)”的匹配度级别最高,因而排在最前面;后面的多个单视频也是按照匹配度级别由高至低的顺序而排位的。
根据本发明上述实施例提供的方法,通过从预设的视频索引库中提取出含有预设的特征字符集中的任一特征字符的一个或多个系列类视频,根据系列类视频的视频信息相似度,将视频信息相似度大于预定值的系列类视频整合在一起得到一个系列视频包,根据该系列视频包内所有系列类视频的视频标题确定该系列视频包的名称,根据该系列视频包内所有系列类视频的视频标题的特征字符对这些系列类视频进行排重处理,按照特征字符对排重处理后的系列类视频进行排序处理,用户通过搜索引擎查找相关视频,当搜索查询词命中一个或多个系列视频包时,根据匹配度级别由高至低的顺序对一个或多个系列视频包进行排名,按照排名先后将一个或多个系列视频包整合到搜索结果页。根据该方法可以将密切关联的一系列视频在同一系列视频包内按顺序排列展示给用户,用户可以方便的在该系列视频包内查找所需要的视频,该方法提供的搜索方式更加便捷和直观。根据该方法可以提高系列视频查找的准确性,并能保证系列视频列表内的视频没有重复,从而方便用户观看。
图3示出了根据本发明一个实施例的视频搜索结果的处理装置的结构示意图。如图3所示,该处理装置包括:视频索引库301、提取模块302、生成模块303、处理模块304、发送模块305。
视频索引库301,适于存储多个视频。搜索引擎预先通过爬虫技术抓取目标视频站的视频相关信息,该视频相关信息包括视频标题、视频简介信息、播放时长等基本信息。然后,搜索引擎根据抓取到的信息建立视频索引库。
提取模块302,适于从视频索引库301中提取出一个或多个系列类视频。
在预先建立了视频索引库301之后,提取模块302在视频索引库中查询目标视频,提取出一个或多个系列类视频。系列类视频的视频标题中一般具有视频剧集数字(1、01、十五)、视频剧集日期(20130802、2012年9月15日)、剧集字符(上、中、下、第一集、第12集)等特征信息,这些特征信息使得系列类视频区分于其他单视频。因此本发明利用该特点预先建立了特征字符集,将特征字符集存入特征字符集存储模块306,特征字符集包含但不限于视频剧集数字、视频剧集日期和视频剧集字符等特征字符。如果视频索引库301中当前视频的视频标题中含有该特征字符集中的任一特征字符,则将该当前视频提取出作为系列类视频。如《php视频教程01》、《中秋赏月(上)》、《国医讲堂20130915》均会被识别为系列类视频。提取模块302可以根据视频标题中所包含的特征字符来识别系列类视频,还可以根据视频的其它相关信息来识别系列类视频,例如可以通过分析视频简介信息来识别系列类视频,密切关联的多个系列类视频的视频简介信息可能包含大部分重复的内容。
生成模块303,适于对所述系列类视频分别进行整合排序,生成一个或多个系列视频包。
生成模块303具体包括查找单元307、排重单元308、排序单元309。
查找单元307,适于查找到与当前系列类视频的视频信息相似度大于预定值的系列类视频列表,将该系列类视频列表中的所有系列类视频与当前系列类视频整合在一起得到一个系列视频包,根据该系列视频包内所有系列类视频的视频标题确定该系列视频包的名称。
具体地,以提取模块302中已判断为系列类视频的的视频标题作为出发点,寻找其所属系列的其它系列类视频,首先查找到与该系列类视频的视频标题具有较高相似度的视频列表,具体地,通过计算两个视频的视频标题中相同字符数与总字符数均值的比值得到两个视频的视频信息相似度,当视频信息相似度大于预先设定的阈值时,判定这两个视频属于同一个系列,由此可得到该系列类视频的一系列相关视频,用该视频系列的标题重合部分作为该系列的名称。举例来说,对于两个系列类视频《php视频教程1:集合的建立方法》和《php视频教程2:php编码案例》,这两个视频的视频标题中相同字符为“php视频教程”,相同字符数为7,字符数均值为两个视频总的字符数的二分之一,即为16,则这两个视频的视频信息相似度为7/16,大于预设阈值0.4,因此可判定这两个视频属于同一个系列。根据该方法,得到同属一个视频系列的标题列表为《php视频教程1:集合的建立方法》、《php视频教程2:php编码案例》、《php视频教程3:ci框架教学》,其中各标题的重合部分为“php视频教程”,则该视频系列的名称为“php视频教程”。
可选地,也可以以判断为系列类视频的视频简介信息作为出发点,寻找其所属系列的其它系列类视频。具体地,根据视频简介信息的重复性查找具有较高相似度的视频列表,将视频列表中的系列类视频整合在一起得到系列视频包。
排重单元308,适于根据该系列视频包内所有系列类视频的视频标题的特征字符对这些系列类视频进行排重处理。
排重处理主要是根据视频标题中特征字符对系列视频包内相同视频进行处理。若查找单元307查找到一系列视频,如《php视频教程01》、《php视频教程1》、《php视频教程第一集》,根据特征字符可以判定这些视频为同一个视频,对它们进行排重处理,只保留一个视频如《php视频教程1》。依此方法对系列视频列包内所有视频进行排重处理。
排序单元309,适于按照所述特征字符对排重处理后的系列类视频进行排序处理。
在对系列视频列表内所有视频进行排重处理之后,按照特征字符对视频进行排序,使视频以“1-N”或“上中下”的方式进行顺序排列。
处理模块304,适于接收用户通过客户端发送的搜索查询词,当所述搜索查询词命中所述一个或多个系列视频包时,按照匹配度级别将命中的一个或多个系列视频包整合到搜索结果页。
用户在客户端输入搜索查询词之后,客户端将搜索查询词发送给搜索引擎,处理模块304查找与搜索查询词相关的视频,当搜索查询词命中一个或多个系列视频包时,即搜索查询词与一个或多个系列视频包相匹配,则根据匹配度级别由高至低的顺序对一个或多个系列视频包进行排名,按照排名先后将一个或多个系列视频包整合到搜索结果页。
可选地,当搜索查询词命中一个或多个单视频时,即搜索查询词不仅与一个或多个系列视频包匹配,还与一个或多个单视频匹配,则按照匹配度级别一并将命中的一个或多个单视频整合到搜索结果页,其中一个或多个单视频的匹配度级别低于一个或多个系列视频包的匹配度级别。
例如,用户在客户端中输入“php教程”,搜索引擎查找到与“php教程”匹配的一个系列视频包:“视频集:php100视频教程(100个)”,以及多个单视频:“后盾PHP教程第一部javascript特效”、“后盾PHP视频教程javascript视频”、“php视频教程PHP基础语法自学PHP”等。处理模块304将这些结果整合到搜索结果页,得到搜索结果页的展示如图4所示,但不限于该展示方式。当用户点击“视频集:php100视频教程(100个)”之后,其展示页面如图5所示。其中,“视频集:php100视频教程(100个)”的匹配度级别最高,因而排在最前面;后面的多个单视频也是按照匹配度级别由高至低的顺序而排位的。
发送模块305,适于将所述搜索结果页返回给客户端显示。
根据本发明上述实施例提供的装置,通过从预设的视频索引库中提取出一个或多个系列类视频,并对系列类视频进行整合排序,生成一个或多个系列视频包,在接收到用户通过客户端发送的搜索查询词之后,如搜索查询词命中一个或多个系列视频包,则按照匹配度级别将命中的一个或多个系列视频包整合到搜索结果页返回给客户端显示。根据该装置可以将密切关联的一系列视频在同一系列视频包内按顺序排列展示给用户,用户可以方便的在该系列视频包内查找所需要的视频,该方法提供的搜索方式更加便捷和直观。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的视频搜索结果的处理设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (10)
1.一种视频搜索结果的处理方法,包括:
从预设的视频索引库中提取出一个或多个系列类视频;
对所述系列类视频分别进行整合排序,生成一个或多个系列视频包;
接收用户通过客户端发送的搜索查询词,当所述搜索查询词命中所述一个或多个系列视频包时,按照匹配度级别将命中的一个或多个系列视频包整合到搜索结果页返回给客户端显示。
2.根据权利要求1所述的方法,所述从预设的视频索引库中提取出一个或多个系列类视频包括:
若所述视频索引库中当前视频的视频信息中含有预设的特征字符集中的任一特征字符,则将该当前视频提取出作为所述系列类视频。
3.根据权利要求1或2所述的方法,所述特征字符集包含视频剧集数字、视频剧集日期和视频剧集字符中的一项或多项。
4.根据权利要求1-3任一项所述的方法,所述对所述系列类视频分别进行整合排序,生成一个或多个系列视频包包括:
查找到与当前系列类视频的视频信息相似度大于预定值的系列类视频列表,将该系列类视频列表中的所有系列类视频与当前系列类视频整合在一起得到一个系列视频包,根据该系列视频包内所有系列类视频的视频标题确定该系列视频包的名称;
根据该系列视频包内所有系列类视频的视频标题的特征字符对这些系列类视频进行排重处理,按照所述特征字符对排重处理后的系列类视频进行排序处理。
5.根据权利要求1-4任一项所述的方法,所述查找到与当前系列类视频的视频信息相似度大于预定值的系列类视频列表进一步包括:
通过计算两个系列类视频的视频标题中相同字符数与总字符数均值的比值得到两个系列类视频的视频信息相似度,与当前系列类视频的视频信息相似度大于预定值的所有系列类视频形成所述系列类视频列表。
6.根据权利要求1-5任一项所述的方法,所述按照匹配度级别将命中的一个或多个系列视频包整合到搜索结果页包括:根据匹配度级别由高至低的顺序对一个或多个系列视频包进行排名,按照排名先后将一个或多个系列视频包整合到搜索结果页。
7.根据权利要求1-6任一项所述的方法,还包括:当所述搜索查询词命中一个或多个视频时,按照匹配度级别一并将命中的一个或多个视频整合到所述搜索结果页,其中所述一个或多个视频的匹配度级别低于所述一个或多个系列视频包的匹配度级别。
8.一种视频搜索结果的处理装置,包括:
视频索引库,适于存储多个视频;
提取模块,适于从所述视频索引库中提取出一个或多个系列类视频;
生成模块,适于对所述系列类视频分别进行整合排序,生成一个或多个系列视频包;
处理模块,适于接收用户通过客户端发送的搜索查询词,当所述搜索查询词命中所述一个或多个系列视频包时,按照匹配度级别将命中的一个或多个系列视频包整合到搜索结果页;
发送模块,适于将所述搜索结果页返回给客户端显示。
9.根据权利要求8所述的装置,所述提取模块具体适于:
若所述视频索引库中当前视频的视频信息中含有预设的特征字符集中的任一特征字符,则将该当前视频提取出作为所述系列类视频。
10.根据权利要求8或9所述的装置,所述生成模块包括:
查找单元,适于查找到与当前系列类视频的视频信息相似度大于预定值的系列类视频列表,将该系列类视频列表中的所有系列类视频与当前系列类视频整合在一起得到一个系列视频包,根据该系列视频包内所有系列类视频的视频标题确定该系列视频包的名称;
排重单元,适于根据该系列视频包内所有系列类视频的视频标题的特征字符对这些系列类视频进行排重处理;
排序单元,适于按照所述特征字符对排重处理后的系列类视频进行排序处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310553384.5A CN103559286B (zh) | 2013-11-08 | 2013-11-08 | 视频搜索结果的处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310553384.5A CN103559286B (zh) | 2013-11-08 | 2013-11-08 | 视频搜索结果的处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103559286A true CN103559286A (zh) | 2014-02-05 |
CN103559286B CN103559286B (zh) | 2017-04-26 |
Family
ID=50013532
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310553384.5A Expired - Fee Related CN103559286B (zh) | 2013-11-08 | 2013-11-08 | 视频搜索结果的处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103559286B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942254A (zh) * | 2014-03-18 | 2014-07-23 | 电子科技大学 | 一种面向网盘分享服务的盗版视频资源发现方法 |
CN104021140A (zh) * | 2014-05-08 | 2014-09-03 | 北京奇艺世纪科技有限公司 | 一种网络视频的处理方法及装置 |
CN104484440A (zh) * | 2014-12-23 | 2015-04-01 | 小米科技有限责任公司 | 展示书籍信息的方法及装置 |
CN104504140A (zh) * | 2015-01-04 | 2015-04-08 | 中国联合网络通信集团有限公司 | 终端桌面图标的分类方法和装置 |
CN104965903A (zh) * | 2015-06-30 | 2015-10-07 | 北京奇艺世纪科技有限公司 | 一种资源的推荐方法和装置 |
CN104978419A (zh) * | 2015-06-30 | 2015-10-14 | 北京奇艺世纪科技有限公司 | 一种用户资源的上传处理方法和装置 |
CN105354283A (zh) * | 2015-10-30 | 2016-02-24 | 北京奇艺世纪科技有限公司 | 一种资源的搜索方法和装置 |
CN105574097A (zh) * | 2015-12-11 | 2016-05-11 | 北京奇虎科技有限公司 | 视频下载类搜索结果页的加载方法及装置 |
CN106033417A (zh) * | 2015-03-09 | 2016-10-19 | 深圳市腾讯计算机系统有限公司 | 视频搜索系列剧的排序方法和装置 |
WO2018018686A1 (zh) * | 2016-07-26 | 2018-02-01 | 深圳Tcl新技术有限公司 | 智能电视视频分享方法及视频分享系统 |
CN109543071A (zh) * | 2018-11-27 | 2019-03-29 | 深圳创维数字技术有限公司 | 剧集关系建立方法、装置、设备及存储介质 |
CN112182290A (zh) * | 2019-07-05 | 2021-01-05 | 北京字节跳动网络技术有限公司 | 一种信息处理方法、装置和电子设备 |
CN113784214A (zh) * | 2021-11-15 | 2021-12-10 | 南京进唯智能科技有限公司 | 一种基于大数据分析的视频整合系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6101492A (en) * | 1998-07-02 | 2000-08-08 | Lucent Technologies Inc. | Methods and apparatus for information indexing and retrieval as well as query expansion using morpho-syntactic analysis |
CN101261645A (zh) * | 2008-03-26 | 2008-09-10 | 北京搜狗科技发展有限公司 | 一种获取多层信息的方法和装置 |
CN101339560A (zh) * | 2008-08-11 | 2009-01-07 | 北京搜狗科技发展有限公司 | 一种搜索系列性数据的方法、装置及一种搜索引擎系统 |
CN101419614A (zh) * | 2008-12-03 | 2009-04-29 | 深圳市迅雷网络技术有限公司 | 视频资源聚类方法和装置 |
CN101719167A (zh) * | 2010-01-15 | 2010-06-02 | 北京暴风网际科技有限公司 | 一种可互动的影视搜索方法 |
-
2013
- 2013-11-08 CN CN201310553384.5A patent/CN103559286B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6101492A (en) * | 1998-07-02 | 2000-08-08 | Lucent Technologies Inc. | Methods and apparatus for information indexing and retrieval as well as query expansion using morpho-syntactic analysis |
CN101261645A (zh) * | 2008-03-26 | 2008-09-10 | 北京搜狗科技发展有限公司 | 一种获取多层信息的方法和装置 |
CN101339560A (zh) * | 2008-08-11 | 2009-01-07 | 北京搜狗科技发展有限公司 | 一种搜索系列性数据的方法、装置及一种搜索引擎系统 |
CN101419614A (zh) * | 2008-12-03 | 2009-04-29 | 深圳市迅雷网络技术有限公司 | 视频资源聚类方法和装置 |
CN101719167A (zh) * | 2010-01-15 | 2010-06-02 | 北京暴风网际科技有限公司 | 一种可互动的影视搜索方法 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942254A (zh) * | 2014-03-18 | 2014-07-23 | 电子科技大学 | 一种面向网盘分享服务的盗版视频资源发现方法 |
CN103942254B (zh) * | 2014-03-18 | 2017-11-14 | 电子科技大学 | 一种面向网盘分享服务的盗版视频资源发现方法 |
CN104021140A (zh) * | 2014-05-08 | 2014-09-03 | 北京奇艺世纪科技有限公司 | 一种网络视频的处理方法及装置 |
CN104021140B (zh) * | 2014-05-08 | 2018-01-26 | 北京奇艺世纪科技有限公司 | 一种网络视频的处理方法及装置 |
CN104484440A (zh) * | 2014-12-23 | 2015-04-01 | 小米科技有限责任公司 | 展示书籍信息的方法及装置 |
CN104504140B (zh) * | 2015-01-04 | 2017-10-20 | 中国联合网络通信集团有限公司 | 终端桌面图标的分类方法和装置 |
CN104504140A (zh) * | 2015-01-04 | 2015-04-08 | 中国联合网络通信集团有限公司 | 终端桌面图标的分类方法和装置 |
CN106033417B (zh) * | 2015-03-09 | 2020-07-21 | 深圳市腾讯计算机系统有限公司 | 视频搜索系列剧的排序方法和装置 |
CN106033417A (zh) * | 2015-03-09 | 2016-10-19 | 深圳市腾讯计算机系统有限公司 | 视频搜索系列剧的排序方法和装置 |
CN104965903A (zh) * | 2015-06-30 | 2015-10-07 | 北京奇艺世纪科技有限公司 | 一种资源的推荐方法和装置 |
CN104978419B (zh) * | 2015-06-30 | 2019-10-08 | 北京奇艺世纪科技有限公司 | 一种用户资源的上传处理方法和装置 |
CN104978419A (zh) * | 2015-06-30 | 2015-10-14 | 北京奇艺世纪科技有限公司 | 一种用户资源的上传处理方法和装置 |
CN105354283A (zh) * | 2015-10-30 | 2016-02-24 | 北京奇艺世纪科技有限公司 | 一种资源的搜索方法和装置 |
CN105574097A (zh) * | 2015-12-11 | 2016-05-11 | 北京奇虎科技有限公司 | 视频下载类搜索结果页的加载方法及装置 |
CN105574097B (zh) * | 2015-12-11 | 2019-05-28 | 北京奇虎科技有限公司 | 视频下载类搜索结果页的加载方法及装置 |
WO2018018686A1 (zh) * | 2016-07-26 | 2018-02-01 | 深圳Tcl新技术有限公司 | 智能电视视频分享方法及视频分享系统 |
CN109543071A (zh) * | 2018-11-27 | 2019-03-29 | 深圳创维数字技术有限公司 | 剧集关系建立方法、装置、设备及存储介质 |
CN112182290A (zh) * | 2019-07-05 | 2021-01-05 | 北京字节跳动网络技术有限公司 | 一种信息处理方法、装置和电子设备 |
CN113784214A (zh) * | 2021-11-15 | 2021-12-10 | 南京进唯智能科技有限公司 | 一种基于大数据分析的视频整合系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103559286B (zh) | 2017-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103559286A (zh) | 视频搜索结果的处理方法及装置 | |
CN102855309B (zh) | 一种基于用户行为关联分析的信息推荐方法及装置 | |
CN105893390B (zh) | 一种应用程序的处理方法及电子设备 | |
CN104537065A (zh) | 一种搜索结果的推送方法及系统 | |
CN103760991B (zh) | 一种实体输入方法和装置 | |
CN104077388A (zh) | 基于搜索引擎的摘要信息提取方法、装置以及搜索引擎 | |
CN103955525A (zh) | 一种搜索试题答案的方法及客户端 | |
CN103631889B (zh) | 一种图像识别方法和装置 | |
CN102968451A (zh) | 浏览器格式页面中加载网址数据的方法和客户端 | |
CN104991962A (zh) | 一种生成推荐信息的方法及装置 | |
CN103778204A (zh) | 基于语音分析的视频搜索方法、设备及系统 | |
CN103186666A (zh) | 基于收藏进行搜索的方法、装置与设备 | |
CN105630937A (zh) | 一种搜索试题答案的方法以及装置 | |
CN103942264A (zh) | 推送包含新闻信息的网页的方法和装置 | |
CN102016782B (zh) | 操作支援装置以及操作支援方法 | |
CN101894109A (zh) | 一种数据库建立方法和装置 | |
CN103761232A (zh) | 一种提供网页媒体内容信息的方法和装置 | |
CN102902784A (zh) | 网页分类存储系统及方法 | |
CN102955847A (zh) | 浏览器格式页面中加载网址数据的系统 | |
EP3905060A1 (en) | Artificial intelligence for content discovery | |
CN103761231A (zh) | 一种搜索引擎提供网页媒体内容信息的方法和装置 | |
CN103984754A (zh) | 一种搜索系统和搜索方法 | |
CN107239209B (zh) | 一种拍照搜索方法、装置、终端及存储介质 | |
CN104199982A (zh) | 一种对搜索关键词进行显示的方法及装置 | |
CN107391613B (zh) | 一种工业安全主题多文档自动消歧方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170426 Termination date: 20211108 |
|
CF01 | Termination of patent right due to non-payment of annual fee |