CN102033937A - 视频搜索结果的展示方法及其系统 - Google Patents
视频搜索结果的展示方法及其系统 Download PDFInfo
- Publication number
- CN102033937A CN102033937A CN 201010596764 CN201010596764A CN102033937A CN 102033937 A CN102033937 A CN 102033937A CN 201010596764 CN201010596764 CN 201010596764 CN 201010596764 A CN201010596764 A CN 201010596764A CN 102033937 A CN102033937 A CN 102033937A
- Authority
- CN
- China
- Prior art keywords
- exhibiting
- picture
- pictures
- exhibiting pictures
- search result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明揭示了一种视频搜索结果的展示方法,包括:S1,接收输入的查询信息;S2,挖掘与所述查询信息相关的文本信息,并对所述文本信息按照周期性进行排续;S3,搜集与所述文本信息相对应的预选图片,并从所述预选图片中挑选出展示图片;S4,将排序后的所述文本信息及其对应的展示图片输出。本发明还揭示了一种视频搜索结果的展示系统。相较于现有技术,本发明的有益效果是:通过展示序列化的文本信息及其对应的图片,可以方便用户查找,提高用户查找效率,节约网络流量。
Description
技术领域
本发明涉及一种视频搜索结果的展示方法及其系统,属于搜索引擎技术领域。
背景技术
过去十几年以来,人们越来越依赖于互联网提供的丰富、快捷、及时的信息。但是如何在浩如烟海的信息中找到待搜寻的信息,成为一项迫切需要解决的问题,相应地,众多的互联网搜索引擎及对应的网站应运而生,这中间的佼佼者包括百度公司的百度搜索(www.baidu.com)和谷歌公司的谷歌搜索(www.google.cn)。
随着网络技术的不断发展,用户可以通过搜索引擎查询自己需要的视频文件。例如,用户从搜索页面输入查询信息(query),如:“武林外传”,搜索引擎只要在视频文件的标题或内容中搜索到“武林外传”这几个关键词,均会被认为是与查询信息相匹配的视频文件。这样导致的问题请参图1所示,搜索引擎返回的结果页面中有不同的第三方视频链接,而且每集的信息都是散乱的排布于结果页面。如果用户只是想看其中的某一集,就需要从杂乱的结果页面中查找,从而导致用户查找时间较长、网络流量较大。现有的搜索系统对用户的要求较高,用户需要预先选择关键词,而且关键词的选取至关重要,因为查询质量在很大程度上依赖于关键词选取的好坏。
与本发明相关的现有技术可参阅2007年11月28日公开的中国发明专利第CN101079033A号,该发明揭示了一种综合搜索结果的排序系统及其方法,所述系统包括数据分析模块、数据库和排序模块;所述数据分析模块提供可用于排序算法的数据信息,并导入所述数据库中存储;所述数据库用于存储数据分析模块提供的数据信息,供应所述排序模块执行排序算法时提取,并存储所述排序模块得到的最终排序信息;所述排序模块用于根据所述数据库中存储的数据信息执行排序算法,对所述垂直搜索引擎进行排序,并将最终排序信息存储到所述数据库中。所述方法包括以下步骤:A.在所述综合搜索引擎中输入检索词进行搜索,得到全部垂直搜索引擎搜索的结果;B.所述排序模块从所述数据库提取数据信息,采取排序算法计算该次搜索中每种垂直搜索引擎的综合值;C.对所述每种垂直搜索引擎的综合值进行比较,对所述垂直搜索引擎进行排序,并将最终排序信息显示输出。
虽然,该现有技术已经揭示了利用排序模块对搜索的数据信息进行排序并最终将排序信息显示输出,然而,仅仅将序列化的数据信息展示给用户,往往还不能够满足用户的需求,因为在某些情况下即使已经序列化的数据信息仍不能帮助用户判断其真正需要的哪一个,进而导致用户查找时间较长、网络流量较大。
发明内容
本发明所要解决的技术问题在于提供一种改进的视频搜索结果的展示方法。
本发明所要解决的技术问题还在于提供一种改进的视频搜索结果的展示系统。
相应地,本发明的一种视频搜索结果的展示方法,包括:
S1,接收输入的查询信息;
S2,挖掘与所述查询信息相关的文本信息,并对所述文本信息按照周期性进行排续;
S3,搜集与所述文本信息相对应的预选图片,并从所述预选图片中挑选出展示图片;
S4,将排序后的所述文本信息及其对应的展示图片输出。
作为本发明的进一步改进,步骤S4中,所述文本信息及其对应的展示图片输出至第一结果页面。
作为本发明的进一步改进,在所述第一结果页面中,所述文本信息或者所述展示图片具有进入第二结果页面的精确链接。
作为本发明的进一步改进,所述第二结果页面包括至少一个第三方视频播放页面链接。
作为本发明的进一步改进,所述第二结果页面是嵌着第三方视频播放器的页面。
作为本发明的进一步改进,所述S3包括图片去重步骤和展示图片挑选步骤。
作为本发明的进一步改进,所述图片去重步骤包括:
接收预选图片;
计算所述预选图片与已有的候选展示图片的方差;
判断方差是否大于等于设定阈值;
如果是,则判定为两张图片不相似;
如果否,则判定为两张图片相似,并删除其中一张图片。
作为本发明的进一步改进,在所述“接收预选图片”和“计算所述预选图片与已有的候选展示图片的方差”之间,还包括以下步骤:
判断该预选图片是否为接收到的第一张预选图片;
如果是,则直接运用该预选图片为候选展示图片;
如果否,则执行“计算所述预选图片与已有的候选展示图片的方差”步骤。
作为本发明的进一步改进,所述展示图片挑选步骤,包括:
接收与同一文本信息相对应的候选展示图片;
判断所述候选展示图片是否为单色图片;
如果均为单色图片,则挑选一张熵最大的候选展示图片作为展示图片;
如果不完全是单色图片,则过滤单色图片。
作为本发明的进一步改进,在“过滤单色图片”后,还包括:
判断候选展示图片是否为马赛克图片;
如果均为马赛克图片,则挑选马赛克块最小的一张做为展示图片;
如果不完全是马赛克图片,则过滤掉马赛克图片。
作为本发明的进一步改进,在“过滤掉马赛克图片”后,还包括:
计算所述候选展示图片的熵值;
过滤掉熵值最小的候选展示图片;
计算所计算候选展示图片的中心区域和图片边缘区域的边缘密度比值;
根据所述边缘密度比值的结果设置加权因子,计算清晰度加权值;
计算清晰度加权值和边缘密度比值的加权和;
选择加权和最大的候选展示图片作为展示图片。
作为本发明的进一步改进,如果查询信息所对应的是连续剧,则步骤S2中文本信息排序为按照所述连续剧的顺序进行排序。
作为本发明的进一步改进,步骤S2还包括对所述连续剧总集数的判断步骤。
相应地,本发明的一种搜索结果的序列化展示装置,包括:
查询模块,用于接收输入的查询信息;
挖掘排序模块,用于挖掘与所述查询信息相关的文本信息,并对所述文本信息按照周期性进行排续;
取图选图模块,用于搜集与所述文本信息相对应的预选图片,并从所述预选图片中挑选出展示图片;以及
展示模块,用于将排序后的所述文本信息及其对应的展示图片输出。
作为本发明的进一步改进,所述展示模块将所述文本信息及其对应的展示图片输出至第一结果页面。
作为本发明的进一步改进,在所述第一结果页面中,所述文本信息或者所述展示图片具有进入第二结果页面的精确链接。
作为本发明的进一步改进,所述第二结果页面包括至少一个第三方视频播放页面链接。
作为本发明的进一步改进,所述第二结果页面是嵌着第三方视频播放器的页面。
作为本发明的进一步改进,所述取图选图模块可将所述预选图片去重,得到候选展示图片。
作为本发明的进一步改进,所述取图选图模块可在所述候选展示图片中挑选出展示图片。
作为本发明的进一步改进,所述取图选图模块包括:
取图子模块,用于搜集与所述文本信息相对应的预选图片;
选图子模块,用于从所述预选图片中挑选出所述展示图片。
作为本发明的进一步改进,所述挖掘排序模块包括:
判断单元,用于在文本挖掘的过程中对文本信息的真伪进行判断。
相较于现有技术,本发明的有益效果是:通过展示序列化的文本信息及其对应的图片,可以方便用户查找,提高用户查找效率,节约网络流量。
附图说明
图1是现有技术中的搜索结果页面示意图。
图2是本发明展示序列化搜索结果的系统的模块图。
图3是本发明展示序列化搜索结果的系统另一种实施方式的模块图。
图4是本发明视频搜索结果的展示方法的流程图。
图5是本发明视频搜索结果的展示方法另一种实施方式的流程图。
图6是本发明视频搜索结果的展示方法再一种实施方式的流程图。
图7是本发明预选图片筛选步骤中的图片去重步骤的流程图。
图8是本发明预选图片筛选步骤中的展示图片挑选步骤的流程图。
图9是利用本发明视频搜索结果的展示方法及其系统所返回的中间页面示意图。
具体实施方式
请参图2所示,本发明揭示了一种视频搜索结果的展示系统,其包括查询模块1、挖掘排序模块2、取图选图模块3及展示模块4。
所述查询模块1用于接收用户输入的查询信息,例如连续剧的名称、周期性视频文件的名称等等。在本实施方式中为连续剧“武林外传”。
所述挖掘排序模块2用于根据用户输入的查询信息挖掘出与该查询信息相关的文本信息,并对所述文本信息按照周期性进行排序。
取图选图模块3用于搜集与所述文本信息相对应的预选图片,并从所述预选图片中挑选出展示图片。其中,所述取图选图模块3包括取图子模块31及选图子模块32。取图子模块31用于搜集与所述文本信息相对应的预选图片,而选图子模块32用于从所述预选图片中挑选出所述展示图片,供用户识别。
所述展示模块4用于将序列化排序后的文本信息及其对应的展示图片向用户展示。
以下结合视频文件以更好的描述本发明。请参图2所示,首先,以视频文件为连续剧“武林外传”为例,挖掘排序模块2首先对各种视频网站进行搜索,通过文本挖掘可以得到“武林外传”每一集的相关资源,例如:武林外传第一集、武林外传第二集、武林外传第三集等等,并将每一集与其对应的URL资源建表存于数据库。通过对各种视频网站进行搜索并保存URL资源,能够充分地利用网络资源,不需要将文件的全部内容保存到数据库中,以节省数据库的容量。通常情形下,视频文件的档案较大,如果将各种视频文件的全部内容都保存到数据库中,则需要数据库具备很大的容量,并且维护起来也非常不便。所述挖掘排序模块2对每一集的相关资源进行聚类,按照连续剧每一集的顺序进行排列。
取图子模块31用于根据挖掘排序模块2所搜集到的文本信息,从各种视频网站中查找与集数相对应的所有预选图片,并将URL资源对应的预选图片建表存于数据库中。由于不同的视频网站对同一集连续剧所展示出来的预选图片往往是不同的,所以,取图子模块31可以从不同的视频网站搜集各种不同的预选图片。当然,通过设定程序,可以对数据库中的文本信息、预选图片、及URL资源进行定期更新。
选图子模块32用于从所述预选图片中挑选出所述展示图片。即是对挖掘到的视频每一集选取合适的展示图片,并将每一集与该集相对应的展示图片关联后建表存于数据库。由于取图子模块31搜集到的预选图片是各种各样的,有的是片头、有的是片尾、有的是模糊的、有的是色彩暗淡的、有的是清楚且色彩亮丽的、有的是内容空洞的等等。当然,这些预选图片中也极可能存在相互重复的。总之,这些预选图片中并不是都是适合展示的。为了挑选出适合的展示图片,所述选图子模块32通过一定的算法将重复的预选图片删除,该算法将在下面结合图7进行具体说明。由于每一集的片头及每一集的片尾的预选图片均比较近似,用户难以通过这些预选图片对该集的内容做区分,因此,选图子模块32一般情况下不会将每一集的片头及片尾作为最终选取的展示图片。在本实施方式中,选图子模块32通过一定的算法,将颜色亮丽的图片作为最终被挑选出来展示给用户的展示图片,该算法将在下面结合图8进行具体说明。
所述展示模块4把经过序列化排序的文本信息及其对应的展示图片结合起来并展示给用户。如果用户明确知道需要寻找的集数,可以通过已经排序的集数迅速找到。如果用户不确定需要寻找的集数,可以参考选图子模块32所挑选出来的展示图片,帮助其判断需要寻找的是第几集,进而使本发明展示序列化搜索结果的系统用户查找效率较高,节约网络流量。
请参图3所示,在本发明展示序列化搜索结果的系统另一种实施方式中,所述挖掘排序模块2包括一个判断单元21,用于在文本挖掘的过程中对文本信息的真伪进行判断。例如:该判断单元21用以在文本挖掘的过程中对连续剧“武林外传”的总集数进行判断。当然,判断的方法有很多种,例如通过资源的头、尾可以对连续剧的总集数进行判断;另外,也可以根据挖到的每一集资源的数目来做判断,例如“武林外传”实际上只有81集,在81集之前每一集挖到的资源都很多,而第82集的资源突然很少,此时判断单元21就可以认为第82集是不真实的,从而得出“武林外传”的总集数为81集。另外,如果某些视频文件的出现是周期性的或者具有某些时间特征,判断单元21对于这些视频文件真实性的判断可以采用如下规则:(1).通过监测视频文件(如连续剧)的首映时间,可以判断凡是在该首映时间之前出现的资源都是不真实的;(2).由于一般连续剧每集的播放时间比较类似,通过设定算法,可以从播放时间上排除那些明显不正确的集数。总之,周期性视频文件的总集数的判断方式有很多,在此不再赘述。
当查询模块1接受到用户输入的查询信息为“武林外传”时,由于相关资源已经事先被搜索出来且存于数据库中(如前所述),所以挖掘排序模块2只需要从该数据库中搜索相关文本信息并对这些文本信息进行排序。另外,取图选图模块3也只需要从数据库中选取适合的展示图片。展示模块4最终把已经序列化排序的文本信息及其展示图片展示给用户即可。在本实施方式中,所述展示模块4会先向用户返回一个中间页面,如图9所示。该中间页面所展示的内容包括序列化排序的文本信息及与这些文本信息相对应的展示图片。用户通过序列化排序的文本信息及展示出来的展示图片,可以很容易的判断其需要寻找的集数,使用方便、用户查找效率高。由于中间页面显示的每一集的文本信息或者展示图片的后面都隐藏着一个精确的链接,故只需点击该文本信息或展示图片,就可以搜索至结果页面。结果页面的显示方式有两种,一种是包括至少一个第三方视频播放页面链接,例如当点击第一集时,会出现之前已经挖掘到的所有第一集的第三方视频,可能包含优酷的、酷6的等等;另一种是嵌着第三方视频播放器的页面。
当然,在其它实施方式中,当查询模块1接受到用户输入的查询信息为“武林外传”时,挖掘排序模块2即时去各种视频网站进行搜索,通过文本挖掘可以得到“武林外传”每一集的相关资源,例如:武林外传第一集、武林外传第二集、武林外传第三集等等,并将每一集与其对应的URL资源建表存于数据库,此外,挖掘排序模块2对所搜集到的文本信息进行排序;然后,取图子模块31根据挖掘排序模块2所搜集到的文本信息,从各种视频网站中查找与集数相对应的所有预选图片,并将URL资源对应的预选图片建表存于数据库中;选图子模块32再对挖掘到的视频每一集选取合适的展示图片,并将每一集与该集相对应的展示图片建表存于数据库;最终,展示模块4将已经序列化排序的文本信息及其展示图片展示给用户即可。通过该动作过程,同样可以实现本发明的目的。
请参图4所示,本发明还揭示了一种视频搜索结果的展示方法,其包括如下步骤:
S1,接收用户输入的查询信息,例如连续剧的名称、周期性视频文件的名称等等。在本实施方式中为连续剧“武林外传”。
S2,从本地数据库中挖掘出与该查询信息相关的文本信息(例如,武林外传第一集、武林外传第二集、武林外传第三集、及剧情介绍等等),并对这些文本信息按照周期性进行排续(在本实施方式中即对连续剧的剧集顺序进行排序);
S3,从数据库中搜集与所述文本信息相对应的预选图片,并从所述预选图片中挑选出展示图片。由于搜集到的预选图片是各种各样的,有的是片头、有的是片尾、有的是模糊的、有的是色彩暗淡的、有的是清楚且色彩亮丽的、有的是内容空洞的等等。当然,这些预选图片中也极可能存在相互重复的。总之,这些预选图片中并不是都是适合展示的。为了挑选出适合的展示图片,通过一定的算法将重复的预选图片删除,该算法将在下面结合图7进行具体说明。由于每一集的片头及每一集的片尾的预选图片均比较近似,用户难以通过这些预选图片对该集的内容做区分,因此,一般情况下不会将每一集的片头及片尾作为最终选取的展示图片。在本实施方式中,通过一定的算法,将颜色亮丽的图片作为最终被挑选出来展示给用户的展示图片,该算法将在下面结合图8进行具体说明。
S4,将上述已经序列化排序的文本信息及其对应的展示图片输出,在本实施方式中,序列化排序的文本信息及其对应的展示图片通过返回给用户的中间页面展示出来。
步骤S4中,由于中间页面显示的每一集的文本信息或者展示图片的后面都隐藏着一个精确的链接,故只需点击该文本信息或展示图片,就可以搜索至结果页面。结果页面的显示方式有两种,一种是包括至少一个第三方视频播放页面链接,例如当点击第一集时,会出现之前已经挖掘到的所有第一集的第三方视频,可能包含优酷的、酷6的等等;另一种是嵌着第三方视频播放器的页面。
步骤S2中,与查询信息相关的URL资源及与该URL资源对应的预选图片均被建表存于本地数据库中。在本实施方式中,所述URL资源及与该URL资源对应的预选图片是通过抓取各种视频网站数据而得到的。
当然,在其它实施方式中,步骤S4可以将上述文本信息及其对应的展示图片通过结果页面直接展示出来。
请参图5所示,本发明视频搜索结果的展示方法的另一种实施方式,其中,在步骤S2还包括所述视频连续剧总集数的判断步骤,例如,在文本挖掘的过程中对连续剧“武林外传”的总集数进行判断。当然,判断的方法有很多种,例如通过资源的头、尾可以对连续剧的总集数进行判断;另外,也可以根据挖到的每一集资源的数目来做判断,例如“武林外传”实际上只有81集,在81集之前每一集挖到的资源都很多,而第82集的资源突然很少,此时判断单元21就可以认为第82集是不真实的,从而得出“武林外传”的总集数为81集。另外,如果某些视频文件的出现是周期性的或者具有某些时间特征,对于这些视频文件真实性的判断可以采用如下规则:(1).通过监测视频文件(如连续剧)的首映时间,可以判断凡是在该首映时间之前出现的资源都是不真实的;(2).由于一般连续剧每集的播放时间比较类似,通过设定算法,可以从播放时间上排除那些明显不正确的集数。总之,周期性视频文件的总集数的判断方式有很多,在此不再赘述。如果文本信息齐备,则对这些文本信息进行排序,如果文本信息不齐备,则继续挖掘该文本信息。如果连续剧的某一集资源突然变得很少,则判断连续剧的总集数为该集对应的数字减去1。
请参图6所示,本发明视频搜索结果的展示方法的再一种实施方式,其包括如下步骤:
S1’,接收用户输入的查询信息,例如连续剧的名称、周期性视频文件的名称等等。在本实施方式中为连续剧“武林外传”;
S2’,即时去各种视频网站进行搜索,并挖掘出与该查询信息相关的文本信息(例如,武林外传第一集、武林外传第二集、武林外传第三集、及剧情介绍等等),并将每一集与其对应的URL资源建表存于数据库,然后对这些文本信息进行周期性排续(在本实施方式中即对连续剧的总集数进行排序);
S3’,根据S2’步骤所搜集到的文本信息,从各种视频网站中查找与集数相对应的预选图片,并将URL资源对应的预选图片建表存于数据库中;并通过一定的算法最终选择出适当的展示图片;由于搜集到的预选图片是各种各样的,有的是片头、有的是片尾、有的是模糊的、有的是色彩暗淡的、有的是清楚且色彩亮丽的、有的是内容空洞的等等。当然,这些预选图片中也极可能存在相互重复的。总之,这些预选图片中并不是都是适合展示的。为了挑选出适合的展示图片,通过一定的算法将重复的预选图片删除,该算法将在下面结合图7进行具体说明。由于每一集的片头及每一集的片尾的预选图片均比较近似,用户难以通过这些预选图片对该集的内容做区分,因此,一般情况下不会将每一集的片头及片尾作为最终选取的展示图片。在本实施方式中,通过一定的算法,将颜色亮丽的图片作为最终被挑选出来展示给用户的展示图片,该算法将在下面结合图8进行具体说明。
S4’,将上述已经序列化排序的文本信息及其对应的展示图片输出,在本实施方式中,序列化排序的文本信息及其对应的展示图片通过返回给用户的中间页面展示出来。
步骤S4’中,由于中间页面显示的每一集的文本信息或者展示图片的后面都隐藏着一个精确的链接,故只需点击该文本信息或展示图片,就可以搜索至结果页面。结果页面的显示方式有两种,一种是包括至少一个第三方视频播放页面链接,例如当点击第一集时,会出现之前已经挖掘到的所有第一集的第三方视频,可能包含优酷的、酷6的等等;另一种是嵌着第三方视频播放器的页面。
步骤S2’中,与查询信息相关的URL资源及与该URL资源对应的预选图片均被建表存于本地数据库中。在本实施方式中,所述URL资源及与该URL资源对应的预选图片是通过抓取各种视频网站数据而得到的。
当然,在其它实施方式中,步骤S4’可以将上述文本信息及其对应的展示图片通过结果页面直接展示出来。
步骤S2’还包括所述视频连续剧总集数的判断步骤,例如,在文本挖掘的过程中对连续剧“武林外传”的总集数进行判断。当然,判断的方法有很多种,例如通过资源的头、尾可以对连续剧的总集数进行判断;另外,也可以根据挖到的每一集资源的数目来做判断,例如“武林外传”实际上只有81集,在81集之前每一集挖到的资源都很多,而第82集的资源突然很少,此时判断单元21就可以认为第82集是不真实的,从而得出“武林外传”的总集数为81集。另外,如果某些视频文件的出现是周期性的或者具有某些时间特征,对于这些视频文件真实性的判断可以采用如下规则:(1).通过监测视频文件(如连续剧)的首映时间,可以判断凡是在该首映时间之前出现的资源都是不真实的;(2).由于一般连续剧每集的播放时间比较类似,通过设定算法,可以从播放时间上排除那些明显不正确的集数。总之,周期性视频文件的总集数的判断方式有很多,在此不再赘述。如果文本信息齐备,则对这些文本信息进行排序,如果文本信息不齐备,则继续挖掘该文本信息。如果连续剧的某一集资源突然变得很少,则判断连续剧的总集数为该集对应的数字减去1。
前述步骤S3或S3’还包括图片去重步骤和展示图片挑选步骤。
请参图7所示,其中图片去重步骤,包括:
步骤S31,接收预选图片;
步骤S32,判断该预选图片是否为接收到的第一张预选图片;
如果是,则执行步骤S33,直接运用该预选图片为候选展示图片;
如果否,则执行步骤S34,计算该预选图片与已有的候选展示图片的方差;
步骤S35,判断方差是否大于等于设定阈值;
如果是,执行步骤S36,判定为两张图片不相似;
如果否,执行步骤S37,判定为两张图片相似,并删除其中一张图片,优选地,是删除所述预选图片。
利用以上算法可以对图片进行去重,从而将其中重复的图片删除掉。
在图片去重步骤后,进行展示图片挑选步骤。通常情况下,展示图片需要能够体现视频主题、画面干净清晰、主体内容突出。
体现视频主题方面:一个视频往往会描述多个内容实体,有多个不同的场景,单靠一张图像来代表整个视频,要达到体现视频主题是比较困难的。所以,在这一方面将重点放在过滤方面,而不是每个帧的语义分析上。需要过滤主要包括:黑屏、绿屏、整体颜色过暗或者过亮、虚镜头、叠影和马赛克等。
画面干净清晰方面:图像清晰通过清晰度来表示,图像是否干净可以用边缘密度来判断。
主题内容突出方面:通过边缘密度比值比和视觉黄金区域等权重计算来表达。
请参图8所示,展示图片挑选步骤的流程如下:
步骤S301,接收与同一文本信息相对应的候选展示图片;
步骤S302,过滤单色图片;即判断输入的候选展示图片是否为单色图片,如果都为单色图片,则挑选一张熵最大的候选展示图片作为展示图片,如果不完全是单色的图片,则过滤掉单色图片;
步骤S303,过滤马赛克图片;即判断候选展示图片是否为马赛克图片,如果都是马赛克图片则挑选马赛克块最小的一张做为展示图片,如果不完全是马赛克图片,则过滤掉马赛克图片;
步骤S304,计算候选展示图片的熵值;
步骤S305,过滤掉熵值最小的候选展示图片(在本实施方式中使用K均值算法,过滤掉熵值最小的候选展示图片);
步骤S306,计算边缘比值密度;在本实施方式中,利用黄金视觉区域划分,计算候选展示图片的中心区域和图片边缘区域的边缘密度比值,同时计算整个候选展示图片的边缘密度,去掉部分边缘密度过高的候选展示图片;
步骤S307,计算清晰度;即根据边缘密度比值的结果设置加权因子,计算清晰度加权值;
步骤S308,计算清晰度和边缘密度比值的加权和;即使用清晰度和边缘比值进行加权计算;
步骤S309,选择加权和最大的候选展示图片作为展示图片;即选择出图片清晰且主体内容出现在图片中间部分的候选展示图片作为展示图片;
请参图9所示,相较于现有技术,本发明通过不直接展现搜索到的第三方视频链接结果,而是在用户输入查询信息后,先向用户返回有视频排序结果的中间页面,通过该中间页面的引导到达嵌入第三方视频页面的播放页面,从而实现了对用户搜索的有顺序关系的视频进行排序显示的功能,使用方便、用户查询效率较高、网络流量较小。
综上所述,以上仅为本发明的较佳实施例而已,不应以此限制本发明的范围,即凡是依本发明权利要求书及发明说明书内容所作的简单的等效变化与修饰,皆应仍属本发明专利涵盖的范围内。
Claims (22)
1.一种视频搜索结果的展示方法,其特征在于,包括如下步骤:
S1,接收输入的查询信息;
S2,挖掘与所述查询信息相关的文本信息,并对所述文本信息按照周期性进行排续;
S3,搜集与所述文本信息相对应的预选图片,并从所述预选图片中挑选出展示图片;
S4,将排序后的所述文本信息及其对应的展示图片输出。
2.如权利要求1所述的视频搜索结果的展示方法,其特征在于:步骤S4中,所述文本信息及其对应的展示图片输出至第一结果页面。
3.如权利要求2所述的视频搜索结果的展示方法,其特征在于:在所述第一结果页面中,所述文本信息或者所述展示图片具有进入第二结果页面的精确链接。
4.如权利要求3所述的视频搜索结果的展示方法,其特征在于:所述第二结果页面包括至少一个第三方视频播放页面链接。
5.如权利要求3所述的视频搜索结果的展示方法,其特征在于:所述第二结果页面是嵌着第三方视频播放器的页面。
6.如权利要求1所述的搜索结果序列化展示方法,其特征在于,所述S3包括图片去重步骤和展示图片挑选步骤。
7.如权利要求6所述的视频搜索结果的展示方法,其特征在于,所述图片去重步骤包括:
接收预选图片;
计算所述预选图片与已有的候选展示图片的方差;
判断方差是否大于等于设定阈值;
如果是,则判定为两张图片不相似;
如果否,则判定为两张图片相似,并删除其中一张图片。
8.如权利要求7所述的视频搜索结果的展示方法,其特征在于,在所述“接收预选图片”和“计算所述预选图片与已有的候选展示图片的方差”之间,还包括以下步骤:
判断该预选图片是否为接收到的第一张预选图片;
如果是,则直接运用该预选图片为候选展示图片;
如果否,则执行“计算所述预选图片与已有的候选展示图片的方差”步骤。
9.如权利要求6所述的视频搜索结果的展示方法,其特征在于,所述展示图片挑选步骤,包括:
接收与同一文本信息相对应的候选展示图片;
判断所述候选展示图片是否为单色图片;
如果均为单色图片,则挑选一张熵最大的候选展示图片作为展示图片;
如果不完全是单色图片,则过滤单色图片。
10.如权利要求9所述的视频搜索结果的展示方法,其特征在于,在“过滤单色图片”后,还包括:
判断候选展示图片是否为马赛克图片;
如果均为马赛克图片,则挑选马赛克块最小的一张做为展示图片;
如果不完全是马赛克图片,则过滤掉马赛克图片。
11.如权利要求10所述的视频搜索结果的展示方法,其特征在于,在“过滤掉马赛克图片”后,还包括:
计算所述候选展示图片的熵值;
过滤掉熵值最小的候选展示图片;
计算所计算候选展示图片的中心区域和图片边缘区域的边缘密度比值;
根据所述边缘密度比值的结果设置加权因子,计算清晰度加权值;
计算清晰度加权值和边缘密度比值的加权和;
选择加权和最大的候选展示图片作为展示图片。
12.如权利要求1所述的视频搜索结果的展示方法,其特征在于:如果查询信息所对应的是连续剧,则步骤S2中文本信息排序为按照所述连续剧的顺序进行排序。
13.如权利要求12所述的视频搜索结果的展示方法,其特征在于:步骤S2还包括对所述连续剧总集数的判断步骤。
14.一种视频搜索结果的展示系统,其特征在于,该系统包括:
查询模块,用于接收输入的查询信息;
挖掘排序模块,用于挖掘与所述查询信息相关的文本信息,并对所述文本信息按照周期性进行排续;
取图选图模块,用于搜集与所述文本信息相对应的预选图片,并从所述预选图片中挑选出展示图片;以及
展示模块,用于将排序后的所述文本信息及其对应的展示图片输出。
15.如权利要求14所述的视频搜索结果的展示系统,其特征在于:所述展示模块将所述文本信息及其对应的展示图片输出至第一结果页面。
16.如权利要求15所述的视频搜索结果的展示系统,其特征在于:在所述第一结果页面中,所述文本信息或者所述展示图片具有进入第二结果页面的精确链接。
17.如权利要求16所述的视频搜索结果的展示系统,其特征在于:所述第二结果页面包括至少一个第三方视频播放页面链接。
18.如权利要求16所述的视频搜索结果的展示系统,其特征在于:所述第二结果页面是嵌着第三方视频播放器的页面。
19.如权利要求14所述的视频搜索结果的展示系统,其特征在于,所述取图选图模块可将所述预选图片去重,得到候选展示图片。
20.如权利要求19所述的视频搜索结果的展示系统,其特征在于,所述取图选图模块可在所述候选展示图片中挑选出展示图片。
21.如权利要求14或19或20所述的视频搜索结果的展示系统,其特征在于,所述取图选图模块包括:
取图子模块,用于搜集与所述文本信息相对应的预选图片;
选图子模块,用于从所述预选图片中挑选出所述展示图片。
22.如权利要求14所述的视频搜索结果的展示系统,其特征在于:所述挖掘排序模块包括:
判断单元,用于在文本挖掘的过程中对文本信息的真伪进行判断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010596764 CN102033937A (zh) | 2010-12-20 | 2010-12-20 | 视频搜索结果的展示方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010596764 CN102033937A (zh) | 2010-12-20 | 2010-12-20 | 视频搜索结果的展示方法及其系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102033937A true CN102033937A (zh) | 2011-04-27 |
Family
ID=43886830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010596764 Pending CN102033937A (zh) | 2010-12-20 | 2010-12-20 | 视频搜索结果的展示方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102033937A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102929874A (zh) * | 2011-08-08 | 2013-02-13 | 深圳市快播科技有限公司 | 检索数据的排序方法及装置 |
CN102955947A (zh) * | 2011-08-19 | 2013-03-06 | 北京百度网讯科技有限公司 | 一种用于确定图像清晰度的设备及其方法 |
CN103020086A (zh) * | 2011-09-26 | 2013-04-03 | 北大方正集团有限公司 | 一种图片查重的方法及装置 |
CN103049570A (zh) * | 2012-12-31 | 2013-04-17 | 天津大学 | 基于相关保持映射和一分类器的图像视频搜索排序方法 |
WO2013128462A1 (en) * | 2012-02-27 | 2013-09-06 | Hewlett-Packard Development Company, L.P. | Video search |
WO2013143465A1 (zh) * | 2012-03-27 | 2013-10-03 | 华为技术有限公司 | 一种视频查询方法、装置与系统 |
CN103377473A (zh) * | 2012-04-19 | 2013-10-30 | 腾讯科技(深圳)有限公司 | 一种图像排重方法和装置 |
CN103678527A (zh) * | 2013-12-02 | 2014-03-26 | Tcl集团股份有限公司 | 一种基于视频标题和内容的视频过滤方法和系统 |
CN105574097A (zh) * | 2015-12-11 | 2016-05-11 | 北京奇虎科技有限公司 | 视频下载类搜索结果页的加载方法及装置 |
CN108829844A (zh) * | 2018-06-20 | 2018-11-16 | 聚好看科技股份有限公司 | 一种信息搜索方法及系统 |
CN110110101A (zh) * | 2018-09-21 | 2019-08-09 | 北京字节跳动网络技术有限公司 | 多媒体内容的推荐方法、装置、终端、服务器及可读介质 |
CN111309947A (zh) * | 2018-12-11 | 2020-06-19 | 华勤通讯技术有限公司 | 移动终端的图片展示方法及系统 |
CN111480158A (zh) * | 2018-10-12 | 2020-07-31 | 华为技术有限公司 | 文件管理方法及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101256597A (zh) * | 2008-03-31 | 2008-09-03 | 北京搜狗科技发展有限公司 | 识别颜色单调缩略图的方法、装置及在搜索引擎中的应用 |
CN101290634A (zh) * | 2008-06-03 | 2008-10-22 | 北京搜狗科技发展有限公司 | 一种识别重复缩略图的方法、装置及在搜索引擎中的应用 |
CN101339560A (zh) * | 2008-08-11 | 2009-01-07 | 北京搜狗科技发展有限公司 | 一种搜索系列性数据的方法、装置及一种搜索引擎系统 |
-
2010
- 2010-12-20 CN CN 201010596764 patent/CN102033937A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101256597A (zh) * | 2008-03-31 | 2008-09-03 | 北京搜狗科技发展有限公司 | 识别颜色单调缩略图的方法、装置及在搜索引擎中的应用 |
CN101290634A (zh) * | 2008-06-03 | 2008-10-22 | 北京搜狗科技发展有限公司 | 一种识别重复缩略图的方法、装置及在搜索引擎中的应用 |
CN101339560A (zh) * | 2008-08-11 | 2009-01-07 | 北京搜狗科技发展有限公司 | 一种搜索系列性数据的方法、装置及一种搜索引擎系统 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102929874A (zh) * | 2011-08-08 | 2013-02-13 | 深圳市快播科技有限公司 | 检索数据的排序方法及装置 |
CN102955947A (zh) * | 2011-08-19 | 2013-03-06 | 北京百度网讯科技有限公司 | 一种用于确定图像清晰度的设备及其方法 |
CN103020086A (zh) * | 2011-09-26 | 2013-04-03 | 北大方正集团有限公司 | 一种图片查重的方法及装置 |
CN103020086B (zh) * | 2011-09-26 | 2016-10-05 | 北大方正集团有限公司 | 一种图片查重的方法及装置 |
WO2013128462A1 (en) * | 2012-02-27 | 2013-09-06 | Hewlett-Packard Development Company, L.P. | Video search |
WO2013143465A1 (zh) * | 2012-03-27 | 2013-10-03 | 华为技术有限公司 | 一种视频查询方法、装置与系统 |
CN103377473A (zh) * | 2012-04-19 | 2013-10-30 | 腾讯科技(深圳)有限公司 | 一种图像排重方法和装置 |
CN103049570B (zh) * | 2012-12-31 | 2015-12-02 | 天津大学 | 基于相关保持映射和一分类器的图像视频搜索排序方法 |
CN103049570A (zh) * | 2012-12-31 | 2013-04-17 | 天津大学 | 基于相关保持映射和一分类器的图像视频搜索排序方法 |
CN103678527A (zh) * | 2013-12-02 | 2014-03-26 | Tcl集团股份有限公司 | 一种基于视频标题和内容的视频过滤方法和系统 |
CN103678527B (zh) * | 2013-12-02 | 2017-10-24 | Tcl集团股份有限公司 | 一种基于视频标题和内容的视频过滤方法和系统 |
CN105574097A (zh) * | 2015-12-11 | 2016-05-11 | 北京奇虎科技有限公司 | 视频下载类搜索结果页的加载方法及装置 |
CN105574097B (zh) * | 2015-12-11 | 2019-05-28 | 北京奇虎科技有限公司 | 视频下载类搜索结果页的加载方法及装置 |
CN108829844A (zh) * | 2018-06-20 | 2018-11-16 | 聚好看科技股份有限公司 | 一种信息搜索方法及系统 |
CN110110101A (zh) * | 2018-09-21 | 2019-08-09 | 北京字节跳动网络技术有限公司 | 多媒体内容的推荐方法、装置、终端、服务器及可读介质 |
CN111480158A (zh) * | 2018-10-12 | 2020-07-31 | 华为技术有限公司 | 文件管理方法及电子设备 |
CN111309947A (zh) * | 2018-12-11 | 2020-06-19 | 华勤通讯技术有限公司 | 移动终端的图片展示方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102033937A (zh) | 视频搜索结果的展示方法及其系统 | |
CN103942337B (zh) | 一种基于图像识别与匹配的视频搜索系统 | |
CN105210048B (zh) | 基于社交媒体的内容识别方法 | |
US9042646B2 (en) | Detecting recurring themes in consumer image collections | |
CN102460433A (zh) | 选择代表图像的方法和设备 | |
CN107408212A (zh) | 用于识别存储在设备上的不需要的照片的系统和方法 | |
CN105930376B (zh) | 一种搜索方法和装置 | |
Tang et al. | Evaluation and user preference study on spatial diversity | |
WO2009070841A1 (en) | Social multimedia management | |
Adams et al. | Sensing and using social context | |
CN102880712A (zh) | 一种用于对搜索的网络视频进行排序的方法和系统 | |
CN108650532B (zh) | 有线电视点播节目推荐方法及系统 | |
CN102411593A (zh) | 展示好友动态的方法及系统 | |
CN103365904A (zh) | 一种广告信息搜索方法和系统 | |
CN100416556C (zh) | 信息检索方法和系统、数据处理设备和视频采集处理设备 | |
CN100477593C (zh) | 网络社区中相关讨论区的选取方法及选取装置 | |
CN109241451A (zh) | 一种内容组合推荐方法、装置及可读存储介质 | |
Reid et al. | Collecting and analyzing the presence of terrorists on the web: A case study of jihad websites | |
CN112116380A (zh) | 一种基于动态满意度的智慧交互信息终端的可视化方法 | |
CN110704755A (zh) | 一种基于虚拟现实的景点推荐方法 | |
Itoh et al. | Visualization for changes in relationships between historical figures in chronicles | |
CN106101359A (zh) | 通讯录信息的显示方法和装置 | |
CN109255682A (zh) | 一种面向大型电子商务系统的混合推荐系统 | |
CN116861063B (zh) | 一种发掘社媒热搜商业价值度的方法 | |
CN103177110B (zh) | 搜索成套图像的方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20110427 |