CN106815288A - 一种视频相关信息生成方法及其装置 - Google Patents

一种视频相关信息生成方法及其装置 Download PDF

Info

Publication number
CN106815288A
CN106815288A CN201611112589.XA CN201611112589A CN106815288A CN 106815288 A CN106815288 A CN 106815288A CN 201611112589 A CN201611112589 A CN 201611112589A CN 106815288 A CN106815288 A CN 106815288A
Authority
CN
China
Prior art keywords
video
information
related information
retrieval result
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611112589.XA
Other languages
English (en)
Inventor
司红江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeTV Holding Beijing Co Ltd
LeTV Information Technology Beijing Co Ltd
Original Assignee
LeTV Holding Beijing Co Ltd
LeTV Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Holding Beijing Co Ltd, LeTV Information Technology Beijing Co Ltd filed Critical LeTV Holding Beijing Co Ltd
Priority to CN201611112589.XA priority Critical patent/CN106815288A/zh
Publication of CN106815288A publication Critical patent/CN106815288A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种视频相关信息生成方法及其装置。该方法包括:接收信息获取请求,所述信息获取请求与至少一个目标视频对应;通过分布式爬虫搜索,获取所述目标视频的检索结果;整合所述检索结果与预设的第一视频相关信息,生成第二视频相关信息;所述第一视频相关信息包括在至少一个维度上,与所述目标视频相关的信息。在整合通过搜索获得动态信息和原有数据库的信息,能够为用户提供更为准确和满足用户需求的视频相关信息,协助用户选择适合观看的视频。

Description

一种视频相关信息生成方法及其装置
技术领域
本发明涉及信息处理技术领域,特别是涉及一种视频相关信息生成方法及其装置。
背景技术
随着电子技术以及互联网的不断发展,网络上可供使用的视频资源或者相类似的流媒体资源的数量极其丰富。为了便于用户更快捷的了解、选择符合自己要求的视频,在视频网站或者视频APP中,会向用户提供多种多样的视频相关页面。
其中,有很大一部分的页面可以归类为通用类型的视频页面相关的视频详情页面。这类型的页面承载了此类相关视频的各维度信息,包括视频相关介绍,剧集列表,剧情介绍等字段。
现有惯常的生成这类型页面的方法为:首先通过请求服务器所缓存的此类视频的媒体资源库。然后根据选中的视频,在资源库中调用相应数据并经过浏览器渲染页面,向用户呈现相关数据。
在实现本申请过程中,发明人发现相关技术存在以下问题:由于媒体资源库是一种静态的数据库。数据库内的信息是静态信息,对于不同类型的输出策略也不统一。因此页面生成的相关信息时效性较差,信息输出存在偏差,不利于用户正确的获取视频的相关信息。
发明内容
本发明提供一种视频相关信息生成方法及其装置,旨在解决现有输出的视频相关信息输出无法满足用户要求,影响用户获知视频相关内容的问题。
本发明实施例一方面提供了一种视频相关信息生成方法。该方法包括:接收信息获取请求,所述信息获取请求与至少一个目标视频对应;通过分布式爬虫搜索,获取所述目标视频的检索结果;整合所述检索结果与预设的第一视频相关信息,生成第二视频相关信息;所述第一视频相关信息包括在至少一个维度上,与所述目标视频相关的信息。
可选地,所述获取所述目标视频的检索结果,具体包括:通过预设的规则引擎,解析所述目标视频以生成若干代表性字段;通过所述分布式爬虫搜索,依次检索所述代表性字段;获取所述代表性字段的前N个检索结果作为所述目标视频的检索结果,N为正整数。
可选地,所述解析所述目标视频并形成若干代表性字段,具体包括:提取视频中的至少一个视频特征;在预设的词典中,检索与所述视频特征相关的第一字段;计算所述第一字段与视频特征的欧式距离,并且归一化所述欧式距离,对所述第一字段进行评分;选择评分最高的前M个第一字段作为代表性字段。
可选地,所述整合所述检索结果与预设的第一视频相关信息,生成第二视频相关信息,具体包括:
根据预定的最优化算法,比较所述第一视频相关信息与所述搜索结果在同一维度上的信息的优先级;
依次确定每个维度中优先级较高的信息作为优先信息;所述第二视频相关信息为所述优先信息的集合。
可选地,所述方法还包括:为视频预设至少一个维度上的,与视频相关的相关信息;生成包括若干视频的相关信息的信息数据库;在所述信息数据库中获取与所述目标视频对应的相关信息,作为所述预设的视频相关信息。
本发明实施例另一方面提供了一种视频相关信息生成装置。该装置包括:请求接收模块,用于接收信息获取请求,所述信息获取请求与至少一个目标视频对应;搜索模块,用于通过分布式爬虫搜索,获取所述目标视频的检索结果;以及整合输出模块,用于整合所述检索结果与预设的第一视频相关信息,生成第二视频相关信息;所述第一视频相关信息包括在至少一个维度上,与所述目标视频相关的信息。
可选地,所述搜索模块包括:解析单元,用于通过预设的规则引擎,解析所述目标视频以生成若干代表性字段;检索单元,用于通过所述分布式爬虫搜索,依次检索所述代表性字段;以及结果获取单元,用于获取所述代表性字段的前N个检索结果作为所述目标视频的检索结果,N为正整数。
可选地,所述解析单元具体用于:提取视频中的至少一个视频特征;在预设的词典中,检索与所述视频特征相关的第一字段;计算所述第一字段与视频特征的欧式距离,并且归一化所述欧式距离,对所述第一字段进行评分;选择评分最高的前M个第一字段作为代表性字段。
可选地,所述整合输出模块,具体用于:根据预定的最优化算法,比较所述第一视频相关信息与所述搜索结果在同一维度上的信息的优先级;依次确定每个维度中优先级较高的信息作为优先信息;所述第二视频相关信息为所述优先信息的集合。
可选地,所述装置还包括信息预设模块,所述信息预设模块具体用于:为视频预设至少一个维度上的,与视频相关的相关信息;生成包括若干视频的相关信息的信息数据库;以及在所述信息数据库中获取与所述目标视频对应的相关信息,作为所述预设的视频相关信息。
本发明实施例的视频相关信息生成方法,采用分布式爬虫搜索的方式,自动的从网络上搜索与视频相关的动态信息。在整合通过搜索获得动态信息和原有数据库的信息,能够为用户提供更为准确和满足用户需求的视频相关信息,协助用户选择适合观看的视频。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍。显而易见地,下面所描述的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供视频相关信息生成方法的应用环境示意图;
图2是本发明实施例提供的视频相关信息生成方法的方法流程图;
图3是本发明另一实施例提供的步骤202的方法流程图;
图4是本发明另一实施例提供的步骤303的方法流程图;
图5是本发明另一实施例提供的视频相关信息生成方法的方法流程图;
图6是本发明实施例提供的视频相关信息生成装置的功能框图;
图7是本发明另一实施例提供的整合输出模块300的功能框图;
图8是本发明另一实施例提供的视频相关信息生成装置的功能框图;
图9是本发明实施例提供的电子设备的硬件结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
一般的,对于视频或者相类似的流媒体资源数据可以通过多个不同的信息维度来进行描述。在此,使用“视频相关信息”这样的术语表示这些与某个视频相关的,用以描述视频的数据。该视频相关信息可以是任何合适类型的数据,例如,惯常使用的文本型的数据。
在计算机角度来看,视频是一个复杂的对象,具有非常丰富的内容。因此,“视频相关信息”通常可以被分类为多个不同的集合,不同的集合从不同的方面对视频进行描述。在此,使用“维度”这样的术语表示视频中某个方面的内容,例如场景、类型、剧情、人物、评论等。任意一个视频均可以基于预定的划分准则,通过若干个维度来代表该视频,用以区分该视频与其它视频之间的区别。
在每一个维度中,是通过多个不同的字段进行描述的。该字段可以是描述性的中性语言,例如,言情、科幻,也可以是情感性的主观语言,例如好看、精彩、沉闷等。在同一个维度中的多个字段之间可能存在时间或者空间上的联系,例如,多个字段之间可能来自于相同类型的评论或者多个字段之间可以连接,形成更长的字段。
某个视频的视频相关信息可以呈现在特定的页面中,这样的页面可以被称为“视频相关页面”“视频详情页面”。在这样的页面的生成过程中,可以根据用户偏好或者实际的需求,选择合适的维度以及维度中合适的字段展示在所述页面中,向用户展示。
本发明实施例中所述的视频可以是任何合适类型或者任何时长的流媒体资源,由一系列连续的视频帧组成。在一些实施例中,还可以是一个单独的视频帧,例如某个场景的镜头或者某些静态图像。
图1为本发明实施例提供的视频相关信息生成方法的应用环境。如图1所示,该应用环境包括:用户10、终端设备20、网络30以及服务器40。
用户10可以为具有任何数量的,具有相同或者相近操作行为的群体,例如家庭、工作组或者个人。用户10可以通过任何合适的类型的,一种或者多种用户交互设备与终端设备20交互,例如鼠标、键盘、遥控器、触摸屏、体感摄像头或者智能可穿戴设备,输入指令或者控制终端设备20执行一种或者多种操作,如点击获取某个视频的详细介绍页面,页面上包含若干视频相关信息。
终端设备20可以为任何合适类型的,具有流媒体播放或者图像展示功能的电子设备,可向用户展示一个或者多个图像或者连续的视频帧,例如,智能电视、个人电脑、平板电脑、智能手机、图形显示器等。该终端设备20可以通过网络30与服务器40通信连接,从服务器40中获取原始视频或者图像信号。
在一些实施例中,该终端设备20还可以包括任何合适类型的,用以存储数据的存储介质,例如磁碟、光盘(CD-ROM)、只读存储记忆体或随机存储记忆体。该存储介质存储有若干视频或者图像数据,作为本地数据,终端设备20可以根据实际情况,可以选择使用本地数据或者使用通过服务器40获取的在线数据。
终端设备20在接收用户对应的操作指令后,可以执行本发明实施例提供的视频相关信息生成方法或者生成装置,向用户展示包含视频相关信息的一个或者多个功能页面。在一些实施例中,这样的处理过程也可以由服务器40完成,并将相应的数据直接输出至终端设备20中,向用户展示。
图2为本发明实施例提供的视频相关信息生成方法的方法流程图。如图2所示,该方法包括如下步骤:
201:接收信息获取请求,所述信息获取请求与至少一个目标视频对应。
所述信息获取请求是由用户10发出的,表示想要获取某个视频的相关内容的用户需求的请求。对应的目标视频可以是一个或者多个,用户希望获取其相关信息的视频。在一些应用场景中,该信息获取请求可以是光标放置在某个视频的缩略窗中,或者是点击某个视频名称项目上的操作。
202:通过分布式爬虫搜索,获取所述目标视频的检索结果。
在确定目标视频后,基于分布式爬虫搜索的技术,在网络30上搜索与目标视频相关的检索结果。所述分布式爬虫搜索是一种惯常,易于实现的,在大量网络数据中检索的技术,通常基于一个或者多个搜索词而进行。
在实际应用过程中,具体可以选择使用任何合适的,提供分布式爬虫搜索服务的引擎或者服务供应商获取目标视频的检索结果。根据实际使用的分布式爬虫搜索服务,选择用于检索的,可以代表目标视频的搜索词,例如视频的名称、视频的角色、视频的扮演者等。
在一些实施例中,分布式爬虫搜索服务可以支持视频或者图像的检索。由此,搜索词也可以是从目标视频中选择的一段短视频或者其中的若干关键的图像帧进行检索。
获得的检索结果可以是以任何合适类型的数据格式予以展示,例如根据发布日期排列或者根据相关性程度排列等。检索结果可以包含目标视频许多不同维度上的相关信息,例如视频剧情的评论、视频的内容简介、视频表演者的近况等。
203:整合所述检索结果与预设的第一视频相关信息,生成第二视频相关信息;所述第一视频相关信息包括在至少一个维度上,与所述目标视频相关的信息。
所述整合的过程是指匹配分布式爬虫搜索的检索结果和原有从媒体资源库中获取的第一视频相关信息两者不同的信息,并输出最优的视频相关信息的过程。
该整合根据数据的特点,可以基于任何合适的种类的寻优算法而进行。获得的视频相关信息的最优解亦即最终在页面上呈现的视频相关信息。
在获取所述第二视频相关信息后,还可以根据实际情况,由终端设备20对其进行进一步的渲染或者其它操作,以页面、弹窗或者下拉菜单等形式向用户展示。
在本发明实施例中,终端设备20向用户展示的,与目标视频对应的第二视频相关信息整合了通过分布式爬虫搜索获取的检索结果,使视频相关信息具有更好的时效性,能够反映当前环境的变化,满足用户的需求,例如对某个视频评价的变化、对于视频的剧情简介更好的描述或者视频人物、扮演者的一些动态等。
另外,由于分布式爬虫搜索的检索结果可以对媒体资源库提供的内容进行补充和匹配,统一了不同类型的视频相关信息展示页面的输出策略,例如对于剧集列表、剧情介绍这样不同类型的视频相关信息展示页面,避免了某些类型的视频相关信息输出缺失的问题。
图3为本发明另一实施例提供的视频相关信息生成方法的方法流程图。除图2所示的步骤201和203外,在本实施例中,步骤202具体包括如下步骤:
301:通过预设的规则引擎,解析所述目标视频以生成若干代表性字段。所述规则引擎可以是任何合适类型的,能够匹配输入消息,确定消息解析规则的功能模块。
在计算机的角度,对于目标视频可以在多种不同维度上进行表述,例如视频的名称、视频中出现的特定的对象等。所述规则引擎可以对用户选中的目标视频进行解析,并输出一些可以代表目标视频的代表性字段。
所述代表性字段是指一些中性单词、情感性单词或者由这些单词组成的词组或者语句。所述代表性字段可以属于不同的维度,例如对于“哈利波特”的系列电影,代表性字段可以包括:名称维度、内容维度、扮演者维度等三个维度。
在名称维度中,代表性字段可以包括:“密室”、“阿兹卡班”和“魔法石”等。在内容维度中,代表性字段可以包括:“爱情”,“战斗”和“魁地奇”等。而在扮演者维度中,则可以包括:“赫敏”,“罗恩”和“哈利波特”等。
302:通过所述分布式爬虫搜索,依次检索所述代表性字段。
惯常的,分布式爬虫搜索提供文本输入框或者其它数据类型的输入框,用以输入搜索字段。通过步骤301获得的代表性字段可以依次输入到分布式爬虫搜索的文本输入框中,进行搜索并获得对应的检索结果。
303:获取所述代表性字段的前N个检索结果作为所述目标视频的检索结果,N为正整数。
在分布式爬虫搜索服务中,检索结果通常是根据时间、相关性或者其它因素综合后提供的,具有排列次序的一系列检索结果。而排列在前的检索结果可以认为是与搜索字段相关性较高的检索结果。
因此,可以根据实际情况的需要,例如计算量、时延等要求,调整N的数值,选择在前的几个检索结果作为目标视频的检索结果,用于后续生成目标视频的视频相关信息。
在本实施例中,规则引擎(步骤301)具体可以通过如下方式,实现对于目标视频的解析并形成代表性字段。如图4所示,步骤301具体可以包括:
401:提取视频中的至少一个视频特征。所述视频特征可以是任何合适的,视频的视频帧中存在的对象,例如是图像信息(如视频中的某个人物面部)、文本信息(如视频中的字幕包含的台词)或者音频信息(如视频中某个角色的演讲)。根据不同的视频特征类型,在实际应用中,可以采用不同的提取算法从视频中提取对应的视频特征。
402:在预设的词典中,检索与所述视频特征相关的第一字段。
所述预设的词典可以是一个根据大量样本数据或者其它方式构建形成的,具有索引的数据库。该预设的词典能够通过索引,提供视频特征与第一字段之间的对应关系。
当然,第一字段与视频特征之间的对应关系可以不是唯一的,例如一个视频特征可以与一个第一字段对应,也可以与多个第一字段对应,一个第一字段也可以与一个或者多个视频特征对应。
403:计算所述第一字段与视频特征的欧式距离,并且归一化所述欧式距离,对所述第一字段进行评分。
404:选择评分最高的前M个第一字段作为代表性字段,M为正整数。
在步骤402中,由于样本数据是稀疏数据,词典中的各个元素之间的联系是非常丰富的。因此,可能会在词典中得到与视频特征对应的大量的第一字段。
过多的第一字段对于后续的检索结果的筛选和整合都会造成很大的计算压力。而且,与视频特征相关性不大的第一字段获得的检索结果对于后续的操作甚至可能造成噪声或者干扰。
步骤403采用欧式距离对第一字段和视频特征的相关性进行评价,并在步骤404中通过挑选评分较高的第一字段用以从稀疏数据中筛选具有显著意义的第一字段。
所述欧式距离是一种对于数值敏感的衡量标准,进行归一化处理后,每个第一字段都具有一个在特定范围(如0-1之间)的评分值,利用评分值对第一字段进行排序,并筛除那些排列靠后的第一字段。具体可以根据实际情况的要求,设置M的值,例如设置为10、5或者3。
在本实施例中,通过预设的词典和欧式距离的方式实现了对于目标视频的解析过程,获得能够代表目标视频的代表性字段,并且这样的代表性字段能够控制在较小的数量,而且均与目标视频的某个维度密切相关,能够很好的代表目标视频,很好的降低了后续操作过程需要的计算量,减少了数据稀疏造成的噪声,能够提供更有代表性的搜索结果。
可选地,步骤203具体可以通过如下步骤实现:
首先,根据预定的最优化算法,比较所述第一视频相关信息与所述搜索结果在同一维度上的信息的优先级。
然后,依次确定每个维度中优先级较高的信息作为优先信息;所述第二视频相关信息为所述优先信息的集合。
如上实施例所述,第一视频相关信息和搜素结果均包括属于不同维度的,用以描述或者代表目标视频的信息。因此,在实际操作中,可以以相同维度为单元,比较和计算两种不同信息之间的优先级并据此确定向用户展示的信息。
通过这种方式,可以实现在每个维度上具有相同的输出策略(基于相同的最优化算法)。由于在终端设备20上向用户展示的视频相关信息页面是以维度为单位进行输出的,不同类型的页面的区别在于输出了不同的维度(例如剧情介绍、剧集列表)。由此,向用户展示的页面能够提供更好的用户体验,满足用户需求。
所述最优化算法是指在多个信息中寻找最优值的方法。其本质上可以转换为一个求解最优解的过程。这样的最优解可能是一个集合,也可以是一个单独的数据,例如,在每个维度上,可能能够找到多个最优的信息,并向用户展示。
上述整合的方法,能够通过搜索结果实现对于媒体资源库内静态信息的补充,并提供一个统一的输出策略,例如,媒体资源库中不存在某个维度的信息时,可以通过该维度上的搜索结果来获取视频相关信息。
图5为本发明又一实施例提供的视频相关信息的方法流程图。在本实施例中,除图2所示的步骤201-203外,如图5所示,还可以包括如下步骤:
501:为视频预设至少一个维度上的,与视频相关的相关信息。
该预设的相关信息可以是由视频发布者在视频发布时提供的相关信息,例如填写视频的名称、视频的内容介绍等。这样的信息是一个静态的信息,不会跟随时间而变化。
502:生成包括若干视频的相关信息的信息数据库。
所述信息数据库可以是如上所描述的媒体资源库,其可以包括许多不同视频的相关信息,并以数据库的形式存储。具体可以基于任何合适类型的数据库,用以存储这样的相关信息。
503:在所述信息数据库中获取与所述目标视频对应的相关信息,作为所述预设的视频相关信息。所述预设的视频相关信息是惯常的,静态的消息。
在本实施例中,通过预设数据库的方式,在生成视频相关消息的过程中,提供静态的相关消息作为补充,获得更为完善和准确的视频相关消息,用以满足用户的需求。
本发明实施例还提供了一种视频相关信息生成装置。如图6所示,该装置包括:请求接收模块100、搜索模块200以及整合输出模块300。
其中,所述请求接收模块100用于接收信息获取请求,所述信息获取请求与至少一个目标视频对应。搜索模块200用于通过分布式爬虫搜索,获取所述目标视频的检索结果。整合输出模块300用于整合所述检索结果与预设的第一视频相关信息,生成第二视频相关信息;所述第一视频相关信息包括在至少一个维度上,与所述目标视频相关的信息。
在本实施例中提供的视频相关信息生成装置整合了通过分布式爬虫搜索获取的检索结果,使视频相关信息具有更好的时效性,能够反映当前环境的变化,满足用户的需求,例如对某个视频评价的变化、对于视频的剧情简介更好的描述或者视频人物、扮演者的一些动态等
另外,由于分布式爬虫搜索的检索结果可以对媒体资源库提供的内容进行补充和匹配,统一了不同类型的视频相关信息展示页面的输出策略,提供了更好的用户体验。
本发明另一实施例还提供了一种视频相关信息生成装置。在本发明实施例中,除图6所示的模块100和200外,还包括一整合输出模块。
图7为本发明实施例中整合输出模块300的具体功能框图。如图7所示,整合输出模块300具体包括:解析单元310、检索单元320以及结果获取单元330。
其中,解析单元310用于通过预设的规则引擎,解析所述目标视频以生成若干代表性字段。检索单元320用于通过所述分布式爬虫搜索,依次检索所述代表性字段。结果获取单元330用于获取所述代表性字段的前N个检索结果作为所述目标视频的检索结果,N为正整数。
在本发明实施例中,所述解析单元310具体用于:提取视频中的至少一个视频特征;在预设的词典中,检索与所述视频特征相关的第一字段;计算所述第一字段与视频特征的欧式距离,并且归一化所述欧式距离,对所述第一字段进行评分;以及选择评分最高的前M个第一字段作为代表性字段。
在本实施例中,解析单元通过预设的词典和欧式距离的方式实现了对于目标视频的解析过程,获得能够代表目标视频的代表性字段,并且这样的代表性字段能够控制在较小的数量,而且均与目标视频的某个维度密切相关,具有较高的代表性。
可选地,在本发明实施例中,所述整合输出模块300具体可以用于:
根据预定的最优化算法,比较所述第一视频相关信息与所述搜索结果在同一维度上的信息的优先级;并且依次确定每个维度中优先级较高的信息作为优先信息;所述第二视频相关信息为所述优先信息的集合。
图8为本发明另一实施例提供的,视频相关消息生成装置的功能框图。除图6所示的模块100-300外,在本实施例中,如图8所示,还可以包括一信息预设模块400。
所述信息预设模块400具体用于:为视频预设至少一个维度上的,与视频相关的相关信息;生成包括若干视频的相关信息的信息数据库;以及在所述信息数据库中获取与所述目标视频对应的相关信息,作为所述预设的视频相关信息。
在实际操作过程中,可以首先通过请求接收模块100接收信息获取请求。然后由搜索模块200根据信息获取请求对应的目标视频,通过分布式爬虫搜索,获取所述目标视频的检索结果。最后,由整合输出模块300整合所述检索结果与预设的第一视频相关信息,生成第二视频相关信息并输出。其中,在整合信息之前,可以由获取请求信息预设模块400提供预设的视频相关信息。
需要说明的是,由于视频相关消息生成装置与视频相关消息生成方法基于相同的发明构思,因此,方法实施例中的相应内容同样适用于装置实施例,此处不再详述。
图9是本发明实施例提供的一种电子设备的硬件结构示意图。如图9所示,该设备包括:一个或多个处理器910以及存储器920,图9中以一个处理器910为例。该电子设备还可以包括:输入装置930和输出装置940。
处理器910、存储器920、输入装置930和输出装置940可以通过总线或者其他方式连接,图9中以通过总线连接为例。
存储器920作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的视频相关消息生成方法对应的程序指令/模块(例如,附图6所示的请求接收模块100、搜索模块200以及整合输出模块300)。
处理器910通过运行存储在存储器920中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例视频相关消息生成方法。
存储器920可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据视频相关消息生成装置的使用所创建的数据等。此外,存储器920可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器920可选包括相对于处理器910远程设置的存储器,这些远程存储器可以通过网络连接至视频相关消息生成装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置930可接收输入的数字或字符信息,以及产生与视频相关消息生成装置的用户设置以及功能控制有关的键信号输入。输出装置940可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器920中,当被所述一个或者多个处理器910执行时,执行上述任意方法实施例中的视频相关消息生成方法。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例所提供的方法。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。所述的计算机软件可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种视频相关信息生成方法,其特征在于,包括:
接收信息获取请求,所述信息获取请求与至少一个目标视频对应;
通过分布式爬虫搜索,获取所述目标视频的检索结果;
整合所述检索结果与预设的第一视频相关信息,生成第二视频相关信息;所述第一视频相关信息包括在至少一个维度上,与所述目标视频相关的信息。
2.根据权利要求1所述的方法,其特征在于,所述获取所述目标视频的检索结果,具体包括:
通过预设的规则引擎,解析所述目标视频以生成若干代表性字段;
通过所述分布式爬虫搜索,依次检索所述代表性字段;
获取所述代表性字段的前N个检索结果作为所述目标视频的检索结果,N为正整数。
3.根据权利要求2所述的方法,其特征在于,所述解析所述目标视频并形成若干代表性字段,具体包括:
提取视频中的至少一个视频特征;
在预设的词典中,检索与所述视频特征相关的第一字段;
计算所述第一字段与视频特征的欧式距离,并且归一化所述欧式距离,对所述第一字段进行评分;
选择评分最高的前M个第一字段作为代表性字段。
4.根据权利要求1所述的方法,其特征在于,所述整合所述检索结果与预设的第一视频相关信息,生成第二视频相关信息,具体包括:
根据预定的最优化算法,比较所述第一视频相关信息与所述搜索结果在同一维度上的信息的优先级;
依次确定每个维度中优先级较高的信息作为优先信息;所述第二视频相关信息为所述优先信息的集合。
5.根据权利要求1-4任一所述的方法,其特征在于,所述方法还包括:
为视频预设至少一个维度上的,与视频相关的相关信息;
生成包括若干视频的相关信息的信息数据库;
在所述信息数据库中获取与所述目标视频对应的相关信息,作为所述预设的视频相关信息。
6.一种视频相关信息生成装置,其特征在于,包括:
请求接收模块,用于接收信息获取请求,所述信息获取请求与至少一个目标视频对应;
搜索模块,用于通过分布式爬虫搜索,获取所述目标视频的检索结果;
整合输出模块,用于整合所述检索结果与预设的第一视频相关信息,生成第二视频相关信息;所述第一视频相关信息包括在至少一个维度上,与所述目标视频相关的信息。
7.根据权利要求6所述的装置,其特征在于,所述搜索模块包括:
解析单元,用于通过预设的规则引擎,解析所述目标视频以生成若干代表性字段;
检索单元,用于通过所述分布式爬虫搜索,依次检索所述代表性字段;
结果获取单元,用于获取所述代表性字段的前N个检索结果作为所述目标视频的检索结果,N为正整数。
8.根据权利要求7所述的装置,其特征在于,所述解析单元具体用于:提取视频中的至少一个视频特征;
在预设的词典中,检索与所述视频特征相关的第一字段;
计算所述第一字段与视频特征的欧式距离,并且归一化所述欧式距离,对所述第一字段进行评分;
选择评分最高的前M个第一字段作为代表性字段。
9.根据权利要求6所述的装置,其特征在于,所述整合输出模块,具体用于:根据预定的最优化算法,比较所述第一视频相关信息与所述搜索结果在同一维度上的信息的优先级;
依次确定每个维度中优先级较高的信息作为优先信息;所述第二视频相关信息为所述优先信息的集合。
10.根据权利要求6-9任一所述的装置,其特征在于,所述装置还包括信息预设模块,
所述信息预设模块具体用于:为视频预设至少一个维度上的,与视频相关的相关信息;生成包括若干视频的相关信息的信息数据库;以及在所述信息数据库中获取与所述目标视频对应的相关信息,作为所述预设的视频相关信息。
CN201611112589.XA 2016-12-06 2016-12-06 一种视频相关信息生成方法及其装置 Pending CN106815288A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611112589.XA CN106815288A (zh) 2016-12-06 2016-12-06 一种视频相关信息生成方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611112589.XA CN106815288A (zh) 2016-12-06 2016-12-06 一种视频相关信息生成方法及其装置

Publications (1)

Publication Number Publication Date
CN106815288A true CN106815288A (zh) 2017-06-09

Family

ID=59106133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611112589.XA Pending CN106815288A (zh) 2016-12-06 2016-12-06 一种视频相关信息生成方法及其装置

Country Status (1)

Country Link
CN (1) CN106815288A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114915807A (zh) * 2022-07-14 2022-08-16 飞狐信息技术(天津)有限公司 一种信息处理方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114915807A (zh) * 2022-07-14 2022-08-16 飞狐信息技术(天津)有限公司 一种信息处理方法及装置

Similar Documents

Publication Publication Date Title
JP7069778B2 (ja) ビデオベースの通信におけるコンテンツキュレーションのための方法、システム及びプログラム
US20090077056A1 (en) Customization of search results
JP2021535458A (ja) 機械学習抽出物とセマンティックグラフとを使用して構造化データを作成し、検索、推奨および発見を促進するための方法およびシステム
US10198506B2 (en) System and method of sentiment data generation
CN104735468B (zh) 一种基于语义分析将图像合成新视频的方法及系统
US20180213289A1 (en) Method of authorizing video scene and metadata
CN102779114B (zh) 利用自动规则生成的非结构化数据支持
US10366154B2 (en) Information processing device, information processing method, and computer program product
CN103984772B (zh) 文本检索字幕库生成方法和装置、视频检索方法和装置
DE202014011461U1 (de) Anzeigevorrichtung
US10311113B2 (en) System and method of sentiment data use
JP2015507253A (ja) キーワードの選択による、接続されたメディア機器におけるチャンネルナビゲーション
CN103052953A (zh) 信息处理设备、信息处理方法和程序
US10783192B1 (en) System, method, and user interface for a search engine based on multi-document summarization
KR102314645B1 (ko) 미디어 리소스를 제공하는 방법 및 장치
KR101916874B1 (ko) 자동으로 동영상 하이라이트 영상의 제목을 생성하는 방법, 장치 및 컴퓨터 판독가능 기록 매체
JP7240505B2 (ja) 音声パケット推薦方法、装置、電子機器およびプログラム
JP2015204105A (ja) 推薦情報を提供するための方法および装置
CN111309200B (zh) 一种扩展阅读内容的确定方法、装置、设备及存储介质
CN109600646B (zh) 语音定位的方法及装置、智能电视、存储介质
CN111263186A (zh) 视频生成、播放、搜索以及处理方法、装置和存储介质
CN104102683A (zh) 用于增强视频显示的上下文查询
CN113806588A (zh) 搜索视频的方法和装置
US20150111189A1 (en) System and method for browsing multimedia file
US20140223466A1 (en) Method and Apparatus for Recommending Video from Video Library

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170609

WD01 Invention patent application deemed withdrawn after publication