CN114915807A - 一种信息处理方法及装置 - Google Patents
一种信息处理方法及装置 Download PDFInfo
- Publication number
- CN114915807A CN114915807A CN202210826490.5A CN202210826490A CN114915807A CN 114915807 A CN114915807 A CN 114915807A CN 202210826490 A CN202210826490 A CN 202210826490A CN 114915807 A CN114915807 A CN 114915807A
- Authority
- CN
- China
- Prior art keywords
- video information
- information
- current
- source
- collection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/24—Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8126—Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
- H04N21/8133—Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program
Abstract
本发明公开了一种信息处理方法及装置,可以按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各视频信息源生成的当前视频信息;比对当前视频信息与历史采集信息是否相同,若否,则比对当前视频信息与目标视频信息是否相同;其中,目标视频信息是由第一信息源生成的,第一信息源与各视频信息源均不同;如果当前视频信息与目标视频信息不相同,则确定当前视频信息与目标视频信息间的差异信息;输出差异信息。本发明可以有效实现对视频信息的自动采集,以及对于信息的自动比对,从而可以有效提高信息采集以及信息比对的处理效率,减少人力资源的消耗。
Description
技术领域
本发明涉及信息处理技术领域,尤其涉及一种信息处理方法及装置。
背景技术
随着计算机科学与技术的发展,信息处理技术不断提高。
当前,不同视频平台针对同样的视频剧集,在信息记录上可能会存在差异信息。其中,部分差异信息可能是错误导致的。
对于某个视频平台,其可以先行确定出与其他视频平台在记录相同视频剧集信息上的差异信息,之后再从差异信息中确定出自身记录的错误信息,对错误信息进行改正。
但是,现有技术主要是由人工来查找上述差异信息,当视频平台所需比对的视频剧集信息较多时,人工处理效率较低。
发明内容
鉴于上述问题,本发明提供一种克服上述问题或者至少部分地解决上述问题的信息处理方法及装置,技术方案如下:
一种信息处理方法,包括:
按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各所述视频信息源生成的当前视频信息;
比对所述当前视频信息与历史采集信息是否相同,若否,则比对所述当前视频信息与目标视频信息是否相同;其中,所述目标视频信息是由第一信息源生成的,所述第一信息源与各所述视频信息源均不同;
如果所述当前视频信息与所述目标视频信息不相同,则确定所述当前视频信息与所述目标视频信息间的差异信息;
输出所述差异信息。
可选的,至少一种所述视频信息采集策略包括:热榜视频信息的全量采集策略、新增视频信息的定量采集策略和/或历史视频信息的滚动采集策略。
可选的,当所述至少一种所述视频信息采集策略中仅包括热榜视频信息的全量采集策略时,所述按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各所述视频信息源生成的当前视频信息,包括:
周期性的对各所述视频信息源处的热榜视频信息进行全量采集。
可选的,当所述至少一种所述视频信息采集策略中仅包括新增视频信息的定量采集策略时,所述按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各所述视频信息源生成的当前视频信息,包括:
周期性的对各所述视频信息源处的新增视频信息进行定量采集。
可选的,当所述至少一种所述视频信息采集策略中仅包括历史视频信息的滚动采集策略时,所述按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各所述视频信息源生成的当前视频信息,包括:
对各所述视频信息源处的历史视频信息进行滚动采集。
可选的,所述对各所述视频信息源处的历史视频信息进行滚动采集,包括:
针对任一所述视频信息源:周期性的对所述视频信息源处的当前历史视频信息进行定量采集,其中,在每一次进行定量采集后,记录当前采集进度,下一次在进行定量采集时,从当前采集进度开始对所述视频信息源处的当前历史视频信息进行定量采集,直至采集完毕所述视频信息源处的当前历史视频信息,之后返回执行周期性的对所述视频信息源处的当前历史视频信息进行定量采集,以再从头开始,对所述视频信息源处的当前历史视频信息进行定量采集。
可选的,所述输出所述差异信息,包括:
将所述差异信息输入至已构建的信息校对页面中;
在所述信息校对页面中,采用不同的标识方式对所述差异信息中不同类型的信息项进行标识;
输出所述信息校对页面。
一种信息处理装置,包括:第一采集单元、第一比对单元、第二比对单元、第一确定单元和第一输出单元,其中:
所述第一采集单元,用于按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各所述视频信息源生成的当前视频信息;
所述第一比对单元,用于比对所述当前视频信息与历史采集信息是否相同,若否,则触发所述第二比对单元;其中,所述目标视频信息是由第一信息源生成的,所述第一信息源与各所述视频信息源均不同;
所述第二比对单元,用于比对所述当前视频信息与目标视频信息是否相同;
所述第一确定单元,用于如果所述当前视频信息与所述目标视频信息不相同,则确定所述当前视频信息与所述目标视频信息间的差异信息;
所述第一输出单元,用于输出所述差异信息。
可选的,所述至少一种所述视频信息采集策略包括:热榜视频信息的全量采集策略、新增视频信息的定量采集策略和/或历史视频信息的滚动采集策略。
可选的,当所述至少一种所述视频信息采集策略中仅包括热榜视频信息的全量采集策略时,所述第一采集单元用于周期性的对各所述视频信息源处的热榜视频信息进行全量采集。
可选的,当所述至少一种所述视频信息采集策略中仅包括新增视频信息的定量采集策略时,所述第一采集单元用于周期性的对各所述视频信息源处的新增视频信息进行定量采集。
可选的,当所述至少一种所述视频信息采集策略中仅包括历史视频信息的滚动采集策略时,所述第一采集单元用于对各所述视频信息源处的历史视频信息进行滚动采集。
可选的,所述第一采集单元,用于:
针对任一所述视频信息源:周期性的对所述视频信息源处的当前历史视频信息进行定量采集,其中,在每一次进行定量采集后,记录当前采集进度,下一次在进行定量采集时,从当前采集进度开始对所述视频信息源处的当前历史视频信息进行定量采集,直至采集完毕所述视频信息源处的当前历史视频信息,之后返回执行周期性的对所述视频信息源处的当前历史视频信息进行定量采集,以再从头开始,对所述视频信息源处的当前历史视频信息进行定量采集。
可选的,所述第一输出单元,包括:输入单元、标识单元和第二输出单元;
所述输入单元,用于将所述差异信息输入至已构建的信息校对页面中;
所述标识单元,用于在所述信息校对页面中,采用不同的标识方式对所述差异信息中不同类型的信息项进行标识;
所述第二输出单元,用于输出所述信息校对页面。
本发明提出的信息处理方法及装置,可以按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各视频信息源生成的当前视频信息;比对当前视频信息与历史采集信息是否相同,若否,则比对当前视频信息与目标视频信息是否相同;其中,目标视频信息是由第一信息源生成的,第一信息源与各视频信息源均不同;如果当前视频信息与目标视频信息不相同,则确定当前视频信息与目标视频信息间的差异信息;输出差异信息。本发明可以有效实现对视频信息的自动采集,以及对于信息的自动比对,从而可以有效提高信息采集以及信息比对的处理效率,减少人力资源的消耗。
上述说明仅是本发明技术方案的概述,为了能够更清楚地了解本发明的技术手段,可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1示出了本发明实施例提供的第一种信息处理方法的流程图;
图2示出了本发明实施例提供的第三种信息处理方法的流程图;
图3示出了本发明实施例提供的第四种信息处理方法的流程图;
图4示出了本发明实施例提供的第五种信息处理方法的流程图;
图5示出了本发明实施例提供的一种信息处理装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
如图1所示,本实施例提出了第一种信息处理方法,该方法可以包括以下步骤:
S101、按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各视频信息源生成的当前视频信息;
需要说明的是,本发明可以应用于某个视频平台或电子设备等。
其中,视频信息采集策略可以是由技术人员按照实际需求所制定的信息采集策略。需要说明的是,本发明对于视频信息采集策略的具体策略内容不作限定。
其中,视频信息源可以为生成或保存有视频信息的视频平台、搜索引擎、网页和相关设备等。本发明对于视频信息源的具体类型不作限定。
具体的,当前视频信息可以是视频信息源当前生成或保存的视频信息。需要说明的是,视频信息可以为视频文件的相关信息,如更新时间、播放量、导演和演员等信息。
具体的,本发明在从一个视频信息源处采集当前视频信息时,可以针对不同的视频类型进行信息采集,获得不同视频类型的视频的当前视频信息,比如,本发明可以对视频信息源处产生的纪录片类型的当前视频信息进行采集,获得纪录片类型的视频的当前视频信息,本发明可以对视频信息源处产生的电影类型的当前视频信息进行采集,获得电影类型的视频的当前视频信息。
具体的,本发明在从一个视频信息源处采集当前视频信息时,可以针对不同视频进行信息采集,获得不同视频的当前视频信息,比如,本发明可以对视频信息源处产生的第一视频的当前视频信息进行采集,对视频信息源处产生的第二视频的当前视频信息进行采集。
S102、比对当前视频信息与历史采集信息是否相同,若否,则执行步骤S103;
其中,当前视频信息可以为从一个视频信息源处采集到的当前视频信息。
其中,历史采集信息可以为上一次从某个视频信息源处采集到的视频信息。
具体的,本发明可以在采集到一个视频信息源的当前视频信息后,即将该视频信息源的当前视频信息与该视频信息源的历史采集信息进行比对。需要说明的是,本发明可以利用现有的信息比对技术,来对当前视频信息与历史采集信息进行比对。
具体的,如果比对结果为是,即从某个视频信息源处采集的当前视频信息与历史采集信息为相同信息,则可以说明本次采集的该视频信息源的当前视频信息与上一次采集的视频信息相同,无需进行后续比对,此时本发明可以禁止针对从该视频信息源采集的当前视频信息执行后续步骤,以避免无谓的资源消耗;如果比对结果为否,即当前视频信息与历史采集信息为不同信息,则本发明可以执行后续步骤,进行进一步的对比。
具体的,本发明也可以在采集到各视频信息源的当前视频信息后,再分别将各视频信息源的当前视频信息与相应的历史采集信息进行比对,基于比对结果来确定是否执行后续步骤。比如,本发明可以在采集到第一视频信息源和第二视频信息源的当前视频信息后,将第一视频信息源的当前视频信息与第一视频信息源的历史采集信息进行比对,将第二视频信息源的当前视频信息与第二视频信息源的历史采集信息进行比对,如果第一视频信息源对应的比对结果为是,则本发明可以禁止针对第一视频信息源的当前视频信息执行后续步骤,如果第一视频信息源对应的比对结果为否,则本发明可以针对第一视频信息源的当前视频信息执行后续步骤,如果第二视频信息源对应的比对结果为是,则本发明可以禁止针对第二视频信息源的当前视频信息执行后续步骤,如果第二视频信息源对应的比对结果为否,则本发明可以针对第二视频信息源的当前视频信息执行后续步骤。
具体的,本发明也可以逐一的对采集到的各视频类型的视频的当前视频信息进行与相应历史采集信息的比对,如果某个视频类型对应的比对结果相同,则可以无需针对该视频类型的视频的当前视频信息执行后续步骤;如果比对结果不同,则可以针对该视频类型的视频的当前视频信息继续执行后续步骤。
具体的,本发明也可以逐一的对采集到的各视频的当前视频信息进行与相应历史采集信息的比对,如果某个视频对应的比对结果相同,则可以无需针对该视频的当前视频信息执行后续步骤;如果比对结果不同,则可以针对该视频的当前视频信息继续执行后续步骤。
S103、比对当前视频信息与目标视频信息是否相同;其中,目标视频信息是由第一信息源生成的,第一信息源与各视频信息源均不同;
其中,目标视频信息可以是由第一信息源生成的视频信息,目标视频信息可以包括多个视频的相关信息。需要说明的是,第一信息源不是上述各视频信息源。
可选的,第一信息源可以在生成目标视频信息后,将目标视频信息保存在数据库中。
具体的,如果某个视频信息源对应的比对结果为否,则本发明可以将从该视频信息源采集到的当前视频信息,与目标视频信息进行比对,基于比对结果来确定是否执行后续步骤。
需要说明的是,本发明可以利用现有的信息比对技术,对当前视频信息与目标视频信息进行比对。
具体的,本发明也可以逐一的对采集到的各视频类型的视频的当前视频信息进行与相应目标视频信息的比对,如果某个视频类型对应的比对结果相同,则可以无需针对该视频类型的视频的当前视频信息执行后续步骤;如果比对结果不同,则可以针对该视频类型的视频的当前视频信息继续执行后续步骤。
具体的,本发明也可以逐一的对采集到的各视频的当前视频信息进行与相应目标视频信息的比对,如果某个视频对应的比对结果相同,则可以无需针对该视频的当前视频信息执行后续步骤;如果比对结果不同,则可以针对该视频的当前视频信息继续执行后续步骤。
S104、如果当前视频信息与目标视频信息不相同,则确定当前视频信息与目标视频信息间的差异信息;
具体的,如果某个视频信息源的当前视频信息与目标视频信息的比对结果为两者不同,即上述步骤S103的比对结果为否,则本发明可以确定出该当前视频信息与目标视频信息间的差异信息。而如果从某个视频信息源处采集的当前视频信息与目标视频信息相同,即上述步骤S103的比对结果为是,则本发明可以禁止针对从该视频信息源处采集的当前视频信息执行后续步骤,避免无谓资源的消耗。
需要说明的是,本发明可以理由现有的信息比对技术,来确定出当前视频信息与目标视频信息之间的差异信息。
具体的,本发明可以在当前视频信息与目标视频信息之中,进行信息项的逐项比对。比如,对于目标视频信息中第一视频的视频信息,本发明可以先行确定当前视频信息中是否存在第一视频的视频信息,如果存在,则可以将当前视频信息中第一视频的视频信息,与目标视频信息中第一视频的视频信息进行逐项比对,比如分别进行名称、别名、语言、国家/地区、年份、发行日期、集数、导演、演员和评分等信息项的比对。
S105、输出差异信息。
具体的,本发明可以在确定出某个视频信息源的当前视频信息与目标视频信息间的差异信息之后,可以将差异信息输出至显示屏或其他电子设备处,以向技术人员展示差异信息,由技术人员基于差异信息确定是否对目标视频信息进行适应性更正,有效提高目标视频信息的准确率和合法性。
具体的,本发明可以分别对各视频信息源对应的差异信息进行输出。可以理解的是,一个视频信息源对应的差异信息,即为该视频信息源的当前视频信息与目标视频信息之间的差异信息。
具体的,本发明可以分别将采集到的各视频的当前视频信息与目标视频信息间的差异信息进行输出。
可选的,步骤S105可以包括步骤S1051、S1052和S1053,其中:
S1051、将差异信息输入至已构建的信息校对页面中;
具体的,本发明可以预先设置用于展示差异信息的信息校对页面。
其中,信息校对页面中可以体现出视频信息源的名称和各类视频信息的名称等信息项。
具体的,本发明可以在确定出某个视频信息源与目标视频信息之间的差异信息之后,可以将差异信息填写至信息校对页面中的相关信息项。
S1052、在信息校对页面中,采用不同的标识方式对差异信息中不同类型的信息项进行标识;
具体的,本发明可以在信息校对页面中,采用不同的标识方式,如颜色、字体和是否加粗等标识方式,对不同类型的信息项进行标识。
S1053、输出信息校对页面。
具体的,本发明可以在标识好各类信息项后,将信息校对页面进行输出。
需要说明的是,本发明也可以将视频信息源的当前视频信息与目标视频信息全量填写至预设的信息校对页面中的相关信息项,之后再对信息校对页面中的差异信息进行标识,输出信息校对页面。此时,信息校对页面中可以更完整的体现出当前视频信息与目标视频信息的异同,有效保证信息比对的可靠性。
还需要说明的是,本发明通过执行图1中的步骤S101至S105,可以有效实现对视频信息的自动采集,以及对于信息的自动比对,从而可以有效提高信息采集以及信息比对的处理效率,减少人力资源的消耗。
具体的,本发明可以应用于目标视频平台。目标视频平台即可以作为上述第一信息源,生成目标视频信息,为保证目标视频信息的准确性和合法性,目标视频平台可以通过执行步骤S101至S105,从其他视频平台、网站、服务器或搜索引擎等各视频信息源处,采集各视频信息源当前生成的视频信息即当前视频信息,分别基于各当期视频信息进行信息比对,确定出与目标视频信息的差异信息并进行输出,以向技术人员展示差异信息,而技术人员即可以基于差异信息确定是否对目标视频信息进行更正。
本实施例提出的信息处理方法,可以按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各视频信息源生成的当前视频信息;比对当前视频信息与历史采集信息是否相同,若否,则比对当前视频信息与目标视频信息是否相同;其中,目标视频信息是由第一信息源生成的,第一信息源与各视频信息源均不同;如果当前视频信息与目标视频信息不相同,则确定当前视频信息与目标视频信息间的差异信息;输出差异信息。本发明可以有效实现对视频信息的自动采集,以及对于信息的自动比对,从而可以有效提高信息采集以及信息比对的处理效率,减少人力资源的消耗。
基于图1,本实施例提出第二种信息处理方法。在该方法中,上述至少一种视频信息采集策略包括:热榜视频信息的全量采集策略、新增视频信息的定量采集策略和/或历史视频信息的滚动采集策略。
其中,热榜视频信息可以为各视频信息源中热榜视频的视频信息。热榜视频即为关注度较高的视频。
其中,新增视频信息可以为各视频信息源最新产生的视频信息。
其中,历史视频信息可以为各视频信息源在历史上产生的所有视频信息。
可选的,本发明在从一个视频信息源处采集当前视频信息时,可以分别针对不同类型视频进行信息采集。比如,本发明可以针对纪录片类型视频,对其热榜视频信息进行全量采集;再比如,本发明可以针对电影类型视频,对其热榜视频信息进行全量采集。
可选的,本发明在从一个视频信息源处采集当前视频信息时,可以分别针对不同视频进行信息采集。比如,本发明可以针对热榜中的第一视频,进行视频信息的全量采集;再比如,本发明可以针对第二视频,对其新增视频信息进行定量采集。
可选的,如图2所示,在本实施例提出的第三种信息处理方法中,当至少一种视频信息采集策略中仅包括热榜视频信息的全量采集策略时,步骤S101可以具体为S201,其中:
S201、周期性的对各视频信息源处的热榜视频信息进行全量采集。
具体的,本发明可以周期性的执行对各视频信息源处的热榜视频信息的全量采集策略。比如,本发明可以在每一天,分别对各视频信息源处的热榜视频信息进行一次全量采集。
具体的,本发明可以分别针对不同类型视频的视频信息,进行视频信息的全量采集。比如,本发明可以分别针对纪录片类型和电影类型的视频信息,进行热榜视频信息的全量采集。
可以理解的是,热榜视频的关注度较高,本发明可以通过对热榜视频信息进行全量采集,来重点关注热榜视频信息是否出现变化,以及重点关注热榜视频信息与目标视频信息是否存在差异。
需要说明的是,本发明采取全量采集策略时,可以保证采集的信息的完整性,有效保证信息准确度。
可选的,如图3所示,在本实施例提出的第四种信息处理方法中,当至少一种视频信息采集策略中仅包括新增视频信息的定量采集策略时,步骤S101可以具体为S301,其中:
S301、周期性的对各视频信息源处的新增视频信息进行定量采集。
具体的,本发明可以周期性的执行对各视频信息源处的新增视频信息进行定量采集。比如,本发明可以在每一天,分别从各视频信息源处的新增视频信息处,采集一万条信息。
具体的,本发明可以分别针对不同类型视频的视频信息,进行新增视频信息的定量采集。比如,本发明可以分别针对纪录片类型和电影类型的视频信息,进行新增视频信息的定量采集。
需要说明的是,由于视频信息源可能不会标识出新增视频信息的产生时间,因此,本发明可以通过视频信息的排序,来确定视频信息是否属于新增视频信息。此时,由于新增视频信息的准确性存疑,因此本发明可以仅对新增视频信息进行定量采集,避免可能采集过多的重复信息,以在获得新增视频信息的同时,减少信息处理压力,提高信息处理效率。
还需要说明的是,本发明采取的对新增视频信息进行采集的信息采集策略,可以通过仅采集部分新增视频信息,来提高信息采集效率,避免资源浪费,且信息时效性较优,具有较强的可靠性。
可选的,如图4所示,在本实施例提出的第五种信息处理方法中,当至少一种视频信息采集策略中仅包括新增视频信息的定量采集策略时,步骤S101可以具体为S401,其中:
S401、对各视频信息源处的历史视频信息进行滚动采集。
具体的,本发明同样可以周期性的对各视频信息源处的历史视频信息进行采集。比如,本发明可以在每一天,分别对各视频信息源处的历史视频信息的进行采集。
可选的,步骤S401可以包括:
针对任一视频信息源:周期性的对视频信息源处的当前历史视频信息进行定量采集,其中,在每一次进行定量采集后,记录当前采集进度,下一次在进行定量采集时,从当前采集进度开始对视频信息源处的当前历史视频信息进行定量采集,直至采集完毕视频信息源处的当前历史视频信息,之后返回执行周期性的对视频信息源处的当前历史视频信息进行定量采集,以再从头开始,对视频信息源处的当前历史视频信息进行定量采集。
需要说明的是,本发明在对某个视频信息源处的当前历史视频信息进行滚动采集过程中,可以从该视频信息源处的当前历史视频信息中记录时刻最早的视频信息处开始进行定量采集,每次采集之后均记录当前采集进度,下一次则可以从记录的当前采集进度处开始进行定量采集,当采集完毕当前历史视频信息时,可以从头开始,再次对当前历史视频信息进行采集。
具体的,本发明可以分别针对不同类型视频的视频信息,进行历史视频信息的滚动采集。比如,本发明可以分别针对纪录片类型和电影类型的视频信息,进行历史视频信息的滚动采集。
比如,本发明在对某个视频信息源处的纪录片类型的当前历史视频信息进行滚动采集时,可以从纪录片的当前历史视频信息的最早视频信息处开始采集,每天可以采集1万条纪录片视频信息,每天完成采集之后均记录当前采集进度,第二天则可以从记录的当前采集进度处开始进行采集,同样采集1万条纪录片视频信息,当采集完毕纪录片的当前历史视频信息时,可以从头开始,再次对纪录片的当前历史视频信息进行采集。
其中,本发明可以通过游标来对信息采集进度进行标识。具体的,本发明在对某个类型的视频信息进行信息采集过程中,可以根据游标来进行定量的信息采集,在每一次定量信息采集结束后,可以使用游标标记当前采集进度,如果当前类型的视频信息的当前游标下未存在新数据,或者游标不存在,则游标可以清零并可以进行下一次的从头采集。
可选的,在本实施例提出的其他信息处理方法中,可以同时采集上述三种信息采集策略,即可以同时采用热榜视频信息的全量采集策略、新增视频信息的定量采集策略和历史视频信息的滚动采集策略,对各视频信息源处的视频信息进行采集。此时,本发明可以通过该三种信息采集策略来相互补充不同信息采集策略的不足,完善信息采集策略,既保证热榜视频信息和新增视频信息的及时采集,又可以保证历史视频信息的不遗漏,可以进一步提高信息采集的有效性,从而进一步提高信息比对的有效性,保证信息准确度。
本实施例提出的信息处理方法,可以通过设置和采用信息采集策略,来提高信息采集的有效性,提高信息比对的有效性,保证信息准确度。
与图1所示方法相对应,如图5所示,本实施例提出一种信息处理装置。该装置可以包括:第一采集单元101、第一比对单元102、第二比对单元103、第一确定单元104和第一输出单元105,其中:
第一采集单元101,用于按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各视频信息源生成的当前视频信息;
第一比对单元102,用于比对当前视频信息与历史采集信息是否相同,若否,则触发第二比对单元103;其中,目标视频信息是由第一信息源生成的,第一信息源与各视频信息源均不同;
第二比对单元103,用于比对当前视频信息与目标视频信息是否相同;
第一确定单元104,用于如果当前视频信息与目标视频信息不相同,则确定当前视频信息与目标视频信息间的差异信息;
第一输出单元105,用于输出差异信息。
需要说明的是,第一采集单元101、第一比对单元102、第二比对单元103、第一确定单元104和第一输出单元105的具体处理过程及其带来的技术效果,可以分别参照本实施例关于图1中步骤S101至S105的相关说明,此处不再赘述。
可选的,至少一种视频信息采集策略包括:热榜视频信息的全量采集策略、新增视频信息的定量采集策略和/或历史视频信息的滚动采集策略。
可选的,当至少一种视频信息采集策略中仅包括热榜视频信息的全量采集策略时,第一采集单元101用于周期性的对各视频信息源处的热榜视频信息进行全量采集。
可选的,当至少一种视频信息采集策略中仅包括新增视频信息的定量采集策略时,第一采集单元101用于周期性的对各视频信息源处的新增视频信息进行定量采集。
可选的,当至少一种视频信息采集策略中仅包括历史视频信息的滚动采集策略时,第一采集单元101用于对各视频信息源处的历史视频信息进行滚动采集。
可选的,第一采集单元101,用于:
针对任一视频信息源:周期性的对视频信息源处的当前历史视频信息进行定量采集,其中,在每一次进行定量采集后,记录当前采集进度,下一次在进行定量采集时,从当前采集进度开始对视频信息源处的当前历史视频信息进行定量采集,直至采集完毕视频信息源处的当前历史视频信息,之后返回执行周期性的对视频信息源处的当前历史视频信息进行定量采集,以再从头开始,对视频信息源处的当前历史视频信息进行定量采集。
可选的,第一输出单元105,包括:输入单元、标识单元和第二输出单元;
输入单元,用于将差异信息输入至已构建的信息校对页面中;
标识单元,用于在信息校对页面中,采用不同的标识方式对差异信息中不同类型的信息项进行标识;
第二输出单元,用于输出信息校对页面。
本实施例提出的信息处理装置,可以按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各视频信息源生成的当前视频信息;比对当前视频信息与历史采集信息是否相同,若否,则比对当前视频信息与目标视频信息是否相同;其中,目标视频信息是由第一信息源生成的,第一信息源与各视频信息源均不同;如果当前视频信息与目标视频信息不相同,则确定当前视频信息与目标视频信息间的差异信息;输出差异信息。本发明可以有效实现对视频信息的自动采集,以及对于信息的自动比对,从而可以有效提高信息采集以及信息比对的处理效率,减少人力资源的消耗。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种信息处理方法,其特征在于,包括:
按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各所述视频信息源生成的当前视频信息;
比对所述当前视频信息与历史采集信息是否相同,若否,则比对所述当前视频信息与目标视频信息是否相同;其中,所述目标视频信息是由第一信息源生成的,所述第一信息源与各所述视频信息源均不同;
如果所述当前视频信息与所述目标视频信息不相同,则确定所述当前视频信息与所述目标视频信息间的差异信息;
输出所述差异信息。
2.根据权利要求1所述的信息处理方法,其特征在于,至少一种所述视频信息采集策略包括:热榜视频信息的全量采集策略、新增视频信息的定量采集策略和/或历史视频信息的滚动采集策略。
3.根据权利要求2所述的信息处理方法,其特征在于,当所述至少一种所述视频信息采集策略中仅包括热榜视频信息的全量采集策略时,所述按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各所述视频信息源生成的当前视频信息,包括:
周期性的对各所述视频信息源处的热榜视频信息进行全量采集。
4.根据权利要求2所述的信息处理方法,其特征在于,当所述至少一种所述视频信息采集策略中仅包括新增视频信息的定量采集策略时,所述按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各所述视频信息源生成的当前视频信息,包括:
周期性的对各所述视频信息源处的新增视频信息进行定量采集。
5.根据权利要求2所述的信息处理方法,其特征在于,当所述至少一种所述视频信息采集策略中仅包括历史视频信息的滚动采集策略时,所述按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各所述视频信息源生成的当前视频信息,包括:
对各所述视频信息源处的历史视频信息进行滚动采集。
6.根据权利要求5所述的信息处理方法,其特征在于,所述对各所述视频信息源处的历史视频信息进行滚动采集,包括:
针对任一所述视频信息源:周期性的对所述视频信息源处的当前历史视频信息进行定量采集,其中,在每一次进行定量采集后,记录当前采集进度,下一次在进行定量采集时,从当前采集进度开始对所述视频信息源处的当前历史视频信息进行定量采集,直至采集完毕所述视频信息源处的当前历史视频信息,之后返回执行周期性的对所述视频信息源处的当前历史视频信息进行定量采集,以再从头开始,对所述视频信息源处的当前历史视频信息进行定量采集。
7.根据权利要求1所述的信息处理方法,其特征在于,所述输出所述差异信息,包括:
将所述差异信息输入至已构建的信息校对页面中;
在所述信息校对页面中,采用不同的标识方式对所述差异信息中不同类型的信息项进行标识;
输出所述信息校对页面。
8.一种信息处理装置,其特征在于,包括:第一采集单元、第一比对单元、第二比对单元、第一确定单元和第一输出单元,其中:
所述第一采集单元,用于按照预定义的至少一种视频信息采集策略,从至少一个视频信息源处采集由各所述视频信息源生成的当前视频信息;
所述第一比对单元,用于比对所述当前视频信息与历史采集信息是否相同,若否,则触发所述第二比对单元;其中,所述目标视频信息是由第一信息源生成的,所述第一信息源与各所述视频信息源均不同;
所述第二比对单元,用于比对所述当前视频信息与目标视频信息是否相同;
所述第一确定单元,用于如果所述当前视频信息与所述目标视频信息不相同,则确定所述当前视频信息与所述目标视频信息间的差异信息;
所述第一输出单元,用于输出所述差异信息。
9.根据权利要求8所述的信息处理装置,其特征在于,所述至少一种所述视频信息采集策略包括:热榜视频信息的全量采集策略、新增视频信息的定量采集策略和/或历史视频信息的滚动采集策略。
10.根据权利要求9所述的信息处理装置,其特征在于,当所述至少一种所述视频信息采集策略中仅包括热榜视频信息的全量采集策略时,所述第一采集单元用于周期性的对各所述视频信息源处的热榜视频信息进行全量采集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210826490.5A CN114915807B (zh) | 2022-07-14 | 2022-07-14 | 一种信息处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210826490.5A CN114915807B (zh) | 2022-07-14 | 2022-07-14 | 一种信息处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114915807A true CN114915807A (zh) | 2022-08-16 |
CN114915807B CN114915807B (zh) | 2022-12-13 |
Family
ID=82772414
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210826490.5A Active CN114915807B (zh) | 2022-07-14 | 2022-07-14 | 一种信息处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114915807B (zh) |
Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004272631A (ja) * | 2003-03-10 | 2004-09-30 | Victor Co Of Japan Ltd | ローカルサーバのデータ処理方法、及びローカルサーバ装置 |
WO2010120168A1 (en) * | 2009-04-16 | 2010-10-21 | Zinias B.V. | Data management system with digitally acquired footage (dmsdaf) for broadcast/cinema purposes and method of managing data with digitally acquired footage |
US20150020106A1 (en) * | 2013-07-11 | 2015-01-15 | Rawllin International Inc. | Personalized video content from media sources |
CN104378578A (zh) * | 2013-08-15 | 2015-02-25 | 中兴通讯股份有限公司 | 一种切换视频源的方法及装置、显示装置 |
CN104765766A (zh) * | 2015-02-28 | 2015-07-08 | 北京奇艺世纪科技有限公司 | 一种监测视频更新的方法和装置 |
CN104980766A (zh) * | 2014-04-01 | 2015-10-14 | 联想移动通信科技有限公司 | 一种信息处理方法、装置及终端 |
CN105099796A (zh) * | 2014-04-22 | 2015-11-25 | 深圳市志友企业发展促进中心 | 一种多媒体内容更改检测方法、装置及资源传播系统 |
CN105979189A (zh) * | 2016-05-31 | 2016-09-28 | 杭州趣吧科技有限公司 | 一种视频信号处理与存储方法与系统 |
CN106484774A (zh) * | 2016-09-12 | 2017-03-08 | 北京歌华有线电视网络股份有限公司 | 一种多源视频元数据的关联方法及系统 |
CN106815288A (zh) * | 2016-12-06 | 2017-06-09 | 乐视控股(北京)有限公司 | 一种视频相关信息生成方法及其装置 |
WO2017121362A1 (zh) * | 2016-01-13 | 2017-07-20 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及服务器、计算机存储介质 |
CN110662101A (zh) * | 2018-06-29 | 2020-01-07 | 深圳联友科技有限公司 | 一种基于udp协议的网络视频多路显示方法及装置 |
CN111093091A (zh) * | 2019-12-11 | 2020-05-01 | 西安万像电子科技有限公司 | 视频处理方法、服务器及系统 |
CN112836087A (zh) * | 2021-01-26 | 2021-05-25 | 湖南快乐阳光互动娱乐传媒有限公司 | 一种视频属性信息采集方法及装置 |
CN113589767A (zh) * | 2021-04-06 | 2021-11-02 | 大连连合信息技术有限公司 | 一种机器人流程自动化rpa处理方法和相关装置 |
CN113747199A (zh) * | 2021-08-23 | 2021-12-03 | 北京达佳互联信息技术有限公司 | 视频编辑方法、装置、电子设备、存储介质及程序产品 |
CN114078020A (zh) * | 2020-08-12 | 2022-02-22 | 北京奇虎技术服务有限公司 | 多媒体信息加载方法、设备、存储介质及装置 |
CN114268815A (zh) * | 2021-12-15 | 2022-04-01 | 北京达佳互联信息技术有限公司 | 视频质量确定方法、装置、电子设备及存储介质 |
CN114302227A (zh) * | 2021-12-28 | 2022-04-08 | 北京智美互联科技有限公司 | 基于容器采集的网络视频采集与解析的方法和系统 |
CN114302176A (zh) * | 2021-12-03 | 2022-04-08 | 杭州海康威视系统技术有限公司 | 视频播放方法及装置 |
-
2022
- 2022-07-14 CN CN202210826490.5A patent/CN114915807B/zh active Active
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004272631A (ja) * | 2003-03-10 | 2004-09-30 | Victor Co Of Japan Ltd | ローカルサーバのデータ処理方法、及びローカルサーバ装置 |
WO2010120168A1 (en) * | 2009-04-16 | 2010-10-21 | Zinias B.V. | Data management system with digitally acquired footage (dmsdaf) for broadcast/cinema purposes and method of managing data with digitally acquired footage |
US20150020106A1 (en) * | 2013-07-11 | 2015-01-15 | Rawllin International Inc. | Personalized video content from media sources |
CN104378578A (zh) * | 2013-08-15 | 2015-02-25 | 中兴通讯股份有限公司 | 一种切换视频源的方法及装置、显示装置 |
CN104980766A (zh) * | 2014-04-01 | 2015-10-14 | 联想移动通信科技有限公司 | 一种信息处理方法、装置及终端 |
CN105099796A (zh) * | 2014-04-22 | 2015-11-25 | 深圳市志友企业发展促进中心 | 一种多媒体内容更改检测方法、装置及资源传播系统 |
CN104765766A (zh) * | 2015-02-28 | 2015-07-08 | 北京奇艺世纪科技有限公司 | 一种监测视频更新的方法和装置 |
WO2017121362A1 (zh) * | 2016-01-13 | 2017-07-20 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及服务器、计算机存储介质 |
CN105979189A (zh) * | 2016-05-31 | 2016-09-28 | 杭州趣吧科技有限公司 | 一种视频信号处理与存储方法与系统 |
CN106484774A (zh) * | 2016-09-12 | 2017-03-08 | 北京歌华有线电视网络股份有限公司 | 一种多源视频元数据的关联方法及系统 |
CN106815288A (zh) * | 2016-12-06 | 2017-06-09 | 乐视控股(北京)有限公司 | 一种视频相关信息生成方法及其装置 |
CN110662101A (zh) * | 2018-06-29 | 2020-01-07 | 深圳联友科技有限公司 | 一种基于udp协议的网络视频多路显示方法及装置 |
CN111093091A (zh) * | 2019-12-11 | 2020-05-01 | 西安万像电子科技有限公司 | 视频处理方法、服务器及系统 |
CN114078020A (zh) * | 2020-08-12 | 2022-02-22 | 北京奇虎技术服务有限公司 | 多媒体信息加载方法、设备、存储介质及装置 |
CN112836087A (zh) * | 2021-01-26 | 2021-05-25 | 湖南快乐阳光互动娱乐传媒有限公司 | 一种视频属性信息采集方法及装置 |
CN113589767A (zh) * | 2021-04-06 | 2021-11-02 | 大连连合信息技术有限公司 | 一种机器人流程自动化rpa处理方法和相关装置 |
CN113747199A (zh) * | 2021-08-23 | 2021-12-03 | 北京达佳互联信息技术有限公司 | 视频编辑方法、装置、电子设备、存储介质及程序产品 |
CN114302176A (zh) * | 2021-12-03 | 2022-04-08 | 杭州海康威视系统技术有限公司 | 视频播放方法及装置 |
CN114268815A (zh) * | 2021-12-15 | 2022-04-01 | 北京达佳互联信息技术有限公司 | 视频质量确定方法、装置、电子设备及存储介质 |
CN114302227A (zh) * | 2021-12-28 | 2022-04-08 | 北京智美互联科技有限公司 | 基于容器采集的网络视频采集与解析的方法和系统 |
Non-Patent Citations (1)
Title |
---|
王晓明等: "基于物联网和三网融合食品安全云服务端研究", 《信息技术》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114915807B (zh) | 2022-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lenarduzzi et al. | MVP explained: A systematic mapping study on the definitions of minimal viable product | |
US9430478B2 (en) | Anchor image identification for vertical video search | |
US20140358973A1 (en) | Methods and Data Structures for Multiple Combined Improved Searchable Formatted Documents including Citation and Corpus Generation | |
CN106484774B (zh) | 一种多源视频元数据的关联方法及系统 | |
JP4896268B2 (ja) | 情報価値を反映した情報検索方法及びその装置 | |
CN112232085B (zh) | 面向本质计算与推理的跨dikw模态文本歧义处理方法 | |
US20070092857A1 (en) | Method and apparatus for supporting training, and computer product | |
US20100157354A1 (en) | Choosing the next document | |
TWI556128B (zh) | Forensic system, forensic method and evidence collection program | |
CN116595859A (zh) | 基于机器学习的审计模型构建方法、装置、设备和介质 | |
CN114915807B (zh) | 一种信息处理方法及装置 | |
Wu et al. | Analytical performance modeling for top-k query processing | |
CN109636303B (zh) | 一种半自动提取和结构化文档信息的存储方法及系统 | |
CN110930106A (zh) | 线上面试系统的信息处理方法、装置和系统 | |
CN108009735B (zh) | 一种简历评估方法及装置 | |
US20230087098A1 (en) | Data analysis method, apparatus and device | |
US20040210834A1 (en) | Data management method and system for generating and verifying accurate coding information | |
Biffl et al. | Building Empirical Software Engineering Bodies of Knowledge with Systematic Knowledge Engineering. | |
Kuhrmann et al. | A mapping study on method engineering: first results | |
CN112307290A (zh) | 基于互联网的人才信息定向抓取方法 | |
CN108182513B (zh) | 一种简历评估方法及装置 | |
JP2011081496A (ja) | 成果物レビュー支援装置 | |
Cerdá et al. | What's Wrong with Citation Counts? | |
CN117272953B (zh) | 一种文档信息自动填充方法、系统和存储介质 | |
CN111817867A (zh) | 分布式环境下进行多日志协同分析的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |