CN108391140A - 一种视频帧的分析方法及装置 - Google Patents
一种视频帧的分析方法及装置 Download PDFInfo
- Publication number
- CN108391140A CN108391140A CN201810168858.7A CN201810168858A CN108391140A CN 108391140 A CN108391140 A CN 108391140A CN 201810168858 A CN201810168858 A CN 201810168858A CN 108391140 A CN108391140 A CN 108391140A
- Authority
- CN
- China
- Prior art keywords
- pixel
- value
- image
- region
- video frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 11
- 238000012512 characterization method Methods 0.000 claims abstract description 16
- 238000000034 method Methods 0.000 claims abstract description 16
- 238000005516 engineering process Methods 0.000 description 4
- 241000208340 Araliaceae Species 0.000 description 3
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 3
- 235000003140 Panax quinquefolius Nutrition 0.000 description 3
- 235000008434 ginseng Nutrition 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 208000001491 myopia Diseases 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种视频帧的分析方法及装置,其中,方法包括:获取当前接收到的属于待发布视频的待处理视频帧;若待处理视频帧不是待发布视频中的参考视频帧,从待处理视频帧中,确定第一预设坐标范围对应的第一图像区域;第一预设坐标范围为:预先设定的表征视频帧中用于表达视频帧的主题语义的至少部分文字所对应的坐标范围;获取待发布视频的参考视频帧中,第一预设坐标范围对应的第二图像区域;若第一图像区域与第二图像区域中的像素点间的颜色差异度小于预设值,则将包含第一图像区域的待处理视频帧,确定为与参考视频帧具有相同主题语义的目标视频帧。分析出该待发布视频中与该参考视频帧所表达的主题语义相同的视频帧。
Description
技术领域
本申请涉及多媒体领域,特别涉及一种视频帧的分析方法及装置。
背景技术
目前,视频网站服务器或者视频类应用所接收的待发布视频内容所表达的主题语义有多个,为了使发布的视频中的每个视频帧的主题语义相同,视频网站服务器或者视频类应用,在接收待发布视频所包含的多个视频帧的过程中,需要确定出表达相同主题语义的目标视频,并将目标视频进行发布。
在实际应用中,视频网站服务器或者视频类应用实时接收待发布视频中的每个视频帧,需要对接收的每个视频帧进行分析,以确定出表达相同主题语义的目标视频。因此,需要一种对实时接收的视频帧进行分析的方法。
发明内容
基于此,本申请提供了一种视频帧的分析方法,用以在实时接收视频帧的过程中,对当前接收的视频帧进行分析,以确定出视频帧内容表达相同主题语义的视频帧,为确定视频内容表达相同主题语义的目标视频提供依据。
本申请还提供了一种视频帧的分析装置,用以保证上述方法在实际中的实现及应用。
本申请的技术方案为:
本申请公开了一种视频帧的分析方法,该方法包括:
获取当前接收到的属于待发布视频的待处理视频帧;
若所述待处理视频帧不是所述待发布视频中的参考视频帧,从所述待处理视频帧中,确定第一预设坐标范围对应的第一图像区域;所述第一预设坐标范围为:预先设定的表征视频帧中用于表达所述视频帧的主题语义的至少部分文字所对应的坐标范围;
获取所述待发布视频的参考视频帧中,所述第一预设坐标范围对应的第二图像区域;
若所述第一图像区域与所述第二图像区域中的像素点间的颜色差异度小于预设值,则将包含所述第一图像区域的所述待处理视频帧,确定为与所述参考视频帧具有相同主题语义的目标视频帧。
其中,所述第一图像区域与所述第二图像区域中的像素点间的颜色差异度,包括:
所述第一图像区域的像素点与所述第二图像区域的像素点之间的颜色差异度,和/或,所述第一图像区域中表征文字的文字像素点所对应的第一颜色直方图,与所述第二图像区域中表征文字的文字像素点所对应的第二颜色直方图间的距离。
其中,所述第一图像区域与所述第二图像区域中像素点的颜色差异度通过如下方式确定:
确定所述第二图像区域中组成文字的第一文字像素点,得到多个第一文字像素点;
分别将所述第二图像区域中的每个第一文字像素点确定为待处理第一文字像素点;
从所述第一图像区域中确定出与所述待处理第一文字像素点具有相同位置坐标的第二文字像素点,并将所述待处理第一文字像素点与所述第二文字像素点确定为一个像素点对,得到多个像素点对;
分别将所述多个像素点对中的每个像素点对确定为待处理像素点对;
确定所述待处理像素点对所对应的目标颜色差异度,所述目标颜色差异度为:所述像素点对所包含的两个像素点对应的像素值的差值的绝对值,与,所述第二图像区域包含的像素点的总个数的比值;
将所述多个像素点对分别对应的目标颜色差异值的和,确定为所述第一图像区域与所述第二图像区域中像素点间的颜色差异度。
其中,所述确定所述第二图像区域中组成文字的第一文字像素点,包括:
获取用于判断所述第二图像区域中的像素点是否为第一文字像素点的目标参考值,所述目标参考值包括像素点在RGB颜色空间对应的R分量参考值、G分量参考值以及B分量参考值;
分别将所述第二图像区域中的每个像素点确定为待处理像素点;
若所述待处理像素点对应的R分量值与所述R分量参考值间差值的绝对值小于预设R分量阈值,所述像素点对应的G分量值与所述G分量参考值间差值的绝对值小于预设G分量阈值,且所述像素点对应的B分量值与所述B分量参考值间差值的绝对值小于预设B分量阈值,则将所述待处理像素点确定为第一文字像素点。
其中,所述用于判断所述第二图像区域中的像素点是否为第一文字像素点的目标参考值通过如下方式获取:
从所述参考视频帧中,提取出第二预设坐标范围对应的第三图像区域;所述第二预设坐标范围为:预先设定的表征视频帧中,用于表达所述视频帧的主题语义的至少部分文字所对应的坐标范围;
对所述第三图像区域进行二值化,得到二值化图像;
确定所述二值化图像中组成文字的第三文字像素点;
依据所述第三图像区域中像素点与所述二值化图像中像素点的位置坐标间的对应关系,以及所述二值化图像中的第三文字像素点的位置坐标,确定所述第三图像区域中与所述第三文字像素点具有相同位置坐标的第四文字像素点,得到多个第四文字像素点;
针对每个第四文字像素点,从所述第三图像区域中,确定所述第四文字像素点的像素值分别在RGB颜色空间上所对应的R分量值、G分量值以及B分量值;
确定所述多个第四文字像素点所对应的R分量平均值、G分量平均值以及B分量平均值;所述多个第四文字像素点所对应的R分量平均值为:所述多个第四文字像素点分别对应的R分量的平均值;所述多个第四文字像素点所对应的G分量平均值为:所述多个第四文字像素点分别对应的G分量的平均值;所述多个第四文字像素点所对应的B分量平均值为:所述多个第四文字像素点分别对应的B分量的平均值;
将所述R分量平均值确定为所述R分量参考值,将所述G分量平均值确定为所述G分量参考值,将所述B分量平均值确定为所述B分量参考值。
其中,所述确定所述二值化图像中组成文字的第三文字像素点,包括:
分别确定所述二值化图像中的每行像素点与每列像素点中的第一目标像素值,以及分别确定所述二值化图像中的每行像素点与每列像素点中不等于所述第一目标像素值的统计像素点;所述第一目标像素值为:位于首或尾位置的像素点所对应的像素值;
从所述二值化图像中,确定统计像素点的个数小于预设统计值的目标行与目标列;
确定所述二值化图像中的第二目标像素值;所述第二目标像素值为:总的第一目标像素值,与,总个数的比值,其中,所述总的第一目标像素值为所述目标行与所述目标列分别对应的第一目标像素值的和;所述总个数为:所述目标行和所述目标列的总个数;
根据所述二值化图像中每个像素值与所述第二目标像素值的差值的绝对值,得到两个不同的绝对值,并将取值大的绝对值所对应的像素值,确定为表征所述二值图像中文字像素点的文字像素值;
将所述二值化图像中像素值等于所述文字像素值的像素点,确定为第三文字像素点。
其中,在获取所述待发布视频的参考视频帧中,所述第一预设坐标范围对应的第二图像区域之后,还包括:
若所述第一图像区域与所述第二图像区域中的像素点间的颜色差异度不小于预设值,则将所述待处理视频帧确定为非目标视频帧;
若所述非目标视频帧的总数目大于预设阈值,则记录所述待处理视频帧的帧号,使得依据所述帧号确定出与所述参考视频帧的主题语义相同的视频。
本申请还提供了一种视频帧的分析装置,该装置包括:
第一获取单元,用于获取当前接收到的属于待发布视频的待处理视频帧;
第一确定单元,用于若所述待处理视频帧不是所述待发布视频中的参考视频帧,从所述待处理视频帧中,确定第一预设坐标范围对应的第一图像区域;所述第一预设坐标范围为:预先设定的表征视频帧中用于表达所述视频帧的主题语义的至少部分文字所对应的坐标范围;
第二获取单元,用于获取所述待发布视频的参考视频帧中,所述第一预设坐标范围对应的第二图像区域;
第二确定单元,用于若所述第一图像区域与所述第二图像区域中的像素点间的颜色差异度小于预设值,则将包含所述第一图像区域的所述待处理视频帧,确定为与所述参考视频帧具有相同主题语义的目标视频帧。
其中,所述第二确定单元中的所述第一图像区域与所述第二图像区域中的像素点间的颜色差异度,包括:
所述第一图像区域的像素点与所述第二图像区域的像素点之间的颜色差异度,和/或,所述第一图像区域中表征文字的文字像素点所对应的第一颜色直方图,与所述第二图像区域中表征文字的文字像素点所对应的第二颜色直方图间的距离。
其中,所述装置还包括:
第三确定单元,用于确定所述第一图像区域与所述第二图像区域中像素点的颜色差异度;
所述第三确定单元,包括:
第一确定子单元,用于确定所述第二图像区域中组成文字的第一文字像素点,得到多个第一文字像素点;
第二确定子单元,用于分别将所述第二图像区域中的每个第一文字像素点确定为待处理第一文字像素点;
第三确定子单元,用于从所述第一图像区域中确定出与所述待处理第一文字像素点具有相同位置坐标的第二文字像素点,并将所述待处理第一文字像素点与所述第二文字像素点确定为一个像素点对,得到多个像素点对;
第四确定子单元,用于分别将所述多个像素点对中的每个像素点对确定为待处理像素点对;
第五确定子单元,用于确定所述待处理像素点对所对应的目标颜色差异度,所述目标颜色差异度为:所述像素点对所包含的两个像素点对应的像素值的差值的绝对值,与,所述第二图像区域包含的像素点的总个数的比值;
第六确定子单元,用于将所述多个像素点对分别对应的目标颜色差异值的和,确定为所述第一图像区域与所述第二图像区域中像素点间的颜色差异度。
其中,所述第一确定子单元,包括:
获取模块,用于获取用于判断所述第二图像区域中的像素点是否为第一文字像素点的目标参考值,所述目标参考值包括像素点在RGB颜色空间对应的R分量参考值、G分量参考值以及B分量参考值;
第一确定模块,用于分别将所述第二图像区域中的每个像素点确定为待处理像素点;
第二确定模块,用于若所述待处理像素点对应的R分量值与所述R分量参考值间差值的绝对值小于预设R分量阈值,所述像素点对应的G分量值与所述G分量参考值间差值的绝对值小于预设G分量阈值,且所述像素点对应的B分量值与所述B分量参考值间差值的绝对值小于预设B分量阈值,则将所述待处理像素点确定为第一文字像素点。
其中,所述装置还包括:
第三获取单元,用于获取用于判断所述第二图像区域中的像素点是否为第一文字像素点的目标参考值;
其中,所述第三获取单元,包括:
提取子单元,用于从所述参考视频帧中,提取出第二预设坐标范围对应的第三图像区域;所述第二预设坐标范围为:预先设定的表征视频帧中,用于表达所述视频帧的主题语义的至少部分文字所对应的坐标范围;
二值化子单元,用于对所述第三图像区域进行二值化,得到二值化图像;
第七确定子单元,用于确定所述二值化图像中组成文字的第三文字像素点;
第八确定子单元,用于依据所述第三图像区域中像素点与所述二值化图像中像素点的位置坐标间的对应关系,以及所述二值化图像中的第三文字像素点的位置坐标,确定所述第三图像区域中与所述第三文字像素点具有相同位置坐标的第四文字像素点,得到多个第四文字像素点;
第九确定子单元,用于针对每个第四文字像素点,从所述第三图像区域中,确定所述第四文字像素点的像素值分别在RGB颜色空间上所对应的R分量值、G分量值以及B分量值;
第十确定子单元,用于确定所述多个第四文字像素点所对应的R分量平均值、G分量平均值以及B分量平均值;所述多个第四文字像素点所对应的R分量平均值为:所述多个第四文字像素点分别对应的R分量的平均值;所述多个第四文字像素点所对应的G分量平均值为:所述多个第四文字像素点分别对应的G分量的平均值;所述多个第四文字像素点所对应的B分量平均值为:所述多个第四文字像素点分别对应的B分量的平均值;
第十一确定子单元,用于将所述R分量平均值确定为所述R分量参考值,将所述G分量平均值确定为所述G分量参考值,将所述B分量平均值确定为所述B分量参考值。
其中,所述第七确定子单元,包括:
第三确定模块,用于分别确定所述二值化图像中的每行像素点与每列像素点中的第一目标像素值,以及分别确定所述二值化图像中的每行像素点与每列像素点中不等于所述第一目标像素值的统计像素点;所述第一目标像素值为:位于首或尾位置的像素点所对应的像素值;
第四确定模块,用于从所述二值化图像中,确定统计像素点的个数小于预设统计值的目标行与目标列;
第五确定模块,用于确定所述二值化图像中的第二目标像素值;所述第二目标像素值为:总的第一目标像素值,与,总个数的比值,其中,所述总的第一目标像素值为所述目标行与所述目标列分别对应的第一目标像素值的和;所述总个数为:所述目标行和所述目标列的总个数;
第六确定模块,用于根据所述二值化图像中每个像素值与所述第二目标像素值的差值的绝对值,得到两个不同的绝对值,并将取值大的绝对值所对应的像素值,确定为表征所述二值图像中文字像素点的文字像素值;
第七确定模块,用于将所述二值化图像中像素值等于所述文字像素值的像素点,确定为第三文字像素点。
其中,所述装置还包括:
第四确定单元,用于在所述第二获取单元获取所述待发布视频的参考视频帧中,所述第一预设坐标范围对应的第二图像区域之后,若所述第一图像区域与所述第二图像区域中的像素点间的颜色差异度不小于预设值,则将所述待处理视频帧确定为非目标视频帧;
第五确定单元,用于若所述非目标视频帧的总数目大于预设阈值,则记录所述待处理视频帧的帧号,使得依据所述帧号确定出与所述参考视频帧的主题语义相同的视频。
本申请技术方案的有益效果为:
由于待发布视频的每个视频帧中,表达视频帧内容的主题语义的一行或多行文字在视频帧中的坐标位置基本相同,因此,可以预先设定视频帧中表达主题语义的文字所对应的第一预设坐标范围,这样,在接收到不属于该待发布视频的参考视频帧的待处理视频帧时,从待处理视频帧中确定第一预设坐标范围所对应的第一图像区域,便得到了该待处理视频帧中用于表达主题语义的文字所对应的图像区域;同时,由于表达相同主题语义的文字在颜色、字体等格式上的设置是相同的,因此,在确定出待发布视频的参考视频帧中第一预设坐标所对应的第二图像区域之后,利用第一图像区域与第二图像区域中文字像素点在目标颜色差异度,以及文字像素点所对应的颜色直方图间的距离这两个特征,便可以分析出待处理视频帧与该参考视频帧所表达的主题语义是否相同,并最终分析出该待发布视频中与该参考视频帧所表达的主题语义相同的视频帧。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请中一种视频帧的分析方法实施例的流程图;
图2为本申请中一种视频帧的分析装置实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
新闻视频中蕴含着大量的最新资讯信息,对于视频网站和新闻类的应用来说有着重要的价值。视频网站或者新闻类的应用需要对每日播出的整条新闻进行拆分、上线,供用户对于其中感兴趣的每条新闻进行点击观看。由于全国的电视台数量众多,除卫视台外还存在各类地方台,如果需要对所有的新闻进行分割的话,需要耗费大量的人力进行切分,对切分好的新闻输入标题,上线到发布系统中。另一方面,由于新闻的时效性,对于新闻视频的处理速度的要求也是十分严格的,所以给人工分割带来的更大的压力,新闻一般都是在某个时间(如中午12点)大量播出,为了保证时效性,需要在规定的时间内尽快将整个的新闻节目切割成独立的新闻条目,而不能采用积压任务后期处理的方式进行生产。因此,自动的新闻视频拆分、分析技术就成为解决这一问题的关键技术。
新闻的标题是新闻拆分中具有重大意义的语义线索。通过对于大量新闻标题的观察可发现,新闻标题背景颜色、字体等信息各异,给新闻的拆分带来了很大的难度,比较极端的情况会出现新闻标题背景是透明色的情况,在时域空间来看,这些标题的背景是视频内容,会随着时间发生变化,因此,通过分析背景信息来实现对新闻视频的拆分,具有较大的难度。
本申请实施例中的发明人在研究中发现,新闻视频所包含的每个视频帧中,标题中的一行或多行文字在视频帧中的位置基本相同,并且,对于表达相同主题语义的多个视频帧,该多个视频帧的标题中组成文字的文字像素点,在颜色特征上的差异度较小,因此,在本申请实施例中,利用视频帧中表达主题语义的标题在视频帧中的位置基本相同,以及表达相同主题语义的标题中的文字像素点在颜色特征上的差异度,以新闻视频中的参考视频帧的标题中的文本像素点为参考,来对接收的视频帧的标题中的文字像素点进行分析,以确定出与参考视频帧的标题表达相同主题语义的目标视频帧,进而实现从大量视频帧中拆分出具有相同主题语义的短视频。
本申请实施例中,针对接收到的每个视频帧进行分析,以判断该视频帧所表达的主题语义是否与参考视频帧所表达的主题语义是否相同,进而判断出与参考视频帧的主题语义相同的目标视频帧。具体的,参考图1,示出了本申请中一种视频帧的分析方法实施例的流程图,该方法实施例可以包括以下步骤:
步骤101:获取当前接收到的属于待发布视频的待处理视频帧。
在本实施例中,处理器实时接收待发布视频中的每个视频帧,并实时对接收的每个视频帧进行分析,在本步骤中,处理器获取当前接收到的属于待发布视频中的视频帧,为了描述方便,本实施例将当前接收到的属于待发布视频的视频帧称为待处理视频帧。
步骤102:若待处理视频帧不是所待发布视频中的参考视频帧,从该待处理视频帧中,确定第一预设坐标范围对应的第一图像区域。
本实施例中以待发布视频中的参考视频帧内容所表达的主题语义为参考语义,因此,本实施例对待发布视频中除参考视频帧外的其他视频帧进行分析,具体的,在获取到待处理视频帧后,接着,在本步骤中,判断该待处理视频帧是否为待发布视频中的参考视频帧,若该待处理视频帧不是待发布视频中的参考视频帧时,本步骤从该待处理视频帧中确定出第一预设坐标范围对应的图像区域,其中,第一预设坐标范围为:预先设定的表征视频帧中,用于表达该视频帧的主题语义的至少部分文字所对应的坐标范围;为了描述方便,本实施例将第一预设坐标范围在该待处理视频帧中所对应的图像区域称为第一图像区域,也就是在该第一图像区域中,包含有表达该待处理视频内容的主题语义的文字,本实施例不对该第一图像区域中所包含的文字的数目作限定。
步骤103:获取该待发布视频的参考视频帧中,第一预设坐标范围对应的第二图像区域。
在本实施例中,以待发布视频中的第一个视频帧所表达的主题语义为参考语义,在本步骤中,获取待发布视频中的参考视频帧中,第一预设坐标范围对应的图像区域,为了描述方便,本实施例中,将参考视频帧中第一预设坐标范围所对应的图像区域称为第二图像区域。由于待发布视频中每个视频帧中表达主题语义的文字在视频帧中的位置基本相同,因此,在本步骤中,从参考视频帧中获取得到的第二图像区域中含有表达该参考视频帧主题语义的文字。
步骤104:判断第一图像区域是否满足预设条件。
在本实施例中,得到待处理视频帧中,含有该待处理视频帧对应的主题语义的文字后,接着,在本步骤中,判断该待处理视频帧中的第一图像区域是否满足预设条件,该预设条件用于判断该第一图像区域所包含的文字与参考视频帧中的第二图像区域所包含的文字在颜色特征上的差异度,进而,通过第一图像区域与第二图像区域中的文字的颜色特征上的差异度,判断该第一图像区域与第二图像区域中文字所对应的主题语义是否相同。
具体的,判断第一图像区域与第二图像区域中的文字在颜色特征上的差异度,本实施例提供了两个依据,其中,两个依据可以包括:第一,第一图像区域的像素点与第二图像区域的像素点之间的颜色差异度小于第一预设值;第二,第一图像区域中表征文字的文字像素点所对应的第一颜色直方图,与第二图像区域中表征文字的文字像素点所对应的第二颜色直方图间的距离小于第二预设值,在本实施例中,在判断第一图像区域与第二图像区域中文字在颜色特征上的差异度可以为上述第一种和第二种中的至少一种,即,本实施例可以只采用第一种,也可以只采用第二种,也可以同时采用第一种和第二种,具体应用中,可以根据实际情况进行确定,本实施例不对具体采用哪一种方式作限定。
其中,上述第一种预设条件为:第一图像区域的像素点与第二图像区域的像素点之间的颜色差异度小于第一预设值。具体的,第一图像区域的像素点与第二图像区域的像素点之间的颜色差异度的确定方式可以包括以下步骤A1~步骤A4:
步骤A1:确定第二图像区域中组成文字的第一文字像素点,得到多个第一文字像素点。
在本步骤中,从第二图像区域中,确定出组成该文字的文字像素点,为了描述方便,本实施例中将第二图像区域中的文字像素点统称为第一文字像素点,此时,得到第二图像区域中的多个第一文字像素点。
具体的,确定第二图像区域中的第一文字像素点的具体过程可以包括步骤B1~步骤B2:
步骤B1:获取用于判断第二图像区域中的像素点是否为第一文字像素点的目标参考值,所述目标参考值包括像素点在RGB颜色空间对应的R分量参考值、G分量参考值以及B分量参考值。
在本步骤中,获取用于判断第二图像区域中的像素点是否为第一文字像素点的目标参考值,其中,目标参考值可以包括:像素点在RGB颜色空间对应的R分量参考值、G分量参考值以及B分量参考值。具体的,确定像素点在RGB颜色空间对应的R分量参考值、G分量参考值以及B分量参考值的过程可以包括步骤C1~步骤C7:
步骤C1:从参考视频帧中,提取出第二预设坐标范围对应的第三图像区域。
在本步骤中,第二预设坐标范围为:预先设定的表征视频帧中,用于表达所述视频帧的主题语义的至少部分文字所对应的坐标范围。因此,本步骤中,从参考视频帧中,提取出第二预设坐标范围对应的图像区域,为了描述方便,本实施例中,将第一视频帧中,第二预设坐标范围所形成的图像区域称为第三图像区域,预先设定的第二预设坐标范围可以人为设定,使得该第二预设坐标范围所对应的第三图像区域中包含参考视频帧中,表达该参考视频帧主题语义的文字,也就是表达参考语义的文字。
步骤C2:对所述第三图像区域进行二值化,得到二值化图像。
在得到包含表达参考语义的第三图像区域后,接着,在本步骤中,对第三图像区域进行二值化,将二值化第三图像区域所得到的图像称为二值化图像。
步骤C3:确定所述二值化图像中组成文字的第三文字像素点。
在得到第三图像区域所对应的二值化图像后,接着,在本步骤中,确定该二值化图像中表征文字的文字像素点,为了描述方便,本实施例将二值化图像中表征文字的文字像素点称为第三文字像素点。
具体的,在本步骤中,确定二值化图像中组成文字的第三文字像素点的过程可以包括步骤D1~步骤D5:
步骤D1:分别确定所述二值化图像中的每行与每列像素点中,第一目标像素值,以及,不等于所述第一目标像素值的统计像素点;所述第一目标像素值为:位于所述行与列像素点中的首或尾位置的像素点所对应的像素值。
在本步骤中,这对二值化图像中的每行和每列像素点,将每行与每列像素点中首或尾位置的像素点对应的像素值确定为第一目标像素值,并统计每行与每列像素点中,像素值不等于该行或该列中的第一目标像素值的像素点,为了描述方便,本实施例中,将每行或每列像素点中像素值不等于第一目标像素值的像素点统称为统计像素点。
步骤D2:从所述二值化图像中,确定统计像素点的个数小于预设统计值的目标行与目标列。
在确定出二值化图像中,每行与每列中统计像素点个数后,接着,在本步骤中,从二值化图像中,将统计像素点个数大于预设统计值的行与列确定为目标行与目标列,此时,得到多个目标行与多个目标列。
步骤D3:确定所述二值化图像中的第二目标像素值;所述第二目标像素值为:所述目标行与所述目标列对应的第一目标像素值的和,与,所述目标行和所述目标列的总个数的比值。
在确定出二值化图像中的目标行与目标列后,接着,在本步骤中,确定所有目标行与目标列对应的第一目标像素值的和,与所有目标行与目标列的总数目间的比值,为了描述方便,本实施例中,将第一目标像素值的和与目标行与目标列的总数目间的比值称为第二目标像素值。
步骤D4:根据所述二值化图像中每个像素值与所述第二目标像素值的差值的绝对值,将大绝对值所对应的像素值确定为文字像素值。
在二值化图像中只存在两种像素值,将这两种像素值分别与第二目标像素值间差值的绝对值,此时,得到两个绝对值,接着,将两个绝对值较大的绝对值所对应的像素值,确定为组成文字的文字像素值。
步骤D5:将所述二值化图像中像素值等于所述文字像素值的像素点,确定为第三文字像素点。
在确定出文字像素值后,接着,在本步骤中,将二值化图像中,像素值等于该文字像素值的像素点确定为组成文字的文字像素点。
步骤C4:依据第三图像区域中像素点与所述二值化图像中像素点的位置坐标间的对应关系,以及二值化图像中的第三文字像素点,确定第三图像区域中与所述第三文字像素点对应的第四文字像素点,得到多个第四文字像素点。
在得到二值化图像中表征文字的第三文字像素点后,接着,在本步骤中,依据第三图像区域中像素点与所述二值化图像中像素点的位置坐标间的对应关系,以及二值化图像中的第三文字像素点,确定第三图像区域中与第三文字像素点对应的文字像素点,为了描述方便,本实施例将第三图像区域中与第三文字像素点具有相同位置坐标的像素点称为第四文字像素点,此时,在第三图像区域中得到多个第四文字像素点。
步骤C5:针对每个第四文字像素点,从第三图像区域中,确定第四文字像素点的像素值分别在RGB颜色空间上所对应的R分量值、G分量值以及B分量值。
在得到第三图像区域中的多个第四文字像素点后,接着,在本步骤中,针对每个第四文字像素点,从第三图像区域中,确定各第四文字像素点的像素值分别在RGB颜色空间上所对应的R分量值、G分量值以及B分量值。
步骤C6:确定所述多个第四文字像素点所对应的R分量平均值、G分量平均值以及B分量平均值。
在得到第三图像区域中,每个第四文字像素点RGB颜色空间上所对应的R分量值、G分量值以及B分量值后,接着,在本步骤中,对多个第四文字像素点分别对应的多个R分量求平均值,得到该多个第四文字像素点对应的R分量平均值。同理,得到该多个第四文字像素点对应的G分量平均值,以及B分量平均值。
步骤C7:将R分量平均值确定为R分量参考值,将G分量平均值确定为G分量参考值,将B分量平均值确定为B分量参考值。
在确定出第三图像区域中所有第四文字像素点在RGB颜色空间上所对应的R分量平均值、G分量平均值以及B分量平均值后,接着,在本步骤中,将确定出的R分量平均值确定为R分量参考值,将G分量平均值确定为G分量参考值,将B分量平均值确定为B分量参考值。
步骤B2:针对第二图像区域中的每个像素点,若像素点对应的R分量值与R分量参考值间差值的绝对值小于预设R阈值,像素点对应的G分量值与G分量参考值间差值的绝对值小于预设G阈值,且像素点对应的B分量值与B分量参考值间差值的绝对值小于预设B阈值,则将像素点确定为第一文字像素点。
通过上述步骤C1~步骤C7,获取了第二图像区域中的像素点是否为第一文字像素点的目标阈值,接着,在本步骤中,针对该第二图像区域中的每个像素点,判断该像素点对应的R分量值是否小于R分量阈值,像素点对应的G分量值是否小于G分量阈值,像素点对应的B分量值是否小于B分量阈值,若像素点对应的R分量值小于R分量阈值,像素点对应的G分量值小于G分量阈值,且像素点对应的B分量值小于B分量阈值,则将像素点确定为第一文字像素点。
步骤A2:针对第二图像区域中的每个第一文字像素点,从第一图像区域中确定出与第一文字像素点具有相同位置坐标的第二文字像素点,并将第一文字像素点与第二文字像素点确定为一个像素点对,得到多个像素点对。
在确定出第二图像区域中的第一文字像素点后,接着,在本步骤中,针对第二图形区域中的每个第一文字像素点,从第一图像区域中确定出与第一文字像素点具有相同位置坐标的第二文字像素点,并将第一文字像素点与第二文字像素点确定为一个像素点对,得到多个像素点对。
步骤A3:针对每个像素点对,确定像素点对所对应的目标颜色差异度,所述目标颜色差异度为:像素点对所包含的两个像素点对应的像素值的差值的绝对值,与,第二图像区域包含的像素点的总个数的比值。
在本步骤中,针对每个像素点对,确定像素点对所对应的目标颜色差异度,其中,目标颜色差异度为:像素点对所包含的两个像素点对应的像素值的差值的绝对值,与,第二图像区域包含的像素点的总个数的比值。具体的,依据每个像素点对的像素值确定第一图像区域与第二图像区域中像素点的目标颜色差异度可以根据以下公式(1)进行计算:
其中,该公式中,Icur(x,y)为该待处理视频帧中坐标位置为x,y的像素点对应的像素值,Iref(x,y)为参考视频帧中坐标位置为x,y的像素点对应的像素值,Imask(x,y)为与参考视频帧具有相同位置坐标处的x,y所对应的标志值,该标志值的取值为:坐标x,y所对应的像素点为文字像素点是该标志值为非零值,具体的可以为255,可以为1,当然还可以为其他值,本实施例不对具体的区域作限定,当该坐标x,y所对应的像素点不是文字像素点时,该标志值为0。H为第二图像区域中一行所包含的像素点个数,W为第二图像区域中一列所包含的像素点个数。
步骤A4:将像素点对所对应的目标颜色差异值的和,确定为第一图像区域与第二图像区域中像素点间的颜色差异度。
上述公式(1)中将第一图像区域与第二图像区域中的每个像素点对所对应的目标颜色差异值的和,确定为该第一图像区域与第二图像区域中像素点间的颜色差异度。
上述步骤A1~步骤A4确定出了第一图像区域与第二图像区域中像素点间的颜色差异度,在本实施例中,还可以通过第一图像区域所对应的第一颜色直方图以及第二图像区域所对应的第二颜色直方图间的距离,其中,本实施例中的距离可以为欧式距离,当然还可以为其他的距离,本实施例不对具体的距离计算方式作限定。
步骤105:若该待处理视频帧满足所述预设条件,则将该待处理视频帧确定为与参考视频帧具有相同主题语义的目标视频帧。
通过步骤104的判断,若该处理视频帧满足所述预设条件,则将该待处理视频帧确定为与参考视频帧具有相同主题语义的目标视频帧,否则,该待处理视频帧确定为与参考视频帧的主题语义不同的非目标视频帧。
步骤106:累计不满足预设条件的视频帧的数目,当总累计数目达到预设值时,记录该达到预设值所对应的视频帧的帧号。
在判断出该待处理视频帧不满足预设条件时,本实施例累计不满足预设条件的视频帧的数目,当总累计数目达到预设值时,记录该达到预设值所对应的视频帧的帧号,以便利用该帧号,确定待发布视频中与参考视频帧所表达的主题语义相同的目标视频帧。
其中,本实施例通过将确定出的非目标视频帧的累加数目与一个预设值系相比较,当累加数目等于预设值时,才根据当前确定出的非目标视频帧的帧号,确定与第一个视频表达相同主题语义的视频的目的是,为了避免个别视频帧由于信号受到干扰,引起图像失真,导致分析出该视频帧是与参考视频帧所表达的主题语义不同的视频帧,因此,本实施例中通过一个预设值,即允许有预设数量的视频帧被分析出的主题语义与参考视频帧的主题语义不同。
通过本实施例,由于待发布视频的每个视频帧中,表达视频帧内容的主题语义的一行或多行文字在视频帧中的坐标位置基本相同,因此,可以预先设定视频帧中表达主题语义的文字所对应的第一预设坐标范围,这样,在接收到不属于该待发布视频的参考视频帧的待处理视频帧时,从待处理视频帧中确定第一预设坐标范围所对应的第一图像区域,便得到了该待处理视频帧中用于表达主题语义的文字所对应的图像区域;同时,由于表达相同主题语义的文字在颜色、字体等格式上的设置是相同的,因此,在确定出待发布视频的参考视频帧中第一预设坐标所对应的第二图像区域之后,利用第一图像区域与第二图像区域中文字像素点在目标颜色差异度,以及文字像素点所对应的颜色直方图间的距离这两个特征,便可以分析出待处理视频帧与该参考视频帧所表达的主题语义是否相同,并最终分析出该待发布视频中与该参考视频帧所表达的主题语义相同的视频帧。
参考图2,示出了本申请中一种视频帧的分析装置实施例的结构示意图,该装置实施例可以包括:
第一获取单元201,用于获取当前接收到的属于待发布视频的待处理视频帧;
第一确定单元202,用于若所述待处理视频帧不是所述待发布视频中的参考视频帧,从所述待处理视频帧中,确定第一预设坐标范围对应的第一图像区域;所述第一预设坐标范围为:预先设定的表征视频帧中用于表达所述视频帧的主题语义的至少部分文字所对应的坐标范围;
第二获取单元203,用于获取所述待发布视频的参考视频帧中,所述第一预设坐标范围对应的第二图像区域;
第二确定单元204,用于若所述第一图像区域与所述第二图像区域中的像素点间的颜色差异度小于预设值,则将包含所述第一图像区域的所述待处理视频帧,确定为与所述参考视频帧具有相同主题语义的目标视频帧。
其中,所述第二确定单元204中的所述第一图像区域与所述第二图像区域中的像素点间的颜色差异度,包括:
所述第一图像区域的像素点与所述第二图像区域的像素点之间的颜色差异度,和/或,所述第一图像区域中表征文字的文字像素点所对应的第一颜色直方图,与所述第二图像区域中表征文字的文字像素点所对应的第二颜色直方图间的距离。
其中,所述装置还包括:
第三确定单元,用于确定所述第一图像区域与所述第二图像区域中像素点的颜色差异度;
所述第三确定单元,包括:
第一确定子单元,用于确定所述第二图像区域中组成文字的第一文字像素点,得到多个第一文字像素点;
第二确定子单元,用于分别将所述第二图像区域中的每个第一文字像素点确定为待处理第一文字像素点;
第三确定子单元,用于从所述第一图像区域中确定出与所述待处理第一文字像素点具有相同位置坐标的第二文字像素点,并将所述待处理第一文字像素点与所述第二文字像素点确定为一个像素点对,得到多个像素点对;
第四确定子单元,用于分别将所述多个像素点对中的每个像素点对确定为待处理像素点对;
第五确定子单元,用于确定所述待处理像素点对所对应的目标颜色差异度,所述目标颜色差异度为:所述像素点对所包含的两个像素点对应的像素值的差值的绝对值,与,所述第二图像区域包含的像素点的总个数的比值;
第六确定子单元,用于将所述多个像素点对分别对应的目标颜色差异值的和,确定为所述第一图像区域与所述第二图像区域中像素点间的颜色差异度。
其中,所述第一确定子单元,包括:
获取模块,用于获取用于判断所述第二图像区域中的像素点是否为第一文字像素点的目标参考值,所述目标参考值包括像素点在RGB颜色空间对应的R分量参考值、G分量参考值以及B分量参考值;
第一确定模块,用于分别将所述第二图像区域中的每个像素点确定为待处理像素点;
第二确定模块,用于若所述待处理像素点对应的R分量值与所述R分量参考值间差值的绝对值小于预设R分量阈值,所述像素点对应的G分量值与所述G分量参考值间差值的绝对值小于预设G分量阈值,且所述像素点对应的B分量值与所述B分量参考值间差值的绝对值小于预设B分量阈值,则将所述待处理像素点确定为第一文字像素点。
其中,所述装置还包括:
第三获取单元,用于获取用于判断所述第二图像区域中的像素点是否为第一文字像素点的目标参考值;
其中,所述第三获取单元,包括:
提取子单元,用于从所述参考视频帧中,提取出第二预设坐标范围对应的第三图像区域;所述第二预设坐标范围为:预先设定的表征视频帧中,用于表达所述视频帧的主题语义的至少部分文字所对应的坐标范围;
二值化子单元,用于对所述第三图像区域进行二值化,得到二值化图像;
第七确定子单元,用于确定所述二值化图像中组成文字的第三文字像素点;
第八确定子单元,用于依据所述第三图像区域中像素点与所述二值化图像中像素点的位置坐标间的对应关系,以及所述二值化图像中的第三文字像素点的位置坐标,确定所述第三图像区域中与所述第三文字像素点具有相同位置坐标的第四文字像素点,得到多个第四文字像素点;
第九确定子单元,用于针对每个第四文字像素点,从所述第三图像区域中,确定所述第四文字像素点的像素值分别在RGB颜色空间上所对应的R分量值、G分量值以及B分量值;
第十确定子单元,用于确定所述多个第四文字像素点所对应的R分量平均值、G分量平均值以及B分量平均值;所述多个第四文字像素点所对应的R分量平均值为:所述多个第四文字像素点分别对应的R分量的平均值;所述多个第四文字像素点所对应的G分量平均值为:所述多个第四文字像素点分别对应的G分量的平均值;所述多个第四文字像素点所对应的B分量平均值为:所述多个第四文字像素点分别对应的B分量的平均值;
第十一确定子单元,用于将所述R分量平均值确定为所述R分量参考值,将所述G分量平均值确定为所述G分量参考值,将所述B分量平均值确定为所述B分量参考值。
其中,所述第七确定子单元,包括:
第三确定模块,用于分别确定所述二值化图像中的每行像素点与每列像素点中的第一目标像素值,以及分别确定所述二值化图像中的每行像素点与每列像素点中不等于所述第一目标像素值的统计像素点;所述第一目标像素值为:位于首或尾位置的像素点所对应的像素值;
第四确定模块,用于从所述二值化图像中,确定统计像素点的个数小于预设统计值的目标行与目标列;
第五确定模块,用于确定所述二值化图像中的第二目标像素值;所述第二目标像素值为:总的第一目标像素值,与,总个数的比值,其中,所述总的第一目标像素值为所述目标行与所述目标列分别对应的第一目标像素值的和;所述总个数为:所述目标行和所述目标列的总个数;
第六确定模块,用于根据所述二值化图像中每个像素值与所述第二目标像素值的差值的绝对值,得到两个不同的绝对值,并将取值大的绝对值所对应的像素值,确定为表征所述二值图像中文字像素点的文字像素值;
第七确定模块,用于将所述二值化图像中像素值等于所述文字像素值的像素点,确定为第三文字像素点。
其中,所述装置还包括:
第四确定单元,用于在所述第二获取单元获取所述待发布视频的参考视频帧中,所述第一预设坐标范围对应的第二图像区域之后,若所述第一图像区域与所述第二图像区域中的像素点间的颜色差异度不小于预设值,则将所述待处理视频帧确定为非目标视频帧;
第五确定单元,用于若所述非目标视频帧的总数目大于预设阈值,则记录所述待处理视频帧的帧号,使得依据所述帧号确定出与所述参考视频帧的主题语义相同的视频。
通过本装置实施例可以包括为图1所对应的视频帧的分析方法实施例,在实际应用中的实现提供保证。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同相似部分互相参见即可。在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。在文中的“包括”、“包含”等词语解释为包含的含义而不是排他或穷举的含义;也就是说,是“包含但不限于”的含义。在不脱离本发明构思的前提下,还可以做出变形、同等替换、改进等,这些都属于本发明的保护范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (14)
1.一种视频帧的分析方法,其特征在于,所述方法包括:
获取当前接收到的属于待发布视频的待处理视频帧;
若所述待处理视频帧不是所述待发布视频中的参考视频帧,从所述待处理视频帧中,确定第一预设坐标范围对应的第一图像区域;所述第一预设坐标范围为:预先设定的表征视频帧中用于表达所述视频帧的主题语义的至少部分文字所对应的坐标范围;
获取所述待发布视频的参考视频帧中,所述第一预设坐标范围对应的第二图像区域;
若所述第一图像区域与所述第二图像区域中的像素点间的颜色差异度小于预设值,则将包含所述第一图像区域的所述待处理视频帧,确定为与所述参考视频帧具有相同主题语义的目标视频帧。
2.根据权利要求1所述的方法,其特征在于,所述第一图像区域与所述第二图像区域中的像素点间的颜色差异度,包括:
所述第一图像区域的像素点与所述第二图像区域的像素点之间的颜色差异度,和/或,所述第一图像区域中表征文字的文字像素点所对应的第一颜色直方图,与所述第二图像区域中表征文字的文字像素点所对应的第二颜色直方图间的距离。
3.根据权利要求2所述的方法,其特征在于,所述第一图像区域与所述第二图像区域中像素点的颜色差异度通过如下方式确定:
确定所述第二图像区域中组成文字的第一文字像素点,得到多个第一文字像素点;
分别将所述第二图像区域中的每个第一文字像素点确定为待处理第一文字像素点;
从所述第一图像区域中确定出与所述待处理第一文字像素点具有相同位置坐标的第二文字像素点,并将所述待处理第一文字像素点与所述第二文字像素点确定为一个像素点对,得到多个像素点对;
分别将所述多个像素点对中的每个像素点对确定为待处理像素点对;
确定所述待处理像素点对所对应的目标颜色差异度,所述目标颜色差异度为:所述像素点对所包含的两个像素点对应的像素值的差值的绝对值,与,所述第二图像区域包含的像素点的总个数的比值;
将所述多个像素点对分别对应的目标颜色差异值的和,确定为所述第一图像区域与所述第二图像区域中像素点间的颜色差异度。
4.根据权利要求3所述的方法,其特征在于,所述确定所述第二图像区域中组成文字的第一文字像素点,包括:
获取用于判断所述第二图像区域中的像素点是否为第一文字像素点的目标参考值,所述目标参考值包括像素点在RGB颜色空间对应的R分量参考值、G分量参考值以及B分量参考值;
分别将所述第二图像区域中的每个像素点确定为待处理像素点;
若所述待处理像素点对应的R分量值与所述R分量参考值间差值的绝对值小于预设R分量阈值,所述像素点对应的G分量值与所述G分量参考值间差值的绝对值小于预设G分量阈值,且所述像素点对应的B分量值与所述B分量参考值间差值的绝对值小于预设B分量阈值,则将所述待处理像素点确定为第一文字像素点。
5.根据权利要求4所述的方法,其特征在于,所述用于判断所述第二图像区域中的像素点是否为第一文字像素点的目标参考值通过如下方式获取:
从所述参考视频帧中,提取出第二预设坐标范围对应的第三图像区域;所述第二预设坐标范围为:预先设定的表征视频帧中,用于表达所述视频帧的主题语义的至少部分文字所对应的坐标范围;
对所述第三图像区域进行二值化,得到二值化图像;
确定所述二值化图像中组成文字的第三文字像素点;
依据所述第三图像区域中像素点与所述二值化图像中像素点的位置坐标间的对应关系,以及所述二值化图像中的第三文字像素点的位置坐标,确定所述第三图像区域中与所述第三文字像素点具有相同位置坐标的第四文字像素点,得到多个第四文字像素点;
针对每个第四文字像素点,从所述第三图像区域中,确定所述第四文字像素点的像素值分别在RGB颜色空间上所对应的R分量值、G分量值以及B分量值;
确定所述多个第四文字像素点所对应的R分量平均值、G分量平均值以及B分量平均值;所述多个第四文字像素点所对应的R分量平均值为:所述多个第四文字像素点分别对应的R分量的平均值;所述多个第四文字像素点所对应的G分量平均值为:所述多个第四文字像素点分别对应的G分量的平均值;所述多个第四文字像素点所对应的B分量平均值为:所述多个第四文字像素点分别对应的B分量的平均值;
将所述R分量平均值确定为所述R分量参考值,将所述G分量平均值确定为所述G分量参考值,将所述B分量平均值确定为所述B分量参考值。
6.根据权利要求5所述的方法,其特征在于,所述确定所述二值化图像中组成文字的第三文字像素点,包括:
分别确定所述二值化图像中的每行像素点与每列像素点中的第一目标像素值,以及分别确定所述二值化图像中的每行像素点与每列像素点中不等于所述第一目标像素值的统计像素点;所述第一目标像素值为:位于首或尾位置的像素点所对应的像素值;
从所述二值化图像中,确定统计像素点的个数小于预设统计值的目标行与目标列;
确定所述二值化图像中的第二目标像素值;所述第二目标像素值为:总的第一目标像素值,与,总个数的比值,其中,所述总的第一目标像素值为所述目标行与所述目标列分别对应的第一目标像素值的和;所述总个数为:所述目标行和所述目标列的总个数;
根据所述二值化图像中每个像素值与所述第二目标像素值的差值的绝对值,得到两个不同的绝对值,并将取值大的绝对值所对应的像素值,确定为表征所述二值图像中文字像素点的文字像素值;
将所述二值化图像中像素值等于所述文字像素值的像素点,确定为第三文字像素点。
7.根据权利要求1所述的方法,其特征在于,在获取所述待发布视频的参考视频帧中,所述第一预设坐标范围对应的第二图像区域之后,还包括:
若所述第一图像区域与所述第二图像区域中的像素点间的颜色差异度不小于预设值,则将所述待处理视频帧确定为非目标视频帧;
若所述非目标视频帧的总数目大于预设阈值,则记录所述待处理视频帧的帧号,使得依据所述帧号确定出与所述参考视频帧的主题语义相同的视频。
8.一种视频帧的分析装置,其特征在于,所述装置包括:
第一获取单元,用于获取当前接收到的属于待发布视频的待处理视频帧;
第一确定单元,用于若所述待处理视频帧不是所述待发布视频中的参考视频帧,从所述待处理视频帧中,确定第一预设坐标范围对应的第一图像区域;所述第一预设坐标范围为:预先设定的表征视频帧中用于表达所述视频帧的主题语义的至少部分文字所对应的坐标范围;
第二获取单元,用于获取所述待发布视频的参考视频帧中,所述第一预设坐标范围对应的第二图像区域;
第二确定单元,用于若所述第一图像区域与所述第二图像区域中的像素点间的颜色差异度小于预设值,则将包含所述第一图像区域的所述待处理视频帧,确定为与所述参考视频帧具有相同主题语义的目标视频帧。
9.根据权利要求8所述的装置,其特征在于,所述第二确定单元中的所述第一图像区域与所述第二图像区域中的像素点间的颜色差异度,包括:
所述第一图像区域的像素点与所述第二图像区域的像素点之间的颜色差异度,和/或,所述第一图像区域中表征文字的文字像素点所对应的第一颜色直方图,与所述第二图像区域中表征文字的文字像素点所对应的第二颜色直方图间的距离。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第三确定单元,用于确定所述第一图像区域与所述第二图像区域中像素点的颜色差异度;
所述第三确定单元,包括:
第一确定子单元,用于确定所述第二图像区域中组成文字的第一文字像素点,得到多个第一文字像素点;
第二确定子单元,用于分别将所述第二图像区域中的每个第一文字像素点确定为待处理第一文字像素点;
第三确定子单元,用于从所述第一图像区域中确定出与所述待处理第一文字像素点具有相同位置坐标的第二文字像素点,并将所述待处理第一文字像素点与所述第二文字像素点确定为一个像素点对,得到多个像素点对;
第四确定子单元,用于分别将所述多个像素点对中的每个像素点对确定为待处理像素点对;
第五确定子单元,用于确定所述待处理像素点对所对应的目标颜色差异度,所述目标颜色差异度为:所述像素点对所包含的两个像素点对应的像素值的差值的绝对值,与,所述第二图像区域包含的像素点的总个数的比值;
第六确定子单元,用于将所述多个像素点对分别对应的目标颜色差异值的和,确定为所述第一图像区域与所述第二图像区域中像素点间的颜色差异度。
11.根据权利要求10所述的装置,其特征在于,所述第一确定子单元,包括:
获取模块,用于获取用于判断所述第二图像区域中的像素点是否为第一文字像素点的目标参考值,所述目标参考值包括像素点在RGB颜色空间对应的R分量参考值、G分量参考值以及B分量参考值;
第一确定模块,用于分别将所述第二图像区域中的每个像素点确定为待处理像素点;
第二确定模块,用于若所述待处理像素点对应的R分量值与所述R分量参考值间差值的绝对值小于预设R分量阈值,所述像素点对应的G分量值与所述G分量参考值间差值的绝对值小于预设G分量阈值,且所述像素点对应的B分量值与所述B分量参考值间差值的绝对值小于预设B分量阈值,则将所述待处理像素点确定为第一文字像素点。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
第三获取单元,用于获取用于判断所述第二图像区域中的像素点是否为第一文字像素点的目标参考值;
其中,所述第三获取单元,包括:
提取子单元,用于从所述参考视频帧中,提取出第二预设坐标范围对应的第三图像区域;所述第二预设坐标范围为:预先设定的表征视频帧中,用于表达所述视频帧的主题语义的至少部分文字所对应的坐标范围;
二值化子单元,用于对所述第三图像区域进行二值化,得到二值化图像;
第七确定子单元,用于确定所述二值化图像中组成文字的第三文字像素点;
第八确定子单元,用于依据所述第三图像区域中像素点与所述二值化图像中像素点的位置坐标间的对应关系,以及所述二值化图像中的第三文字像素点的位置坐标,确定所述第三图像区域中与所述第三文字像素点具有相同位置坐标的第四文字像素点,得到多个第四文字像素点;
第九确定子单元,用于针对每个第四文字像素点,从所述第三图像区域中,确定所述第四文字像素点的像素值分别在RGB颜色空间上所对应的R分量值、G分量值以及B分量值;
第十确定子单元,用于确定所述多个第四文字像素点所对应的R分量平均值、G分量平均值以及B分量平均值;所述多个第四文字像素点所对应的R分量平均值为:所述多个第四文字像素点分别对应的R分量的平均值;所述多个第四文字像素点所对应的G分量平均值为:所述多个第四文字像素点分别对应的G分量的平均值;所述多个第四文字像素点所对应的B分量平均值为:所述多个第四文字像素点分别对应的B分量的平均值;
第十一确定子单元,用于将所述R分量平均值确定为所述R分量参考值,将所述G分量平均值确定为所述G分量参考值,将所述B分量平均值确定为所述B分量参考值。
13.根据权利要求12所述的装置,其特征在于,所述第七确定子单元,包括:
第三确定模块,用于分别确定所述二值化图像中的每行像素点与每列像素点中的第一目标像素值,以及分别确定所述二值化图像中的每行像素点与每列像素点中不等于所述第一目标像素值的统计像素点;所述第一目标像素值为:位于首或尾位置的像素点所对应的像素值;
第四确定模块,用于从所述二值化图像中,确定统计像素点的个数小于预设统计值的目标行与目标列;
第五确定模块,用于确定所述二值化图像中的第二目标像素值;所述第二目标像素值为:总的第一目标像素值,与,总个数的比值,其中,所述总的第一目标像素值为所述目标行与所述目标列分别对应的第一目标像素值的和;所述总个数为:所述目标行和所述目标列的总个数;
第六确定模块,用于根据所述二值化图像中每个像素值与所述第二目标像素值的差值的绝对值,得到两个不同的绝对值,并将取值大的绝对值所对应的像素值,确定为表征所述二值图像中文字像素点的文字像素值;
第七确定模块,用于将所述二值化图像中像素值等于所述文字像素值的像素点,确定为第三文字像素点。
14.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第四确定单元,用于在所述第二获取单元获取所述待发布视频的参考视频帧中,所述第一预设坐标范围对应的第二图像区域之后,若所述第一图像区域与所述第二图像区域中的像素点间的颜色差异度不小于预设值,则将所述待处理视频帧确定为非目标视频帧;
第五确定单元,用于若所述非目标视频帧的总数目大于预设阈值,则记录所述待处理视频帧的帧号,使得依据所述帧号确定出与所述参考视频帧的主题语义相同的视频。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810168858.7A CN108391140B (zh) | 2018-02-28 | 2018-02-28 | 一种视频帧的分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810168858.7A CN108391140B (zh) | 2018-02-28 | 2018-02-28 | 一种视频帧的分析方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108391140A true CN108391140A (zh) | 2018-08-10 |
CN108391140B CN108391140B (zh) | 2021-06-01 |
Family
ID=63069642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810168858.7A Active CN108391140B (zh) | 2018-02-28 | 2018-02-28 | 一种视频帧的分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108391140B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110493609A (zh) * | 2019-08-07 | 2019-11-22 | 咪咕文化科技有限公司 | 直播方法、终端及计算机可读存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101315631A (zh) * | 2008-06-25 | 2008-12-03 | 中国人民解放军国防科学技术大学 | 一种新闻视频故事单元关联方法 |
CN101895789A (zh) * | 2010-08-09 | 2010-11-24 | 北京海尔集成电路设计有限公司 | 检测电视信号中重复内容的方法和装置 |
US20130114704A1 (en) * | 2011-11-03 | 2013-05-09 | Cisco Technology, Inc. | Utilizing A Search Scheme for Screen Content Video Coding |
US20130148884A1 (en) * | 2011-12-13 | 2013-06-13 | Morris Lee | Video comparison using color histograms |
CN104636488A (zh) * | 2015-02-26 | 2015-05-20 | 北京奇艺世纪科技有限公司 | 一种基于图片的重复视频文件确定方法及装置 |
CN104982026A (zh) * | 2014-02-03 | 2015-10-14 | 株式会社隆创 | 图像检查装置和图像检查程序 |
CN105447842A (zh) * | 2014-07-11 | 2016-03-30 | 阿里巴巴集团控股有限公司 | 一种图像匹配的方法及装置 |
CN106162223A (zh) * | 2016-05-27 | 2016-11-23 | 北京奇虎科技有限公司 | 一种新闻视频切分方法和装置 |
CN106227868A (zh) * | 2016-07-29 | 2016-12-14 | 努比亚技术有限公司 | 视频文件的归类方法和装置 |
CN107590447A (zh) * | 2017-08-29 | 2018-01-16 | 北京奇艺世纪科技有限公司 | 一种文字标题识别方法及装置 |
-
2018
- 2018-02-28 CN CN201810168858.7A patent/CN108391140B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101315631A (zh) * | 2008-06-25 | 2008-12-03 | 中国人民解放军国防科学技术大学 | 一种新闻视频故事单元关联方法 |
CN101895789A (zh) * | 2010-08-09 | 2010-11-24 | 北京海尔集成电路设计有限公司 | 检测电视信号中重复内容的方法和装置 |
US20130114704A1 (en) * | 2011-11-03 | 2013-05-09 | Cisco Technology, Inc. | Utilizing A Search Scheme for Screen Content Video Coding |
US20130148884A1 (en) * | 2011-12-13 | 2013-06-13 | Morris Lee | Video comparison using color histograms |
CN104982026A (zh) * | 2014-02-03 | 2015-10-14 | 株式会社隆创 | 图像检查装置和图像检查程序 |
CN105447842A (zh) * | 2014-07-11 | 2016-03-30 | 阿里巴巴集团控股有限公司 | 一种图像匹配的方法及装置 |
CN104636488A (zh) * | 2015-02-26 | 2015-05-20 | 北京奇艺世纪科技有限公司 | 一种基于图片的重复视频文件确定方法及装置 |
CN106162223A (zh) * | 2016-05-27 | 2016-11-23 | 北京奇虎科技有限公司 | 一种新闻视频切分方法和装置 |
CN106227868A (zh) * | 2016-07-29 | 2016-12-14 | 努比亚技术有限公司 | 视频文件的归类方法和装置 |
CN107590447A (zh) * | 2017-08-29 | 2018-01-16 | 北京奇艺世纪科技有限公司 | 一种文字标题识别方法及装置 |
Non-Patent Citations (2)
Title |
---|
吴玲达,邓莉琼,邓维: "基于内容的相似视频片段检索技术", 《小型微型计算机系统》 * |
周丽君: "基于内容的视频镜头边界检测与", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110493609A (zh) * | 2019-08-07 | 2019-11-22 | 咪咕文化科技有限公司 | 直播方法、终端及计算机可读存储介质 |
CN110493609B (zh) * | 2019-08-07 | 2022-02-01 | 咪咕文化科技有限公司 | 直播方法、终端及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108391140B (zh) | 2021-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020437B (zh) | 一种视频和弹幕相结合的情感分析及可视化方法 | |
US9473448B2 (en) | System for social media tag extraction | |
DE102008056603B4 (de) | Verfahren und Vorrichtungen zur Messung von Markenexposition in Medienstreams und zur Festlegung von Interessenbereichen in zugeordneten Videoframes | |
EP2405369B1 (en) | Automatic segmentation of video | |
US20210406549A1 (en) | Method and apparatus for detecting information insertion region, electronic device, and storage medium | |
JP5840130B2 (ja) | テキストを含む映像領域の前処理方法及びシステム | |
CN110267061B (zh) | 一种新闻拆条方法及系统 | |
CN102469350A (zh) | 广告统计的方法、装置和系统 | |
CN112752151B (zh) | 一种动态广告植入位置的检测方法及装置 | |
WO2023138590A1 (zh) | 无参考的视频质量确定方法、装置、设备和存储介质 | |
CN108108733A (zh) | 一种新闻字幕检测方法及装置 | |
CN101216833A (zh) | 一种搜索并提供视频文件的方法、服务器和系统 | |
CN108391140A (zh) | 一种视频帧的分析方法及装置 | |
CN113011345B (zh) | 图像质量检测方法、装置、电子设备、可读存储介质 | |
WO2017096849A1 (zh) | 一种视频快速起播的实现方法和系统 | |
CN114595409A (zh) | 共享屏幕内容中的超链接被会议参与者直接点击打开的方法 | |
CN112822539B (zh) | 信息显示方法、装置、服务器及存储介质 | |
EP1324622A1 (en) | Broadcast confirmation system, broadcast confirmation device and method, recorded medium where broadcast confirmation program is recorded | |
CN107169004B (zh) | 一种特征数据库更新方法及装置 | |
CN112287800A (zh) | 一种无样本条件下的广告视频识别方法及系统 | |
CN108549708B (zh) | 一种图文匹配方法及系统 | |
CN108388872A (zh) | 一种基于字体颜色的新闻标题识别方法及装置 | |
JP2002204392A (ja) | 画像処理装置、画像処理システム、画像処理方法、及び記憶媒体 | |
TWI792957B (zh) | 文字辨識系統及方法 | |
CN113010797A (zh) | 一种基于云平台的智慧城市数据分享方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |