CN105898561B - 一种视频图像处理方法和装置 - Google Patents

一种视频图像处理方法和装置 Download PDF

Info

Publication number
CN105898561B
CN105898561B CN201610226956.2A CN201610226956A CN105898561B CN 105898561 B CN105898561 B CN 105898561B CN 201610226956 A CN201610226956 A CN 201610226956A CN 105898561 B CN105898561 B CN 105898561B
Authority
CN
China
Prior art keywords
region
grid
video image
color
watermark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610226956.2A
Other languages
English (en)
Other versions
CN105898561A (zh
Inventor
王志斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610226956.2A priority Critical patent/CN105898561B/zh
Publication of CN105898561A publication Critical patent/CN105898561A/zh
Application granted granted Critical
Publication of CN105898561B publication Critical patent/CN105898561B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44012Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving rendering scenes according to scene graphs, e.g. MPEG-4 scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • H04N21/8358Generation of protective data, e.g. certificates involving watermark

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明公开了一种视频图像处理方法和装置。本发明实施例在获取到需要添加水印的视频图像后,可以对该视频图像进行区域划分,然后,对划分得到的区域进行物体识别,得到物体信息,并根据该物体信息选择符合预设条件的区域添加水印;该方案可以减少水印对视频播放质量的影响,有利于改善视频的播放效果。

Description

一种视频图像处理方法和装置
技术领域
本发明涉及通信技术领域,具体涉及一种视频图像处理方法和装置。
背景技术
随着互联网技术的发展,以及视频数量的逐渐增多,人们对于版权、以及品牌的意识也越来越强。为了防止视频图像被盗用,以及品牌宣传的需要,在现有技术中,一般会在视频图像中加入某种标识,比如,以水印的方式在视频图像中加入品牌标识(Logo)等。以加入品牌水印为例,具体的,一般会在视频每一帧图像的预设固定位置添加一定大小的品牌水印,或者在视频的结尾添加全屏的品牌水印,这样,当用户观看该视频时,便会同时接收到该品牌的信息,从而一方面达到对品牌宣传的作用,另一方面,也可以防止该视频图像被盗用。
在对现有技术的研究和实践过程中,本发明的发明人发现,现有添加水印的技术通常会对视频的播放质量造成一定的影响,比如,会对视频的画面造成遮盖,等等,从而降低视频播放效果。
发明内容
本发明实施例提供一种视频图像处理方法和装置,可以减少水印对视频的播放质量的影响,改善视频的播放效果。
一种视频图像处理方法,包括:
获取需要添加水印的视频图像;
对所述视频图像进行区域划分;
对划分得到的区域进行物体识别,得到物体信息;
根据所述物体信息选择符合预设条件的区域添加水印。
相应的,本发明实施例还提供一种视频图像处理装置,包括:
获取单元,用于获取需要添加水印的视频图像;
划分单元,用于对所述视频图像进行区域划分;
识别单元,用于对划分得到的区域进行物体识别,得到物体信息;
处理单元,用于根据所述物体信息选择符合预设条件的区域添加水印。
本发明实施例在获取到需要添加水印的视频图像后,可以对该视频图像进行区域划分,然后,对划分得到的区域进行物体识别,得到物体信息,并根据该物体信息选择符合预设条件的区域添加水印;由于该方案在添加水印时,可以灵活地根据视频图像的具体场景来确定添加的位置,而不是将水印添加到视频图像的某个固定位置上,因此,可以避免由于视频图像的变化所导致的视频图像重要部位被水印遮盖等情况的发生,大大减少水印对视频播放质量的影响,有利于改善视频的播放效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本发明实施例所提供的一种视频图像处理方法的场景示意图;
图1b是本发明实施例所提供的一种视频图像处理方法的流程图;
图2a是本发明实施例所提供的一种视频图像处理方法的另一流程图;
图2b是本发明实施例所提供的视频图像处理方法中直方图的示意图;
图2c是本发明实施例所提供的视频图像处理方法中格子合并的示意图;
图2d是本发明实施例所提供的视频图像处理方法中合并的格子进行规整后的示意图;
图2e是本发明实施例所提供的视频图像处理方法的显示效果示意图;
图3是本发明实施例所提供的视频图像处理装置的结构示意图;
图4是本发明实施例所提供的终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种视频图像处理方法和装置。
其中,该视频图像处理装置具体可以集成在终端或其他可以进行视频图像处理的设备中,例如,以该视频图像处理装置具体集成在终端中为例,参见图1a,终端可以获取需要添加水印的视频图像,对该视频图像进行区域划分,对划分得到的区域进行物体识别,得到物体信息,根据该物体信息选择符合预设条件的区域添加水印,其中,该预设条件可以根据实际应用的需求进行设置,例如,可以选择在相对较为次要的位置,譬如墙面或地面等位置进行水印的添加,等等,从而减少对视频播放质量的影响,提高用户体验。例如,如图1b所示,对于不同场景的视频图像,比如某段视频的A帧、B帧……N帧等,由于其显示的具体场景(即显示的画面)不同,因此,水印的添加位置也会有所不同。
以下将分别进行详细说明。
实施例一、
本实施例将从视频图像处理装置的角度进行描述,该视频图像处理装置具体可以集成在终端或其他可以进行视频图像处理的设备中,该终端具体可以手机、平板电脑、笔记本电脑或个人计算机(PC,Personal Computer)等。
一种视频图像处理方法,包括:获取需要添加水印的视频图像,对该视频图像进行区域划分,对划分得到的区域进行物体识别,得到物体信息,根据该物体信息选择符合预设条件的区域添加水印。
如图1b所示,该视频图像处理方法的具体流程可以如下:
101、获取需要添加水印的视频图像。
例如,具体可以从本地读取视频数据,并从视频数据中确定需要添加水印的视频图像,或者,也可以接收其他设备传送的视频数据,并视频数据中确定需要添加水印的视频图像,等等。
102、对该视频图像进行区域划分。
其中,区域划分的方式可以有多种,例如,可以将视频图像按照基本形状,比如方形等划分为若干个区块,具体可以如下:
(1)将该视频图像拆分为n×m个格子,其中,n和m为正整数。
例如,对于320×480像素大小的视频图像,可以按照32×32像素大小的尺寸拆分成10×15个格子。
(2)计算每个格子颜色出现次数的直方图数据。
其中,直方图是一种二维统计图表,其可以由一系列高度不等的纵向条纹或线段表示数据分布的情况。在本发明实施例中,颜色出现次数的直方图指的是可以反映每种颜色的出现次数及颜色分布情况的图,其中,该图的横轴表示颜色分布情况,纵轴表示每种颜色的出现次数。
(3)根据该直方图数据估算每个格子的颜色离散程度。
例如,可以根据该直方图数据估算格子颜色分布情况的标准差或方差,然后根据该标准差或方差估算每个格子的颜色离散程度。其中,标准差或方差越大,离散程度越大。
(4)选择颜色离散程度小于预设离散阈值,且颜色色差小于预设色差阈值的格子,得到格子集合。
其中,该预设离散阈值和色差阈值可以根据实际应用的需求进行设置,在此不再赘述。
需说明的是,在本发明实施例中,对于颜色离散程度较小(即颜色离散程度小于预设离散阈值)且颜色比较均匀(即颜色色差小于预设色差阈值)的格子,称为平整区域,而对于颜色离散程度较大(即颜色离散程度大于等于预设离散阈值)的格子,或虽然颜色离散程度较小(即颜色离散程度小于预设离散阈值)但颜色不够均匀(即颜色色差大于等于预设色差阈值)的格子,称为非平整区域,对于非平整区域,可以直接排除,无需添加至格子集合中,即后续的计算搜索过程可以直接忽略此类格子。
(5)对该格子集合中的格子进行合并。
例如,具体可以将位置关系为连续,且平均颜色相近的格子合并成一个大格子,即步骤“对该格子集合中的格子进行合并”具体可以为:
计算格子集合中各个格子的颜色平均值,以及确定格子集合中各个格子之间的位置关系,将位置关系为连续,且颜色平均值的差异小于预设差值的格子进行合并。
递归步骤(5),直至无法进一步合并格子为止。
(6)将合并后的格子进行规整,得到划分后区域。
由于合并后的格子不一定符合预设的基本形状,因此,需要按照预设规则将合并后的格子进行规整,使其整齐划一,符合预设标准。
其中,该预设规则可以根据实际应用的需求进行设置,在此不再赘述。
需说明的是,如果在区域的划分过程中,均找不到平整区域,则区域划分失败,此时可以不添加水印,或者,也可以采用现有常规的方式添加水印,比如,在某个特定的角度打上水印,等等,具体策略可以根据实际应用的需求而定,在此不再赘述。
103、对划分得到的区域进行物体识别,得到物体信息。
例如,具体可以对步骤102中得到的“划分后区域”进行物体识别,得到物体信息,具体可以如下:
对划分得到的区域进行形状识别,得到基本形状,采用物体识别技术对该基本形式进行识别,得到物体信息。
其中,该物体信息可以包括物体的颜色、形状、和/或大小等信息。
可选的,为了提高识别效果,还可以在识别之前,先对该基本形状进行滤波、曲线调节、去除噪点、强化物体边缘、和/或减少光照等预处理,即在步骤“采用物体识别技术对该基本形式进行识别,得到物体信息”之前,该视频图像处理方法还可以包括:
对该基本形状进行预处理,得到预处理后基本形状,其中,该预处理可以包括滤波、曲线调节、去除噪点、强化物体边缘、和/或减少光照等。
则此时,步骤“采用物体识别技术对该基本形式进行识别,得到物体信息”具体可以为:
采用物体识别技术对该预处理后基本形状进行识别,得到物体信息。
104、根据该物体信息选择符合预设条件的区域添加水印。例如,具体可以如下:
(1)根据该物体信息确定该区域的位置、以及该区域的类别。
例如,具体可以从该物体信息中提取物体的特征信息,将该特征信息与预设的模型进行匹配,得到匹配模型,根据该匹配模型对该区域进行定位,得到区域的位置,以及根据该匹配模型确定该区域的类别。
其中,预设的模型、以及对应的类别可以根据实际应用的需求进行设置,在此不再赘述。
需说明的是,在本发明实施例中,对于物体的识别可以不作精细的识别,只需识别出大致的类别即可。
(2)根据该位置和类别选择符合预设条件的区域添加水印。例如,具体可以如下:
分别获取各个区域的类别所对应的权重,并确定该权重是否超过预设权重阈值,若超过预设阈值,则将该类别对应的区域确定为不适合添加水印的区域,可以将此类区域直接排除;而若未超过预设阈值,则将该类别对应的区域确定为候选区域,根据该候选区域的位置确定目标区域,在该目标区域上添加水印。
其中,各个类别对应的权重、以及预设权重阈值可以根据实际应用的需求进行设置,在此不再赘述。
其中,在根据该候选区域的位置确定目标区域时,可以采用多种方式,例如,可以从候选区域中随机选取一个区域作为目标区域,或者,也可以根据该候选区域的位置,按照预设规则为各个候选区域设置相应的优先级,然后,将优先级最高的区域确定为目标区域,比如,从优先级最高的区域中随机选择一个区域作为目标区域,或者,从优先级最高的区域中选择色调与该视频图像色调最接近的区域作为目标区域,等等。
其中,优先级的设置规则可以根据实际应用的需求而定,比如,可以定义靠近视频图像4个角落的区域的优先级最高,靠近视频图像四个边缘的区域其次,靠近视频图像中间的区域优先级最低,等等。
可选的,在添加水印时,可以调整水印的颜色使其与所在的区域融合,看起来更为自然。
由上可知,本实施例在获取到需要添加水印的视频图像后,可以对该视频图像进行区域划分,然后,对划分得到的区域进行物体识别,得到物体信息,并根据该物体信息选择符合预设条件的区域添加水印;由于该方案在添加水印时,可以灵活地根据视频图像的具体场景来确定添加的位置,而不是将水印添加到视频图像的某个固定位置上,因此,可以避免由于视频图像的变化所导致的视频图像重要部位被水印遮盖等情况的发生,大大减少水印对视频播放质量的影响,有利于改善视频的播放效果。
实施例二、
根据实施例一所描述的方法,以下将举例作进一步详细说明。
在本实施例中,将以该视频图像处理装置具体集成在终端中为例进行说明。
如图2所示,一种视频图像处理方法,具体流程可以如下:
201、终端获取需要添加水印的视频图像。
例如,具体可以从本地读取视频数据,并从视频数据中确定需要添加水印的视频图像,或者,也可以接收其他设备传送的视频数据,并视频数据中确定需要添加水印的视频图像,等等。
202、终端将该视频图像拆分为n×m个格子,其中,n和m为正整数。
例如,对于320×480像素大小的视频图像,可以按照32×32像素大小的尺寸拆分成10×15个格子,等等。
203、终端计算每个格子颜色出现次数的直方图数据。
其中,该直方图的横轴表示颜色分布情况,纵轴表示每种颜色的出现次数。例如,还是以该视频图像拆分成10×15个格子为例,若每个格子的颜色分布如表一所示(该表中每个格子与视频图像中的每个格子的位置相对应):
表一:
由表一可知,红色出现的次数为16次,橙色出现的次数为9次,黄色出现的次数为69次,绿色出现的次数为14次,青色出现的次数为8次,蓝色出现的次数为23次,紫色出现的次数为11次,则其直方图可以如图2b所示,可见,黄色出现的次数最多,而青色出现的次数最少。
需说明的是,为了描述方便,本发明实施例仅以红、橙、黄、绿、青、蓝和紫七种基本颜色为例进行说明,应当理解的是,在具体实现时,颜色的种类并不以此为限,还需理解的是,具体的颜色也可以用RGB(Red,Green,Blue)数值等来表示。
204、终端根据该直方图数据估算每个格子的颜色离散程度。
例如,终端具体可以根据该直方图数据估算格子颜色分布情况的标准差或方差(每种颜色均可以用具体的数值表示,比如用RGB数值等),然后根据该标准差或方差估算每个格子的颜色离散程度。其中,标准差或方差越大,离散程度越大。
205、终端选择颜色离散程度小于预设离散阈值,且颜色色差小于预设色差阈值的格子,得到格子集合。即选择平整区域,得到格子集合,然后执行步骤206,而对于非平整区域,则可以直接排除,无需添加至格子集合中,即后续的计算搜索过程可以直接忽略此类格子。
例如,若黄色对应的格子的颜色离散程度小于预设离散阈值,且颜色色差小于预设色差阈值,则可以确定黄色对应的格子确定为平整区域,可以添加至格子集合中;而若青色对应的格子的颜色离散程度大于预设离散阈值,或者其颜色色差大于预设色差阈值,则可以确定青色对应的格子为非平整区域,可以直接排除,无需添加至格子集合中,等等。
206、终端对该格子集合中的格子进行合并。
例如,具体可以将位置关系为连续,且平均颜色相近的格子合并成一个大格子,即具体可以如下:
终端计算格子集合中各个格子的颜色平均值,以及确定格子集合中各个格子之间的位置关系,将位置关系为连续,且颜色平均值的差异小于预设差值的格子进行合并。
递归步骤206,直至无法进一步合并格子为止,然后执行步骤207。
比如,参见表一,该视频图像除了最后一行中还存在两个格子为“绿”色之外,倒数四行(即第7~10行)均为黄色,因此,可以将这倒数四行中除了这两个“绿”色格子之外的其他格子均合并为一个大格子,参见图2c,需说明的是,该图仅仅以合并倒数四行的黄色格子为例进行示意,应当理解的是,在该图中,还有其他可以进行合并的格子,在此不再赘述。
207、终端将合并后的格子进行规整,得到划分后区域。
由于合并后的格子不一定符合预设的基本形状,因此,需要按照预设规则将合并后的格子进行规整,使其整齐划一,符合预设标准。
其中,该预设规则可以根据实际应用的需求进行设置,在此不再赘述。
例如,由参见图2c可知,由于最后一行存在两个绿色的小格子,导致合并后的黄色大格子的形状并不整齐,因此,可以对该黄色大格子进行规整,比如,参见图2d,可以将最后一行的两个“绿”色格子也一并与黄色大格子合并,形成一个方形的大格子,从而使得该黄色大格子,整齐划一,符合预设标准。当然,也可以采用其他的规整方法,具体的规整方式可根据实际应用的需求而定,在此不再列举。
需说明的是,如果在区域的划分过程中,均找不到平整区域,则区域划分失败,此时可以不添加水印,或者,也可以采用现有常规的方式添加水印,比如,在某个特定的角度打上水印,等等,具体策略可以根据实际应用的需求而定,在此不再赘述。
208、终端对划分后区域进行物体识别,得到物体信息;例如,具体可以如下:
对划分得到的区域进行形状识别,得到基本形状,采用物体识别技术对该基本形式进行识别,得到物体信息。
其中,该物体信息可以包括物体的颜色、形状、和/或大小等信息。
可选的,为了提高识别效果,还可以在识别之前,先对该基本形状进行滤波、曲线调节、去除噪点、强化物体边缘、和/或减少光照等预处理。
209、终端根据该物体信息确定该区域的位置、以及该区域的类别。
例如,终端可以从该物体信息中提取物体的特征信息,将该特征信息与预设的模型进行匹配,得到匹配模型,根据该匹配模型对该区域进行定位,得到区域的位置,以及根据该匹配模型确定该区域的类别。
比如,还是以合并后的黄色大格子为例,终端可以从该黄色大格子的颜色、形状、和/或大小等物体信息中提取物体的特征信息,比如颜色为“黄色”、形状为“方形”、和/或大小为“128×480”等,然后,将该特征信息与预设的模型进行匹配,进而确定该区域的类别为地面,并对该区域进行定位,得到区域的位置,比如在视频图像的下方(包括左下角、下边缘和右下角等)。
其中,预设的模型、以及对应的类别可以根据实际应用的需求进行设置,在此不再赘述。
需说明的是,在本发明实施例中,对于物体的识别可以不作精细的识别,只需识别出大致的类别即可。
210、终端根据该位置和类别选择符合预设条件的区域添加水印。例如,具体可以如下:
分别获取各个区域的类别所对应的权重,并确定该权重是否超过预设权重阈值,若超过预设阈值,则将该类别对应的区域确定为不适合添加水印的区域,可以将此类区域直接排除;而若未超过预设阈值,则将该类别对应的区域确定为候选区域,根据该候选区域的位置确定目标区域,在该目标区域上添加水印。
其中,各个类别对应的权重、以及预设权重阈值可以根据实际应用的需求进行设置,比如,由于“墙面”、“桌面”和/或“地面”等位置的重要性一般不高,因此,可以设置区域的类别为“墙面”、“桌面”和/或“地面”等所对应的权重小于该预设权重阈值,这样,当某个区域被确定为“墙面”、“桌面”或“地面”时,便可以确定为候选区域,比如,步骤209中所示例的黄色大格子所对应的区域,便可以确定为候选区域,等等,在此不再赘述。
其中,在根据该候选区域的位置确定目标区域时,可以采用多种方式,例如,可以从候选区域中随机选取一个区域作为目标区域,或者,也可以根据该候选区域的位置,按照预设规则为各个候选区域设置相应的优先级,然后,将优先级最高的区域确定为目标区域,比如,从优先级最高的区域中随机选择一个区域作为目标区域,或者,从优先级最高的区域中选择色调与该视频图像色调最接近的区域作为目标区域,等等。
其中,优先级的设置规则可以根据实际应用的需求而定,比如,可以定义靠近视频图像4个角落的区域的优先级最高,靠近视频图像四个边缘的区域其次,靠近视频图像中间的区域优先级最低,等等。
可选的,在添加水印时,可以调整水印的颜色使其与所在的区域融合,看起来更为自然。
由上可知,本实施例的终端在获取到需要添加水印的视频图像后,可以对该视频图像进行区域划分,然后,对划分得到的区域进行物体识别,得到物体信息,并根据该物体信息选择符合预设条件的区域添加水印;由于该方案在添加水印时,可以灵活地根据视频图像的具体场景来确定添加的位置,而不是将水印添加到视频图像的某个固定位置上,因此,可以避免由于视频图像的变化所导致的视频图像重要部位被水印遮盖等情况的发生,大大减少水印对视频播放质量的影响,有利于改善视频的播放效果,比如,参见图2e,该图为本发明实施例所提供的视频图像处理方法的显示效果示意图,看图2e中可以看出,对于不同的场景,添加水印的位置也会灵活地发生相应调整,使其不会对重要的场景发生遮盖,大大改善视频的播放效果,提高用户体验。
实施例三、
为了更好地实施以上方法,本发明实施例还提供一种视频图像处理装置,如图3所示,该视频图像处理装置包括获取单元301、划分单元302、识别单元303和处理单元304,如下:
(1)获取单元301;
获取单元301,用于获取需要添加水印的视频图像。
例如,获取单元301,具体可以用于从本地读取视频数据,并从视频数据中确定需要添加水印的视频图像,或者,也可以接收其他设备传送的视频数据,并视频数据中确定需要添加水印的视频图像,等等。
(2)划分单元302;
划分单元302,用于对该视频图像进行区域划分。例如,可以将视频图像按照基本形状,比如方形等划分为若干个区块,具体可以如下:
该划分单元302,具体用于将该视频图像拆分为n×m个格子,n和m为正整数;计算每个格子颜色出现次数的直方图数据;根据该直方图数据估算每个格子的颜色离散程度;选择颜色离散程度小于预设离散阈值,且颜色色差小于预设色差阈值的格子,得到格子集合;对该格子集合中的格子进行合并,并将合并后的格子进行规整,得到划分后区域。
其中,该预设离散阈值和色差阈值可以根据实际应用的需求进行设置,在此不再赘述。
其中,在合并格子时,具体可以将位置关系为连续,且平均颜色相近的格子合并成一个大格子,即可以如下:
该划分单元302,具体用于计算格子集合中各个格子的颜色平均值,以及确定格子集合中各个格子之间的位置关系;将位置关系为连续,且颜色平均值的差异小于预设差值的格子进行合并。
(3)识别单元303;
识别单元303,用于对划分得到的区域进行物体识别,得到物体信息。
例如,该识别单元303,具体可以用于对划分单元302得到的划分后区域进行物体识别,得到物体信息。
其中,该识别单元303可以包括形状识别子单元和物体识别子单元,具体如下:
该形状识别子单元,可以用于对划分得到的区域进行形状识别,得到基本形状;
该物体识别子单元,可以用于采用物体识别技术对该基本形式进行识别,得到物体信息。
其中,该物体信息可以包括物体的颜色、形状、和/或大小等信息。
可选的,为了提高识别效果,还可以在识别之前,先对该基本形状进行滤波、曲线调节、去除噪点、强化物体边缘、和/或减少光照等预处理,即该识别单元303还可以包括预处理子单元,如下:
该预处理子单元,可以用于对该基本形状进行预处理,得到预处理后基本形状,该预处理包括滤波、曲线调节、去除噪点、强化物体边缘、和/或减少光照等。
则此时,该物体识别子单元,具体可以用于采用物体识别技术对该预处理后基本形状进行识别,得到物体信息。
(4)处理单元304;
处理单元304,用于根据该物体信息选择符合预设条件的区域添加水印。
例如,该处理单元可以包括确定子单元和添加子单元,如下:
该确定子单元,可以用于根据该物体信息确定该区域的位置、以及该区域的类别。
例如,确定子单元可以从该物体信息中提取物体的特征信息,将该特征信息与预设的模型进行匹配,得到匹配模型,然后,根据该匹配模型对该区域进行定位,得到区域的位置,以及根据该匹配模型确定该区域的类别。
其中,预设的模型、以及对应的类别可以根据实际应用的需求进行设置,在此不再赘述。
该添加子单元,可以用于根据该位置和类别选择符合预设条件的区域添加水印,例如,具体可以如下:
添加子单元分别获取各个区域的类别所对应的权重,并确定该权重是否超过预设权重阈值;若超过预设权重阈值,则将该类别对应的区域确定为不适合添加水印的区域;若未超过预设权重阈值,则将该类别对应的区域确定为候选区域;根据该候选区域的位置确定目标区域;在该目标区域上添加水印。
其中,各个类别对应的权重、以及预设权重阈值可以根据实际应用的需求进行设置,在此不再赘述。
其中,添加子单元在根据该候选区域的位置确定目标区域时,可以采用多种方式,例如,可以从候选区域中随机选取一个区域作为目标区域,或者,也可以根据该候选区域的位置,按照预设规则为各个候选区域设置相应的优先级,然后,将优先级最高的区域确定为目标区域,比如,从优先级最高的区域中随机选择一个区域作为目标区域,或者,从优先级最高的区域中选择色调与该视频图像色调最接近的区域作为目标区域,等等。
其中,优先级的设置规则可以根据实际应用的需求而定,比如,可以定义靠近视频图像4个角落的区域的优先级最高,靠近视频图像四个边缘的区域其次,靠近视频图像中间的区域优先级最低,等等。
可选的,在添加水印时,可以调整水印的颜色使其与所在的区域融合,看起来更为自然。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
该视频图像处理装置具体可以集成在终端或其他可以进行视频图像处理的设备中,该终端具体可以手机、平板电脑、笔记本电脑或PC等。
由上可知,本实施例的视频图像处理装置在获取到需要添加水印的视频图像后,可以由划分单元302对该视频图像进行区域划分,然后,由识别单元303对划分得到的区域进行物体识别,得到物体信息,并由处理单元304根据该物体信息选择符合预设条件的区域添加水印;由于该方案在添加水印时,可以灵活地根据视频图像的具体场景来确定添加的位置,而不是将水印添加到视频图像的某个固定位置上,因此,可以避免由于视频图像的变化所导致的视频图像重要部位被水印遮盖等情况的发生,大大减少水印对视频播放质量的影响,有利于改善视频的播放效果。
实施例四、
相应的,本发明实施例还提供一种终端,如图4所示,该终端可以包括射频(RF,Radio Frequency)电路401、包括有一个或一个以上计算机可读存储介质的存储器402、输入单元403、显示单元404、传感器405、音频电路406、无线保真(WiFi,Wireless Fidelity)模块407、包括有一个或者一个以上处理核心的处理器408、以及电源409等部件。本领域技术人员可以理解,图4中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路401可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器408处理;另外,将涉及上行的数据发送给基站。通常,RF电路401包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM,Subscriber Identity Module)卡、收发信机、耦合器、低噪声放大器(LNA,Low Noise Amplifier)、双工器等。此外,RF电路401还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GSM,Global System of Mobile communication)、通用分组无线服务(GPRS,GeneralPacket Radio Service)、码分多址(CDMA,Code Division Multiple Access)、宽带码分多址(WCDMA,Wideband Code Division Multiple Access)、长期演进(LTE,Long TermEvolution)、电子邮件、短消息服务(SMS,Short Messaging Service)等。
存储器402可用于存储软件程序以及模块,处理器408通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器408和输入单元403对存储器402的访问。
输入单元403可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元403可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器408,并能接收处理器408发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面,输入单元403还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元404可用于显示由用户输入的信息或提供给用户的信息以及终端的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元404可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid Crystal Display)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器408以确定触摸事件的类型,随后处理器408根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图4中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
终端还可包括至少一种传感器405,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在终端移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路406、扬声器,传声器可提供用户与终端之间的音频接口。音频电路406可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路406接收后转换为音频数据,再将音频数据输出处理器408处理后,经RF电路401以发送给比如另一终端,或者将音频数据输出至存储器402以便进一步处理。音频电路406还可能包括耳塞插孔,以提供外设耳机与终端的通信。
WiFi属于短距离无线传输技术,终端通过WiFi模块407可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图4示出了WiFi模块407,但是可以理解的是,其并不属于终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器408是终端的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行终端的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器408可包括一个或多个处理核心;优选的,处理器408可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器408中。
终端还包括给各个部件供电的电源409(比如电池),优选的,电源可以通过电源管理系统与处理器408逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源409还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,终端还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,终端中的处理器408会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器408来运行存储在存储器402中的应用程序,从而实现各种功能:
获取需要添加水印的视频图像,对该视频图像进行区域划分,对划分得到的区域进行物体识别,得到物体信息,根据该物体信息选择符合预设条件的区域添加水印。
上述操作具体可参见前面的实施例,在此不再赘述。
由于该终端在添加水印时,可以灵活地根据视频图像的具体场景来确定添加的位置,而不是将水印添加到视频图像的某个固定位置上,因此,可以避免由于视频图像的变化所导致的视频图像重要部位被水印遮盖等情况的发生,大大减少水印对视频播放质量的影响,有利于改善视频的播放效果。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,RandomAccess Memory)、磁盘或光盘等。
以上对本发明实施例所提供的一种视频图像处理方法和装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (11)

1.一种视频图像处理方法,其特征在于,包括:
获取需要添加水印的视频图像;
对所述视频图像进行区域划分;
对划分得到的区域进行形状识别,得到基本形状;
采用物体识别技术对所述基本形状进行识别,得到物体信息,所述物体信息包括物体的颜色、形状、和/或大小;
根据所述物体信息确定所述区域的位置、以及所述区域的类别;
分别获取各个区域的类别所对应的权重,并确定所述权重是否超过预设权重阈值;
若超过预设权重阈值,则将所述类别对应的区域确定为不适合添加水印的区域;
若未超过预设权重阈值,则将所述类别对应的区域确定为候选区域;
根据所述候选区域的位置,按照预设规则为各个候选区域设置相应的优先级;
将优先级最高的区域确定为目标区域,在所述目标区域上添加水印,并调整水印的颜色使其与所在的区域融合。
2.根据权利要求1所述的方法,其特征在于,所述采用物体识别技术对所述基本形状进行识别,得到物体信息之前,还包括:
对所述基本形状进行预处理,得到预处理后基本形状,所述预处理包括滤波、曲线调节、去除噪点、强化物体边缘、和/或减少光照;
所述采用物体识别技术对所述基本形状进行识别,得到物体信息,具体为:采用物体识别技术对所述预处理后基本形状进行识别,得到物体信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述物体信息确定所述区域的位置、以及所述区域的类别,包括:
从所述物体信息中提取物体的特征信息;
将所述特征信息与预设的模型进行匹配,得到匹配模型;
根据所述匹配模型对所述区域进行定位,得到区域的位置,以及根据所述匹配模型确定所述区域的类别。
4.根据权利要求1所述的方法,其特征在于,所述将优先级最高的区域确定为目标区域,包括:
从优先级最高的区域中随机选择一个区域作为目标区域;或者,
从优先级最高的区域中选择色调与所述视频图像色调最接近的区域作为目标区域。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述对所述视频图像进行区域划分,包括:
将所述视频图像拆分为n×m个格子,n和m为正整数;
计算每个格子颜色出现次数的直方图数据;
根据所述直方图数据估算每个格子的颜色离散程度;
选择颜色离散程度小于预设离散阈值,且颜色色差小于预设色差阈值的格子,得到格子集合;
对所述格子集合中的格子进行合并,并将合并后的格子进行规整,得到划分后区域;
所述对划分得到的区域进行物体识别,得到物体信息,具体为:对划分后区域进行物体识别,得到物体信息。
6.根据权利要求5所述的方法,其特征在于,所述对所述格子集合中的格子进行合并,包括:
计算格子集合中各个格子的颜色平均值,以及确定格子集合中各个格子之间的位置关系;
将位置关系为连续,且颜色平均值的差异小于预设差值的格子进行合并。
7.一种视频图像处理装置,其特征在于,包括获取单元、划分单元、识别单元和处理单元,所述处理单元包括确定子单元和添加子单元,所述识别单元包括形状识别子单元和物体识别子单元;
获取单元,用于获取需要添加水印的视频图像;
划分单元,用于对所述视频图像进行区域划分;
形状识别子单元,用于对划分得到的区域进行形状识别,得到基本形状;
物体识别子单元,用于采用物体识别技术对所述基本形状进行识别,得到物体信息,所述物体信息包括物体的颜色、形状、和/或大小;
确定子单元,用于根据所述物体信息确定所述区域的位置、以及所述区域的类别;
添加子单元,用于分别获取各个区域的类别所对应的权重,并确定所述权重是否超过预设权重阈值;若超过预设权重阈值,则将所述类别对应的区域确定为不适合添加水印的区域;若未超过预设权重阈值,则将所述类别对应的区域确定为候选区域;根据所述候选区域的位置,按照预设规则为各个候选区域设置相应的优先级;将优先级最高的区域确定为目标区域;在所述目标区域上添加水印。
8.根据权利要求7所述的装置,其特征在于,所述识别单元还包括预处理子单元;
所述预处理子单元,用于对所述基本形状进行预处理,得到预处理后基本形状,所述预处理包括滤波、曲线调节、去除噪点、强化物体边缘、和/或减少光照;
所述物体识别子单元,具体用于采用物体识别技术对所述预处理后基本形状进行识别,得到物体信息。
9.根据权利要求7所述的装置,其特征在于,所述确定子单元,具体用于:
从所述物体信息中提取物体的特征信息;
将所述特征信息与预设的模型进行匹配,得到匹配模型;
根据所述匹配模型对所述区域进行定位,得到区域的位置,以及根据所述匹配模型确定所述区域的类别。
10.根据权利要求7至9任一项所述的装置,其特征在于,
所述划分单元,具体用于将所述视频图像拆分为n×m个格子,n和m为正整数;计算每个格子颜色出现次数的直方图数据;根据所述直方图数据估算每个格子的颜色离散程度;选择颜色离散程度小于预设离散阈值,且颜色色差小于预设色差阈值的格子,得到格子集合;对所述格子集合中的格子进行合并,并将合并后的格子进行规整,得到划分后区域;
所述识别单元,具体用于对划分后区域进行物体识别,得到物体信息。
11.根据权利要求10所述的装置,其特征在于,
所述划分单元,具体用于计算格子集合中各个格子的颜色平均值,以及确定格子集合中各个格子之间的位置关系;将位置关系为连续,且颜色平均值的差异小于预设差值的格子进行合并。
CN201610226956.2A 2016-04-13 2016-04-13 一种视频图像处理方法和装置 Active CN105898561B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610226956.2A CN105898561B (zh) 2016-04-13 2016-04-13 一种视频图像处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610226956.2A CN105898561B (zh) 2016-04-13 2016-04-13 一种视频图像处理方法和装置

Publications (2)

Publication Number Publication Date
CN105898561A CN105898561A (zh) 2016-08-24
CN105898561B true CN105898561B (zh) 2019-06-18

Family

ID=57013562

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610226956.2A Active CN105898561B (zh) 2016-04-13 2016-04-13 一种视频图像处理方法和装置

Country Status (1)

Country Link
CN (1) CN105898561B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341827B (zh) * 2017-07-27 2023-01-24 腾讯科技(深圳)有限公司 一种视频处理方法、装置和存储介质
KR102449877B1 (ko) 2017-09-15 2022-10-04 삼성전자주식회사 컨텐트를 제공하는 방법 및 단말기
CN107911753B (zh) 2017-11-28 2021-01-22 百度在线网络技术(北京)有限公司 用于在视频中添加数字水印的方法和装置
CN108563929A (zh) * 2018-04-16 2018-09-21 深圳市联软科技股份有限公司 一种仅在涉密区域生成水印的方法、系统、装置及介质
CN109102453A (zh) * 2018-08-10 2018-12-28 优视科技新加坡有限公司 一种添加水印的方法、装置、设备/终端/服务器以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1545811A (zh) * 2001-06-25 2004-11-10 �ʼҷ����ֵ������޹�˾ 视频中覆盖元素的适应性放置
CN102404649A (zh) * 2011-11-30 2012-04-04 江苏奇异点网络有限公司 水印位置自适应的视频水印添加方法
CN104182927A (zh) * 2014-09-12 2014-12-03 北京国双科技有限公司 图片水印添加方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1545811A (zh) * 2001-06-25 2004-11-10 �ʼҷ����ֵ������޹�˾ 视频中覆盖元素的适应性放置
CN102404649A (zh) * 2011-11-30 2012-04-04 江苏奇异点网络有限公司 水印位置自适应的视频水印添加方法
CN104182927A (zh) * 2014-09-12 2014-12-03 北京国双科技有限公司 图片水印添加方法及装置

Also Published As

Publication number Publication date
CN105898561A (zh) 2016-08-24

Similar Documents

Publication Publication Date Title
CN105898561B (zh) 一种视频图像处理方法和装置
CN107966209B (zh) 环境光检测方法、装置、存储介质和电子设备
CN106778585B (zh) 一种人脸关键点跟踪方法和装置
CN103871051B (zh) 图像处理方法、装置和电子设备
CN106296617B (zh) 人脸图像的处理方法及装置
CN106357897B (zh) 跌落信息的获取方法及装置
CN109191410A (zh) 一种人脸图像融合方法、装置及存储介质
CN104463105B (zh) 路牌识别方法及装置
US9948856B2 (en) Method and apparatus for adjusting a photo-taking direction, mobile terminal
US20150178336A1 (en) Method, device and storage medium for providing data statistics
CN108287744A (zh) 文字显示方法、装置及存储介质
CN106204552B (zh) 一种视频源的检测方法和装置
CN110796157A (zh) 一种图像差异识别方法、装置及存储介质
CN103325107A (zh) 图片处理方法、装置及终端设备
CN106296634B (zh) 一种检测相似图像的方法和装置
CN109145926A (zh) 相似图片识别方法及计算机设备
CN106204423A (zh) 一种基于增强现实的图片调整方法、装置及终端
JP2016511875A (ja) 画像サムネイルの生成方法、装置、端末、プログラム、及び記録媒体
CN108875594A (zh) 一种人脸图像的处理方法、装置以及存储介质
CN106296640B (zh) 一种识别模糊图像的方法和装置
CN107396193B (zh) 视频播放的方法和装置
CN104239005B (zh) 图形对齐方法及装置
CN104616333A (zh) 游戏视频处理方法及装置
CN114143523A (zh) 亮度调节方法、装置、投影设备及存储介质
CN105513098B (zh) 一种图像处理的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant