CN105451029B - 一种视频图像的处理方法及装置 - Google Patents

一种视频图像的处理方法及装置 Download PDF

Info

Publication number
CN105451029B
CN105451029B CN201510874223.5A CN201510874223A CN105451029B CN 105451029 B CN105451029 B CN 105451029B CN 201510874223 A CN201510874223 A CN 201510874223A CN 105451029 B CN105451029 B CN 105451029B
Authority
CN
China
Prior art keywords
video image
information
image
initial
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510874223.5A
Other languages
English (en)
Other versions
CN105451029A (zh
Inventor
谢睿
张周
彭浩浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Cubesili Information Technology Co Ltd
Original Assignee
Guangzhou Huaduo Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huaduo Network Technology Co Ltd filed Critical Guangzhou Huaduo Network Technology Co Ltd
Priority to CN201510874223.5A priority Critical patent/CN105451029B/zh
Publication of CN105451029A publication Critical patent/CN105451029A/zh
Application granted granted Critical
Publication of CN105451029B publication Critical patent/CN105451029B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs

Abstract

本发明实施例提供了一种视频图像的处理方法及装置,所述方法包括:对初始视频图像进行生物特征识别,得到该初始视频图像的第一生物特征信息;在预置的动态提示库中获取与所述第一生物特征信息关联的动态提示信息;推送视频信息,所述视频信息包括所述初始视频图像和与所述第一生物特征信息关联的动态提示信息,以便关联播放所述初始视频图像和与所述第一生物特征信息关联的动态提示信息。采用本发明,能够在视频中针对其中的图像自动加载一些诸如动画、语音等动态提示信息,不需要由用户进行后期的制作处理,节省了包括特效动画的视频的制作时间,满足了用户对视频后期制作的自动化、智能化需求。

Description

一种视频图像的处理方法及装置
技术领域
本发明涉及一种图像处理技术领域,尤其涉及一种视频图像的处理方法及装置。
背景技术
随着电子技术以及通信技术的发展,人们基本上可以随时随地观看各种视频节目,例如娱乐视频节目、游戏视频节目等。在这些视频节目的制作阶段,为了增加视频节目的趣味性,吸引更多的观众,制作者一般会在录制了节目视频后,根据需要人为的添加一些特殊效果,例如,在节目视频中的人物伤心时,加入“流泪”的效果。
现有技术中只能在节目视频录制好后,进一步进行后期的加工处理,增加了节目视频的制作时间,耗时耗力,特别是对于一些网络直播类的节目,则根本无法及时地添加这些效果。
发明内容
本发明实施例提供一种视频图像的处理方法及装置,可以自动化、智能化地在视频中增加动态信息。
本发明实施例提供了一种视频图像的处理方法,包括:
对初始视频图像进行生物特征识别,得到该初始视频图像的第一生物特征信息;
在预置的动态提示库中获取与所述第一生物特征信息关联的动态提示信息;
推送视频信息,所述视频信息包括所述初始视频图像和与所述第一生物特征信息关联的动态提示信息,以便关联播放所述初始视频图像和与所述第一生物特征信息关联的动态提示信息。
相应地,本发明实施例还提供了一种视频图像的处理装置,包括:
识别模块,用于对初始视频图像进行生物特征识别,得到该初始视频图像的第一生物特征信息;
获取模块,用于在预置的动态提示库中获取与所述第一生物特征信息关联的动态提示信息;
推送模块,用于推送视频信息,所述视频信息包括所述初始视频图像和与所述第一生物特征信息关联的动态提示信息,以便关联播放所述初始视频图像和与所述第一生物特征信息关联的动态提示信息。
实施本发明实施例,具有如下有益效果:
本发明实施例能够在视频中针对其中的图像自动加载一些诸如动画、语音等动态提示信息,不需要由用户进行后期的制作处理,节省了包括特效动画的视频的制作时间,满足了用户对视频后期制作的自动化、智能化需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种视频图像的处理方法的流程示意图;
图2是本发明实施例的另一种视频图像的处理方法的流程示意图;
图3是关于两帧视频图像中生物特征所在位置区域的示意图;
图4是本发明实施例的一种基于手势的视频图像处理的流程示意图;
图5是本发明实施例的再一种视频图像的处理方法的流程示意图;
图6是本发明实施例的一种视频图像的处理装置的结构示意图;
图7是本发明实施例的另一种视频图像的处理装置的结构示意图;
图8是图7中的比较模块的一种结构示意图;
图9是本发明实施例的一种视频服务设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
请参见图1,是本发明实施例的一种视频图像的处理方法的流程示意图,本发明实施例的所述方法可以由各类可进行视频处理的终端设备或服务器来执行,特别是一些用于视频直播的终端设备或服务器来执行。具体的,本发明实施例的所述方法可以包括以下步骤。
S101:对初始视频图像进行生物特征识别,得到该初始视频图像的第一生物特征信息。
在视频直播或者录制的过程中,针对视频的每一帧视频图像,均可以执行生物特征识别处理,一旦识别到视频图像中存在或可能存在诸如人物肢体、人脸表情、手势等生物特征时,即可将该视频图像作为初始视频图像,以进一步地进行生物特征识别,最终得出具体的生物特征信息。而如果不存在生物特征时,则继续对下一张视频图像进行识别处理。
生物特征可以是人物肢体的具体形态(例如跳、跑等),人脸的具体表情(如哭、笑等),具体的手势(例如“V”型手势等)。对视频图像的生物特征识别可以基于图像中的颜色值,具体根据背景颜色值、人物皮肤颜色值、衣物颜色值等来完成生物特征的识别与确认。具体的,如人脸表情识别可以基于眼睛、鼻子、嘴之间的相对位置、大小等特征来大致确定出图像中人物的具体的人脸表情;手势识别则可以具体的根据手的肤色与周围环境颜色的差异,即可大致确定出图像中人物的具体手势。
具体的,在本发明实施例中,所述生物特征识别包括进行肢体、人脸以及手势识别中的任一种或多种,而所述第一生物特征信息对应地包括肢体特征、人脸特征以及手势特征中的任一种或多种。
S102:在预置的动态提示库中获取与所述第一生物特征信息关联的动态提示信息。
所述预置的动态提示库中包括多种动态提示信息,这些动态提示信息可以为动画信息,语音信息等。每一种动态提示信息可以与一种生物特征信息关联,或者每一种动态提示信息可以与多种生物特征信息关联,因此,在得到第一生物特征信息后,可以查找获取到与之关联的动态提示信息。
当然,一种生物特征信息也可以与多种动态信息关联,当确定出第一生物特征信息后,可以从与之关联的多种动态信息中选择一种或多种来确定为所述第一生物特征信息的关联动态提示信息。
所述预置的动态提示库可以基于视频的类型进行分类,例如针对娱乐节目的视频、新闻节目的视频预置不同的动态提示库,这样可以加快针对生物特征信息查找动态提示信息的时间。当然也可以预置一个较大的动态提示库以便于满足多种视频对动态提示信息的需求。
S103:推送视频信息,所述视频信息包括所述初始视频图像和与所述第一生物特征信息关联的动态提示信息,以便关联播放所述初始视频图像和与所述第一生物特征信息关联的动态提示信息。
根据所述初始视频图像和所述第一生物特征信息关联的动态提示信息,并结合在所述初始视频图像之前采集到的相关视频图像,生成视频信息发送给指定的视频服务器,该视频服务器可以为网络直播服务器、卫星电视直播服务器等。这些视频服务器可以接收包括所述初始视频图像和所述第一生物特征信息关联的动态提示信息的视频信息,并接收该初始视频图像所对应视频的其他视频图像的视频信息,以及其他的包括视频图像及动态提示信息的视频信息。
这些视频服务器可以根据其配置的具体功能,可以存储各个时间点接收到的包括视频图像的视频信息、和包括视频图像和动态提示信息的视频信息,得到对应的视频节目,并在检测到对该视频节目的播放需求时,一并播放包括视频图像和动态提示信息的视频节目。
而直播服务器则可以直接根据接收到的视频图像和某些视频图像对应的动态提示信息生成直播流,推送给各播放端播放。
本发明实施例会对采集到的每一帧视频图像进行识别分析,一旦某一帧视频图像中存在或者可能存在生物特征时,即将该帧视频图像确定为初始视频图像,执行上述的S101至S103。
本发明实施例能够在视频中针对其中的图像自动加载一些诸如动画、语音等动态提示信息,不需要由用户进行后期的制作处理,节省了包括特效动画的视频的制作时间,满足了用户对视频后期制作的自动化、智能化需求。
再请参见图2,是本发明实施例的另一种视频图像的处理方法的流程示意图,本发明实施例的所述方法可以由各类可进行视频处理的终端设备或服务器来执行,特别是一些用于视频直播的终端设备或服务器来执行。具体的,本发明实施例的所述方法可以包括以下步骤。
S201:对初始视频图像进行生物特征识别,得到该初始视频图像的第一生物特征信息。
S202:在预置的动态提示库中获取与所述第一生物特征信息关联的动态提示信息。
S203:推送视频信息,所述视频信息包括所述初始视频图像和与所述第一生物特征信息关联的动态提示信息,以便关联播放所述初始视频图像和与所述第一生物特征信息关联的动态提示信息。
本发明实施例中的所述S201至S203的具体实现可参考图1对应实施例中S101至S103的描述,在此不赘述。在所述S201中确定了初始视频图像中的第一生物特征信息后,可以进一步的根据该第一生物特征信息在该初始视频图像中的位置区域,对该初始视频图像后的下M帧进行处理,即执行本发明实施例的下述步骤,M为正整数。
S204:确定所述第一生物特征信息在所述初始视频图像中的位置区域。
对于视频拍摄时得到的前后两帧或多帧(如4、5帧)之间,一般会非常相关,人脸、手势等生物特征多数情况下并不会移动太快,因此,在初始视频图像中确定出了第一生物特征信息后,不用对接下来的几帧视频图像进行全面检测,只需对部分区域内的图像内容进行分析处理即可。
确定出的位置区域的大小可以根据所述第一生物特征的类型及大小进行确定,一般来说,肢体的位置区域会比人脸的位置区域、手势的位置区域大。在所述S204中确定出的区域会大于人脸、手的大小,以便于保证在相邻的视频图像中能够更好地确定生物特征信息是否与第一生物特征信息相同。
S205:根据确定的位置区域,将所述初始视频图像中在所述确定出的位置区域内的图像信息和相邻视频图像中对应位置区域内的图像信息进行相似度比较,所述相邻视频图像包括:与所述初始视频图像在采集时间上临近的图像。
具体的,所述S205中可以基于灰度值来比较相似度。所述S205具体可以包括:根据确定的位置区域,获取所述初始视频图像中在所述确定出的位置区域内的各像素点灰度值。获取相邻视频图像中对应位置区域内的各像素点灰度值。将两次获取到的灰度值进行灰度值比较,得到灰度值比较结果。当然也可以采用现有的其他方式来确定图像区域中的内容之间的相似度。
所说的相邻视频图像中的与所述S204确定的位置区域对应的位置区域是指:该对应位置区域在相邻视频图像中的相对位置与所述S204确定的位置区域在所述初始视频图像中的相对位置相同,在相邻视频图像中的位置区域具体可以根据在所述S204中确定的位置区域在所述初始视频图像中的像素坐标来确定,具体可以为S204中确定的位置区域的边沿的像素位置坐标来确定。两个位置区域的示意图可以如图3所示。
S206:若比较结果为相似度达到预设的相似度阈值,则推送包括所述相邻视频图像和与所述第一生物特征信息关联的动态提示信息。
若比较结果大于相似度阈值,例如大于85%以上,则可以直接将所述第一生物特征信息作为该相邻视频图像中生物特征,并不需要进行手势识别、动态提示信息查找确认等处理步骤,直接推送包括所述相邻视频图像和与所述第一生物特征信息关联的动态提示信息,以便于后续播放。
S207:若比较结果为相似度没有达到预设的相似度阈值,则将所述相邻视频图像作为初始视频图像进行生物特征识别处理。
若相似度没有达到预设的相似度阈值,具体可以再进一步判断该相邻视频图像对应的位置区域中是否存在或者可能存在生物特征,或者进一步判断整个相邻视频图像是否存在或者可能存在生物特征,若存在或可能存在,则执行所述相邻视频图像作为初始视频图像进行生物特征识别处理,包括执行上述的S201至S203的步骤。若不存在,则继续对后续的视频图像进行处理,以便于在检测到存在或者可能存在生物特征时,将后续视频图像作为初始视频图像进行上述各个步骤的处理。
需要说明的是,相邻视频图像包括一帧或者多帧,针对每一帧相邻视频图像,均执行相同的步骤。
再请参见图4,是本发明实施例的一种基于手势的视频图像处理的流程示意图,该处理流程为一种具体的实例对本发明进行说明。
S2001:搜集若干手势的正负样本,以具有手势的作为正样本集,以只有背景的图片作为负样本集,采用Adaboost分类器进行手势样本集的训练分类,生成xml格式的手势分类器。
S2002:视频第n(n>=0)帧时,调用分类器进行手势识别,判断出是哪一种手势,并记录手势的区域HandRect,计算区域内的像素点灰度值的分布HandA。若未检测到手势,则n=n+1帧,继续步骤S2002。
S2003:根据识别到的手势,查找动态提示信息,触发动态效果,例如动画效果,声音效果等。
S2004:利用帧间的相关性,将接下来的m帧(可根据软件效果和效率设定)的手势假设为HandA,区域假设为Hand Rect,计算区域内像素点灰度值的分布,与第n帧手势区域灰度值的分布进行比较。若满足设定的相似阈值,则判定本帧的手势为第n帧检测的手势。转入步骤S2003。若不满足设定的相似阈值,则n=i(i为n到n+m的某一帧),转入步骤S2002。
本发明实施例能够在视频中针对其中的图像自动加载一些诸如动画、语音等动态提示信息,不需要由用户进行后期的制作处理,节省了包括特效动画的视频的制作时间,满足了用户对视频后期制作的自动化、智能化需求。并且在对其中一帧视频图像进行了动态提示信息的相关处理后,基于该帧中生物特征的位置区域,可以对相邻的一帧或者多帧进行快速的动态提示信息处理,仅进行简单的诸如灰度值比较的处理,不需要进行生物特征识别以及动态提示信息查找的步骤,进一步节省了视频的处理时间,满足了直播视频等对时效的要求。
再请参见图5,是本发明实施例的再一种视频图像的处理方法的流程示意图,本发明实施例的所述方法可以由各类可进行视频处理的终端设备或服务器来执行,特别是一些用于视频直播的终端设备或服务器来执行。具体的,本发明实施例的所述方法可以包括以下步骤。
S301:对初始视频图像进行生物特征识别,得到该初始视频图像的第一生物特征信息。
S302:在预置的动态提示库中获取与所述第一生物特征信息关联的动态提示信息。
S303:推送视频信息,所述视频信息包括所述初始视频图像和与所述第一生物特征信息关联的动态提示信息,以便关联播放所述初始视频图像和与所述第一生物特征信息关联的动态提示信息。
本发明实施例中的所述S301至S303的具体实现可参考图1对应实施例中S101至S103的描述,在此不赘述。在所述S301中确定了初始视频图像中的第一生物特征信息后,可以进一步的根据该第一生物特征信息在该初始视频图像中的位置区域,对该初始视频图像后的下M帧进行处理,即执行本发明实施例的下述步骤,M为正整数。
S304:确定所述识别出的第一生物特征形象在所述视频图像中的位置区域。
对于视频拍摄时得到的前后两帧或多帧(如4、5帧)之间,一般会非常相关,人脸、手势等生物特征多数情况下并不会移动太快,因此,在初始视频图像中确定出了第一生物特征信息后,不用对接下来的几帧视频图像进行全面检测,只需对部分区域内的图像内容进行分析处理即可。
确定出的位置区域的大小可以根据所述第一生物特征的类型及大小进行确定,一般来说,肢体的位置区域会比人脸的位置区域、手势的位置区域大。在所述S304中确定出的区域会大于人脸、手的大小,以便于保证在相邻的视频图像中能够更好地确定生物特征信息是否与第一生物特征信息相同。
S305:根据确定的位置区域,在相邻视频图像中对应位置区域中进行生物特征识别,所述相邻视频图像包括与所述当前采集的视频图像在采集时间上临近的图像。
所说的相邻视频图像中的与所述S304确定的位置区域对应的位置区域是指:该对应位置区域在相邻视频图像中的相对位置与所述S304确定的位置区域在所述初始视频图像中的相对位置相同,在相邻视频图像中的位置区域具体可以根据在所述S304中确定的位置区域在所述初始视频图像中的像素坐标来确定,具体可以为S304中确定的位置区域的边沿的像素位置坐标来确定。两个位置区域的示意图可以如图3所示。
在相邻视频图像中确定了位置区域后,即可仅在该位置区域中进行生物特征识别,相邻视频图像之间内容的一般变化很小,因此一般情况下仅在确定的对应位置区域中即可得到生物特征信息。
S306:若在相邻视频图像中的对应位置区域内识别得到第二生物特征信息,则在预置的动态提示库中获取与所述第二生物特征信息关联的动态提示信息。
需要说明的是,所述第二生物特征信息可以为与所述第一生物特征信息相同或基本相同的生物特征对应信息。当然,第二生物特征信息也可以是完全与所述第一生物特征信息不相同的生物特征对应信息。
基于动态提示库中,生物特征信息与动态提示信息之间的映射关系,可以查找得到所述第二生物特征信息对应的动态提示信息。若没有查找到对应的动态提示信息,则直接结束对本相邻视频图像的处理。
S307:推送包括所述相邻视频图像和所述第二生物特征信息关联的动态提示信息的视频信息。
所述包括所述相邻视频图像和所述第二生物特征信息关联的动态提示信息的视频信息的生成与最终播放的过程,可参考所述第一生物特征信息及其动态提示信息生成与最终播放过程的说明。
S308:当在相邻视频图像中的对应位置区域内没有识别得到生物特征信息时,则进一步检测所述相邻视频图像中是否具有生物特征信息。
S309:若是,则将所述相邻视频图像作为初始视频图像进行生物特征识别处理。
如果整个相邻视频图像中均不包括生物特征信息,则结束对该视频图像的动态提示信息的处理,继续对后续的视频图像进行处理,以便于在检测到存在或者可能存在生物特征时,将后续视频图像作为初始视频图像进行上述各个步骤的处理。作为初始视频图像进行生物特征识别处理包括重新对该图像执行上述S301至S303的步骤。
需要说明的是,相邻视频图像包括一帧或者多帧,针对每一帧相邻视频图像,均执行相同的步骤。
本发明实施例能够在视频中针对其中的图像自动加载一些诸如动画、语音等动态提示信息,不需要由用户进行后期的制作处理,节省了包括特效动画的视频的制作时间,满足了用户对视频后期制作的自动化、智能化需求。并且在对其中一帧视频图像进行了动态提示信息的相关处理后,基于该帧中生物特征的位置区域,可以对相邻的一帧或者多帧进行快速的动态提示信息处理,进一步节省了视频的处理时间,满足了直播视频等对时效的要求。
下面对本发明实施例的频图像的处理装置进行详细描述。
请参见图6,是本发明实施例的一种视频图像的处理装置的结构示意图,本发明实施例的所述装置可以为各类可进行视频处理的终端设备或服务器,特别是一些用于视频直播的终端设备或服务器。具体的,本发明实施例的所述装置包括以下模块。
识别模块1,用于对初始视频图像进行生物特征识别,得到该初始视频图像的第一生物特征信息。
获取模块2,用于在预置的动态提示库中获取与所述第一生物特征信息关联的动态提示信息。
推送模块3,用于推送视频信息,所述视频信息包括所述初始视频图像和与所述第一生物特征信息关联的动态提示信息,以便关联播放所述初始视频图像和与所述第一生物特征信息关联的动态提示信息。
所述生物特征识别包括进行肢体、人脸以及手势识别中的任一种或多种,而所述第一生物特征信息对应地包括肢体特征、人脸特征以及手势特征中的任一种或多种。
在视频直播或者录制的过程中,针对视频的每一帧视频图像,均可以由所述识别模块1执行生物特征识别处理,一旦识别到视频图像中存在或可能存在诸如人物肢体、人脸表情、手势等生物特征时,即可将该视频图像作为初始视频图像,由所述识别模块1进一步地进行生物特征识别,最终得出具体的生物特征信息。而如果不存在生物特征时,则继续对下一张视频图像进行识别处理。
所述获取模块2可以根据预置的动态提示库中生物特征与动态提示信息之间的映射关系,检索查找到与所述第一生物特征管理的动态提示信息。
所述推送模块3可以根据所述初始视频图像和所述第一生物特征信息关联的动态提示信息,并结合在所述初始视频图像之前采集到的相关视频图像,生成视频信息发送给指定的视频服务器,该视频服务器可以为网络直播服务器、卫星电视直播服务器等。
本发明实施例能够在视频中针对其中的图像自动加载一些诸如动画、语音等动态提示信息,不需要由用户进行后期的制作处理,节省了包括特效动画的视频的制作时间,满足了用户对视频后期制作的自动化、智能化需求。
再请参见图7,是本发明实施例的另一种视频图像的处理装置的结构示意图,本发明实施例的所述装置可以为各类可进行视频处理的终端设备或服务器,特别是一些用于视频直播的终端设备或服务器。具体的,本发明实施例的所述装置包括上述的识别模块1、获取模块2以及推送模块3。进一步地,在本发明实施例中还包括以下的模块和单元。
其中具体的,所述装置还包括:第一确定模块4,用于确定所述第一生物特征信息在所述初始视频图像中的位置区域。比较模块5,用于根据确定的位置区域,将所述初始视频图像中在所述确定出的位置区域内的图像信息和相邻视频图像中对应位置区域内的图像信息进行相似度比较,所述相邻视频图像包括:与所述初始视频图像在采集时间上临近的图像。所述推送模块3,还用于在所述比较模块5的比较结果为相似度达到预设的相似度阈值时,则推送包括所述相邻视频图像和与所述第一生物特征信息关联的动态提示信息。
其中具体的,如图8所示,所述比较模块5可以包括:第一获取单元51,用于根据确定的位置区域,获取所述初始视频图像中在所述确定出的位置区域内的各像素点灰度值;第二获取单元52,用于获取相邻视频图像中对应位置区域内的各像素点灰度值;比较单元53,用于将所述第一获取单元51和所述第二获取单元52获取到的灰度值进行灰度值比较,得到灰度值比较结果。
进一步地,本发明实施例的所述装置还可以包括:第一通知模块6,用于在所述比较模块5的比较结果为相似度没有达到预设的相似度阈值时,则将所述相邻视频图像作为初始视频图像,并通知所述识别模块1将所述相邻视频图像作为初始视频图像进行处理。
进一步地,本发明实施例的所述装置还可以包括:第二确定模块7,用于确定所述识别出的生物特征在所述视频图像中的位置区域;所述识别模块1,还用于根据确定的位置区域,在相邻视频图像中对应位置区域中进行生物特征识别,所述相邻视频图像包括与所述当前采集的视频图像在采集时间上临近的图像;所述获取模块2,还用于若在相邻视频图像中的对应位置区域内识别得到第二生物特征信息,则在预置的动态提示库中获取与所述第二生物特征信息关联的动态提示信息;所述推送模块3,还用于推送包括所述相邻视频图像和所述第二生物特征信息关联的动态提示信息的视频信息。
进一步地,本发明实施例中的所述识别模块1,还用于当在相邻视频图像中的对应位置区域内没有识别得到生物特征信息时,则进一步检测所述相邻视频图像中是否具有生物特征信息;所述装置还包括:第二通知模块8,用于在所述识别模块1识别出所述相邻视频图像中具有生物特征信息时,则将所述相邻视频图像作为初始视频图像,并通知所述识别模块1将所述相邻视频图像作为初始视频图像进行处理。
本发明实施例中各个模块和单元的具体实现可参考图1至图5对应的方法实施例中相关步骤的具体描述。本发明实施例所述装置所包括的上述第一确定模块4、通知模块5、第一通知模块6的组合,和第二确定模块7、第二通知模块8的组合可以仅存在其中一种组合,也可以同时存在两种组合,使用时可以基于用户的功能需求在两组组合中进行切换。
本发明实施例能够在视频中针对其中的图像自动加载一些诸如动画、语音等动态提示信息,不需要由用户进行后期的制作处理,节省了包括特效动画的视频的制作时间,满足了用户对视频后期制作的自动化、智能化需求。并且在对其中一帧视频图像进行了动态提示信息的相关处理后,基于该帧中生物特征的位置区域,可以对相邻的一帧或者多帧进行快速的动态提示信息处理,进一步节省了视频的处理时间,满足了直播视频等对时效的要求。
再请参见图9,是本发明实施例的一种视频服务设备的结构示意图,本发明实施例的所述视频服务设备可以为进行视频节目处理的服务器,也可以为一台个人电脑等设备。所述视频服务设备包括外壳、供电模块、计算机通信接口等,本发明实施例中,所述视频服务设备还包括:输入装置100、输出装置200、处理器300以及存储器400,所述输入装置100、输出装置200、处理器300以及存储器400之间可以通过数据总线500相连。所述存储器400中存储有相关的应用程序,所述处理器300通过访问所述存储器400运行相应的应用程序,完成视频处理。
所述输入装置100用于接收并向所述处理器300输入录制到的视频图像。所述输出装置200则在所述处理器300的控制下,向外部设备输出所述处理器300处理后得到的数据。
所述处理器300,通过调用所述存储器400中的应用程序,具体用于对初始视频图像进行生物特征识别,得到该初始视频图像的第一生物特征信息;在预置的动态提示库中获取与所述第一生物特征信息关联的动态提示信息;推送视频信息,所述视频信息包括所述初始视频图像和与所述第一生物特征信息关联的动态提示信息,以便关联播放所述初始视频图像和与所述第一生物特征信息关联的动态提示信息。
进一步可选地,所述处理器300,还用于确定所述第一生物特征信息在所述初始视频图像中的位置区域;根据确定的位置区域,将所述初始视频图像中在所述确定出的位置区域内的图像信息和相邻视频图像中对应位置区域内的图像信息进行相似度比较,所述相邻视频图像包括:与所述初始视频图像在采集时间上临近的图像;若比较结果为相似度达到预设的相似度阈值,则推送包括所述相邻视频图像和与所述第一生物特征信息关联的动态提示信息。
进一步可选地,所述处理器300,在用于根据确定的位置区域,将所述初始视频图像中在所述确定出的位置区域内的图像信息和相邻视频图像中对应位置区域内的图像信息进行相似度比较时,具体用于根据确定的位置区域,获取所述初始视频图像中在所述确定出的位置区域内的各像素点灰度值;获取相邻视频图像中对应位置区域内的各像素点灰度值;将两次获取到的灰度值进行灰度值比较,得到灰度值比较结果。
进一步可选地,所述处理器300,还用于若比较结果为相似度没有达到预设的相似度阈值,则将所述相邻视频图像作为初始视频图像进行处理。
进一步可选地,所述处理器300,还用于确定所述识别出的生物特征在所述视频图像中的位置区域;根据确定的位置区域,在相邻视频图像中对应位置区域中进行生物特征识别,所述相邻视频图像包括与所述当前采集的视频图像在采集时间上临近的图像;若在相邻视频图像中的对应位置区域内识别得到第二生物特征信息,则在预置的动态提示库中获取与所述第二生物特征信息关联的动态提示信息;推送包括所述相邻视频图像和所述第二生物特征信息关联的动态提示信息的视频信息。
进一步可选地,所述处理器300,还用于当在相邻视频图像中的对应位置区域内没有识别得到生物特征信息时,则进一步检测所述相邻视频图像中是否具有生物特征信息;若是,则将所述相邻视频图像作为初始视频图像进行处理。
所述预置的动态提示库中包括一个或者多个分别与不同的生物特征关联的动画信息和/或语音信息。
具体的,本发明实施例中的所述处理器300的具体实现可参考上述方法项实施例中的相应描述。
本发明实施例能够在视频中针对其中的图像自动加载一些诸如动画、语音等动态提示信息,不需要由用户进行后期的制作处理,节省了包括特效动画的视频的制作时间,满足了用户对视频后期制作的自动化、智能化需求。并且在对其中一帧视频图像进行了动态提示信息的相关处理后,基于该帧中生物特征的位置区域,可以对相邻的一帧或者多帧进行快速的动态提示信息处理,进一步节省了视频的处理时间,满足了直播视频等对时效的要求。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (11)

1.一种视频图像的处理方法,其特征在于,包括:
对初始视频图像进行生物特征识别,得到该初始视频图像的第一生物特征信息;
在预置的动态提示库中获取与所述第一生物特征信息关联的动态提示信息;
推送视频信息,所述视频信息包括所述初始视频图像和与所述第一生物特征信息关联的动态提示信息,以便关联播放所述初始视频图像和与所述第一生物特征信息关联的动态提示信息;
确定所述第一生物特征信息在所述初始视频图像中的位置区域;
根据确定的位置区域,将所述初始视频图像中在所述确定出的位置区域内的图像信息和相邻视频图像中对应位置区域内的图像信息进行相似度比较,所述相邻视频图像包括:与所述初始视频图像在采集时间上临近的图像;所述确定出的位置区域的大小是根据所述第一生物特征的类型及大小确定的;所述相邻图像中对应位置区域是根据所述确定的位置区域在所述初始视频图像中的像素坐标确定的;
若比较结果为相似度达到预设的相似度阈值,则推送包括所述相邻视频图像和与所述第一生物特征信息关联的动态提示信息。
2.如权利要求1所述的方法,其特征在于,所述根据确定的位置区域,将所述初始视频图像中在所述确定出的位置区域内的图像信息和相邻视频图像中对应位置区域内的图像信息进行相似度比较,包括:
根据确定的位置区域,获取所述初始视频图像中在所述确定出的位置区域内的各像素点灰度值;
获取相邻视频图像中对应位置区域内的各像素点灰度值;
将两次获取到的灰度值进行灰度值比较,得到灰度值比较结果。
3.如权利要求1所述的方法,其特征在于,还包括:
若比较结果为相似度没有达到预设的相似度阈值,则将所述相邻视频图像作为初始视频图像进行处理。
4.如权利要求1所述的方法,其特征在于,在得到该初始视频图像的第一生物特征信息后,还包括:
确定所述识别出的第一生物特征信息在所述视频图像中的位置区域;
根据确定的位置区域,在相邻视频图像中对应位置区域中进行生物特征识别;
若在相邻视频图像中的对应位置区域内识别得到第二生物特征信息,则在预置的动态提示库中获取与所述第二生物特征信息关联的动态提示信息;
推送包括所述相邻视频图像和所述第二生物特征信息关联的动态提示信息的视频信息。
5.如权利要求4所述的方法,其特征在于,还包括:
当在相邻视频图像中的对应位置区域内没有识别得到生物特征信息时,则进一步检测所述相邻视频图像中是否具有生物特征信息;
若是,则将所述相邻视频图像作为初始视频图像进行处理。
6.如权利要求1-5任一项所述的方法,其特征在于,所述预置的动态提示库中包括一个或者多个分别与不同的生物特征关联的动画信息和/或语音信息。
7.一种视频图像的处理装置,其特征在于,包括:
识别模块,用于对初始视频图像进行生物特征识别,得到该初始视频图像的第一生物特征信息;
获取模块,用于在预置的动态提示库中获取与所述第一生物特征信息关联的动态提示信息;
推送模块,用于推送视频信息,所述视频信息包括所述初始视频图像和与所述第一生物特征信息关联的动态提示信息,以便关联播放所述初始视频图像和与所述第一生物特征信息关联的动态提示信息;
第一确定模块,用于确定所述第一生物特征信息在所述初始视频图像中的位置区域;
比较模块,用于根据确定的位置区域,将所述初始视频图像中在所述确定出的位置区域内的图像信息和相邻视频图像中对应位置区域内的图像信息进行相似度比较,所述相邻视频图像包括:与所述初始视频图像在采集时间上临近的图像;所述确定出的位置区域的大小是根据所述第一生物特征的类型及大小确定的;所述相邻图像中对应位置区域是根据所述确定的位置区域在所述初始视频图像中的像素坐标确定的;
所述推送模块,还用于在所述比较模块的比较结果为相似度达到预设的相似度阈值时,则推送包括所述相邻视频图像和与所述第一生物特征信息关联的动态提示信息。
8.如权利要求7所述的装置,其特征在于,所述比较模块包括:
第一获取单元,用于根据确定的位置区域,获取所述初始视频图像中在所述确定出的位置区域内的各像素点灰度值;
第二获取单元,用于获取相邻视频图像中对应位置区域内的各像素点灰度值;
比较单元,用于将所述第一获取单元和所述第二获取单元获取到的灰度值进行灰度值比较,得到灰度值比较结果。
9.如权利要求7所述的装置,其特征在于,还包括:
第一通知模块,用于在所述比较模块的比较结果为相似度没有达到预设的相似度阈值时,则将所述相邻视频图像作为初始视频图像,并通知所述识别模块将所述相邻视频图像作为初始视频图像进行处理。
10.如权利要求7所述的装置,其特征在于,还包括:
第二确定模块,用于确定所述识别出的生物特征在所述视频图像中的位置区域;
所述识别模块,还用于根据确定的位置区域,在相邻视频图像中对应位置区域中进行生物特征识别;
所述获取模块,还用于若在相邻视频图像中的对应位置区域内识别得到第二生物特征信息,则在预置的动态提示库中获取与所述第二生物特征信息关联的动态提示信息;
所述推送模块,还用于推送包括所述相邻视频图像和所述第二生物特征信息关联的动态提示信息的视频信息。
11.如权利要求10所述的装置,其特征在于,
所述识别模块,还用于当在相邻视频图像中的对应位置区域内没有识别得到生物特征信息时,则进一步检测所述相邻视频图像中是否具有生物特征信息;
所述装置还包括:第二通知模块,用于在所述识别模块识别出所述相邻视频图像中具有生物特征信息时,则将所述相邻视频图像作为初始视频图像,并通知所述识别模块将所述相邻视频图像作为初始视频图像进行处理。
CN201510874223.5A 2015-12-02 2015-12-02 一种视频图像的处理方法及装置 Active CN105451029B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510874223.5A CN105451029B (zh) 2015-12-02 2015-12-02 一种视频图像的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510874223.5A CN105451029B (zh) 2015-12-02 2015-12-02 一种视频图像的处理方法及装置

Publications (2)

Publication Number Publication Date
CN105451029A CN105451029A (zh) 2016-03-30
CN105451029B true CN105451029B (zh) 2019-04-02

Family

ID=55560749

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510874223.5A Active CN105451029B (zh) 2015-12-02 2015-12-02 一种视频图像的处理方法及装置

Country Status (1)

Country Link
CN (1) CN105451029B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106231415A (zh) * 2016-08-18 2016-12-14 北京奇虎科技有限公司 一种在视频直播中互动添加脸部特效的方法及装置
CN107340852A (zh) * 2016-08-19 2017-11-10 北京市商汤科技开发有限公司 手势控制方法、装置和终端设备
CN106454481B (zh) * 2016-09-30 2019-08-23 广州华多网络科技有限公司 一种移动终端直播互动的方法及装置
CN107786549B (zh) * 2017-10-16 2019-10-29 北京旷视科技有限公司 音频文件的添加方法、装置、系统及计算机可读介质
CN107911614B (zh) * 2017-12-25 2019-09-27 腾讯数码(天津)有限公司 一种基于手势的图像拍摄方法、装置和存储介质
CN110879946A (zh) * 2018-09-05 2020-03-13 武汉斗鱼网络科技有限公司 手势结合ar特效的方法、存储介质、设备及系统
CN109492577B (zh) * 2018-11-08 2020-09-18 北京奇艺世纪科技有限公司 一种手势识别方法、装置及电子设备
CN109274983A (zh) * 2018-12-06 2019-01-25 广州酷狗计算机科技有限公司 进行直播的方法和装置
CN111259728A (zh) * 2019-12-20 2020-06-09 中译语通文娱科技(青岛)有限公司 一种视频图像信息标注方法
CN114390341B (zh) * 2020-10-22 2023-06-06 华为技术有限公司 一种视频录制方法、电子设备、存储介质及芯片

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101661556A (zh) * 2009-09-25 2010-03-03 哈尔滨工业大学深圳研究生院 基于视觉的静态手势识别方法
CN102142084A (zh) * 2011-05-06 2011-08-03 北京网尚数字电影院线有限公司 一种手势识别的方法
CN102368290A (zh) * 2011-09-02 2012-03-07 华南理工大学 一种基于手指高级特征的手势识别方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101247482B (zh) * 2007-05-16 2010-06-02 北京思比科微电子技术有限公司 一种实现动态图像处理的方法和装置
US20120069028A1 (en) * 2010-09-20 2012-03-22 Yahoo! Inc. Real-time animations of emoticons using facial recognition during a video chat
CN103297742A (zh) * 2012-02-27 2013-09-11 联想(北京)有限公司 数据处理方法、微处理器、通信终端及服务器
CN103218601B (zh) * 2013-04-03 2016-08-03 华为技术有限公司 检测手势的方法及装置
CN104780339A (zh) * 2015-04-16 2015-07-15 美国掌赢信息科技有限公司 一种即时视频中的表情特效动画加载方法和电子设备
CN104780338A (zh) * 2015-04-16 2015-07-15 美国掌赢信息科技有限公司 一种即时视频中的表情特效动画加载方法和电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101661556A (zh) * 2009-09-25 2010-03-03 哈尔滨工业大学深圳研究生院 基于视觉的静态手势识别方法
CN102142084A (zh) * 2011-05-06 2011-08-03 北京网尚数字电影院线有限公司 一种手势识别的方法
CN102368290A (zh) * 2011-09-02 2012-03-07 华南理工大学 一种基于手指高级特征的手势识别方法

Also Published As

Publication number Publication date
CN105451029A (zh) 2016-03-30

Similar Documents

Publication Publication Date Title
CN105451029B (zh) 一种视频图像的处理方法及装置
CN109145784B (zh) 用于处理视频的方法和装置
CN110166827B (zh) 视频片段的确定方法、装置、存储介质及电子装置
CN109522815B (zh) 一种专注度评估方法、装置及电子设备
CN108198130B (zh) 图像处理方法、装置、存储介质及电子设备
CN111191067A (zh) 绘本识别方法、终端设备及计算机可读存储介质
CN113395542B (zh) 基于人工智能的视频生成方法、装置、计算机设备及介质
CN107786549A (zh) 音频文件的添加方法、装置、系统及计算机可读介质
CN111241340A (zh) 视频标签确定方法、装置、终端及存储介质
CN112381104A (zh) 一种图像识别方法、装置、计算机设备及存储介质
CN115396705B (zh) 投屏操作验证方法、平台及系统
CN113160231A (zh) 一种样本生成方法、样本生成装置及电子设备
CN113407436A (zh) 播放组件兼容性检测方法、装置、计算机设备和存储介质
CN101924847B (zh) 多媒体播放装置及其播放方法
CN113627402B (zh) 一种图像识别方法及相关装置
CN111144156B (zh) 一种图像数据处理方法和相关装置
CN111666820A (zh) 一种讲话状态识别方法、装置、存储介质及终端
CN111773658B (zh) 一种基于计算机视觉库的游戏交互方法及装置
CN111860057A (zh) 人脸图像模糊和活体检测方法、装置、存储介质及设备
CN112837350A (zh) 目标运动对象识别方法、装置、电子设备及存储介质
CN111539390A (zh) 一种基于Yolov3的小目标图像识别方法、设备和系统
CN111768729A (zh) 一种vr场景自动解说方法、系统和存储介质
CN113591865B (zh) 一种回环检测方法、装置以及电子设备
TWI776429B (zh) 動作識別方法及裝置、電腦可讀存儲介質
CN108898169A (zh) 图片处理方法、图片处理装置及终端设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210112

Address after: 511442 3108, 79 Wanbo 2nd Road, Nancun Town, Panyu District, Guangzhou City, Guangdong Province

Patentee after: GUANGZHOU CUBESILI INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 511442 24 floors, B-1 Building, Wanda Commercial Square North District, Wanbo Business District, 79 Wanbo Second Road, Nancun Town, Panyu District, Guangzhou City, Guangdong Province

Patentee before: GUANGZHOU HUADUO NETWORK TECHNOLOGY Co.,Ltd.