CN109618173B - 视频压缩方法、装置和计算机可读存储介质 - Google Patents

视频压缩方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN109618173B
CN109618173B CN201811546877.5A CN201811546877A CN109618173B CN 109618173 B CN109618173 B CN 109618173B CN 201811546877 A CN201811546877 A CN 201811546877A CN 109618173 B CN109618173 B CN 109618173B
Authority
CN
China
Prior art keywords
image
frame
fuzzy
processing
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811546877.5A
Other languages
English (en)
Other versions
CN109618173A (zh
Inventor
谢仁礼
何林俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen TCL New Technology Co Ltd
Original Assignee
Shenzhen TCL New Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen TCL New Technology Co Ltd filed Critical Shenzhen TCL New Technology Co Ltd
Priority to CN201811546877.5A priority Critical patent/CN109618173B/zh
Publication of CN109618173A publication Critical patent/CN109618173A/zh
Priority to PCT/CN2019/126016 priority patent/WO2020125631A1/zh
Application granted granted Critical
Publication of CN109618173B publication Critical patent/CN109618173B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种视频压缩方法。该方法包括:获取视频图像;对所述视频图像中每帧图像进行肤色分析,得到所述每帧图像中的人脸图像和背景图像;对所述背景图像进行高斯模糊处理得到模糊的背景图像;对所述模糊的背景图像进行压缩处理。本发明还公开了一种视频压缩装置及计算机可读存储介质。本发明能够实现在视频聊天过程中即能保证视频过程中人脸信息的清晰度,又能降低视频的带宽。

Description

视频压缩方法、装置和计算机可读存储介质
技术领域
本发明涉及视频处理领域,尤其涉及一种视频压缩方法、装置和计算机可读存储介质。
背景技术
随着经济和互联网的发展,人们之间的交流方式已在渐渐发生变化,视频聊天逐渐取代普通语言文字,成为人们工作或日常生活中交流和交流的重要方式。
视频聊天过程中的视频信息是由一帧帧图像组成的,但现在的视频图像中包含了大量的冗余信息,在视频数字化传送过程中占用了大量的带宽,影响了运行的成本和视频的流畅度。但为了减少运行成本和提高视频流畅度,出现了很多压缩方法,如JPEG和MPEG方法等。
然而目前的压缩方法会将每帧图像中所有内容进行压缩,从而导致视频中人脸的清晰度降低,无法满足人们视频聊天过程中对人脸清晰度的要求。
发明内容
本发明的主要目的在于提供一种视频压缩方法、装置和计算机可读存储介质,旨在实现在视频聊天中将人脸所在区域识别出来,并将人脸所在区域以外的部分做模糊压缩处理,即能降低整个过程的带宽成本,又能保证视频中人脸信息的清晰度和流畅度。
为实现上述目的,本发明提供一种视频压缩方法,所述视频压缩方法包括以下步骤:
获取视频图像;
对所述视频图像中每帧图像进行肤色分析,得到所述每帧图像中的人脸图像和背景图像;
对所述背景图像进行高斯模糊处理得到模糊的背景图像;
对所述模糊的背景图像进行压缩处理。
可选地,所述对所述视频图像中每帧图像进行肤色分析,得到所述每帧图像中的人脸图像和背景图像的步骤包括:
将所述每帧图像投射到预设的色彩空间,得到所述每帧图像中像素点的亮度与色度;
根据所述每帧图像中像素点的亮度与色度利用第一预设算法对所述每帧图像进行亮度补偿,得到每帧图像中补偿后的像素点的色度;
将所述每帧图像中补偿后的像素点的色度与预设的肤色色度高斯模型进行对比,得到每帧图像中像素点的肤色概率图;
根据所述每帧图像中像素点的肤色概率图利用自适应阈值确定每帧图像的肤色区域;
对所述每帧图像的肤色区域进行形态学处理得到每帧图像中的人脸图像和背景图像。
可选地,所述对所述每帧图像进行高斯模糊处理得到模糊的背景图像的步骤包括:
对所述每帧图像进行高斯模糊处理得到渐进模糊的背景图像。
可选地,所述对所述每帧图像进行高斯模糊处理得到渐进模糊的背景图像的步骤包括:
对背景图像进行高斯滤波处理,得到过渡区域和模糊区域;
根据第二预设算法确定所述模糊区域的模糊处理中心点;
根据所述模糊处理中心点,计算出所述模糊区域中各像素点与所述模糊处理中心点的距离;
根据所述模糊区域中各像素点与所述模糊处理中心点的距离计算出模糊区域各像素点进行高斯模糊处理的可变半径;
根据所述高斯模糊处理的可变半径对所述模糊区域各像素点进行高斯模糊处理,得到渐进模糊的模糊区域。
可选地,所述过渡区域位于所述人脸图像和所述模糊区域之间。
可选地,所述模糊区域中各像素点与所述模糊处理中心点的距离越大,计算的高斯模糊处理的可变半径越大,进行高斯处理后的图像越模糊;所述模糊区域中各像素点与所述模糊处理中心点的距离越小,计算的高斯模糊处理的可变半径越小,进行高斯处理后的图像越清晰。
可选地,所述第二预设算法为:
Figure 92582DEST_PATH_IMAGE001
其中,x为像素点的横坐标,y为像素点的纵坐标,target为目标函数,background为背景函数,x0为模糊处理中心点的横坐标,y0为模糊处理中心点的纵坐标。
此外,为实现上述目的,本发明还提供一种视频压缩装置,所述视频压缩装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的视频压缩程序,所述视频压缩程序被所述处理器执行时实现以下步骤:
获取视频图像;
对所述视频图像中每帧图像进行肤色分析,得到所述每帧图像中的人脸图像和背景图像;
对所述背景图像进行高斯模糊处理得到模糊的背景图像;
对所述模糊的背景图像进行压缩处理。
可选地,所述对所述视频图像中每帧图像进行肤色分析,得到所述每帧图像中的人脸图像和背景图像的步骤包括:
将所述每帧图像投射到预设的色彩空间,得到所述每帧图像中像素点的亮度与色度;
根据所述每帧图像中像素点的亮度与色度利用第一预设算法对所述每帧图像进行亮度补偿,得到每帧图像中补偿后的像素点的色度;
将所述每帧图像中补偿后的像素点的色度与预设的肤色色度高斯模型进行对比,得到每帧图像中像素点的肤色概率图;
根据所述每帧图像中像素点的肤色概率图利用自适应阈值确定每帧图像的肤色区域;
对所述每帧图像的肤色区域进行形态学处理得到每帧图像中的人脸图像和背景图像。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有视频压缩程序,所述视频压缩程序被处理器执行时实现上述的视频压缩方法的步骤。
本发明通过获取视频图像,根据对所述视频图像中每帧图像进行肤色分析,得到所述每帧图像中的人脸图像和背景图像;对所述背景图像进行高斯模糊处理得到模糊的背景图像;对所述模糊的背景图像进行压缩处理。通过上述方式,本发明在获取视频图像时,能够根据肤色确定出图像中人脸区域,并对人脸区域以外的部分进行模糊压缩处理,这样在视频传输的过程中既能保证视频过程中用户最关注的部分:人脸区域的清晰,又将不是很重要的部分:背景图像进行模糊处理。相对于现有技术中将每帧图像中所有内容进行压缩的方式,本发明中,分割出来的未进行处理的人脸图像能够满足人们视频聊天过程中对人脸清晰度的要求;同时,相对清晰的背景图像,所需带宽较小,能够降低整个系统的带宽成本。
附图说明
图1为本发明实施例方案涉及的视频压缩终端结构示意图;
图2为本发明视频压缩方法第一实施例的流程示意图;
图3为本发明实施例中对所述视频图像中每帧图像进行肤色分析,得到所述每帧图像中的人脸图像和背景图像的一细化流程示意图;
图4为本发明实施例中对所述每帧图像进行高斯模糊处理得到模糊的背景图像的一细化流程示意图;
图5为本发明视频压缩方法实施例中渐进模糊方式示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
由于在现有技术中,常用的视频压缩算法是直接对视频画面整体进行压缩,在降低视频传输成本的同时,却也影响了视频中人脸的清晰度。
为了解决上述技术问题,本发明提供一种视频压缩方法,通过获取视频图像,根据对所述视频图像中每帧图像进行肤色分析,得到所述每帧图像中的人脸图像和背景图像;对所述背景图像进行高斯模糊处理得到模糊的背景图像;对所述模糊的背景图像进行压缩处理。本发明能够实现在视频聊天过程中识别出图像中人脸所在区域,并且将人脸以外的区域作模糊压缩处理,从而保证在视频聊天过程中人脸信息清晰度的同时也降低了视频带宽成本。
请参阅图1,图1为本发明实施例方案涉及的视频压缩终端结构示意图。
本发明实施例终端可以是PC,也可以是智能手机、平板电脑、录像机、便携计算机等可具有视频压缩功能的终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005,摄像头1006,存储在所述存储器上并可在所述处理器上运行的视频压缩程序。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括麦克风、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。当然,终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及视频压缩程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001主要用于执行存储器1005中存储的视频压缩程序,以实现以下步骤:
获取视频图像;
对所述视频图像中每帧图像进行肤色分析,得到所述每帧图像中的人脸图像和背景图像;
对所述背景图像进行高斯模糊处理得到模糊的背景图像;
对所述模糊的背景图像进行压缩处理。
进一步地,所述处理器1002主要用于执行存储器1001中存储的视频压缩程序,以实现以下步骤:
将所述每帧图像投射到预设的色彩空间,得到所述每帧图像中像素点的亮度与色度;
根据所述每帧图像中像素点的亮度与色度利用第一预设算法对所述每帧图像进行亮度补偿,得到每帧图像中补偿后的像素点的色度;
将所述每帧图像中补偿后的像素点的色度与预设的肤色色度高斯模型进行对比,得到每帧图像中像素点的肤色概率图;
根据所述每帧图像中像素点的肤色概率图利用自适应阈值确定每帧图像的肤色区域;
对所述每帧图像的肤色区域进行形态学处理得到每帧图像中的人脸图像和背景图像。
进一步地,所述处理器1002主要用于执行存储器1001中存储的视频压缩程序,以实现以下步骤:
对所述每帧图像进行高斯模糊处理得到渐进模糊的背景图像。
进一步地,所述处理器1002主要用于执行存储器1001中存储的视频压缩程序,以实现以下步骤:
对背景图像进行高斯滤波处理,得到过渡区域和模糊区域;
根据第二预设算法确定所述模糊区域的模糊处理中心点;
根据所述模糊处理中心点,计算出所述模糊区域中各像素点与所述模糊处理中心点的距离;
根据所述模糊区域中各像素点与所述模糊处理中心点的距离计算出模糊区域各像素点进行高斯模糊处理的可变半径;
根据所述高斯模糊处理的可变半径对所述模糊区域各像素点进行高斯模糊处理,得到渐进模糊的模糊区域。
进一步地,所述处理器1002主要用于执行存储器1001中存储的视频压缩程序,以实现以下步骤:
所述过渡区域位于所述人脸图像和所述模糊区域之间。
进一步地,所述处理器1002主要用于执行存储器1001中存储的视频压缩程序,以实现以下步骤:
所述模糊区域中各像素点与所述模糊处理中心点的距离越大,计算的高斯模糊处理的可变半径越大,进行高斯处理后的图像越模糊;所述模糊区域中各像素点与所述模糊处理中心点的距离越小,计算的高斯模糊处理的可变半径越小,进行高斯处理后的图像越清晰。
进一步地,所述处理器1002主要用于执行存储器1001中存储的视频压缩程序,以实现以下步骤:
所述第二预设算法为:
Figure 934636DEST_PATH_IMAGE002
其中,x为像素点的横坐标,y为像素点的纵坐标,target为目标函数,background为背景函数,x0为模糊处理中心点的横坐标,y0为模糊处理中心点的纵坐标。
本发明视频压缩设备的具体实施例与下述视频压缩方法各实施例基本相同,在此不作赘述。
请参阅图2,图2为本发明视频压缩方法第一实施例的流程示意图。
在本发明实施例中,该视频压缩方法包括:
步骤S100,获取视频图像;
在本发明实施例中,该视频压缩方法主要是通过在视频聊天过程中识别出图像中人脸所在区域,并且将人脸以外的区域作模糊压缩处理,从而保证在视频聊天过程中人脸信息清晰度的同时也降低了视频带宽成本。该视频压缩方法可以通过终端或者服务器等具有图像处理功能的设备来完成。具体的,具有图像处理功能的设备可以是PC,与终端相连的服务器,也可以是智能手机、平板电脑、录像机、便携计算机等可移动式终端设备。本实施例以移动终端为例进行说明。本发明可以应用于录像场景,也可以应用于通过聊天软件进行视频会话的场景,比如应用于微信或QQ中视频通话等。
本发明实施例通过摄像头采集视频图像,其中,摄像头可以为所述移动终端的摄像头,例如手机摄像头、电脑摄像头。
步骤S200,对所述视频图像中每帧图像进行肤色分析,得到所述每帧图像中的人脸图像和背景图像;
本发明主要通过肤色识别来进行人脸识别,肤色是人脸信息中的重要信息,通过肤色识别,能加快人脸识别的识别过程,是较为快速简洁的进行人脸识别的方法。
具体地,对所述视频图像中每帧图像进行肤色分析,主要是利用了肤色在特定的色彩空间具有聚类性的特点,即肤色在一定的色彩空间内,不同年龄、种族和性别的人的肤色的色度稳定分布在一定的范围内,该范围能用相关分布模型来描述。常用的分布模型有区域模型,高斯模型,直方图模型等。在本实施例中,对每帧图像进行肤色分析是先将在即时通信软件视频聊天中获取的每帧图像投射到色彩空间,得到每帧图像中像素点的亮度与色度,然后对每帧图像像素点进行亮度补偿,以消除不同年龄、种族和性别的人肤色在亮度上的区别,再将补偿后的每帧图像像素点的色度与大量肤色样本构建的肤色色度模型进行对比,确定出每帧图像的肤色区域,在对肤色区域进行分割处理,得到每帧图像的人脸图像和背景图像。通过这样肤色识别的方法,就能将每幅图像的人脸图像和背景图像分别开来。在本发明实施例中,对肤色区域进行分割的方法可以是阈值法,边界探测法,匹配法等。
步骤S300,对所述背景图像进行高斯模糊处理得到模糊的背景图像;
在本实施例中,采用的是高斯模糊处理方式,高斯模糊是图像处理中广泛实用的技术,是一种数据平滑技术,适用于多个场合。高斯模糊计算处理过程与现有技术中相同,此处不做多余赘述。简单来说就是对步骤S200中的背景图像的某个像素点的像素取周围像素点像素的平均值,这样就使该像素点失去细节,达到使该像素点平滑的效果,从而使图像变得模糊。在模糊过程中,选取的周围像素点的范围越大,模糊效果越强烈。
需要说明的是,在对步骤S200中的背景图像进行高斯模糊处理,得到渐进模糊的背景图像的过程中,此渐进模糊效果可以是从靠近人脸图像的模糊区域开始,到远离人脸图像的模糊区域逐渐模糊,即靠近人脸图像的区域较清晰,远离人脸图像的区域较模糊;也可以是,从远离人脸图像的模糊区域开始,到靠近人脸图像的模糊区域逐渐模糊,即靠近人脸图像的区域较模糊,远离人脸图像的区域较清晰;也可以是从模糊区域的中间的区域开始,向两边即靠近人脸区域和远离人脸区域逐渐模糊,即背景图像的中间区域较清晰,靠近人脸区域和远离人脸区域较模糊。
步骤S400,对所述模糊的背景图像进行压缩处理。
具体地,本实施例中,是将每帧图像分为人脸图像和背景图像两幅图像,并对背景图像进行高斯模糊后,再进行压缩,这样就将每帧图像分为了两幅图像人脸图像和背景图像进行传输,并且背景图像在进行模糊压缩后占用的带宽较小。另一边,接收方客户端在接收到两幅图像后,对压缩的背景图像进行解压得到模糊的背景图像,在与人脸图像合并成一副图像。这样,这个过程就实现了本发明要实现的功能,有效地降低带宽成本,同时保证视频聊天中人脸信息的清晰。
本发明通过获取视频图像,根据对所述视频图像中每帧图像进行肤色分析,得到所述每帧图像中的人脸图像和背景图像;对所述背景图像进行高斯模糊处理得到模糊的背景图像;对所述模糊的背景图像进行压缩处理。通过上述方式,本发明在获取视频图像时,能够根据肤色确定出图像中人脸区域,并对人脸区域以外的部分进行模糊压缩处理,这样在视频传输的过程中既能保证视频过程中用户最关注的部分:人脸区域的清晰,又将不是很重要的部分:背景图像进行模糊处理。相对于现有技术中将每帧图像中所有内容进行压缩的方式,本发明中,分割出来的未进行处理的人脸图像能够满足人们视频聊天过程中对人脸清晰度的要求;同时,相对清晰的背景图像,所需带宽较小,能够降低整个系统的带宽成本。
请参阅图3,图3为本发明实施例中对所述视频图像中每帧图像进行肤色分析,得到所述每帧图像中的人脸图像和背景图像的一细化流程示意图。
基于图2所示的实施例,本实施中,步骤S200包括:
步骤S201,将所述每帧图像投射到预设的色彩空间,得到所述每帧图像中像素点的亮度与色度;
将所述每帧图像投射到预设的色彩空间,预设的色彩空间有:YCrCb色彩空间,RGB色彩空间,HSI色彩空间,YIQ色彩空间等。具体的,本实施例以投射到YCrCb色彩空间为例进行说明。YCbCr色彩空间将色彩表示为三个分景,即亮度Y,蓝色色度Cb和红色色度Cr。这样,将每帧图像投射到YCbCr色彩空间中,就可以得到每帧图像像素点的亮度Y与色度CrCb两种信息。
步骤S202,根据所述每帧图像中像素点的亮度与色度利用第一预设算法对所述每帧图像进行亮度补偿,得到每帧图像中补偿后的像素点的色度;
在色彩空间中,不同年龄、种族和性别的人的肤色区别主要在亮度上,而在色度上的区别较小。即不同肤色在亮度上差异很大,而在色度上较为接近。通过对每帧图像像素点的亮度进行补偿,就能消除不同年龄、种族和性别的人肤色上的影响,从而提高图像肤色的检测率。
实际处理过程中对每帧图像进行亮度补偿,进行亮度补偿方法有很多,本实施例以参考白算法为例进行说明,具体地,通过参考白算法对每帧图像进行亮度补偿,即将步骤S201中每帧图像像素点的亮度Y与色度CrCb用参考白算法进行计算补偿后,消除在YCbCr色彩空间中像素点亮度Y的影响,得到该视频图像像素点的CbCr色度。步骤参考白算法是常用的亮度补偿算法,亮度补偿过程与现有技术中相同,此处不做多余赘述。
步骤S203,将所述每帧图像中补偿后的像素点的色度与预设的肤色色度高斯模型进行对比,得到每帧图像中像素点的肤色概率图;
由于不同年龄、种族和性别的人的肤色在亮度上相差很大,而在色度上比较接近,并且在色度上的分布满足二维独立分布,分布区域比较集中,所以除去亮度影响后,肤色在色度上的分布范围能建立肤色模型来描述,常用的肤色模型有区域模型,高斯模型,直方图模型等。本实施例是采用高斯模型来描述不同肤色在色度上的分布范围的。具体地,在CbCr空间下,选取大量的肤色样本进行统计,得到各个肤色在色度上的分布范围,然后用高斯模型来进行计算描述,所述高斯模型就是本发明实施例中所预设的肤色色度高斯模型。具体地,将所述每帧图像中补偿后的像素点的色度与预设的肤色色度高斯模型进行对比,得到每帧图像中像素点的肤色概率图,是将步骤S202中像素点的CbCr色度值与所述的预设的肤色色度高斯模型进行比较,即将每个像素点在YCrCb色度空间的色度与所述的预设的肤色色度高斯模型分布中心的远近得到与肤色的相似度,进而得到该点是肤色的概率。像素点在YCrCb色度空间的色度与所述的预设的肤色色度高斯模型分布中心的越近,则该像素点是肤色的概率越大,像素点在YCrCb色度空间的色度与所述的预设的肤色色度高斯模型分布中心的越远,则该像素点是肤色的概率越小,像素点在YCrCb色度空间的色度不在所述的预设的肤色色度高斯模型分布范围内,则该像素点是肤色的概率为0。这样,通过将所有补偿后的像素点的色度与预设的肤色色度高斯模型进行对比,就能得到整幅图像的肤色概率图。
步骤S204,根据所述每帧图像中像素点的肤色概率图利用自适应阈值确定每帧图像的肤色区域;
得到每帧图像的肤色概率图后,需要对整幅图像进行分割,进而确定每帧图像分为肤色区域和背景区域。常用的分割方法有阈值法,边界探测法,匹配法等。本实施例采用自适应阈值的方法来进行分割。具体就是将每帧图像中像素点的肤色概率图与预设的自适应阈值进行比较,该像素点的肤色概率大于所设的自适应阈值,则该像素点为肤色区域,该像素点的肤色概率小于所设的自适应阈值,则该像素点为非肤色区域。这样利用自适应阈值就能确定出每帧图像的肤色区域和非肤色区域。
自适应阈值分割方法为图像分割较为常见的分割方法,自适应阈值分割方法计算较为简单,受其他因素影响较小。
步骤S205,对所述每帧图像的肤色区域进行形态学处理得到每帧图像中的人脸图像和背景图像。
在实际处理过程中可能会出现进行分割的每帧图像的肤色区域不是一个连贯的整体,较为分散,甚至是多个不相连的图像区域构成的情况,此时需要利用形态学处理来改善分割效果。具体地,是通过步骤S204确定出每帧图像的肤色区域后,用形态学处理相关算法对分割的肤色区域进行处理,使肤色区域边界较为平滑,分散的肤色区域完整连接为一个整体,这样连为整体的肤色区域为人脸图像,另一区域为背景图像。这样整帧图像就分为了人脸图像和背景图像两部分。
形态学处理方法是常用的图像处理方法,图像处理过程与现有技术中相同,此处不做多余赘述。
请参阅图4,图4为本发明实施例中对所述每帧图像进行高斯模糊处理得到模糊的背景图像的一细化流程示意图。
基于图2所示的实施例,本实施中,步骤S300还包括:
步骤S301,对背景图像进行高斯滤波处理,得到过渡区域和模糊区域;
在本发明实施例中,模糊处理采用渐进模糊处理方式,将每帧图像分为3个区域,即清晰区域,过渡区域,模糊区域,所述过渡区域位于清晰区域和模糊区域之间。例如,参照图5,图5为本发明视频压缩方法实施例中渐进模糊方式示意图,将聊天视频中的每帧图像的人脸图像与背景图像进行切割分离,并将背景图像进行高斯滤波处理,分离后的人脸图像就是我们的清晰区域a,经高斯滤波处理后的背景图像分为过渡区域b和模糊区域c。
高斯滤波处理为图像处理常用方法,与现有技术中相同,此处不做多余赘述。
步骤S302,根据第二预设算法确定所述模糊区域的模糊处理中心点;
在本发明实施例中,所述第二预设算法为:
Figure 329846DEST_PATH_IMAGE003
其中,x为像素点的横坐标,y为像素点的纵坐标,target为目标函数,background为背景函数,x0为模糊处理中心点的横坐标,y0为模糊处理中心点的纵坐标。
需要说明的是,根据第二预设算法确定所述模糊区域的模糊处理中心点,模糊处理中心点位于清晰区域。
具体地,在本实施例中,通过上述公式计算出模糊区域c的模糊处理中心点的位置坐标,进而得到模糊处理中心点的位置,模糊处理中心点位于清晰区域a中。
步骤S303,根据所述模糊处理中心点,计算出所述模糊区域中各像素点与所述模糊处理中心点的距离;
通过对上述模糊处理中心点的位置坐标与模糊区域c中各个像素点的位置坐标进行计算,就能得到模糊区域c中各像素点与模糊处理中心点的距离大小。
步骤S304,根据所述模糊区域中各像素点与所述模糊处理中心点的距离计算出模糊区域各像素点进行高斯模糊处理的可变半径;
具体地,得到模糊区域c中各像素点与模糊处理中心点的距离的大小后,将模糊区域c中各像素点与模糊处理中心点的距离的大小进行相关计算,得到高斯模糊处理的可变半径。模糊区域c中各像素点与模糊处理中心点的距离越大,高斯模糊处理的可变半径就越大,模糊区域c中各像素点与模糊处理中心点的距离越小,高斯模糊处理的可变半径就越小。
高斯模糊处理可变半径的计算方法与现有技术中相同,此处不做多余赘述。
步骤S305,根据所述高斯模糊处理的可变半径对所述模糊区域各像素点进行高斯模糊处理,得到渐进模糊的模糊区域。
需要说明的是,在本实施例中,高斯模糊处理的可变半径越大,进行高斯模糊处理后图像模糊处理效果就越模糊;相反,高斯模糊处理的可变半径越小,进行高斯模糊处理后图像模糊处理效果就越清晰,即离模糊处理中心点近的像素点较清晰,离模糊处理中心点远的像素点较模糊。
具体为,在得到模糊区域c中各像素点高斯模糊处理的可变半径后,根据高斯模糊处理的可变半径的大小,对模糊区域c中各像素点进行高斯模糊。模糊区域c中各像素点高斯模糊处理的可变半径越大,高斯模糊越模糊,模糊区域c中各像素点高斯模糊处理的可变半径越小,高斯模糊越清晰。即在模糊区域c中,离清晰区域a越近的地方,图像模糊效果越清晰,离清晰区域a越远的地方,图像模糊效果越模糊,这样就形成了从清晰区域到模糊区域逐渐渐进模糊的效果。然后,将有渐进模糊效果的模糊区域c与过渡区域b一起进行压缩,就能在传输过程中降低视频聊天的带宽,同时又能保证未被模糊压缩处理的人脸信息的清晰度。
在本实施例中,通过设置过渡区域b的方式,能使清晰区域到模糊区域的模糊过程有个比较自然的过渡,使视频聊天过程中处理后的图像不会显得太突兀,提高背景虚化效果。
在本发明实施例中,将所述每帧图像中的人脸图像与背景图像进行分离,得到人脸图像和背景图像,并对背景图像进行高斯滤波处理,得到过渡区域和模糊区域;根据第二预设算法确定所述模糊区域的模糊处理中心点;根据所述模糊处理中心点,计算出所述模糊区域中各像素点与所述模糊处理中心点的距离;根据所述模糊区域中各像素点与所述模糊处理中心点的距离计算出模糊区域各像素点进行高斯模糊处理的可变半径;根据所述高斯模糊处理的可变半径对所述模糊区域各像素点进行高斯模糊处理,得到渐进模糊的模糊区域。通过这样的方式,将图像分为两个人脸图像部分和背景图像部分,其中,对背景图像进行模糊和压缩,能降低整帧图像在传输过程中的带宽,又能保证未被模糊压缩处理的人脸图像的清晰度。从清晰区域到模糊区域渐进模糊处理的方式又能使模糊效果比较自然,过渡比较连贯。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有视频压缩程序,所述视频压缩程序被处理器执行时实现如上所述的视频压缩方法的步骤。
本发明计算机可读存储介质的具体实施例与上述视频压缩方法各实施例基本相同,在此不作赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围。

Claims (8)

1.一种视频压缩方法,其特征在于,所述视频压缩方法包括以下步骤:
获取视频图像;
对所述视频图像中每帧图像进行肤色分析,得到所述每帧图像中的人脸图像和背景图像;
对所述每帧图像进行高斯模糊处理得到模糊的背景图像;
对所述模糊的背景图像进行压缩处理;
其中,所述对所述每帧图像进行高斯模糊处理得到渐进模糊的背景图像的步骤包括:
对背景图像进行高斯滤波处理,得到过渡区域和模糊区域;
根据第二预设算法确定所述模糊区域的模糊处理中心点;
根据所述模糊处理中心点,计算出所述模糊区域中各像素点与所述模糊处理中心点的距离;
根据所述模糊区域中各像素点与所述模糊处理中心点的距离计算出模糊区域各像素点进行高斯模糊处理的可变半径,距离和可变半径呈正相关;
根据所述高斯模糊处理的可变半径对所述模糊区域各像素点进行高斯模糊处理,得到渐进模糊的模糊区域。
2.如权利要求1所述的视频压缩方法,其特征在于,所述对所述视频图像中每帧图像进行肤色分析,得到所述每帧图像中的人脸图像和背景图像的步骤包括:
将所述每帧图像投射到预设的色彩空间,得到所述每帧图像中像素点的亮度与色度;
根据所述每帧图像中像素点的亮度与色度利用第一预设算法对所述每帧图像进行亮度补偿,得到每帧图像中补偿后的像素点的色度;
将所述每帧图像中补偿后的像素点的色度与预设的肤色色度高斯模型进行对比,得到每帧图像中像素点的肤色概率图;
根据所述每帧图像中像素点的肤色概率图利用自适应阈值确定每帧图像的肤色区域;
对所述每帧图像的肤色区域进行形态学处理得到每帧图像中的人脸图像和背景图像。
3.如权利要求1所述的视频压缩方法,其特征在于,所述过渡区域位于所述人脸图像和所述模糊区域之间。
4.如权利要求1所述的视频压缩方法,其特征在于,所述模糊区域中各像素点与所述模糊处理中心点的距离越大,计算的高斯模糊处理的可变半径越大,进行高斯处理后的图像越模糊;所述模糊区域中各像素点与所述模糊处理中心点的距离越小,计算的高斯模糊处理的可变半径越小,进行高斯处理后的图像越清晰。
5.如权利要求1所述的视频压缩方法,其特征在于,所述第二预设算法为:
Figure 911430DEST_PATH_IMAGE001
其中,x为像素点的横坐标,y为像素点的纵坐标,target为目标函数,background为背景函数,x0为模糊处理中心点的横坐标,y0为模糊处理中心点的纵坐标。
6.一种视频压缩装置,其特征在于,所述视频压缩装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的视频压缩程序,所述视频压缩程序被处理器执行时实现如下步骤:
获取视频图像;
对所述视频图像中每帧图像进行肤色分析,得到所述每帧图像中的人脸图像和背景图像;
对所述每帧图像进行高斯模糊处理得到模糊的背景图像;
对所述模糊的背景图像进行压缩处理;
其中,所述对所述每帧图像进行高斯模糊处理得到渐进模糊的背景图像的步骤包括:
对背景图像进行高斯滤波处理,得到过渡区域和模糊区域;
根据第二预设算法确定所述模糊区域的模糊处理中心点;
根据所述模糊处理中心点,计算出所述模糊区域中各像素点与所述模糊处理中心点的距离;
根据所述模糊区域中各像素点与所述模糊处理中心点的距离计算出模糊区域各像素点进行高斯模糊处理的可变半径,距离和可变半径呈正相关;
根据所述高斯模糊处理的可变半径对所述模糊区域各像素点进行高斯模糊处理,得到渐进模糊的模糊区域。
7.如权利要求6所述的视频压缩装置,其特征在于,所述视频压缩程序被处理器执行时还实现如下步骤:
将所述每帧图像投射到预设的色彩空间,得到所述每帧图像中像素点的亮度与色度;
根据所述每帧图像中像素点的亮度与色度利用第一预设算法对所述每帧图像进行亮度补偿,得到每帧图像中补偿后的像素点的色度;
将所述每帧图像中补偿后的像素点的色度与预设的肤色色度高斯模型进行对比,得到每帧图像中像素点的肤色概率图;
根据所述每帧图像中像素点的肤色概率图利用自适应阈值确定每帧图像的肤色区域;
对所述每帧图像的肤色区域进行形态学处理得到每帧图像中的人脸图像和背景图像。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有视频压缩程序,所述视频压缩程序被处理器执行时实现如权利要求1至5中任一项所述视频压缩方法的步骤。
CN201811546877.5A 2018-12-17 2018-12-17 视频压缩方法、装置和计算机可读存储介质 Active CN109618173B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811546877.5A CN109618173B (zh) 2018-12-17 2018-12-17 视频压缩方法、装置和计算机可读存储介质
PCT/CN2019/126016 WO2020125631A1 (zh) 2018-12-17 2019-12-17 视频压缩方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811546877.5A CN109618173B (zh) 2018-12-17 2018-12-17 视频压缩方法、装置和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109618173A CN109618173A (zh) 2019-04-12
CN109618173B true CN109618173B (zh) 2021-09-28

Family

ID=66010246

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811546877.5A Active CN109618173B (zh) 2018-12-17 2018-12-17 视频压缩方法、装置和计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN109618173B (zh)
WO (1) WO2020125631A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109618173B (zh) * 2018-12-17 2021-09-28 深圳Tcl新技术有限公司 视频压缩方法、装置和计算机可读存储介质
CN110059642B (zh) * 2019-04-23 2020-07-31 北京海益同展信息科技有限公司 人脸图像筛选方法与装置
CN112313700A (zh) * 2019-11-26 2021-02-02 深圳市大疆创新科技有限公司 图像处理方法和装置
CN112334942A (zh) * 2019-11-26 2021-02-05 深圳市大疆创新科技有限公司 图像处理方法和装置
CN111246093B (zh) * 2020-01-16 2021-07-20 Oppo广东移动通信有限公司 图像处理方法、装置、存储介质及电子设备
CN112639867A (zh) * 2020-05-07 2021-04-09 深圳市大疆创新科技有限公司 图像处理方法和装置
CN111626310B (zh) * 2020-05-27 2023-08-29 百度在线网络技术(北京)有限公司 图像比对方法、装置、设备以及存储介质
CN111626959A (zh) * 2020-05-28 2020-09-04 深圳康佳电子科技有限公司 一种图像处理方法、终端及存储介质
CN112785512B (zh) * 2020-06-30 2023-05-12 青岛经济技术开发区海尔热水器有限公司 一种高斯模糊图像处理的优化方法
CN112307968B (zh) * 2020-10-30 2022-11-08 天地伟业技术有限公司 一种人脸识别特征压缩方法
CN112488964B (zh) * 2020-12-18 2024-04-16 深圳市镜玩科技有限公司 针对滑动列表的图像处理方法、相关装置、设备及介质
CN112651883B (zh) * 2021-01-18 2023-04-07 广东工业大学 一种图像高速场景恢复方法、设备及介质
CN112907457A (zh) * 2021-01-19 2021-06-04 Tcl华星光电技术有限公司 图像处理方法、图像处理装置及计算机设备
CN113824967B (zh) * 2021-11-23 2022-02-15 环球数科集团有限公司 一种基于深度学习的视频压缩方法
CN114565966A (zh) * 2022-04-26 2022-05-31 全时云商务服务股份有限公司 一种人脸视频图像处理方法及装置
CN116228606B (zh) * 2023-05-09 2023-07-28 南京茂聚智能科技有限公司 一种基于大数据的图像优化处理系统
CN117857808B (zh) * 2024-03-06 2024-06-04 深圳市旭景数字技术有限公司 一种基于数据分类压缩的高效视频传输方法及系统
CN118015108A (zh) * 2024-04-10 2024-05-10 深圳市丽台电子有限公司 基于物联网的智慧物业智能管理方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101236599A (zh) * 2007-12-29 2008-08-06 浙江工业大学 基于多摄像机信息融合的人脸识别检测装置
CN102348116A (zh) * 2010-08-03 2012-02-08 株式会社理光 视频处理方法、视频处理装置以及视频处理系统
CN103632132A (zh) * 2012-12-11 2014-03-12 广西工学院 一种基于肤色分割和模板匹配的人脸检测与识别方法
CN108122194A (zh) * 2017-11-28 2018-06-05 沈阳美行科技有限公司 一种图像发光的方法及装置
CN108230243A (zh) * 2018-02-09 2018-06-29 福州大学 一种基于显著性区域检测模型背景虚化方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060140445A1 (en) * 2004-03-22 2006-06-29 Cusack Francis J Jr Method and apparatus for capturing digital facial images optimally suited for manual and automated recognition
US8306283B2 (en) * 2009-04-21 2012-11-06 Arcsoft (Hangzhou) Multimedia Technology Co., Ltd. Focus enhancing method for portrait in digital image
CN103152521B (zh) * 2013-01-30 2016-08-17 广东欧珀移动通信有限公司 一种移动终端中实现景深效果的方法及移动终端
RU2633149C2 (ru) * 2013-07-19 2017-10-11 Общество с ограниченной ответственностью "Мэйл.Ру" Способ и система автоматического генерирования графического пользовательского интерфейса и компьютерный носитель для выполнения способа с использованием системы
CN103945118B (zh) * 2014-03-14 2017-06-20 华为技术有限公司 图像虚化方法、装置及电子设备
CN104361558B (zh) * 2014-10-24 2018-09-04 小米科技有限责任公司 图像处理方法、装置及设备
US10116901B2 (en) * 2015-03-18 2018-10-30 Avatar Merger Sub II, LLC Background modification in video conferencing
CN104966266B (zh) * 2015-06-04 2019-07-09 福建天晴数码有限公司 自动模糊身体部位的方法及系统
CN106993112B (zh) * 2017-03-09 2020-01-10 Oppo广东移动通信有限公司 基于景深的背景虚化方法及装置和电子装置
CN106971165B (zh) * 2017-03-29 2018-08-10 武汉斗鱼网络科技有限公司 一种滤镜的实现方法及装置
US10147216B1 (en) * 2017-11-01 2018-12-04 Essential Products, Inc. Intelligent camera
CN109618173B (zh) * 2018-12-17 2021-09-28 深圳Tcl新技术有限公司 视频压缩方法、装置和计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101236599A (zh) * 2007-12-29 2008-08-06 浙江工业大学 基于多摄像机信息融合的人脸识别检测装置
CN102348116A (zh) * 2010-08-03 2012-02-08 株式会社理光 视频处理方法、视频处理装置以及视频处理系统
CN103632132A (zh) * 2012-12-11 2014-03-12 广西工学院 一种基于肤色分割和模板匹配的人脸检测与识别方法
CN108122194A (zh) * 2017-11-28 2018-06-05 沈阳美行科技有限公司 一种图像发光的方法及装置
CN108230243A (zh) * 2018-02-09 2018-06-29 福州大学 一种基于显著性区域检测模型背景虚化方法

Also Published As

Publication number Publication date
CN109618173A (zh) 2019-04-12
WO2020125631A1 (zh) 2020-06-25

Similar Documents

Publication Publication Date Title
CN109618173B (zh) 视频压缩方法、装置和计算机可读存储介质
CN109272459B (zh) 图像处理方法、装置、存储介质及电子设备
EP3614334B1 (en) Method for image processing and electronic device
KR101802146B1 (ko) 화상처리장치 및 화상처리방법
US10198621B2 (en) Image-Processing device and method for foreground mask correction for object segmentation
US11113795B2 (en) Image edge processing method, electronic device, and computer readable storage medium
US8559708B2 (en) Image preprocessing
US8660323B2 (en) Image Preprocessing
US20210281718A1 (en) Video Processing Method, Electronic Device and Storage Medium
CN109727216B (zh) 图像处理方法、装置、终端设备及存储介质
JP2004310475A (ja) 画像処理装置、画像処理を行う携帯電話、および画像処理プログラム
CN109615620B (zh) 图像压缩度识别方法、装置、设备及计算机可读存储介质
CN111160267A (zh) 图像处理方法、终端及存储介质
CN114298935A (zh) 图像增强方法、装置及计算机可读存储介质
JP2016177500A (ja) 画像処理装置、画像処理システムおよびプログラム
CN113284063A (zh) 图像处理方法、图像处理装置、电子设备和可读存储介质
US11501404B2 (en) Method and system for data processing
CN112839167A (zh) 图像处理方法、装置、电子设备及计算机可读介质
CN116884359A (zh) 基于画面内容的自适应调光方法、装置、设备及存储介质
CN112511890A (zh) 视频图像处理方法、装置及电子设备
CN113453017B (zh) 视频处理方法、装置、设备及计算机程序产品
WO2016113407A1 (en) Methods and apparatus for groupwise contrast enhancement
KR20030091471A (ko) YCrCb 칼라 기반 얼굴 영역 추출 방법
CN114764839A (zh) 动态视频生成方法、装置、可读存储介质及终端设备
CN112801932A (zh) 图像显示方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant