CN101511008B - 一种多分屏图像处理的方法和设备 - Google Patents

一种多分屏图像处理的方法和设备 Download PDF

Info

Publication number
CN101511008B
CN101511008B CN2009101312368A CN200910131236A CN101511008B CN 101511008 B CN101511008 B CN 101511008B CN 2009101312368 A CN2009101312368 A CN 2009101312368A CN 200910131236 A CN200910131236 A CN 200910131236A CN 101511008 B CN101511008 B CN 101511008B
Authority
CN
China
Prior art keywords
zone
output
image
processing equipment
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009101312368A
Other languages
English (en)
Other versions
CN101511008A (zh
Inventor
雷奕
黄建强
吴坚
孔令波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN2009101312368A priority Critical patent/CN101511008B/zh
Publication of CN101511008A publication Critical patent/CN101511008A/zh
Application granted granted Critical
Publication of CN101511008B publication Critical patent/CN101511008B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提供一种多分屏图像处理的方法和设备,该方法应用于与两个以上终端设备连接的图像处理设备,包括:所述图像处理设备解码各终端设备发送的码流;所述图像处理设备确定解码获得的图像中的人脸区域;所述图像处理设备根据所述人脸区域确定所述图像的输出送显区域;所述图像处理设备将所述图像的输出送显区域拼接为多分屏显示图像并编码发送到相应的终端设备。本发明中,图像处理设备获取各终端设备发送的图像后,根据图像中的人脸区域确定图像的输出送显区域,进一步将图像的输出送显区域拼接为完整的多分屏显示图像,从而可以在多分屏会议中获取清楚的与会者的图像信息。

Description

一种多分屏图像处理的方法和设备
技术领域
本发明涉及通信领域,尤其涉及一种多分屏图像处理的方法和设备。
背景技术
随着世界经济的快速增长以及电子政务和企业信息化的迅速推进,视频会议的发展越来越受到人们的重视。多方会议是视频会议中的重要应用,与会者可以同时查看多个会场的信息,由此产生将多个会场的信息同时显示给用户的需要,尤其是将多个会场的信息同时显示在同一屏幕上,即多分屏显示的需要,这种使用多分屏显示技术的多方会议称为多分屏会议。
如图1所示,为现有技术中多分屏会议的典型系统架构图,包括MCU(Multi-point Control Unit,多点控制单元)以及多台TE(Terminal Equipment,终端设备)。MCU是多分屏会议系统的核心部分,为用户提供群组会议、多组会议的连接服务。具体的,MCU与多个TE连接,接收并解码各个TE发送的码流,获取各个会场的图像信息;然后,MCU根据显示屏幕的大小将接收到各个TE的图像进行缩小,再将各个缩小后的图像拼接成一个完整屏幕大小的图像;并对该拼接后的图像进行编码,发送码流至各台TE。各台TE接收到MCU发送的码流后,解码该码流获得多分屏显示图像。
以四分屏会议为例,图2是现有技术中四分屏会议图像显示示意图,MCU将各个会场的图像缩小为原始图像的1/4,然后再拼接成四分屏显示图像发送到各终端设备显示,即输出送显,具体的,如图3所示,现有技术中实现四分屏会议的流程包括:
步骤s301,终端设备发送MG编码码流。
步骤s302,MCU解码收到的MG编码码流,获得各会场的图像。
步骤s303,MCU对解码得到的图像进行缩小,缩小到原屏幕图像的1/4并拼接,获得多分屏显示图像。
步骤s304,MCU对该多分屏显示图像进行编码,将编码得到的码流发送到各终端设备。
现有技术中存在的问题在于:多分屏显示图像的获取需要根据显示区域对原图像进行缩小,但是缩小后的多分屏显示图像清晰度降低,导致多分屏会议中最关心的与会者图像信息模糊。
发明内容
本发明提供一种多分屏图像处理的方法和设备,以提高多分屏显示图像中与会者图像的清晰度。
为了实现上述目的,本发明提供一种多分屏图像处理的方法,应用于与两个以上终端设备连接的图像处理设备,包括:
所述图像处理设备解码各终端设备发送的码流;
所述图像处理设备确定所述解码获得的图像中的人脸区域;
所述图像处理设备根据所述人脸区域确定所述图像的输出送显区域;
所述图像处理设备将所述图像的输出送显区域拼接为多分屏显示图像,并编码发送到相应的终端设备;
所述图像处理设备根据所述人脸区域确定所述图像的输出送显区域包括:
所述图像处理设备根据多分屏显示图像的长宽比,以所述人脸区域为中心确定准输出送显区域;
所述图像处理设备比较所述准输出送显区域的尺寸与预定输出图像尺寸的大小;
当所述准输出送显区域的尺寸大于所述预定输出图像尺寸时,所述图像处理设备将所述准输出送显区域缩小为预定输出图像尺寸,作为所述图像的输出送显区域;
当所述待输出送显区域的尺寸小于所述预定输出图像尺寸时,所述图像处理设备以所述待输出送显区域为中心确定所述图像的输出送显区域。
所述图像处理设备确定解码获得的图像中的人脸区域包括:
所述图像处理设备建立人脸的图形信息数据库;
所述图像处理设备将所述人脸的图形信息数据库中的图形信息与所述图像中的图形信息进行匹配;
所述图像处理设备将匹配成功的图形信息所在的区域确定为人脸区域。
所述图像处理设备根据所述人脸区域确定所述图像的输出送显区域还包括:
当所述人脸区域不唯一时,或者当所述人脸区域没有互相连接时,所述图像处理设备以所有人脸区域互相连接后的区域为中心确定准输出送显区域。
所述图像处理设备解码所述终端设备发送的码流之后,还包括:
所述图像处理设备获取所述图像的运动矢量分布信息;
所述图像处理设备根据所述图像的运动矢量分布信息预先判断所述图像的人脸区域与上一时刻图像的人脸区域相比是否发生变化;
当判断结果为否时,所述图像处理设备将上一时刻图像的输出送显区域作为所述图像的输出送显区域;
当判断结果为是时,所述图像处理设备确定所述解码获得的图像中的人脸区域。
所述图像处理设备确定所述图像中的人脸区域之后,还包括:
所述图像处理设备判断所述图像中的人脸区域是否处于上一时刻图像的输出送显区域内;
判断结果为是时,所述图像处理设备将所述上一时刻图像的输出送显区域作为所述图像的输出送显区域;
判断结果为否时,所述图像处理设备根据所述人脸区域确定所述图像的输出送显区域。
所述上一时刻图像具体为上一帧图像。
所述图像处理设备确定所述解码获得的图像中的人脸区域之后,还包括:
所述图像处理设备获取所述图像的运动矢量分布信息;
所述图像处理设备根据所述图像的运动矢量分布信息确定发生运动的图像区域;
所述图像处理设备根据所述发生运动的图像区域和所述人脸区域确定输出送显区域,该输出送显区域包括该运动图像区域和人脸区域。
本发明提供一种图像处理设备,与两个以上终端设备连接,包括:
图像解码单元,用于解码各终端设备发送的码流;
人脸确定单元,用于确定所述图像解码单元解码获得的图像中的人脸区域;
输出区域单元,用于根据所述人脸确定单元确定的人脸区域确定所述图像的输出送显区域;
图像发送单元,用于将所述输出区域单元确定的图像的输出送显区域拼接为多分屏显示图像,并编码发送到相应的终端设备;
所述输出区域单元包括:
准输出区域子单元,用于根据多分屏显示图像的长宽比以所述人脸区域为中心确定准输出送显区域;
区域比较子单元,用于比较所述准输出区域子单元确定的准输出送显区域的尺寸与预定输出图像尺寸的大小;
缩小子单元,用于当所述区域比较子单元的结果为所述准输出送显区域的尺寸大于所述预定输出图像尺寸时,将所述准输出送显区域缩小为预定输出图像尺寸,作为所述图像的输出送显区域;
中心子单元,用于当所述区域比较子单元的结果为所述准输出送显区域的尺寸小于所述预定输出图像尺寸时,以所述准输出送显区域为中心确定所述图像的输出送显区域。
所述人脸确定单元包括:
图形建立子单元,用于建立人脸的图形信息数据库;
图形匹配子单元,用于将所述图形建立子单元建立的人脸的图形信息数据库中的图形信息,与所述图像中的图形信息进行匹配;
区域确定子单元,用于当所述图形匹配子单元匹配成功时,将所述匹配成功的图形信息所在的区域确定为人脸区域。
本发明提供的图像处理设备,还包括:
运动信息单元,用于获取所述图像的运动矢量分布信息;
第一判断单元,用于根据所述运动信息单元获取的运动矢量分布信息预先判断所述图像的人脸区域与上一时刻图像的人脸区域相比是否发生变化;
所述输出区域单元还用于,当所述第一判断单元的判断结果为否时,将上一时刻图像的输出送显区域作为所述图像的输出送显区域。
本发明提供的图像处理设备,还包括:
第二判断单元,用于当所述第一判断单元的判断结果为是时,判断所述图像中的人脸区域是否处于所述上一时刻图像的输出送显区域内;
所述输出区域单元还用于,当所述第二判断单元的判断结果为是时,将所述上一时刻图像的输出送显区域作为所述图像的输出送显区域。
本发明提供的图像处理设备,还包括:
运动信息单元,用于获取所述图像的运动矢量分布信息;
运动区域单元,用于根据所述运动信息单元获取的运动矢量分布信息确定发生运动的图像区域;
所述输出区域单元还用于,根据所述运动区域单元确定的发生运动的图像区域和所述人脸确定单元确定的人脸区域确定输出送显区域,该输出送显区域包括该运动图像区域和人脸区域。
与现有技术相比,本发明至少具有以下优点:
图像处理设备获取各终端设备发送的图像后,根据图像中的人脸区域确定图像的输出送显区域,进一步将图像的输出送显区域拼接为完整的多分屏显示图像,从而可以在多分屏会议中获取清楚的与会者的图像信息。
附图说明
图1为现有技术中多分屏会议的典型系统架构图;
图2为现有技术中四分屏会议图像显示示意图;
图3为现有技术中实现四分屏会议的流程示意图;
图4为本发明提供的多分屏图像处理的方法的流程示意图;
图5为本发明提供的多分屏图像处理的方法的流程示意图;
图6为本发明一应用场景中MCU获取终端设备的图像并确定图像的输出送显区域的流程示意图;
图7为本发明另一应用场景中MCU获取终端设备的图像并确定图像的输出送显区域的流程示意图;
图8为本发明一应用场景中多分屏图像处理的方法的流程示意图;
图9为本发明一实施例提供的图像处理设备的结构示意图;
图10为本发明另一实施例中图像处理设备的的结构示意图;
图11为本发明另一实施例中图像处理设备的的结构示意图。
具体实施方式
本发明提供一种多分屏图像处理的方法,应用于与两个以上终端设备连接的图像处理设备,如图4所示,包括:
步骤s401,图像处理设备解码终端设备发送的码流。    
步骤s402,图像处理设备确定解码获得的图像中的人脸区域。
步骤s403,图像处理设备根据人脸区域确定图像的输出送显区域。
步骤s404,图像处理设备将图像的输出送显区域拼接为多分屏显示图像并编码发送到相应的终端设备。
下面结合一具体应用场景对本发明提供的方法进行详细介绍。本发明提供一种多分屏图像处理的方法,其中,图像处理设备以MCU为例,如图5所示,包括以下步骤:
步骤s501,MCU解码各终端设备发送的码流,获取各会场的图像。
若该图像为MCU解码的第一帧图像,则直接执行步骤s504;否则继续。
步骤s502,MCU根据图像的运动矢量分布信息预先判断图像的人脸区域与上一帧图像的人脸区域相比是否发生变化。若发生了变化,则执行步骤s504;否则执行步骤s503。
具体的,MCU解码图像时,获取图像的运动矢量分布信息,该运动矢量分布信息可以通过运动矢量分布图提供。运动矢量分布图上以若干像素块,例如16*16的像素块为单位标识图像的运动情况,记录像素块在上一帧图像与当前图像上的位置变化。MCU存储上一次检测出的人脸区域,以及运动矢量分布图上该人脸区域内的像素块位置信息,比较当前运动矢量分布图上该人脸区域内的像素块位置信息的变化。例如,若上一帧图像的运动矢量分布图上该人脸区域内的像素块有8个,当前运动矢量分布图上该人脸区域内的像素块为6个,则可以直接判断图像的人脸区域发生了变化;或者,整体发生了位置移动,则可以设置位置移动阈值作为判断人脸区域是否发生移动的标准,例如该阈值可以设置为6个像素点,若当前运动矢量分布图上该人脸区域内的像素块位置整体移动了5个像素点,则MCU判断该人脸区域没有发生变化。
对于上述人脸区域内像素块位置的整体移动,可以采用多种方式进行判断,例如,可以将像素块向上和向右的位置变化取正值,向下和向左的位置变化取负值,最后加和求出平均值,作为人脸区域内像素块位置的整体移动值。
步骤s503,MCU将上一帧图像的输出送显区域作为当前图像的输出送显区域。
步骤s504,MCU利用人脸检测算法确定解码获得的图像中的人脸区域。
具体的,MCU建立人脸的图形信息数据库,将人脸的图形信息数据库中的图形信息与解码获得的图像中的图形信息进行匹配;当匹配成功时,MCU将匹配成功的图形信息所在区域确定为人脸区域。
步骤s506,MCU根据人脸区域确定图像的准输出送显区域。
MCU根据多分屏显示图像的长宽比以上述确定的人脸区域为中心确定准输出送显区域,即以人脸区域的长或宽为基准,根据多分屏显示图像的长宽比确定准输出送显区域。例如,人脸区域的纵坐标长度大于横坐标长度时,可以以人脸区域的纵坐标长度为基准,根据多分屏显示图像的长宽比确定相应的宽度,作为准输出送显区域的宽,并以人脸区域的纵坐标长度作为准输出送显区域的长。
当步骤s504中确定的人脸区域不唯一时,或者当多个人脸区域彼此没有互相连接时,MCU可以以所有人脸区域互相连接后的区域为中心确定准输出送显区域。例如,当图像中有三个人脸区域A、B、C,并且A、B、C分别处于图像的中间位置、左上侧和左下侧,且彼此没有连接时,MCU以人脸区域A、B、C连接后的区域为基础,确定准输出送显区域。
步骤s507,MCU根据准输出送显区域确定输出送显区域。
MCU比较准输出送显区域的尺寸与预定尺寸的大小;当准输出送显区域的尺寸大于预定尺寸时,MCU将准输出送显区域缩小为预定尺寸,作为图像的输出送显区域;当待输出送显区域的尺寸小于预定尺寸时,MCU以准输出送显区域为中心确定图像的输出送显区域。MCU输出送显区域的预定尺寸由需要显示的多分屏图像决定,例如MCU需要输出四分屏显示图像时,则输出送显区域的预定尺寸为屏幕的1/4,输出送显区域的长宽比可以为1∶1。
步骤s508,MCU将图像的输出送显区域拼接为多分屏显示图像并编码发送到相应的终端设备。
MCU可以根据预置的顺序将图像的输出送显区域拼接为多分屏显示图像,然后进行编码发送。
本应用场景中,步骤s504与步骤s506之间,还可以包括:
步骤s505,MCU判断图像中的人脸区域是否处于上一帧图像的输出送显区域内。判断结果为是时,执行步骤s503;否则执行步骤s506。具体的,MCU可以存储上一帧图像的输出送显区域的位置信息,例如坐标信息,根据该坐标信息判断上述步骤中确定的人脸区域是否在该输出送显区域内。
下面再结合一具体应用场景对本发明提供的多分屏图像处理的方法进行进一步介绍。其中,以四分屏显示为例,MCU获取终端设备的图像并确定图像的输出送显区域的流程如图6所示,包括以下步骤:
步骤s601,MCU解码终端设备发送的码流,获取第一帧的图像。
步骤s602,MCU对第一帧的图像进行人脸检测算法,根据识别出的人脸,确定人脸区域。
MCU中存储的人脸图形信息库中可以存储多种图形信息,例如人眼的图形信息,并设定两个眼睛之间的距离为5mm-5cm,当图像中存在两个人眼的图形并且两个人眼的图形之间的距离在5mm-5cm内时,MCU可以确定以该两个眼睛图形为中心的区域为人脸区域。例如,当MCU获取的第一帧的图像中出现两个眼睛图形,且这两个眼睛图形之间的距离为1.5cm时,MCU可以确定以这两个眼睛图形为中心,向上3倍于1.5cm的距离、向下5倍于1.5cm的距离、左右各1cm的距离为人脸区域。
步骤s603,MCU根据人脸区域确定输出送显区域。
具体的,MCU根据人脸区域确定输出送显区域可以为:MCU根据四分屏显示图像的长宽比和尺寸提取以人脸区域为中心的图像作为准输出送显区域,将准输出送显区域整体缩小、放大或不改变尺寸,作为图像的输出送显区域。例如,当四分屏显示图像为四块尺寸为10cm*10cm的图像构成时,图像的输出送显区域应当为10cm*10cm大小。若MCU获取的人脸区域为12cm*3.5cm时,MCU可以首先确定以该人脸区域为核心的12cm*12cm作为准输出送显区域,将该准输出送显区域缩小为10cm*10cm,作为输出送显区域。然后MCU将该输出送显区域与其它终端设备发送的图像的输出送显区域拼接为完整的四分屏显示图像,并编码传输到相应的终端设备。
步骤s604,MCU解码下一帧的图像,获取该帧图像的运动矢量分布信息。
该图像的运动矢量分布信息可以由MCU从解码时产生的运动矢量分布图像上获取。
步骤s605,MCU根据运动矢量分布信息判断人脸区域是否发生变化;若发生变化,则执行步骤s606;若没有发生变化,执行步骤s608。
例如,第一帧图像上的人脸区域由七个像素块构成,该下一帧图像的运动矢量分布图像上显示这七个像素块的位置整体向左平移了1cm,则可以据此推断人脸区域发生了变化,需要重新确定人脸区域,提取新的图像信息。
步骤s606,MCU对下一帧图像进行人脸检测算法,获取该图像的人脸区域。
步骤s607,MCU判断该人脸区域是否在第一帧图像的输出显示区域内;若在,则执行步骤s608;否则,执行步骤s609。
步骤s608,MCU继续进行下一帧图像的解码。
步骤s609,MCU根据步骤s606中获取的图像的人脸区域重新确定输出显示区域。
本应用场景中,人脸检测算法可以但不限于识别图像中的人脸,例如还可以用来识别图像中的麦克风等具有重要意义的图像信息。人脸区域与人脸检测算法检测的图像信息相适应,当人脸检测算法检测的图像信息为麦克风时,人脸区域可以为麦克风所在的图像区域。
下面结合另一具体应用场景对本发明提供的多分屏图像处理的方法进行介绍,其中,MCU获取终端设备的图像并确定图像的输出送显区域的流程如图7所示,包括以下步骤:
步骤s701,MCU解码终端设备发送的码流,获取图像。
步骤s702,MCU获取该图像的运动矢量分布信息,获取发生运动的图像区域。
具体的,MCU根据运动矢量分布信息上像素块的变化确定发生运动的图像区域。
步骤s703,MCU对获取到的图像进行人脸检测算法,获取该图像的人脸区域。
步骤s704,MCU将包括发生运动的图像区域和人脸区域的区域作为输出送显区域。
具体的,MCU以发生运动的图像区域和人脸区域为核心确定输出送显区域。其中,发生运动的图像区域与人脸区域可以在图像的两个不同位置,输出送显区域包括该两个位置之间的区域。例如,人在讲话时,如果有手势,则MCU可以通过运动矢量分布信息获取手的图像区域,根据人脸检测算法获取人脸区域,然后建立包括这两个区域的输出送显区域,获取该输出送显区域的图像信息,包括人脸与手的图像信息。
上述步骤s702与步骤s703之间的顺序还可以相互调换,并不影响实现的效果。
下面结合另一具体应用场景对本发明提供的多分屏图像处理的方法进行进一步介绍。以四分屏显示为例,如图8所示,包括以下步骤:
步骤s801,MCU接收四个终端设备发送的编码码流。
MCU可以通过多个接口同时接收各终端设备发送的码流,也可以按照一定的顺序进行接收。满足每秒钟最少输出25帧图像的前提下,MCU接收编码码流的方式可以灵活设置。
步骤s802,MCU解码各终端设备发送的码流获得四副图像。
步骤s803,MCU对解码获得的图像提取重要信息,获取输出送显区域。
其中,MCU对解码获得的图像提取重要信息的方法可以为:
MCU对图像进行人脸检测算法,以获取的人脸区域作为中心获取输出送显区域;或者
MCU对图像进行人脸检测算法,获取人脸区域;根据后续图像的运动矢量分布信息确定人脸区域是否发生运动,若发生运动,则MCU对后续图像进行人脸检测算法,确定新的人脸区域并根据该新的人脸区域进一步确定输出送显区域;或者
MCU对图像进行人脸检测算法,获取人脸区域;并且,MCU根据运动矢量分布信息获取发生运动的图像区域;MCU建立以人脸区域和发生运动的图像区域为中心的输出送显区域。
步骤s804,MCU将获得的输出送显区域的图像拼接为完整的四分屏显示图像。
步骤s805,MCU将四分屏显示图像进行编码,并将编码码流发送到四个终端设备,实现四分屏显示。
通过采用本发明提供的方法,MCU获取各终端设备的图像后,根据图像中的人脸区域确定图像的输出送显区域,并根据图像的输出送显区域提取相应的图像信息拼接为完整的多分屏显示图像发送到终端设备,从而可以在多分屏显示会议中获取清楚的与会者的图像信息。
本发明提供一种图像处理设备,与两个以上终端设备连接,如图9所示,包括:
图像解码单元91,用于解码各终端设备发送的码流;
人脸确定单元92,用于确定所述图像解码单元91解码获得的图像中的人脸区域;
可选的,该单元包括:
图形建立子单元921,用于建立人脸的图形信息数据库;
图形匹配子单元922,用于将所述图形建立子单元921建立的人脸的图形信息数据库中的图形信息,与所述图像中的图形信息进行匹配;
区域确定子单元923,用于当所述图形匹配子单元922匹配成功时,将所述匹配成功的图形信息所在区域确定为人脸区域。
输出区域单元93,用于根据所述人脸确定单元92确定的人脸区域确定所述图像的输出送显区域;
可选的,该单元包括:
准输出区域子单元931,用于根据多分屏显示图像的长宽比以所述人脸区域为中心确定准输出送显区域;
区域比较子单元932,用于比较所述准输出区域子单元931确定的准输出送显区域的尺寸与预定输出图像尺寸的大小;
缩小子单元933,用于当所述区域比较子单元932的结果为所述准输出送显区域的尺寸大于所述预定输出图像尺寸时,将所述准输出送显区域缩小为预定输出图像尺寸,作为所述图像的输出送显区域;
中心子单元934,用于当所述区域比较子单元932的结果为所述准输出送显区域的尺寸小于所述预定输出图像尺寸时,以所述准输出送显区域为中心确定所述图像的输出送显区域。
图像发送单元94,用于将所述输出区域单元93确定的图像的输出送显区域拼接为多分屏显示图像并编码发送到相应的终端设备。
如图10所示,本发明提供的设备还包括:
运动信息单元101,用于获取所述图像的运动矢量分布信息;
第一判断单元102,用于根据所述运动信息单元101获取的运动矢量分布信息预先判断所述图像的人脸区域与上一时刻图像的人脸区域相比是否发生变化;
所述输出区域单元93还用于,当所述第一判断单元102的判断结果为否时,将上一时刻图像的输出送显区域作为所述图像的输出送显区域。
进一步,本发明提供的设备还可以包括:
第二判断单元103,用于当所述第一判断单元102的判断结果为是时,判断所述图像中的人脸区域是否处于所述上一时刻图像的输出送显区域内;
所述输出区域单元93还用于,当所述第二判断单元103的判断结果为是时,将所述上一时刻图像的输出送显区域作为所述图像的输出送显区域。
其中,上一时刻图像具体为上一帧图像。
如图11所示,本发明提供的设备中,还可以包括:
运动信息单元111,用于获取所述图像的运动矢量分布信息;
运动区域单元112,用于根据所述运动信息单元111获取的运动矢量分布信息确定发生运动的图像区域;
所述输出区域单元93还用于,根据所述运动区域单元112确定的发生运动的图像区域和所述人脸确定单元92确定的人脸区域确定输出送显区域,该输出送显区域包括该运动图像区域和人脸区域。
通过采用本发明提供的图像处理设备,获取各终端设备的图像后,根据图像中的人脸区域确定图像的输出送显区域,并将图像的输出送显区域拼接为完整的多分屏显示图像,并编码发送到终端设备,从而可以在多分屏会议中获取清楚的与会者的图像信息。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
总之,以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (12)

1.一种多分屏图像处理的方法,应用于与两个以上终端设备连接的图像处理设备,其特征在于,包括:
所述图像处理设备解码各终端设备发送的码流;
所述图像处理设备确定所述解码获得的图像中的人脸区域;
所述图像处理设备根据所述人脸区域确定所述图像的输出送显区域;
所述图像处理设备将所述图像的输出送显区域拼接为多分屏显示图像,并编码发送到相应的终端设备;
所述图像处理设备根据所述人脸区域确定所述图像的输出送显区域包括:所述图像处理设备根据多分屏显示图像的长宽比,以所述人脸区域为中心确定准输出送显区域;所述图像处理设备比较所述准输出送显区域的尺寸与预定输出图像尺寸的大小;当所述准输出送显区域的尺寸大于所述预定输出图像尺寸时,所述图像处理设备将所述准输出送显区域缩小为预定输出图像尺寸,作为所述图像的输出送显区域;当所述待输出送显区域的尺寸小于所述预定输出图像尺寸时,所述图像处理设备以所述待输出送显区域为中心确定所述图像的输出送显区域。
2.如权利要求1所述的方法,其特征在于,所述图像处理设备确定解码获得的图像中的人脸区域包括:
所述图像处理设备建立人脸的图形信息数据库;
所述图像处理设备将所述人脸的图形信息数据库中的图形信息与所述图像中的图形信息进行匹配;
所述图像处理设备将匹配成功的图形信息所在的区域确定为人脸区域。
3.如权利要求1所述的方法,其特征在于,所述图像处理设备根据所述人脸区域确定所述图像的输出送显区域还包括:
当所述人脸区域不唯一时,或者当所述人脸区域没有互相连接时,所述图像处理设备以所有人脸区域互相连接后的区域为中心确定准输出送显区域。
4.如权利要求1所述的方法,其特征在于,所述图像处理设备解码各终端设备发送的码流之后,还包括:
所述图像处理设备获取所述图像的运动矢量分布信息;
所述图像处理设备根据所述图像的运动矢量分布信息预先判断所述图像的人脸区域与上一时刻图像的人脸区域相比是否发生变化;
当判断结果为否时,所述图像处理设备将上一时刻图像的输出送显区域作为所述图像的输出送显区域;
当判断结果为是时,所述图像处理设备确定所述解码获得的图像中的人脸区域。
5.如权利要求4所述的方法,其特征在于,所述图像处理设备确定所述图像中的人脸区域之后,还包括:
所述图像处理设备判断所述图像中的人脸区域是否处于上一时刻图像的输出送显区域内;
判断结果为是时,所述图像处理设备将所述上一时刻图像的输出送显区域作为所述图像的输出送显区域;
判断结果为否时,所述图像处理设备根据所述人脸区域确定所述图像的输出送显区域。
6.如权利要求4或5所述的方法,其特征在于,所述上一时刻图像具体为上一帧图像。
7.如权利要求1所述的方法,其特征在于,所述图像处理设备确定所述解码获得的图像中的人脸区域之后,还包括:
所述图像处理设备获取所述图像的运动矢量分布信息;
所述图像处理设备根据所述图像的运动矢量分布信息确定发生运动的图像区域;
所述图像处理设备根据所述发生运动的图像区域和所述人脸区域确定输出送显区域,该输出送显区域包括该运动图像区域和人脸区域。
8.一种图像处理设备,与两个以上终端设备连接,其特征在于,包括:
图像解码单元,用于解码各终端设备发送的码流;
人脸确定单元,用于确定所述图像解码单元解码获得的图像中的人脸区域;
输出区域单元,用于根据所述人脸确定单元确定的人脸区域确定所述图像的输出送显区域;
图像发送单元,用于将所述输出区域单元确定的图像的输出送显区域拼接为多分屏显示图像,并编码发送到相应的终端设备;
所述输出区域单元包括:
准输出区域子单元,用于根据多分屏显示图像的长宽比以所述人脸区域为中心确定准输出送显区域;
区域比较子单元,用于比较所述准输出区域子单元确定的准输出送显区域的尺寸与预定输出图像尺寸的大小;
缩小子单元,用于当所述区域比较子单元的结果为所述准输出送显区域的尺寸大于所述预定输出图像尺寸时,将所述准输出送显区域缩小为预定输出图像尺寸,作为所述图像的输出送显区域;
中心子单元,用于当所述区域比较子单元的结果为所述准输出送显区域的尺寸小于所述预定输出图像尺寸时,以所述准输出送显区域为中心确定所述图像的输出送显区域。
9.如权利要求8所述的图像处理设备,其特征在于,所述人脸确定单元包括:
图形建立子单元,用于建立人脸的图形信息数据库;
图形匹配子单元,用于将所述图形建立子单元建立的人脸的图形信息数据库中的图形信息,与所述图像中的图形信息进行匹配;
区域确定子单元,用于当所述图形匹配子单元匹配成功时,将所述匹配成功的图形信息所在的区域确定为人脸区域。
10.如权利要求8所述的图像处理设备,其特征在于,还包括:
运动信息单元,用于获取所述图像的运动矢量分布信息;
第一判断单元,用于根据所述运动信息单元获取的运动矢量分布信息预先判断所述图像的人脸区域与上一时刻图像的人脸区域相比是否发生变化;
所述输出区域单元还用于,当所述第一判断单元的判断结果为否时,将上一时刻图像的输出送显区域作为所述图像的输出送显区域。
11.如权利要求10所述的图像处理设备,其特征在于,还包括:
第二判断单元,用于当所述第一判断单元的判断结果为是时,判断所述图像中的人脸区域是否处于所述上一时刻图像的输出送显区域内;
所述输出区域单元还用于:当所述第二判断单元的判断结果为是时,将所述上一时刻图像的输出送显区域作为所述图像的输出送显区域。
12.如权利要求8所述的图像处理设备,其特征在于,还包括:
运动信息单元,用于获取所述图像的运动矢量分布信息;
运动区域单元,用于根据所述运动信息单元获取的运动矢量分布信息确定发生运动的图像区域;
所述输出区域单元还用于:根据所述运动区域单元确定的发生运动的图像区域和所述人脸确定单元确定的人脸区域确定输出送显区域,该输出送显区域包括运动图像区域和人脸区域。
CN2009101312368A 2009-04-10 2009-04-10 一种多分屏图像处理的方法和设备 Active CN101511008B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009101312368A CN101511008B (zh) 2009-04-10 2009-04-10 一种多分屏图像处理的方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101312368A CN101511008B (zh) 2009-04-10 2009-04-10 一种多分屏图像处理的方法和设备

Publications (2)

Publication Number Publication Date
CN101511008A CN101511008A (zh) 2009-08-19
CN101511008B true CN101511008B (zh) 2010-11-10

Family

ID=41003238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101312368A Active CN101511008B (zh) 2009-04-10 2009-04-10 一种多分屏图像处理的方法和设备

Country Status (1)

Country Link
CN (1) CN101511008B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102111605A (zh) * 2009-12-28 2011-06-29 杭州华三通信技术有限公司 Mcu多画面分屏实现方法及mcu
CN102740155A (zh) * 2012-06-15 2012-10-17 宇龙计算机通信科技(深圳)有限公司 图像显示的方法及电子设备
EP2765769A4 (en) 2012-09-10 2014-12-24 Huawei Tech Co Ltd IMAGE PROCESSING METHOD AND IMAGE PROCESSING DEVICE
CN103853512B (zh) * 2012-12-03 2017-11-28 联想(北京)有限公司 一种实现分屏的方法及电子设备
CN108270989A (zh) * 2016-12-30 2018-07-10 中移(杭州)信息技术有限公司 一种视频图像处理方法和装置
CN107872639A (zh) * 2017-11-14 2018-04-03 维沃移动通信有限公司 通信视频的传输方法、装置和移动终端
CN117422617B (zh) * 2023-10-12 2024-04-09 华能澜沧江水电股份有限公司 实现视频会议系统图像拼接的方法及系统

Also Published As

Publication number Publication date
CN101511008A (zh) 2009-08-19

Similar Documents

Publication Publication Date Title
CN101511008B (zh) 一种多分屏图像处理的方法和设备
US11356488B2 (en) Frame synchronous rendering of remote participant identities
KR101099884B1 (ko) 동화상데이터의 부호화방법, 복호화방법, 이들을 실행하는단말장치, 및 쌍방향 대화형 시스템
US20220255666A1 (en) Adaptive Screen Encoding Control
CN106878658B (zh) 用于多流多站点远程呈现会议系统的自动视频布局
US8976220B2 (en) Devices and methods for hosting a video call between a plurality of endpoints
CN103597468A (zh) 用于视频通信系统中改进的交互式内容共享的系统和方法
US20150373341A1 (en) Techniques for Interactive Region-Based Scalability
EP2202970A1 (en) A method and a system of video communication and a device for video communication
JP2009510877A (ja) 顔検出を利用したストリーミングビデオにおける顔アノテーション
CN101938626A (zh) 一种视频会议终端、系统和方法
CN116584090A (zh) 视频流操作
EP2785050A2 (en) Annotating a presentation in a telepresence meeting
US8917309B1 (en) Key frame distribution in video conferencing
WO2023207872A1 (zh) 视频编解码方法、视频编解码器和电子设备
CN107231564A (zh) 一种视频直播方法、直播系统和直播服务器
CN102215405B (zh) 3d视频信号压缩编解码方法、装置及系统
JP4973908B2 (ja) 通信端末およびその表示方法
US11165989B2 (en) Gesture and prominence in video conferencing
US20240020083A1 (en) Multiple Video Stream Generation Based On Different Pixel Sets Within An Initial Video Stream
CN102123266A (zh) 基于网真技术的点对点视频通信方法、编解码器和客户端
JP6431301B2 (ja) 動画処理装置、方法、コンピュータプログラム
WO2024015272A1 (en) Multi-stream video encoding for screen sharing within a communications session
CN115756234A (zh) 一种显示处理方法、系统及存储介质
US20170374368A1 (en) Video Processor, Method, Computer Program

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address

Address after: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Patentee after: Xinhua three Technology Co., Ltd.

Address before: 310053 Hangzhou hi tech Industrial Development Zone, Zhejiang province science and Technology Industrial Park, No. 310 and No. six road, HUAWEI, Hangzhou production base

Patentee before: Huasan Communication Technology Co., Ltd.

CP03 Change of name, title or address