CN113660495A - 实时视频流压缩方法、装置、电子设备以及存储介质 - Google Patents
实时视频流压缩方法、装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN113660495A CN113660495A CN202110918790.1A CN202110918790A CN113660495A CN 113660495 A CN113660495 A CN 113660495A CN 202110918790 A CN202110918790 A CN 202110918790A CN 113660495 A CN113660495 A CN 113660495A
- Authority
- CN
- China
- Prior art keywords
- background
- image
- data
- portrait
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007906 compression Methods 0.000 title claims abstract description 83
- 230000006835 compression Effects 0.000 title claims abstract description 83
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000003068 static effect Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 6
- 238000009877 rendering Methods 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 abstract description 36
- 230000003287 optical effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000007689 inspection Methods 0.000 description 5
- 238000013144 data compression Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5175—Call or contact centers supervision arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明实施例公开了一种实时视频流压缩方法、装置、电子设备以及存储介质。该方法包括:获取视频数据中的各图像帧,提取所述各图像帧中的人像区域图像,并对各所述人像区域图像执行图像压缩,得到各人像压缩数据;确定所述各图像帧进行展示时的一背景图像,并对所述背景图像执行图像压缩,得到背景压缩数据。通过本发明实施例公开的技术方案,实现降低了数据传输带宽,提高了数据传输效率。
Description
技术领域
本发明实施例涉及网络通信及呼叫中心技术领域,尤其涉及一种实时视频流压缩方法、装置、电子设备以及存储介质。
背景技术
在进行图像或视频传输时,由于传输带宽和传输速率的限制,需要对传输的视频或图像进行压缩处理。无损压损虽然能够很好地保持原有对象的信息,但本身具有较低的压缩效率,往往会受到传输条件的制约;相反地,有损压缩具有较高的压缩效率,但本身对原有信息的损失会造成解压出来的图像信息丢失,不符合关注信息提取和视觉方面质量要求。
发明内容
本发明提供一种实时视频流压缩方法、装置、电子设备以及存储介质,以实现降低了数据传输带宽,提高了数据传输效率。
第一方面,本发明实施例提供了一种实时视频流压缩方法,该方法包括:
获取视频数据中的各图像帧,提取所述各图像帧中的人像区域图像,并对各所述人像区域图像执行图像压缩,得到各人像压缩数据;
确定所述各图像帧进行展示时的一背景图像,并对所述背景图像执行图像压缩,得到背景压缩数据。
可选的,所述提取所述各图像帧中的人像区域图像,包括:
对各所述图像帧进行人像识别;
将所述图像帧中识别出的人像所在的区域确定人像区域;
提取所述人像区域的人像数据,得到所述人像区域图像。
可选的,所述确定所述各图像帧进行展示时的一背景图像,包括:
对于任一图像帧,将人像识别结果中除所述人像区域以外的区域确定为背景区域;
提取所述背景区域的背景数据,基于所述背景数据确定背景图像。
可选的,所述基于所述背景数据确定背景图像,包括:
获取所述背景区域的内部边缘的背景边缘数据,确定所述背景边缘数据的边缘均值数据并作为所述人像区域的背景填充数据,并基于所述背景填充数据以及所述背景数据形成背景图像;或,
获取所述背景区域预设区域的部分背景数据,将所述部分背景数据作为所述人像区域的背景填充数据,并基于所述背景填充数据以及所述背景数据形成背景图像。
可选的,所述背景图像为静态图像,所述背景图像的数量为1。
可选的,所述确定所述各图像帧进行展示时的一背景图像,包括:
获取预设静态图像,并将所述预设静态图像确定为所述背景图像。
可选的,所述方法还包括:
将所述背景压缩数据以及所述各人像压缩数据传输至接收方,以使接收方对所述背景压缩数据以及所述各人像压缩数据进行数据解压,并将解压后的背景图像以及各人像区域图像进行数据视频渲染。
第二方面,本发明实施例还提供了一种实时视频流压缩装置,该装置包括:
人像压缩数据获取模块,用于获取视频数据中的各图像帧,提取所述各图像帧中的人像区域图像,并对各所述人像区域图像执行图像压缩,得到各人像压缩数据;
背景压缩数据获取模块,用于确定所述各图像帧进行展示时的背景图像,并对所述背景图像执行图像压缩,得到背景压缩数据。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例提供的实时视频流压缩方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例提供的实时视频流压缩方法。
本实施例的技术方案获取视频数据中的各图像帧,提取各图像帧中的人像区域图像,并对各人像区域图像执行图像压缩,得到各人像压缩图像,以使视频通话系统在减小数据传输压力的情况下保留关键区域,实现减小压力的情况下保证接收方法可以对视频中的各坐席客服的人像进行精确质检;进一步的,确定各图像帧进行展示时的一背景图像,并对背景图像执行图像压缩,得到背景压缩数据;通过一张背景图像代替视频数据的各图像帧中除人像区域以外的区域,以减小背景区域的压缩数据在传输时的数据带宽,并且将背景区域的背景数据更换为静态图片间接的保护了客户的隐私。通过本发明实施例公开的技术方案,实现降低了数据传输带宽,提高了数据传输效率。
附图说明
为了更加清楚地说明本发明示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本发明所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。
图1是本发明实施例一提供的实时视频流压缩方法的流程示意图;
图2是本发明实施例二提供的实时视频流压缩方法的流程示意图;
图3是本发明实施例二提供的另一种实时视频流压缩方法的流程示意图;
图4是本发明实施例三提供的实时视频流压缩装置的结构示意图;
图5为本发明实施例四提供的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种实时视频流压缩方法的流程图,本实施例可适用于对待传输的视频数据进行压缩的情况,更具体的,对于待传输的视频数据中的人像区域图像和背景图像分别压缩处理后并传输的情况。该方法可以由实时视频流压缩装置来执行,该装置可以由软件和/或硬件的方式来实现。
现有的处理视频文件的方法包括对视频文件进行数据压缩,并将压缩后的数据进行传输,以减小传输带宽。但是上述方法对视频数据统一压缩之后,解压缩的视频中的人像区域不清楚,导致无法对视频中的客服人员进行准确质检。当然还有处理视频文件的方法是针对于视频数据区分为感兴趣区域和不感兴趣区域将视频数据进行区分,并将不同的区域数据采用不同的压缩方法,并将压缩后的数据进行传输。但是上述方法若视频数据较长,则压缩后的数据量还是较为庞大,数据传输的压力依旧很大。
为了解决上述问题,本实施例的技术方案获取视频数据中的各图像帧,提取各图像帧中的人像区域图像,并对各人像区域图像执行图像压缩,得到各人像压缩图像,以使视频通话系统在减小数据传输压力的情况下保留关键区域,实现减小压力的情况下保证接收方法可以对视频中的各坐席客服的人像进行精确质检;进一步的,确定各图像帧进行展示时的一背景图像,并对背景图像执行图像压缩,得到背景压缩数据;通过一张背景图像代替视频数据的各图像帧中除人像区域以外的区域,以减小背景区域的压缩数据在传输时的数据带宽,并且将背景区域的背景数据更换为静态图片间接的保护了客户的隐私。
如图1所示,该方法具体包括以下步骤:
S110、获取视频数据中的各图像帧,提取各图像帧中的人像区域图像,并对各人像区域图像执行图像压缩,得到各人像压缩数据。
在本实施例中,视频数据可以包括基于摄像头采集到的坐席客服的视频数据还可以包括与坐席客服进行沟通的客户的视频数据。
具体的,获取视频数据的方式可以是基于摄像头进行采集生成视频数据。在获取视频数据之后,将该视频数据进行帧拆分,得到各图像帧。进一步的,提取各图像帧中的人像区域图像。可选的,人像区域图像提取方法可以是对各图像帧进行人像识别;将图像帧中识别出的人像所在的区域确定人像区域;提取人像区域的人像数据,得到人像区域图像。具体的,以提取一图像帧中的人像区域图像为例进行示例性的介绍;对任一图像帧进行人像识别,确定图像帧中的人像所在区域,提取该区域的像素数据,并基于提取出的像素数据确定人像区域图像。
在确定各图像中很中的各人像区域图像之后,对各人像区域图像进行数据压缩。可选的,为了得到较为精细的人像区域图像,可以选择无损压缩的压缩方式对人像区域图像进行图像压缩,得到各人像压缩数据。在本实施例中,对人像数据执行图像压缩的压缩方法包括哈夫曼算法、Rice算法、LZ77算法或自定义无损压缩算法中至少一项,本实施例对压缩方式不加以限制。
S120、确定各图像帧进行展示时的一背景图像,并对背景图像执行图像压缩,得到背景压缩数据。
在发明实施例中,背景图像可以是用于衬托视频数据中的人像的图像。在本实施例中,对视频数据中的人像区域图像进行展示时采用的是同一张背景图像;可选的,该背景图像可以包括静态图像,以实现减少视频数据的数据大小,便于数据传输。具体的,确定各图像帧进行展示时的一背景图像的方法可以是:对于任一图像帧,将人像识别结果中除人像区域以外的区域确定为背景区域;提取背景区域的背景数据,基于背景数据确定背景图像。具体的,确定视频数据中的任一图像帧中的背景区域,并提取该背景区域的背景数据,进一步地基于该背景数据确定该视频数据在进行展示时的一张背景图像。
可选的,基于该背景数据确定该视频数据在进行展示时的一张背景图像的方法可以包括:获取背景区域的内部边缘的背景边缘数据,确定背景边缘数据的边缘均值数据并作为人像区域的背景填充数据,并基于背景填充数据以及背景数据形成背景图像。具体的,确定背景数据位于当前图像帧的背景区域中的数据位置,并确定各数据位置中位于背景区域的内部边缘区域的数据位置对应的各背景数据为背景边缘数据;计算背景边缘数据中各数据的数据均值,将该数据均值作为当前图像帧中人像区域的背景填充数据,并进行填充;填充后的图像帧中的各数据组成背景图像;其中,背景图像是基于背景数据以及背景填充数据所生成。进一步的,将生成的背景图像确定为该视频数据在进行展示时的一张背景图像。
可选的,基于该背景数据确定该视频数据在进行展示时的一张背景图像的方法还可以包括:获取背景区域预设区域的部分背景数据,将部分背景数据作为人像区域的背景填充数据,并基于背景填充数据以及背景数据形成背景图像。具体的,确定当前图像帧中人像区域的区域面积,并在背景区域中确定任一包括该区域面积的部分区域;确定该该部分区域在背景数据中对应的部分背景数据,将该部分背景数据填充至人像区域,填充后的图像帧中的各数据组成背景图像;其中,背景图像是基于背景数据以及背景填充数据所生成。进一步的,将生成的背景图像确定为该视频数据在进行展示时的一张背景图像。
在一些实施例中,确定视频数据进行展示时的一张背景图像的方法还可以包括:获取预设静态图像,并将预设静态图像确定为背景图像。具体的,获取预设静态图像,并在视频数据进行展示时用该静态图像替换掉视频数据中的背景区域图像。换言之,将各人像区域图像与预设静态图像形成新的视频数据,并进行展示。
上述将视频数据中的各图像帧的背景区域图像进行删除,采用一张背景图像进行展示的技术方案的有益效果在于减小了视频数据的数据大小,从而减小了数据传输时的带宽,以实现提高传输效率,在此基础上,将背景区域的背景数据更换为静态图片间接的保护了客户的隐私。本实施例中,上述基于背景数据确定背景图像的方法只是作为可以选实施例,还可以基于实际情况设置其他确定背景图像的方法,本实施例对此不加以限制。
进一步的,在确定背景图像之后,对该背景图像进行数据压缩。可选的,为得到较小的压缩数据,可以选择有损压缩的压缩方式对人像区域图像进行图像压缩,得到背景压缩数据。在本实施例中对背景图像执行图像压缩的压缩方法包括脉冲编码,预测编码,变换编码,统计编码,量化编码和子带编码中至少一项,本实施例对压缩方式不加以限制。
本实施例的技术方案获取视频数据中的各图像帧,提取各图像帧中的人像区域图像,并对各人像区域图像执行图像压缩,得到各人像压缩图像,以使视频通话系统在减小数据传输压力的情况下保留关键区域,实现减小压力的情况下保证接收方法可以对视频中的各坐席客服的人像进行精确质检;进一步的,确定各图像帧进行展示时的一背景图像,并对背景图像执行图像压缩,得到背景压缩数据;通过一张背景图像代替视频数据的各图像帧中除人像区域以外的区域,以减小背景区域的压缩数据在传输时的数据带宽,并且将背景区域的背景数据更换为静态图片间接的保护了客户的隐私。通过本发明实施例公开的技术方案,实现降低了数据传输带宽,提高了数据传输效率。
实施例二
图2为本发明实施例二提供的一种实时视频流压缩方法的流程图,本实施例在上述各实施例的基础上,在步骤“确定各图像帧进行展示时的一背景图像,并对背景图像执行图像压缩,得到背景压缩数据。”之后增加了“将背景压缩数据以及各人像压缩数据传输至接收方。”其中与上述各实施例相同或相应的术语的解释在此不再赘述。参见图2,本实施例提供的实时视频流压缩方法包括:
S210、获取视频数据中的各图像帧,提取各图像帧中的人像区域图像,并对各人像区域图像执行图像压缩,得到各人像压缩数据。
S220、确定各图像帧进行展示时的一背景图像,并对背景图像执行图像压缩,得到背景压缩数据。
S230、将背景压缩数据以及各人像压缩数据传输至接收方。
在本实施例中,在得到视频数据的背景压缩数据以及各人像压缩数据之后,将该背景压缩数据以及各人像压缩数据传输至接收方,以使接收方接收背景压缩数据以及各人像压缩数据,并分别进行数据解压,得到背景图像以及各人像区域图像;进一步地,基于该背景图像以及各人像区域图像渲染成视频数据进行播放。在本实施例中传输背景图像以及各人像压缩数据的传输协议可以采用实时传输协议、安全实时传输协议、数据报传输层-安全实时传输协议中至少一项,本实施例对比不加以限定。
在上述各实施例的基础上,本发明实施例还提供了一个可选实施例。具体的如图3所示,视频采集端的应用层调用SDK加入视频会议的方法,SDK启动摄像头将加入视频会议的指令传输给信令网关,信令网关反馈会入会成功的提示通知,从而实现入会成功;进一步地逐帧采集摄像头的画面,并对采集到的每一帧进行人脸识别,确定人像区域图像;将图像帧中除人像区域图像以外的背景区域替换为静态图像,得到处理后的各图像帧;将处理后的图像帧传给编码层进行编码;编码层采用帧内预测和帧间预测等方法进行数据压缩,以实现减少视频数据的数据冗余;再一步的,对压缩后的数据进行其他处理,并将处理后的数据传输至接收端,以使接收端对所述背景压缩数据以及所述各人像压缩数据进行数据解压,并将解压后的背景图像以及各人像区域图像进行数据视频渲染。
本实施例的技术方案获取视频数据中的各图像帧,提取各图像帧中的人像区域图像,并对各人像区域图像执行图像压缩,得到各人像压缩图像,以使视频通话系统在减小数据传输压力的情况下保留关键区域,实现减小压力的情况下保证接收方法可以对视频中的各坐席客服的人像进行精确质检;进一步的,确定各图像帧进行展示时的一背景图像,并对背景图像执行图像压缩,得到背景压缩数据;通过一张背景图像代替视频数据的各图像帧中除人像区域以外的区域,以减小背景区域的压缩数据在传输时的数据带宽,并且将背景区域的背景数据更换为静态图片间接的保护了客户的隐私。通过本发明实施例公开的技术方案,实现降低了数据传输带宽,提高了数据传输效率。
以下是本发明实施例提供的实时视频流压缩装置的实施例,该装置与上述各实施例的实时视频流压缩方法属于同一个发明构思,在实时视频流压缩装置的实施例中未详尽描述的细节内容,可以参考上述实时视频流压缩方法的实施例。
实施例三
图4为本发明实施例三提供的实时视频流压缩装置的结构示意图,本实施例可适用于对待传输的视频数据进行压缩的情况,更具体的,对于待传输的视频数据中的人像区域图像和背景图像分别压缩处理后并传输的情况。该实时视频流压缩装置的具体结构包括:人像压缩数据获取模块310和背景压缩数据获取模块320;其中,
人像压缩数据获取模块310,用于获取视频数据中的各图像帧,提取所述各图像帧中的人像区域图像,并对各所述人像区域图像执行图像压缩,得到各人像压缩数据;
背景压缩数据获取模块320,用于确定所述各图像帧进行展示时的背景图像,并对所述背景图像执行图像压缩,得到背景压缩数据。
本实施例的技术方案获取视频数据中的各图像帧,提取各图像帧中的人像区域图像,并对各人像区域图像执行图像压缩,得到各人像压缩图像,以使视频通话系统在减小数据传输压力的情况下保留关键区域,实现减小压力的情况下保证接收方法可以对视频中的各坐席客服的人像进行精确质检;进一步的,确定各图像帧进行展示时的一背景图像,并对背景图像执行图像压缩,得到背景压缩数据;通过一张背景图像代替视频数据的各图像帧中除人像区域以外的区域,以减小背景区域的压缩数据在传输时的数据带宽,并且将背景区域的背景数据更换为静态图片间接的保护了客户的隐私。通过本发明实施例公开的技术方案,实现降低了数据传输带宽,提高了数据传输效率。
在本实施例技术方案的基础上,人像压缩数据获取模块310,包括:
识别单元,用于对各所述图像帧进行人像识别;
人像区域确定单元,用于将所述图像帧中识别出的人像所在的区域确定人像区域;
人像区域图像确定单元,用于提取所述人像区域的人像数据,得到所述人像区域图像。
在本实施例技术方案的基础上,背景压缩数据获取模块320,包括:
背景区域确定单元,用于对于任一图像帧,将人像识别结果中除所述人像区域以外的区域确定为背景区域;
第一背景图像确定单元,用于提取所述背景区域的背景数据,基于所述背景数据确定背景图像。
在本实施例技术方案的基础上,背景图像确定单元,包括:
第一背景图像确定子单元,用于获取所述背景区域的内部边缘的背景边缘数据,确定所述背景边缘数据的边缘均值数据并作为所述人像区域的背景填充数据,并基于所述背景填充数据以及所述背景数据形成背景图像;或,
第二背景图像确定子单元,用于获取所述背景区域预设区域的部分背景数据,将所述部分背景数据作为所述人像区域的背景填充数据,并基于所述背景填充数据以及所述背景数据形成背景图像。
在本实施例技术方案的基础上,所述背景图像为静态图像,所述背景图像的数量为1。
在本实施例技术方案的基础上,背景压缩数据获取模块320,包括:
第二背景图像确定单元,用于获取预设静态图像,并将所述预设静态图像确定为所述背景图像。
在本实施例技术方案的基础上,该装置还包括:
数据传输模块,用于将所述背景压缩数据以及所述各人像压缩数据传输至接收方,以使接收方对所述背景压缩数据以及所述各人像压缩数据进行数据解压,并将解压后的背景图像以及各人像区域图像进行数据视频渲染。
本发明实施例所提供的实时视频流压缩装置可执行本发明任意实施例所提供的实时视频流压缩方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,上述实时视频流压缩装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
实施例四
图5为本发明实施例四提供的一种电子设备的结构示意图。图5示出了适于用来实现本发明实施方式的示例性电子设备12的框图。图5显示的电子设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备12以通用计算电子设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图5所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图5中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及样本数据获取,例如实现本发实施例所提供的一种实时视频流压缩方法步骤,实时视频流压缩方法包括:
获取视频数据中的各图像帧,提取所述各图像帧中的人像区域图像,并对各所述人像区域图像执行图像压缩,得到各人像压缩数据;
确定所述各图像帧进行展示时的一背景图像,并对所述背景图像执行图像压缩,得到背景压缩数据。
当然,本领域技术人员可以理解,处理器还可以实现本发明任意实施例所提供的样本数据获取方法的技术方案。
实施例五
本实施例五提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现例如实现本发实施例所提供的一种实时视频流压缩方法步骤,实时视频流压缩方法包括:
获取视频数据中的各图像帧,提取所述各图像帧中的人像区域图像,并对各所述人像区域图像执行图像压缩,得到各人像压缩数据;
确定所述各图像帧进行展示时的一背景图像,并对所述背景图像执行图像压缩,得到背景压缩数据。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种实时视频流压缩方法,其特征在于,包括:
获取视频数据中的各图像帧,提取所述各图像帧中的人像区域图像,并对各所述人像区域图像执行图像压缩,得到各人像压缩数据;
确定所述各图像帧进行展示时的一背景图像,并对所述背景图像执行图像压缩,得到背景压缩数据。
2.根据权利要求1所述的方法,其特征在于,所述提取所述各图像帧中的人像区域图像,包括:
对各所述图像帧进行人像识别;
将所述图像帧中识别出的人像所在的区域确定人像区域;
提取所述人像区域的人像数据,得到所述人像区域图像。
3.根据权利要求2所述的方法,其特征在于,所述确定所述各图像帧进行展示时的一背景图像,包括:
对于任一图像帧,将人像识别结果中除所述人像区域以外的区域确定为背景区域;
提取所述背景区域的背景数据,基于所述背景数据确定背景图像。
4.根据权利要求3所述的方法,其特征在于,所述基于所述背景数据确定背景图像,包括:
获取所述背景区域的内部边缘的背景边缘数据,确定所述背景边缘数据的边缘均值数据并作为所述人像区域的背景填充数据,并基于所述背景填充数据以及所述背景数据形成背景图像;或,
获取所述背景区域预设区域的部分背景数据,将所述部分背景数据作为所述人像区域的背景填充数据,并基于所述背景填充数据以及所述背景数据形成背景图像。
5.根据权利要求1所述的方法,其特征在于,所述确定所述各图像帧进行展示时的一背景图像,包括:
获取预设静态图像,并将所述预设静态图像确定为所述背景图像。
6.根据权利要求1所述的方法,其特征在于,所述背景图像为静态图像,所述背景图像的数量为1。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述背景压缩数据以及所述各人像压缩数据传输至接收方,以使接收方对所述背景压缩数据以及所述各人像压缩数据进行数据解压,并将解压后的背景图像以及各人像区域图像进行数据视频渲染。
8.一种实时视频流压缩装置,其特征在于,
人像压缩数据获取模块,用于获取视频数据中的各图像帧,提取所述各图像帧中的人像区域图像,并对各所述人像区域图像执行图像压缩,得到各人像压缩数据;
背景压缩数据获取模块,用于确定所述各图像帧进行展示时的背景图像,并对所述背景图像执行图像压缩,得到背景压缩数据。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的实时视频流压缩方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的实时视频流压缩方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110918790.1A CN113660495A (zh) | 2021-08-11 | 2021-08-11 | 实时视频流压缩方法、装置、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110918790.1A CN113660495A (zh) | 2021-08-11 | 2021-08-11 | 实时视频流压缩方法、装置、电子设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113660495A true CN113660495A (zh) | 2021-11-16 |
Family
ID=78491397
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110918790.1A Pending CN113660495A (zh) | 2021-08-11 | 2021-08-11 | 实时视频流压缩方法、装置、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113660495A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114979651A (zh) * | 2022-04-30 | 2022-08-30 | 苏州浪潮智能科技有限公司 | 一种终端视频数据的传输方法、装置、设备及介质 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1842158A (zh) * | 1999-08-09 | 2006-10-04 | 索尼公司 | 发送设备及方法 |
CN102647590A (zh) * | 2012-04-17 | 2012-08-22 | 华为终端有限公司 | 图像压缩方法和装置 |
US20130083153A1 (en) * | 2011-09-30 | 2013-04-04 | Polycom, Inc. | Background Compression and Resolution Enhancement Technique for Video Telephony and Video Conferencing |
CN103460250A (zh) * | 2011-04-11 | 2013-12-18 | 英特尔公司 | 基于感兴趣对象的图像处理 |
US20140168354A1 (en) * | 2012-12-19 | 2014-06-19 | Rabbit, Inc. | Audio video streaming system and method |
CN106162190A (zh) * | 2015-04-08 | 2016-11-23 | 杭州海康威视数字技术股份有限公司 | 一种视频图像压缩和读取的方法、装置及系统 |
CN106664417A (zh) * | 2014-05-15 | 2017-05-10 | 英特尔公司 | 用于视频编码的内容自适应背景前景分割 |
CN107346547A (zh) * | 2017-07-04 | 2017-11-14 | 易视腾科技股份有限公司 | 基于单目平台的实时前景提取方法及装置 |
CN109565590A (zh) * | 2016-08-08 | 2019-04-02 | 联发科技股份有限公司 | 用于视频编解码的基于模型的运动向量推导 |
CN110060203A (zh) * | 2019-04-22 | 2019-07-26 | 京东方科技集团股份有限公司 | 图片显示方法、图片显示装置、电子设备及存储介质 |
CN110795546A (zh) * | 2019-09-12 | 2020-02-14 | 易谷网络科技股份有限公司 | 一种基于智能客服的收敛方法、装置及电子设备 |
CN111292337A (zh) * | 2020-01-21 | 2020-06-16 | 广州虎牙科技有限公司 | 图像背景替换方法、装置、设备及存储介质 |
CN111353395A (zh) * | 2020-02-19 | 2020-06-30 | 南京信息工程大学 | 一种基于长短期记忆网络的换脸视频检测方法 |
US20200320272A1 (en) * | 2019-04-04 | 2020-10-08 | Sri International | Efficient Transmission of Video over Low Bandwidth Channels |
CN112465853A (zh) * | 2020-11-25 | 2021-03-09 | 咪咕视讯科技有限公司 | 视频图片的背景变换方法、装置、电子设备及存储介质 |
CN112585978A (zh) * | 2018-07-30 | 2021-03-30 | 皇家Kpn公司 | 生成用于在vr中显示的复合视频流 |
CN112954398A (zh) * | 2021-02-07 | 2021-06-11 | 杭州朗和科技有限公司 | 编码方法、解码方法、装置、存储介质及电子设备 |
CN113115037A (zh) * | 2021-06-15 | 2021-07-13 | 深圳市中鹏教育科技股份有限公司 | 一种在线教育方法、系统、设备及存储介质 |
-
2021
- 2021-08-11 CN CN202110918790.1A patent/CN113660495A/zh active Pending
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1842158A (zh) * | 1999-08-09 | 2006-10-04 | 索尼公司 | 发送设备及方法 |
CN103460250A (zh) * | 2011-04-11 | 2013-12-18 | 英特尔公司 | 基于感兴趣对象的图像处理 |
US20130083153A1 (en) * | 2011-09-30 | 2013-04-04 | Polycom, Inc. | Background Compression and Resolution Enhancement Technique for Video Telephony and Video Conferencing |
CN102647590A (zh) * | 2012-04-17 | 2012-08-22 | 华为终端有限公司 | 图像压缩方法和装置 |
US20140168354A1 (en) * | 2012-12-19 | 2014-06-19 | Rabbit, Inc. | Audio video streaming system and method |
CN106664417A (zh) * | 2014-05-15 | 2017-05-10 | 英特尔公司 | 用于视频编码的内容自适应背景前景分割 |
CN106162190A (zh) * | 2015-04-08 | 2016-11-23 | 杭州海康威视数字技术股份有限公司 | 一种视频图像压缩和读取的方法、装置及系统 |
CN109565590A (zh) * | 2016-08-08 | 2019-04-02 | 联发科技股份有限公司 | 用于视频编解码的基于模型的运动向量推导 |
CN107346547A (zh) * | 2017-07-04 | 2017-11-14 | 易视腾科技股份有限公司 | 基于单目平台的实时前景提取方法及装置 |
CN112585978A (zh) * | 2018-07-30 | 2021-03-30 | 皇家Kpn公司 | 生成用于在vr中显示的复合视频流 |
US20200320272A1 (en) * | 2019-04-04 | 2020-10-08 | Sri International | Efficient Transmission of Video over Low Bandwidth Channels |
CN110060203A (zh) * | 2019-04-22 | 2019-07-26 | 京东方科技集团股份有限公司 | 图片显示方法、图片显示装置、电子设备及存储介质 |
CN110795546A (zh) * | 2019-09-12 | 2020-02-14 | 易谷网络科技股份有限公司 | 一种基于智能客服的收敛方法、装置及电子设备 |
CN111292337A (zh) * | 2020-01-21 | 2020-06-16 | 广州虎牙科技有限公司 | 图像背景替换方法、装置、设备及存储介质 |
CN111353395A (zh) * | 2020-02-19 | 2020-06-30 | 南京信息工程大学 | 一种基于长短期记忆网络的换脸视频检测方法 |
CN112465853A (zh) * | 2020-11-25 | 2021-03-09 | 咪咕视讯科技有限公司 | 视频图片的背景变换方法、装置、电子设备及存储介质 |
CN112954398A (zh) * | 2021-02-07 | 2021-06-11 | 杭州朗和科技有限公司 | 编码方法、解码方法、装置、存储介质及电子设备 |
CN113115037A (zh) * | 2021-06-15 | 2021-07-13 | 深圳市中鹏教育科技股份有限公司 | 一种在线教育方法、系统、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
DEVESH SAMAIYA, ET AL: "Background Modeling for HEVC Compressed Videos using Radial Basis Network", 《2019 INTERNATIONAL CONFERENCE ON COMMUNICATION AND SIGNAL PROCESSING (ICCSP)》 * |
冀贞贤: "面向视频会议和视频聊天的X264码率控制算法研究", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114979651A (zh) * | 2022-04-30 | 2022-08-30 | 苏州浪潮智能科技有限公司 | 一种终端视频数据的传输方法、装置、设备及介质 |
CN114979651B (zh) * | 2022-04-30 | 2024-06-07 | 苏州浪潮智能科技有限公司 | 一种终端视频数据的传输方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112954398B (zh) | 编码方法、解码方法、装置、存储介质及电子设备 | |
WO2022057789A1 (zh) | 视频清晰度识别方法、电子设备及存储介质 | |
CN110688286B (zh) | 应用程序运行信息传送方法及装置、存储介质、电子设备 | |
CN105165009A (zh) | 一种多可视化组件屏幕共享的系统,装置,和方法 | |
CN111131828B (zh) | 一种图像压缩方法、装置、电子设备和存储介质 | |
CN112714273A (zh) | 屏幕共享显示方法、装置、设备及存储介质 | |
CN112532998A (zh) | 抽取视频帧的方法、装置、设备和可读存储介质 | |
CN113660495A (zh) | 实时视频流压缩方法、装置、电子设备以及存储介质 | |
CN111263164A (zh) | 一种高帧频视频并行编码及重组方法 | |
CN111432213A (zh) | 用于视频和图像压缩的自适应贴片数据大小编码 | |
CN110891195B (zh) | 花屏图像的生成方法、装置、设备和存储介质 | |
CN112468763A (zh) | 会议电视的视频传输和显示方法、装置、设备及存储介质 | |
CN108668170B (zh) | 图像信息处理方法及装置、存储介质 | |
CN111093091A (zh) | 视频处理方法、服务器及系统 | |
CN113766319A (zh) | 图像信息处理方法及装置、存储介质 | |
CN110958460A (zh) | 一种视频存储方法、装置、电子设备及存储介质 | |
CN111147928A (zh) | 视频处理方法、服务器、终端及系统 | |
CN116389772B (zh) | 一种基于北斗网的图像传输方法及系统 | |
CN111080728A (zh) | 一种贴图处理方法、装置、设备及存储介质 | |
CN117528098B (zh) | 基于深压缩码流提升画质的编解码系统、方法及设备 | |
CN110798700B (zh) | 视频处理方法、视频处理装置、存储介质与电子设备 | |
CN116708793B (zh) | 视频的传输方法、装置、设备及存储介质 | |
CN115118922B (zh) | 一种云会议中实时视频合屏插入动图的方法与装置 | |
CN113051415B (zh) | 图像存储方法、装置、设备和存储介质 | |
US20230262210A1 (en) | Visual lossless image/video fixed-rate compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |