CN103813169B - 视频编解码器中可伸缩的对象表示方法和装置 - Google Patents

视频编解码器中可伸缩的对象表示方法和装置 Download PDF

Info

Publication number
CN103813169B
CN103813169B CN201410056434.3A CN201410056434A CN103813169B CN 103813169 B CN103813169 B CN 103813169B CN 201410056434 A CN201410056434 A CN 201410056434A CN 103813169 B CN103813169 B CN 103813169B
Authority
CN
China
Prior art keywords
coding unit
decision
precision
module
coded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410056434.3A
Other languages
English (en)
Other versions
CN103813169A (zh
Inventor
黄铁军
董思维
田永鸿
王耀威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN201410056434.3A priority Critical patent/CN103813169B/zh
Publication of CN103813169A publication Critical patent/CN103813169A/zh
Application granted granted Critical
Publication of CN103813169B publication Critical patent/CN103813169B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提出了一种视频编解码器中可伸缩的对象表示方法,本方法在编码过程中,根据编码单元的划分结构和对象信息来判定编码单元的对象属性,从而将对象属性编入输出视频的比特流;在解码过程中,解码出对象属性,从而得到包括形状、位置的对象信息。利用此方法,本发明提出视频编解码器中可伸缩的对象表示装置。对于一个最大编码单元,根据模式决策对其进行递归划分;对于终止划分的编码单元,判断其是否属于对象:不属于对象则进入标识编码模块为其编码对象索引标识;属于对象则进入对象表示精度决策模块。

Description

视频编解码器中可伸缩的对象表示方法和装置
技术领域
本发明涉及一种视频编解码器中可伸缩的对象表示方法,属于数字媒体处理技术领域中的视频对象表示技术。
背景技术
现有视频编码方法并没有较好的结合对象检测,通常需要对获取的视频码流进行解码,在解码图像上才能进行对象的检测与识别。同时,视频码流中通常不包含对象的位置、形状等信息,这对于快速准确的对象检测和识别是不利的。
发明内容
本发明提出的一种视频编解码器中可伸缩的对象表示方法。该方法的特征在编码过程中,根据编码单元的划分结构和对象信息来判定编码单元的对象属性,从而将对象属性编入输出视频的比特流;在解码过程中,解码出对象属性,从而得到包括形状、位置的对象信息,以用于对象的精确检测与识别跟踪。
本发明提出的一种视频编解码器中可伸缩的对象表示方法,其对象属性包括:
a)对象索引标识:区分不同类别的对象。
b)对象分割标识:区分当前区域是否需要更小粒度的划分,以满足对象表示的准确性要求。
在编码对象属性时,使用的编码方法为:在每个编码单元中增加对象索引标识,用以标识当前编码单元所属的对象。
在编码对象属性时,增加对象分割标识,用以标识当前区域是否需要更细粒度的划分,以逼近对象的形状。
在解码输入的视频比特流时,根据编码单元中解码出的对象索引标识、对象分割标识来恢复对象属性。
基于以上可伸缩的对象表示方法,本发明设计了一种视频编解码器中可伸缩的对象表示装置,包括:
a)编码单元划分模块,
b)对象表示精度决策模块,
c)标识编码模块。
所述的编码单元划分模块,输入为一个最大编码单元。在该模块中,一个最大编码单元根据模式决策将被递归划分。在递归划分过程中,当前编码单元一旦终止划分,则判断其是否属于对象。如果不属于对象,则输出决策结果给标识编码模块;属于对象,则输出决策结果给对象表示精度决策模块。
所述的对象表示精度决策模块,输入为编码单元划分模块的划分结果。对于一个终止划分的编码单元,如果其属于对象,则在对象表示精度决策模块中,判断其大小是否满足对象表示精度。输出决策结果给标识编码模块。
所述的标识编码模块,输入为编码单元划分模块和对象表示精度决策模块的决策结果。对于编码单元划分模块中判断为不属于对象的编码单元和对象表示精度决策模块中判断为满足表示精度的编码单元,为其编码对象索引标识。对于对象表示精度决策模块中判断为不满足表示精度的编码单元,需要先编码对象分割标识,再编码对象索引标识。最终输出编码比特流。
附图说明
图1本发明所述的编码过程的流程图,
图2本发明所述的解码过程流程图,
图3本发明所述的一种视频编解码器中可伸缩的对象表示装置。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明提出了一种视频编解码器中可伸缩的对象表示方法。本方法在编码过程中,根据编码单元的划分结构和对象信息来判定编码单元的对象属性,从而将对象属性编入输出视频的比特流;在解码过程中,解码出对象属性,从而得到包括形状、位置的对象信息。
如图1所示,一种视频编解码器中可伸缩的对象表示方法的编码过程包括:
编码对象属性步骤S1,编码原始视频图像时,判断不同大小的编码单元是否属于对象,编码对象索引标识。如果当前编码单元的大小不足以精确描述对象时,则编码对象分割标识,表明需要更细粒度的编码单元才能够精确表示对象。
如图2所示,一种视频编解码器中可伸缩的对象表示方法的解码过程包括:
解码输入码流步骤S2,此步骤对原始视频图像码流进行解码,获得原始视频图像。
解码对象属性步骤S3,此步骤从解码出的编码单元中获取对象索引标识及对象分割标识,从而得到对象属性。
下面以具体实施例,结合图3进行说明本发明所述一种视频编解码器中可伸缩的对象表示方法的一种可能的实现方式。
输入为YUV4:2:0格式的监控视频序列。对于一个最大编码单元,首先根据模式决策对其进行递归划分。对于终止划分的编码单元,计算对象属性图像中对应区域中属于对象的像素个数,判断当前编码单元是否属于对象,对于非对象的编码单元,则直接编入值为0的对象索引标识;否则通过比较当前编码单元内包含的属于对象的像素个数是否大于对象表示精度阈值,判断当前编码单元满足表示精度。对于满足对象表示精度的编码单元,直接编入对象索引标识;否则,需要先编入对象分割标识,再编入对象索引标识。
之后完成对原始视频图像的编码,输出视频码流。解码时,对原始视频图像进行解码,之后从解码出的编码单元中获取对象属性。
该实例的实现平台为HM12.0,基本配置如表1所示,测试结果如表2所示。
表1配置参数
表2测试结果
以上是对本发明所提供的一种视频编解码器中可伸缩的对象表示方法进行详细介绍,本文中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种视频编解码器中可伸缩的对象表示方法,其特征在于:在编码过程中,根据编码单元的划分结构和对象信息来判定编码单元的对象属性,从而将对象属性编入输出视频的比特流;所述的对象属性包括:a)对象索引标识:区分不同类别的对象,b)对象分割标识:区分当前区域是否需要更小粒度的划分,以满足对象表示的准确性要求;在编码对象属性时,使用的编码方法为:在每个编码单元中增加对象索引标识,用以标识当前编码单元所属的对象;在解码过程中,解码出对象属性,从而得到包括形状、位置的对象信息,用于对象的精确检测与识别跟踪;
所述的对象表示方法具体为:
输入为YUV4:2:0格式的监控视频序列;对于一个最大编码单元,首先根据模式决策对其进行递归划分,对于终止划分的编码单元,计算对象属性图像中对应区域中属于对象的像素个数,判断当前编码单元是否属于对象,对于非对象的编码单元,则直接编入值为0的对象索引标识;否则通过比较当前编码单元内包含的属于对象的像素个数是否大于对象表示精度阈值,判断当前编码单元满足表示精度;对于满足对象表示精度的编码单元,直接编入对象索引标识;否则,需要先编入对象分割标识,再编入对象索引标识;之后完成对原始视频图像的编码,输出视频码流;解码时,对原始视频图像进行解码,之后从解码出的编码单元中获取对象属性。
2.如权利要求1所述的对象表示方法,其特征在于,在编码对象属性时,增加对象分割标识,用以标识当前区域是否需要更细粒度的划分,以逼近对象的形状。
3.如权利要求1所述的对象表示方法,其特征在于,在解码原始视频图像时,根据编码单元中解码出的对象索引标识、对象分割标识来恢复对象属性。
4.一种视频编解码器中可伸缩的对象表示装置,其特征在于,包括如下模块:
a)编码单元划分模块,
b)对象表示精度决策模块,
c)标识编码模块;
对于一个最大编码单元,首先根据模式决策对其进行递归划分;对于终止划分的编码单元,判断其是否属于对象:不属于对象则进入标识编码模块为其编码对象索引标识;属于对象则进入对象表示精度决策模块,根据对象表示精度的决策结果,为其编码对象索引标识;其中不满足对象表示精度的编码单元,需要在编码对象索引标识前先编码对象分割标识;所述的标识编码模块,输入为编码单元划分模块和对象表示精度决策模块的决策结果;对于编码单元划分模块中判断为不属于对象的编码单元和对象表示精度决策模块中判断为满足表示精度的编码单元,为其编码对象索引标识;对于对象表示精度决策模块中判断为不满足表示精度的编码单元,需要先编码对象分割标识,再编码对象索引标识;最终输出编码比特流。
5.如权利要求4所述的对象表示装置,其特征在于,所述的编码单元划分模块,输入为一个最大编码单元;在该模块中,一个最大编码单元根据模式决策将被递归划分;在递归划分过程中,当前编码单元一旦终止划分,则判断其是否属于对象:如果不属于对象,则输出决策结果给标识编码模块;属于对象,则输出决策结果给对象表示精度决策模块。
6.如权利要求4所述的对象表示装置,其特征在于,所述的对象表示精度决策模块,输入为编码单元划分模块的划分结果;对于一个终止划分的编码单元,如果其属于对象,则在对象表示精度决策模块中,判断其大小是否满足对象表示精度;输出决策结果给标识编码模块。
CN201410056434.3A 2014-02-19 2014-02-19 视频编解码器中可伸缩的对象表示方法和装置 Active CN103813169B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410056434.3A CN103813169B (zh) 2014-02-19 2014-02-19 视频编解码器中可伸缩的对象表示方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410056434.3A CN103813169B (zh) 2014-02-19 2014-02-19 视频编解码器中可伸缩的对象表示方法和装置

Publications (2)

Publication Number Publication Date
CN103813169A CN103813169A (zh) 2014-05-21
CN103813169B true CN103813169B (zh) 2017-07-21

Family

ID=50709301

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410056434.3A Active CN103813169B (zh) 2014-02-19 2014-02-19 视频编解码器中可伸缩的对象表示方法和装置

Country Status (1)

Country Link
CN (1) CN103813169B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104580825B (zh) * 2015-01-28 2018-05-08 苏州科达科技股份有限公司 在视频中识别及跟踪对象的方法
EP3509309A1 (en) * 2016-08-30 2019-07-10 Sony Corporation Transmitting device, transmitting method, receiving device and receiving method
CN110741635A (zh) * 2018-06-29 2020-01-31 深圳市大疆创新科技有限公司 编码方法、解码方法、编码设备和解码设备
CN110720224B (zh) * 2018-07-05 2021-12-17 深圳市大疆创新科技有限公司 图像处理方法和装置
CN111221924B (zh) * 2018-11-23 2023-04-11 腾讯科技(深圳)有限公司 一种数据处理方法、装置、存储介质和网络设备
US20220103846A1 (en) * 2020-09-28 2022-03-31 Alibaba Group Holding Limited Supplemental enhancement information message in video coding
WO2023035552A1 (en) * 2021-09-13 2023-03-16 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Video coding by object recognition and feature unit management
WO2023035551A1 (en) * 2021-09-13 2023-03-16 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Video coding by object recognition and feature extraction

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101507281A (zh) * 2006-07-12 2009-08-12 诺基亚公司 媒体文件中的兴趣区域可缩放性信息的信号发送
CN102081671A (zh) * 2011-01-25 2011-06-01 北京中星微电子有限公司 一种视频可伸缩文件的生成方法及装置
CN102395029A (zh) * 2011-11-05 2012-03-28 江苏物联网研究发展中心 一种支持视频可伸缩浏览的视频编解码方法和装置
CN102595119A (zh) * 2011-01-14 2012-07-18 华为技术有限公司 条带编码方法及装置、条带解码方法及装置
CN102804782A (zh) * 2010-01-15 2012-11-28 三星电子株式会社 用于预测编码的使用可变分区的视频编码的方法和设备以及用于预测编码的使用可变分区的视频解码的方法和设备
CN103119938A (zh) * 2010-07-21 2013-05-22 瑞典爱立信有限公司 画面编码和解码
CN103402087A (zh) * 2013-07-23 2013-11-20 北京大学 一种基于可分级位流的视频编解码方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101507281A (zh) * 2006-07-12 2009-08-12 诺基亚公司 媒体文件中的兴趣区域可缩放性信息的信号发送
CN102804782A (zh) * 2010-01-15 2012-11-28 三星电子株式会社 用于预测编码的使用可变分区的视频编码的方法和设备以及用于预测编码的使用可变分区的视频解码的方法和设备
CN103119938A (zh) * 2010-07-21 2013-05-22 瑞典爱立信有限公司 画面编码和解码
CN102595119A (zh) * 2011-01-14 2012-07-18 华为技术有限公司 条带编码方法及装置、条带解码方法及装置
CN102081671A (zh) * 2011-01-25 2011-06-01 北京中星微电子有限公司 一种视频可伸缩文件的生成方法及装置
CN102395029A (zh) * 2011-11-05 2012-03-28 江苏物联网研究发展中心 一种支持视频可伸缩浏览的视频编解码方法和装置
CN103402087A (zh) * 2013-07-23 2013-11-20 北京大学 一种基于可分级位流的视频编解码方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于背景模型的监控视频编码研究;张贤国;《中国博士学位论文电子期刊网》;20131015;全文 *

Also Published As

Publication number Publication date
CN103813169A (zh) 2014-05-21

Similar Documents

Publication Publication Date Title
CN103813169B (zh) 视频编解码器中可伸缩的对象表示方法和装置
CN102509118B (zh) 一种监控视频检索方法
CN109684803B (zh) 基于手势滑动的人机验证方法
CN106920206B (zh) 一种基于对抗神经网络的隐写分析方法
CN104778470B (zh) 基于组件树和霍夫森林的文字检测和识别方法
CN101655983B (zh) 主颜色提取装置和方法
CN104036287A (zh) 一种基于人类运动显著轨迹的视频分类方法
WO2021036550A1 (zh) 基于视觉任务的点云数据压缩质量评价方法及系统
CN104778474A (zh) 一种用于目标检测的分类器构建方法及目标检测方法
CN104408711A (zh) 一种基于多尺度区域融合的显著区域检测方法
CN110276264A (zh) 一种基于前景分割图的人群密度估计方法
CN104123529A (zh) 人手检测方法及系统
CN102509109B (zh) 一种唐卡图像与非唐卡图像的区分方法
CN109035246A (zh) 一种人脸的图像选择方法及装置
CN102567738B (zh) 基于高斯分布的色情视频快速检测方法
CN103714122A (zh) 一种基于局部分块二进制编码特征的图像检索方法
CN104933408B (zh) 手势识别的方法及系统
CN111783639A (zh) 图像检测方法、装置、电子设备及可读存储介质
CN113963170A (zh) 一种基于交互式特征融合的rgbd图像显著性检测方法
CN105116394A (zh) 一种基于多维细微特征分析的目标点迹提取方法
CN110516527B (zh) 一种基于实例分割的视觉slam回环检测改进方法
CN108573238A (zh) 一种基于双网络结构的车辆检测方法
CN104636708A (zh) 一种局部文档图像的比对方法及系统
CN105701464A (zh) 一种判断人脸检测误检及关键点定位准确度的方法
CN105574837A (zh) 一种图像相似性匹配方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant