CN103517073B - 视频编解码方法、装置及系统 - Google Patents

视频编解码方法、装置及系统 Download PDF

Info

Publication number
CN103517073B
CN103517073B CN201310294435.7A CN201310294435A CN103517073B CN 103517073 B CN103517073 B CN 103517073B CN 201310294435 A CN201310294435 A CN 201310294435A CN 103517073 B CN103517073 B CN 103517073B
Authority
CN
China
Prior art keywords
roi
image
current frame
frame image
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310294435.7A
Other languages
English (en)
Other versions
CN103517073A (zh
Inventor
陈明亮
林巍嶢
郑萧桢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Shanghai Jiaotong University
Original Assignee
Huawei Technologies Co Ltd
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd, Shanghai Jiaotong University filed Critical Huawei Technologies Co Ltd
Priority to CN201310294435.7A priority Critical patent/CN103517073B/zh
Publication of CN103517073A publication Critical patent/CN103517073A/zh
Priority to PCT/CN2014/081564 priority patent/WO2015003573A1/zh
Application granted granted Critical
Publication of CN103517073B publication Critical patent/CN103517073B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明实施例提供一种视频编解码方法、装置及系统。其中,方法包括:从当前帧图像中检测出至少一个ROI的位置信息;基于预设近似度匹配规则,将所述当前帧图像中ROI的位置信息与已编码图像中至少一个ROI的位置信息进行近似度匹配,获得所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系;对各所述位置关系进行编码,作为当前帧图像中各ROI的描述信息。本发明实施例可以提高视频数据中ROI描述信息的压缩效率。

Description

视频编解码方法、装置及系统
技术领域
本发明实施例涉及编解码技术,尤其涉及一种视频编解码方法、装置及系统。
背景技术
视频编解码在如今的信息传输中有着举足轻重的地位,它对压缩信息量,提高视频清晰度有着十分重要的应用。
目前,视频压缩技术中基于感兴趣区域(Region Of Interest,简称ROI)的视频编解码方法已经成为热点。现有的编码方法策略大多采用相似的步骤:先对视频帧中的图像块进行分类,区分出ROI和非ROI等分类区域;然后,再根据线形预测模型、码率失真模型调节分类图像块的量化参数,对ROI采用小的量化参数,对非ROI采用大的量化参数;最后,根据得到的量化参数对原始视频帧数据进行编码。所以,在编码端需要采用描述信息指明哪些是ROI,以便在解码端能够根据描述信息获知哪些区域是ROI,从而采用对应的算法进行解码。
现有的视频编解码系统通常对ROI描述信息采取直接压缩的方法,即对这些描述信息进行直接编码写入码流中。当一帧图像中ROI较多而使得描述信息量较大时,直接压缩的方法会大幅增加比特流的开销而影响编码效率。
发明内容
本发明实施例提供一种视频编解码方法、装置及系统,以提高视频数据中ROI描述信息的压缩效率。
第一方面,本发明实施例提供一种视频编码方法,包括:
从当前帧图像中检测出至少一个感兴趣区域ROI的位置信息;
基于预设近似度匹配规则,将所述当前帧图像中ROI的位置信息与已编码图像中至少一个ROI的位置信息进行近似度匹配,获得所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系;
对各所述位置关系进行编码,作为当前帧图像中各ROI的描述信息。
在第一方面的第一种可能的实现方式中,所述已编码图像至少包括下述一种已编码图像:
当前帧图像编码顺序之前第n帧已编码图像、当前帧图像显示顺序之前第n帧已编码图像、参考帧缓存中的已编码图像或按预设规则的已编码图像;
其中n大于或等于1。
在第一方面的第二种可能的实现方式中,所述ROI为矩形区域,所述ROI的位置信息包括所述ROI的左上角坐标值、宽和高。
根据第一方面、第一方面第一种至第二种可能的实现方式任意一种,在第三种可能的实现方式中,所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系包括如下一种或多种:
当前帧图像中的ROI相对于已编码图像为新出现ROI;
当前帧图像中的ROI相对于已编码图像中的ROI为位置相同ROI;
当前帧图像中的ROI相对于已编码图像中的ROI为位置偏差ROI;
已编码图像中的ROI相对于当前帧图像中的ROI为消失ROI。
根据第一方面第三种可能的实现方式,在第四种可能的实现方式中,基于预设近似度匹配规则,将所述当前帧图像中ROI的位置信息与已编码图像中至少一个ROI的位置信息进行近似度匹配,获得所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系包括:
将当前帧图像中每个ROI的位置信息与已编码图像中每个ROI的位置信息进行比较;
当比较结果为位置信息相同时,则位置关系为位置相同;
当比较结果为当前帧图像中ROI与已编码图像中ROI的位置信息差值小于设定阈值时,则位置关系为位置偏差;
当比较结果为当前帧图像中ROI与已编码图像中ROI的位置信息差值等于或大于设定阈值时,则位置关系为新出现;
已编码图像中的ROI与当前帧图像中ROI不存在位置相同或位置偏差关系的ROI确定位置关系为消失。
根据第一方面第四种可能的实现方式,在第五种可能的实现方式中,对各所述位置关系进行编码包括:
对新出现ROI的位置关系,对所述新出现ROI的位置信息数值进行编码;
对位置相同ROI的位置关系,编码为第一标识;
对位置偏差ROI的位置关系,采用所述位置偏差ROI与已编码图像中ROI的位置信息差分值进行编码;
对消失ROI的位置关系,编码为第二标识。
根据第一方面第五种可能的实现方式,在第六种可能的实现方式中,所述第一标识和第二标识的比特位为一位。
根据第一方面第六种可能的实现方式,在第七种可能的实现方式中,对各所述位置关系进行编码,作为当前帧图像中各ROI的描述信息包括:
将各所述位置关系的编码值按照ROI的序号进行排序,作为当前帧图像中各ROI的描述信息,其中,位置相同ROI、位置偏差ROI和消失ROI的序号与已编码图像中对应的ROI序号相同,新出现ROI在已有序号后分配新的序号。
根据第一方面第七种可能的实现方式,在第八种可能的实现方式中,将各所述位置关系的编码值按照ROI的序号进行排序,作为当前帧图像中各ROI的描述信息包括:
在所述描述信息的第一字段记录新出现ROI和位置偏差ROI的数目;
在所述描述信息的第二字段记录新出现ROI的数目;
在所述描述信息的第三字段记录位置相同ROI和消失ROI的数目;
根据所述第三字段记录的数目,按照ROI序号,在所述描述信息的第四字段记录位置相同ROI和消失ROI的编码值;
根据所述第一字段和第二字段记录的数目,按照ROI序号,在所述描述信息的第五字段记录位置偏差ROI的编码值;
在所述描述信息的第六字段记录新出现ROI的编码值。
第二方面,本发明实施例提供一种视频解码方法,包括:
获取当前帧图像中至少一个ROI的描述信息;
获取当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系;
根据所述当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系和描述信息解码值,获取当前帧图像中ROI的位置信息。
在第二方面的第一种可能的实现方式中,所述已解码图像至少包括下述一种已解码图像:
当前帧图像解码顺序之前第n帧已解码图像、当前帧图像显示顺序之前第n帧已解码图像、参考帧缓存中的已解码图像或按预设规则的已解码图像;
其中n大于或等于1。
在第二方面的第二种可能的实现方式中,所述ROI为矩形区域,所述ROI的位置信息包括所述ROI的左上角坐标值、宽和高。
根据第二方面、第二方面第一种至第二种可能的实现方式任意一种,在第三种可能的实现方式中,所述当前帧图像中各ROI与所述已解码图像中各ROI的位置关系包括如下一种或多种:
当前帧图像中的ROI相对于已解码图像为新出现ROI;
当前帧图像中的ROI相对于已解码图像中的ROI为位置相同ROI;
当前帧图像中的ROI相对于已解码图像中的ROI为位置偏差ROI;
已解码图像中的ROI相对于当前帧图像中的ROI为消失ROI。
根据第二方面第三种可能的实现方式,在第四种可能的实现方式中,获取当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系,包括:
解码描述信息中的字段信息,根据所述字段信息获取当前帧图像中ROI的位置关系。
根据第二方面第四种可能的实现方式,在第五种可能的实现方式中,所述解码描述信息中的字段信息,根据所述字段信息获取当前帧图像中ROI的位置关系,包括:
获取当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系包括:
解码所述描述信息的第一字段,获取新出现ROI和位置偏差ROI的数目;
解码所述描述信息的第二字段,获取新出现ROI的数目;
解码所述描述信息的第三字段,获取位置相同ROI和消失ROI的数目;
根据所述第三字段记录的数目,逐个解码所述描述信息的第四字段记录的编码值,获取第一标识,并根据所述第一标识和ROI序号获取位置相同ROI的位置关系,所示第一标识用于标识位置相同ROI,或获取第二标识,并根据所述第二标识和获取消失ROI的位置关系,所述第二标识用于标识消失ROI;
根据所述第一字段和第二字段记录的数目,解码所述描述信息的第五字段记录的编码值,以按照ROI序号获取位置偏差ROI的位置关系;
解码所述描述信息的第六字段中各新出现ROI的编码值,以按照ROI序号获取新出现ROI的位置关系。
根据第二方面第五种可能的实现方式,在第六种可能的实现方式中,根据ROI序号获取ROI位置关系,包括:
根据ROI序号和已编码图像中ROI序号的排序关系获取当前帧图像中ROI的排序关系,并根据所述排序关系获取ROI位置关系;其中位置相同ROI、位置偏差ROI和消失ROI的序号与已编码图像中对应的ROI序号相同,新出现ROI在已有序号后分配新的序号。
根据第二方面第六种可能的实现方式,在第七种可能的实现方式中,所述根据所述当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系和描述信息解码值,获取当前帧图像中ROI的位置信息,包括:
将与位置相同ROI对应的已解码图像中ROI位置信息作为当前帧图像中位置相同的ROI的位置信息;
根据所述第五字段记录的位置偏差解码值和与位置偏差ROI对应的已解码图像中ROI位置信息,计算获取当前帧图像中位置偏差ROI的位置信息;
根据所述第六字段记录的位置解码值,计算获取当前帧图像中新出现ROI的位置信息。
第三方面,本发明实施例提供一种视频编码装置,包括:
检测模块,用于从当前帧图像中检测出至少一个ROI的位置信息;
位置关系获取模块,用于基于预设近似度匹配规则,将所述当前帧图像中ROI的位置信息与已编码图像中至少一个ROI的位置信息进行近似度匹配,获得所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系;
编码模块,用于对各所述位置关系进行编码,作为当前帧图像中各ROI的描述信息。
在第三方面的第一种可能的实现方式中,所述已编码图像至少包括下述一种已编码图像:
当前帧图像编码顺序之前第n帧已编码图像、当前帧图像显示顺序之前第n帧已编码图像、参考帧缓存中的已编码图像或按预设规则的已编码图像;
其中n大于或等于1。
在第三方面的第二种可能的实现方式中,所述ROI为矩形区域,所述ROI的位置信息包括所述ROI的左上角坐标值、宽和高。
根据第三方面、第三方面第一种至第二种可能的实现方式任意一种,在第二种可能的实现方式中,所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系包括如下一种或多种:
当前帧图像中的ROI相对于已编码图像为新出现ROI;
当前帧图像中的ROI相对于已编码图像中的ROI为位置相同ROI;
当前帧图像中的ROI相对于已编码图像中的ROI为位置偏差ROI;
已编码图像中的ROI相对于当前帧图像中的ROI为消失ROI。
根据第三方面第三种可能的实现方式,在第四种可能的实现方式中,所述位置关系获取模块,具体用于:
将当前帧图像中每个ROI的位置信息与已编码图像中每个ROI的位置信息进行比较;
当比较结果为位置信息相同时,则位置关系为位置相同;
当比较结果为当前帧图像中ROI与已编码图像中ROI的位置信息差值小于设定阈值时,则位置关系为位置偏差;
当比较结果为当前帧图像中ROI与已编码图像中ROI的位置信息差值等于或大于设定阈值时,则位置关系为新出现;
已编码图像中的ROI与当前帧图像中ROI不存在位置相同或位置偏差关系的ROI确定位置关系为消失。
根据第三方面第四种可能的实现方式,在第五种可能的实现方式中,所述编码模块,具体用于:
对新出现ROI的位置关系,对所述新出现ROI的位置信息数值进行编码;
对位置相同ROI的位置关系,编码为第一标识;
对位置偏差ROI的位置关系,采用所述位置偏差ROI与已编码图像中ROI的位置信息差分值进行编码;
对消失ROI的位置关系,编码为第二标识。
根据第三方面第五种可能的实现方式,在第六种可能的实现方式中,所述第一标识和第二标识的比特位为一位。
根据第三方面第六种可能的实现方式,在第七种可能的实现方式中,所述编码模块,包括:
排序单元,用于将各所述位置关系的编码值按照ROI的序号进行排序,作为当前帧图像中各ROI的描述信息,其中,位置相同ROI、位置偏差ROI和消失ROI的序号与已编码图像中对应的ROI序号相同,新出现ROI在已有序号后分配新的序号。
根据第三方面第七种可能的实现方式,在第八种可能的实现方式中,所述排序单元,具体用于:
在所述描述信息的第一字段记录新出现ROI和位置偏差ROI的数目;
在所述描述信息的第二字段记录新出现ROI的数目;
在所述描述信息的第三字段记录位置相同ROI和消失ROI的数目;
根据所述第三字段记录的数目,按照ROI序号,在所述描述信息的第四字段记录位置相同ROI和消失ROI的编码值;
根据所述第一字段和第二字段记录的数目,按照ROI序号,在所述描述信息的第五字段记录位置偏差ROI的编码值;在所述描述信息的第六字段记录新出现ROI的编码值。
第四方面,本发明实施例提供一种视频解码装置,包括:
描述信息获取模块,用于获取当前帧图像中至少一个ROI的描述信息;
位置关系获取模块,用于获取当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系;
位置信息获取模块,用于根据所述当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系和描述信息解码值,获取当前帧图像中ROI的位置信息。
在第四方面的第一种可能的实现方式中,所述已解码图像至少包括下述一种已解码图像:
当前帧图像解码顺序之前第n帧已解码图像、当前帧图像显示顺序之前第n帧已解码图像、参考帧缓存中的已解码图像或按预设规则的已解码图像;
其中n大于或等于1。
在第四方面的第二种可能的实现方式中,所述ROI为矩形区域,所述ROI的位置信息包括所述ROI的左上角坐标值、宽和高。
根据第四方面、第四方面第一种至第二种可能的实现方式,所述当前帧图像中各ROI与所述已解码图像中各ROI的位置关系包括如下一种或多种:
当前帧图像中的ROI相对于已解码图像为新出现ROI;
当前帧图像中的ROI相对于已解码图像中的ROI为位置相同ROI;
当前帧图像中的ROI相对于已解码图像中的ROI为位置偏差ROI;
已解码图像中的ROI相对于当前帧图像中的ROI为消失ROI。
根据第四方面第三种可能的实现方式,在第四种可能的实现方式中,所述位置关系获取,具体用于:
解码描述信息中的字段信息,根据所述字段信息获取当前帧图像中ROI的位置关系。
根据第四方面第四种可能的实现方式,在第五种可能的实现方式中,所述位置关系获取模块,具体用于:
解码所述描述信息的第一字段,获取新出现ROI和位置偏差ROI的数目;
解码所述描述信息的第二字段,获取新出现ROI的数目;
解码所述描述信息的第三字段,获取位置相同ROI和消失ROI的数目;
根据所述第三字段记录的数目,逐个解码所述描述信息的第四字段记录的编码值,获取第一标识,并根据所述第一标识和ROI序号获取位置相同ROI的位置关系,所示第一标识用于标识位置相同ROI,或获取第二标识,并根据所述第二标识和获取消失ROI的位置关系,所述第二标识用于标识消失ROI;
根据所述第一字段和第二字段记录的数目,解码所述描述信息的第五字段记录的编码值,以按照各ROI序号的排序关系获取位置偏差ROI的位置关系;
解码所述描述信息的第六字段中各新出现ROI的编码值,以按照各ROI序号的排序关系获取新出现ROI的位置关系。
根据第四方面第四种可能的实现方式,在第五种可能的实现方式中,所述位置关系获取模块,具体用于:
根据ROI序号和已编码图像中ROI序号的排序关系获取当前帧图像中ROI的排序关系,并根据所述排序关系获取ROI位置关系;其中位置相同ROI、位置偏差ROI和消失ROI的序号与已编码图像中对应的ROI序号相同,新出现ROI在已有序号后分配新的序号。
根据第四方面第五种可能的实现方式,在第六种可能的实现方式中,所述位置信息获取模块,具体用于:
将与位置相同ROI对应的已解码图像中ROI位置信息作为当前帧图像中位置相同的ROI的位置信息;
根据所述第五字段记录的位置偏差解码值和与位置偏差ROI对应的已解码图像中ROI位置信息,计算获取当前帧图像中位置偏差ROI的位置信息;
根据所述第六字段记录的位置解码值,计算获取当前帧图像中新出现ROI的位置信息。
第五方面,本发明实施例提供一种视频编解码系统,包括:
根据第三方面、第三方面的第一种至第八种可能的实现方式的任意一种所述的视频编码装置;
根据第四方面、第四方面的第一种至第七种可能的实现方式的任意一种所述的视频解码装置。
本发明实施例通过根据当前帧图像中ROI与已编码图像中ROI的对应关系,实现利用时域编码信息,即利用已编码图像的ROI描述信息对当前帧图像的ROI描述信息进行压缩编码。由于在时域上相近的两帧图像的ROI描述信息相关度较大,本方法可以有效提高ROI描述信息的编解码压缩效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明视频编码方法实施例一的流程图;
图2为本发明视频编码方法实施例二的流程图;
图3为图2中的ROI位置关系示意图;
图4为图2中的ROI位置关系具体编码规则示意图;
图5为本发明视频解码方法实施例一的流程图;
图6为本发明视频编码装置实施例一的结构图;
图7为本发明视频编码装置实施例二的结构图;
图8为本发明视频解码装置实施例一的结构图;
图9为本发明视频编解码系统实施例一的结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明视频编码方法实施例一的流程图,本实施例的方法执行主体是一个视频编码装置,该装置能够以硬件或软件的形式实现,可配置在编码器中,如图1所示,该方法包括以下步骤:
步骤101、从当前帧图像中检测出至少一个ROI的位置信息;
本步骤中可以使用判断ROI的技术在当前帧中检测ROI位置信息,如基于强健性肤色检测器技术、基于图像块内容的运动性和纹理性分析技术,本发明实施例对识别ROI的方式并不进行限制。
ROI的位置信息可以通过多种形式来表示,例如,对于圆形区域可描述为圆心和半径,对于矩形区域可描述为四角坐标值。可选地,本步骤中的ROI可以为矩形区域,则所述ROI的位置信息包括所述ROI的左上角坐标值、宽和高。
步骤102、基于预设近似度匹配规则,将所述当前帧图像中ROI的位置信息与已编码图像中至少一个ROI的位置信息进行近似度匹配,获得所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系;
本步骤中,具体地,所述已编码图像至少包括下述一种已编码图像:
当前帧图像编码顺序之前第n帧已编码图像、当前帧图像显示顺序之前第n帧已编码图像、参考帧缓存中的已编码图像或按预设规则的已编码图像;其中n大于或等于1。
预设近似度匹配规则可以根据所述当前帧图像中ROI的位置信息与已编码图像中至少一个ROI的位置信息进行比较运算的结果设定。其中编码图像可以是上一帧图像,或者一定时间范围内的前几帧图像中的一个或多个。
具体地,根据近似度匹配的结果,可以将在所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系定义成包括如下一种或多种:
当前帧图像中的ROI相对于已编码图像为新出现ROI;
当前帧图像中的ROI相对于已编码图像中的ROI为位置相同ROI;
当前帧图像中的ROI相对于已编码图像中的ROI为位置偏差ROI;
已编码图像中的ROI相对于当前帧图像中的ROI为消失ROI。
步骤103、对各所述位置关系进行编码,作为当前帧图像中各ROI的描述信息。
相对现有技术中,对ROI描述信息采取直接压缩的方法,即对这些描述信息进行直接编码写入码流中,本实施例通过根据当前帧图像中ROI与已编码图像中ROI的对应关系,实现利用时域编码信息,即利用已编码图像的ROI描述信息对当前帧图像的ROI描述信息进行压缩编码。由于在时域上相近的两帧图像的ROI描述信息相关度较大,所以相同或相似的描述信息较多,而新的描述信息较少,因此可减少描述信息的数据量,本方法可以有效提高ROI的编码压缩效率。
图2为本发明视频编码方法实施例二的流程图,本实施例是上述实施例的基础上,增加计算位置关系计算和对位置关系编码的具体步骤,如图2所示,该方法具体包括以下步骤:
步骤201、从当前帧图像中检测出至少一个ROI的位置信息;
步骤202、基于预设近似度匹配规则,将所述当前帧图像中ROI的位置信息与已编码图像中至少一个ROI的位置信息进行近似度匹配,获得所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系;
本步骤中,位置关系包括上一实施例中所述的新出现ROI、位置相同ROI、位置偏差ROI和消失ROI,具体计算时,将当前帧图像中每个ROI的位置信息与已编码图像中每个ROI的位置信息进行比较;当比较结果为位置信息相同时,则位置关系为位置相同;当比较结果为当前帧图像中ROI与已编码图像中ROI的位置信息差值小于设定阈值时,则位置关系为位置偏差;当比较结果为当前帧图像中ROI与已编码图像中ROI的位置信息差值等于或大于设定阈值时,则位置关系为新出现;已编码图像中的ROI与当前帧图像中ROI不存在位置相同或位置偏差关系的ROI确定位置关系为消失。
预设近似度匹配规则可以根据所述当前帧图像中ROI的位置信息与已编码图像中至少一个ROI的位置信息进行比较运算的结果设定,比如ROI的位置信息定义为R={x,y,w,h},其中x和y分别是ROI左上角的横纵坐标,w是ROI的宽,h是ROI的长。两ROI的相近程度可定义为:OP(R,R*)=(x-x*)2+(y-y*)2+(w-w*)2+(h-h*)2,其中R和R*分别是当前帧和已编码图像中的ROI。对R的每个OP进行计算,寻找出最小值,此时的R*就是R在上一帧对应的ROI。同时应对最小值制定一个上限TOP,避免得到的R*离R位置相差很远。用数学语言可以表示为:
R i * = arg min R * ( k ) ( OP ( R i , R * ( k ) ) ) if OP ( R i , R * ( k ) ) ≤ T OP Null if OP ( R i , R * ( k ) ) > T OP
当OP(R,R*)=0时,说明Ri为与已编码图像中对应的Ri *位置相同;
当OP(R,R*)≤TOP时,说明Ri为与已编码图像中对应的Ri *位置偏差;
当OP(R,R*)>TOP时,说明Ri为相对于已编码图像中对应的Ri *为新出现;
时,说明Ri在已编码图像中没有对应的ROI,关系为消失。
步骤203、将各所述位置关系的编码值按照ROI的序号进行排序,作为当前帧图像中各ROI的描述信息;
可选地,本步骤中排序时,可以使用任何的排序方法,比如顺序、倒序或者光栅扫描顺序或其他排序方法,其中位置相同ROI、位置偏差ROI和消失ROI的序号与已编码图像中对应的ROI序号相同,新出现ROI在已有序号后分配新的序号。所述按光栅扫描顺序排序的方法为:按从左往右从上至下依次扫描图像中的像素点,以ROI左上角位置为基准,扫描到新的ROI则将该ROI序号在前一ROI序号基础上加1。
图3为图2中的ROI位置关系示意图,如图3所示,以上一帧作为已编码图像为例,根据位置近似度匹配计算结果,将在上一帧中出现的R2 *和R5 *定义为消失的ROI,将R1、R3、R4和R6定义为位置相同或位置偏差的ROI,序号各ROI与上一帧对应的ROI相同,将R7、R8和R9定义为新出现的ROI,序号在已有序号后分配新的序号。
本步骤中,进一步地,在所述描述信息的第一字段记录新出现ROI和位置偏差ROI的数目;在所述描述信息的第二字段记录新出现ROI的数目;在所述描述信息的第三字段记录位置相同ROI和消失ROI的数目;根据所述第三字段记录的数目,按照ROI序号,在所述描述信息的第四字段记录位置相同ROI和消失ROI的编码值;根据所述第一字段和第二字段记录的数目,按照ROI序号,在所述描述信息的第五字段记录位置偏差ROI的编码值;在所述描述信息的第六字段记录新出现ROI的编码值。
具体地,本步骤中,对新出现ROI的位置关系,对所述新出现ROI的位置信息数值进行编码;对位置相同ROI的位置关系,编码为第一标识;对位置偏差ROI的位置关系,采用所述位置偏差ROI与已编码图像中ROI的位置信息差分值进行编码;对消失ROI的位置关系,编码为第二标识。
较佳地,所述第一标识和第二标识的比特位为一位。比如当已编码图像中存在的ROI在当前帧中消失时,标志为“消失跳过”模式,可以给此模式分配第二标识“0”;当两帧的对应ROI位置信息相同时,标志为“位置相同跳过”模式,可以给此模式分配第一标识“1”。
图4为图2中的ROI位置关系具体编码规则示意图,如图4所示,以上一帧作为已编码图像为例,R1为位置相同的ROI,编码时,分配第一标识为“1”;R2为消失的ROI,编码时,分配第二标识为“0”;R3为位置偏差ROI,编码时,采用R3与上一帧图像中R3 *的位置信息差分值进行编码;R4为新出现的ROI,编码时采用固定长度编码。
如图4的编码所示,编码的顺序是按照ROI的编号顺序编码。
第一字段表示采用编码策略的个数,即新出现ROI和位置偏差ROI的数目,因图4中只有1个新出现的R4和1个位置偏差的R3,因此第一字段的值为固定8个字节的二进制的“0000010”,即2个;
第二字段表示新出现感兴趣的个数,因图4中只有1个新出现的R4,因此用固定2个字节表示1个,即二进制“01”;具体实施时,可以根据ROI的个数使用多个二进制字节表示,比如4个或8个等;
第三字段表示采用可变长度编码的表示“跳过的个数”,即位置相同ROI和消失ROI的数目,图4中存在1个位置相应的R1和1个位置消失的R2,因此第三字段采用可变长度编码,以用可变长度编码规则“001”表示2,其中可变长度编码规则中以二进制“0”表示0,“01”表示1,“001”表示2。
第四字段用“0”和“1”分别表示消失的ROI和相同的ROI位置信息编码;
第五字段表示偏差ROI的编码值,即采用偏差编码的ROI与对应的上一帧中ROI位置信息的偏差值的编码。
第六字段表示采用固定长度编码的新出现的ROI的位置信息编码。
需要说明的是,在第五和第六字段中间设置一个“0”,表示“跳过的个数为0”,即后面不存在采用位置相同ROI和消失ROI的编码。也是判断采用差值编码结束的重要标记。
步骤204、将当前帧中各ROI的位置关系编码的比特流最终嵌入到该视频帧的帧头或条带头或用户自定义数据或附加增强信息(supplementalenhancement information,简称SEI)数据中。
与直接对ROI的位置信息进行编码的比特流相比,本实施例通过具体的算法,获取当前帧图像中ROI与已编码图像中ROI的对应关系,并通过具体的编码规则对各对应关系的ROI描述信息进行压缩编码,能有效地压缩使用的比特数,而且当每帧编码的ROI数量较多时,压缩效果将会变得更加明显,能够尽量减少ROI位置编码比特数在整帧的编码比特数中所占的比例。
图5为本发明视频解码方法实施例一的流程图,本实施例的方法执行主体是一个视频解码装置,该装置能够以硬件或软件的形式实现,可配置在解码器中,如图5所示,该方法包括以下步骤:
步骤501、获取当前帧图像中至少一个ROI的描述信息;
本步骤中,ROI的描述信息可以为ROI的位置信息,ROI可以为矩形区域,所述ROI的位置信息包括所述ROI的左上角坐标值、宽和高。
步骤502、获取当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系。
本步骤中,具体地,所述已解码图像至少包括下述一种已解码图像:
当前帧图像解码顺序之前第n帧已解码图像、当前帧图像显示顺序之前第n帧已解码图像、参考帧缓存中的已解码图像或按预设规则的已解码图像;
其中n大于或等于1。
具体地,所述位置关系可以定位为包括如下一种或多种:
当前帧图像中的ROI相对于已解码图像为新出现ROI;
当前帧图像中的ROI相对于已解码图像中的ROI为位置相同ROI;
当前帧图像中的ROI相对于已解码图像中的ROI为位置偏差ROI;
已解码图像中的ROI相对于当前帧图像中的ROI为消失ROI。
步骤503、根据所述当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系和描述信息解码值,获取当前帧图像中ROI的位置信息。
本实施例通过获取当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系,结合对应的已解码图像中ROI的解码获取当前帧的ROI编码,本方法可以有效提高ROI的解码压缩效率。
在本实施例的基础上,进一步地,获取当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系,包括:
解码描述信息中的字段信息,根据所述字段信息获取当前帧图像中ROI的位置关系。
具体实施时,所述解码描述信息中的字段信息,根据所述字段信息获取当前帧图像中ROI的位置关系,包括:
解码所述描述信息的第一字段,获取新出现ROI和位置偏差ROI的数目;
解码所述描述信息的第二字段,获取新出现ROI的数目;
解码所述描述信息的第三字段,获取位置相同ROI和消失ROI的数目;
根据所述第三字段记录的数目,逐个解码所述描述信息的第四字段记录的编码值,获取第一标识,并根据所述第一标识和ROI序号获取位置相同ROI的位置关系,所示第一标识用于标识位置相同ROI,或获取第二标识,并根据所述第二标识和获取消失ROI的位置关系,所述第二标识用于标识消失ROI;
根据所述第一字段和第二字段记录的数目,解码所述描述信息的第五字段记录的编码值,以按照ROI序号获取位置偏差ROI的位置关系;
解码所述描述信息的第六字段中新出现ROI的编码值,以按照ROI序号获取新出现ROI的位置关系。
如图4中所示,解码第一标识为“1”时,表示对应的R1为位置相同的ROI解码第二标识为“0”时;表示对应的R2为消失的ROI。
进一步地,根据ROI序号获取ROI位置关系,包括:
根据ROI序号和已编码图像中ROI序号的排序关系获取当前帧图像中ROI的排序关系,并根据所述排序关系获取ROI位置关系;其中位置相同ROI、位置偏差ROI和消失ROI的序号与已编码图像中对应的ROI序号相同,新出现ROI在已有序号后分配新的序号。
具体解码字段的序号和含义可参见图4中编码各字段对应的序号和含义,在此不在赘述。
在本实施例的基础上,进一步地,所述根据所述当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系和描述信息解码值,获取当前帧图像中ROI的位置信息,包括:
将与位置相同ROI对应的已解码图像中ROI位置信息作为当前帧图像中位置相同的ROI的位置信息;
根据所述第五字段记录的位置偏差解码值和与位置偏差ROI对应的已解码图像中ROI位置信息,计算获取当前帧图像中位置偏差ROI的位置信息;
根据所述第六字段记录的位置解码值,计算获取当前帧图像中新出现ROI的位置信息。
图6为本发明视频编码装置实施例一的结构图,该装置60通常集成在编码器里面,如图6所示,该装置60包括:
检测模块61,用于从当前帧图像中检测出至少一个ROI的位置信息;
位置关系获取模块62,用于基于预设近似度匹配规则,将所述当前帧图像中ROI的位置信息与已编码图像中至少一个ROI的位置信息进行近似度匹配,获得所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系;
可选地,所述已编码图像至少包括下述一种已编码图像:
当前帧图像编码顺序之前第n帧已编码图像、当前帧图像显示顺序之前第n帧已编码图像、参考帧缓存中的已编码图像或按预设规则的已编码图像;
其中n大于或等于1。
编码模块63,用于对各所述位置关系进行编码,作为当前帧图像中各ROI的描述信息。
本实施例的装置,用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图7为本发明视频编码装置实施例二的结构图,本实施例在上一实施例的基础上,增加编码模块中的排序单元,具体该装置60包括:
位置关系获取模块62,具体用于:将当前帧图像中每个ROI的位置信息与已编码图像中每个ROI的位置信息进行比较;当比较结果为位置信息相同时,则位置关系为位置相同;当比较结果为当前帧图像中ROI与已编码图像中ROI的位置信息差值小于设定阈值时,则位置关系为位置偏差;当比较结果为当前帧图像中ROI与已编码图像中ROI的位置信息差值等于或大于设定阈值时,则位置关系为新出现;已编码图像中的ROI与当前帧图像中ROI不存在位置相同或位置偏差关系的ROI确定位置关系为消失。
具体地,本实施中所述ROI为矩形区域,所述ROI的位置信息包括所述ROI的左上角坐标值、宽和高;
进一步地,本实施中所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系包括如下一种或多种:当前帧图像中的ROI相对于已编码图像为新出现ROI;当前帧图像中的ROI相对于已编码图像中的ROI为位置相同ROI;当前帧图像中的ROI相对于已编码图像中的ROI为位置偏差ROI;已编码图像中的ROI相对于当前帧图像中的ROI为消失ROI。
编码模块63,具体用于:对新出现ROI的位置关系,对所述新出现ROI的位置信息数值进行编码;对位置相同ROI的位置关系,编码为第一标识;对位置偏差ROI的位置关系,采用所述位置偏差ROI与已编码图像中ROI的位置信息差分值进行编码;对消失ROI的位置关系,编码为第二标识。
优选地,所述第一标识和第二标识的比特位为一位。
所述编码模块63,包括:排序单元71,用于将各所述位置关系的编码值按照ROI的序号进行排序,作为当前帧图像中各ROI的描述信息,其中,位置相同ROI、位置偏差ROI和消失ROI的序号与已编码图像中对应的ROI序号相同,新出现ROI在已有序号后分配新的序号。
所述排序单元71,具体用于:在所述描述信息的第一字段记录新出现ROI和位置偏差ROI的数目;在所述描述信息的第二字段记录新出现ROI的数目;在所述描述信息的第三字段记录位置相同ROI和消失ROI的数目;根据所述第三字段记录的数目,按照ROI序号,在所述描述信息的第四字段记录位置相同ROI和消失ROI的编码值;根据所述第一字段和第二字段记录的数目,按照ROI序号,在所述描述信息的第五字段记录位置偏差ROI的编码值;在所述描述信息的第六字段记录新出现ROI的编码值。
本实施例的装置,用于执行图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图8为本发明视频解码装置实施例一的结构图,该装置80通常集成在解码器里面,如图8所示,该装置80包括:
描述信息获取模块81,用于获取当前帧图像中至少一个ROI的描述信息;
位置关系获取模块82,用于获取当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系;
位置信息获取模块83,用于根据所述当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系和描述信息解码值,获取当前帧图像中ROI的位置信息。
本实施例的装置,用于执行图5所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
在本实施例的基础上,具体地,所述已解码图像至少包括下述一种已解码图像:
当前帧图像解码顺序之前第n帧已解码图像、当前帧图像显示顺序之前第n帧已解码图像、参考帧缓存中的已解码图像或按预设规则的已解码图像;
其中n大于或等于1。
在本实施例的基础上,具体地,所述ROI为矩形区域,所述ROI的位置信息包括所述ROI的左上角坐标值、宽和高。
在本实施例的基础上,具体地,所述当前帧图像中各ROI与所述已解码图像中各ROI的位置关系包括如下一种或多种:
当前帧图像中的ROI相对于已解码图像为新出现ROI;
当前帧图像中的ROI相对于已解码图像中的ROI为位置相同ROI;
当前帧图像中的ROI相对于已解码图像中的ROI为位置偏差ROI;
已解码图像中的ROI相对于当前帧图像中的ROI为消失ROI。
进一步地,所述位置关系获取模块82,具体用于:解码描述信息中的字段信息,根据所述字段信息获取当前帧图像中ROI的位置关系。
具体实施时,所述位置关系获取模块82,具体用于:
解码所述描述信息的第一字段,获取新出现ROI和位置偏差ROI的数目;
解码所述描述信息的第二字段,获取新出现ROI的数目;
解码所述描述信息的第三字段,获取位置相同ROI和消失ROI的数目;
根据所述第三字段记录的数目,逐个解码所述描述信息的第四字段记录的编码值,获取第一标识,并根据所述第一标识和ROI序号获取位置相同ROI的位置关系,所示第一标识用于标识位置相同ROI,或获取第二标识,并根据所述第二标识和获取消失ROI的位置关系,所述第二标识用于标识消失ROI;
根据所述第一字段和第二字段记录的数目,解码所述描述信息的第五字段记录的编码值,以按照ROI序号获取位置偏差ROI的位置关系;
解码所述描述信息的第六字段中新出现ROI的编码值,以按照ROI序号获取新出现ROI的位置关系。
具体地,所述位置关系获取模块82,具体用于:
根据ROI序号和已编码图像中ROI序号的排序关系获取当前帧图像中ROI的排序关系,并根据所述排序关系获取ROI位置关系;其中位置相同ROI、位置偏差ROI和消失ROI的序号与已编码图像中对应的ROI序号相同,新出现ROI在已有序号后分配新的序号。
进一步地,所述位置信息获取模块83,具体用于:
将与位置相同ROI对应的已解码图像中ROI位置信息作为当前帧图像中位置相同的ROI的位置信息;
根据所述第五字段记录的位置偏差解码值和与位置偏差ROI对应的已解码图像中ROI位置信息,计算获取当前帧图像中位置偏差ROI的位置信息;
根据所述第六字段记录的位置解码值,计算获取当前帧图像中新出现ROI的位置信息。
以上实施例用于执行上述任意一视频解码方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图9为本发明视频编解码系统实施例一的结构图,如图9所示,包括编码器91和解码器92,所述编码器91包括上述任意实施例所述的视频编码装置60,所述解码器92包括上述任意实施例所述的视频编码装置80。
本实施例中的视频编码装置60对应的可执行本发明任意实施例所提供的视频编码方法,实现原理和技术效果类似,此处不再赘述;
本实施例中的视频解码装置80对应的可执行本发明任意实施例所提供的视频解码方法,实现原理和技术效果类似,此处不再赘述。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

Claims (35)

1.一种视频编码方法,其特征在于,包括:
从当前帧图像中检测出至少一个感兴趣区域ROI的位置信息;
基于预设近似度匹配规则,将所述当前帧图像中ROI的位置信息与已编码图像中至少一个ROI的位置信息进行近似度匹配,获得所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系;
对各所述位置关系进行编码,作为当前帧图像中各ROI的描述信息。
2.根据权利要求1所述的方法,其特征在于,所述已编码图像至少包括下述一种已编码图像:
当前帧图像编码顺序之前第n帧已编码图像、当前帧图像显示顺序之前第n帧已编码图像、参考帧缓存中的已编码图像或按预设规则的已编码图像;
其中n大于或等于1。
3.根据权利要求1所述的方法,其特征在于:
所述ROI为矩形区域,所述ROI的位置信息包括所述ROI的左上角坐标值、宽和高。
4.根据权利要求1-3任一所述的方法,其特征在于,所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系包括如下一种或多种:
当前帧图像中的ROI相对于已编码图像为新出现ROI;
当前帧图像中的ROI相对于已编码图像中的ROI为位置相同ROI;
当前帧图像中的ROI相对于已编码图像中的ROI为位置偏差ROI;
已编码图像中的ROI相对于当前帧图像中的ROI为消失ROI。
5.根据权利要求4所述的方法,其特征在于,基于预设近似度匹配规则,将所述当前帧图像中ROI的位置信息与已编码图像中至少一个ROI的位置信息进行近似度匹配,获得所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系包括:
将当前帧图像中每个ROI的位置信息与已编码图像中每个ROI的位置信息进行比较;
当比较结果为位置信息相同时,则位置关系为位置相同;
当比较结果为当前帧图像中ROI与已编码图像中ROI的位置信息差值小于设定阈值时,则位置关系为位置偏差;
当比较结果为当前帧图像中ROI与已编码图像中ROI的位置信息差值等于或大于设定阈值时,则位置关系为新出现;
已编码图像中的ROI与当前帧图像中ROI不存在位置相同或位置偏差关系的ROI确定位置关系为消失。
6.根据权利要求5所述的方法,其特征在于,对各所述位置关系进行编码包括:
对新出现ROI的位置关系,对所述新出现ROI的位置信息数值进行编码;
对位置相同ROI的位置关系,编码为第一标识;
对位置偏差ROI的位置关系,采用所述位置偏差ROI与已编码图像中ROI的位置信息差分值进行编码;
对消失ROI的位置关系,编码为第二标识。
7.根据权利要求6所述的方法,其特征在于:所述第一标识和第二标识的比特位为一位。
8.根据权利要求7所述的方法,其特征在于,对各所述位置关系进行编码,作为当前帧图像中各ROI的描述信息包括:
将各所述位置关系的编码值按照ROI的序号进行排序,作为当前帧图像中各ROI的描述信息,其中,位置相同ROI、位置偏差ROI和消失ROI的序号与已编码图像中对应的ROI序号相同,新出现ROI在已有序号后分配新的序号。
9.根据权利要求8所述的方法,其特征在于,将各所述位置关系的编码值按照ROI的序号进行排序,作为当前帧图像中各ROI的描述信息包括:
在所述描述信息的第一字段记录新出现ROI和位置偏差ROI的数目;
在所述描述信息的第二字段记录新出现ROI的数目;
在所述描述信息的第三字段记录位置相同ROI和消失ROI的数目;
根据所述第三字段记录的数目,按照ROI序号,在所述描述信息的第四字段记录位置相同ROI和消失ROI的编码值;
根据所述第一字段和第二字段记录的数目,按照ROI序号,在所述描述信息的第五字段记录位置偏差ROI的编码值;
在所述描述信息的第六字段记录新出现ROI的编码值。
10.一种视频解码方法,其特征在于,包括:
获取当前帧图像中至少一个感兴趣区域ROI的描述信息;
获取当前帧图像中ROI与已解码图像中至少一个ROI的位置关系;
根据所述当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系和描述信息,获取当前帧图像中ROI的位置信息。
11.根据权利要求10所述的方法,其特征在于,所述已解码图像至少包括下述一种已解码图像:
当前帧图像解码顺序之前第n帧已解码图像、当前帧图像显示顺序之前第n帧已解码图像、参考帧缓存中的已解码图像或按预设规则的已解码图像;
其中n大于或等于1。
12.根据权利要求10所述的方法,其特征在于:
所述ROI为矩形区域,所述ROI的位置信息包括所述ROI的左上角坐标值、宽和高。
13.根据权利要求10-12任一所述的方法,其特征在于,所述当前帧图像中各ROI与所述已解码图像中各ROI的位置关系包括如下一种或多种:
当前帧图像中的ROI相对于已解码图像为新出现ROI;
当前帧图像中的ROI相对于已解码图像中的ROI为位置相同ROI;
当前帧图像中的ROI相对于已解码图像中的ROI为位置偏差ROI;
已解码图像中的ROI相对于当前帧图像中的ROI为消失ROI。
14.根据权利要求13所述的方法,其特征在于,获取当前帧图像中ROI与已解码图像中至少一个ROI的位置关系,包括:
解码描述信息中的字段信息,根据所述字段信息获取当前帧图像中ROI的位置关系。
15.根据权利要求14所述的方法,其特征在于,所述解码描述信息中的字段信息,根据所述字段信息获取当前帧图像中ROI的位置关系,包括:
解码所述描述信息的第一字段,获取新出现ROI和位置偏差ROI的数目;
解码所述描述信息的第二字段,获取新出现ROI的数目;
解码所述描述信息的第三字段,获取位置相同ROI和消失ROI的数目;
根据所述第三字段记录的数目,逐个解码所述描述信息的第四字段记录的编码值,获取第一标识,并根据所述第一标识和ROI序号获取位置相同ROI的位置关系,所示第一标识用于标识位置相同ROI,或获取第二标识,并根据所述第二标识和获取消失ROI的位置关系,所述第二标识用于标识消失ROI;
根据所述第一字段和第二字段记录的数目,解码所述描述信息的第五字段记录的编码值,以按照ROI序号获取位置偏差ROI的位置关系;
解码所述描述信息的第六字段中新出现ROI的编码值,以按照ROI序号获取新出现ROI的位置关系。
16.根据权利要求15所述的方法,其特征在于,根据ROI序号获取ROI位置关系,包括:
根据ROI序号和已解码图像中ROI序号的排序关系获取当前帧图像中ROI的排序关系,并根据所述排序关系获取ROI位置关系;其中位置相同ROI、位置偏差ROI和消失ROI的序号与已编码图像中对应的ROI序号相同,新出现ROI在已有序号后分配新的序号。
17.根据权利要求16所述的方法,其特征在于,所述根据所述当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系和描述信息解码值,获取当前帧图像中ROI的位置信息,包括:
将与位置相同ROI对应的已解码图像中ROI位置信息作为当前帧图像中位置相同的ROI的位置信息;
根据所述第五字段记录的位置偏差解码值和与位置偏差ROI对应的已解码图像中ROI位置信息,计算获取当前帧图像中位置偏差ROI的位置信息;
根据所述第六字段记录的位置解码值,计算获取当前帧图像中新出现ROI的位置信息。
18.一种视频编码装置,其特征在于,包括:
检测模块,用于从当前帧图像中检测出至少一个感兴趣区域ROI的位置信息;
位置关系获取模块,用于基于预设近似度匹配规则,将所述当前帧图像中ROI的位置信息与已编码图像中至少一个ROI的位置信息进行近似度匹配,获得所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系;
编码模块,用于对各所述位置关系进行编码,作为当前帧图像中各ROI的描述信息。
19.根据权利要求18所述的装置,其特征在于,所述已编码图像至少包括下述一种已编码图像:
当前帧图像编码顺序之前第n帧已编码图像、当前帧图像显示顺序之前第n帧已编码图像、参考帧缓存中的已编码图像或按预设规则的已编码图像;
其中n大于或等于1。
20.根据权利要求18所述的装置,其特征在于:
所述ROI为矩形区域,所述ROI的位置信息包括所述ROI的左上角坐标值、宽和高。
21.根据权利要求18-20任一所述的装置,其特征在于,所述当前帧图像中各ROI与所述已编码图像中各ROI的位置关系包括如下一种或多种:
当前帧图像中的ROI相对于已编码图像为新出现ROI;
当前帧图像中的ROI相对于已编码图像中的ROI为位置相同ROI;
当前帧图像中的ROI相对于已编码图像中的ROI为位置偏差ROI;
已编码图像中的ROI相对于当前帧图像中的ROI为消失ROI。
22.根据权利要求21所述的装置,其特征在于,所述位置关系获取模块,具体用于:
将当前帧图像中每个ROI的位置信息与已编码图像中每个ROI的位置信息进行比较;
当比较结果为位置信息相同时,则位置关系为位置相同;
当比较结果为当前帧图像中ROI与已编码图像中ROI的位置信息差值小于设定阈值时,则位置关系为位置偏差;
当比较结果为当前帧图像中ROI与已编码图像中ROI的位置信息差值等于或大于设定阈值时,则位置关系为新出现;
已编码图像中的ROI与当前帧图像中ROI不存在位置相同或位置偏差关系的ROI确定位置关系为消失。
23.根据权利要求22所述的装置,其特征在于,所述编码模块,具体用于:
对新出现ROI的位置关系,对所述新出现ROI的位置信息数值进行编码;
对位置相同ROI的位置关系,编码为第一标识;
对位置偏差ROI的位置关系,采用所述位置偏差ROI与已编码图像中ROI的位置信息差分值进行编码;
对消失ROI的位置关系,编码为第二标识。
24.根据权利要求23所述的装置,其特征在于:所述第一标识和第二标识的比特位为一位。
25.根据权利要求24所述的装置,其特征在于,所述编码模块,包括:
排序单元,用于将各所述位置关系的编码值按照ROI的序号进行排序,作为当前帧图像中各ROI的描述信息,其中,位置相同ROI、位置偏差ROI和消失ROI的序号与已编码图像中对应的ROI序号相同,新出现ROI在已有序号后分配新的序号。
26.根据权利要求25所述的装置,其特征在于,所述排序单元,具体用于:
在所述描述信息的第一字段记录新出现ROI和位置偏差ROI的数目;
在所述描述信息的第二字段记录新出现ROI的数目;
在所述描述信息的第三字段记录位置相同ROI和消失ROI的数目;
根据所述第三字段记录的数目,按照ROI序号,在所述描述信息的第四字段记录位置相同ROI和消失ROI的编码值;
根据所述第一字段和第二字段记录的数目,按照ROI序号,在所述描述信息的第五字段记录位置偏差ROI的编码值;
在所述描述信息的第六字段记录新出现ROI的编码值。
27.一种视频解码装置,其特征在于,包括:
描述信息获取模块,用于获取当前帧图像中至少一个感兴趣区域ROI的描述信息;
位置关系获取模块,用于获取当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系;
位置信息获取模块,用于根据所述当前帧图像中各ROI与已解码图像中至少一个ROI的位置关系和描述信息解码值,获取当前帧图像中ROI的位置信息。
28.根据权利要求27所述的装置,其特征在于,所述已解码图像至少包括下述一种已解码图像:
当前帧图像解码顺序之前第n帧已解码图像、当前帧图像显示顺序之前第n帧已解码图像、参考帧缓存中的已解码图像或按预设规则的已解码图像;其中n大于或等于1。
29.根据权利要求27所述的装置,其特征在于:
所述ROI为矩形区域,所述ROI的位置信息包括所述ROI的左上角坐标值、宽和高。
30.根据权利要求27-29任一所述的装置,其特征在于,所述当前帧图像中各ROI与所述已解码图像中各ROI的位置关系包括如下一种或多种:
当前帧图像中的ROI相对于已解码图像为新出现ROI;
当前帧图像中的ROI相对于已解码图像中的ROI为位置相同ROI;
当前帧图像中的ROI相对于已解码图像中的ROI为位置偏差ROI;
已解码图像中的ROI相对于当前帧图像中的ROI为消失ROI。
31.根据权利要求30所述的装置,其特征在于,所述位置关系获取模块,具体用于:
解码描述信息中的字段信息,根据所述字段信息获取当前帧图像中ROI的位置关系。
32.根据权利要求31所述的装置,其特征在于,所述位置关系获取模块,具体用于:
解码所述描述信息的第一字段,获取新出现ROI和位置偏差ROI的数目;
解码所述描述信息的第二字段,获取新出现ROI的数目;
解码所述描述信息的第三字段,获取位置相同ROI和消失ROI的数目;
根据所述第三字段记录的数目,逐个解码所述描述信息的第四字段记录的编码值,获取第一标识,并根据所述第一标识和ROI序号获取位置相同ROI的位置关系,所示第一标识用于标识位置相同ROI,或获取第二标识,并根据所述第二标识和获取消失ROI的位置关系,所述第二标识用于标识消失ROI;
根据所述第一字段和第二字段记录的数目,解码所述描述信息的第五字段记录的编码值,以按照ROI序号获取位置偏差ROI的位置关系;
解码所述描述信息的第六字段中新出现ROI的编码值,以按照ROI序号获取新出现ROI的位置关系。
33.根据权利要求32所述的装置,其特征在于,所述位置关系获取模块,具体用于:
根据ROI序号和已编码图像中ROI序号的排序关系获取当前帧图像中ROI的排序关系,并根据所述排序关系获取ROI位置关系;其中位置相同ROI、位置偏差ROI和消失ROI的序号与已编码图像中对应的ROI序号相同,新出现ROI在已有序号后分配新的序号。
34.根据权利要求33所述的装置,其特征在于,所述位置信息获取模块,具体用于:
将与位置相同ROI对应的已解码图像中ROI位置信息作为当前帧图像中位置相同的ROI的位置信息;
根据所述第五字段记录的位置偏差解码值和与位置偏差ROI对应的已解码图像中ROI位置信息,计算获取当前帧图像中位置偏差ROI的位置信息;
根据所述第六字段记录的位置解码值,计算获取当前帧图像中新出现ROI的位置信息。
35.一种视频编解码系统,其特征在于,包括:
权利要求18-26任一所述的视频编码装置;
权利要求27-34任一所述的视频解码装置。
CN201310294435.7A 2013-07-12 2013-07-12 视频编解码方法、装置及系统 Active CN103517073B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310294435.7A CN103517073B (zh) 2013-07-12 2013-07-12 视频编解码方法、装置及系统
PCT/CN2014/081564 WO2015003573A1 (zh) 2013-07-12 2014-07-03 视频编解码方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310294435.7A CN103517073B (zh) 2013-07-12 2013-07-12 视频编解码方法、装置及系统

Publications (2)

Publication Number Publication Date
CN103517073A CN103517073A (zh) 2014-01-15
CN103517073B true CN103517073B (zh) 2016-11-02

Family

ID=49898989

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310294435.7A Active CN103517073B (zh) 2013-07-12 2013-07-12 视频编解码方法、装置及系统

Country Status (2)

Country Link
CN (1) CN103517073B (zh)
WO (1) WO2015003573A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103517073B (zh) * 2013-07-12 2016-11-02 上海交通大学 视频编解码方法、装置及系统
CN105592285B (zh) 2014-10-21 2020-04-21 华为技术有限公司 Roi视频实现方法及装置
CN105376580B (zh) * 2015-12-28 2018-08-28 上海集成电路研发中心有限公司 一种图像压缩方法
WO2020000473A1 (zh) * 2018-06-29 2020-01-02 深圳市大疆创新科技有限公司 编码方法、解码方法、编码设备和解码设备
CN114422788A (zh) * 2022-03-30 2022-04-29 浙江智慧视频安防创新中心有限公司 数字视网膜视频联合编码方法、译码方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101282479A (zh) * 2008-05-06 2008-10-08 武汉大学 基于感兴趣区域的空域分辨率可调整编解码方法
CN102045570A (zh) * 2011-01-13 2011-05-04 北京中星微电子有限公司 一种图像编码方法及装置
CN102682454A (zh) * 2012-04-28 2012-09-19 中国科学技术大学 一种视频中的感兴趣区域跟踪方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050114751A (ko) * 2004-06-01 2005-12-06 경희대학교 산학협력단 예측 부호화/복호화 장치 및 예측 부호화/복호화 방법
JP5979405B2 (ja) * 2011-03-11 2016-08-24 ソニー株式会社 画像処理装置および方法
CN103517073B (zh) * 2013-07-12 2016-11-02 上海交通大学 视频编解码方法、装置及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101282479A (zh) * 2008-05-06 2008-10-08 武汉大学 基于感兴趣区域的空域分辨率可调整编解码方法
CN102045570A (zh) * 2011-01-13 2011-05-04 北京中星微电子有限公司 一种图像编码方法及装置
CN102682454A (zh) * 2012-04-28 2012-09-19 中国科学技术大学 一种视频中的感兴趣区域跟踪方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种基于MPEG-4的感兴趣区域视频编码新方法;张方等;《电子学报》;20050430;第33卷(第4期);P634-637 *

Also Published As

Publication number Publication date
CN103517073A (zh) 2014-01-15
WO2015003573A1 (zh) 2015-01-15

Similar Documents

Publication Publication Date Title
CN103517073B (zh) 视频编解码方法、装置及系统
Gu et al. 3D point cloud attribute compression using geometry-guided sparse representation
US20220353525A1 (en) Image encoding method and apparatus, and image decoding method and apparatus
Guarda et al. Point cloud coding: Adopting a deep learning-based approach
Eleftheriadis et al. Automatic face location detection and tracking for model-assisted coding of video teleconferencing sequences at low bit-rates
CN102006475A (zh) 一种视频编解码装置和方法
CN103402087A (zh) 一种基于可分级位流的视频编解码方法
CN103402091A (zh) 云桌面图像分类与编码方法
Cai et al. A novel video coding strategy in HEVC for object detection
Eleftheriadis et al. Model-assisted coding of video teleconferencing sequences at low bit rates
EP0684736A2 (en) Model-assisted coding of video sequences at low bit rates
US8538175B1 (en) System and method for representing and coding still and moving images
Duan et al. Multimedia semantic communications: Representation, encoding and transmission
Zheng et al. A novel gray image representation using overlapping rectangular NAM and extended shading approach
CN105007494B (zh) 一种3d视频深度图像的帧内楔形分割模式选择方法
RU2236751C2 (ru) Способы и устройство для сжатия и восстановления траектории анимации с использованием линейной аппроксимации
FI113930B (fi) Menetelmä ja järjestely digitaalikuvien kompressoimiseksi
EP4354872A1 (en) Point cloud attribute information encoding and decoding method and apparatus, and related device
CN109615670A (zh) 一种基于压缩域内容感知的多算子图像重定向方法
Chakraborty et al. Adaptive weighted non-parametric background model for efficient video coding
KR100196874B1 (ko) 선택적 윤곽선 근사화 장치
Byrne et al. Unsupervised image compression-by-synthesis within a JPEG framework
Ierodiaconou et al. Unsupervised image compression using graphcut texture synthesis
Yang et al. Chain code-based occupancy map coding for video-based point cloud compression
Shindo et al. Image Coding for Machines with Edge Information Learning Using Segment Anything

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant