CN115623218A - 特征数据编码方法、编码器、特征数据解码方法及解码器 - Google Patents

特征数据编码方法、编码器、特征数据解码方法及解码器 Download PDF

Info

Publication number
CN115623218A
CN115623218A CN202210423921.3A CN202210423921A CN115623218A CN 115623218 A CN115623218 A CN 115623218A CN 202210423921 A CN202210423921 A CN 202210423921A CN 115623218 A CN115623218 A CN 115623218A
Authority
CN
China
Prior art keywords
sub
conversion unit
specific
ith
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210423921.3A
Other languages
English (en)
Inventor
王圣博
林敬杰
林俊隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial Technology Research Institute ITRI
Original Assignee
Industrial Technology Research Institute ITRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from TW110148784A external-priority patent/TWI800180B/zh
Application filed by Industrial Technology Research Institute ITRI filed Critical Industrial Technology Research Institute ITRI
Publication of CN115623218A publication Critical patent/CN115623218A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提供一种特征数据编码方法、编码器、特征数据解码方法及解码器。所述特征数据编码方法包括:将转换单元划分为多个子区块及N个子转换单元;在第i个子转换单元中决定参考原点及最后有效系数,并将所述第i个子转换单元的最后有效系数的原始坐标修正为特定坐标;从所述第i个子转换单元的特定子区块开始扫瞄所述第i个子转换单元,并将所述第i个子转换单元中的有效特征系数个别编码为编码数据。据此,可提升传输效率。

Description

特征数据编码方法、编码器、特征数据解码方法及解码器
技术领域
本发明涉及一种特征数据处理机制,且涉及一种特征数据编码方法、 编码器、特征数据解码方法及解码器。
背景技术
因物联网(Internet of Things,IoT)相关应用快速成长,衍生大量的 智能化创新应用需求(例如智能城市/智能安全防护、智慧车联网、智慧家 电等)。在未来的趋势中,手机、摄像机、家电、行车辅助系统都将具备 人工智能(AI)功能(俗称AIoT装置),而将AI运算力移往前端AIoT 装置将成为B5G/6G时代的重要发展趋势。
然而,考虑成本、功耗、机构限制与系统弹性,前端装置仅能提供初 步的运算功能,而深度运算与训练仍需边缘装置/后端服务器协作完成(例 如分段式机器视觉运算)。在此情况下,可预见的是分段式机器视觉运算 对编码与传输将衍生出以下技术需求。
例如,机器视觉应用需要降低运算复杂度与编码延迟时间,以满足高 度实时性服务的需求(此可称为低延迟需求)。另外,为了维持AI辨识 的准确率,需要保留机器需要的细节信息,避免过度处理导致影像失真, 造成系统辨识率下降(可称为高准确率需求)。此外,需以共通的格式进 行特征编码,并以共享骨干(Shared Backbone)的方式提供不同应用的机器 视觉任务,重复利用萃取的特征(此可称为多重应用需求)。
在现有视频压缩技术中,虽可达到强大的压缩效能,但不完全适合机 器视觉的应用。主要原因在于特征影像内容非用于供人类观看,因此传统 编码技术已不完全适用特征影像的压缩,且反而会增加延迟时间。同时, 欲满足高辨识率的应用,需要设计适合保留高频数据的编码方法以提供更 高的数据精准度。
发明内容
有鉴于此,本发明提供一种特征数据编码方法、编码器、特征数据解码 方法及解码器,其可用于解决上述技术问题。
本发明提供一种特征数据编码方法,适于编码器,所述方法包括:取得 包括多个特征系数的转换单元,并将转换单元划分为多个子区块;将转换单 元划分为N个子转换单元,其中各子转换单元包括所述多个子区块的至少其 中之一,且N为大于等于1的整数;在所述N个子转换单元的第i个子转换 单元中决定参考原点及最后有效系数,并基于所述第i个子转换单元的参考 原点将所述第i个子转换单元的最后有效系数的原始坐标修正为特定坐标, 其中所述第i个子转换单元的最后有效系数位于所述第i个子转换单元中的特 定子区块,i为索引值且1≤i≤N;从所述第i个子转换单元的特定子区块开 始扫瞄所述第i个子转换单元,并将所述第i个子转换单元中的至少一有效特 征系数个别编码为编码数据;以及发送第一特定指标、各子转换单元的最后 有效系数的特定坐标及各有效特征系数的编码数据至解码器,其中第一特定 指标指示各子转换单元的最后有效系数的特定坐标经过修正。
本发明提供一种编码器,包括收发器及处理器。处理器其耦接收发器, 并经配置以执行:取得包括多个特征系数的转换单元,并将转换单元划分为 多个子区块;将转换单元划分为N个子转换单元,其中各子转换单元包括所 述多个子区块的至少其中之一,且N为大于等于1的整数;在所述N个子转 换单元的第i个子转换单元中决定参考原点及最后有效系数,并基于所述第i 个子转换单元的参考原点将所述第i个子转换单元的最后有效系数的原始坐 标修正为特定坐标,其中所述第i个子转换单元的最后有效系数位于所述第i 个子转换单元中的特定子区块,i为索引值且1≤i≤N;从所述第i个子转换 单元的特定子区块开始扫瞄所述第i个子转换单元,并将所述第i个子转换单 元中的至少一有效特征系数个别编码为编码数据;以及控制收发器发送第一 特定指标、各子转换单元的最后有效系数的特定坐标及各有效特征系数的编 码数据至解码器,其中第一特定指标指示各子转换单元的最后有效系数的特 定坐标经过修正。
本发明提供一种特征数据解码方法,适于解码器,所述方法包括:接收 第一特定指标、N个子转换单元个别的最后有效系数的特定坐标及至少一有 效特征系数个别的编码数据,其中第一特定指标指示各子转换单元的最后有 效系数的特定坐标经过修正;基于各有效特征系数的编码数据重建转换单元 的多个子区块;基于所述N个子转换单元的第i个子转换单元的最后有效系 数的特定坐标,在所述第i个子转换单元中找出特定子区块,其中i为索引值 且1≤i≤N;从所述第i个子转换单元的特定子区块开始扫瞄所述第i个子 转换单元,并解码所述第i个子转换单元中各有效特征系数的编码数据。
本发明提供一种解码器,包括收发器及处理器。处理器耦接于收发器, 并经配置以执行:控制收发器接收第一特定指标、N个子转换单元个别的最 后有效系数的特定坐标及至少一有效特征系数个别的编码数据,其中第一特 定指标指示各子转换单元的最后有效系数的特定坐标经过修正;基于各有效 特征系数的编码数据重建转换单元的多个子区块;基于所述N个子转换单元 的第i个子转换单元的最后有效系数的特定坐标,在所述第i个子转换单元中 找出特定子区块,其中i为索引值且1≤i≤N;从所述第i个子转换单元的特定子区块开始扫瞄所述第i个子转换单元,并解码所述第i个子转换单元中 各有效特征系数的编码数据。
附图说明
包含附图以便进一步理解本发明,且附图并入本说明书中并构成本说 明书的一部分。附图说明本发明的实施例,并与描述一起用于解释本发明 的原理。
图1是依据本发明的实施例绘示的自然影像压缩机制示意图。
图2是依据本发明的实施例绘示的特征数据图压缩示意图。
图3是依据本发明的实施例绘示的特征数据处理系统的示意图。
图4是依据本发明的实施例绘示的特征数据编码方法流程图。
图5是依据本发明不同实施例绘示的划分转换单元的示意图。
图6A及图6B是依据本发明实施例绘示的坐标修正机制的示意图。
图7是依据本发明的实施例绘示的多个预设扫瞄方式的示意图。
图8A是依据本发明的实施例绘示的扫瞄各子转换单元的示意图。
图8B是依据本发明的实施例绘示的多种扫瞄子区块方式的示意图。
图9是依据本发明的实施例绘示的特征数据解码方法的流程图。
具体实施方式
现将详细地参考本发明的示范性实施例,示范性实施例的实例说明于附 图中。只要有可能,相同组件符号在图式和描述中用来表示相同或相似部分。
请参照图1,其是依据本发明的实施例绘示的自然影像压缩机制示意图。 在本实施例中,当编码器欲对影像110进行编码时,可将影像110划分为多 个子影像,并对各子影像进行后续处理。以子影像111为例,编码器例如可 基于相关的影像预测算法来预测对应于子影像111的预测影像112,再将子影 像111与预测影像112进行相减以取得残值影像113。之后,编码器可对残值 影像113进行离散余弦转换(Discrete Cosine Transform,DCT)(及量化), 以产生转换单元(Transform Unit,TU)120。
在图1中,转换单元120可包括绘示为方格的多个特征系数,其中上述 特征系数例如可包括有效特征系数(即,非0的特征系数,其绘示为点状格) 及无效特征系数(即,数值为0的特征系数,其绘示为空白格)。
在图1中,转换单元120例如可经划分为多个子区块,而各子区块例如 可包括4X4个特征系数。在一实施例中,转换单元120中的子区块可包括多 个有效子区块及无效子区块,其中各有效子区块包括至少一有效特征系数, 而各无效子区块仅包括无效特征系数。亦即,在图1的情境中,有效子区块 例如是包括至少一个点状格(即,有效特征系数)的子区块,而无效子区块 例如是未包括任何点状格的子区块。
之后,编码器可在转换单元120中找出最后有效系数124,并找出包括 最后有效系数124的特定子区块122。接着,编码器可自特定子区块122开 始往转换单元120的初始子区块(例如是转换单元120中位于左上角的子区 块)扫描,并对各子区块中的各有效特征系数进行编码等操作。
由图1可看出,在转换单元120中,有效特征系数主要集中于左上角的 低频区域。由于人眼对低频信息较为敏感,因此通过上述记录最后有效系数 124的方式,可有效省略高频子区块的记录,进而提高影像的压缩率。例如, 在图1的转换单元120,仅需记录约9个子区块的相关信息即可。
然而,对于包括较多高频信息的特征数据图而言,图1中的方式并无法 达到良好的压缩率。
请参照图2,其是依据本发明的实施例绘示的特征数据图压缩示意图。 在本实施例中,当编码器欲对参考特征数据图210进行编码时,可将参考特 征数据图210划分为多个特征数据图,并对各特征数据图进行后续处理。以 特征数据图211为例,编码器例如可基于相关的影像预测算法来预测对应于 特征数据图211的预测特征数据图212,再将特征数据图211与预测特征数据 图212进行相减以取得差异特征数据图213。之后,编码器可对差异特征数 据图213进行DCT(及量化),以产生转换单元220。
在图2中,转换单元220可包括绘示为方格的多个特征系数,其中上述 特征系数例如可包括有效特征系数(即,非0的特征系数,其绘示为点状格) 及无效特征系数(即,数值为0的特征系数,其绘示为空白格)。
在图2中,转换单元220例如可经划分为多个子区块,而各子区块例如 可包括4X4个特征系数,且上述子区块可划分为多个有效子区块及多个无效 子区块。之后,编码器可在转换单元220中找出最后有效系数224,并找出 包括最后有效系数224的特定子区块222。接着,编码器可自特定子区块222 开始往转换单元220的初始子区块(例如是转换单元220中位于左上角的子 区块)扫描,并对各子区块中的各有效特征系数进行编码等操作。
由图2可看出,在转换单元220中,有效特征系数的分布明显朝右下角 的高频区域延伸。在此情况下,若采用图1所示机制对图2的转换单元220 进行处理的话,约需记录51个子区块的相关信息,进而导致不佳的压缩率。
有鉴于此,本发明提供一种特征数据编码方法、编码器、特征数据解码 方法及解码器,其可用于解决上述技术问题。
请参照图3,其是依据本发明的实施例绘示的特征数据处理系统的示意 图。在图3中,特征数据处理系统300包括编码器310及解码器320,其中 编码器310包括收发器312及处理器314,而解码器320包括收发器322及 处理器324。
在一实施例中,编码器310例如可设置于系统前端的AIoT装置中,而解 码器320例如可设置于边缘装置及/或后端服务器中,但可不限于此。在一实 施例中,编码器310可用于萃取特征数据,并在将所萃取的特征数据进行压 缩后发送至解码器320。之后,解码器320例如可在还原特征数据之后,让 上述边缘装置及/或后端服务器依据特征数据进行后续的AI辨识或其他类似 的操作,但可不限于此。
在不同的实施例中,收发器312及322例如可实现为各式可用于传送/接 收比特流/码流的收发接口。另外,处理器314耦接于收发器312,且处理器 324耦接于收发器322。
在不同的实施例中,处理器314及324可为一般用途处理器、特殊用途 处理器、传统的处理器、数字信号处理器、多个微处理器(Microprocessor)、 一个或多个结合数字信号处理器核心的微处理器、控制器、微控制器、特殊 应用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可程序门 阵列电路(Field Programmable Gate Array,FPGA)、任何其他种类的集成电 路、状态机、基于进阶精简指令集机器(Advanced RISCMachine,ARM)的 处理器以及类似品。
在本发明的实施例中,处理器314可存取特定的模块、程序代码来实现 本发明提出的特征数据编码方法,其细节详述如下。
请参照图4,其是依据本发明的实施例绘示的特征数据编码方法流程图。 本实施例的方法可由图3的编码器310执行,以下即搭配图3所示的组件说 明图4各步骤的细节。
首先,在步骤S410中,处理器314取得包括多个特征系数的转换单元, 并将转换单元划分为多个子区块。在一实施例中,处理器314例如可通过执 行图2所示的方式来取得包括多个特征系数的转换单元,并将此转换单元划 分为多个子区块,但可不限于此。
为便于说明,以下假设所考虑的转换单元即为图2中的转换单元220但 可不限于此。如先前所述,转换单元220中的子区块可包括多个有效子区块 及无效子区块,其中各有效子区块包括至少一有效特征系数,而各无效子区 块仅包括无效特征系数。
之后,在步骤S420中,处理器314将转换单元220划分为N个子转换 单元,其中各子转换单元包括上述子区块的至少其中之一,且N为大于等于 1的整数。
在不同的实施例中,处理器314可基于不同的方式来决定如何将转换单 元220划分为所述N个子转换单元。
在一实施例中,假设转换单元220在第一方向(例如X方向)上具有多 个第一划分选项,且转换单元220在第二方向(例如Y方向)上具有多个第 二划分选项,则处理器314可选择第一划分选项之一及第二划分选项之一来 将转换单元220划分为所述N个子转换单元。
在一实施例中,所述多个第一划分选项例如是”1”、”1/2+1/2”、”1/4+3/4” 及”3/4+1/4”,其中”1”例如是不在第一方向上划分转换单元220。另 外,”1/2+1/2”例如是在第一方向上将转换单元220划分为两个等分,且此二 等分之间的比例为1:1。”1/4+3/4”例如是在第一方向上将转换单元220划分 为两个等分,且此二等分之间的比例为1:3。”3/4+1/4”例如是在第一方向上 将转换单元220划分为两个等分,且此二等分之间的比例为3:1,但可不限 于此。
在一实施例中,所述多个第二划分选项例如是”1”、”1/2+1/2”、”1/4+3/4” 及”3/4+1/4”,其中”1”例如是不在第二方向上划分转换单元220。另 外,”1/2+1/2”例如是在第二方向上将转换单元220划分为两个等分,且此二 等分之间的比例为1:1。”1/4+3/4”例如是在第二方向上将转换单元220划分 为两个等分,且此二等分之间的比例为1:3。”3/4+1/4”例如是在第二方向上 将转换单元220划分为两个等分,且此二等分之间的比例为3:1,但可不限 于此。
请参照图5,其是依据本发明不同实施例绘示的划分转换单元的示意图。 在图5中,划分方式511例如是在第一方向上选用”1/2+1/2”的第一划分选项, 并在第二方向上选用”1/2+1/2”的第二划分选项将转换单元划分为4个子转换 单元(其编号例如是0~3)的方式。划分方式512例如是在第一方向上选 用”1/2+1/2”的第一划分选项,并在第二方向上选用”3/4+1/4”的第二划分选项 将转换单元划分为4个子转换单元(其编号例如是0~3)的方式。
划分方式513例如是在第一方向上选用”3/4+1/4”的第一划分选项,并在 第二方向上选用”1/2+1/2”的第二划分选项将转换单元划分为4个子转换单元 (其编号例如是0~3)的方式。划分方式514例如是在第一方向上选用”1”的 第一划分选项,并在第二方向上选用”1/2+1/2”的第二划分选项将转换单元划 分为2个子转换单元(其编号例如是0~1)的方式。划分方式515例如是在 第一方向上选用”1/2+1/2”的第一划分选项,并在第二方向上选用”1”的第二划 分选项将转换单元划分为2个子转换单元(其编号例如是0~1)的方式。
在其他实施例中,若在第一方向上选用”1”的第一划分选项,并在第二方 向上选用”1”的第二划分选项划分转换单元,则所得到的子转换单元可理解为 等于转换单元,但可不限于此。
在一实施例中,处理器314例如可基于率失真优化(Rate DistortionOptimization,RDO)的概念决定挑选哪一个第一/第二划分选项来划分转换单 元。
在一实施例中,处理器314可取得各第一划分选项对应的第一率失真成 本(RateDistortion cost,RD cost),并据以从这些第一划分选项中挑选第一特 定划分选项(例如是对应于最低第一率失真成本的第一划分选项)。另外,处 理器314可取得各第二划分选项对应的第二率失真成本,并据以从这些第二 划分选项中挑选第二特定划分选项(例如是对应于最低第二率失真成本的第 二划分选项)。之后,处理器314可分别在第一方向及第二方向上采用第一特 定划分选项及第二特定划分选项划分转换单元220,以取得所述N个子转换 单元。
举例而言,假设处理器314判定”1/2+1/2”的第一划分选项对应的第一率 失真成本为最低,且”3/4+1/4”的第二划分选项对应的第二率失真成本为最低, 则处理器314可据以采用图5的划分方式512将转换单元220划分为4个子 转换单元,但可不限于此。
在另一实施例中,处理器314可基于上述第一划分选项及上述第二划分 选项产生多个划分选项组合,其中各划分选项组合可包括上述第一划分选项 之一及上述第二划分选项之一。例如,图5中的划分方式511~515可理解为 对应于5种划分选项组合。
之后,处理器314可取得各划分选项组合的率失真成本,并据以从这些 划分选项组合中挑选特定划分选项组合(例如是对应于最低率失真成本的划 分选项组合),其中此特定划分选项组合可包括第一特定划分选项及第二特定 划分选项。
接着,处理器314可分别在第一方向及第二方向上采用第一特定划分选 项及第二特定划分选项划分转换单元220,以取得所述N个子转换单元。
举例而言,假设处理器314判定图5中划分方式513对应的划分选项组 合具有最低的率失真成本,则处理器314可在第一方向上采用”3/4+1/4”的第 一划分选项,以及在第二方向上采用”1/2+1/2”的第二划分选项来将转换单元 220划分为4个子转换单元,但可不限于此。
在取得所述N个子转换单元之后,在步骤S430中,处理器314在所述N 个子转换单元的第i个(i为索引值且1≤i≤N)子转换单元中决定参考原点 及最后有效系数(LastSignificant Coefficient,LSC),并基于所述第i个子转 换单元的参考原点将所述第i个子转换单元的最后有效系数的原始坐标修正 为特定坐标其中所述第i个子转换单元的最后有效系数位于所述第i个子转换 单元中的特定子区块。为便于理解,以下将辅以图6A及图6B作进一步说明, 其中图6A及图6B是依据本发明实施例绘示的坐标修正机制的示意图。
在图6A中,假设转换单元220在经过步骤S420处理后被划分为1个子 转换单元611,则子转换单元611可理解为相等于转换单元220。在此情况下, 处理器314可在子转换单元611中决定参考原点O1a及最后有效系数611a(其 位于特定子区块611b中),并基于子转换单元611的参考原点O1a将最后有 效系数611a的原始坐标修正为特定坐标。
在本实施例中,转换单元220可具有原始原点O1,而其例如位于转换单 元220的左上角,并可表征为(0,0)。在此情况下,最后有效系数611a的原始 坐标例如可表征为(xLSC,yLSC)。
在图6A中,处理器314例如可将子转换单元611的尾端坐标(例如是子 转换单元611的右下角坐标)作为子转换单元611的参考原点O1a。之后, 处理器314可基于参考原点O1a将最后有效系数611a的原始坐标(即, (xLSC,yLSC))修正为特定坐标。
在一实施例中,最后有效系数611a的特定坐标例如可表征 为”(Δx,Δy)=(xLSTU-xLSC,yLSTU-yLSC)”,其中(xLSTU,yLSTU)为子转换单 元611的尾端坐标,但可不限于此。
在图6A情境中,(Δx,Δy)亦可表征为如下形式:
Δx=(1<<Log2ZoTbWidth)-1-LastSignificantCoeffX;
Δy=(1<<Log2ZoTbHeight)-1-LastSignificantCoeffY;
,其中”1<<Log2k”表示将二进制的位1往左移k个位置,例 如”1<<Log28”代表将位1往左移8个位置,即”10000000”(即,256)。此 外,”LastSignificantCoeffX”及”LastSignificantCoeffY”分别为最后有效 系数611a的原始坐标的x坐标及y坐标。另外,若子转换单元611(即,转 换单元220)的宽度及高度分别表示为Width及Height,则”ZoTbWidth”为 log2 Width,且”ZoTbHeight”为log2Height。
举例而言,若子转换单元611(即,转换单元220)的宽度及高度分别表 示为256及128,则”ZoTbWidth”为8(即,log2256),且”ZoTbHeight”为 (即,log2128)。在此情况下,(Δx,Δy)=(256-1- LastSignificantCoeffX,128-1-LastSignificantCoeffY)。
在图6B中,假设转换单元220在经过步骤S420处理后被划分为3个子 转换单元621~623。在此情况下,处理器314可对各子转换单元621~623中 的最后有效系数进行对应的坐标修正操作。
以子转换单元622为例,处理器314例如可在子转换单元622中决定参 考原点O1b及最后有效系数622a(其位于特定子区块622b中),并基于子转 换单元622的参考原点O1b将最后有效系数622a的原始坐标修正为特定坐 标。
在本实施例中,转换单元220可具有原始原点O1,而其例如位于转换单 元220的左上角,并可表征为(0,0)。在此情况下,最后有效系数622a的原始 坐标例如可表征为(xLSC,yLSC)。
在图6B中,处理器314例如可将子转换单元622的尾端坐标(例如是子 转换单元622的右下角坐标)作为子转换单元622的参考原点O1b。之后, 处理器314可基于参考原点O1b将最后有效系数622a的原始坐标(即, (xLSC,yLSC))修正为特定坐标。
在一实施例中,最后有效系数622a的特定坐标例如可表征 为”(Δx,Δy)=(xLSTU-xLSC,yLSTU-yLSC)”,其中(xLSTU,yLSTU)为子转换单 元622的尾端坐标,但可不限于此。
相似地,处理器314可对其他的子转换单元执行上述操作,以取得各子 转换单元中的最后有效系数对应的特定坐标,但可不限于此。进一步而言, 通过将各子转换单元中的最后有效系数的原始坐标改以对应的特定坐标表 示,可相应地降低后续传输的数据量,进而提升数据传输的效率。
此外,在一些实施例中,反应于处理器314判定某个子转换单元仅包括 无效特征系数,则处理器314可将此子转换单元(例如图6B中的子转换单元 623)标记为无需处理,藉以加速后续的操作,但可不限于此。
在将所述第i个子转换单元的最后有效系数的原始坐标修正为特定坐标 之后,在步骤S440中,处理器314从所述第i个子转换单元的特定子区块开 始扫瞄所述第i个子转换单元,并将所述第i个子转换单元中的有效特征系数 个别编码为编码数据。
在一实施例中,处理器314可基于任意的扫瞄方式来扫瞄所述第i个子 转换单元。在其他实施例中,处理器314亦可基于特定的机制为所述第i个 子转换单元决定适合的扫瞄方式。
举例而言,处理器314可基于所述第i个子转换单元中的子区块从K个 预设扫瞄方式中选定对应于所述第i个子转换单元的特定扫瞄方式,其中K 为正整数。以下将辅以图7作进一步说明。
请参照图7,其是依据本发明的实施例绘示的多个预设扫瞄方式的示意 图。在图7中,处理器314例如可从所示的8个预设扫瞄方式711~718中择 一作为所述第i个子转换单元的特定扫瞄方式。
在一实施例中,处理器314可采用预设扫瞄方式711~718中的第j个预 设扫瞄方式从所述第i个子转换单元的特定子区块扫瞄至所述第i个子转换单 元的起始子区块(例如是所述第i个子转换单元左上角的子区块),并记录在 所述第j个预设扫瞄方式的扫瞄过程中经过的无效子区块的特定数量,其中j 为索引值且1≤j≤K。之后,处理器314可基于各预设扫瞄方式711~718对 应的特定数量从预设扫瞄方式711~718中选定对应于所述第i个子转换单元 的特定扫瞄方式,其中特定扫瞄方式对应的特定数量为最低。
举例而言,当处理器314采用预设扫瞄方式711扫瞄时,其扫瞄过程中 将经过6个无效子区块(对应于空心箭号区段),因此预设扫瞄方式711对应 的特定数量为6。举另一例而言,当处理器314采用预设扫瞄方式714扫瞄 时,其扫瞄过程中将经过1个无效子区块,因此预设扫瞄方式714对应的特 定数量为1。另外,当处理器314采用预设扫瞄方式717扫瞄时,其扫瞄过 程中将经过1个无效子区块,因此预设扫瞄方式717对应的特定数量亦为1。其余预设扫瞄方式对应的特定数量应可基于上述教示而推得,于此不另赘述。
如上所述,处理器314例如可选定具最低特定数量的预设扫瞄方式来作 为所述第i个子转换单元的特定扫瞄方式,而由于图7中的预设扫瞄方式714 及717对应的特定数量(即,1)皆为最低,故处理器314可选用预设扫瞄方 式714及717中的任一者作为所考虑的特定扫瞄方式,但可不限于此。
在其他实施例中,处理器314亦可依其他原则而从预设扫瞄方式711~718 中选定所需的特定扫瞄方式,并不限于上述实施方式。
在一实施例中,处理器314还可依据对应于所述第i个子转换单元的特 定扫瞄方式的扫瞄过程产生无效子区块清单,其中此无效子区块列表可至少 记录所述第i个子转换单元中的各无效子区块在所述第i个子转换单元中的位 置。
在一实施例中,假设处理器314选用预设扫瞄方式711作为子转换单元 700的特定扫瞄方式,则处理器314例如可基于以下方式产生对应的无效子 区块清单。
举例而言,处理器314例如可将预设扫瞄方式711对应的无效子区块列 表记录为[2,4,4,2,46],其中第1个”2”代表从特定子区块开始经过的第1个 至第2个子区块(共2个子区块)为有效子区块;第2个”4”代表从特定子区 块开始经过的第3个至第6个子区块(共4个子区块)为无效子区块;第3 个”4”代表从特定子区块开始经过的第7个至第10个子区块(共4个子区块) 为有效子区块;第4个”2”代表从特定子区块开始经过的第11个至第12个子区块(共2个子区块)为无效子区块;第5个”46”代表从特定子区块开始经 过的第13个至第58个子区块(共46个子区块)为无效子区块。
举另一例而言,处理器314例如可将预设扫瞄方式711对应的无效子区 块列表记录为[110000111100111…],其中的第k个位对应于从特定子区块开 始经过的第k个子区块。若所述第k个位为1,此即代表所述第k个子区块 为有效子区块;若所述第k个位为0,此即代表所述第k个子区块为无效子 区块,但可不限于此。在其他实施例中,处理器314亦可基于其他的原则产 生所需的无效子区块清单,并不限于上述方式。
在为所述第i个子转换单元决定对应的特定扫瞄方式之后,处理器314 可据以从所述第i个子转换单元中的特定子区块开始扫瞄所述第i个子转换单 元。
请参照图8A,其是依据本发明的实施例绘示的扫瞄各子转换单元的示意 图。在图8A中,假设转换单元800经划分为子转换单元811~814,其中子转 换单元814仅包括无效子区块。在此情况下,处理器314可为子转换单元 811~813个别决定适合的特定扫瞄方式,并据以扫瞄子转换单元811~813。
以子转换单元811为例,处理器314可基于对应的特定扫瞄方式(绘示 为位于子转换单元811中的箭号序列)从子转换单元811的特定子区块811a 往子转换单元811的起始子区块(例如位于子转换单元811的左上角)进行 扫瞄,并在扫瞄的过程中将子转换单元811中的各个有效特征系数编码为对 应的编码数据。
以子转换单元812为例,处理器314可基于对应的特定扫瞄方式(绘示 为位于子转换单元812中的箭号序列)从子转换单元812的特定子区块812a 往子转换单元812的起始子区块(例如位于子转换单元812的左上角)进行 扫瞄,并在扫瞄的过程中将子转换单元812中的各个有效特征系数编码为对 应的编码数据。
以子转换单元813为例,处理器314可基于对应的特定扫瞄方式(绘示 为位于子转换单元813中的箭号序列)从子转换单元813的特定子区块813a 往子转换单元813的起始子区块(例如位于子转换单元813的左上角)进行 扫瞄,并在扫瞄的过程中将子转换单元813中的各个有效特征系数编码为对 应的编码数据。
在本发明的实施例中,处理器314例如可采以下方式扫瞄所述第i个子 转换单元。在一实施例中,对于所述第i个子转换单元的有效子区块中的第c 个有效子区块,处理器314可取得所述第c个有效子区块中的本地最后有效 系数,并从此本地最后有效系数朝所述第c个有效子区块的本地原点(例如 位于所述第c个有效子区块的左上角)扫瞄,并编码所述第i个子转换单元 中各有效特征系数的编码数据。在一实施例中,所述第c个有效子区块例如 是在处理器314扫瞄所述第i个子转换单元时所经过的第c个包括有效特征 系数的子区块,但可不限于此。另外,处理器314例如可基于某参考扫瞄方 式(例如Zigzac方式)来从各有效子区块的本地最后有效系数来扫瞄每个子 区块。
请参照图8B,其是依据本发明的实施例绘示的多种扫瞄子区块方式的示 意图。在图8B中,对于大小为4X4的子区块而言,处理器314例如可基于 所示的16种扫瞄方式的任一来扫瞄此子区块,其中各扫瞄方式中所标示的数 字表示对应的系数的扫瞄顺序。亦即,在各扫瞄方式中,处理器314是依照 所示的数字1~16依序扫瞄子区块中的各个系数。
在其他实施例中,处理器314亦可基于其他习知方式扫瞄各子转换单元 及编码有效特征系数,于此不另赘述。
在一实施例中,处理器314可先将各有效子区块中的各有效特征系数的 旗标设置为第一值(例如1),并将各有效子区块中的无效特征系数的旗标设 置为第二值(例如0)。藉此,当处理器314判定某有效子区块中的某特征系 数的旗标为第一值时,处理器314可再相应读取/编码此特征系数。另一方面, 当判定某有效子区块中的某特征系数的旗标为第二值时,处理器314可相应 地忽略此特征系数,但可不限于此。
另外,由于子转换单元814仅包括无效子区块,故处理器314可将子转 换单元814标记为无需处理,但可不限于此。
在完成各子转换单元的扫瞄/编码之后,在步骤S450中,处理器314控 制收发器312发送第一特定指标I1、各子转换单元的最后有效系数的特定坐 标C1及各有效特征系数的编码数据D1至解码器320。在一实施例中,所述 第一特定指标I1指示各子转换单元的最后有效系数的特定坐标C1经过修正, 亦即编码器310已对各子转换单元的最后有效系数进行如图6A及/或图6B 所例示的坐标修正机制。
在一实施例中,所述第一特定指标I1可实现为具有第一值的第一特定旗 标。在一实施例中,此第一特定旗标例如可名 为”sh_reverse_last_sig_coeff_flag”,而当其值为第一值(例如1)时,即代表 各子转换单元的最后有效系数的特定坐标C1经过修正。在另一实施例中,当 编码器310未提供第一特定旗标时,此亦可隐含各子转换单元的最后有效系数的坐标未经过修正,但可不限于此。
此外,处理器314还可将对应于所述第i个子转换单元的特定扫瞄方式 及无效子区块清单通知解码器320,但可不限于此。
在另一实施例中,编码器310还可发送名 为”sps_reverse_last_sig_coeff_enabled_flag”的第二特定旗标至解码器320,其 中此第二特定旗标可用于指示编码器310是否支持上述坐标修正机制。在一 实施例中,当第二特定旗标为第一值(例如1)时,此即代表编码器310支 持上述坐标修正机制。另一方面,当第二特定旗标为第二值(例如0)时, 此即代表编码器310不支持上述坐标修正机制。在另一实施例中,当编码器 310未提供第二特定旗标时,此亦可隐含编码器310不支持上述坐标修正机 制,但可不限于此。
在一实施例中,处理器314可仅在所考虑的转换单元的尺寸大于某指定 尺寸(例如16X16个特征系数)时才进行上述坐标修正机制。在一实施例中, 在进行图4的步骤S430之前,处理器314可先判断所考虑的转换单元的尺寸 是否大于上述指定尺寸。
在一实施例中,反应于判定所考虑的转换单元的尺寸大于上述指定尺寸, 处理器314可再接续执行步骤S430~S450。
在另一实施例中,反应于判定所考虑的转换单元的尺寸大于上述指定尺 寸,处理器314可经配置以:在所述N个子转换单元的所述第i个子转换单 元中决定参考原点及最后有效系数;从所述第i个子转换单元的特定子区块 开始扫瞄所述第i个子转换单元,并将所述第i个子转换单元中的有效特征系 数个别编码为编码数据;以及发送第二特定指标、各子转换单元的最后有效 系数的原始坐标及各有效特征系数的编码数据至解码器320,其中所述第二 特定指标指示各子转换单元的最后有效系数的原始坐标未经过修正。
在一实施例中,所述第二特定指标可实现为具有第二值(例如0)的上 述第一特定旗标。亦即,当第一特定旗目标值为第二值(例如0)时,此即 代表各子转换单元的最后有效系数的特定坐标未经过修正,但可不限于此。
简言之,若所考虑的转换单元的尺寸未大于指定尺寸,则处理器314可 在不执行坐标修正机制的情况下执行后续的扫瞄/编码操作,但可不限于此。
在一实施例中,因应于编码器310所发送的各种数据,解码器320可相 应地执行图9所示的特征数据解码方法,其细节详述如下。
请参照图9,其是依据本发明的实施例绘示的特征数据解码方法的流程 图。本实施例的方法可由图3的解码器320执行,以下即搭配图3所示的组 件说明图9各步骤的细节。
首先,在步骤S910中,处理器324控制收发器322接收第一特定指标I1、 N个子转换单元个别的最后有效系数的特定坐标C1及有效特征系数个别的 编码数据D1。
之后,在步骤S920中,处理器324基于各有效特征系数的编码数据D1 重建转换单元的多个子区块。在一实施例中,假设编码器310所考虑的转换 单元为图8A中的转换单元800,则处理器324基于编码器310所提供的各式 数据所重建的转换单元亦可具有转换单元800的态样,但可不限于此。
之后,在步骤S930中,处理器324基于所述N个子转换单元的第i个子 转换单元的最后有效系数的特定坐标,在所述第i个子转换单元中找出特定 子区块。
举例而言,假设处理器324所还原的转换单元具有图8A的转换单元800 的态样,则处理器324可相应地基于各子转换单元811~813的最后有效系数 的特定坐标而在各子转换单元811~813中找出对应的特定子区块811a~813a。
接着,在步骤S940中,处理器324从所述第i个子转换单元的特定子区 块开始扫瞄所述第i个子转换单元,并解码所述第i个子转换单元中各有效特 征系数的编码数据D1。
在一实施例中,处理器324可在从编码器310取得对应于所述第i个子 转换单元的特定扫瞄方式及无效子区块清单之后,依据此特定扫瞄方式及此 无效子区块清单从所述第i个子转换单元的特定子区块开始扫瞄所述第i个子 转换单元。
以图8A的子转换单元811为例,处理器324可基于对应的特定扫瞄方式 (绘示为位于子转换单元811中的箭号序列)从子转换单元811的特定子区 块811a往子转换单元811的起始子区块(例如位于子转换单元811的左上角) 进行扫瞄,并在扫瞄的过程中解码各有效特征系数的编码数据D1。
以子转换单元812为例,处理器324可基于对应的特定扫瞄方式(绘示 为位于子转换单元812中的箭号序列)从子转换单元812的特定子区块812a 往子转换单元812的起始子区块(例如位于子转换单元812的左上角)进行 扫瞄,并在扫瞄的过程中解码各有效特征系数的编码数据D1。
以子转换单元813为例,处理器324可基于对应的特定扫瞄方式(绘示 为位于子转换单元813中的箭号序列)从子转换单元813的特定子区块813a 往子转换单元813的起始子区块(例如位于子转换单元813的左上角)进行 扫瞄,并在扫瞄的过程中解码各有效特征系数的编码数据D1。
在本发明的实施例中,处理器324例如可采以下方式扫瞄所述第i个子 转换单元。在一实施例中,对于所述第i个子转换单元的有效子区块中的第c 个有效子区块,处理器324可取得所述第c个有效子区块中的本地最后有效 系数,并从此本地最后有效系数朝所述第c个有效子区块的本地原点(例如 位于所述第c个有效子区块的左上角)扫瞄,并解码所述第i个子转换单元 中各有效特征系数的编码数据D1。在一实施例中,所述第c个有效子区块例 如是在处理器324扫瞄所述第i个子转换单元时所经过的第c个包括有效特 征系数的子区块,但可不限于此。另外,处理器324例如可基于某参考扫瞄 方式(例如Zigzac方式)来从各有效子区块的本地最后有效系数来扫瞄每个 子区块,但可不限于此。
在其他实施例中,处理器324亦可基于其他习知方式扫瞄各子转换单元 及解码各有效特征系数的编码数据D1,于此不另赘述。
在一实施例中,当处理器324判定某有效子区块中的某编码数据的旗标 为第一值时,处理器324可再相应读取/解码此编码数据以取得对应的有效特 征系数。另一方面,当判定某有效子区块中的某编码数据的旗标为第二值时, 处理器324可相应地忽略此编码数据,但可不限于此。
另外,若子转换单元814经标记为无需处理,则处理器324可直接忽略 子转换单元814,但可不限于此。
综上所述,本发明实施例的特征数据编码方法可通过上述的坐标修正机 制来降低用于表示各子转换单元中最后有效系数的坐标的数据量,进而相应 地提升传输效率。此外,通过适应性地将转换单元划分为N个子转换单元的 方式,本发明可找出某些仅包括无效子区块的子转换单元,并可藉由忽略此 类子转换单元来提升数据处理的效率。并且,在将转换单元划分为N个子转 换单元之后,本发明还可为各子转换单元决定适合的特定扫瞄方式,藉以提 升扫瞄各子转换单元时的效率。
此外,本发明实施例的特征数据解码方法可基于各子转换单元的最后有 效系数的特定坐标找到各子转换单元中的特定子区块,并依据对应的特定扫 瞄方式及无效子区块列表扫瞄/解码各子转换单元中的各编码数据。藉此,可 达到较佳的数据解码效率。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对 其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通 技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改, 或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并 不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (20)

1.一种特征数据编码方法,适于编码器,其特征在于,所述方法包括:
取得包括多个特征系数的转换单元,并将所述转换单元划分为多个子区块;
将所述转换单元划分为N个子转换单元,其中各所述子转换单元包括所述多个子区块的至少其中之一,且N为大于等于1的整数;
在所述N个子转换单元的第i个子转换单元中决定参考原点及最后有效系数,并基于所述第i个子转换单元的所述参考原点将所述第i个子转换单元的所述最后有效系数的原始坐标修正为特定坐标,其中所述第i个子转换单元的所述最后有效系数位于所述第i个子转换单元中的特定子区块,i为索引值且1≤i≤N;
从所述第i个子转换单元的所述特定子区块开始扫瞄所述第i个子转换单元,并将所述第i个子转换单元中的至少一有效特征系数个别编码为编码数据;以及
发送第一特定指标、各所述子转换单元的所述最后有效系数的所述特定坐标及各所述有效特征系数的所述编码数据至解码器,其中所述第一特定指标指示各所述子转换单元的所述最后有效系数的所述特定坐标经过修正。
2.根据权利要求1所述的方法,其中所述转换单元的所述多个子区块包括多个有效子区块及多个无效子区块,其中各所述有效子区块包括至少一有效特征系数,各所述无效子区块仅包括无效特征系数。
3.根据权利要求1所述的方法,还包括:
将各所述有效子区块中的各所述有效特征系数的旗标设置为第一值,并将各所述有效子区块中的无效特征系数的旗标设置为第二值。
4.根据权利要求1所述的方法,其中所述第i个子转换单元的所述参考原点表征为所述第i个子转换单元的尾端坐标,且所述第i个子转换单元的所述最后有效系数的所述特定坐标表征为:
(Δx,Δy)=(xLSTU-xLSC,yLSTU-yLSC),
其中(xLSTU,yLSTU)为所述第i个子转换单元的所述尾端坐标,(xLSC,yLSC)为所述第i个子转换单元的所述最后有效系数的所述原始坐标。
5.根据权利要求1所述的方法,其中所述转换单元在第一方向上具有多个第一划分选项,所述转换单元在第二方向上具有多个第二划分选项,且将所述转换单元划分为所述N个子转换单元的步骤包括:
取得各所述第一划分选项对应的第一率失真成本,并据以从所述多个第一划分选项中挑选第一特定划分选项;
取得各所述第二划分选项对应的第二率失真成本,并据以从所述多个第二划分选项中挑选第二特定划分选项;
分别在所述第一方向及所述第二方向上采用所述第一特定划分选项及所述第二特定划分选项划分所述转换单元,以取得所述N个子转换单元。
6.根据权利要求1所述的方法,其中所述转换单元在第一方向上具有多个第一划分选项,所述转换单元在第二方向上具有多个第二划分选项,且将所述转换单元划分为所述N个子转换单元的步骤包括:
基于所述多个第一划分选项及所述多个第二划分选项产生多个划分选项组合,其中各所述划分选项组合包括所述多个第一划分选项之一及所述多个第二划分选项之一;
取得各所述划分选项组合的率失真成本,并据以从所述多个划分选项组合中挑选特定划分选项组合,其中所述特定划分选项组合包括第一特定划分选项及第二特定划分选项;
分别在所述第一方向及所述第二方向上采用所述第一特定划分选项及所述第二特定划分选项划分所述转换单元,以取得所述N个子转换单元。
7.根据权利要求1所述的方法,其中从所述第i个子转换单元的所述特定子区块开始扫瞄所述第i个子转换单元的步骤包括:
基于所述第i个子转换单元中的所述多个子区块从K个预设扫瞄方式中选定对应于所述第i个子转换单元的特定扫瞄方式,其中K为正整数;
依据对应于所述第i个子转换单元的所述特定扫瞄方式从所述第i个子转换单元中的所述特定子区块开始扫瞄所述第i个子转换单元;
将对应于所述第i个子转换单元的所述特定扫瞄方式通知所述解码器。
8.根据权利要求7所述的方法,其中所述转换单元的所述多个子区块包括多个有效子区块及多个无效子区块,所述第i个子转换单元还包括起始子区块,且基于所述第i个子转换单元中的所述多个子区块从所述K个预设扫瞄方式中选定对应于所述第i个子转换单元的所述特定扫瞄方式的步骤包括:
采用所述K个预设扫瞄方式中的第j个预设扫瞄方式从所述第i个子转换单元的所述特定子区块扫瞄至所述第i个子转换单元的所述起始子区块,并记录在所述第j个预设扫瞄方式的扫瞄过程中经过的所述多个无效子区块的特定数量,其中j为索引值且1≤j≤N;
基于各所述预设扫瞄方式对应的所述特定数量从所述K个预设扫瞄方式中选定对应于所述第i个子转换单元的所述特定扫瞄方式,其中所述特定扫瞄方式对应的所述特定数量为最低。
9.根据权利要求8所述的方法,还包括:
依据对应于所述第i个子转换单元的所述特定扫瞄方式的所述扫瞄过程产生无效子区块清单,其中所述无效子区块列表至少记录所述第i个子转换单元中的各所述无效子区块在所述第i个子转换单元中的位置;
将对应于所述第i个子转换单元的所述无效子区块清单通知所述解码器。
10.根据权利要求1所述的方法,其中取得包括所述多个特征系数的所述转换单元的步骤包括:
取得特征数据图,并据以预测预测特征数据图;
取得所述特征数据图及所述预测特征数据图之间的差异特征数据图,并通过离散余弦转换将所述差异特征数据图转换为所述转换单元。
11.根据权利要求1所述的方法,还包括:
反应于判定所述转换单元的尺寸大于指定尺寸,在所述N个子转换单元的所述第i个子转换单元中决定所述参考原点及所述最后有效系数,并基于所述第i个子转换单元的所述参考原点将所述第i个子转换单元的所述最后有效系数的所述原始坐标修正为所述特定坐标。
12.根据权利要求11所述的方法,还包括:
反应于判定所述转换单元的所述尺寸不大于所述指定尺寸,在所述N个子转换单元的所述第i个子转换单元中决定所述参考原点及所述最后有效系数;
从所述第i个子转换单元的所述特定子区块开始扫瞄所述第i个子转换单元,并将所述第i个子转换单元中的所述至少一有效特征系数个别编码为所述编码数据;以及
发送第二特定指标、各所述子转换单元的所述最后有效系数的所述原始坐标及各所述有效特征系数的所述编码数据至所述解码器,其中所述第二特定指标指示各所述子转换单元的所述最后有效系数的所述原始坐标未经过修正。
13.根据权利要求1所述的方法,其中N为1,所述第i个子转换单元等于所述转换单元,所述转换单元的所述参考原点表征为所述转换单元的尾端坐标,且所述转换单元的所述最后有效系数的所述特定坐标表征为:
(Δx,Δy)=(xLSTU-xLSC,yLSTU-yLSC),
其中(xLSTU,yLSTU)为所述转换单元的所述尾端坐标,(xLSC,yLSC)为所述转换单元的所述最后有效系数的所述原始坐标。
14.根据权利要求1所述的方法,其中N为1,所述第i个子转换单元等于所述转换单元,所述转换单元的所述参考原点表征为所述转换单元的尾端坐标,且所述转换单元的所述最后有效系数的所述特定坐标表征为(Δx,Δy),其中:
Δx=(1<<Log2ZoTbWidth)-1-LastSignificantCoeffX;
Δy=(1<<Log2ZoTbHeight)-1-LastSignificantCoeffY;
其中1<<Log2k表示将二进制的位1往左移k个位置,LastSignificantCoeffX及LastSignificantCoeffY分别为所述转换单元的所述最后有效系数的所述原始坐标的x坐标及y坐标,ZoTbWidth及ZoTbHeight分别为log2Width及log2Height,其中Width及Height分别为所述转换单元的宽度及高度。
15.一种编码器,其特征在于,包括:
收发器;以及
处理器,其耦接所述收发器,并经配置以执行:
取得包括多个特征系数的转换单元,并将所述转换单元划分为多个子区块;
将所述转换单元划分为N个子转换单元,其中各所述子转换单元包括所述多个子区块的至少其中之一,且N为大于等于1的整数;
在所述N个子转换单元的第i个子转换单元中决定参考原点及最后有效系数,并基于所述第i个子转换单元的所述参考原点将所述第i个子转换单元的所述最后有效系数的原始坐标修正为特定坐标,其中所述第i个子转换单元的所述最后有效系数位于所述第i个子转换单元中的特定子区块,i为索引值且1≤i≤N;
从所述第i个子转换单元的所述特定子区块开始扫瞄所述第i个子转换单元,并将所述第i个子转换单元中的至少一有效特征系数个别编码为编码数据;以及
控制所述收发器发送第一特定指标、各所述子转换单元的所述最后有效系数的所述特定坐标及各所述有效特征系数的所述编码数据至解码器,其中所述第一特定指标指示各所述子转换单元的所述最后有效系数的所述特定坐标经过修正。
16.一种特征数据解码方法,适于解码器,其特征在于,所述方法包括:
接收第一特定指标、N个子转换单元个别的最后有效系数的特定坐标及至少一有效特征系数个别的编码数据,其中所述第一特定指标指示各所述子转换单元的所述最后有效系数的所述特定坐标经过修正,N为大于等于1的整数;
基于各所述有效特征系数的所述编码数据重建转换单元的多个子区块;
基于所述N个子转换单元的第i个子转换单元的所述最后有效系数的所述特定坐标,在所述第i个子转换单元中找出特定子区块,其中i为索引值且1≤i≤N;
从所述第i个子转换单元的所述特定子区块开始扫瞄所述第i个子转换单元,并解码所述第i个子转换单元中各所述有效特征系数的所述编码数据。
17.根据权利要求16所述的方法,其中从所述第i个子转换单元的所述特定子区块开始扫瞄所述第i个子转换单元的步骤包括:
取得对应于所述第i个子转换单元的特定扫瞄方式及无效子区块清单,并依据所述特定扫瞄方式及所述无效子区块清单从所述第i个子转换单元的所述特定子区块开始扫瞄所述第i个子转换单元,其中所述无效子区块列表至少记录所述第i个子转换单元中的至少一无效子区块在所述第i个子转换单元中的位置。
18.根据权利要求16所述的方法,其中所述第i个子转换单元包括至少一有效子区块,且从所述第i个子转换单元的所述特定子区块开始扫瞄所述第i个子转换单元,并解码所述第i个子转换单元中各所述有效特征系数的所述编码数据的步骤包括:
对于所述第i个子转换单元的所述至少一有效子区块中的第c个有效子区块,取得所述第c个有效子区块中的本地最后有效系数,并从所述本地最后有效系数朝所述第c个有效子区块的本地原点扫瞄,并解码所述第i个子转换单元中各所述有效特征系数的所述编码数据。
19.根据权利要求18所述的方法,其中解码所述第i个子转换单元中各所述有效特征系数的所述编码数据的步骤包括:
取得所述第c个有效子区块第一编码数据的旗标;
反应于判定所述第一编码数据的所述旗标为第一值,读取并解码所述第一编码数据;
反应于判定所述第一编码数据的所述旗标为第二值,忽略所述第一编码数据。
20.一种解码器,其特征在于,包括:
收发器;以及
处理器,其耦接于所述收发器,并经配置以执行:
控制所述收发器接收第一特定指标、N个子转换单元个别的最后有效系数的特定坐标及至少一有效特征系数个别的编码数据,其中所述第一特定指标指示各所述子转换单元的所述最后有效系数的所述特定坐标经过修正,N为大于等于1的整数;
基于各所述有效特征系数的所述编码数据重建转换单元的多个子区块;
基于所述N个子转换单元的第i个子转换单元的所述最后有效系数的所述特定坐标,在所述第i个子转换单元中找出特定子区块,其中i为索引值且1≤i≤N;
从所述第i个子转换单元的所述特定子区块开始扫瞄所述第i个子转换单元,并解码所述第i个子转换单元中各所述有效特征系数的所述编码数据。
CN202210423921.3A 2021-07-13 2022-04-21 特征数据编码方法、编码器、特征数据解码方法及解码器 Pending CN115623218A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202163221040P 2021-07-13 2021-07-13
US63/221,040 2021-07-13
TW110148784A TWI800180B (zh) 2021-07-13 2021-12-24 特徵資料編碼方法、編碼器、特徵資料解碼方法及解碼器
TW110148784 2021-12-24

Publications (1)

Publication Number Publication Date
CN115623218A true CN115623218A (zh) 2023-01-17

Family

ID=82404386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210423921.3A Pending CN115623218A (zh) 2021-07-13 2022-04-21 特征数据编码方法、编码器、特征数据解码方法及解码器

Country Status (3)

Country Link
US (1) US20230021460A1 (zh)
EP (1) EP4120682A3 (zh)
CN (1) CN115623218A (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7308146B2 (en) * 2002-09-30 2007-12-11 Canon Kabushiki Kaisha Digital video compression
EP2595380B1 (en) * 2011-11-19 2015-10-21 BlackBerry Limited Multi-level significance map scanning
KR20220024500A (ko) * 2019-07-12 2022-03-03 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치

Also Published As

Publication number Publication date
EP4120682A2 (en) 2023-01-18
EP4120682A3 (en) 2023-04-05
US20230021460A1 (en) 2023-01-26

Similar Documents

Publication Publication Date Title
CN111699694B (zh) 使用变换跳过标志的图像编码方法和装置
JP2022172145A (ja) ビデオ符号化およびビデオ復号における変換の選択のための方法および装置
RU2562379C2 (ru) Иерархия видеоблоков с предсказанием движения
JP5869493B2 (ja) ビデオ符号化および復号化のためのテンプレート・マッチング予測の適応型残差更新のための方法および装置
KR101838320B1 (ko) 예시-기반 데이터 프루닝을 이용한 비디오 디코딩
CN113574891B (zh) 基于dmvr的帧间预测方法和设备
JP2010502102A (ja) 低減された解像度の分割の方法及び装置
WO2012033970A1 (en) Encoding of a picture in a video sequence by example - based data pruning using intra- frame patch similarity
CN105247863A (zh) 三维视频编码中简化的cabac编码方法
CN103124349A (zh) 多级有效图扫描
CN111901596B (zh) 基于深度学习的视频混合编码与解码方法及装置、介质
EP2614644B1 (en) Encoding of the link to a reference block in video compression by image content based search and ranking
CN116527892A (zh) 解码设备、编码设备和数据发送设备
KR20230169239A (ko) 인공 신경망 기반 툴을 사용하여 이미지 및 비디오를 인코딩/디코딩하기 위한 방법 및 장치
CN111034198B (zh) 图像编码和解码方法、编码和解码设备及对应计算机程序
CN116708819A (zh) 解码装置、编码装置和数据发送装置
CN115623218A (zh) 特征数据编码方法、编码器、特征数据解码方法及解码器
TW202304204A (zh) 特徵資料編碼方法、編碼器、特徵資料解碼方法及解碼器
KR20170044028A (ko) 비디오 발췌를 이용하여 이미지의 잡음을 제거하기 위한 방법 및 장치
WO2024078920A1 (en) Latent coding for end-to-end image/video compression
KR20240110006A (ko) 부호화 구조의 채널간 참조에 기반한 피쳐 부호화/복호화 방법, 장치, 비트스트림을 저장한 기록 매체 및 비트스트림 전송 방법
KR20240090254A (ko) 피쳐 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
CN118044203A (zh) 特征编码/解码方法和装置以及存储比特流的记录介质
CN117934641A (zh) 一种面向多机器视觉任务的高效编码方法、装置及介质
CN118044204A (zh) 编解码方法、解码器、编码器及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination