CN103327332A - 一种hevc标准中8×8idct变换的实现方法 - Google Patents

一种hevc标准中8×8idct变换的实现方法 Download PDF

Info

Publication number
CN103327332A
CN103327332A CN2013102411475A CN201310241147A CN103327332A CN 103327332 A CN103327332 A CN 103327332A CN 2013102411475 A CN2013102411475 A CN 2013102411475A CN 201310241147 A CN201310241147 A CN 201310241147A CN 103327332 A CN103327332 A CN 103327332A
Authority
CN
China
Prior art keywords
matrix
carry out
calculating
8idct
matrixes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013102411475A
Other languages
English (en)
Other versions
CN103327332B (zh
Inventor
范益波
马天龙
刘聪
曾晓洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN201310241147.5A priority Critical patent/CN103327332B/zh
Publication of CN103327332A publication Critical patent/CN103327332A/zh
Application granted granted Critical
Publication of CN103327332B publication Critical patent/CN103327332B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)

Abstract

本发明属于数字视频信号编解码技术领域,具体为一种HEVC标准中8×8IDCT变换的实现方法。本发明通过将8×8的变换矩阵分解成稀疏矩阵相乘以及相加的形式,减小8×8IDCT变换中矩阵相乘的计算复杂度,从而大大降低系统的硬件开销。

Description

一种HEVC标准中8×8IDCT变换的实现方法
技术领域
本发明属于数字视频信号编解码技术领域,针对HEVC视频标准,具体涉及一种HEVC(High Efficiency Video Coding)标准中8×8IDCT(inverse discrete cosine transform)变换的实现方法。
背景技术
HEVC(High efficiency video coding)是由国际电信组织(ITU)和运动图像专家组(MPEG)联合制定而成的最新国际视频编码标准。相对于旧的H.264标准,HEVC具有更高的压缩效率,更适合超高分辨率视频的编码,但其计算量与复杂度也剧增,以标准中的IDCT变换为例,H.264标准采用4×4以及8×8的IDCT变换矩阵,而HEVC则采用4×4、8×8、16×16以及32×32的变换矩阵,这大大增加了硬件实现的复杂度;然而通过对矩阵进行适当分解,可以有效降低计算复杂度,提高计算速度以及减小硬件开销。
发明内容
 为了克服现有技术的不足,本发明的目的在于提出一种HEVC标准中8×8IDCT变换的实现方法,其可以有效降低计算复杂度,提高计算速度以及减小硬件开销。
本发明提出的方法具体描述如下:
HEVC中8×8IDCT的变换过程如下式所示:                                                。这是一个二维离散整数余弦变换,其中,F为输入8×8矩阵,f为输出8×8矩阵,A为常数8×8矩阵,A T A的转置矩阵。A的具体数值如下:
Figure 817539DEST_PATH_IMAGE002
通过进行两次一维离散整数余弦变换来实现二维离散整数余弦变换,过程如下。
Figure 231203DEST_PATH_IMAGE001
又可以写成另一种形式:
Figure 583687DEST_PATH_IMAGE003
,那么可以用如下过程来计算
Figure 57393DEST_PATH_IMAGE001
                                                                 (1)
                                                              
Figure 712682DEST_PATH_IMAGE005
                                                    (2)
                                                          
Figure 919673DEST_PATH_IMAGE006
                                                 (3)
                                                              
Figure 33122DEST_PATH_IMAGE007
                                                     (4)
       上述计算中,式(1)和式(3)计算过程相同,式(2)和式(4)对矩阵进行了转置操作。图1描述了上述计算过程的整体框图。
对于式(1)和式(3)所述的一维矩阵运算,通过将常数矩阵分解为稀疏矩阵相乘和相加的形式,得到一种实现方法,可以提高一维矩阵运算的计算速度和减低其计算复杂度。
为方便进行说明,现将式(1)、式(3)写成
Figure 489512DEST_PATH_IMAGE008
的形式,
Figure 713820DEST_PATH_IMAGE009
为8×8矩阵,包含64个元素,记为
Figure 572054DEST_PATH_IMAGE010
,
Figure 590826DEST_PATH_IMAGE011
,同样,
Figure 534511DEST_PATH_IMAGE012
也为8×8矩阵,包含64个元素,记为
Figure 562510DEST_PATH_IMAGE013
,
Figure 275251DEST_PATH_IMAGE011
Figure 730503DEST_PATH_IMAGE008
的计算可以以
Figure 895905DEST_PATH_IMAGE009
的列为单位进行,即
         
Figure 462016DEST_PATH_IMAGE014
(5)
本发明中,
Figure 294842DEST_PATH_IMAGE015
可以进行如下分解:
                                               
Figure 920996DEST_PATH_IMAGE016
                                      (6)
其中
Figure 42536DEST_PATH_IMAGE017
  
Figure 943496DEST_PATH_IMAGE018
        
Figure 427884DEST_PATH_IMAGE020
Figure 36719DEST_PATH_IMAGE021
Figure 475791DEST_PATH_IMAGE022
还可以进行进一步分解:
            
Figure 486472DEST_PATH_IMAGE023
(7)
Figure 985587DEST_PATH_IMAGE022
可以分解为
                                                            
Figure 81719DEST_PATH_IMAGE024
                                                  (8)
其中:
Figure 793323DEST_PATH_IMAGE025
    (9)    
Figure 189669DEST_PATH_IMAGE026
     (10)
可以进一步分解,
         
Figure 443113DEST_PATH_IMAGE027
(11)
本发明的有益效果在于:从而能够以更快的速度,更小的硬件开销来计算HEVC中的8×8二维整数离散余弦反变换。
附图说明
图1. 二维离散余弦反变换(IDCT)的整体框图。
图2. 式(5)的一种实现流程图。
具体实施方式
 图1所示为二维离散余弦反变换(IDCT)的整体框图。
本发明所述的HEVC中8×8IDCT实现方法,具体实施方式如下:
(1)输入8×8矩阵数据
Figure 489566DEST_PATH_IMAGE028
,以的每一列为单位,进行(1)式的计算,计算流程如图2所示,进行8次这样的计算后,得到8×8输出矩阵
Figure 50178DEST_PATH_IMAGE029
(2)对矩阵
Figure 652060DEST_PATH_IMAGE029
进行转置操作,得到矩阵
Figure 705467DEST_PATH_IMAGE030
(3)以
Figure 76405DEST_PATH_IMAGE030
的每一列为单位,进行(1)式的计算,计算流程如图2所示,进行8次这样的计算后,得到8×8输出矩阵
Figure 557065DEST_PATH_IMAGE031
(4)对矩阵
Figure 646244DEST_PATH_IMAGE031
进行转置操作,得到最终的8×8输出矩阵
Figure 237762DEST_PATH_IMAGE032
图2所示为根据上述分解原理所得到的关于式(5)的实现流程图,下面对其进行详细描述:
a)  输入为
Figure 463207DEST_PATH_IMAGE033
b)   先进行与的相乘,对应图中步骤1的操作,可以看到,与
Figure 691243DEST_PATH_IMAGE034
相乘只是
对输入进行了重新排序而已,并没有任何的计算操作。
c)    然后将前一步骤算出的结果分成上下两部分,分别与矩阵MN进行相
乘。步骤2到步骤5的上半部分对应与M的相乘,步骤2到步骤5的下半部分对应与N的相乘;其中,步骤5的上半部分没有操作,下半部分对应
Figure 86453DEST_PATH_IMAGE024
的操作。
d)    步骤6对应的操作为将步骤5中得到的结果和
Figure 431983DEST_PATH_IMAGE035
相乘。
e)    输出为
Figure 254446DEST_PATH_IMAGE036
本发明的这种实现方法与直接进行矩阵乘法相比,可以有效的减少乘法和加法的次数,乘法次数可以减少66%,加法次数可以减少46%,对比如下:
  乘法 加法
直接计算 64 56
本发明 22 30
整个实施过程可以方便的用软件或是硬件实现。
用软件实现时,如下:
(1)  输入8×8矩阵数据
Figure 52638DEST_PATH_IMAGE028
,以的每一列为单位,进行(1)式的计算,计算流程如图2所
示,用相应的软件语言依次描述每一步骤的计算过程,进行8次这样的计算后,得到8×8输出矩阵
Figure 451575DEST_PATH_IMAGE029
(2)  对矩阵
Figure 444939DEST_PATH_IMAGE029
进行转置操作,用软件实现时只需在读出时改变相应的行列号即可,得到
Figure 730427DEST_PATH_IMAGE029
的转置矩阵
(3)  以的每一列为单位,进行(1)式的计算,计算流程如图2所示,用相应的软件语言依次描述每一步骤的计算过程,进行8次这样的计算后,得到8×8输出矩阵
Figure 951826DEST_PATH_IMAGE031
(4)  对矩阵
Figure 724610DEST_PATH_IMAGE031
进行转置操作,用软件实现时只需在读出时改变相应的行列号即可,得到最终的8×8输出矩阵
用硬件实现时,如下:
(1)   输入8×8矩阵数据
Figure 174363DEST_PATH_IMAGE028
,以
Figure 509530DEST_PATH_IMAGE028
的每一列为单位,进行(1)式的计算,计算流程如图2所示,用硬件实现时,可采用多级流水线的方式实现,流程图中的每一步骤可以对应于一级流水线,流程图中的小圆圈可以看做一个寄存器,用来保存每一级的计算结果。但由于步骤1只是对输入数据的位置进行变换,并没有计算操作,因此可以省去步骤1这级流水线,直接对输入进行相应位置的调整即可,进行8次这样的计算后,得到8×8输出矩阵
Figure 769610DEST_PATH_IMAGE029
(2)  对矩阵
Figure 848424DEST_PATH_IMAGE029
进行转置操作,用硬件实现时需要有相应的存储器来存储
Figure 877560DEST_PATH_IMAGE029
的数据,对存储器的写操作读操作进行相应处理即可得到的转置矩阵
Figure 131004DEST_PATH_IMAGE030
(3)  以
Figure 13509DEST_PATH_IMAGE030
的每一列为单位,进行(1)式的计算,计算流程如图2所示,用硬件实现时,可采用多级流水线的方式实现,流程图中的每一步骤可以对应于一级流水线,流程图中的小圆圈可以看做一个寄存器,用来保存每一级的计算结果。但由于步骤1只是对输入数据的位置进行变换,并没有计算操作,因此可以省去步骤1这级流水线,直接对输入进行相应位置的调整即可,进行8次这样的计算后,得到8×8输出矩阵
Figure 897152DEST_PATH_IMAGE031
(4)  对矩阵
Figure 839700DEST_PATH_IMAGE031
进行转置操作,用硬件实现时需要有相应的存储器来存储
Figure 808793DEST_PATH_IMAGE031
的数据,对存储器的写操作读操作进行相应处理即可得到最终的8×8输出矩阵
Figure 229410DEST_PATH_IMAGE032

Claims (2)

1.一种HEVC标准中8×8IDCT变换的实现方法,其采用两次相同的一维矩阵运算和两次转置操作来实现二维矩阵运算,其特征在于具体步骤如下:
(1)   输入8×8矩阵数据                                                
Figure 704207DEST_PATH_IMAGE001
,以
Figure 348815DEST_PATH_IMAGE001
的每一列为单位,进行式(1)的计算,进
行8次这样的计算后,得到8×8输出矩阵
Figure 274046DEST_PATH_IMAGE002
Figure 29512DEST_PATH_IMAGE003
        (1)
其中,
Figure 91009DEST_PATH_IMAGE004
为常数8×8矩阵,的具体数值如下:
Figure 850204DEST_PATH_IMAGE005
(2) 对矩阵
Figure 878203DEST_PATH_IMAGE002
进行转置操作,得到矩阵
Figure 590944DEST_PATH_IMAGE006
(3) 以的每一列为单位,进行式(3)的计算,进行8次这样的计算后,得到8×8输出矩阵
Figure 211598DEST_PATH_IMAGE007
Figure 777709DEST_PATH_IMAGE008
        (3)
其中,A为常数8×8矩阵,A T A的转置矩阵;
(4)    对矩阵
Figure 610535DEST_PATH_IMAGE007
进行转置操作,得到最终的8×8输出矩阵
Figure 971110DEST_PATH_IMAGE009
2.根据权利要求1中的实现方法,其特征在于:步骤(1)和步骤(3)中的常数
矩阵分解为稀疏矩阵相乘和相加的形式,具体如下: 
                                                                                               
其中:
Figure 259188DEST_PATH_IMAGE011
  
Figure 680942DEST_PATH_IMAGE012
Figure 477997DEST_PATH_IMAGE013
        
Figure 791484DEST_PATH_IMAGE015
Figure 333324DEST_PATH_IMAGE016
进行进一步分解,
Figure 301280DEST_PATH_IMAGE015
分解为:
           
Figure 928570DEST_PATH_IMAGE017
           
分解为:
                                                            
Figure 36520DEST_PATH_IMAGE018
                                                            
其中:
Figure 175378DEST_PATH_IMAGE019
           
Figure 289964DEST_PATH_IMAGE020
     
Figure 539680DEST_PATH_IMAGE016
进一步分解为:
Figure 56112DEST_PATH_IMAGE021
。 
CN201310241147.5A 2013-06-18 2013-06-18 一种hevc标准中8×8idct变换的实现方法 Active CN103327332B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310241147.5A CN103327332B (zh) 2013-06-18 2013-06-18 一种hevc标准中8×8idct变换的实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310241147.5A CN103327332B (zh) 2013-06-18 2013-06-18 一种hevc标准中8×8idct变换的实现方法

Publications (2)

Publication Number Publication Date
CN103327332A true CN103327332A (zh) 2013-09-25
CN103327332B CN103327332B (zh) 2016-04-13

Family

ID=49195829

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310241147.5A Active CN103327332B (zh) 2013-06-18 2013-06-18 一种hevc标准中8×8idct变换的实现方法

Country Status (1)

Country Link
CN (1) CN103327332B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100811A (zh) * 2014-05-14 2015-11-25 北京君正集成电路股份有限公司 一种视频变换的实现方法及装置
CN110737869A (zh) * 2019-12-20 2020-01-31 眸芯科技(上海)有限公司 Dct/idct乘法器电路优化方法及应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1801940A (zh) * 2005-12-15 2006-07-12 清华大学 整型变换电路和整型变换方法
CN102387367A (zh) * 2011-11-08 2012-03-21 复旦大学 适用于多种视频标准、多尺寸二维整数余弦变换的通用方法
CN102404569A (zh) * 2011-11-08 2012-04-04 复旦大学 可用于多种视频标准、多尺寸二维整数余弦反变换的通用方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1801940A (zh) * 2005-12-15 2006-07-12 清华大学 整型变换电路和整型变换方法
CN102387367A (zh) * 2011-11-08 2012-03-21 复旦大学 适用于多种视频标准、多尺寸二维整数余弦变换的通用方法
CN102404569A (zh) * 2011-11-08 2012-04-04 复旦大学 可用于多种视频标准、多尺寸二维整数余弦反变换的通用方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
WEN-HSIUNG CHEN,ET AL: "A Fast Computational Algorithm for the Discrete Cosine Transform", 《IEEE TRANSACTIONS ON COMMUNICATIONS》, vol. 25, no. 9, 30 September 1977 (1977-09-30), XP000560650, DOI: doi:10.1109/TCOM.1977.1093941 *
邵凌 等: "一种基于通用DSP的快速余弦变换算法", 《系统工程与电子技术》, vol. 22, no. 2, 29 February 2000 (2000-02-29) *
郭宝增 等: "基于Loeffler算法的2-D DCT IP软核设计", 《微电子学与计算机》, vol. 28, no. 2, 28 February 2011 (2011-02-28) *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100811A (zh) * 2014-05-14 2015-11-25 北京君正集成电路股份有限公司 一种视频变换的实现方法及装置
CN105100811B (zh) * 2014-05-14 2018-04-03 北京君正集成电路股份有限公司 一种视频变换的实现方法及装置
CN110737869A (zh) * 2019-12-20 2020-01-31 眸芯科技(上海)有限公司 Dct/idct乘法器电路优化方法及应用

Also Published As

Publication number Publication date
CN103327332B (zh) 2016-04-13

Similar Documents

Publication Publication Date Title
CN109472350A (zh) 一种基于块循环稀疏矩阵的神经网络加速系统
CN102158694B (zh) 一种基于gpu的遥感图像解压缩方法
CN102387367B (zh) 适用于多种视频标准、多尺寸二维整数余弦变换的通用方法
CN101188761A (zh) Avs标准中基于并行处理来优化dct快速算法的方法
CN104320668B (zh) Hevc/h.265的dct变换和反变换的simd优化方法
CN103473744A (zh) 基于变权重式压缩感知采样的空域可缩小图像重构方法
CN102567282B (zh) 通用dsp处理器中fft计算实现装置和方法
CN104244010A (zh) 提高数字信号变换性能的方法及数字信号变换方法和装置
CN103327332A (zh) 一种hevc标准中8×8idct变换的实现方法
CN102547263B (zh) 可变复杂度的离散余弦逆变换查表快速算法
CN101957738A (zh) 基于一阶矩的数字内积计算器
CN108960203B (zh) 一种基于fpga异构计算的车辆检测方法
CN103327331A (zh) 一种hevc标准中8×8dct变换的实现方法
CN104270643B (zh) 基于single‑port SRAM的转置矩阵的地址映射算法
CN103327331B (zh) 一种hevc标准中8×8dct变换的实现方法
CN102447898B (zh) 用fpga实现klt变换的方法
CN109255770B (zh) 一种图像变换域降采样方法
Wang et al. JPEG image compression algorithm analysis and local optimization
CN203279074U (zh) 二维离散余弦变换/逆离散余弦变换电路
CN105407358B (zh) 一种基于hevc的整数dct变换方法
CN104270156A (zh) 压缩感知中追踪缩减补偿机制测量矩阵构造方法
Gajić et al. Fast computation of the discrete Pascal transform
CN104113763A (zh) 一种应用于图像编码的优选整数变换基
CN102333212B (zh) 一种双线性两倍上采样方法及系统
KR20150050680A (ko) 이산 코사인 변환 장치 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant