JP5241819B2 - 画像符号化方式変換装置 - Google Patents
画像符号化方式変換装置 Download PDFInfo
- Publication number
- JP5241819B2 JP5241819B2 JP2010502714A JP2010502714A JP5241819B2 JP 5241819 B2 JP5241819 B2 JP 5241819B2 JP 2010502714 A JP2010502714 A JP 2010502714A JP 2010502714 A JP2010502714 A JP 2010502714A JP 5241819 B2 JP5241819 B2 JP 5241819B2
- Authority
- JP
- Japan
- Prior art keywords
- prediction mode
- block
- frequency component
- unit
- intra
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
画像符号化方式の代表的なものとしては、主にデジタルカメラなどで用いられるJPEG(Joint Photographic Expert Group)方式がある。
また、JPEGを連続して符号化することで、動画像を符号化するMotionJPEGと呼ばれる方式がある。MotionJPEG方式はMJPEG方式やM−JPEG方式と呼ばれることもある。
さらに、DVD(Digital Versatile Disk)−VIDEOに採用されているMPEG−2(Moving Picture Expert Group)と呼ばれる方式もある。
また、携帯端末向けの地上デジタル放送、いわゆるワンセグ放送に採用されている方式であるH.264方式もある。
以上のように、画像符号化方式には様々な方式があり、一般に、異なる画像符号化方式には互換性がない。
しかし、例えば、市販されているDVDプレーヤでは、MPEG−2方式以外の方式には対応することができず、それぞれの画像符号化方式に対応する画像復号装置を用意するのは現実的に困難な場合がある。
一方、画像符号化方式変換装置を用意すれば、それぞれの画像符号化方式に対応する画像復号装置を用意する必要がなくなるが、画像の変換に要する時間や、変換後の画像の品質が問題になる。
即ち、この画像符号化方式変換装置では、JPEG方式とMPEG−4方式の双方がDCT係数を圧縮に用いていることを利用し、直流(DC:Direct Current)成分の変換とハフマンコードの変換によって、JPEG方式をMPEG−4方式に変換するようにしている。
しかし、H.264方式ではDCT係数が用いられないので、この画像符号化方式変換装置では、H.264方式の変換に適用することができない。
特に、H.264方式で採用されている画面内予測における予測モードの決定処理において、SAD(Sum of Absolute Difference)やSATD(Sum of Absolute Transformed Difference)は非常に演算量が大きいとされている。
ただし、非特許文献1,2では、16×16予測において、予測モードを決定するようにしているが、全てのDCT係数を使用する場合があり、この場合には、非常に多くの演算量を要することになる。
なお、4×4予測においては、予測方向の絞込みを行うだけで、完全には予測方法を決定していない。
ただし、8×8DCT係数を4つの4×4DCT係数に変換する演算量は非常に大きなものとなる。
実施の形態1.
図1はこの発明の実施の形態1による画像符号化方式変換装置を示す構成図であり、図において、JPEG簡易復号部1は画像が周波数領域に変換されて符号化されているJPEG方式(第1の符号化方式)の符号化ストリームであるJPEGデータを入力すると、そのJPEGデータの一部を復号して、画像の周波数成分の信号であるDCT係数と、画像の幅や高さなどを示すヘッダ情報を取得する処理を実施する。なお、JPEG簡易復号部1は周波数成分信号取得手段を構成している。
H.264符号化部3はH.264方式の符号化処理を実施する符号化部であり、予測モード推定部2により推定された予測モードとJPEG簡易復号部1により取得されたヘッダ情報を用いて、JPEG簡易復号部1により取得されたDCT係数を符号化して、H.264ストリーム(第2の符号化方式の符号化ストリーム)を生成する処理を実施する。なお、H.264符号化部3は符号化手段を構成している。
図2はこの発明の実施の形態1による画像符号化方式変換装置の予測モード推定部2の処理内容を示すフローチャートである。
この実施の形態1では、第1の符号化方式がJPEG方式であり、第2の符号化方式がH.264方式である例を説明する。
ただし、これは単なる一例に過ぎず、類似する他の方式であっても適用することができることは言うまでもない。例えば、第1の符号化方式がMPEG−1方式、MPEG−2方式又はMPEG−4方式であってもよい。
なお、H.264方式は時間方向の圧縮も可能であるが、この実施の形態1では、画面内圧縮方式のみを対象とする。
JPEG方式は、画像を8×8のブロックに分割して、各ブロックに対するDCT変換を実施し、DCT変換を実施することにより得られるDCT係数を量子化し、量子化後のDCT係数を可変長符号化する方式である。
一般に、DCT係数を量子化する際、高周波成分に対する量子化係数を大きくして、高周波成分をカットすることにより、圧縮効率を高めている。
この予測は、既に符号化された隣接する画素から予測画像を作成し、符号化対象の画像と予測画像の差分を取ることを意味する。
即ち、H.264方式では、上記の予測を16×16ブロック領域(16×16予測モード)で行うか、4×4ブロック領域(4×4予測モード)で行うかを選択する。
この予測処理により、取られた差分に対して、整数精度で周波数領域への変換を実施し、その変換により得られる係数を量子化する。この適応的な予測処理を行うことにより、圧縮効率を高めている。
しかし、この予測モードの選択は、非常に演算量が多い処理である。
この実施の形態1では、JPEG方式のDCT係数を利用することで、予測モードの推定を高速に行う。
JPEG簡易復号部1は、画像が周波数領域に変換されて符号化されているJPEG方式のJPEGデータを入力すると、そのJPEGデータの一部を復号して、画像の周波数成分の信号であるDCT係数と、画像の幅や高さなどを示すヘッダ情報を取得する。
通常のJPEG復号では、得られたDCT係数に対してIDCT(Inverse Discrete Cosine Transform)処理を実施して画素の値に復号するが、JPEG簡易復号部1ではIDCT処理を実施せず、得られたDCT係数を予測モード推定部2に出力し、ヘッダ情報をH.264符号化部3に出力する。
以下、予測モード推定部2の処理内容を具体的に説明する。
16×16予測モードにおける予測モード0(垂直予測)が効率的である状況(H.264方式において、予測モード0を利用するのが適正である状況)は、ブロックR0の最下部の8画素とブロックC00,C02の画素が近く、ブロックR1の最下部の8画素とブロックC01,C03の画素が近い場合である。
また、16×16予測モードにおける予測モード1(水平予測)が効率的である状況(H.264方式において、予測モード1を利用するのが適正である状況)は、ブロックR2の最右端の8画素とブロックC00,C01の画素が近く、ブロックR3の最右端の8画素とブロックC02,C03の画素が近い場合である。
また、16×16予測モードにおける予測モード3(平面予測)が効率的である状況(H.264方式において、予測モード3を利用するのが適正である状況)は、ブロックR0,R1の最下部の8画素と、ブロックR2,R3の最右端の8画素と、ブロックR4の右下の画素とを利用して、グラデーションのある予測画像が作成されるため、ブロックR0,R1の最下部の画素の変化が、ブロックC00〜C03の水平方向の変化に一致し、ブロックR2,R3の最右端の画素の変化が、ブロックC00〜C03の垂直方向の変化に近い場合である。これは、グラデーションのある画像の場合に有効である。
また、kは計算に用いる係数であり、ここでは、0≦k≦7であるとする。因みに、k=0とすれば、全DCT係数のうち、直流成分のDCT係数のみから予測モードを推定することを意味する。また、k=1又はk=2とすれば、全DCT係数のうち、低周波成分のDCT係数のみから予測モードを推定することを意味する。ここでは、k=1又はk=2とすれば、低周波成分のDCT係数のみから予測モードを推定することを意味するとしたが、例えば、k=3としても、低周波成分のDCT係数のみから予測モードを推定することを意味する。
w16×16_DC0,w16×16_DC1,w16×16_DC2,w16×16_DC3,wi,wjは重みである。
また、評価値Cost16×16_1は、ブロックC00,C01とブロックR2の垂直方向の変化及びブロックC02,C03とブロックR3の垂直方向の変化の近さを評価しており、16×16予測モードにおける予測モード1(水平予測)の評価値である。
Cost16×16_0≦th16×16_0 (3)
Cost16×16_1≦th16×16_1 (4)
一方、式(3)と式(4)の双方が成立しない場合、H.264方式における予測モードとして、4×4予測モードにおける何れかの予測モードを利用するものと決定する(ステップST5)。
また、式(4)のみが成立する場合、16×16予測モードにおける予測モード1(水平予測)を利用するものと決定する(ステップST7)。
予測モード推定部2は、式(3)と式(4)の双方が成立する場合、評価値Cost16×16_0と評価値Cost16×16_1の差分絶対値を取り、その差分絶対値と閾値th16×16_2を比較する(ステップST8)。
|Cost16×16_0−Cost16×16_1|≧th16×16_2
(5)
Cost16×16_0<Cost16×16_1 (6)
予測モード推定部2は、式(6)が成立する場合、16×16予測モードにおける予測モード0(垂直予測)を利用するものと決定し(ステップST10)、式(6)が成立しない場合、16×16予測モードにおける予測モード1(水平予測)を利用するものと決定する(ステップST11)。
このうち、予測モード3(平面予測)は、ブロックR0,R1の最下部の画素の変化と、ブロックR2,R3の最右端の画素の変化とが、ブロックC00〜C04の画素の変化に近い場合に有効であると言える。
Cost16×16_3=Cost16×16_0+Cost16×16_1≦th16×16_3
(7)
予測モード推定部2は、式(7)が成立する場合、16×16予測モードにおける予測モード3(平面予測)を利用するものと決定し(ステップST14)、式(7)が成立しない場合、16×16予測モードにおける予測モード2(DC予測)を利用するものと決定する(ステップST13)。
図6は画像の符号化対象のブロックC10〜C115と、その周辺のブロックR0〜R5を示す説明図である。
ブロックC10〜C115は、いずれも4×4のブロックであり、0〜15の順序で符号化される。
ブロックC10〜C115は、図5のブロックC00〜C03が4分割されたものであって、ブロックC00はブロックC10〜C13、ブロックC01はブロックC14〜C17、ブロックC02はブロックC18〜C111、ブロックC03はブロックC112〜C115に分割されたものである。
なお、ブロックR0〜R5は、いずれも8×8のブロックであり、図4のブロックR0〜R5と同じである。
予測モード推定部2は、評価値の比によって、大まかに、3つに予測モード(垂直方向、水平方向、斜め方向)に絞込み、絞り込んだ予測方向から予測モードを決定する。
この予測モードの絞込みにおいて、予測モード0,3,7を垂直方向、予測モード1,8を水平方向、予測モード2,4,5,6を斜め方向とする。この予測モードの分類は、予測画像を作成する画素の位置に基づくものである。
図7は4×4予測モードにおける予測モードの絞込み処理を示すフローチャートである。
図8、図9及び図10は4×4予測モードにおける予測モードの選択処理を示すフローチャートである。
予測モード推定部2は、垂直方向と水平方向の評価値をブロック毎に算出すると、垂直方向の評価値と水平方向の評価値の比RateVH4×4,nを算出する(ステップST22)。
RateVH4×4,n<th4×4_H,n (9)
th4×4_H,n≦RateVH4×4,n<th4×4_V,n (10)
RateVH4×4,n≧th4×4_V,n (11)
予測モード推定部2は、式(10)が成立する場合、斜め方向への予測が有効であるとして、予測モード2,4,5,6に絞込みを行う(ステップST26)。
予測モード推定部2は、式(11)が成立する場合、垂直方向への予測が有効であるとして、予測モード0,3,7に絞込みを行う(ステップST27)。
RateVH4×4,n>th4×4_1_8,n (12)
予測モード推定部2は、式(12)が成立する場合、予測モード1を利用するものと決定し(ステップST32)、式(12)が成立しない場合、予測モード8を利用するものと決定する(ステップST33)。
RateVH4×4,n≦th4×4_4_5,n (14)
th4×4_4_5,n<RateVH4×4,n≦th4×4_4_6,n (15)
RateVH4×4,n>th4×4_4_6,n (16)
予測モード推定部2は、式(15)が成立する場合、予測モード4を利用するものと決定する(ステップST47)。
予測モード推定部2は、式(16)が成立する場合、予測モード6を利用するものと決定する(ステップST48)。
RateVH4×4,n≦th4×4_0_7,n (17)
th4×4_0_7,n<RateVH4×4,n≦th4×4_3_7,n (18)
RateVH4×4,n>th4×4_3_7,n (19)
予測モード推定部2は、式(18)が成立する場合、予測モード7を利用するものと決定する(ステップST54)。
予測モード推定部2は、式(19)が成立する場合、予測モード3を利用するものと決定する(ステップST55)。
基本的に、4×4の各ブロックが構成される元となる8×8ブロックと、それに隣接する8×8ブロックのDCT係数から算出される。
n=0(C10)のときは、下記の式(20)及び式(21)に示すように、ブロックC10が含まれるC00と、ブロックC00に隣接するブロックR0,R2のDCT係数を用いて評価値を算出する。
上記のようにして、予測モードの決定処理を実施することで、8×8ブロックのDCT係数から予測モードを推定することができる。
H.264ストリームの生成に際して、JPEG簡易復号部1により取得されたDCT係数に対するIDCT処理を実施して、そのDCT係数を画素信号に戻してから符号化を行うようにしてもよい。
また、非特許文献4に開示されているように、変換行列を用いて、DCT係数を整数精度DCTに変換して符号化を行うようにしてもよい。
・非特許文献4
「Efficient MPEG-2 to H.264/AVC intra transcoding in transform-domain」
Circuits and Systems, 2005. ISCAS 2005. IEEE International Symposium on
23-26 May 2005 Page(s):1234 - 1237 Vol. 2
なお、式(1)、式(2)、式(20)〜式(51)において、変数kを小さくすれば、即ち、k=0として、全DCT係数のうち、直流成分のDCT係数のみから予測モードを推定する場合や、k=1又はk=2として(あるいは、k=3として)、全DCT係数のうち、低周波成分のDCT係数のみから予測モードを推定する場合には、演算量を大幅に削減することができる。
上記実施の形態1では、予測モード推定部2がJPEG簡易復号部1により取得されたDCT係数からH.264方式における予測モードを推定するものについて示したが、予測モード推定部2がH.264方式における予測モードを推定する際、JPEG簡易復号部1により取得されたDCT係数の中に高周波成分のDCT係数が含まれているか否かを判定し、高周波成分のDCT係数が含まれていない場合には、推定する予測モードを絞り込むようにしてもよい。
なお、特に断りがない限り、数式中の変数は、上記実施の形態1と同じ意味を表すものとする。
16×16予測モードが採用され、16×16予測モードにおける予測モードを選択する際の処理内容は、上記実施の形態1と同様であるため説明を省略する。
以下、図5及び図6を参照しながら、4×4予測モードが採用された場合の処理内容を説明する。
図11及び図12はこの発明の実施の形態2による画像符号化方式変換装置の予測モードの選択処理を示すフローチャートである。
予測モード推定部2は、下記の式(52)が成立する場合、ブロックC00に高周波成分が存在していると判定する(図11のステップST61)。
MAX(DCT_C00i,j)>th2_high (52)
ただし、MAX(DCT_C00i,j)はDCT係数の最大値であり、th2_highは閾値であり、4≦i,j≦7である。ここでは、4≦i,j≦7である例を示しているが、例えば、4≦i,4≦jであってもよい。i,jについては、以降の説明において全て同様である。
なお、高周波成分が存在しているか否かを判定は、他の方法を用いてもよい。
一方、ブロックC00に高周波成分が存在していない場合、下記の式(53)〜式(55)を計算して、評価値Cost2_4×4,0,0,Cost2_4×4,0,1,Cost2_4×4,0,2_4を算出する(ステップST63)。
予測モード推定部2は、評価値Cost2_4×4,0,0が最小である場合(ステップST64)、ブロックC10については予測モード0を利用するものと決定する(ステップST65)。
また、予測モード推定部2は、評価値Cost2_4×4,0,1が最小である場合(ステップST66)、ブロックC10については予測モード1を利用するものと決定する(ステップST67)。
MAX(DCT_C00i,j)>th2_DC (56)
ただし、4≦i,j≦7である。
予測モード推定部2は、式(56)が成立する場合、ブロックC10については予測モード4を利用するものと決定する(ステップST69)。
一方、式(56)が成立しない場合、ブロックC10については予測モード2を利用するものと決定する(ステップST70)。
即ち、ブロックC11については予測モード1に決定し、ブロックC12については予測モード0に決定し、ブロックC13については、下記の式(57)が成立するか否かを判定する(図12のステップST81)。
予測モード推定部2は、式(57)が成立しない場合、下記の式(58)が成立するか否かを判定する(ステップST83)。
予測モード推定部2は、式(58)が成立しない場合、ブロックC13については予測モード0を利用するものと決定する(ステップST85)。
以降、ブロックC01,C02,C03についても同様の方法で、ブロックC14〜C115の各ブロックの予測モードを決定する。
MAX(DCT_C01i,j)>th2_high (59)
ただし、4≦i,j≦7である。
ブロックC01に高周波成分が存在しない場合、ブロックC14の予測モードを決定するために、下記の式(60)〜式(62)を計算して、評価値Cost2_4×4,1,0,Cost2_4×4,1,1,Cost2_4×4,1,2_4を算出する。
予測モード推定部2は、評価値Cost2_4×4,1,0が最小である場合、ブロックC14については予測モード0を利用するものと決定する。
また、予測モード推定部2は、評価値Cost2_4×4,1,1が最小である場合、ブロックC14については予測モード1を利用するものと決定する。
予測モード推定部2は、評価値Cost2_4×4,1,2_4が最小である場合、DCT係数の最大値MAX(DCT_C01i,j)と閾値th2_DCを比較する。
MAX(DCT_C01i,j)>th2_DC (63)
ただし、4≦i,j≦7である。
予測モード推定部2は、式(63)が成立する場合、ブロックC14については予測モード4を利用するものと決定する。
一方、式(63)が成立しない場合、ブロックC14については予測モード2を利用するものと決定する。
ブロックC17については、下記の式(64)が成立するか否かを判定する。
一方、式(64)が成立しない場合、下記の式(65)が成立するか否かを判定する。
一方、式(65)が成立しない場合、ブロックC17については予測モード0を利用するものと決定する。
MAX(DCT_C02i,j)>th2_high (66)
ただし、4≦i,j≦7である。
ブロックC02に高周波成分が存在しない場合、ブロックC18の予測モードを決定するために、下記の式(67)〜式(69)を計算して、評価値Cost2_4×4,2,0,Cost2_4×4,2,1,Cost2_4×4,2,2_4を算出する。
予測モード推定部2は、評価値Cost2_4×4,2,0が最小である場合、ブロックC18については予測モード0を利用するものと決定する。
また、予測モード推定部2は、評価値Cost2_4×4,2,1が最小である場合、ブロックC18については予測モード1を利用するものと決定する。
予測モード推定部2は、評価値Cost2_4×4,2,2_4が最小である場合、DCT係数の最大値MAX(DCT_C02i,j)と閾値th2_DCを比較する。
MAX(DCT_C02i,j)>th2_DC (70)
ただし、4≦i,j≦7である。
予測モード推定部2は、式(70)が成立する場合、ブロックC18については予測モード4を利用するものと決定する。
一方、式(69)が成立しない場合、ブロックC18については予測モード2を利用するものと決定する。
ブロックC111については、下記の式(71)が成立するか否かを判定する。
一方、式(71)が成立しない場合、下記の式(72)が成立するか否かを判定する。
一方、式(72)が成立しない場合、ブロックC111については予測モード0を利用するものと決定する。
MAX(DCT_C03i,j)>th2_high (73)
ただし、4≦i,j≦7である。
ブロックC03に高周波成分が存在しない場合、ブロックC112の予測モードを決定するために、下記の式(74)〜式(76)を計算して、評価値Cost2_4×4,3,0,Cost2_4×4,3,1,Cost2_4×4,3,2_4を算出する。
予測モード推定部2は、評価値Cost2_4×4,3,0が最小である場合、ブロックC112については予測モード0を利用するものと決定する。
また、予測モード推定部2は、評価値Cost2_4×4,3,1が最小である場合、ブロックC112については予測モード1を利用するものと決定する。
予測モード推定部2は、評価値Cost2_4×4,3,2_4が最小である場合、DCT係数の最大値MAX(DCT_C03i,j)と閾値th2_DCを比較する。
MAX(DCT_C03i,j)>th2_DC (77)
ただし、4≦i,j≦7である。
予測モード推定部2は、式(77)が成立する場合、ブロックC112については予測モード4を利用するものと決定する。
一方、式(77)が成立しない場合、ブロックC112については予測モード2を利用するものと決定する。
ブロックC115については、下記の式(78)が成立するか否かを判定する。
一方、式(78)が成立しない場合、下記の式(79)が成立するか否かを判定する。
一方、式(79)が成立しない場合、ブロックC115については予測モード0を利用するものと決定する。
したがって、高周波成分がない場合に、非常に高速に4×4予測モードを決定して、H.264方式への変換を高速に行うことが可能になる。
上記実施の形態1,2では、予測モード推定部2がJPEG簡易復号部1により取得されたDCT係数からH.264方式の予測モードを推定するものについて示したが、動画像の場合、図14に示すように、静止画像を時間軸方向に並べた形式で表されることが多く、時間的に近いフレームは一般に相関が高い(類似している)ことが多い。
そこで、この実施の形態3では、類似している画像が連続して符号化されている場合、H.264方式の予測モードの推定を行わず、1フレーム前の予測モードと同一の予測モードを使用し続けるようにしている。
具体的には、以下の通りである。
DCT係数記憶部11はJPEG簡易復号部1により取得されたDCT係数を記憶し、その後、JPEG簡易復号部1により最新のDCT係数(現在のフレームのDCT係数)が取得されると、記憶している1フレーム前のDCT係数を予測モード推定処理判定部13に出力する。なお、DCT係数記憶部11は周波数成分記憶手段を構成している。
予測モード記憶部12は予測モード推定部2により推定されたH.264方式の予測モードを記憶し、予測モード推定処理判定部13から予測モードの出力指令を受けると、記憶している1フレーム前の予測モードをH.264符号化部3に出力する。なお、予測モード記憶部12は画面内予測方向記憶手段を構成している。
図16はこの発明の実施の形態3による画像符号化方式変換装置の予測モード推定処理判定部13の処理内容を示すフローチャートである。
ただし、DCT係数記憶部11、予測モード記憶部12及び予測モード推定処理判定部13を実装している点以外は、上記実施の形態1,2と同様であるため、ここでは、DCT係数記憶部11、予測モード記憶部12及び予測モード推定処理判定部13の動作のみを説明する。
予測モード記憶部12は、上記実施の形態1と同様にして、予測モード推定部2がH.264方式の予測モードを推定すると、その予測モードを記憶する。
予測モード推定処理判定部13は、予測モード推定処理を実施する必要があると判定すると、予測モードの推定命令を予測モード推定部2に出力することにより、その予測モード推定処理を予測モード推定部2に実施させる。
一方、予測モード推定処理を実施する必要がないと判定すると、予測モードの出力命令を予測モード記憶部12に出力することにより、予測モード記憶部12に記憶されている1フレーム前の予測モードをH.264符号化部3に出力させる。
以下、予測モード推定処理判定部13の処理内容を具体的に説明する。
符号化対象ブロックが、連続するフレームにおいて類似している場合は、1フレーム前と同一の予測モードを用いても、高効率の符号化が可能である。
一方、符号化対象ブロックが、連続するフレームにおいて相違している場合は、1フレーム前と同一の予測モードを用いると、符号化効率が悪化する可能性が高い。
また、k及びlは計算に用いる係数であり、ここでは、0≦k≦7,0≦l≦7であるとする。
k=0,l=0とすれば全DCT係数のうち、直流成分のDCT係数のみを用いて、予測モード推定処理の実施の必要性を判定することを意味する。
k=2,l=2とすれば、全DCT係数のうち、低周波成分のDCT係数のみを用いて、予測モード推定処理の実施の必要性を判定することを意味する。
また、k=2,l=7とすれば、水平方向は低周波成分のみを用い、垂直方向は高周波成分までのDCT係数を用いて、予測モード推定処理の実施の必要性を判定することを意味する。
なお、wi,jは重みである。
Diff≦thDiff (81)
予測モード推定処理判定部13は、式(81)が成立する場合、符号化対象ブロックが、連続するフレーム間において類似しているとみなして、予測モードの出力命令を予測モード記憶部12に出力する(ステップST93)。
予測モード記憶部12は、予測モード推定処理判定部13から予測モードの出力命令を受けると、記憶している1フレーム前の予測モードをH.264符号化部3に出力する。
ただし、予測モード推定処理判定部13から数フレーム連続して予測モードの出力命令を受けている場合には、予測モード記憶部12が記憶している予測モードは数フレーム前の予測モードであり、数フレーム前の予測モードをH.264符号化部3に出力する。
予測モード推定部2は、予測モード推定処理判定部13から予測モードの推定命令を受けると、上記実施の形態1,2と同様にして、H.264方式の予測モードを推定し、その予測モードをH.264符号化部3及び予測モード記憶部12に出力する。
なお、予測モード推定部2は、H.264方式の予測モードを推定する際、上記実施の形態1,2と同様に、DCT係数を用いて予測モードを推定してもよいが、全ての予測モードに対して、SADやSATDを実施して、予測モードを決定するようにしてもよい。
上記実施の形態3では、現在のフレームと1フレーム前の同一位置の符号化対象ブロックが相違している場合に限り、予測モード推定部2が予測モードの推定処理を実施するものについて示したが、現在のフレームと1フレーム前の同一位置の符号化対象ブロックが類似している場合でも、規定回数連続して、予測モード推定部2が予測モードの推定処理を実施していない場合には、予測モードの推定処理を予測モード推定部2に実施させるようにしてもよい。
具体的には、以下の通りである。
同一予測モードカウント部14は予測モード推定処理判定部15から予測モードの出力命令が予測モード記憶部12に出力されるとカウント値Countをインクリメントし、予測モード推定処理判定部15から予測モードの推定命令が予測モード推定部2に出力されるとカウント値Countを0リセットする。
なお、同一予測モードカウント部14及び予測モード推定処理判定部15から推定処理判定手段が構成されている。
図18はこの発明の実施の形態4による画像符号化方式変換装置の予測モード推定処理判定部15の処理内容を示すフローチャートである。
上記実施の形態3では、符号化対象ブロックにおいて、現在のフレームと1フレーム前の同一位置の符号化対象ブロックが類似している限り、何回でも、前のフレームと同一の予測モードを使用し続けるようにしている。
しかしながら、例えば、日照変動などのように、フレーム間では類似していても、微小な変化が連続する場合には、同一の予測モードを使用し続けると、符号化効率が悪くなる可能性がある。
そこで、この実施の形態4では、微小な変化が連続するような場合には、同一の予測モードが使用され続けないようにするため、同一予測モードの連続使用数に制限を設けるようにしている。
以下、同一予測モードカウント部14及び予測モード推定処理判定部15の処理内容を具体的に説明する。
予測モード推定処理判定部15は、差分値Diffを算出すると、その差分値Diffと閾値thDiffを比較する(ステップST102)。
予測モード推定部2は、予測モード推定処理判定部15から予測モードの推定命令を受けると、上記実施の形態1〜3と同様にして、H.264方式の予測モードを推定し、その予測モードをH.264符号化部3及び予測モード記憶部12に出力する。
なお、予測モード推定部2は、H.264方式の予測モードを推定する際、上記実施の形態1〜3と同様に、DCT係数を用いて予測モードを推定してもよいが、全ての予測モードに対して、SADやSATDを実施して、予測モードを決定するようにしてもよい。
Count≦thCount (82)
予測モード記憶部12は、予測モード推定処理判定部15から予測モードの出力命令を受けると、記憶している1フレーム前の予測モードをH.264符号化部3に出力する。
ただし、予測モード推定処理判定部15から数フレーム連続して予測モードの出力命令を受けている場合には、予測モード記憶部12が記憶している予測モードは数フレーム前の予測モードであり、数フレーム前の予測モードをH.264符号化部3に出力する。
予測モード推定部2は、予測モード推定処理判定部15から予測モードの推定命令を受けると、上記実施の形態1〜3と同様にして、H.264方式の予測モードを推定し、その予測モードをH.264符号化部3及び予測モード記憶部12に出力する。
上記実施の形態3,4では、現在のフレームと1フレーム前の同一位置の符号化対象ブロックを比較して、予測モード推定部2におけるH.264方式の予測モード推定処理の実施の必要性を判定するものについて示したが、現在のフレームと1フレーム前の同一位置の符号化対象ブロックだけでなく、符号化対象ブロックの周辺ブロックも比較対象に含めて、予測モード推定処理の実施の必要性を判定することにより、より高効率な符号化を行うことができるようにしてもよい。
この実施の形態5では、説明の便宜上、図13の画像符号化方式変換装置の構成を参照して説明する。
ただし、ブロックA00〜A03,RA0〜RA5,B00〜B03及びRB0〜RB5は、いずれも8×8ブロックである。
また、DCT_RA0i,j,DCT_RA1i,j,DCT_RA2i,j,DCT_RA3i,j,DCT_RA4i,j,DCT_RA5i,j,DCT_RB0i,j,DCT_RB1i,j,DCT_RB2i,j,DCT_RB3i,j,DCT_RB4i,j,DCT_RB5i,jは、それぞれブロックRA0,RA1,RA2,RA3,RA4,RA5,RB0,RB1,RB2,RB3,RB4,RB5におけるi行、j列のDCT係数である。
k=0,l=0とすれば全DCT係数のうち、直流成分のDCT係数のみを用いて、予測モード推定処理の実施の必要性を判定することを意味する。
k=2,l=2とすれば、全DCT係数のうち、低周波成分のDCT係数のみを用いて、予測モード推定処理の実施の必要性を判定することを意味する。
また、k=2,l=7とすれば、水平方向は低周波成分のみを用い、垂直方向は高周波成分までのDCT係数を用いて、予測モード推定処理の実施の必要性を判定することを意味する。
なお、ui,j,vi,jは重みである。
Diffneighbor≦thneighbor (84)
予測モード推定処理判定部13は、式(84)が成立する場合、符号化対象ブロックが、連続するフレーム間において類似しているとみなして、予測モードの出力命令を予測モード記憶部12に出力する。
予測モード記憶部12は、予測モード推定処理判定部13から予測モードの出力命令を受けると、記憶している1フレーム前の予測モードをH.264符号化部3に出力する。
ただし、予測モード推定処理判定部13から数フレーム連続して予測モードの出力命令を受けている場合には、予測モード記憶部12が記憶している予測モードは数フレーム前の予測モードであり、数フレーム前の予測モードをH.264符号化部3に出力する。
予測モード推定部2は、予測モード推定処理判定部13から予測モードの推定命令を受けると、上記実施の形態1〜4と同様にして、H.264方式の予測モードを推定し、その予測モードをH.264符号化部3及び予測モード記憶部12に出力する。
上記実施の形態5では、現在のフレームと1フレーム前の同一位置の符号化対象ブロックだけでなく、符号化対象ブロックの周辺ブロックも比較対象に含めて、予測モード推定処理の実施の必要性を判定するものについて示したが、予測モード記憶部12に記憶されている1フレーム前の予測モードを考慮して、予測モード推定処理の実施の必要性を判定するようにしてもよい。
具体的には、以下の通りである。
予測モード推定処理判定部16は図13の予測モード推定処理判定部13又は図17の予測モード推定処理判定部15と同様に、予測モード推定処理の実施の必要性を判定し、その予測モード推定処理を実施する必要があると判定すれば、その予測モード推定処理を予測モード推定部2に実施させる一方、その予測モード推定処理を実施する必要がないと判定すれば、予測モード記憶部12に記憶されている1フレーム前の予測モードをH.264符号化部3に出力させるが、予測モード推定処理判定部16は予測モード推定処理の実施の必要性を判定する際、予測モード記憶部12に記憶されている1フレーム前の予測モードを考慮して判定を行う。なお、予測モード推定処理判定部16は推定処理判定手段を構成している。
図21はこの発明の実施の形態6による画像符号化方式変換装置の予測モード推定処理判定部16の処理内容を示すフローチャートである。
予測モード推定処理判定部16は、1フレーム前の予測モードが16×16予測モードである場合、差分値Diff16×16_nを算出し(ステップST112)、その差分値Diff16×16_nと閾値th16×16_nを比較する(ステップST113)。差分値Diff16×16_nの算出方法は後述する。
Diff16×16_n≦th16×16_n (85)
ここで、nは1フレーム前の16×16予測モードであり、予測モード0〜3のいずれかである。
予測モード記憶部12は、予測モード推定処理判定部16から予測モードの出力命令を受けると、記憶している1フレーム前の予測モードをH.264符号化部3に出力する。
ただし、予測モード推定処理判定部16から数フレーム連続して予測モードの出力命令を受けている場合には、予測モード記憶部12が記憶している予測モードは数フレーム前の予測モードであり、数フレーム前の予測モードをH.264符号化部3に出力する。
予測モード推定処理判定部16は、式(85)が成立しない場合、符号化対象ブロックが、連続するフレーム間において相違しているとみなして、予測モードの推定命令を予測モード推定部2に出力する(ステップST119)。
予測モード推定部2は、予測モード推定処理判定部16から予測モードの推定命令を受けると、上記実施の形態1〜5と同様に、H.264方式の予測モードを推定し、その予測モードをH.264符号化部3及び予測モード記憶部12に出力する。
Diff4×4≦th4×4 (86)
予測モード記憶部12は、予測モード推定処理判定部16から予測モードの出力命令を受けると、記憶している1フレーム前の予測モードをH.264符号化部3に出力する。
ただし、予測モード推定処理判定部16から数フレーム連続して予測モードの出力命令を受けている場合には、予測モード記憶部12が記憶している予測モードは数フレーム前の予測モードであり、数フレーム前の予測モードをH.264符号化部3に出力する。
予測モード推定処理判定部16は、式(86)が成立しない場合、符号化対象ブロックが、連続するフレーム間において相違しているとみなして、予測モードの推定命令を予測モード推定部2に出力する(ステップST119)。
予測モード推定部2は、予測モード推定処理判定部16から予測モードの推定命令を受けると、上記実施の形態1〜5と同様に、H.264方式の予測モードを推定し、その予測モードをH.264符号化部3及び予測モード記憶部12に出力する。
予測モード推定処理判定部16は、n=0のときは、下記の式(87)に示すように、符号化対象ブロックA00〜A03,B00〜B03と、ブロックA00,A01及びブロックB00,B01に隣接するブロックRA0,RA1及びRB0,RB1のDCT係数を用いて差分値Diff16×16_0を算出する。
予測モード推定処理判定部16は、下記の式(91)及び式(92)に示すように、符号化対象ブロックA00〜A03,B00〜B03と、ブロックA00〜A02及びブロックB00〜B02の周辺のブロックRA0〜RA5及びRB0〜RB5のDCT係数を用いて差分値Diff4×4を算出する。
以下、μ0〜μ5の算出方法について説明する。
図22は4×4予測モードのときの1フレーム前の符号化対象ブロックB10〜B115とその周辺のブロックRB0〜RB5と、現在のフレームの符号化対象ブロックA00〜A03とその周辺のブロックRA0〜RA5とを示す説明図である。
ブロックB10〜B115は、図19のブロックB00〜B03が4分割されたものであって、ブロックB00はブロックB10〜B13、ブロックB01はブロックB14〜B17、ブロックB02はブロックB18〜B111、ブロックB03はブロックB112〜B115に分割されたものである。
μ0=0を初期値として、B10,B11が上記予測モードをとっている場合、μ0にそれぞれ4/9が加算され、B14が上記予測モードをとっている場合、μ0に1/9が加算される。
μ1=0を初期値として、B11,B14,B15が上記予測モードをとっている場合、μ1にそれぞれ1/3が加算される。
μ2=0を初期値として、B10,B12が上記予測モードをとっている場合、μ2にそれぞれ4/9が加算され、B18が上記予測モードをとっている場合、μ2に1/9が加算される。
μ3=0を初期値として、B18,B110が上記予測モードをとっている場合、μ3にそれぞれ1/2が加算される。
μ5は、前フレームでブロックRB5内に含まれる画素を用いて予測が行われているか否かで、その値が決定される。前フレームでブロックRB5内に含まれる画素を用いて予測が行われるのは、B15の予測モードが3または7の場合であり、これを満たすとき、μ5=4/9とされる。
上記実施の形態1〜6では、予測モード推定部2がJPEG簡易復号部1により取得されたDCT係数からH.264方式の予測モードを推定するものについて示したが、予測モード推定部2がH.264方式の予測モードを推定する際、JPEG簡易復号部1により取得されたDCT係数から新たに周波数特性(周波数成分)を算出し、その周波数特性から予測モードを推定するようにしてもよい。
なお、特に断りがない限り、数式中の変数は、上記実施の形態1と同じ意味を表すものとする。
以下、予測モード推定部2の処理内容を具体的に説明する。
図5は画像の符号化対象ブロックC00〜C03と、その周辺のブロックR0〜R5を示す説明図である。なお、ブロックC00〜C03,R0〜R5は、いずれも8×8のブロックである。
また、16×16予測モードにおける予測モード1(水平方向)が効率的である状況は、ブロックR2の最右端の8画素とブロックC00,C01の画素の値が近く、ブロックR3の最右端の8画素とブロックC02,C03の画素の値が近い場合である。
また、16×16予測モードにおける予測モード3(プレーン予測)が効率的である状況は、ブロックR0,R1の最下部の15画素と、ブロックR2,R3の最右端の15画素と、R4の右下の1画素とを利用して、グラデーションのある予測画像が作成されるため、ブロックR0,R1の最下部の画素の変化が、ブロックC00〜C03の水平方向の変化に一致し、ブロックR2,R3の最右端の画素の変化が、ブロックC00〜C03の垂直方向の変化に近い場合である。これは、グラデーションのある画像の場合に有効である。
また、dj,iは離散コサイン変換行列Dの要素、dT j,iは離散コサイン行列Dの転置行列DTの要素である。
wi,wjは重みである。
R0_bottom,R1_bottomは、ブロックR0,R1の最下部の画素の垂直方向の周波数特性を示すものであり、R2_right,R3_rightは、ブロックR2,R3の最右端の画素の水平方向の周波数特性を示すものである。
因みに、k=0とすれば、全DCT係数のうち、直流成分のDCT係数及び直流成分の周波数特性のみから予測モードを推定することを意味する。
また、k=1、または、k=2とすれば、全DCT係数のうち、低周波成分のDCT係数及び低周波成分の周波数特性のみから予測モードを推定することを意味する。
また、k=7とすれば、高周波成分までのDCT係数及び高周波成分までの周波数特性から予測モードを推定することを意味する。
w16×16_0j,w16×16_1j,w16×16_2j,w16×16_3j,w16×16_0i,w16×16_1i,w16×16_2i,w16×16_3iは重みである。
また、評価値Cost16×16_1は、ブロックC00,C01とブロックR2の垂直方向の変化及びブロックC02,C03とブロックR3の垂直方向の変化の近さを評価しており、16×16予測モードにおける予測モード1(水平予測)の評価値である。
以降の推定処理については、上記実施の形態1〜6と同様であるため、説明を省略する。
上記実施の形態1〜7では、予測モード推定部2がJPEG簡易復号部1により取得されたDCT係数からH.264方式における予測モードを推定するものについて示したが、4×4予測モードを推定する際に、8×8ブロック単位の周波数成分ではなく、4×4ブロック単位の周波数成分を用いて推定を行うようにしてもよい。
この実施の形態8では、4×4予測モードを推定する際に、JPEGから復号される画素値に、4×4変換を施すことで算出可能な4×4ブロック単位の変換係数を用いるようにする。
H.264符号化部23はH.264方式の符号化処理を実施する符号化部であり、予測モード推定部22により推定された予測モードとJPEG復号部21により取得されたヘッダ情報を用いて、JPEG簡易復号部21により取得された画素値を符号化してH.264ストリーム(第2の符号化方式の符号化ストリーム)を生成する処理を実施する。なお、H.264符号化部23は符号化手段を構成している。
JPEG復号部21は、画像が周波数領域に変換されて符号化されているJPEG方式の符号化ストリームであるJPEGデータを入力すると、そのJPEGデータを復号する。
JPEG復号部21は、JPEGデータの復号結果として、画像の画素値、画像の周波数成分であるDCT係数及び画像の幅や高さなどを示すヘッダ情報を取得する。
なお、画像の画素値は、JPEG復号部21から予測モード推定部22及びH.264符号化部23に出力され、DCT係数はJPEG復号部21から予測モード推定部22に出力される。
また、ヘッダ情報は、JPEG復号部21からH.264符号化部23に出力される。
即ち、予測モード推定部22は、上記実施の形態1〜7におけるいずれかの予測モード推定部2と同様にして、16×16モードを採用するか、4×4予測モードを採用するかを判定する。
16×16予測モードが採用され、16×16予測モードにおける予測モードを選択する際の処理内容は、上記実施の形態1〜7のいずれかと同様であるため説明を省略する。
具体的には以下の通りである。
図25から図27は4×4予測モードにおける予測モードの推定処理を示すフローチャートである。
kは計算に用いる係数であり、ここでは、1≦k≦3であるとする。因みに、k=1とすれば、全ての4×4変換係数のうち、低周波成分の4×4変換係数のみから予測モードを推定することを意味する。
また、k=3とすれば、全ての4×4変換係数のうち、高周波成分の4×4変換係数の周波数特性から予測モードを推定することを意味する。
Value4×4_V<th4×4_V (103)
Value4×4_H<th4×4_H (104)
予測モード推定部22は、式(103)又は式(104)のいずれか一方でも成立しない場合、垂直方向の評価値Value4×4_Vと水平方向の評価値Value4×4_Hとの比RateVH4×4を算出する(ステップST123)。
RateVH4×4<th4×4_1 (106)
th4×4_1≦RateVH4×4<th4×4_0 (107)
th4×4_0≦RateVH4×4 (108)
予測モード推定部22は、式(108)が成立する場合、垂直方向の予測が有効であるとして、4×4予測モードの予測モード0を利用するものと決定する(ステップST127)。
予測モード推定部22は、式(107)が成立する場合、垂直方向成分と水平方向成分を乗算してSignVH4×4を算出する(ステップST128)。
SignVH4×4=y0,1・y1,0 (109)
画像内のエッジが左下から右上に向かっているとき、符号SignVH4×4は正になっており、画像内のエッジが左上から右下に向かっているとき、符号SignVH4×4は負になっている。
SignVH4×4≧0 (110)
予測モード推定部22は、式(110)が成立する場合、右上又は左下へ向かうエッジがあるとして、4×4予測モードを予測モード3,7,8に絞り込むようにする(ステップST131)。
一方、式(110)が成立しない場合、右下又は左上に向かうエッジがあるとして、4×4予測モードを予測モード4,5,6に絞り込むようにする(ステップST130)。
RateVH4×4<th4×4_8 (111)
th4×4_8≦RateVH4×4<th4×4_7 (112)
th4×4_7≦RateVH4×4 (113)
予測モード推定部22は、式(113)が成立する場合、4×4予測モードの予測モード7を利用するものと決定する(ステップST135)。
予測モード推定部22は、式(112)が成立する場合、4×4予測モードの予測モード3を利用するものと決定する(ステップST136)。
RateVH4×4<th4×4_6 (114)
th4×4_6≦RateVH4×4<th4×4_5 (115)
th4×4_5≦RateVH4×4 (116)
予測モード推定部22は、式(116)が成立する場合、4×4予測モードの予測モード5を利用するものと決定する(ステップST140)。
予測モード推定部22は、式(115)が成立する場合、4×4予測モードの予測モード4を利用するものと決定する(ステップST141)。
また、予測モード推定部22で決定された予測モード以外に、隣り合う予測モードを含めて、3つの予測モードに絞り込み、SADなどによってコストを計算するようにしてもよい。
ここで、隣り合うモードとは、図5の下側の図において、矢印の方向が近いもののことであり、例えば、予測モード7に決定されたときは、予測モード0,3が隣り合うモードとなる。
また、予測モード推定部22において4×4変換係数を算出しているため、H.264符号化部23における4×4変換の計算を省略することが可能であり、H.264への変換を高速に行うことができる効果を奏する。
上記実施の形態8では、4×4予測モードを推定する際に、4×4ブロック単位で予測モードの推定を実施するものについて示したが、予測に用いる画素値を含めた5×5ブロック単位で予測モードの推定を実施するようにしてもよい。
この実施の形態9では、4×4予測モードを推定する際に、4×4ブロックの画素値と予測に用いる画素値を含めた5×5ブロックの周波数成分から4×4予測モードを推定するようにする。
この実施の形態9における画像符号化方式変換装置は、上記実施の形態8と基本的な構成は同一であり、JPEG復号部21及びH.264符号化部23の処理内容は、上記実施の形態8と同様であるため、予測モード推定部22の処理内容のみを説明する。
16×16予測モードが採用され、16×16予測モードにおける予測モードを選択する際の処理内容は、上記実施の形態1〜7のいずれかと同様であるため説明を省略する。
予測モード推定部22は、4×4予測モードを採用する旨の判定を行うと、該当16×16マクロブロック内の16個の4×4ブロックと4×4ブロックの周辺の画素値a〜iを含めた5×5ブロックXを下記の式(117)に代入して5×5ブロックの周波数成分Yを算出する。
即ち、予測モード推定部22は、4×4変換係数を下記の式(120)及び式(121)に代入して、垂直方向の評価値Value4×4_V及び水平方向の評価値Value4×4_Hを算出する(図25のステップST120)。
kは計算に用いる係数であり、ここでは、1≦k≦4であるとする。因みに、k=1とすれば、全ての5×5ブロックの周波数成分のうち、低周波成分のみから予測モードを推定することを意味する。
また、k=4とすれば、全ての5×5ブロックの周波数成分のうち、高周波成分の周波数特性から予測モードを推定することを意味する。
以上で明らかなように、この実施の形態9によれば、予測モード推定部22において、4×4ブロックと予測に用いられる周辺画素とで構成される5×5ブロックの周波数特性を用いて、H.264の予測モードを決定するように構成したので、より精度が高い予測モードの推定を行うことができる効果を奏する。
Claims (6)
- 画像が周波数領域に変換されて符号化されている第1の符号化方式の符号化ストリームの一部を復号して、上記画像の周波数成分の信号を取得する周波数成分信号取得手段と、
上記周波数成分信号取得手段により取得された周波数成分の信号のうち、低周波成分の信号から画面内予測の方向を推定する画面内予測方向推定手段と、
上記画面内予測方向推定手段により推定された画面内予測の方向を用いて、上記周波数成分信号取得手段により取得された周波数成分の信号を符号化して第2の符号化方式の符号化ストリームを生成する符号化手段と、
上記周波数成分信号取得手段により取得された周波数成分の信号を記憶する周波数成分記憶手段と、
上記画面内予測方向推定手段により推定された画面内予測の方向を記憶する画面内予測方向記憶手段と、
上記周波数成分信号取得手段により取得された最新の周波数成分の信号と上記周波数成分記憶手段に記憶されている前回の周波数成分の信号とを比較して、上記画面内予測方向推定手段における画面内予測方向の推定処理の実施の必要性を判定し、上記画面内予測方向の推定処理を実施する必要があると判定すれば、上記画面内予測方向の推定処理を上記画面内予測方向推定手段に実施させる一方、上記画面内予測方向の推定処理を実施する必要がないと判定すれば、上記画面内予測方向記憶手段に記憶されている画面内予測の方向を符号化手段に出力させる推定処理判定手段とを備えた画像符号化方式変換装置。 - 推定処理判定手段は、周波数成分信号取得手段により取得された最新の周波数成分の信号及び周波数成分記憶手段に記憶されている前回の周波数成分の信号のうち、低周波成分の信号を用いて、画面内予測方向の推定処理の実施の必要性を判定することを特徴とする請求項1記載の画像符号化方式変換装置。
- 推定処理判定手段は、画面内予測方向の推定処理を実施する必要がないとする判定が規定回数連続している場合、上記画面内予測方向の推定処理を実施する必要がないと判定しても、上記画面内予測方向の推定処理を画面内予測方向推定手段に実施させることを特徴とする請求項1記載の画像符号化方式変換装置。
- 推定処理判定手段は、画面内予測方向記憶手段に記憶されている画面内予測の方向を考慮して、画面内予測方向の推定処理の実施の必要性を判定することを特徴とする請求項1記載の画像符号化方式変換装置。
- 第1の符号化方式がJPEG方式又はMotionJPEG方式であり、第2の符号化方式がH.264方式であることを特徴とする請求項1記載の画像符号化方式変換装置。
- 第1の符号化方式がMPEG−1方式、MPEG−2方式又はMPEG−4方式であり、第2の符号化方式がH.264方式であることを特徴とする請求項1記載の画像符号化方式変換装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010502714A JP5241819B2 (ja) | 2008-03-12 | 2009-03-04 | 画像符号化方式変換装置 |
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008062856 | 2008-03-12 | ||
JP2008062856 | 2008-03-12 | ||
JP2008140446 | 2008-05-29 | ||
JP2008140446 | 2008-05-29 | ||
JP2008194877 | 2008-07-29 | ||
JP2008194877 | 2008-07-29 | ||
JP2010502714A JP5241819B2 (ja) | 2008-03-12 | 2009-03-04 | 画像符号化方式変換装置 |
PCT/JP2009/000983 WO2009113276A1 (ja) | 2008-03-12 | 2009-03-04 | 画像符号化方式変換装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009113276A1 JPWO2009113276A1 (ja) | 2011-07-21 |
JP5241819B2 true JP5241819B2 (ja) | 2013-07-17 |
Family
ID=41064950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010502714A Expired - Fee Related JP5241819B2 (ja) | 2008-03-12 | 2009-03-04 | 画像符号化方式変換装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5241819B2 (ja) |
WO (1) | WO2009113276A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5844263B2 (ja) | 2009-10-05 | 2016-01-13 | ビーマル イメージング リミテッドBeamr Imaging Ltd. | デジタル画像を再圧縮するための装置および方法 |
EP2486727A4 (en) * | 2009-10-05 | 2014-03-12 | Icvt Ltd | METHOD AND SYSTEM FOR PROCESSING AN IMAGE |
WO2011083573A1 (ja) | 2010-01-07 | 2011-07-14 | 株式会社 東芝 | 動画像符号化装置及び動画像復号化装置 |
JP6212890B2 (ja) * | 2013-03-22 | 2017-10-18 | 富士通株式会社 | 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム |
US10999604B2 (en) | 2018-04-13 | 2021-05-04 | Mediatek Inc. | Adaptive implicit transform setting |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006121273A (ja) * | 2004-10-20 | 2006-05-11 | Victor Co Of Japan Ltd | 符号化変換方法及び符号化変換装置 |
WO2006100946A1 (ja) * | 2005-03-24 | 2006-09-28 | Pioneer Corporation | 画像信号再符号化装置及び画像信号再符号化方法 |
-
2009
- 2009-03-04 JP JP2010502714A patent/JP5241819B2/ja not_active Expired - Fee Related
- 2009-03-04 WO PCT/JP2009/000983 patent/WO2009113276A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006121273A (ja) * | 2004-10-20 | 2006-05-11 | Victor Co Of Japan Ltd | 符号化変換方法及び符号化変換装置 |
WO2006100946A1 (ja) * | 2005-03-24 | 2006-09-28 | Pioneer Corporation | 画像信号再符号化装置及び画像信号再符号化方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2009113276A1 (ja) | 2009-09-17 |
JPWO2009113276A1 (ja) | 2011-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019200515B2 (en) | Image decoding device, image encoding device, and method thereof | |
KR100803611B1 (ko) | 영상의 부호화, 복호화 방법 및 장치 | |
KR101918012B1 (ko) | 화상 예측 부호화 장치, 화상 예측 복호 장치, 화상 예측 부호화 방법, 화상 예측 복호 방법, 화상 예측 부호화 프로그램, 및 화상 예측 복호 프로그램 | |
KR101131689B1 (ko) | 필터 선택을 이용한 비디오 압축 방법 | |
WO2011155364A1 (ja) | 画像復号化装置と画像符号化装置およびその方法とプログラム | |
JP5194119B2 (ja) | 画像処理方法及び対応する電子装置 | |
EP1628487A2 (en) | Method and apparatus for estimating motion | |
JPH11112973A (ja) | 映像信号変換装置及び映像信号変換方法 | |
JP5241819B2 (ja) | 画像符号化方式変換装置 | |
JP3864098B2 (ja) | 動画像符号化方法、動画像復号方法、及びこれらの方法の実行プログラムとこれらの実行プログラムを記録した記録媒体 | |
JP2012169762A (ja) | 画像符号化装置と画像復号化装置およびその方法とプログラム | |
JP5489557B2 (ja) | 画像符号化装置及び画像符号化方法 | |
US9055292B2 (en) | Moving image encoding apparatus, method of controlling the same, and computer readable storage medium | |
JP5649296B2 (ja) | 画像符号化装置 | |
JP2008004984A (ja) | 画像理装置および方法、プログラム、並びに記録媒体 | |
JP2001036908A (ja) | 動画像圧縮装置 | |
JP5387520B2 (ja) | 情報処理装置と情報処理方法 | |
JP4359184B2 (ja) | 予測情報・量子化値制御圧縮符号化装置、予測情報・量子化値制御圧縮符号化プログラム | |
KR100987581B1 (ko) | 고속 움직임 추정을 위한 부분 블록정합 방법 | |
JP2009206911A (ja) | 動画像変換装置 | |
JP2018191334A (ja) | 画像符号化装置と画像符号化方法およびプログラム | |
JP4364919B2 (ja) | 動画像復号化装置 | |
WO2000062554A1 (en) | Image processing method and image processing device | |
JP2004201345A (ja) | 画像符号化方法、画像符号化装置、画像復号化方法及び画像復号化装置 | |
JP2002232892A (ja) | 画像符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120807 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130402 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160412 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |