JPH11259455A - 離散コサイン変換の直流成分予測方法 - Google Patents
離散コサイン変換の直流成分予測方法Info
- Publication number
- JPH11259455A JPH11259455A JP8032598A JP8032598A JPH11259455A JP H11259455 A JPH11259455 A JP H11259455A JP 8032598 A JP8032598 A JP 8032598A JP 8032598 A JP8032598 A JP 8032598A JP H11259455 A JPH11259455 A JP H11259455A
- Authority
- JP
- Japan
- Prior art keywords
- component
- block
- discrete cosine
- predicted
- cosine transform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Complex Calculations (AREA)
Abstract
(57)【要約】
【課題】 離散コサイン変換の直流成分予測方法におい
て、あまり精度の高い予測結果は得られなかった。 【解決手段】 DC値QDCA,QDCB,QDCC,
QDCDをそれぞれニューラルネット4の入力層1に入
力して、出力層3から処理中のブロックXのDC予測値
QDCYを得る。
て、あまり精度の高い予測結果は得られなかった。 【解決手段】 DC値QDCA,QDCB,QDCC,
QDCDをそれぞれニューラルネット4の入力層1に入
力して、出力層3から処理中のブロックXのDC予測値
QDCYを得る。
Description
【0001】
【発明の属する技術分野】フレーム内予測符号化(イン
トラ)画像の画像圧縮を離散コサイン変換(DCT)に
より行うMPEG方式等の画像符号化において、DCT
の直流(DC)成分予測の制度を向上させた離散コサイ
ン変換の直流成分予測方法に関するものである。
トラ)画像の画像圧縮を離散コサイン変換(DCT)に
より行うMPEG方式等の画像符号化において、DCT
の直流(DC)成分予測の制度を向上させた離散コサイ
ン変換の直流成分予測方法に関するものである。
【0002】
【従来の技術】MPEG方式等の画像符号化方式では、
フレーム内予測符号化(イントラ)画像の画像圧縮を行
う際には、まず、例えば8×8ピクセルのマクロブロッ
クを離散コサイン変換(DCT:Discrete Cosine Tr
ansform)し、次いで量子化を行っている。
フレーム内予測符号化(イントラ)画像の画像圧縮を行
う際には、まず、例えば8×8ピクセルのマクロブロッ
クを離散コサイン変換(DCT:Discrete Cosine Tr
ansform)し、次いで量子化を行っている。
【0003】この時、イントラ・マクロブロックが連続
する場合には、差分を連続させることで圧縮効率が向上
するので、直流(DC)成分予測を行っている。
する場合には、差分を連続させることで圧縮効率が向上
するので、直流(DC)成分予測を行っている。
【0004】MPEG1,2方式で使用されている単純
DC予測は、図2に示すように、輝度成分についてはマ
クロブロック(MB)内の4つのブロックを順次たど
り、色差成分については、Cb,Crそれぞれ個別にイ
ントラ・マクロブロックの連続に合わせて差分を連続さ
せている。そして、輝度成分及び色差成分共に、スライ
ス層の先頭MBや非イントラ・マクロブロックにおいて
は、レベルを128にリセットしている。
DC予測は、図2に示すように、輝度成分についてはマ
クロブロック(MB)内の4つのブロックを順次たど
り、色差成分については、Cb,Crそれぞれ個別にイ
ントラ・マクロブロックの連続に合わせて差分を連続さ
せている。そして、輝度成分及び色差成分共に、スライ
ス層の先頭MBや非イントラ・マクロブロックにおいて
は、レベルを128にリセットしている。
【0005】また、最近では、単純DC予測ではなく、
Adaptive DC predictionと呼ばれる方式が検討され
ている。
Adaptive DC predictionと呼ばれる方式が検討され
ている。
【0006】この方式は、図3に示すように、処理中の
ブロック(current block)をXとし、その周囲のブロ
ックA,B,CのDC値をQDCA,QDCB,QDC
CとしたときのDC予測値をQDCYとすると、(QD
CA−QDCB)の絶対値よりも(QDCB−QDC
C)の絶対値の方が大きい場合には、QDCY=QDC
Cとし、それ以外はQDCY=QDCAとするものであ
る。
ブロック(current block)をXとし、その周囲のブロ
ックA,B,CのDC値をQDCA,QDCB,QDC
CとしたときのDC予測値をQDCYとすると、(QD
CA−QDCB)の絶対値よりも(QDCB−QDC
C)の絶対値の方が大きい場合には、QDCY=QDC
Cとし、それ以外はQDCY=QDCAとするものであ
る。
【0007】そして、シーケンスや量子化係数等により
結果は異なるが、実験では、予測を行わない場合に比べ
て、単純DC予測では数%〜20%、Adaptive DC
predictionでは数%〜27%の符号化効率の改善が可能
とされている。
結果は異なるが、実験では、予測を行わない場合に比べ
て、単純DC予測では数%〜20%、Adaptive DC
predictionでは数%〜27%の符号化効率の改善が可能
とされている。
【0008】
【発明が解決しようとする課題】上述したAdaptive D
C predictionは、単純に処理中のブロック近傍で垂直
方向と水平方向のどちらの相関性が強いかを判断し、相
関性が強い方向のDCTのDC成分を予測値として使用
しているだけであるので、QDCYはQDCAまたはQ
DCCのいずれかになり、あまり精度の高い予測結果は
得られなかった。
C predictionは、単純に処理中のブロック近傍で垂直
方向と水平方向のどちらの相関性が強いかを判断し、相
関性が強い方向のDCTのDC成分を予測値として使用
しているだけであるので、QDCYはQDCAまたはQ
DCCのいずれかになり、あまり精度の高い予測結果は
得られなかった。
【0009】そこで、本発明は、ニューラルネットワー
クを使用して処理ブロックの近傍のブロックのDCTの
DC成分の予測を行うことにより、単純な構成で、多く
の情報を処理して精度の高い予測を行うことを目的とす
る。
クを使用して処理ブロックの近傍のブロックのDCTの
DC成分の予測を行うことにより、単純な構成で、多く
の情報を処理して精度の高い予測を行うことを目的とす
る。
【0010】
【課題を解決するための手段】上記目的を達成するため
の手段として、離散コサイン変換を使用したフレーム内
予測符号化で画像圧縮を行う際に直流成分とその予測値
との差分を符号化する符号化方法において予測対象とな
るブロックの離散コサイン変換の直流成分を予測する予
測方法であって、離散コサイン変換を行ったブロックの
直流成分を入力して前記予測対象となるブロックの離散
コサイン変換の直流成分の予測値を出力するニューラル
ネットワークを用いることにより、前記予測対象となる
ブロックの近傍に位置するブロックの直流成分の振る舞
いを学習し、その結果から直流成分を予測するようにし
たことを特徴とする離散コサイン変換の直流成分予測方
法を提供しようとするものである。
の手段として、離散コサイン変換を使用したフレーム内
予測符号化で画像圧縮を行う際に直流成分とその予測値
との差分を符号化する符号化方法において予測対象とな
るブロックの離散コサイン変換の直流成分を予測する予
測方法であって、離散コサイン変換を行ったブロックの
直流成分を入力して前記予測対象となるブロックの離散
コサイン変換の直流成分の予測値を出力するニューラル
ネットワークを用いることにより、前記予測対象となる
ブロックの近傍に位置するブロックの直流成分の振る舞
いを学習し、その結果から直流成分を予測するようにし
たことを特徴とする離散コサイン変換の直流成分予測方
法を提供しようとするものである。
【0011】
【発明の実施の形態】本発明の離散コサイン変換の直流
成分予測方法の一実施の形態の構成を図1に示し、以下
詳細に説明する。
成分予測方法の一実施の形態の構成を図1に示し、以下
詳細に説明する。
【0012】同図において、処理中のブロック(curren
t block)をXとしてそのDC値をQDCXとし、その
処理中のブロックXに隣接し、すでに離散コサイン変換
を行ったブロックA,B,C,DのDC値をそれぞれQ
DCA,QDCB,QDCC,QDCDとしたときの処
理中のブロックXのDC予測値をQDCYとする。
t block)をXとしてそのDC値をQDCXとし、その
処理中のブロックXに隣接し、すでに離散コサイン変換
を行ったブロックA,B,C,DのDC値をそれぞれQ
DCA,QDCB,QDCC,QDCDとしたときの処
理中のブロックXのDC予測値をQDCYとする。
【0013】そして、DC値QDCA,QDCB,QD
CC,QDCDをそれぞれニューラルネットワーク4の
入力層1に入力して、出力層3から処理中のブロックX
のDC予測値QDCYを得る。
CC,QDCDをそれぞれニューラルネットワーク4の
入力層1に入力して、出力層3から処理中のブロックX
のDC予測値QDCYを得る。
【0014】ここで、ニューラルネットワーク4は、例
えば、入力層1と中間層2と出力層3とからなる周知の
ニューラルネットワークで、バックプロパゲーションを
学習アルゴリズムとするものを使用することができる。
この各層1,2,3は可変の重みで結ばれた多数のユニッ
ト(ニューロン)で構成されており、これらが結合して
ニューラルネットワーク4が構成されている。また、ユ
ニットは非線形の入出力特性を有する変換系であり、ユ
ニットにはDC値または前層からの総和が入力され、非
線形変換されて後層またはDC予測値QDCYとして出
力される。
えば、入力層1と中間層2と出力層3とからなる周知の
ニューラルネットワークで、バックプロパゲーションを
学習アルゴリズムとするものを使用することができる。
この各層1,2,3は可変の重みで結ばれた多数のユニッ
ト(ニューロン)で構成されており、これらが結合して
ニューラルネットワーク4が構成されている。また、ユ
ニットは非線形の入出力特性を有する変換系であり、ユ
ニットにはDC値または前層からの総和が入力され、非
線形変換されて後層またはDC予測値QDCYとして出
力される。
【0015】なお、このニューラルネットワーク4にD
C値を入力する近傍の画素と中間層2の階層数は性能や
状況に応じて適宜決定される。
C値を入力する近傍の画素と中間層2の階層数は性能や
状況に応じて適宜決定される。
【0016】そして、予め処理中のブロックXのDC値
QDCXを教師信号にして、DC予測値QDCYとの差
が小さくなるように各ユニット間の重みを可変すること
により、ニューラルネットワーク4の学習を行い、各ユ
ニット間の重みを決定してニューラルネットワーク4を
構築しておくことにより、実際の処理では、簡単な構成
により高速処理が可能で、高精度な結果を得ることがで
きる。
QDCXを教師信号にして、DC予測値QDCYとの差
が小さくなるように各ユニット間の重みを可変すること
により、ニューラルネットワーク4の学習を行い、各ユ
ニット間の重みを決定してニューラルネットワーク4を
構築しておくことにより、実際の処理では、簡単な構成
により高速処理が可能で、高精度な結果を得ることがで
きる。
【0017】本発明は、上述したように、ニューラルネ
ットワークを使用して、予測対象となるブロックの近傍
に位置するブロックの直流成分の振る舞いを学習し、そ
の結果から直流成分を予測するようにしたので、より高
精度な結果を得ることができる。
ットワークを使用して、予測対象となるブロックの近傍
に位置するブロックの直流成分の振る舞いを学習し、そ
の結果から直流成分を予測するようにしたので、より高
精度な結果を得ることができる。
【0018】なお、一般に、ニューラルネットワークに
よる画像処理は、画像の輪郭線の抽出や画像の動き処理
等に適しているので、多くの画像について学習させてお
くことにより、輪郭線の連続性や空間周波数との関連な
どが学習され、DC予測値の精度が向上することにな
る。
よる画像処理は、画像の輪郭線の抽出や画像の動き処理
等に適しているので、多くの画像について学習させてお
くことにより、輪郭線の連続性や空間周波数との関連な
どが学習され、DC予測値の精度が向上することにな
る。
【0019】
【発明の効果】本発明の離散コサイン変換の直流成分予
測方法は、離散コサイン変換を行ったブロックの直流成
分を入力して予測対象となるブロックの離散コサイン変
換の直流成分の予測値を出力するニューラルネットワー
クを用いることにより、離散コサイン変換を行ったブロ
ックの直流成分の振る舞いから直流成分を予測するよう
にしたので、単純な構成で、高精度な予測が可能にな
る。
測方法は、離散コサイン変換を行ったブロックの直流成
分を入力して予測対象となるブロックの離散コサイン変
換の直流成分の予測値を出力するニューラルネットワー
クを用いることにより、離散コサイン変換を行ったブロ
ックの直流成分の振る舞いから直流成分を予測するよう
にしたので、単純な構成で、高精度な予測が可能にな
る。
【0020】また、予測対象となるブロックの左と左上
と上と右上の4つの隣接するブロックの離散コサイン変
換の直流成分をニューラルネットワークに入力される直
流成分とした場合には、すでに離散コサイン変換が行わ
れたブロックの直流成分のうち処理対象のブロックに接
するブロックの直流成分全てを入力とすることになるの
で、より高精度な予測が可能になるという効果がある。
と上と右上の4つの隣接するブロックの離散コサイン変
換の直流成分をニューラルネットワークに入力される直
流成分とした場合には、すでに離散コサイン変換が行わ
れたブロックの直流成分のうち処理対象のブロックに接
するブロックの直流成分全てを入力とすることになるの
で、より高精度な予測が可能になるという効果がある。
【図1】本発明の離散コサイン変換の直流成分予測方法
の一実施の形態の構成を示す図である。
の一実施の形態の構成を示す図である。
【図2】単純DC予測を説明するための図である。
【図3】Adaptive DC predictionを説明するための
図である。
図である。
1 入力層 2 中間層 3 出力層 4 ニューラルネットワーク
Claims (2)
- 【請求項1】離散コサイン変換を使用したフレーム内予
測符号化で画像圧縮を行う際に直流成分とその予測値と
の差分を符号化する符号化方法において予測対象となる
ブロックの離散コサイン変換の直流成分を予測する予測
方法であって、 離散コサイン変換を行ったブロックの直流成分を入力し
て前記予測対象となるブロックの離散コサイン変換の直
流成分の予測値を出力するニューラルネットワークを用
いることにより、前記離散コサイン変換を行ったブロッ
クの直流成分の振る舞いから直流成分を予測するように
したことを特徴とする離散コサイン変換の直流成分予測
方法。 - 【請求項2】請求項1記載の離散コサイン変換の直流成
分予測方法において、前記ニューラルネットワークに入
力される直流成分は、前記予測対象となるブロックの左
と左上と上と右上の4つの隣接するブロックの離散コサ
イン変換の直流成分であることを特徴とする離散コサイ
ン変換の直流成分予測方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8032598A JPH11259455A (ja) | 1998-03-12 | 1998-03-12 | 離散コサイン変換の直流成分予測方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8032598A JPH11259455A (ja) | 1998-03-12 | 1998-03-12 | 離散コサイン変換の直流成分予測方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH11259455A true JPH11259455A (ja) | 1999-09-24 |
Family
ID=13715118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8032598A Pending JPH11259455A (ja) | 1998-03-12 | 1998-03-12 | 離散コサイン変換の直流成分予測方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH11259455A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100529311B1 (ko) * | 2003-01-21 | 2005-11-17 | 삼성전자주식회사 | 신경 회로망을 이용하여 가변 길이 부호화 비트 스트림의길이를 선택하는 장치 및 방법 |
WO2009025347A1 (ja) * | 2007-08-22 | 2009-02-26 | Shinichiro Yumura | データ圧縮方法及び画像表示方法及び表示画像拡大方法 |
-
1998
- 1998-03-12 JP JP8032598A patent/JPH11259455A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100529311B1 (ko) * | 2003-01-21 | 2005-11-17 | 삼성전자주식회사 | 신경 회로망을 이용하여 가변 길이 부호화 비트 스트림의길이를 선택하는 장치 및 방법 |
WO2009025347A1 (ja) * | 2007-08-22 | 2009-02-26 | Shinichiro Yumura | データ圧縮方法及び画像表示方法及び表示画像拡大方法 |
JP2009049895A (ja) * | 2007-08-22 | 2009-03-05 | Shinichiro Yumura | データ圧縮方法及び画像表示方法及び表示画像拡大方法 |
JP4717860B2 (ja) * | 2007-08-22 | 2011-07-06 | 眞一郎 湯村 | データ圧縮方法及び画像表示方法及び表示画像拡大方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210258578A1 (en) | Method and device for encoding or decoding image | |
US8111914B2 (en) | Method and apparatus for encoding and decoding image by using inter color compensation | |
KR101192026B1 (ko) | 소스 픽쳐의 시퀀스를 코딩하는 방법 또는 장치 | |
JP3764458B2 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラム | |
JP3764457B2 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラム | |
US8204136B2 (en) | Image encoding apparatus | |
KR940023254A (ko) | 화상 부호화 방법 및 장치 | |
US5610659A (en) | MPEG encoder that concurrently determines video data encoding format and rate control | |
JPH07288810A (ja) | 動画符号化方法 | |
US6173080B1 (en) | Prediction method for discrete cosine transform coefficient | |
JPH11289544A (ja) | 動き検出装置およびその方法 | |
JP2000510311A (ja) | デジタル化画像の符号化および復号化のための方法および装置 | |
JP2008154060A (ja) | 動画像符号化装置 | |
JP4298803B2 (ja) | 画像のソース符号化方法 | |
JP2830855B2 (ja) | 適応量子化制御装置 | |
KR100727991B1 (ko) | 영상의 인트라 예측 부호화 방법 및 그 방법을 사용하는부호화 장치 | |
US6141449A (en) | Coding mode determination system | |
JPH11259455A (ja) | 離散コサイン変換の直流成分予測方法 | |
JPH10136367A (ja) | 適応直交変換モード判定方法 | |
JPH07135657A (ja) | 符号化方法と符号化装置 | |
JP2005020294A (ja) | ブロック歪低減装置 | |
JPH01238389A (ja) | 動画像の予測符号化方式 | |
Monaco et al. | Video coding using image warping within variable size blocks | |
JP3363476B2 (ja) | 符号化装置及びその方法 | |
KR0152031B1 (ko) | 영상특성에 따른 영상신호의 부호화방법 및 그 장치 |