JP2005117444A - 画像データ変換装置 - Google Patents

画像データ変換装置 Download PDF

Info

Publication number
JP2005117444A
JP2005117444A JP2003350321A JP2003350321A JP2005117444A JP 2005117444 A JP2005117444 A JP 2005117444A JP 2003350321 A JP2003350321 A JP 2003350321A JP 2003350321 A JP2003350321 A JP 2003350321A JP 2005117444 A JP2005117444 A JP 2005117444A
Authority
JP
Japan
Prior art keywords
block
dct
image
quantization
frequency component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003350321A
Other languages
English (en)
Other versions
JP4259974B2 (ja
Inventor
Atsushi Shimizu
敦志 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2003350321A priority Critical patent/JP4259974B2/ja
Publication of JP2005117444A publication Critical patent/JP2005117444A/ja
Application granted granted Critical
Publication of JP4259974B2 publication Critical patent/JP4259974B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract


【課題】 オリジナルMPEGストリームを低ビットレートに変換する際に、再生系における画質劣化を抑制する。
【解決手段】 VAD202は、復号対象ブロックのDCTタイプを参照し、当該ブロックのDCTモードがフレームDCTモードであり、且つ、(0,7)(1,7)の周波数成分の量子化係数の加算値が閾値S1以上であるとき、当該ブロックを、画像劣化を引き起こすブロックと判別する。
適応的DCT係数割付部203は、当該ブロックが画像劣化を引き起こさないブロックの場合には、低次側のDCT係数のみを残し、当該ブロックが画像劣化を引き起こすブロックの場合には、上記よりもさらに高次側のDCT係数を残すよう、オリジナルMPEGストリームに対するデータ変換処理を実行する。
【選択図】 図1

Description

本発明は、画像データ変換装置に関し、特に、MPEGエンコードされたデータストリームを低ビットレートのデータストリームに変換する際に用いて好適なものである。
近年、画像情報を圧縮符号化する技術として、MPEG(Moving Picture Experts Group)が種々の装置に用いられている。かかる圧縮符号化技術を用いることにより、画像や音声の品質を落とさずに、より少ない情報でもとの映像や音声を表現することができる。
図9に、MPEG符号化された画像情報を再生する画像再生装置の基本的構成例を示す。
図において、VLCデコーダ101は、VLC(Variable Length Code:可変長符号)処理されたMPEGデータストリームを復号して、ブロック毎(8画素×8フレーム)の量子化係数を導出する。逆量子化処理部102は、復号された量子化係数を逆量子化し、ブロック毎のDCT係数を導出する。IDCT処理部103は、ブロック毎のDCT係数を逆DCT(Discrete Cosine Group:離散コサイン変換)処理し、当該ブロックの画像データを導出する。フレームメモリ104は、IDCT処理部103から出力された画像データに動き補償処理部105からの参照画像データを加算して得られた1フレーム分の画像データ(Iピクチャ、Pピクチャ)を参照画像として保持する。動き補償処理部105は、フレームメモリ104に保持された参照画像データを動きベクトル分だけずらした画像データを生成する。
ここで、VLCデコード処理された1ブロックの量子化係数は、当該ピクチャに適用されたスキャン順序(ジグザグスキャン、オルタネートスキャン)に従って、図10に示すように配列される。図において、左上の(0,0)の位置にある量子化係数は、当該ブロックのDC成分を示すDCT係数を量子化したもの、それ以外の量子化係数は、それぞれ、水平周波数と垂直周波数が所定の値を持つAC成分のDCT係数を量子化したものである。
1ブロックの画像データは、図10に示す量子化係数を逆量子化(各量子化係数に量子化係数値を乗算)して各周波数成分のDCT係数を求め、求めたDCT係数を逆DCT処理することによって取得される。ここで、DCT係数は、各周波数成分に応じた変換基底(基本パターン)の大きさを示す。したがって、逆DCT処理によって得られる画像データは、各周波数成分の変換基底をDCT係数に応じた重み付けにて合成して得られる画像を表現するものとなる。
ところで、MPEGストリームを再生処理系に送信するとき、オリジナルのMPEGストリームをよりビットレートの低いストリームに変換する処理が実行される場合がある。たとえば、図11(a)(b)に示すように、低周波側から3つまたは6つの量子化係数のみを残し、それより高次の量子化係数を全て“0”にする処理が行われる。このように変換された量子化係数を、たとえばジグザグスキャン順に走査すると、所定順位以降の量子化係数は全て“0”になる。“0”の連続の開始まで量子化係数を残し、その後にEOB(End of Block)を追加することで、当該ブロックのデータ量をかなり削減することができる。これにより、オリジナルのMPEGストリームをよりビットレートの低いストリームに変換することができる。
図12は、低次側の6つの量子化係数のみを残す処理を実行したときのデータ量の削減状態を示すものである。このように、DCT係数を削減したMPEGストリームを再生する場合、低次側のDCT係数のみにより画像が生成されるため、曇りガラス越しに画像を見たような、大まかな画像が再生表示される。
なお、かかるストリーム変換処理については、たとえば、以下の特許文献1に示されている。
特開2000−32457号公報
ところで、MPEG2およびMPEG4においては、インターレース画像を効率的に符号化するために、フレームDCTモードとフィールドDCTモードの2つのDCT処理が準備されている。
図13に、フレームDCTモードとフィールドDCTモードの処理方法を示す。
同図(a)に示す如く、フレームDCTモードは、16画素×16ラインからなる領域をそのまま4分割してブロックを切り出し、このブロックに対してDCT処理を施すものである。このDCT処理は、MPEG1においても適用されている。
これに対し、フィールドDCTモードは、図13(b)に示す如く、16画素×16ラインからなる領域を左右2分割した後、それぞれの分割領域の奇数ラインと偶数ラインを分離して取り出してブロックを構成し、このブロックに対してDCT処理を施すものである。
上記何れかのDCTモードが適用されたMPEGデータを復号する場合、フィールドDCTモードにあっては、トップフィールド(奇数フレーム群)とボトムフィールド(偶数フレーム群)のそれぞれに対して逆DCT処理が行われるため、上記の如く低次側のDCT係数のみを残したストリームデータに対して逆DCT変換処理を実行したとしても、トップフィールドとボトムフィールドの画像が互いに悪影響を及ぼしあうようなことはない。しかしながら、フレームDCTモードにあっては、トップフィールドとボトムフィールドが混じり合った状態で逆DCT処理が施されるため、トップフィールドとボトムフィールドの差が激しい画像の場合には、トップフィールドの画像とボトムフィールドの画像が互いに悪影響を及ぼしあうことが起こってしまう。
すなわち、低次のDCT係数は当該ブロックを平均化したような情報を有するため、フレームDCTモードが適用されたブロックに対し、低次のDCT係数のみを用いて逆DCT処理を実行すると、各画素が混じり合った画像が生成されることとなる。このため、たとえば図14(b)に示すように、トップフィールドの画像がボトムフィールドに滲み出したような画像データが生成され、さらに、次にデコードされるフレームがこのフレームを参照すると、物体の背景の中に突然、不連続に物体の一部が現われるといった現象が生じる場合がある。この現象は、人間の目には、非常に目立つ画像劣化として認識される。
そこで、本発明は、かかる問題を解消し、高速再生時においても良好に再生画像を表示し得る画像再生装置を提供するものである。
上記課題に鑑み、本発明は、以下の特徴を有する。
請求項1の発明は、MPEGエンコードされたデータストリームを低ビットレートのデータストリームに変換する画像データ変換装置において、一つのピクチャを構成するブロック領域のうち画像劣化を引き起こすブロック領域を検出するブロック検出手段と、前記ブロック領域中のDCT係数のうち低次側から所定の次数までのDCT係数のみを残すことにより、当該ブロックに対するデータ量を調整するデータ量調整手段とを有し、前記データ量調整手段は、前記ブロック検出手段によって画像劣化を引き起こすと検出されたブロック領域に対しては、画像劣化を引き起こさないと検出されたブロック領域よりもさらに高次側のDCT係数まで残すように、当該ブロックのデータ量を調整することを特徴とする。
ここで、前記ブロック検出手段は、請求項2に記載のように、当該ブロック領域のDCTモードを識別するモード識別手段と、当該ブロック領域の周波数成分のうち特定の周波数成分の値を参照する参照手段とを備え、前記モード識別手段によってフレームDCTモードであると識別され、且つ、前記参照手段によって前記特定周波数成分の値が設定値範囲内にあると判定されたときに、当該ブロック領域を、画像劣化を引き起こすブロック領域として検出するよう構成することができる。
また、前記参照手段は、請求項3に記載のように、前記特定周波数成分に対応する量子化係数の絶対値の加算値がその閾値を超えたか否か、または、前記特定周波数成分に対応するDCT係数の絶対値の加算値がその閾値を超えたか否かを判定するよう構成することができる。
また、前記参照手段は、請求項4に記載のように、ブロック領域の周波数成分のうち水平周波数成分が低く、且つ、垂直周波数成分が高い周波数成分を、前記特定周波数成分として参照するよう構成することができる。
さらに、前記ブロック領域の量子化係数を逆量子化してDCT係数を導出する逆量子化手段と、前記データ量調整手段によって調整されたDCT係数を再量子化する再量子化手段と、前記再量子化手段における量子化値を調整する量子化値調整手段とをさらに有する構成とすることもできる。
本発明の特徴は、以下に示す実施の形態の説明により更に明らかとなろう。
ただし、以下の実施の形態は、あくまでも、本発明の一つの実施形態であって、本発明ないし各構成要件の用語の意義は、以下の実施の形態に記載されたものに制限されるものではない。
本発明によれば、一つのピクチャを構成するブロック領域のうち画像劣化を引き起こすブロック領域に対しては、画像劣化を引き起こさないと検出されたブロック領域よりもさらに高次側のDCT係数まで残すように、当該ブロックのデータ量を調整するものであるから、再生系において、トップフィールドの画像がボトムフィールドに滲み出したような画像が再生されるのを抑制でき、もって、物体の背景の中に突然、不連続に物体の一部が現われるといった画質劣化現象を抑制できる。
なお、ブロック領域が画像劣化を引き起こすか否かは、請求項2ないし4に記載のように、当該ブロック領域のDCTモードと、当該ブロック領域の特定周波数成分の値を監視することによって検出できる。ここで、DCTモードの判別は、MPEGストリーム中に挿入されたDCTタイプ情報を参照して行うことができ、また、特定周波数成分の値の判定は、当該周波数成分に対応する量子化係数またはDCT係数を参照して行うことができため、これらの判別・判定に際し、別途複雑な処理は必要とならない。よって、請求項2ないし4の発明によれば、簡易な処理により円滑に、画像劣化を引き起こすブロックの検出を行うことができる。
また、請求項5のように、再量子化手段における量子化値を調整できるようにすれば、たとえば、オリジナルのMPEGストリームに適用された量子化値よりも大きな量子化値によって再量子化することにより、当該ブロックのデータ量をさらに削減することができ、より効果的に、MPEGストリームのビットレートを低減させることができる。
また、請求項6のように、前記ブロック検出手段によって画像劣化を引き起こすと検出されたブロック領域に対しては、垂直方向に高次のDCT係数を残すように、当該ブロックのデータ量を調整するようにすれば、当該ブロックのデータ量を抑制しながら、再生側における画像劣化を効果的に抑制することができる。
また、請求項7のように、Iピクチャおよび/もしくはPピクチャのみを対象として、あるいは、Iピクチャおよび/もしくはPピクチャのイントラブロックのみを対象として問題ブロックの検出処理を実行するようにすれば、処理の簡素化を図りながら、問題ブロックによる画像劣化の発生を効果的に抑制することができる。
その他、上記各請求項に記載の発明の効果は、以下に示す実施の形態の説明によって、さらに明らかになろう。
以下、本発明の実施の形態につき図面を参照して説明する。
まず、図1に実施の形態に係る画像データ変換装置の構成を示す。
図において、VLCデコーダ201は、VLC処理されたMPEGデータストリームを復号して、ブロック毎の量子化係数を導出する。
VAD202は、復号対象ブロックのDCTモード(フレームDCTモード/フィールドDCTモード)と、当該復号対象ブロックの量子化係数とに基づいて、当該ブロックが画像劣化を引き起こすブロックか否かを判別する。なお、判別の方法は後述する。
適応的DCT係数割付部203は、オリジナルのMPEGストリームをよりビットレートの低いストリームに変換する処理が実行するもので、当該ブロックが画像劣化を引き起こさないブロックの場合には、低次側のDCT係数、例えば、低次側から6個のDCT係数のみを送信し、当該ブロックが画像劣化を引き起こすブロックの場合には、上記よりもさらに高次側のDCT係数、例えば、当該ブロックの全ての周波数成分のDCT係数を送信する。なお、それぞれの場合に送信されるDCT係数は、ここに例示したものに限られず、適宜変更可能である。
図2に、適応的DCT係数割付部203におけるDCT係数の割付処理の具体例を示す。なお、同図には、オリジナルMPEGストリームから、6個、9個、12個のDCT係数を残す場合を示している。
同図(a)のVLCデータ(オリジナルMPEGストリーム)をVLCデコードすると、同図(b)に示す量子化係数列が得られる。ここで、低次側から6個のDCT係数(量子化係数)を残す場合には、同図(c)の最上段のVLCデータが生成される。すなわち、低次側から6個のDCT係数に対応する部分のVCLデータが残され、その後にEOB(End of Block)が付加される。同様に、低次側から9個のDCT係数(量子化係数)を残す場合には、低次側から9個のDCT係数に対応する部分のVCLデータが残され、その後にEOB(End of Block)が付加され、同図(c)の中段のVLCデータが生成される。
なお、低次側から12個のDCT係数(量子化係数)を残す場合には、同図(b)に示すように、低次側から12個のDCT係数の区切り位置が、一つのVLCデータ単位の“000001”に対応する量子化係数“0,0,0,−1”中の“0”と“−1”の間となる。この場合、当該量子化係数のうち、残す量子化係数は全て“0”であるから、これらを残す必要はなく、これより一つ前のVLCデータ単位“1,0”の後にEOBを付加すればよい。この場合、生成されるVLCデータは、同図(c)の最下段に示すようになり、低次側から9個のDCT係数を残す場合と同じとなる。なお、このようにDCT係数の区切り位置が、一つのVLCデータ単位に対応する量子化係数中に含まれる場合には、上記のように処理する他、当該VLCデータ単位をそのまま残し、その後にEOBを付加するようにしても良い。
図3に、VAD202によって画像劣化を引き起こすと判断されたブロック(問題ブロック)と、引き起こさないと判断されたブロック(通常ブロック)に対するDCT係数の割付処理の具体例を示す。なお、同図では、通常ブロックに対してはオリジナルMPEGストリームから低次側6個のDCT係数のみを残し、問題ブロックに対してはオリジナルMPEGストリームのDCT係数をそのまま全て残すようにしている。
なお、通常ブロックのときに残すDCT係数の数は、図3の例に限定されるものではなく、たとえば、上記図2に示すように9個、12個とすることもできる。また、問題ブロックのときに残すDCT係数も、全て残す場合の他、適当数(ただし、正常ブロックときに残す数より多い)を残すようにすることもできる。これにより、変換後のデータ量をさらに削減でき、MPEGストリームのビットレートをさらに低減することができる。
次に、上記VAD202における問題ブロックの判定処理について説明する。
まず、図4に、MPEG2規格に従うMPEGストリームのレイヤ構成を示す。
図示の如く、MPEGストリームは、シーケンスレイヤ、GOP(Group of Picture)レイヤ、ピクチャレイヤ、スライスレイヤ、マクロブロックレイヤ、ブロックレイヤから構成されている。なお、図中、GOPレイヤのI、P、BはそれぞれIピクチャ、Pピクチャ、Bピクチャを示し、ピクチャレイヤのMBは16画素×16ラインからなるマクロブロックを示し、マクロブロックレイヤのBLは8画素×8ラインのブロックを示す。
上記DCTモードを識別するための情報は、マクロブロックレイヤ中に、“DCTタイプ”として付加されており、DCTモードはマクロブロック毎に設定可能となっている。すなわち、一つのマクロブロックを構成する4つのブロックには、当該マクロブロックに対して設定されたDCTモードが共通して適用されている。
上記VAD110は、マクロブロック毎に設定されたDCTモードをマクロブロックレイヤから抽出し、抽出したDCTモードを、当該マクロブロックを構成する4つのブロックのDCTモードとして認識する。そして、認識したDCTモードがフレームDCTモードであるときは、以下のように、当該マクロブロックを構成する4つのブロックの量子化係数をそれぞれ参照し、それぞれのブロックが画像劣化を引き起こすブロックに該当するかを判別する。
図5に、画像劣化を引き起こすか否かを判別する際に参照する量子化係数を示す。
本実施の形態では、同図に示すように、(0,7)(1,7)の位置にある量子化係数を参照する。そして、これら2つの量子化係数の加算値(絶対値の加算)が閾値S1以上の場合に、画像劣化を引き起こすブロックとし、加算値が閾値S1未満の場合には、画像劣化を引き起こさないブロックとする。なお、閾値S1は、実験的検証結果を反映して設定される。たとえば、図3に示すように、(0,7)(1,7)の位置にある周波数成分の量子化係数を判定対象とする場合、閾値S1は、S1=1に設定される。
図6に、かかる場合の判定例を示す。
復号対象ブロックの量子化係数が同図(a)のようになっている場合、(0,7)(1,7)の位置にある量子化係数の加算値は「0」であるから、このブロックは、画像劣化を引き起こさないブロックとして判定される。これに対し、復号対象ブロックの量子化係数が同図(b)のようになっている場合、(0,7)(1,7)の位置にある量子化係数の加算値は「3」であるから、このブロックは、画像劣化を引き起こすブロックとして判定される。
ところで、上記のように、(0,7)(1,7)の位置にある量子化係数を判定対象としたのは、トップフィールドとボトムフィールドの差が激しい画像に対し低次側のDCT係数のみで逆DCT処理したときに画像劣化が生じやすいことに起因するものである。すなわち、図14に示す如く、トップフィールドとボトムフィールドは垂直方向に1ライン分ずれた関係にあるため、トップフィールドとボトムフィールドの画像差は、垂直方向の周波数成分に反映されることとなる。つまり、トップフィールドとボトムフィールドの画像差の激しさは、垂直周波数成分によって検出することができ、具体的には、両画像の差が激しくなるほど、垂直周波数成分の高次側の量子化係数が大きくなる。よって、垂直周波数成分の高次側にある量子化係数の値が大きければ、当該ブロックを低次側のDCT係数のみで高速再生したときに画像劣化が生じやすいことになる。
上記では、この点に着目して、(0,7)(1,7)の位置にある量子化係数を、画質劣化の判定対象に用いている。ただし、判定対象に用いる量子化係数はこれに限定されるものではなく、実験的検証結果に応じて適宜設定するようにすれば良い。
たとえば、(0,7)の位置にある量子化係数は、トップフィールドとボトムフィールドの画像差の激しさを最も端的に示すものであるから、この量子化係数のみを用いて画像劣化の検出をおこなっても精度の良い判定結果が得られるものと予測できる。あるいは、判定対象の量子化係数を、(0,1)〜(0,7)、(1,1)〜(1,7)、(2,1)〜(2,7)の位置にある量子化係数にまで広げるようにしても良い。この場合は、トップフィールドとボトムフィールドの画像差が比較的緩やかな垂直方向低次側の量子化係数も判定対象に含まれるため、これらの値をそのまま加算(絶対値の加算)して閾値と比較する場合には、画像劣化の検出精度が高められるよう、閾値を細かく調整する必要がある。なお、このとき、低次側の量子化係数よりも高次側の量子化係数が強調されるように、加算時に重み付けを設定するようにしてもよい。
なお、垂直方向に低次の量子化係数と、水平方向に高次の量子化係数を判定対象に含めると、画像劣化の判定において誤差成分が大きくなるため、検出精度が低下する危惧がある。このため、通常は、ブロックの周波数成分のうち水平周波数成分が低く、且つ、垂直周波数成分が高い周波数成分を判定対象とするのが好ましい。具体的には、(0,4)〜(0,7)、(1,4)〜(1,7)、(2,4)〜(2,7)の範囲内で判定の際に参照する量子化係数を設定すると良い。この場合も、各量子化係数に適宜重み付けして加算するようにすると良い。
図7に、一つのピクチャに対して実行されるデータ変換処理のフローチャートを示す。
当該ピクチャに対するデータ変換処理が開始されると、まず、先頭ブロックのDCTタイプが参照され(S101)、当該先頭ブロックのDCTモードがフレームDCTモードであるかが判別される(S102)。かかる判別結果がNOであれば、S106に進み、通常ブロックに対する変換処理、すなわち、低次側のDCT係数(たとえば低次側から6つのDCT係数)のみを残す処理が実行される。
一方、S102においてYESなら、当該ブロック中の特定周波数成分の量子化係数、たとえば、(0,7)(1,7)の位置にある量子化係数が加算され(S104)、この加算値が閾値S1以上であるか判別される(S104)。この判別結果がNOであれば、S106に進み、上記と同様、低次側のDCT係数のみを残す処理が実行される。一方、S104の判定結果がYESであれば、当該ブロックが画像劣化を引き起こすブロックとされ、高次側のDCT係数(たとえば全てのDCT係数)を残す処理が実行される(S105)。
このようにして、正常ブロックまたは問題ブロックに対してDCT係数を残す処理が実行されると、次いで、EOBを付加する処理が実行される(S107)。これにより、当該先頭ブロックに対するデータ変換処理が終了する。しかして、先頭ブロックに対する処理が終了すると、S101に戻り、次のブロックに対して、上記と同様の処理が実行される。かかるS101〜S107の処理は、当該ピクチャに含まれる全てのブロックに対して処理が実行されるまで繰り返される。全てのブロックに対する処理が終了すると(S108)、当該ピクチャに対する処理は終了し、次のピクチャの対する処理に移行する。
なお、図7に示す処理は、Iピクチャ、Pピクチャ、Bピクチャの何れにも同様に適用されるものである。このとき、S104における閾値S1は、ピクチャ種別毎に適宜変更するようにすると良い。なお、Bピクチャは他のピクチャから参照されないことから、Bピクチャに問題ブロックが含まれていても、これによる画像劣化の影響は比較的小さい。したがって、図7の示す処理は、IピクチャおよびPピクチャのみを対象として行うようにしても良い。さらに、IピクチャとPピクチャのイントラブロックのみを対象とするようにしても良い。これにより、処理の簡素化を図りながら、再生側における画像劣化の発生を効果的に抑制することができる。
以上、本実施の形態によれば、DCTタイプと特定周波数成分の量子化係数をもとに当該ブロックが画像劣化を引き起こすブロックであるかを判定し、その判定結果に応じて、データ変換時に残すDCT係数の数を適宜変更するものであるから、変換後のMPEGストリームを用いて画像再生を行っても、再生画像の画質が劣化することはなく、よって、ビットレートを効果的に低減させながら画質劣化を同時に抑制することができる。
なお、本発明はかかる実施の形態に限定されるものではなく、他に種々の変更が可能であることは言うまでもない。
たとえば、上記実施の形態では、特定周波数成分の量子化係数を参照して画像劣化の有無を判定するようにしたが、当該特定周波数成分の量子化係数を逆量子化して得られるDCT係数を参照して画像劣化の有無を判定するようにしても良い。ここで、当該量子化係数を逆量子化して得られるDCT係数を加算し、これを閾値と比較して画像劣化の有無を判定する場合には、当然ながら、閾値をDCT係数の大きさに合うように調整(たとえば、上記S1に量子化値を乗算して調整)する必要がある。
また、画像データ変換装置の構成を図8に示すように変更することもできる。
図において、211は、VLCデコーダ201から受信した量子化係数を逆量子化する逆量子化部、212は、VAD202からの検出結果(当該ブロックが正常ブロックか問題ブロックか)に応じて量子化係数を残す処理、たとえば、正常ブロックの場合には低次側6個の量子化係数を残し、問題ブロックの場合には全ての量子化係数をそのまま残す処理を実行する適応的DCT割付部、213は、適応的DCT割付部212から受信した量子化係数を再量子化して量子化係数を導出する再量子化部、214は再量子化された量子化係数をVLCエンコードすると共にEOB付加処理を実行するVLCエンコーダである。
ここで、再量子化部213における量子化値は、MPEGストリームを再生する再生系の状態および再生系にMPEGストリームを送信する通信系の状態等に応じて適宜設定可能とされている。このとき、再量子化時の量子化値をオリジナルストリームの量子化値に比べて大きく設定すれば、変換後のMPEGストリームのビットレートをさらに低減することができる。
なお、再量子化時に設定された量子化値は、図4に示すシーケンスレイヤのSH(シースヘッダもしくはマクロブロックレイヤ)に含められる。すなわち、オリジナルストリームにおけるSHもしくはマクロブロックレイヤの量子化値が、再量子化時に設定された量子化値に書き換えられる。
また、対象ブロックが画像劣化を引き起こすブロックであるとき、たとえば図15に示すように、垂直方向に高次のDCT係数(同図中、ハッチが付されたDCT係数)を残すように、適応的DCT係数割付部203、212にてDCT係数の割付処理を行うようにしも良い。これにより、ビットレートを効果的に低減させながら、再生画像の画質劣化を同時に抑制することができる。
その他、本発明の実施の形態は、特許請求の範囲に示された技術的思想の範囲内において、適宜、種々の変更が可能である。
実施の形態に係る画像データ変換装置の構成を示す図 DCT係数の割付処理の具体例を示す図 問題ブロックと通常ブロックに対するDCT係数の割付状態を示す図 MPEGストリームの構成を示す図 画質劣化ブロック判定の際に参照される量子化係数を示す図 画像劣化ブロックの判定例を示す図 実施の形態に係る画像データ変換処理フローを示す図 他の実施の形態に係る画像データ変換装置の構成を示す図 画像再生装置の基本的構成例を示す図 周波数成分の配列を示す図 データ変換の際に残されるDCT係数を示す図 従来の画像データ変換処理フローを示す図 フレームDCTとフィールドDCTについて説明する図 低次側DCT係数のみを用いた再生において生じる画像劣化現象を説明する図 データ変換の際に残されるDCT係数の変更例を示す図
符号の説明
202 VAD
203 適応的DCT係数割付部
212 適応的DCT係数割付部
213 再量子化部

Claims (7)

  1. MPEGエンコードされたデータストリームを低ビットレートのデータストリームに変換する画像データ変換装置において、
    一つのピクチャを構成するブロック領域のうち画像劣化を引き起こすブロック領域を検出するブロック検出手段と、
    前記ブロック領域中のDCT係数のうち低次側から所定の次数までのDCT係数のみを残すことにより、当該ブロックに対するデータ量を調整するデータ量調整手段とを有し、
    前記データ量調整手段は、前記ブロック検出手段によって画像劣化を引き起こすと検出されたブロック領域に対しては、画像劣化を引き起こさないと検出されたブロック領域よりもさらに高次側のDCT係数まで残すように、当該ブロックのデータ量を調整する、
    ことを特徴とする画像データ変換装置。
  2. 請求項1において、
    前記ブロック検出手段は、当該ブロック領域のDCTモードを識別するモード識別手段と、当該ブロック領域の周波数成分のうち特定の周波数成分の値を参照する参照手段とを備え、前記モード識別手段によってフレームDCTモードであると識別され、且つ、前記参照手段によって前記特定周波数成分の値が設定値範囲内にあると判定されたときに、当該ブロック領域を、画像劣化を引き起こすブロック領域として検出する、
    ことを特徴とする画像データ変換装置。
  3. 請求項2において、
    前記参照手段は、前記特定周波数成分に対応する量子化係数の絶対値の加算値がその閾値を超えたか否か、または、前記特定周波数成分に対応するDCT係数の絶対値の加算値がその閾値を超えたか否かを判定する、
    ことを特徴とする画像データ変換装置。
  4. 請求項2または3において、
    前記参照手段は、ブロック領域の周波数成分のうち水平周波数成分が低く、且つ、垂直周波数成分が高い周波数成分を、前記特定周波数成分として参照する、
    ことを特徴とする画像データ変換装置。
  5. 請求項1乃至4の何れかにおいて、
    前記ブロック領域の量子化係数を逆量子化してDCT係数を導出する逆量子化手段と、前記データ量調整手段によって調整されたDCT係数を再量子化する再量子化手段と、前記再量子化手段における量子化値を調整する量子化値調整手段とをさらに有する、
    ことを特徴とする画像データ変換装置。
  6. 請求項1ないし5の何れかにおいて、
    前記データ量調整手段は、前記ブロック検出手段によって画像劣化を引き起こすと検出されたブロック領域に対しては、垂直方向に高次のDCT係数を残すように、当該ブロックのデータ量を調整する、
    ことを特徴とする画像再生装置。
  7. 請求項1ないし5の何れかにおいて、
    前記ブロック検出手段は、Iピクチャおよび/もしくはPピクチャのみを対象として、あるいは、Iピクチャおよび/もしくはPピクチャのイントラブロックのみを対象として検出処理を実行する、
    ことを特徴とする画像再生装置。




JP2003350321A 2003-10-09 2003-10-09 画像データ変換装置 Expired - Fee Related JP4259974B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003350321A JP4259974B2 (ja) 2003-10-09 2003-10-09 画像データ変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003350321A JP4259974B2 (ja) 2003-10-09 2003-10-09 画像データ変換装置

Publications (2)

Publication Number Publication Date
JP2005117444A true JP2005117444A (ja) 2005-04-28
JP4259974B2 JP4259974B2 (ja) 2009-04-30

Family

ID=34541911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003350321A Expired - Fee Related JP4259974B2 (ja) 2003-10-09 2003-10-09 画像データ変換装置

Country Status (1)

Country Link
JP (1) JP4259974B2 (ja)

Also Published As

Publication number Publication date
JP4259974B2 (ja) 2009-04-30

Similar Documents

Publication Publication Date Title
US8374236B2 (en) Method and apparatus for improving the average image refresh rate in a compressed video bitstream
US6658157B1 (en) Method and apparatus for converting image information
US7787541B2 (en) Dynamic pre-filter control with subjective noise detector for video compression
US20090147856A1 (en) Variable color format based video encoding and decoding methods and apparatuses
US20070201554A1 (en) Video transcoding method and apparatus
KR100504641B1 (ko) 화상 부호화 장치 및 화상 부호화 방법
US9071844B2 (en) Motion estimation with motion vector penalty
JP2005192228A (ja) 符号化装置及び復号装置
US20050036549A1 (en) Method and apparatus for selection of scanning mode in dual pass encoding
US6865229B1 (en) Method and apparatus for reducing the “blocky picture” effect in MPEG decoded images
US8903196B2 (en) Video presentation at fractional speed factor using time domain interpolation
US7280689B2 (en) Anti-compression techniques for visual images
JP2003348597A (ja) 画像符号化装置および画像符号化方法
US20040264790A1 (en) Method of and apparatus for adaptively encoding motion image according to characteristics of input image
JP2007129318A (ja) 画像復号装置
JP4259974B2 (ja) 画像データ変換装置
JP2004023670A (ja) 画像符号化装置および同方式
JPH0998421A (ja) 画像符号化/復号化装置
JP3703088B2 (ja) 拡張画像符号化装置及び拡張画像復号化装置
JP4320509B2 (ja) 映像再符号化装置および方法
JP2008526077A (ja) ビデオストリーム変更装置
JP2005005862A (ja) 画像符号化装置
JP4155905B2 (ja) 画像再生装置
JP2002354484A (ja) 符号化画像のレート変換方法、及び符号化画像レート変換装置
WO2023127940A1 (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060725

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080905

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080930

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090106

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090203

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120220

Year of fee payment: 3

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120220

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees