JP2009267919A - 動画像復号器 - Google Patents

動画像復号器 Download PDF

Info

Publication number
JP2009267919A
JP2009267919A JP2008117076A JP2008117076A JP2009267919A JP 2009267919 A JP2009267919 A JP 2009267919A JP 2008117076 A JP2008117076 A JP 2008117076A JP 2008117076 A JP2008117076 A JP 2008117076A JP 2009267919 A JP2009267919 A JP 2009267919A
Authority
JP
Japan
Prior art keywords
field
image
picture
frame
decoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008117076A
Other languages
English (en)
Inventor
Yuji Okuda
田 裕 二 奥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008117076A priority Critical patent/JP2009267919A/ja
Publication of JP2009267919A publication Critical patent/JP2009267919A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】動画像データをデコードする処理を効率化する。
【解決手段】動画像データをデコードする動画像復号器であって、前記動画像データを構成する所定のフレームをデコードする場合、表示対象となる第1フィールドについてはデコードを行い、前記第1フィールドの復号画像を生成し、表示対象とならない第2フィールドについてはデコードを省略する動画像復号部を備える動画像復号器。
【選択図】図1

Description

本発明は、動画像復号器に関する。
動画像の圧縮・伸張に関する標準規格として、MPEGが広く知られている。MPEGには、MPEG1、MPEG2、H.264等の方式が存在する。
MPEGは例えば、ディジタルハイビジョン放送でも利用されている。ディジタルハイビジョン放送では、1920画素×1080画素という高解像度の画像を取り扱うため、動画像データをデコードするのに膨大な処理量を要する。ディジタルハイビジョン放送では、インタレース画像が毎秒60フィールド分送信される。
ディジタルハイビジョン放送は、携帯端末で受信されることも考えられる。この場合、携帯端末の画面サイズが問題となる。携帯端末の画面サイズは一般に小さいため、画像は縮小されて表示されることになる。そのため、携帯端末では、1920×1080のフルサイズ画像は不要であることが多く、960×540のハーフサイズ画像で十分なことが多いと考えられる。更には、毎秒60枚もの画像は不要であることが多く、毎秒30枚ほどの画像で十分なことが多いと考えられる。この場合、1920×1080の画像サイズでのデコード処理では、無駄な処理が多くなってしまう。
特許文献1には、動画像データのトップフィールド及びボトムフィールドを、垂直方向及び水平方向のサイズが半分に縮小されるようにデコードする画像復号装置及び画像復号方法が記載されている。
特許3937599号公報
本発明は、動画像データをデコードする処理を効率化することを課題とする。
本発明の実施形態は例えば、動画像データをデコードする動画像復号器であって、前記動画像データを構成する所定のフレームをデコードする場合、表示対象となる第1フィールドについてはデコードを行い、前記第1フィールドの復号画像を生成し、表示対象とならない第2フィールドについてはデコードを省略する動画像復号部を備える動画像復号器である。
本発明により、動画像データをデコードする処理を効率化することが可能になる。
本発明の実施例を、図面に基づいて説明する。
(第1実施例)
図1は、第1実施例の動画像復号器101の機能ブロック図である。図1の動画像復号器101は、ビットストリーム分解部111と、動画像復号部112とを備える。動画像復号部112には、エントロピー復号部201と、逆量子化部202と、逆離散コサイン変換部(IDCT部)203と、動き補償部204と、画像サイズ変換部205とが設けられている。図1の動画像復号器101はここでは、MPEG(詳細にはMPEG2)に準拠した動画像復号処理を行うLSIである。
動画像復号器101には、動画像データのビットストリームが入力される。ビットストリームには、動画像データに加えて、動きベクトルに関するデータ等が含まれる。
動画像データには、複数のフレームが含まれる。各フレームは、トップフィールド及びボトムフィールドにより構成される。これらのフィールドの一方が第1フィールドの例であり、これらのフィールドの他方が第2フィールドの例である。各フレームには、複数のマクロブロックが含まれる。これらのマクロブロックの構造は、フレーム構造でもフィールド構造でも構わない。本実施例では、上記動画像はカラー画像とし、上記動画像データには輝度フレームと色差フレームとが含まれるとする。本実施例では、各輝度フレームのマクロブロックのサイズは16×16とし、各色差フレームのマクロブロックのサイズは8×8とする。本段落の説明事項の詳細については、後述する。
ビットストリーム分解部111は、ビットストリームを分解し、ビットストリームから動画像データを抽出するブロックである。抽出された動画像データは、エントロピー復号部201に提供される。抽出された動きベクトルに関するデータは、動き補償部204に提供される。
動画像復号部112は、動画像データをデコードするブロックである。動画像データのデコードは、エントロピー復号部201、逆量子化部202、IDCT部203、動き補償部204、画像サイズ変換部205等により実行される。デコードされた動画像データは、表示デバイス等に出力される。
次に、エントロピー復号部201、逆量子化部202、IDCT部203、動き補償部204、画像サイズ変換部205について説明する。
エントロピー復号部201は、エントロピー復号を行うブロックである。エントロピー復号により、動画像データから、量子化されたDCT係数が算出される。
逆量子化部202は、逆量子化を行うブロックである。逆量子化により、量子化されたDCT係数から、DCT係数が算出される。
IDCT部203は、IDCT(逆離散コサイン変換)を行うブロックである。IDCTにより、DCT係数から、差分画像又は復号画像が生成される。具体的には、Bピクチャ又はPピクチャについては、差分画像が生成され、Iピクチャについては、復号画像が生成される。Bピクチャは、双方向予測による符号化が行われる画像である。Pピクチャは、前方向予測による符号化が行われる画像である。Iピクチャは、フレーム間符号化が行われない画像である。IDCT部203は、図1のように、フレーム構造用のIDCT部203Aと、フィールド構造用のIDCT部203Bとを備える。
動き補償部204は、動き補償により予測画像を生成するブロックである。動き補償により、予測画像が生成され、その後の処理により、差分画像とこの予測画像から復号画像が生成される。より詳細には、動きベクトルによって、参照画像の位置が特定されて予測画像が生成され、差分画像と予測画像とを加算することにより、復号画像が生成される。動き補償部204は、図1のように、フレーム構造用の動き補償部204Aと、フィールド構造用の動き補償部204Bとを備える。
画像サイズ変換部205は、画像サイズを変換するブロックである。画像サイズ変換部205は例えば、フルサイズのフレーム又はフィールドを、ハーフサイズのフレーム又はフィールドに変換する。画像サイズ変換部205の詳細については、後述する。
本実施例の動画像復号部112は、動画像データを構成する所定のフレームをデコードする場合、表示対象となる第1フィールドについてはデコードを行い、第1フィールドの復号画像を生成し、表示対象とならない第2フィールドについてはデコードを省略する。すなわち、本実施例の動画像復号部112は、所定のフレームをデコードする場合、第1フィールドの復号画像は生成するが、第2フィールドの復号画像は生成しない。
また、本実施例の動画像復号部112は、上記第1フィールドについては、水平方向のサイズが縮小されるようなデコードを行い、上記第1フィールドの復号画像として、水平方向のサイズが縮小された復号画像を生成する。本実施例では例えば、上記第1フィールドの水平方向のサイズが半分に縮小されるようなデコードを行う。これにより、水平方向のサイズが半分に縮小された復号画像が生成される。該復号画像の画像サイズは例えば、960×540である。
本実施例では、トップフィールドを第1フィールドとして取り扱い、ボトムフィールドを第2フィールドとして取り扱う。よって、本実施例では、上記所定のフレームのトップフィールドは表示対象となるが、上記所定のフレームのボトムフィールドは表示対象とはならない。本実施例では、ボトムフィールドを第1フィールドとし、トップフィールドを第2フィールドとしても構わない。
以下、上記所定のフレームと、Bピクチャ、Pピクチャ、Iピクチャとの関係について説明する。
本実施例では、Bピクチャは、上記所定のフレームに該当する。よって、動画像復号部112は、Bピクチャをデコードする場合、第1フィールドについてはデコードを行い、第2フィールドについてはデコードを省略する。
動画像復号部112は、Bピクチャについては、第1フィールドの差分画像と予測画像を生成し、第1フィールドの差分画像と予測画像から第1フィールドの復号画像を生成する。Bピクチャの予測画像を生成する際には、Pピクチャ及び/又はIピクチャの復号画像が参照される。
また、本実施例では、Pピクチャ及びIピクチャはそれぞれ、上記所定のフレームには該当しない。よって、動画像復号部112は、Pピクチャ又はIピクチャをデコードする場合、第1フィールドと第2フィールドの両方についてデコードを行う。
動画像復号部112は、Pピクチャについては、第1及び第2フィールドの差分画像と予測画像を生成し、第1及び第2フィールドの差分画像と予測画像から第1及び第2フィールドの復号画像を生成する。当該差分画像、予測画像、及び復号画像の構造はそれぞれ、フレーム構造でもフィールド構造でもよい。Pピクチャの予測画像を生成する際には、Pピクチャ及び/又はIピクチャの復号画像が参照される。
動画像復号部112は、Iピクチャについては、第1及び第2フィールドの復号画像を生成する。Iピクチャは、フレーム間符号化がなされないため、IDCTにより復号画像に変換される。当該復号画像の構造は、フレーム構造でもフィールド構造でもよい。
以上のように、本実施例では、Bピクチャについては、第1フィールドのみを表示対象とすべく、第1フィールドのみをデコードする。これにより、Bピクチャの第1及び第2フィールドをデコードする場合に比べて、デコード処理の処理量が減り、デコード処理が効率化される。
本実施例では更に、Bピクチャの第1フィールドについては、水平方向のサイズが縮小されるようなデコードを行う。これにより、デコード処理の処理量が更に減り、デコード処理が更に効率化される。
本実施例では、上記動画像データの各フレームの画像サイズは、例えば1920×1080とする。本実施例では、第1フィールドのみのデコードにより、復号画像の垂直方向のサイズが半分に縮小され、第1フィールドの水平方向のサイズの縮小により、復号画像の水平方向のサイズが半分に縮小される。よって、本実施例では、Bピクチャの復号画像の画像サイズは、1フレームあたり960×540となる。
一方、本実施例では、Pピクチャ及びIピクチャについては、これらが参照画像となり得ることを理由に、第1フィールドと第2フィールドの両方をデコードする。よって、本実施例では、Pピクチャ及びIピクチャの復号画像の画像サイズは、(画像サイズ変換前において)1フレームあたり960×1080となる。
以上のように、本実施例では、Bピクチャの復号画像の画像サイズは、960×540に縮小される。一方、Pピクチャ及びIピクチャの復号画像の画像サイズは、水平方向のサイズのみが半分に縮小された960×1080となる。しかしながら、Bピクチャ、Pピクチャ、及びIピクチャの復号画像を共に動画像として表示するためには、Pピクチャ及びIピクチャの復号画像の画像サイズについても、960×540に縮小する必要がある。そこで、本実施例の画像サイズ変換部205では、Pピクチャ及びIピクチャの復号画像の画像サイズを、1フレームあたり960×1080から960×540に変換する。
本実施例では、動画像データが、毎秒60フィールド分受信される場合、動画像データの復号画像は、毎秒30枚、すなわち、30フィールド分だけ送信されることになる。Bピクチャの各フレームを構成するフィールドが、第1及び第2フィールドから第1フィールドのみに半減するからである。例えば、Bピクチャが毎秒NBフィールド分受信される場合、Bピクチャの復号画像は毎秒NB/2枚だけ送信される。この場合、Pピクチャ、Iピクチャがそれぞれ毎秒NP、NIフィールド分受信されるとすると、Pピクチャ、Iピクチャの復号画像もそれぞれ毎秒NP/2、NI/2枚だけ送信される必要がある。そこで、本実施例の画像サイズ変換部205では、Pピクチャ及びIピクチャの復号画像の画像サイズを変換する処理に加えて、Pピクチャ及びIピクチャの復号画像の枚数を調整する処理を行う。
以下、Bピクチャのデコード処理の詳細について説明する。
Bピクチャの構造は、フレーム構造の場合とフィールド構造の場合とがある。また、Bピクチャの構造がフレーム構造の場合、DCTモードには、フレームDCTモードとフィールドDCTモードとがある。また、本実施例のBピクチャは、輝度(Luma)フレームに相当するBピクチャと、色差(Chroma)フレームに相当するBピクチャとに分類される。以下、Bピクチャのデコード処理について、これらの観点による場合分けの下で説明する。
図2は、輝度フレーム、フレーム構造、フレームDCTモードの場合のデコード処理について説明するための図である。
図2Aは、輝度フレームを構成するフレーム構造のマクロブロックを表す。輝度フレームのマクロブロックのサイズは一般に、図2Aのように、16×16である。図2Aのマクロブロックは、逆量子化が終了しており、16×16のDCT係数で構成されているとする。領域Tは、トップフィールド(第1フィールド)の画素領域を表しており、領域Bは、ボトムフィールド(第2フィールド)の画素領域を表している。以下、トップフィールドの画素をトップ画素と呼び、ボトムフィールドの画素をボトム画素と呼ぶ。図2Aのマクロブロックは、フレーム構造であるため、トップ画素とボトム画素とが1ライン毎にインタリーブされている。
図2Bは、IDCT(逆離散コサイン変換)を適用するマクロブロックを表す。フレームDCTモードでは、図2Aのマクロブロックがそのまま利用される。よって、図2Bには、図2Aのマクロブロックと同じマクロブロックが示されている。
図2Bのマクロブロックは、4つのブロックに分割される。これらのブロックのサイズはそれぞれ、図2Cのように、8×8である。続いて、IDCT部203Aにより、これらのブロックのIDCTが行われる。ここでは、4つのブロックのIDCTを行うべく、4回のIDCTが行われる。通常であれば、8×8のIDCTが行われるが、本実施例においては、各ブロックの水平方向のサイズを半分に縮小すべく、4×8のIDCTが行われる。よって、本実施例では、IDCTにより、8×8のブロックが4×8のブロックに変換される。IDCTにより生成される4つのブロックは、Bピクチャの差分画像に相当する。
図2Cの差分画像は、トップ画素とボトム画素とを含んでいる。しかしながら、本実施例では、Bピクチャについてはトップ画素のみが必要とされる。よって、本実施例では、図2Cの差分画像からトップ画素だけを取り出し、図2Dのような4×4の差分画像を生成する。これにより、4つの4×8差分画像(図2C)から4つの4×4差分画像(図2D)が生成される。
4つの4×4差分画像は、図2Eのように、1つの差分画像に統合される。図2Eの差分画像の画像サイズは、8×8である。こうして、マクロブロックから、トップフィールドの差分画像が生成される。
本実施例ではさらに、動き補償部204Aにより、トップフィールドの予測画像が生成され、動画像復号部112内では、図2Eのようなトップフィールドの差分画像と、上記予測画像から、トップフィールドの復号画像が生成される。このように、本実施例では、トップフィールドのみを表示対象とすべく、トップフィールドのみがデコードされる。図2の処理では、ボトムフィールドについては、図2Dの段階で除去されてしまう。
図3は、輝度フレーム、フレーム構造、フィールドDCTモードの場合のデコード処理について説明するための図である。
図3Aは、輝度フレームを構成するフレーム構造のマクロブロックを表す。図2Aと同様である。
図3Bは、IDCT(逆離散コサイン変換)を適用するマクロブロックを表す。フィールドDCTモードでは、図3Aのマクロブロックの画素が、図3Bのようにトップ画素とボトム画素とに分離され、図3BのマクロブロックがIDCTに利用される。
図3Bのマクロブロックは、4つのブロックに分割される。これらのブロックのサイズはそれぞれ、図3Cのように、8×8である。続いて、IDCT部203Bにより、これらのブロックのIDCTが行われる。ここでは、2つのブロックのIDCTを行うべく、2回のIDCTが行われる。本実施例では、Bピクチャについてはトップ画素のみが必要とされるため、トップ画素を含むブロックについてだけIDCTが行われる。また、本実施例においては、各ブロックの水平方向のサイズを半分に縮小すべく、4×8のIDCTが行われる。よって、本実施例では、IDCTにより、8×8のブロックが4×8のブロックに変換される。IDCTにより生成される2つのブロックは、Bピクチャの(トップフィールドの)差分画像に相当する。
これらの差分画像は、図3Dのように、1つの差分画像に統合される。図3Dの差分画像の画像サイズは、8×8である。こうして、マクロブロックから、トップフィールドの差分画像が生成される。
本実施例ではさらに、動き補償部204Bにより、トップフィールドの予測画像が生成され、動画像復号部112内では、図3Dのようなトップフィールドの差分画像と、上記予測画像から、トップフィールドの復号画像が生成される。このように、本実施例では、トップフィールドのみを表示対象とすべく、トップフィールドのみがデコードされる。図3の処理では、ボトムフィールドについては、図3Cの段階で除去されてしまう。
図4は、輝度フレーム、フィールド構造の場合のデコード処理について説明するための図である。
図4Aは、輝度フレームを構成するフィールド構造のマクロブロックを表す。図4Aのマクロブロックは、フィールド構造であるため、トップ画素とボトム画素とが元々分離されている。図4Aのマクロブロックは、フレーム構造のマクロブロック2個分のトップ画素を含んでいる。
図4Bは、IDCT(逆離散コサイン変換)を適用するマクロブロックを表す。フィールド構造のマクロブロックのIDCTでは、図4Aのようなマクロブロックがそのまま利用される。よって、図4Bには、図4Aのマクロブロックと同じマクロブロックが示されている。
図4Bのマクロブロックは、4つのブロックに分割される。これらのブロックのサイズはそれぞれ、図4Cのように、8×8である。続いて、IDCT部203Bにより、これらのブロックのIDCTが行われる。ここでは、4つのブロックのIDCTを行うべく、4回のIDCTが行われる。本実施例においては、各ブロックの水平方向のサイズを半分に縮小すべく、4×8のIDCTが行われる。よって、本実施例では、IDCTにより、8×8のブロックが4×8のブロックに変換される。IDCTにより生成される4つのブロックは、Bピクチャの(トップフィールドの)差分画像に相当する。
これらの差分画像は、図4Dのように、1つの差分画像に統合される。図4Dの差分画像の画像サイズは、8×16である。こうして、マクロブロックから、トップフィールドの差分画像が生成される。
本実施例ではさらに、動き補償部204Bにより、トップフィールドの予測画像が生成され、動画像復号部112内では、図4Dのようなトップフィールドの差分画像と、上記予測画像から、トップフィールドの復号画像が生成される。このように、本実施例では、トップフィールドのみを表示対象とすべく、トップフィールドのみがデコードされる。図4の処理では、ボトムフィールドについては、図4Aでマクロブロックを選ぶ段階で除去されてしまう。
図5は、色差フレーム、フレーム構造、フレームDCTモードの場合のデコード処理について説明するための図である。
図5Aは、色差フレームを構成するフレーム構造のマクロブロックを表す。色差フレームのマクロブロックのサイズは一般に、図5Aのように、8×8である。
続いて、図5Bのように、IDCT部203Aにより、マクロブロックのIDCTが行われる。本実施例においては、マクロブロックの水平方向のサイズを半分に縮小すべく、4×8のIDCTが行われる。よって、本実施例では、IDCTにより、8×8のマクロブロックが4×8のマクロブロックに変換される。IDCTにより生成されるマクロブロックは、Bピクチャの差分画像に相当する。
図5Bの差分画像は、トップ画素とボトム画素とを含んでいる。しかしながら、本実施例では、Bピクチャについてはトップ画素のみが必要とされる。よって、本実施例では、図5Bの差分画像からトップ画素だけを取り出し、図5Cのような4×4の差分画像を生成する。こうして、マクロブロックから、トップフィールドの差分画像が生成される。
本実施例ではさらに、動き補償部204Aにより、トップフィールドの予測画像が生成され、動画像復号部112内では、図5Cのようなトップフィールドの差分画像と、上記予測画像から、トップフィールドの復号画像が生成される。このように、本実施例では、トップフィールドのみを表示対象とすべく、トップフィールドのみがデコードされる。図5の処理では、ボトムフィールドについては、図5Cの段階で除去されてしまう。
図6は、色差フレーム、フィールド構造の場合のデコード処理について説明するための図である。
図6Aは、色差フレームを構成するフィールド構造のマクロブロックを表す。図6Aのマクロブロックは、フィールド構造であるため、トップ画素とボトム画素とが元々分離されている。図6Aのマクロブロックは、フレーム構造のマクロブロック2個分のトップ画素を含んでいる。
続いて、図6Bのように、IDCT部203Bにより、マクロブロックのIDCTが行われる。本実施例においては、マクロブロックの水平方向のサイズを半分に縮小すべく、4×8のIDCTが行われる。よって、本実施例では、IDCTにより、8×8のマクロブロックが4×8のマクロブロックに変換される。IDCTにより生成されるマクロブロックは、Bピクチャの(トップフィールドの)差分画像に相当する。図6Bの差分画像の画像サイズは、4×8である。こうして、マクロブロックから、トップフィールドの差分画像が生成される。
本実施例ではさらに、動き補償部204Bにより、トップフィールドの予測画像が生成され、動画像復号部112内では、図6Bのようなトップフィールドの差分画像と、上記予測画像から、トップフィールドの復号画像が生成される。このように、本実施例では、トップフィールドのみを表示対象とすべく、トップフィールドのみがデコードされる。図6の処理では、ボトムフィールドについては、図6Aでマクロブロックを選ぶ段階で除去されてしまう。
以下、第2実施例の動画像復号器101について説明する。第1実施例では、Bピクチャのみが上記所定のフレームに該当するのに対し、第2実施例では、Bピクチャ、Pピクチャ、Iピクチャがいずれも上記所定のフレームに該当する。第2実施例は第1実施例の変形例であり、第2実施例については第1実施例との相違点を中心に説明する。
(第2実施例)
図7は、第2実施例の動画像復号器101の機能ブロック図である。図7の動画像復号器101は、ビットストリーム分解部111と、動画像復号部112とを備える。動画像復号部112には、エントロピー復号部201と、逆量子化部202と、逆離散コサイン変換部(IDCT部)203と、動き補償部204と、動きベクトル補正部211とが設けられている。図7の動画像復号器101は、画像サイズ変換部205を備えていない点と、動きベクトル補正部211を備えている点で、図1の動画像復号器101と異なっている。
動きベクトル補正部211は、動きベクトルの補正を行うブロックである。動きベクトル補正部211は、動きベクトルに関するデータを、ビットストリーム分解部111から受け取り、必要に応じて補正し、動き補償部211に提供する。動きベクトル補正部211は、図7のように、フレーム構造用の動きベクトル補正部211Aと、フィールド構造用の動きベクトル補正部211Bとを備える。動きベクトル補正部211の詳細については、後述する。
本実施例の動画像復号部112は、動画像データを構成する所定のフレームをデコードする場合、表示対象となる第1フィールドについてはデコードを行い、第1フィールドの復号画像を生成し、表示対象とならない第2フィールドについてはデコードを省略する。第1実施例と同様である。
また、本実施例の動画像復号部112は、上記第1フィールドについては、水平方向のサイズが縮小されるようなデコードを行い、上記第1フィールドの復号画像として、水平方向のサイズが縮小された復号画像を生成する。第1実施例と同様である。
以下、上記所定のフレームと、Bピクチャ、Pピクチャ、Iピクチャとの関係について説明する。
本実施例では、BピクチャとPピクチャとIピクチャは、いずれも上記所定のフレームに該当する。よって、動画像復号部112は、Bピクチャ、Pピクチャ、又はIピクチャをデコードする場合、第1フィールドについてはデコードを行い、第2フィールドについてはデコードを省略する。
動画像復号部112は、Bピクチャについては、第1フィールドの差分画像を生成し、第1フィールドの差分画像から第1フィールドの復号画像を生成する。Bピクチャの差分画像から復号画像を生成する際には、Pピクチャ及び/又はIピクチャの復号画像が参照される。
また、動画像復号部112は、Pピクチャについても、第1フィールドの差分画像を生成し、第1フィールドの差分画像から第1フィールドの復号画像を生成する。Pピクチャの差分画像から復号画像を生成する際には、Pピクチャ及び/又はIピクチャの復号画像が参照される。
また、動画像復号部112は、Iピクチャについては、第1フィールドの復号画像を生成する。Iピクチャは、フレーム間符号化がなされないため、IDCTにより復号画像に変換される。
以上のように、本実施例では、Bピクチャ、Pピクチャ、及びIピクチャのいずれについても、第1フィールドのみを表示対象とすべく、第1フィールドのみをデコードする。これにより、これらのピクチャの第1及び第2フィールドをデコードする場合に比べて、デコード処理の処理量が減り、デコード処理が効率化される。
本実施例では更に、これらのピクチャの第1フィールドについては、水平方向のサイズが縮小されるようなデコードを行う。これにより、デコード処理の処理量が更に減り、デコード処理が更に効率化される。
第2実施例では、Pピクチャ及びIピクチャをも上記所定のフレームとするため、第1実施例よりも更にデコード処理が効率化される。ただし、第2実施例では、これらのピクチャが参照画像となり得るにもかかわらず、これらのピクチャを上記所定のフレームとしているため、動き補償の際、動きベクトルの補正や画素の補間が必要となり得る。動きベクトルの補正や画素の補間の詳細については、後述する。
動画像復号部112は、Bピクチャ又はPピクチャについては、第1フィールドの予測画像が得られる場合には、第1フィールドの差分画像と予測画像を生成し、第1フィールドの差分画像と予測画像から第1フィールドの復号画像を生成する。一方、第1フィールドの予測画像が得られない場合には、第1フィールドの差分画像を生成すると共に、第1フィールドの予測画像の代わりとなる代替的な予測画像を、上記動画像データの第1フィールドを利用して導出し、第1フィールドの差分画像と代替的な予測画像から第1フィールドの復号画像を生成する。代替的な予測画像の導出は、後述のように、動きベクトルの補正や画素の補間を利用して行われる。
Bピクチャ、Pピクチャ、及びIピクチャの差分画像生成処理は、図2から図6に示す方法で実行可能である。なお、Iピクチャに関しては、予測画像から復号画像を生成する処理は不要である。
以下、動き補償の詳細について説明する。
動き補償には、フレーム予測、フィールド予測、デュアルプライム予測等の方式が存在する。フレーム予測による動き補償は一般に、動きの少ない動画像に適している。フィールド予測による動き補償は一般に、動きの多い動画像に適している。また、Bピクチャ、Pピクチャ、Iピクチャの構造はそれぞれ、フレーム構造の場合とフィールド構造の場合とがある。以下、動き補償について、これらの観点による場合分けの下で説明する。
図8は、フレーム構造、フレーム予測の場合の動き補償について説明するための模式図である。
フレーム予測の場合、トップフィールドとボトムフィールドは、インタレースしてフレームとして取り扱う。図8Aにおいて、記号T(円形)は、トップフィールドのラインを模式的に表しており、記号B(四角形)は、ボトムフィールドのラインを模式的に表している。図8Aでは、記号Tと記号Bが近接して描かれている。これは、トップフィールドとボトムフィールドがインタレースされていることを模式的に表している。
図8Aには、フレームXとフレームYが示されている。フレームXとフレームYは、同じ動画像データのフレーム同士であり、フレームYがフレームXを参照する関係にある。図8Aに示すMVは、参照関係を規定する動きベクトルを表す。このような参照関係は、本実施例においては、BピクチャやPピクチャの予測画像から復号画像を生成する際に利用される。当該予測画像は、図8Aでは、フレームYのトップフィールドに相当する。
図8Aでは、フレームYのトップフィールドの画素位置が、フレームXのトップフィールドの画素位置を参照している。図8Aでは更に、フレームYのボトムフィールドの画素位置が、フレームXのボトムフィールドの画素位置を参照している。本実施例の予測画像から復号画像を生成する際には、前者の参照関係が利用される。
一方、図8Bでは、フレームYのトップフィールドの画素位置が、フレームXのボトムフィールドの画素位置を参照している。この場合、本実施例では、フレームXのボトムフィールドが存在しないことが問題となる。本実施例では、Pピクチャ及びBピクチャのボトムフィールドのデコードを省略するからである。
このような問題は、フレームYのトップフィールドの画素が、フレームXのトップフィールドの復号画像に存在しない画素を参照している場合に問題となる。当該問題が生じる場合の具体例を、図8Cに基づいて説明する。図8Cは、フレームXのトップフィールドの復号画像を表す。
上記問題は第1に、フレームYのトップフィールドの画素が、フレームXのボトムフィールドの画素を参照している場合に生じる(P1)。上記問題は第2に、フレームYのトップフィールドの画素が、フレームXのトップフィールドの画素を参照している場合において、フレームXのトップフィールドの復号画像に存在しない画素を参照している場合に生じる(P2)。上記問題は第3に、フレームYのトップフィールドの画素が、ハーフ精度の位置の画素を参照している場合に生じる(P3)。
このような場合、動画像復号部112は、上記画素の画素値を、フレームXのトップフィールドの復号画像に存在する画素の画素値を利用した補間処理により算出する。この補間処理により、上記画素の画素値を補間した予測画像、即ち、本来の予測画像の代わりとなる代替的な予測画像が導出される。これにより、上記のような問題が生じた場合にも、予測画像(代替的な予測画像)から復号画像を生成することが可能になる。上記補間処理の例を、図8Dに示す。
図8Dの画素Aの画素値aは、画素B1〜B4の画素値b1〜b4を利用して算出することができる。画素B1〜B4は、フレームXのトップフィールドの復号画像に存在する画素である。まず、画素B1〜B4の画素値b1〜b4を利用して、画素C1〜C3の画素値c1〜c3を算出する。画素値c1〜c3は、式(1)〜(3)のように与えられる。次に、画素B1の画素値b1と画素C1〜C3の画素値c1〜c3を利用して、画素Aの画素値aを算出する。画素値aは、式(4)のように与えられる。
1=(b1+b2+1)>>1 :(1)
2=(b1+b3+1)>>1 :(2)
3=(b1+b2+b3+b4+2)>>2 :(3)
a=(b1+c1+c2+c3+2)>>2 :(4)
画素Aの画素値aは、式(1)〜(3)を式(4)に代入することにより、式(5)のように算出される。このように、画素Aの画素値aは、画素B1〜B4の画素値b1〜b4を利用した補間処理により算出可能である。
a=(9b1+3b2+3b3+b4+8)>>4 :(5)
なお、図8Eの状況において、画素Mの画素値mは、画素N1〜N4の画素値n1〜n4により、式(6)のように与えられる。ただし、dx及びdyはそれぞれ0、1、2、3、4のいずれかの値である。
m=((4-dx)(4-dy)n1+dx(4-dy)n2+(4-dx)dyn3+dxdyn4+8)>>4 :(5)
なお、本実施例では、Pピクチャ及びIピクチャもハーフサイズ画像にデコードされるため、参照画像は常にハーフサイズ画像である。よって、本実施例では、動きベクトルもハーフサイズに縮小する。動きベクトルを(MVx,MVy)とする場合、動きベクトル補正部211は、当該動きベクトルを(MVx/2,MVy/2)に補正する。MPEG2では、動きベクトルはハーフ画素精度であるため、補正後の動きベクトルはクオーター画素精度となる。
図9は、フレーム構造、フィールド予測の場合の動き補償について説明するための模式図である。
フィールド予測の場合、トップフィールドとボトムフィールドは、インタレースせずに個別に取り扱う。図9Aでは、記号Tと記号Bが離して描かれている。これは、トップフィールドとボトムフィールドがインタレースされていないことを模式的に表している。
図9Aには、フレームXとフレームYが示されている。フレームXとフレームYは、同じ動画像データのフレーム同士であり、フレームYのトップフィールド及びボトムフィールドがフレームXのトップフィールド及びボトムフィールドを参照する関係にある。図9Aに示すMV1及びMV2は、参照関係を規定する動きベクトルを表す。このような参照関係は、本実施例においては、BピクチャやPピクチャの予測画像から復号画像を生成する際に利用される。当該予測画像は、図9Aでは、フレームYのトップフィールドに相当する。
図9Aでは、フレームYのトップフィールドが、動きベクトルMV1に従って、フレームXのトップフィールドを参照している。図9Aでは更に、フレームYのボトムフィールドが、動きベクトルMV2に従って、フレームXのボトムフィールドを参照している。本実施例の予測画像から復号画像を生成する際には、前者の参照関係が利用される。
一方、図9Bでは、フレームYのトップフィールドが、動きベクトルMV1に従って、フレームXのボトムフィールドを参照している。この場合、本実施例では、フレームXのボトムフィールドが存在しないことが問題となる。本実施例では、Pピクチャ及びBピクチャのボトムフィールドのデコードを省略するからである。
上述のように、フィールド予測は、画像に動きがある場合に用いられる事が多い。そのため、フレームXのトップボトムフィールドにおいてMV1の位置にある対象物は、フレームXのトップフィールドにおいては、図9Bに示すように、2×MV1の位置にある事が多いと考えられる(フィールド間の時間間隔は一定と想定する)。
そこで、動きベクトル補正部211は、動きベクトルMV1を(MV1x,MV1y)から(2×MV1x,2×(MV1y+1))に補正する。即ち、動きベクトルMV1を、約2倍に補正する。Y成分に1が加えられているのは、トップフィールドとボトムフィールドとの間の画素差を補正するためである。このように、動きベクトル補正部211は、フレームYのトップフィールドが、動きベクトルMV1に従って、フレームXのボトムフィールドを参照している場合、フレームYのトップフィールドが、フレームXのトップフィールドを参照するよう、動きベクトルMV1を補正する。この補正により、本来の予測画像に代わる新たな予測画像、即ち、代替的な予測画像が導出される。これにより、予測画像(代替的な予測画像)から復号画像を生成することが可能になる。
図9Aにおいて、フレームYのトップフィールドは、動きベクトルMV1に従って、フレームXのトップフィールドを参照している。また、図9Bにおいて、フレームYのトップフィールドは、動きベクトル2×MV1に従って、フレームXのトップフィールドを参照している。これらの場合、フレームYのトップフィールドは、図9Cのように、フレームXのトップフィールドの復号画像に存在しない画素を参照している場合がある。このような場合には、図8D又は図8Eのような補間処理を行う。即ち、上記画素の画素値を、フレームXのトップフィールドの復号画像に存在する画素の画素値を利用した補間処理により算出する。この補間処理により、予測画像又は代替的な予測画像を構成する画素の画素値が補間される。
なお、本実施例では、Pピクチャ及びIピクチャも水平方向にハーフサイズ画像にデコードされるため、参照画像は常に水平方向にハーフサイズ画像となる。よって、本実施例では、動きベクトルも水平方向にハーフサイズに縮小する。図9Bの場合には、MV1から2×MV1への補正と、このハーフサイズ補正を行うことになる。
図10は、フレーム構造、フィールド予測の場合の動き補償の変形例について説明するための模式図である。
図10には、連続する4つのフレームX、Z1、Z2、Yが示されている。フレームXはIピクチャ、フレームYはPピクチャ、フレームZ1及びZ2はBピクチャである。フレームX、Z1、Z2、Yは、同じ動画像データのフレーム同士であり、フレームYのトップフィールド及びボトムフィールドが、フレームXのトップフィールド及びボトムフィールドを参照する関係にある。図10に示すMV1及びMV2は、参照関係を規定する動きベクトルを表す。
図10では、フレームYのトップフィールドが、動きベクトルMV1に従って、フレームXのボトムフィールドを参照している。そこで、動きベクトル補正部211は、動きベクトルMV1を(MV1x,MV1y)から(6/5×MV1x,6/5×(MV1y+1))に補正する。即ち、動きベクトルMV1を、約6/5倍に補正する。因子を6/5とする理由は、フレームYのトップフィールドとフレームXのボトムフィールドとの時間間隔と、フレームYのトップフィールドとフレームXのトップフィールドとの時間間隔との比が、5:6であることに起因する。また、Y成分に1が加えられているのは、トップフィールドとボトムフィールドとの間の画素差を補正するためである。
フレームXとフレームYとの間に介在するBピクチャの枚数は、1枚でもよいし、3枚以上でもよい。
図11は、フレーム構造、デュアルプライム予測の場合の動き補償について説明するための模式図である。
図11Aには、フレームXとフレームYが示されている。フレームXとフレームYは、同じ動画像データのフレーム同士であり、フレームYのトップフィールド及びボトムフィールドがフレームXのトップフィールド及びボトムフィールドを参照する関係にある。
デュアルプライム予測の場合、フレームYのトップフィールドは、動きベクトルMVに従って、フレームXのトップフィールドを参照すると共に、動きベクトルα×MV+dmvに従って、フレームXのボトムフィールドを参照する(α=1/2)。そして、フレームXのトップフィールドに位置する参照画像と、フレームXのボトムフィールドに位置する参照画像との平均値が、フレームYのトップフィールドの参照画像となる。しかし、本実施例では、フレームXのボトムフィールドは存在しない。本実施例では、Pピクチャ及びBピクチャのボトムフィールドのデコードを省略するからである。
そこで、本実施例の動画像復号部112は、フレームXを参照して動き補償を行う場合には、図11Bのように、フレームXのトップフィールドの復号画像のみを利用して動き補償を行う。これにより、予測画像から復号画像を生成することが可能になる。
また、本実施例の動画像復号部112は、フレームYのトップフィールドが、フレームXのトップフィールドについて、フレームXのトップフィールドの復号画像に存在しない画素を参照している場合、図8Dや図8Eのような補間処理を行う。即ち、上記画素の画素値を、フレームXのトップフィールドの復号画像に存在する画素の画素値を利用した補間処理により算出する。この算出結果は、上記動き補償に利用される。
なお、本実施例では、Pピクチャ及びIピクチャも水平方向にハーフサイズ画像にデコードされるため、参照画像は常に水平方向にハーフサイズ画像となる。よって、本実施例では、動きベクトルも水平方向にハーフサイズに縮小する。
図12は、フィールド構造、フィールド予測の場合の動き補償について説明するための模式図である。
図12A及びBはそれぞれ、図9A及びBに対応している。図9では、各フィールドの垂直方向のライン数が8本なのに対し、図12では、各フィールドの垂直方向のライン数が16本となっている。図12における動き補償は、図9における動き補償と同様の方法で実行可能である。
図13は、フィールド構造、デュアルプライム予測の場合の動き補償について説明するための模式図である。
図13A及びBはそれぞれ、図11A及びBに対応している。図11では、各フィールドの垂直方向のライン数が8本なのに対し、図13では、各フィールドの垂直方向のライン数が16本となっている。図13における動き補償は、図11における動き補償と同様の方法で実行可能である。
図14は、フィールド構造、16×8予測の場合の動き補償について説明するための模式図である。
図14A及びBはそれぞれ、図12A及びBや図13A及びBに対応している。図14では、動きベクトルが、16×8ブロック毎に設定される。図14における動き補償は、フィールド予測の場合と同様の方法で実行可能である。
以上のように、本実施例では、BピクチャとPピクチャとIピクチャは、いずれも上記所定のフレームに該当する。よって、本実施例の動画像復号部112は、Bピクチャ、Pピクチャ、又はIピクチャをデコードする場合、第1フィールドについてはデコードを行い、第2フィールドについてはデコードを省略する。そのため、本実施例では、動き補償の際に参照画像が存在しない場合がある。Pピクチャ及びIピクチャの第2フィールドがデコードされないからである。しかしながら、本実施例では、図8から図14に示す方法により、比較的実際の参照画像に近い参照画像を得る事ができる。
第1実施例の動画像復号器の機能ブロック図である。 輝度フレーム、フレーム構造、フレームDCTモードの場合のデコード処理について説明するための図である。 輝度フレーム、フレーム構造、フィールドDCTモードの場合のデコード処理について説明するための図である。 輝度フレーム、フィールド構造の場合のデコード処理について説明するための図である。 色差フレーム、フレーム構造、フレームDCTモードの場合のデコード処理について説明するための図である。 色差フレーム、フィールド構造の場合のデコード処理について説明するための図である。 第2実施例の動画像復号器の機能ブロック図である。 フレーム構造、フレーム予測の場合の動き補償について説明するための模式図である。 フレーム構造、フィールド予測の場合の動き補償について説明するための模式図である。 フレーム構造、フィールド予測の場合の動き補償の変形例について説明するための模式図である。 フレーム構造、デュアルプライム予測の場合の動き補償について説明するための模式図である。 フィールド構造、フィールド予測の場合の動き補償について説明するための模式図である。 フィールド構造、デュアルプライム予測の場合の動き補償について説明するための模式図である。 フィールド構造、16×8予測の場合の動き補償について説明するための模式図である。
符号の説明
101 動画像復号器
111 ビットストリーム分解部
112 動画像復号部
201 エントロピー復号部
202 逆量子化部
203 逆離散コサイン変換部(IDCT部)
204 動き補償部
205 画像サイズ変換部
211 動きベクトル補正部

Claims (5)

  1. 動画像データをデコードする動画像復号器であって、
    前記動画像データを構成する所定のフレームをデコードする場合、表示対象となる第1フィールドについてはデコードを行い、前記第1フィールドの復号画像を生成し、表示対象とならない第2フィールドについてはデコードを省略する動画像復号部を備えることを特徴とする動画像復号器。
  2. 前記動画像復号部は、
    前記動画像データを構成するBピクチャをデコードする場合、第1フィールドについてはデコードを行い、第2フィールドについてはデコードを省略し、
    前記動画像データを構成するPピクチャ又はIピクチャをデコードする場合、第1フィールドと第2フィールドの両方についてデコードを行い、
    前記Bピクチャについては、前記第1フィールドの差分画像と予測画像を生成し、前記差分画像と前記予測画像から前記第1フィールドの復号画像を生成することを特徴とする請求項1に記載の動画像復号器。
  3. 前記動画像復号部は、
    前記動画像データを構成するBピクチャ、Pピクチャ、又はIピクチャをデコードする場合、第1フィールドについてはデコードを行い、第2フィールドについてはデコードを省略し、
    前記Bピクチャ又は前記Pピクチャについては、前記第1フィールドの差分画像を生成すると共に、前記第1フィールドの予測画像の代わりとなる代替的な予測画像を、前記動画像データの第1フィールドを利用して導出し、前記差分画像と前記代替的な予測画像から前記第1フィールドの復号画像を生成することを特徴とする請求項1に記載の動画像復号器。
  4. 前記動画像復号部は、
    フレーム予測による動き補償において、
    前記予測画像が、前記動画像データのあるフレームを参照している場合において、前記フレームの第1フィールドの復号画像に存在しない画素を参照している場合、前記画素の画素値を、前記第1フィールドの前記復号画像に存在する画素の画素値を利用した補間処理により算出することを特徴とする請求項3に記載の動画像復号器。
  5. 前記動画像復号部は、
    フィールド予測による動き補償において、
    前記予測画像が、動きベクトルに従って、前記動画像データの第2フィールドを参照している場合、前記予測画像が、前記動画像データの第1フィールドを参照するよう、前記動きベクトルを補正し、
    前記予測画像が、前記動きベクトル又は補正した前記動きベクトルに従って、前記動画像データの第1フィールドを参照している場合において、前記第1フィールドの復号画像に存在しない画素を参照している場合、前記画素の画素値を、前記第1フィールドの前記復号画像に存在する画素の画素値を利用した補間処理により算出することを特徴とする請求項3に記載の動画像復号器。
JP2008117076A 2008-04-28 2008-04-28 動画像復号器 Pending JP2009267919A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008117076A JP2009267919A (ja) 2008-04-28 2008-04-28 動画像復号器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008117076A JP2009267919A (ja) 2008-04-28 2008-04-28 動画像復号器

Publications (1)

Publication Number Publication Date
JP2009267919A true JP2009267919A (ja) 2009-11-12

Family

ID=41393177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008117076A Pending JP2009267919A (ja) 2008-04-28 2008-04-28 動画像復号器

Country Status (1)

Country Link
JP (1) JP2009267919A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013210826A (ja) * 2012-03-30 2013-10-10 Nec Corp 情報処理装置、描画処理システム、描画処理方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013210826A (ja) * 2012-03-30 2013-10-10 Nec Corp 情報処理装置、描画処理システム、描画処理方法およびプログラム

Similar Documents

Publication Publication Date Title
US9197903B2 (en) Method and system for determining a macroblock partition for data transcoding
KR101197506B1 (ko) 비디오 유닛 내의 경계 아티팩트 정정
JP5238523B2 (ja) 動画像符号化装置、動画像復号化装置、および、動画像復号化方法
US8514939B2 (en) Method and system for motion compensated picture rate up-conversion of digital video using picture boundary processing
JP4987322B2 (ja) 動画像復号装置及び動画像復号方法
US8989273B2 (en) Image information encoding method and encoder, and image information decoding method and decoder
KR101912059B1 (ko) 화상 부호화 장치 및 화상 복호 장치
CN106341622B (zh) 一种多路视频流的编码方法及装置
JP4412672B2 (ja) 補間された画素値を修正する方法
US20080285648A1 (en) Efficient Video Decoding Accelerator
EP1126710A1 (en) A method and an apparatus for video mixing of bit streams
JP5560009B2 (ja) 動画像符号化装置
JP4761390B2 (ja) 内挿される画素値の計算方法の改良
EP1125439A1 (en) Drift-free transcoder and related method
JP7178907B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP2009267919A (ja) 動画像復号器
US20090110304A1 (en) Method and System for Video Compression with Integrated Picture Rate Up-Conversion
JP5815326B2 (ja) 動画像復号装置及び画像表示装置
JP4533157B2 (ja) 画像復号方法
KR20120067626A (ko) 영상의 인트라 예측 부호화 방법 및 그 방법을 이용한 장치
JP2002218468A (ja) 動きベクトル変換装置及び動きベクトル変換方法
JPH05111009A (ja) 動画像の高能率符号化方式
JP2000350214A (ja) 動き補償予測符号化方法及びその装置
JP2011109528A (ja) 動画像符号化復号化装置