JP5092011B2 - 動画像復号装置及び動画像復号方法 - Google Patents

動画像復号装置及び動画像復号方法 Download PDF

Info

Publication number
JP5092011B2
JP5092011B2 JP2010282154A JP2010282154A JP5092011B2 JP 5092011 B2 JP5092011 B2 JP 5092011B2 JP 2010282154 A JP2010282154 A JP 2010282154A JP 2010282154 A JP2010282154 A JP 2010282154A JP 5092011 B2 JP5092011 B2 JP 5092011B2
Authority
JP
Japan
Prior art keywords
prediction
decoding
processing
load
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010282154A
Other languages
English (en)
Other versions
JP2012129951A (ja
Inventor
恵美 丸山
裕司 川島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2010282154A priority Critical patent/JP5092011B2/ja
Priority to US13/230,456 priority patent/US8711942B2/en
Publication of JP2012129951A publication Critical patent/JP2012129951A/ja
Application granted granted Critical
Publication of JP5092011B2 publication Critical patent/JP5092011B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Description

本発明の実施形態は、多視点の動画像を復号する動画像復号装置及び動画像復号方法に関する。
H.264/AVCの規格拡張であるH.264/MVCは多視点動画像符号化方式でBlu-ray 3Dに採用されている。H.264/MVCは動き補償においてH.264/AVCの画面間予測に加えて視差間予測を行うことにより高い圧縮率を実現している反面、視点数に比例して増加する処理量の多さが課題となる。特に、Blu-ray 3Dのように高解像度の多視点動画像を再生する場合には深刻な問題となる。
他方、視差間予測は同時刻の異なる視点のピクチャを参照するため、その相関は高く、隣接する視点のピクチャであればその領域の多くで類似していると考えられる。これまでのデブロッキング処理の技術(例えば、特許文献1参照。)に加え、この視差間予測を用いたより効率的な処理の要望があるが、かかる要望を実現するための手段は知られていない。
特開2007−208476号公報
本発明は、多視点の動画像を復号する際の視差間予測を用いたより効率的な処理技術を提供することを目的とする。
上記課題を解決するために、実施形態によれば動画像復号装置は、圧縮符号化された動画像ストリームをデコードする動画像復号装置であって、デコードする各フレームに対してこのフレームの処理対象ブロックに視差間予測処理を行う視差間予測手段と、デコードに要する処理負荷を含む装置内処理負荷の大きさを検出する負荷検出手段と、前記負荷検出手段により検出された前記装置内処理負荷の大きさのレベルを示す負荷レベルに応じて前記視差間予測処理の省略をするか否かを判定するための判定を行う判定手段と、該判定手段の判定結果に基づき、前記負荷レベルが小さくないと判定された場合は、前記視差間予測手段が前記視差間予測処理の省略を行うように制御する制御手段とを有する。
この発明の一実施形態を示す動き/視差補償予測部309を含むブロック構成図。 同実施形態のビデオデコーダと負荷検出部を示すブロック構成図。 同実施形態の動き予測により、補間される画素位置を説明するために示す図。 同実施形態の視差予測により、補間される画素位置を示すブロック構成図。 同実施形態に用いられる装置の説明のために利用する画素ライン、画素列の識別図。 同実施形態の動き補償予測部309cの画素補間生成部を示すブロック構成図。 同実施形態に用いられる6tap w/SW FIR filterを示すブロック構成図。 同実施形態に用いられる6tap w/SW FIR filter×6を示すブロック構成図。 同実施形態の視差補償予測部309dの画素補間生成部を示すブロック構成図。 ビデオデコーダの処理切り替えのフローチャート。 本発明の実施の形態に於ける動画像復号装置が適用される映像再生装置の内部構成を記録媒体およびネットワークストレージとともに示すブロック図。
以下、本発明の実施形態を説明する。
(第1の実施形態)
本発明による第1の実施形態を図1乃至図11を参照して説明する。なお、同一要素には同一符号を用い、重複する説明は省略する。
まず本発明の実施の形態に於ける動画像復号装置100は、図11に示す映像再生装置1に備えられている。図11は、映像再生装置1の内部構成を記録媒体203およびネットワークストレージ204とともに示すブロック図である。図11に示すように、映像再生装置1は、光ディスク等の記録媒体203が用いられ、記録媒体203に記録されているデジタル形式の映像コンテンツデータ(映画、ドラマなどの映像コンテンツを再生するためのデータ)を読取って映像コンテンツおよびインタラクティブデータ(映像コンテンツに関連して再生されるメニューデータ、アニメーションデータ、効果音データ、映像コンテンツの解説等のコンテンツ解説データ、クイズの問題などを含むデータ)を再生することができ、また、インターネット202を介してネットワークストレージ204に接続し、ネットワークストレージ204からも映像コンテンツデータを取得して映像コンテンツおよびインタラクティブデータを再生可能な構成を有している。
映像再生装置1は、ハードディスクドライブ2、フラッシュメモリ(Flash Memory)3、ディスクドライブ4およびネットワークコントローラ5を有し、いずれもバス19に接続されている。ハードディスクドライブ2は、高速回転する磁気ディスクに映像コンテンツデータ等のデジタルデータを記録して、デジタルデータの読み書きを行う
。フラッシュメモリ3には、映像コンテンツデータ等のデジタルデータが記憶されてデジタルデータの読み書きが行われる。ディスクドライブ4は記録媒体203から映像コンテンツデータ等のデジタルデータを読み取り、再生信号を出力する機能を有している。ネットワークコントローラ5は、インターネット202を介してネットワークストレージ204との間で行われる映像コンテンツデータ等のデジタルデータの読み書きを制御する。
また、映像再生装置1は、MPU(Micro Processing Unit)6、メモリ部7、ROM8およびビデオメモリ部9を有し、いずれもバス19に接続されている。MPU6は、ROM8からメモリ部7に読み出された起動プログラムにしたがい起動され、また、プレイヤプログラムをROM8からメモリ部7に読み出し、そのプレイヤプログラムにしたがってシステム初期化、システム終了などを制御し、システムマイコン16の処理を制御する。さらに、MPU6は、後述するデータプロセッサ部10に対して、記録媒体203、ネットワークストレージ204、ハードディスクドライブ2およびフラッシュメモリ3のいずれかから読み出される映像コンテンツデータから映像および音声を再生するように指示する。メモリ部7には、MPU6が作動する際に用いるデータやプログラムが記憶される。ROM8には、起動プログラム、プレイヤプログラムといったMPU6が実行するプログラムや、データプロセッサ部10が実行するプログラム(例えば、映像コンテンツデータ等の圧縮符号化されている動画音声データをデコードし、映像および音声を再生するための映像再生プログラム)、恒久的なデータなどが記憶されている。ビデオメモリ部9には、後述するデコードされたデコード画像データDが順次書き込まれる。
データプロセッサ部10は映像再生プログラムにしたがい作動して、圧縮符号化されている動画音声データを動画像データと音声データに分離してそれぞれをデコードし、映像および音声を再生する。システムマイコン16は、映像コンテンツの再生情報を表示パネル17へ表示させ、ユーザ入力装置18(リモコンまたは映像再生装置1に備えられた操作ボタン等操作入力可能な装置)から入力される操作入力信号をバス19を介してMPU6に入力する。表示パネル17は、液晶表示パネルを有し、システムマイコン16の指示にしたがい、映像コンテンツおよびインタラクティブデータの再生に関する様々な情報を液晶表示パネルに表示する。
次に、図2は映像再生装置1に備えられている動画像復号装置100の内部構成を示すブロック図である。この動画像復号装置100は、映像再生プログラムの1モジュールとして構成されている動画像復号処理プログラムにより実現されるソフトウェアデコーダである。動画像復号処理プログラムは、H.264/MVC規格で定義されている符号化方式で圧縮符号化されている動画像データS(以下「動画像ストリーム」といい、例えば映像コンテンツデータ)をデコードするためのソフトウェアであって、データプロセッサ部10によって実行され、図2に示す処理負荷検出部(動画像復号処理プログラムにおける処理負荷検出モジュール)200と、ビデオデコーダ(動画像復号処理プログラムにおけるデコード実行モジュール)300とに相当する機能を有している。
処理負荷検出部200は、ビデオデコーダ300におけるデコードに要する処理負荷を含む映像再生装置1内で発生する各種の処理負荷(以下「装置内処理負荷」という)の大きさを検出する負荷検出手段としての機能を有している。本実施の形態では、装置内処理負荷として、再生された映像データを可視化し表示されるべき画像を生成するレンダリングに要するレンダリング処理負荷L1、音声出力に要するオーディオ処理負荷L2およびビデオデコーダ300におけるデコードに要するビデオデコード処理負荷L3が検出の対象となっている。これらの処理負荷の大きさ(負荷量)は例えばMPU6(またはデータプロセッサ部10)の使用率に基づいて決定されるが、MPU6の使用率とメモリ部7、ビデオメモリ部9の使用率との組み合わせによって決定することもできる。
通常、ソフトウェアデコーダをスムーズに作動させるためには、ある一定サイズ以上のメモリ(メモリ部7など)を必要とする。メモリの使用率が高くなると、ソフトウェアデコーダのパフォーマンスが低下する。そのため、MPU6(またはデータプロセッサ部10)の使用率とメモリ部7、ビデオメモリ部9の使用率との組み合わせによって、装置内処理負荷の大きさを検出すると、ソフトウェアデコーダのスムーズな動作に支障をきたす負荷量であるか否かが精度よく判別される。
そして、処理負荷検出部200は、検出した装置内処理負荷の大きさを示す負荷情報LDを生成し、ビデオデコーダ300に入力する。負荷情報LDは映像再生装置1がビデオデコーダ300におけるデコード処理の実行に支障をきたす負荷量である(この場合を後述する高負荷状態という)か否かの判定に用いられる。
ビデオデコーダ300は詳しくは後述するが、動画像ストリームSを入力し、伸張するためのデコードを行う等してデコード画像データDを出力する。なお、図2には示していないが、デコード画像データDについては合成処理が行われ、その合成処理後の合成画像に対応した映像出力信号が映像再生装置1から出力される。
さてMPEG4-AVC/H.264(以下、H.264と略する)には、多視点映像符号化技術(Multiview Video Codec、以下MVCと略する)がサポートされている。MVCが符号化対象としている多視点映像の代表例として、3D映像や多視点による立体視映像が挙げられる。3D映像として提供される映像は、左目用、右目用に別々の角度から撮影された2つの二次元映像(または左目、右目の視差を考慮して処理された映像)である。これを再生する際に左目には左目用映像を、右目には右目用映像を投射することで、立体映像として認識することができる。
多視点動画像符号化方式H.264/MVCは、同一視差内の画面間予測に加えて異なる視差間を参照する視差間予測を適用することにより符号化効率を向上させている。視差間予測は同時刻の異なる視点のピクチャを参照するため、その相関は高く、隣接する視点のピクチャであればその領域の多くで類似していると考えられる。したがって視差間予測を用いて復号されるブロックに対して、以下のような条件で、一部の省略したデコード処理を実行すれば、画質劣化とデコード処理量の両面を抑制することができる。
MVCの特徴は、時間方向の予測の他に視差間の予測を導入した点と、ストリームのヘッダー情報が微増したが信号処理部に変更がない点にある。従い、視差間予測での画素ブロックの変位量を示す視差ベクトルも、インター予測での画素ブロックの動きベクトルも同じ信号処理が行なわれる。
一方で、視点数に比例して増加する処理量の多さが課題となる。特に、Blu-ray 3Dのように高解像度の多視点動画像を再生する場合には深刻な問題となる。他方、視差間予測は同時刻の異なる視点のピクチャを参照するため、その相関は高く、隣接する視点のピクチャであればその領域の多くで類似していると考えられる。本実施形態では、この類似性に着目し、視差間予測を行うピクチャの復号処理において、視差ベクトルの水平成分は、符号化データに記載された1/4画素精度の動きベクトルを利用するが、垂直成分では整数画素精度に丸め処理、または切り捨て/切り上げ処理を行うことで、FIRフィルタ処理を伴う補間処理を削減できる。
次に、図1を参照してビデオデコーダ300について説明する。
ビデオデコーダ300は、H.264/MVC規格に対応しており、図1に示すとおり、符号化データバッファ301、逆直交変換(逆DCT(Discrete Cosine Transform))/逆量子化部(以下、IQ/ITRANS部)302、加算部304、参照画像バッファ(フレームメモリ)306、動き/視差間予測部309、イントラ(Intra)予測部310およびモード切替スイッチ311を有している。なお、H.264の直交変換は整数精度であり、従来のDCTとは異なるが、本実施の形態では、DCTとして説明する。
更に動き/視差間予測部309は、動き/視差補償ブロック分割部309a、予測種別判定部309b、動き補償予測部309c、視差補償予測部309d、重み付け処理部309eを含む。
なお加算部304の後にデブロッキングフィルタ部305を備えてもよい。またモニタ出力(表示パネル17など)は、参照画像バッファ(フレームメモリ)306から行うように構成してもよい。
ビデオデコーダ300では、動画像ストリームSを構成するフレーム(ピクチャ)を例えば4×4の16ブロックからなるマクロブロック単位に分割し、マクロブロックごとにデコードを実行する。各マクロブロックは、例えば16個のブロックによって構成され、各ブロックは4×4の16画素が含まれている。
そして、マクロブロックごとにフレーム内符号化モード(イントラ符号化モード)および動き補償フレーム間予測符号化モード(インター符号化モード)のいずれか一方が選択されてデコードが実行される。
イントラ符号化モードにおいては、符号化の対象とされるフレーム(符号化対象フレーム)のすでに符号化されている信号からの画面内予測信号が定められた形状単位で生成されている。そして、符号化対象フレームから画面内予測信号を引いた予測誤差信号が直交変換(DCT)、量子化およびエントロピー符号化によって符号化されている。また、動き補償フレーム間予測符号化モードにおいては、動き補償フレーム間予測信号が定められた形状単位で生成されている。動き補償フレーム間予測信号はすでに符号化されているフレームと異なっている部分のみを変化分として検出し、それを用いて動きを推定するために生成されている。そして、符号化対象フレームから動き補償フレーム間予測信号を引いた予測誤差信号が、直交変換(DCT)、量子化およびエントロピー符号化によって符号化されている。また、視差補償フレーム間予測符号化モードにおいては、視差補償フレーム間予測信号が定められた形状単位で生成されている。視差補償フレーム間予測信号はすでに符号化されているフレームと異なっている部分のみを変化分として検出し、それを用いて視差の変位量を推定するために生成されている。そして、符号化対象フレームから視差補償フレーム間予測信号を引いた予測誤差信号が、直交変換(DCT)、量子化およびエントロピー符号化によって符号化されている。
なお、H.264/MVC規格の前身であるH.264/AVC規格に対応するコーデックは、MPEG2と比較しさらに圧縮率を高めるために、以下の(1)〜(6)に示す各技術などを利用している。
(1)従来のMPEGよりも高い画素精度(1/4画素精度)の動き補償
(2)フレーム内符号化を効率的に行うためのフレーム内予測
(3)ブロック歪みを低減するためのデブロッキングフィルタ
(4)4×4画素単位の整数DCT
(5)任意の位置の複数フレームを参照画面として使用可能なマルチリファレンスフレーム
(6)重み付け予測
さて次に図10に示すように、あるタイミングで検出した負荷量から得られる負荷レベルが、ある値L以上で当該ブロックが視差間予測の場合に、視差間予測を省略したデコード処理を実行し、それ以外は通常デコード処理を実行する。
上記の負荷量検出のタイミング(すなわち通常デコードと省略デコードの切替判定のタイミング)は、ブロック単位、マクロブロック単位、スライス単位、ピクチャ単位、GOVU単位(Iの単位)、シーケンス単位(IDRの単位)のいずれでも構わない。
以下、図10のフローチャートを参照して、映像再生装置1(プレイヤー)によるデコード処理の動作手順について説明する。なお、図10に示すフローチャートに沿ったデコード処理が行われる場合、データプロセッサ部10が動画像復号処理プログラムを実行し本実施形態における制御手段として作動している。
データプロセッサ部10は、動画像復号処理プログラムによるデコード処理を開始すると、ステップ61に進み、映像再生装置1の現在の負荷を問い合わせる。この場合、処理負荷検出部200によって、データプロセッサ部10の使用率等に基づき装置内処理負荷の大きさが検出され、負荷情報LDがビデオデコーダ300に入力される。
次に、データプロセッサ部10はステップ62に進み、ステップ61で入力された負荷情報LDに基づいて、映像再生装置1の現在の負荷が所定の基準値L以上か否かによって高負荷状態であるか否かを判定する。
そして、高負荷状態ではないと判定されたときはステップ63に進む。この場合、データプロセッサ部10は通常デコード処理を選択して、視差間予測処理部の全部を含む上述の一連のデコード処理を実行する。したがって、映像再生装置1が高負荷状態にならないかぎり、つまりデコードパフォーマンスが低下しないかぎり、動画像ストリームSは通常デコード処理によってデコードされる。
一方、高負荷状態であると判定されたときはステップ64に進み、データプロセッサ部10は実行すべきデコード処理として上述の特殊デコード処理を選択し、ビデオデコーダ300による上述の一連のデコード処理から視差間予測処理部の一部を除いた残りの処理を実行する。
ステップ63、ステップ64のいずれの場合も次にステップ65へ進む。ステップ65では、すべてのデコードが完了したか判定し、完了してなければステップ61へ戻り、完了していれば一連の処理を終了する。
以下で本実施形態の動き/視差間予測部309を中心とする動作例を示す。符号化されたデータは、マクロブロック単位で信号処理が行われる。マクロブロックとは、縦16画素横16画素の大きさをもつ符号化処理単位であり、復号化の信号処理もマクロブロック単位で行われる。IQ/ITRANS部302で残差成分は逆量子化及び逆変換が行われる。予測画像のうち、画面内予測されたマクロブロックはIntra予測部310で処理が行われ、IQ/ITRANS部302からの出力と加算される。予測画像のうち画面間の動き予測または視差間予測の場合には、動き/視差間予測部309へ入力され、処理の後に、IQ/ITRANS部302からの出力と加算される。動き予測/視差間予測で利用される参照画像は、参照画像バッファ306に保存される。
次に、動き/視差間予測部309について、説明する。動き/視差補償ブロック分割部309aで、マクロブロックを動き/視差補償ブロックに分割を行う。ここでは、動き/視差補償ブロック毎に、ベクトル残差と、参照画像を特定する参照番号と、双方向/前方向/後方向の予測方向の情報を得る。この情報を元に、予測種別判定部309bで動き/視差補償ブロックが動き補償ブロックか視差補償ブロックであるかの判定を行ない、動き/視差補償ブロック分割部309aからの出力である予測方向と、参照画像バッファ306から、参照番号から特定された参照画像と、既にデコードされたマクロブロックのベクトルを動き補償予測部309c、視差補償予測部309dに振り分ける。またベクトル残差を、動き/視差補償ブロック分割部309aから、動き補償予測部309c、視差補償予測部309dに振り分ける。動き補償予測部309cでは、参照画像バッファ306からのデコード済みのベクトルから動き補償ブロックのベクトルの予測値を求め、この予測値とベクトル残差を加算し、実際のベクトルを求める。視差補償予測部309dでも同様で、参照画像バッファ306からのデコード済みのベクトルから視差補償ブロックのベクトルの予測値を求め、この予測値とベクトル残差を加算し、実際のベクトルを求める。算出されたベクトル及び参照画像から予測補間を行なう際、動き補償予測部309cと視差補償予測部309dで処理方法が異なる(後述)。動き補償予測部309cと視差補償予測部309dから得られる画素ブロックを重み付け処理部309eで重み付け処理した後、予測画素ブロックを得て、1マクロブロックを構成した後、IQ/ITRANS部302から出力される残差成分と加算した後、モニタ出力される。
図3に動き予測により補間される画素位置を示す。動きベクトルは1/4精度の精度をもち、整数精度部と1/4精度部にベクトルを分けると、基準となる整数画素位置に対して、斜線で示した1/4画素に動きベクトルが指す場合に、画素補間が行なわれる。図4に視差予測により補間される画素位置を示す。視差ベクトルは動きベクトルと同様に1/4精度の精度をもち、H.264規格書の通りであると、図3の動き予測による補間画素と同じ画素位置が補間されるが、本特許では図4の視差予測により補間される画素位置のように、水平方向では1/4精度の精度をもつが、垂直方向成分は整数精度とすることで、補間生成される画素を減らすことができる。垂直方向成分の視差ベクトルを整数精度にする手段は、切捨て処理もしくは丸め処理による。この視差ベクトルの垂直成分の整数精度化により、視差補間部での補間処理時間または処理回路を削減することができる。
以下で、H.264での動き予測による補間処理と、本実施形態の視差予測による補間予測を比較する。
図5に本実施形態の装置の説明のために利用する画素ライン、画素列の識別図を示す。画素ラインはline1〜line6で示し、画素列はcol1〜col6で示す。図中の灰色で示された四角が整数画素位置であり、そのうち画素Gが図3,4で示した基準となる整数画素である。白色で示された四角が補間によって生成された画素位置である。処理の概略を1/4精度の画素位置の画素を生成するためには(例:f)、第一段階は1/2精度の画素位置の画素を6tapFIRフィルタによって得る(例:line1の整数画素ラインを入力としてaa、以下、line2からbb、line3からb、line4からs、line5からgg、line6からhhを得る)。得られた1/2精度の画素位置の画素(例:aa,bb,b,s,gg,hh)から4つの整数画素(例:G、H、M、N)の中間位置にある1/2精度の画素位置の画素を6tapFIRフィルタによって生成する(例:aa,bb,b,s,gg,hhを入力として、jを生成する)。1/2画素位置の画素二つの平均をとって、中間の1/4精度の画素位置の画素を生成する(例:jとbの平均値フィルタによって、fが生成される)。
図6に、動き補償予測部309cの画素補間生成部を示す。入力する整数位置の画素は、G,H,M及びline1〜6の6画素で構成される画素ライン及び、col1〜6の6画素で構成される画素列である(但し、col3はG,Mを含む6画素列、col4はHを含む6画素列、line3はG,Hを含む6画素ライン、line4はMを含む6画素ライン)。出力される画素信号は、G及び補間生成されたa,b,c,d,e,f,g,h,i,j,k,n,p,q,rである。1/4精度ベクトル判定部では、ベクトルの1/4精度部を判定し、水平成分(x)、垂直成分(y)の大きさから、生成する画素位置を求め、処理の切り替えを行なう。処理の切り替え信号は、6tap w/SW (with switch)FIR filter×6, 6tap w/SW FIR filterと、出力最終段へ入力し、生成画素に関係する回路だけをONにする。6tap w/SW FIR filterは図7で詳細を示す。これは、1/4精度ベクトル判定部からのON信号によって、6画素信号の入力を6tap FIR filterで受付け、フィルタされた画素として出力する。フィルタ係数は、(1,-5,20,20,-5,1)/32である。ONにする条件は補間生成される座標位置によって異なり、条件となる座標位置を図6の1/4精度ベクトル判定部からの矢印に記載した。6tap w/SW FIR filterx6は図8で詳細を示す。これは6tap w/SW FIR filterを6つ備え、1/4精度ベクトル判定部からの信号から同時にON/OFFされ、6組の6画素信号が入力し、フィルタされた画素を出力する。図6の6tap FIR filterは6tap w/SW FIR filterx6から出力される6画素からなる信号から1画素を生成する。このフィルタ係数は、6tap w/SW FIR filterと同じく(1,-5,20,20,-5,1)/32である。aveは2画素信号を入力として、線形補間するフィルタで係数は(1/2,1/2)である。
一方、視差補償予測部309dの画素補間生成部を図9に示す。1/4精度の精度をもつ視差ベクトルが入力し、ベクトルy成分が処理される。整数精度への処理方法は、切捨て、切上げ及び丸めのどちらかを選択できる。入力される画素信号G,line3,Hは整数精度の画素位置の画素信号であり、出力される画素信号a,b,cは補間生成された信号である。1/4精度ベクトル判定部、6tap w/SW FIR filter、aveは、動き補償予測部309cの画素補間生成部と同じである。図6において、視差補償予測部309dの画素補間生成部に相当する箇所を四角の一点鎖線の枠で囲った。視差ベクトルも動きベクトルと同じ精度で処理を行なう場合に比べて、大きく回路規模が異なることが分かる。
図6で図示した回路は、1/4精度の画素位置に応じて異なる処理を明示する目的で、並列的に回路を記述したため、実際には動き補償予測部309cの画素補間生成部の回路は、図示した回路より小さい回路規模で構成されることが予想される。しかし、視差補償予測部309dの画素補間生成部では、6tap FIR filterを1段用意するだけでよいことを見ても、本特許によって回路規模、または処理速度が大きく削減されるメリットが分かる。
以上のようにして、視差間予測の視差ベクトルの演算の一部の実行を省略することにより、フレームあたりのデコードに必要な処理を大幅に削減することができるようになる。そのため、たとえデコード処理の実行中にほかのプログラムが実行されていることにより、映像再生装置1が高負荷状態になっても、コマ落ちやオブジェクトの動きが極端に遅くなるなどの不具合を招くようなことはなく、動画像データのデコードおよび再生をスムーズに継続して実行できるようになる。
以上説明した実施例によれば、視差間予測の類似性に着目し、視差間予測を行うピクチャの復号処理において、視差補償予測の垂直ベクトル成分を整数精度に演算することによりデコーダの処理量を軽減する。この軽減処理は常時行うのではなく、プレイヤーで行う各種処理の負荷を検出し、負荷が高い場合に行うようにすることにより、可能な限り画質劣化を抑える。
以上の実施形態の効果として、AV機器おけるプロセッサの負荷や電池残量に応じてビデオデコーダの処理の一部を省略することにより、消費電力の軽減や、膨大な処理量が必要となる多視点動画像のリアルタイムデコードを実現できる。
即ち動画像を復号する装置(図1)において,復号にかかる処理量を削減するため,以下のような処理を行う。
(1)処理負荷検出部において、ビデオデコーダの処理負荷と、ビデオ以外のオーディオ,レンダリングなどの処理負荷から、全体の処理負荷を検出する。ビデオデコーダではこの負荷情報に応じて簡略処理を制御する。(図2)
(2)ビデオデコーダの復号処理において簡略処理を指示された場合、視差間予測の視差ベクトルのうち垂直方向の視差ベクトル成分を整数精度で演算する.(図10)
以上の概要として、多視点動画像復号装置で、処理負荷検出部において、ビデオデコーダの処理負荷、ビデオ以外のオーディオ処理負荷、そしてレンダリング処理負荷などから全体の処理負荷を検出し、所定の負荷以上の場合に簡略処理を制御する。その場合、視差間予測の視差ベクトルのうち垂直方向の視差ベクトル成分を整数精度で演算する。
AV機器おけるプロセッサの負荷や電池残量に応じてビデオデコーダの処理の一部を省略することにより、消費電力の軽減や、膨大な処理量が必要となる多視点動画像のリアルタイムデコードを実現できる。
なお、この発明は上記実施形態に限定されるものではなく、この外その要旨を逸脱しない範囲で種々変形して実施することができる。左右2画面の立体視映像では、視差間予測の視差ベクトルのうち垂直方向の視差ベクトル成分の変動が少なく、整数精度で演算することによる画質の低減は少ないという前提がある。これとは別にカメラを上下に並べて撮像した画像を処理するには、視差間予測の視差ベクトルのうち水平方向の視差ベクトル成分を整数精度で演算するように構成したほうが好適な場合がある。
また、上記した実施の形態に開示されている複数の構成要素を適宜に組み合わせることにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素から幾つかの構成要素を削除しても良いものである。さらに、異なる実施の形態に係わる構成要素を適宜組み合わせても良いものである。
1…映像再生装置、2…ハードディスクドライブ
3…フラッシュメモリ,6…MPU,8…ROM
10…データプロセッサ部、
100…動画像復号装置、200…処理負荷検出部
300…ビデオデコーダ、302…IQ/ITRANS部
309…動き/視差間予測部、311…モード切替スイッチ

Claims (4)

  1. 圧縮符号化された動画像ストリームをデコードする動画像復号装置であって、
    デコードする各フレームの処理対象ブロックに対して、すでにデコード処理が行われた他視点の処理対象ブロックから得られるベクトル情報に応じて、整数画素間の画素を補間する視差間予測処理を行う視差間予測手段と、
    デコードに要する処理負荷を含む装置内処理負荷の大きさを検出する負荷検出手段と、
    前記負荷検出手段により検出された前記装置内処理負荷の大きさのレベルを示す負荷レベルに応じて、垂直方向の整数画素間の前記視差間予測処理の省略をするか否かを判定するための判定を行う判定手段と、
    前記判定手段の判定結果に基づき、前記負荷レベルが閾値より小さくないと判定された場合は、前記視差間予測手段が、前記処理対象ブロックの垂直方向の整数画素間の視差間予測処理の省略を行い、前記処理対象ブロックの水平方向の整数画素間の視差間予測処理を行うように制御する制御手段とを有する動画像復号装置。
  2. 前記省略は垂直方向の視差ベクトル成分を整数精度で演算するものである請求項1に記載の動画像復号装置。
  3. デコードされた前記各フレームを表示するモニタを更に備えた請求項1に記載の動画像復号装置。
  4. 圧縮符号化された動画像ストリームをデコードする動画像復号方法であって、
    デコードに要する処理負荷を含む装置内処理負荷の大きさを検出し、
    デコードする各フレームの処理対象ブロックに対して、すでにデコード処理が行われた他視点の処理対象ブロックから得られるベクトル情報に応じて、整数画素間の画素を補間する視差間予測処理において、前記検出された前記装置内処理負荷の大きさのレベルを示す負荷レベルに応じて、垂直方向の整数画素間の前記視差間予測処理を省略をするか否かを判定し、
    前記判定結果に基づき、前記負荷レベルが閾値より小さくないと判定された場合は、前記処理対象ブロックの垂直方向の整数画素間の前記視差間予測処理の省略を行い、前記処理対象ブロックの水平方向の整数画素間の視差間予測処理を行うように制御する動画像復号方法。
JP2010282154A 2010-12-17 2010-12-17 動画像復号装置及び動画像復号方法 Expired - Fee Related JP5092011B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010282154A JP5092011B2 (ja) 2010-12-17 2010-12-17 動画像復号装置及び動画像復号方法
US13/230,456 US8711942B2 (en) 2010-12-17 2011-09-12 Moving picture decoding device and moving picture decoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010282154A JP5092011B2 (ja) 2010-12-17 2010-12-17 動画像復号装置及び動画像復号方法

Publications (2)

Publication Number Publication Date
JP2012129951A JP2012129951A (ja) 2012-07-05
JP5092011B2 true JP5092011B2 (ja) 2012-12-05

Family

ID=46234400

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010282154A Expired - Fee Related JP5092011B2 (ja) 2010-12-17 2010-12-17 動画像復号装置及び動画像復号方法

Country Status (2)

Country Link
US (1) US8711942B2 (ja)
JP (1) JP5092011B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5248583B2 (ja) 2010-12-13 2013-07-31 株式会社東芝 動画像復号装置及び動画像復号方法
WO2012124121A1 (ja) * 2011-03-17 2012-09-20 富士通株式会社 動画像復号方法、動画像符号化方法、動画像復号装置及び動画像復号プログラム
EP2878125A4 (en) * 2012-07-27 2016-10-12 Hfi Innovation Inc CONSTRAINED DISPARITY VECTOR DERIVATION METHOD IN 3D VIDEO CODING
US20140071235A1 (en) * 2012-09-13 2014-03-13 Qualcomm Incorporated Inter-view motion prediction for 3d video
CN104685881B (zh) * 2012-09-28 2018-05-15 夏普株式会社 图像解码装置、图像编码装置以及图像解码方法
KR20140051789A (ko) * 2012-10-22 2014-05-02 (주)휴맥스 3차원 비디오에서의 뷰간 움직임 예측 방법 및 뷰간 병합 후보 결정 방법
JP6181925B2 (ja) * 2012-12-12 2017-08-16 キヤノン株式会社 画像処理装置、画像処理装置の制御方法およびプログラム
JP5858119B2 (ja) * 2014-10-15 2016-02-10 富士通株式会社 動画像復号方法、動画像符号化方法、動画像復号装置及び動画像復号プログラム
CN105791890A (zh) * 2014-12-23 2016-07-20 Tcl集团股份有限公司 一种播放器的软解码方法及装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004289745A (ja) 2003-03-25 2004-10-14 Toshiba Corp 動画像復号化方法および装置
TWI268715B (en) * 2004-08-16 2006-12-11 Nippon Telegraph & Telephone Picture encoding method, picture decoding method, picture encoding apparatus, and picture decoding apparatus
JP2006101404A (ja) 2004-09-30 2006-04-13 Toshiba Corp 情報処理装置および同装置で用いられるプログラム
JP2007180982A (ja) 2005-12-28 2007-07-12 Victor Co Of Japan Ltd 画像復号装置、画像復号方法、及び画像復号プログラム
JP4825524B2 (ja) * 2006-01-31 2011-11-30 株式会社東芝 動画像復号装置および動画像復号方法
JP4987322B2 (ja) * 2006-02-28 2012-07-25 株式会社東芝 動画像復号装置及び動画像復号方法
KR100966567B1 (ko) * 2006-03-30 2010-06-29 엘지전자 주식회사 비디오 신호를 디코딩/인코딩하기 위한 방법 및 장치
JP5030495B2 (ja) 2006-07-14 2012-09-19 ソニー株式会社 再生装置、再生方法、プログラム、および記録媒体
WO2008010929A2 (en) 2006-07-18 2008-01-24 Thomson Licensing Methods and apparatus for adaptive reference filtering
BRPI0716810A2 (pt) 2006-09-20 2013-11-05 Nippon Telegraph & Telephone Método de codificação e método de decodificação de imagens, aparelhos para tal, aparelho de decodificação de imagem, programa para tal e meios de armazenamento para armazenar os programas.
JP2009100071A (ja) 2007-10-15 2009-05-07 Victor Co Of Japan Ltd 多視点画像復号方法、多視点画像復号装置及び多視点画像復号プログラム
JP2009159466A (ja) 2007-12-27 2009-07-16 Victor Co Of Japan Ltd 多視点画像復号方法、多視点画像復号装置及び多視点画像復号プログラム
JP5248583B2 (ja) 2010-12-13 2013-07-31 株式会社東芝 動画像復号装置及び動画像復号方法

Also Published As

Publication number Publication date
JP2012129951A (ja) 2012-07-05
US20120155537A1 (en) 2012-06-21
US8711942B2 (en) 2014-04-29

Similar Documents

Publication Publication Date Title
JP5092011B2 (ja) 動画像復号装置及び動画像復号方法
TWI690201B (zh) 全方位視訊之解碼方法、編碼方法及電子設備
JP5029062B2 (ja) 多視点動画像伝送システム
US8487981B2 (en) Method and system for processing 2D/3D video
JP5406182B2 (ja) 3次元ビデオ信号をエンコードするための方法及びシステム、含まれる3次元ビデオ信号、並びに3次元ビデオ信号のためのデコーダのための方法及び信号
KR100728009B1 (ko) 다시점 동영상을 부호화하는 방법 및 장치
WO2011058690A1 (ja) 三次元映像復号装置及び三次元映像復号方法
KR20140029383A (ko) 화상 부호화 장치 및 화상 복호 장치
WO1993013626A1 (en) Image data coding method, image data decoding method, image data coding device, image data decoding device, and image recording medium
JP2009284331A (ja) 復号装置及び復号方法、プログラム
US20120195381A1 (en) Image processing apparatus and method for processing image
JP4875008B2 (ja) 動画像符号化方法、動画像復号化方法、動画像符号化装置及び動画像復号化装置
JP5159927B2 (ja) 動画像復号装置及び動画像復号方法
JP2007318615A (ja) 動画再生装置、動画再生方法およびプログラム
JP5058362B1 (ja) 動画像復号装置及び動画像復号方法
JPH07240944A (ja) ステレオ画像符号化装置
JP5248583B2 (ja) 動画像復号装置及び動画像復号方法
JP6221820B2 (ja) 符号化装置、符号化方法および符号化プログラム
JP2012028960A (ja) 画像復号装置、画像復号方法および画像復号プログラム
JP2009081781A (ja) 動き補償装置及び動き補償方法
US20180124376A1 (en) Video decoding device and image display device
WO2010023782A1 (ja) 画像表示装置、録画再生装置、及び画像処理方法
JP6874844B2 (ja) 動画像符号化装置、動画像符号化方法、及び、動画像符号化プログラム
JP2009290387A (ja) エンコーダ、デコーダ、及び記録再生装置
WO2013108307A1 (ja) 映像処理装置および映像処理方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120321

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120821

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120914

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150921

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150921

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees