JP6190103B2 - 動画像符号化装置、動画像符号化方法およびプログラム - Google Patents

動画像符号化装置、動画像符号化方法およびプログラム Download PDF

Info

Publication number
JP6190103B2
JP6190103B2 JP2012238002A JP2012238002A JP6190103B2 JP 6190103 B2 JP6190103 B2 JP 6190103B2 JP 2012238002 A JP2012238002 A JP 2012238002A JP 2012238002 A JP2012238002 A JP 2012238002A JP 6190103 B2 JP6190103 B2 JP 6190103B2
Authority
JP
Japan
Prior art keywords
image data
moving image
bit depth
unit
prediction mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012238002A
Other languages
English (en)
Other versions
JP2014090253A (ja
Inventor
遠藤 寛朗
寛朗 遠藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2012238002A priority Critical patent/JP6190103B2/ja
Priority to US14/051,799 priority patent/US9313524B2/en
Publication of JP2014090253A publication Critical patent/JP2014090253A/ja
Application granted granted Critical
Publication of JP6190103B2 publication Critical patent/JP6190103B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は動画像を符号化する動画像符号化装置に関し、特に高ビット深度を含む異なるビット深度の動画像データを符号化するための動画像符号化装置に関する。
近年、音声信号、画像信号など所謂マルチメディアに関連する情報のデジタル化が急進しており、これに対応して画像データの圧縮符号化/復号化技術が注目されている。圧縮符号化及び復号化技術により、画像データの格納に必要な記憶容量や伝送に必要な帯域を減少させることができるため、マルチメディア産業には極めて重要な技術である。
これらの圧縮符号化復号化技術は、多くの画像が有する自己相関性の高さ(すなわち、冗長性)を利用して情報量/データ量を圧縮している。画像データが有する冗長性には、時間冗長性と二次元の空間冗長性があり、時間冗長性は、ブロック単位の動き検出及び動き補償を用いて低減することができる。一方、空間冗長性は、離散コサイン変換(DCT)を用いて低減させることが出来る。これらの技術を用いた画像符号化方式に、H.264/MPEG−4 PART10(AVC)(以下、H.264と呼ぶ)がある。
また、デジタルシネマに代表される映像制作の分野では超高画質映像への期待が高まっており、映像の高画質化に関する研究が精力的に行われている。そのための要素の一つとして、映像の高ダイナミックレンジ化があり、画像データのビット深度を現行の8ビットから、10ビットや12ビットとするものである。画像データの高ビット深度化は、そのまま画像のデータ量増大を招くことになるため、効率的な符号化手法が研究されている。例えば、特許文献1では、入力画像データをそのビット深度が小さくなるように変換処理し、変換処理後の画像データを符号化するとともに、変換処理後の符号化画像と高ビット深度の入力画像との差分情報も符号化している。
特開2011−176407号公報
しかしながら、前記特許文献1では、低ビット深度の符号化画像と高ビット深度の入力画像との差分情報を計算するために符号化画像データを復号する必要があり、符号化処理の演算コストが増大してしまう。また、前記H.264でも、従来の8ビット深度の符号化方式を転用した形で画像データの高ビット深度化に対応しているが、8ビット深度の符号化方式を転用しているため、データ量がそのまま増大し、やはり符号化処理の演算コストが増大してしまう。
そこで、本発明は上記従来技術の課題に鑑み、イントラ予測方式の選択精度を大きく落とすことなく符号化処理の演算コストの増大化を抑えた、高ビット深度の画像データの符号化に対応した動画像符号化装置を提供することである。
本発明の一態様によれば、複数の異なるビット深度のいずれか一つで表現される動画像データを、少なくとも画面内予測を用いて予測符号化する動画像符号化装置であって、前記動画像データを取得する取得手段と、前記取得手段で取得した動画像データを、前記複数の異なるビット深度の最も低いビット深度の動画像データに変換する変換手段と、前記変換手段でビット深度が変換された動画像データに基づいて画面内予測モードを決定する決定手段と、前記決定手段が決定した画面内予測モードに従って、前記取得手段が取得した前記複数の異なるビット深度のいずれか一つで表現される動画像データを予測符号化する符号化手段と、を備え、前記決定手段は、前記取得手段が取得した前記複数の異なるビット深度のいずれか一つで表現される動画像データから演算した所定のモードの評価値を前記最も低いビット深度の評価値に補正し、前記所定のモード以外の画面内予測モードの評価値を前記変換手段が出力する動画像データから演算し、前記補正された評価値と前記変換手段が出力する動画像データから演算した評価値に基づいて画面内予測モードを決定することを特徴とする動画像符号化装置が提供される。
本発明によれば、イントラ予測方式の選択精度を大きく落とすことなく、また符号化処理の演算コストの増大化を抑えて高ビット深度の画像データの符号化に対応できる動画像符号化装置を提供することが可能となる。
本発明の第1の実施例に係る動画像符号化装置の構成例を示すブロック図である。 イントラ予測の予測モードを説明するための図である。 本発明の第1の実施例に係るビット深度変換部の変換処理の第1の変形例を説明するための図である。 本発明の第1の実施例に係るビット深度変換部の変換処理の第2の変形例を説明するための図である。 本発明の第2の実施例に係る動画像符号化装置の構成例を示すブロック図である。 本発明の第1の実施例に係る動画像符号化装置の動作のフローチャートを示す図である。 本発明の第2の実施例に係る動画像符号化装置の動作のフローチャートを示す図である。
以下、添付の図面を参照して本発明の好適な実施形態を詳細に説明する。
(第1の実施例)
図1は、本発明の第1の実施例に係る動画像を予測符号化する動画像符号化装置の構成例を示すブロック図である。
同図において、動画像符号化装置100は、レンズや撮像センサ等のカメラ部を含む撮像部101からの入力動画像データを取得する。動画像符号化装置100は、フレームメモリ102と、動きベクトルを探索する動き探索部103と、イントラ予測方法を決定するイントラ予測モード決定部104とを備える。さらに、画素値のビット深度を変換するビット深度変換部120と、インター予測とイントラ予測とのどちらかの予測方法を選択するイントラ・インター選択部105と、予測画像生成部106と、減算器107と、整数変換部108と、量子化部109とを備える。さらに、逆量子化部110と、逆整数変換部111と、加算器112と、ループ内フィルタ113と、エントロピー符号化部115と、量子化制御部116と、符号量制御部117とを備える。そして、動画像符号化装置100による圧縮符号化によって生成された符号化データは、記録部118によって記録媒体に記録される。なお、インター予測は画面間予測とも称し、イントラ予測は画面内予測とも称す。
動画像符号化装置100は、記録媒体119が装着可能に構成されている。本実施例に係わる動画像符号化装置100は上述した構成であるので、撮像部と記録部を備えた撮像装置における画像処理装置として適用できるだけでなく、信号の入力手段と記録手段を備えるPCなどの情報処理装置にも同様に適用できる。その場合、撮像装置又は情報処理装置の制御部が有するCPUによって上記動画像符号化装置を制御することになる。具体的には、上記CPUが制御プログラムを実行することに本実施例の動画像符号化装置の各部の動作を実現することになる。
本実施例に係わる動画像符号化装置は、撮像部101により撮像して得られた動画像データを取得し、フレームメモリ102の入力画像の領域に順次格納する。本実施例に係わる動画像符号化装置100は、異なるビット深度の動画像データを入力して圧縮符号化することが可能な構成を有する。例えば、12bit,10bit,8bit,等のいずれかのビット深度の動画像データを入力して圧縮符号化することが可能なように、フレームメモリ102を初めとする各部を構成するものとする。本実施例では、入力される動画像データはNiビット深度であり、それがフレームメモリに格納されるとする。ビット深度Niは複数のビット深度(例えば、12bit,10bit,8bit,等)のいずれかを表わす。なお、フレームメモリ102に記憶する動画像データのビット深度は、ユーザが選択してもよいし、固定であってもよい。また、入力される動画データのビット深度を判定して対応するようにしてもよい。本実施形態では、Ni=12として以降の説明を行なう。
動き探索部103は、フレームメモリ102から、符号化対象ブロックの画像データと参照フレームの動き探索範囲の画像データを読み出す。探索範囲内の画像データと前記符号化対象ブロックの画像データとのブロックマッチングにより、探索範囲内の相関が高い場所を動きベクトルとして決定し、相関に基づく評価値とともにイントラ・インター選択部105に出力する。
イントラ予測モード(画面内予測モード)は、例えば図2に示す複数の予測モードが選択可能になっている。図2において、四角は1つの画素を示し、白い四角が符号化対象ブロックの画素を、また黒い四角は符号化対象ブロックの周辺画素を示している。図示の各イントラ予測モードの予測画像は、ブロック周辺の画素を用いて、周辺の画素値を矢印の方向に有する予測画像を生成する。図2(a)のVertical予測は、上方向に隣接する画素を使用して予測画像を生成する。図2(b)のHorizontal予測は、左方向に隣接する画素を使用して予測画像を生成する。図2(c)のDC予測は、周辺の画素値の平均値を予測画像の全画素値とする。図2(d)のPlane予測は、複数の隣接する画素値を用いた演算により予測画像を生成する。なお、イントラ予測モードの種類はこれに限るものではない。
イントラ予測モード決定部104は、動画像符号化装置100が対応可能な動画像データのビット深度のうちの最小ビット深度(以下、Noビット深度と記す)の動画像データのみに対応している。本実施形態では、12bit,10bit,8bitに対応する動画像符号化装置100であるとしているので、No=8とする。
イントラ予測モード決定部104は、フレームメモリ102に格納されている符号化対象ブロックの画像データを、後述するビット深度変換部120を経由して8ビット深度の符号化対象ブロックの画像データとして読み出す。また同様に、フレームメモリ102に格納されている符号化対象ブロックの周辺の画像データを、ビット深度変換部120を経由して8ビット深度の符号化対象ブロックの周辺の画像データとして読み出す。イントラ予測モード決定部104は、読み出した周辺の画像データを用いて、複数のイントラ予測モードに対応する予測画像を生成し、それぞれのイントラ予測モードに対して、符号化対象ブロックとの相関を表す評価値を算出する。評価値には、符号化対象ブロックと予測画像との画素値の差分絶対値総和を用い、評価値が小さいほど相関が高いことになる。なお、評価値の算出方法はこれに限るものではない。イントラ予測モード決定部104は、算出されたそれぞれのイントラ予測モードに対する評価値のうちで最小となる評価値に対応するイントラ予測モードをイントラ・インター選択部105に出力する。なお、動画像データは輝度成分と2つの色差成分(Cb、Cr)から構成されていて、イントラ予測モード決定部104は、輝度成分のイントラ予測モードを決定するとともに、色差成分に対しては2つの色差成分に共通のイントラ予測モードを決定する。
ビット深度変換部120は、フレームメモリ102に格納されているNi(Ni=12)ビット深度の動画像データを入力し、ビット深度をNo(No=8)の動画像データとして出力する。ビット深度の変換は、下位ビットの削減量LをL=Ni−Noから算出し(L=12−8=4)、各画素データの下位L(L=4)ビットを削除する構成とする。なお、入力動画像データのビット深度がNoであった場合は、入力動画像データをそのまま出力する。また、上述の変換構成はこれに限るものではなく、後に本実施例の変形例として説明する構成でもよい。この構成により、符号化される動画像データのビット深度が異なっても、一つのイントラ予測モード決定部104で(を兼用して)イントラ予測モードを決定することが可能となる。
ここで、本実施例の特徴であるイントラ予測モードを決定する動作について、図6を参照しながら説明する。本動作は、本実施例の動画像符号化装置100の図示しない制御部又は当該装置が適用されているカメラ、情報処理装置等の制御部のCPUがプログラムを実行してソフトウエア処理として実現される。なお、ここでは詳述しないが、イントラ予測モードを決定した後の符号化動作も、同様に上記CPUによるソフトウエア処理として実現することが可能である。
まずS601で、ビット深度変換部120は、符号化する画像データのビット深度が、動画像符号化装置100が対応可能な動画像データのビット深度のうちの最小ビット深度であるかどうかを判断する。最小のビット深度ではない場合(本実施例の場合)は、S602で画像データのビット深度変換を行いS603へ移行する。S601において最小のビット深度であった場合には、ビット深度変換は行わずにS603へ移行する。
S603で、イントラ予測モード決定部104は、複数のイントラ予測モードの評価値を算出し、S604へ移行する。S604で、イントラ予測モード決定部104は、前記複数のイントラ予測モードの評価値のうち最小の評価値を示すモードをイントラ予測モードとして決定する。
イントラ・インター選択部105は、動き探索部103の結果とイントラ予測モード決定部104の結果とを入力し、例えば、評価値が小さい方の予測方法を選択して、予測画像生成部106へ通知する。予測画像生成部106は、入力された予測方法に従って予測画像を生成し、減算器107へ出力する。インター予測が選択された場合は、フレームメモリ102に格納されている後述の参照フレームの画像データから予測画像を生成し、イントラ予測が選択された場合は、後述する加算器112が出力する再構成画像から予測画像を生成する。減算器107では、符号化対象の画像データと予測画像データとの差分を計算し、差分画像データが生成される。差分画像データは整数変換部108に出力され、入力された差分画像データに整数変換を施し、量子化部109は、整数変換部108により整数変換された差分画像データに対して量子化処理を行う。
エントロピー符号化部115は、量子化部109により量子化された変換係数をエントロピー符号化し、ストリームとして記録部118に出力する。ここで、量子化部109における量子化係数は、エントロピー符号化部115で発生した符号量や、符号量制御部117から設定される目標符号量などから量子化制御部116が算出する。記録部118は、エントロピー符号化部115から出力されたストリームを記録媒体119に記録する。
また、量子化部109により量子化された変換係数は、逆量子化部110にも入力される。逆量子化部110は、入力された変換係数を逆量子化し、逆整数変換部111は、逆量子化された信号に対して逆整数変換処理を施す。
加算器112には、逆整数変換されたデータと、予測画像生成部106により生成された予測画像データとが入力されて加算される。加算後のデータは復号された再構成画像データとなり、予測画像生成部106に入力されてイントラ予測画像データの生成に用いられる。また、再構成画像データは、ループ内フィルタ113によって符号化歪の軽減処理が施され、インター符号化の際に用いる参照フレームの画像データとしてフレームメモリ102の参照画像の領域(不図示)に格納される。
上述した本実施例によれば、イントラ予測方式の選択精度を大きく落とすことなく、また符号化処理の演算コストの増大化を抑えて高ビット深度の画像データの符号化に対応できる動画像符号化が可能となる。特に、従来技術のように低ビット深度の符号化画像と高ビット深度の入力画像との差分情報を計算および符号化することがないので、符号化処理の負荷および符号化のデータ量の増大を避けることが可能となる。
(第1の実施例の第1の変形例)
上述した本発明の第1の実施例におけるビット深度変換部120の動作(ビット深度変換の構成)の第1の変形例を説明する。本変形例では、ビット深度変換部120の変換動作が異なる以外は、前記第1の実施例の構成と同様であるので、ここでの説明を省略する。なお、ビット深度NiおよびNoは、第1の実施例と同様にそれぞれ12および8であり、また動画像データは輝度成分と2つの色差成分から構成されている。以下、本変形例に係わるビット深度変換部120の動作を説明する。
ビット深度変換部120は、フレームメモリ102に格納されているNi(Ni=12)ビット深度の動画像データから符号化対象ブロックの画像データおよびその周辺の画像データを入力する。入力された画像データの輝度成分の全画素データの中で、最も上位にある有意ビット“1”の位置nを検出する。図3(a)に、入力された輝度成分の画像データを8画素A乃至Hとして、各画素の値をビットデータとして例示した。この例では、最も上位にある有意ビット“1”の位置nは10である。そこで、上位ビットの削除量mをm=Ni−nで算出し(m=12−10=2)、下位ビットの削減量LをL=Ni−No−mで算出する(L=12−8−2=2)。算出したmおよびLに従って、入力された画像データの輝度成分の各画素の上位mビットと下位Lビットを削除し、ビット深度Noの画像データとして出力する。色差成分に対しては、2つの色差成分の画像データに対して輝度成分の場合と同様のビット削減を行い、ビット深度Noの画像データとして出力する(図3(b))。なお、色差成分は12ビット深度の場合、−2048〜+2047の値をとるが、ここでは−2048は−2047にクリップ処理したあと絶対値を求め、その絶対値に対して同様のビット深度変換を行った後、符号を戻して値を求める。この場合、入力される色差成分の絶対値のビット深度は(Ni−1)ビットであり、ビット深度変換後のビット深度は(No−1)ビットである。また、イントラ予測モードが2つの色差成分に対して共通であるため、ビット深度の変換も2つの色差成分に対して共通に行っている。
有意な最上位ビットを検出してビット削減を行うことにより、全体的に画素の値が小さな場合であっても、下位のビットも用いた精度が高い評価値の算出が可能となる。
本変形例によっても、符号化される動画像データのビット深度が異なる場合でも、一つのイントラ予測モード決定部104で(を兼用して)イントラ予測モードを決定することが可能となる。
(第1の実施例の第2の変形例)
上述した本発明の第1の実施例におけるビット深度変換部120の動作(ビット深度変換の構成)の第2の変形例を説明する。本変形例でも、ビット深度変換部120の変換動作が異なる以外は、前記第1の実施例の構成と同様であるので、ここでの説明を省略する。なお本変形例においても、ビット深度NiおよびNoは第1の実施例と同様に、それぞれ12および8であり、また動画像データは輝度成分と2つの色差成分から構成されている。以下、本変形例に係わるビット深度変換部120の動作を説明する。
ビット深度変換部120は、フレームメモリ102に格納されているNiビット深度(Ni=12)の動画像データから符号化対象ブロックの画像データおよびその周辺の画像データを入力する。入力された画像データの輝度成分の各画素の値の中で、最も大きい画素値Imaxを求める。図4(a)に入力された輝度成分の画像データを8画素として、各画素の値を例示した。この例では、最も大きい値を有する画素は画素Bであり、最大値Imaxは300である。出力するビット深度No(No=8)で表現可能な最大値をOmax(Omax=255)として、各輝度値に対して、(Omax/Imax)を乗算することでビット深度Noである値に変換し、変換した輝度値を出力する。色差成分に対しては、2つの色差成分の画像データに輝度成分の場合と同様のビット削減を行なって出力する(図4(b))。なお、色差成分は12ビット深度の場合、−2048〜+2047の値をとるが、ここでは−2048は−2047にクリップ処理したあと絶対値を求め、その絶対値に対して同様のビット深度変換を行った後、符号を戻して値を求める。この場合、入力される色差成分の絶対値のビット深度は(Ni−1)ビットであり、ビット深度変換後のビット深度は(No−1)ビットである。また、イントラ予測モードが2つの色差成分に対して共通であるため、ビット深度の変換も2つの色差成分に対して共通に行っている。
画素の値の最大値で正規化することによって、変換後のビット深度で取り得る値の範囲を有効に使用した精度が高い評価値の算出が可能となる。
本変形例によっても、符号化される動画像データのビット深度が異なる場合でも、一つのイントラ予測モード決定部104で(を兼用して)イントラ予測モードを決定することが可能となる。
(第1の実施例の第3の変形例)
上述した本発明の第1の実施例におけるビット深度変換部120の動作(ビット深度変換の構成)の第3の変形例を説明する。本変形例でも、ビット深度変換部120の変換動作が異なる以外は、前記第1の実施例の構成と同様であるので、ここでの説明を省略する。なお本変形例においても、ビット深度NiおよびNoは第1の実施例と同様にそれぞれ12および8であり、また動画像データは輝度成分と2つの色差成分から構成されている。以下、本変形例に係わるビット深度変換部120の動作を説明する。
ビット深度変換部120は、フレームメモリ102に格納されているNi(Ni=12)ビット深度の動画像データから符号化対象ブロックの画像データおよびその周辺の画像データを入力する。ビット深度変換部120は、入力されたNiビット深度の画像データを、次の変換式に従って演算によってNoビット深度の画像データに変換する。
Pout =4×√Pin
ここで、Pinは変換前の画素値、Poutは変換後の画素値である。
上記の式に従って、ビット深度変換部120は各輝度値を変換して出力する。色差成分に対しては、2つの色差成分の画像データに輝度成分の場合と同様にビット削減を行なって出力する。なお、色差成分は12ビット深度の場合、−2048〜+2047の値をとるが、絶対値を使用して、同様のビット深度変換を行った後、符号を戻して値を求める。その場合、絶対値を求める変換式は、|Pout|=2×√2×√|Pin|である。また、イントラ予測モードが2つの色差成分に対して共通であるため、ビット深度の変換も2つの色差成分に対して共通に行っている。なお、変換式は本変形例に示したものに限るものではない。
全体的な画素の値の大きさによらず共通の変換処理でありながらも、画素の値が小さい領域を生かした精度が高い評価値の算出が可能となる。なお、変換式によっては、画素の値が大きい領域を重視することも可能であり、また、画素の値が中程度の領域を重視することも可能である。
本変形例によっても、符号化される動画像データのビット深度が異なる場合でも、一つのイントラ予測モード決定部104で(を兼用して)イントラ予測モードを決定することが可能となる。
(第2の実施例)
本発明の第2の実施例を、図5を用いて説明する。
図5は、本実施例に係る動画像符号化装置500の構成例を示すブロック図である。同図において、DC予測評価値算出部501およびイントラ予測モード決定部502以外の部分は第1の実施例と同じであるので、ここでの説明は省略する。なお本実施例においても、NiおよびNoはそれぞれ12および8とする。
DC予測評価値算出部501は、入力画像データ、即ち符号化される画像データと同じNiビット深度の画像データを入力として、イントラ予測モードのDC予測の評価値を算出する。DC予測評価値算出部501は、フレームメモリ102に格納されている、12ビット深度の動画像データから符号化対象ブロックの画像データおよび符号化対象ブロックの周辺の画像データを読み出す。そして、読み出した周辺の画像データを用いて、DC予測モードに対応する予測画像を生成し、符号化対象ブロックとの相関を表す評価値を算出してイントラ予測モード決定部502へ出力する。
イントラ予測モード決定部502は、前記第1の実施例で説明したイントラ予測モード決定部104と同様に、DC予測モード以外のイントラ予測モードに対応する評価値を算出する。その時、DC予測評価値算出部501から入力されたDC予測モードの評価値は、ビット深度Noの画像データの評価値に相当するように、16(2)で除算して補正する。イントラ予測モード決定部502は、補正されたDC予測モードの評価値と算出した他のイントラ予測モードの評価値それぞれを比較し、評価値が最小であるイントラ予測モードをイントラ・インター選択部105に出力する。
なお、イントラ予測モード決定部502は、補正前のDC予測モードの評価値が閾値より小さいかどうかを判定し、小さい場合には他のイントラ予測モードとの評価値の比較をせずに、DC予測モードをイントラ予測モードとして決定してもよい。
DC予測モードは主に平坦な画像部分で使用されることが多い。また、平坦な画像部分では画像のわずかな濃淡を表現することが視覚的に良好な画質である。このことから、本実施例のように、DC予測モードの評価値算出をNiビット深度で行うことで、DC予測モードの選択精度が向上し、平坦部分での視覚的が画像劣化を抑えることができる。
ここで、本実施例の特徴であるイントラ予測モードを決定する動作について、図7を参照しながら説明する。本動作は、本実施例の動画像符号化装置500の図示しない制御部又は当該装置が適用されているカメラ、情報処理装置等の制御部のCPUがプログラムを実行してソフトウエア処理として実現される。なお、ここでは詳述しないが、イントラ予測モードを決定した後の符号化動作も、同様に上記CPUによるソフトウエア処理として実現することが可能である。
まずS701で、DC予測評価値算出部501はDC予測モードの評価値を算出する。
S702で、ビット深度変換部120は、符号化する画像データのビット深度が、動画像符号化装置500が対応可能な動画像データのビット深度のうちの最小ビット深度であるかどうかを判断する。最小のビット深度ではない場合(本実施例の場合)は、S703で画像データのビット深度変換を行い、S704移行する。S702において最小のビット深度であった場合は、ビット深度変換は行わずにS704へ移行する。
S704では、イントラ予測モード決定部502は、DC予測モード以外の複数のイントラ予測モードの評価値を算出し、S705へ移行する。S705では、イントラ予測モード決定部502は、DC予測モードの評価値を他のモードの評価値と比較できるように補正した後、DC予測モードを含む前記複数のイントラ予測モードの評価値のうち最小の評価値を示すモードをイントラ予測モードとして決定する。
本実施例によっても、第1の実施例と同様に、イントラ予測方式の選択精度を大きく落とすことなく、また符号化処理の演算コストの増大化を抑えて高ビット深度の画像データの符号化に対応できる動画像符号化が可能となる。
(その他の実施形態)
前述した本発明の実施形態における動画像符号化装置を構成する各手段、並びに動画像符号化方法の各工程は、コンピュータのRAMやROMなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び前記プログラムを記憶したコンピュータ読み取り可能な記憶媒体は本発明に含まれる。
また、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
なお、本発明は、前述した実施形態の機能を実現するソフトウエアのプログラム(図示したフローチャートに対応したプログラム)を、システムまたは装置に直接、または遠隔から供給する場合も含む。そして、そのシステムまたは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
プログラムを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスクなどがある。さらに、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM、DVD−R)などもある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する方法がある。そして、前記ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記憶媒体にダウンロードすることによっても供給できる。
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、その他の方法として、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。さらに、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、その他の方法として、まず記憶媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。そして、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現される。
以上、本発明の好ましい実施形態について説明したが、本発明はこれらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。

Claims (15)

  1. 複数の異なるビット深度のいずれか一つで表現される動画像データを、少なくとも画面内予測を用いて予測符号化する動画像符号化装置であって、
    前記動画像データを取得する取得手段と、
    前記取得手段で取得した動画像データを、前記複数の異なるビット深度の最も低いビット深度の動画像データに変換する変換手段と、
    前記変換手段でビット深度が変換された動画像データに基づいて画面内予測モードを決定する決定手段と、
    前記決定手段が決定した画面内予測モードに従って、前記取得手段が取得した前記複数の異なるビット深度のいずれか一つで表現される動画像データを予測符号化する符号化手段と、を備え、
    前記決定手段は、前記取得手段が取得した前記複数の異なるビット深度のいずれか一つで表現される動画像データから演算した所定のモードの評価値を前記最も低いビット深度の評価値に補正し、前記所定のモード以外の画面内予測モードの評価値を前記変換手段が出力する動画像データから演算し、前記補正された評価値と前記変換手段が出力する動画像データから演算した評価値に基づいて画面内予測モードを決定する
    ことを特徴とする動画像符号化装置。
  2. 前記符号化手段は、前記取得手段が取得する前記複数の異なるビット深度のいずれか一つで表現される動画像データを符号化し、前記決定手段は前記最も低いビット深度で表現される動画像データのみの画面内予測モードを、複数の画面内予測モードの評価値に基づいて決定し、前記取得手段が取得した動画像データのビット深度が前記最も低いビット深度であるときは、前記変換手段は、前記取得した動画像データを出力することを特徴とする請求項1に記載の動画像符号化装置。
  3. 前記決定手段は、前記複数の異なるビット深度のいずれか一つで表現される動画像データから演算した前記所定のモードの評価値が所定の閾値より小さい場合は、前記所定のモードを画面内予測モードとして決定することを特徴とする請求項1に記載の動画像符号化装置。
  4. 前記所定のモードは、DC予測モードであることを特徴とする請求項1乃至のいずれか一項に記載の動画像符号化装置。
  5. 前記変換手段は、前記取得手段が取得した動画像データのビット深度をNiとし、前記最も低いビット深度をNoとするとき、前記取得手段が取得した動画像データの下位L(L=Ni−No)ビットを削除して、前記取得手段が取得した動画像データのビット深度を変換することを特徴とする請求項1乃至4のいずれか一項に記載の動画像符号化装置。
  6. 前記変換手段は、前記取得手段が取得した動画像データのビット深度をNiとし、前記最も低いビット深度をNoとしたとき、前記取得手段が取得した動画像データの最も上位の有意ビットの位置nを検出し、前記検出した位置nに基づいて、前記取得手段が取得した動画像データの上位m(m=Ni−n)ビットおよび下位L(L=Ni−No−m)ビットを削除して、前記取得手段が取得した動画像データのビット深度を変換することを特徴とする請求項1乃至4のいずれか一項に記載の動画像符号化装置。
  7. 前記変換手段は、前記取得手段が取得した動画像データのビット深度をNiとし、前記最も低いビット深度をNoとしたとき、前記取得手段が取得した動画像データの最も大きい画素値Imaxを検出し、前記ビット深度Noで表現され得る画素値の最大値をOmaxとして、前記取得手段が取得した動画像データに(Omax/Imax)を乗算して前記取得手段が取得した動画像データのビット深度を変換することを特徴とする請求項1乃至4のいずれか一項に記載の動画像符号化装置。
  8. 前記変換手段は、変換式に従った演算により前記取得手段が取得した動画像データのビット深度を変換することを特徴とする請求項1乃至4のいずれか一項に記載の動画像符号化装置。
  9. 前記変換手段は、前記取得手段が取得した動画像データの複数の色差成分に対しては、共通のビット深度変換を行うことを特徴とする請求項1乃至8のいずれか一項に記載の動画像符号化装置。
  10. 前記取得手段が取得した動画像データの動きベクトルを探索する動き探索手段をさらに備え、前記符号化手段は、前記動き探索手段による動きベクトルの探索の結果と前記決定手段による画面内予測モードの決定の結果とに基づいて、前記取得手段が取得した動画像データを予測符号化することを特徴とする請求項1乃至9のいずれか一項に記載の動画像符号化装置。
  11. 複数の異なるビット深度のいずれか一つで表現される動画像データを、少なくとも画面内予測を用いて予測符号化する動画像符号化方法であって、
    前記動画像データを取得してメモリに記憶する取得ステップと、
    前記メモリに記憶された動画像データを、前記複数の異なるビット深度の最も低いビット深度の動画像データに変換する変換ステップと、
    前記変換ステップでビット深度が変換された動画像データに基づいて画面内予測モードを決定する決定ステップと、
    記決定した画面内予測モードに従って、前記メモリに記憶された前記複数の異なるビット深度のいずれか一つで表現される動画像データを予測符号化する符号化ステップと、を備え、
    前記画面内予測モードは、記取得した前記複数の異なるビット深度のいずれか一つで表現される動画像データから演算した所定のモードの評価値を前記最も低いビット深度の評価値に補正し、前記所定のモード以外の画面内予測モードの評価値を前記変換によって得られる動画像データから演算し、前記補正された評価値と前記変換によって得られる動画像データから演算した評価値に基づいて決されることを特徴とする動画像符号化方法。
  12. 複数の異なるビット深度のいずれか一つで表現される動画像データを、少なくとも画面内予測を用いて予測符号化する動画像符号化装置を制御するプログラムであって、
    コンピュータを、
    前記動画像データを取得する取得手段、
    前記取得手段で取得した動画像データを、前記複数の異なるビット深度の最も低いビット深度の動画像データに変換する変換手段、
    前記変換手段でビット深度が変換された動画像データに基づいて画面内予測モードを決定する決定手段、
    前記決定手段が決定した画面内予測モードに従って、前記取得手段が取得した前記複数の異なるビット深度のいずれか一つで表現される動画像データを予測符号化する符号化手段、として機能させ、
    前記決定手段は、前記取得手段が取得した前記複数の異なるビット深度のいずれか一つで表現される動画像データから演算した所定のモードの評価値を前記最も低いビット深度の評価値に補正し、前記所定のモード以外の画面内予測モードの評価値を前記変換手段が出力する動画像データから演算し、前記補正された評価値と前記変換手段が出力する動画像データから演算した評価値に基づいて画面内予測モードを決定するプログラム。
  13. 請求項12に記載のプログラムを記憶したコンピュータが読み取り可能な記憶媒体。
  14. コンピュータを、請求項1乃至10のいずれか一項に記載された動画像符号化装置の各手段として機能させるプログラム。
  15. コンピュータを、請求項1乃至10のいずれか一項に記載された動画像符号化装置の各手段として機能させるプログラムを格納したコンピュータ読み取り可能な記憶媒体。
JP2012238002A 2012-10-29 2012-10-29 動画像符号化装置、動画像符号化方法およびプログラム Expired - Fee Related JP6190103B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012238002A JP6190103B2 (ja) 2012-10-29 2012-10-29 動画像符号化装置、動画像符号化方法およびプログラム
US14/051,799 US9313524B2 (en) 2012-10-29 2013-10-11 Moving image coding apparatus, moving image coding method, and program therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012238002A JP6190103B2 (ja) 2012-10-29 2012-10-29 動画像符号化装置、動画像符号化方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2014090253A JP2014090253A (ja) 2014-05-15
JP6190103B2 true JP6190103B2 (ja) 2017-08-30

Family

ID=50547172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012238002A Expired - Fee Related JP6190103B2 (ja) 2012-10-29 2012-10-29 動画像符号化装置、動画像符号化方法およびプログラム

Country Status (2)

Country Link
US (1) US9313524B2 (ja)
JP (1) JP6190103B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110049231B (zh) * 2017-12-27 2021-08-10 佳能株式会社 电子设备及其控制方法和计算机可读介质
WO2020228835A1 (en) * 2019-05-16 2020-11-19 Beijing Bytedance Network Technology Co., Ltd. Adaptive color-format conversion in video coding

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06209469A (ja) * 1993-01-11 1994-07-26 Sony Corp 画像符号化装置、画像符号化方法、画像復号化装置、画像復号化方法、および画像記録媒体
US20060153295A1 (en) * 2005-01-12 2006-07-13 Nokia Corporation Method and system for inter-layer prediction mode coding in scalable video coding
KR100718130B1 (ko) * 2005-06-04 2007-05-14 삼성전자주식회사 디스플레이 구동 장치 및 방법
US8228998B2 (en) * 2006-10-10 2012-07-24 Nippon Telegraph And Telephone Corporation Intra prediction encoding control method and apparatus, program therefor, and storage medium which stores the program
RU2011122801A (ru) * 2008-11-07 2012-12-20 Мицубиси Электрик Корпорейшн Кодер изображения и декодер изображения
JP5270592B2 (ja) 2010-02-23 2013-08-21 日本電信電話株式会社 画像符号化装置,画像符号化方法および画像符号化プログラム
JP5844969B2 (ja) * 2010-12-22 2016-01-20 日本電信電話株式会社 画像復号モジュール、画像符号化装置、画像復号装置、画像復号方法及びプログラム

Also Published As

Publication number Publication date
US9313524B2 (en) 2016-04-12
US20140119449A1 (en) 2014-05-01
JP2014090253A (ja) 2014-05-15

Similar Documents

Publication Publication Date Title
KR102469145B1 (ko) 영상을 부호화 또는 복호화하는 방법 및 장치
US8761254B2 (en) Image prediction encoding device, image prediction decoding device, image prediction encoding method, image prediction decoding method, image prediction encoding program, and image prediction decoding program
KR102032771B1 (ko) 화상 예측 부호화 장치, 화상 예측 부호화 방법, 화상 예측 복호 장치, 및 화상 예측 복호 방법
EP3146719B1 (en) Re-encoding image sets using frequency-domain differences
WO2010001916A1 (ja) 画像処理装置および方法
US20120027092A1 (en) Image processing device, system and method
KR102218696B1 (ko) 영상 변환 부호화/복호화 방법 및 장치
CN104380738A (zh) 图像处理装置及方法
KR101090586B1 (ko) 부호화 장치/복호화 장치, 부호화 방법/복호화 방법 및 기록 매체
JP6151909B2 (ja) 動画像符号化装置、方法およびプログラム
US20180014022A1 (en) Encoding method and apparatus, and decoding method and apparatus
JP2022512088A (ja) ビデオコーディングのための方法、装置、およびプログラム
KR20150099165A (ko) Tsm 율-왜곡 최적화 방법, 그를 이용한 인코딩 방법 및 장치, 그리고 영상 처리 장치
JP6491628B2 (ja) 映像符号化方法、映像符号化装置及び映像符号化プログラム
JP4574444B2 (ja) 画像復号装置及び方法、画像符号化装置及び方法、コンピュータプログラム及び記憶媒体
KR102413038B1 (ko) 예측 화상 보정 장치, 화상 부호화 장치, 화상 복호 장치, 및 프로그램
JP6457248B2 (ja) 画像復号装置、画像符号化装置および画像復号方法
JP6190103B2 (ja) 動画像符号化装置、動画像符号化方法およびプログラム
JP4971817B2 (ja) 画像符号化装置
JP2023525212A (ja) 変換係数に対する符号マップの改善されたエントロピーコーディング
JP6200220B2 (ja) 画像処理装置、符号化装置、復号装置、及びプログラム
JP6066583B2 (ja) 動画像符号化装置及び動画像符号化方法
JP4857152B2 (ja) 直交変換・量子化装置
JP2009049513A (ja) 動画像符号化装置及び動画像符号化方法
JP5247210B2 (ja) 動画像符号化装置及び動画像符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151027

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160913

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170427

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170616

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170804

R151 Written notification of patent or utility model registration

Ref document number: 6190103

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees