JPWO2016194380A1 - 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体 - Google Patents

動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体 Download PDF

Info

Publication number
JPWO2016194380A1
JPWO2016194380A1 JP2017521699A JP2017521699A JPWO2016194380A1 JP WO2016194380 A1 JPWO2016194380 A1 JP WO2016194380A1 JP 2017521699 A JP2017521699 A JP 2017521699A JP 2017521699 A JP2017521699 A JP 2017521699A JP WO2016194380 A1 JPWO2016194380 A1 JP WO2016194380A1
Authority
JP
Japan
Prior art keywords
image
quantization
encoding
unit
quantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017521699A
Other languages
English (en)
Other versions
JP6708211B2 (ja
Inventor
達治 森吉
達治 森吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2016194380A1 publication Critical patent/JPWO2016194380A1/ja
Application granted granted Critical
Publication of JP6708211B2 publication Critical patent/JP6708211B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

安定したレート制御処理が含まれる符号化処理を、演算量を大きく増加させずに高速で実行できる動画像符号化装置を提供する。動画像符号化装置10は、符号化対象画像を構成する画像のデータを、複数の量子化パラメータを使用して量子化パラメータごとにそれぞれ量子化する量子化部11と、複数の量子化された画像のデータを、それぞれ量子化される際に使用された量子化パラメータと対応付けて記憶する記憶部12と、記憶部12から、所定の量子化パラメータを使用して所定の量子化された画像のデータを抽出する抽出部13と、抽出された所定の量子化された画像のデータを符号化する符号化部14と、符号化部14による符号化結果に基づいて、抽出部13が次に所定の量子化された画像のデータを抽出する際に使用される所定の量子化パラメータを決定する決定部15とを備える。

Description

本発明は、符号化処理を高速で実行できる動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記録する記憶媒体に関する。
動画像の圧縮符号化技術が広く普及している。動画像の圧縮符号化技術は、デジタル放送、光学ディスクによる映像コンテンツ頒布、インターネット等を経由した映像配信など、幅広い用途に利用されている。
動画像信号を低ビットレート、高圧縮率かつ高画質で符号化することによって符号化データを生成したり、符号化された動画像を復号化したりする技術には、例えば、ITU(International Telecommunication Union)が標準化したH.261およびH.263がある。また、ISO(International Organization for Standardization)のMPEG(Moving Picture Expert Group)-1、MPEG-2、MPEG-4、SMPTE(Society of Motion Picture and Television Engineers)のVC-1などもある。H.261、H.263、MPEG-1、MPEG-2、MPEG-4、およびVC-1は、国際標準規格の技術として広く用いられている。
また、非特許文献1に記載されている、ITUとISOが共同で規格化を行なったH.264/MPEG-4 AVC(Advanced Video Coding) (以下、H.264という。)も普及している。さらに、2013年に最新の動画像圧縮符号化規格として、非特許文献2に記載されているH.265/MPEG-H HEVC(High Efficiency Video Coding) (以下、H.265という。)が標準化された。H.265は、H.264と同等の映像品質を保ちながら、H.264に比べてデータサイズを半分程度に圧縮できる。H.265は、あらゆる分野に渡って幅広く活用される可能性がある。
上記の動画像符号化技術は、動き補償予測、予測誤差画像の直交変換、直交変換係数の量子化、および量子化された直交変換係数のエントロピー符号化などの、複数の要素技術が組み合わせられて構成される。動画像符号化技術における符号化は、ハイブリッド符号化と呼ばれる。
上記の動画像符号化技術は、動画像の特性の一つである時間軸方向の画像の相関性の高さが使用されるフレーム間予測を行うことによって、動画像の圧縮率を高くする。フレーム間予測では、一般的に時間的に近接する画像間における被写体や背景等の動き、位置ずれを補正することによって予測画像を生成する、動き補償予測の技術が利用される。
予測方式としてフレーム間予測を用いる動画像符号化装置の構成の一例を図11に示す。図11は、一般的な動画像符号化装置の構成例を示すブロック図である。
図11に示す動画像符号化装置100は、減算部101、変換部102、量子化部103、逆量子化部104、逆変換部105、加算部106、フィルタ部107、フレームバッファ108、スキャン部109、エントロピー符号化部110、レート制御部111、および動き予測部112を備える。
動画像符号化装置100に新たな画像が入力されると、動画像符号化装置100は、所定のサイズの画像ブロック単位で符号化処理を行う。
例えば、動画像圧縮符号化方式としてH.264が用いられた場合、動画像符号化装置100は、マクロブロック(MB)と呼ばれる16×16画素のブロック単位で符号化処理を行う。また、動画像圧縮符号化方式としてH.265が用いられた場合、動画像符号化装置100は、コーディングツリーユニット(CTU)と呼ばれる16×16画素、32×32画素、または64×64画素などのブロック単位で符号化処理を行う。
新たな画像が入力されると、動き予測部112は、フレームバッファ108に格納されている符号化済み画像の画像ブロックに対応する、入力画像の画像ブロックの位置変化を検出する。フレームバッファ108には、既に符号化されたフレームの画像データが格納されている。
動き予測部112は、検出した位置変化に相当する動きベクトル情報を求める。また、動き予測部112は、求めた動きベクトル情報に基づいて動き補償予測処理を行い、動き補償予測画像を出力する。
減算部101には、動き予測部112から動き補償予測画像が入力される。次いで、減算部101は、入力画像から動き補償予測画像を減算する。減算部101は、動き補償予測画像を減算することによって得られた画像を予測誤差画像とし、予測誤差画像を出力する。
変換部102には、減算部101から予測誤差画像が入力される。変換部102は、入力された予測誤差画像に対して、DCT(Discrete Cosine Transform)と同様の直交変換処理を行う。変換部102は、直交変換処理を行うことによって変換係数列を生成し、生成された変換係数列を出力する。
例えば、動画像圧縮符号化方式としてH.264が用いられた場合、直交変換処理は、4×4画素または8×8画素のブロック単位で行われる。また、動画像圧縮符号化方式としてH.265が用いられた場合、直交変換処理は、4×4画素、8×8画素、16×16画素、または32×32画素のいずれかのブロック単位で行われる。
なお、変換部102は、DCTと同様の直交変換処理や、Wavelet変換などの他の変換処理を行うことによって予測誤差画像を変換してもよい。また、動画像符号化装置100は、予測誤差画像に対して変換処理を行う変換部を必ずしも備えていなくてもよい。
量子化部103には、変換部102から変換係数列が、レート制御部111から量子化パラメータ(QP)が、それぞれ入力される。量子化部103は、入力された量子化パラメータに基づいて、入力された変換係数列に対して量子化処理を行い、量子化された変換係数列を生成する。量子化部103は、生成された量子化された変換係数列を出力する。
逆量子化部104には、量子化部103から量子化された変換係数列が入力される。逆量子化部104は、入力された量子化された変換係数列に対して逆量子化処理を行い、変換係数列を生成する。逆量子化部104は、生成された変換係数列を出力する。
逆変換部105には、逆量子化部104から変換係数列が入力される。逆変換部105は、入力された変換係数列に対して逆整数変換処理を行い、予測誤差画像を生成する。逆変換部105は、生成された予測誤差画像を出力する。
加算部106には、逆変換部105から予測誤差画像が、動き予測部112から予測画像が、それぞれ入力される。加算部106は、入力された予測誤差画像および予測画像を加算し、加算することによって生成された画像を出力する。
フィルタ部107には、加算部106から予測誤差画像と予測画像が加算された画像が入力される。フィルタ部107は、入力された画像に対してフィルタ処理を行うことによって、ローカルデコード画像を生成する。
フィルタ部107が行うフィルタ処理は、符号化により画像に発生する歪みを軽減する処理である。例えば、動画像圧縮符号化方式としてH.264およびH.265が用いられた場合、フィルタ処理には、デブロックフィルタが用いられる。また、動画像圧縮符号化方式としてH.265が用いられた場合、フィルタ処理には、Sample Adaptive Offsetも用いられる。
フィルタ部107が生成したローカルデコード画像は、フレームバッファ108に格納される。ローカルデコード画像は、後続のフレームの符号化において利用される。
また、スキャン部109には、量子化部103から量子化された変換係数列が入力される。スキャン部109は、入力された量子化された変換係数列に対して所定のスキャン処理を行い、量子化された変換係数列を並び替える。所定のスキャン処理は、例えば、ジグザグスキャンである。スキャン部109は、並び替えられた変換係数列を出力する。
エントロピー符号化部110には、スキャン部109から並び替えられた変換係数列が入力される。エントロピー符号化部110は、入力された並び替えられた変換係数列に対して、所定の規則に従ってエントロピー符号化処理を行い、ビットストリームを生成する。エントロピー符号化部110は、生成されたビットストリームを出力する。
例えば、動画像圧縮符号化方式としてH.264およびH.265が用いられた場合、エントロピー符号化処理には、コンテキスト適応算術符号化(CABAC:Context Adaptive Binary Arithmetic Coding)が使用される。また、動画像圧縮符号化方式としてH.264が用いられた場合、エントロピー符号化処理には、コンテキスト適応可変長符号化(CAVLC: Context-based Adaptive VideoLAN Client)が使用されることもある。
レート制御部111には、エントロピー符号化部110からビットストリームが入力される。レート制御部111は、入力されたビットストリームの統計情報に基づいて、後続のブロックの量子化に用いられる量子化パラメータを算出する。
レート制御部111が使用するビットストリームの統計情報は、例えばブロックごとの符号量、またはコンテキストごとの符号量である。量子化パラメータ算出処理の具体的な処理内容は、例えば、非特許文献3または非特許文献4に記載されている。
例えば、動画像符号化装置100は、出力するビットストリームのビットレートが指定され、指定されたビットレートに合致するようにレートを制御することを求められることが多い。レート制御部111は、指定されたビットレートに合致するようにレートを制御するレート制御処理を行う。
例えば、H.265における具体的なレート制御処理の内容が、非特許文献4に記載されている。非特許文献4に記載されているレート制御処理では、各画像フレームの重要度などに基づいて各フレームのターゲットビット数(TCurrPic)が算出される。フレームの符号化処理では、フレームのビット数がTCurrPicに合致するようにフィードバック制御が行われる。
すなわち、所定のCTUが符号化される際、既に符号済みのCTU群において発生したビット数がTCurrPicから差し引かれる。差し引かれた後のTCurrPicの残りのビット数は、未符号化のCTU群に配分される。各CTUに割り当てられたビット数に基づいて、CTUの量子化処理で用いられる量子化パラメータが算出される。
上記のように、動画像符号化装置では、動き予測処理、変換処理、量子化処理、逆量子化処理、逆変換処理、フィルタ処理の一連の画像処理および信号処理が、多数の画像に対して行われる。すなわち、一般的に動画像符号化処理の実行には、膨大な演算量が求められる。
よって、汎用プロセッサがソフトウェアを制御することによって動画像符号化処理が行われる場合、高い動作周波数で動作するプロセッサが求められる。高い動作周波数で動作するプロセッサが使用されると、コストや消費電力が増大する課題が生じる。
また、高い動作周波数で動作するプロセッサは、入力された動画像を入力と同時に処理するだけの演算能力を有していないことが多い。よって、高い動作周波数で動作するプロセッサが解像度の高い動画像を入力と同時に処理する場合、処理時間が長くなるという課題が生じる。
符号化処理が専用ハードウェアで行われる場合においても高速に動作する演算回路が求められ、結局コストや消費電力が増大する課題が生じる。また、高速に動作する演算回路を用いるとハードウェア設計が複雑になり、開発期間が延びる可能性が高い。
上記の課題を解決するため、汎用プロセッサに加え、動画像符号化処理に適した構造の他のプロセッサや演算回路等をアクセラレータとして利用することによって、画像処理や信号処理を、高効率かつ高速で実行する技術が開発されている。
アクセラレータとして、例えば、GPU(Graphics Processing Unit)が用いられる。また、DSP(Digital Signal Processor)やFPGA(Field Programmable Gate Array)がアクセラレータとして利用されてもよい。
GPUは、本来3次元グラフィックス処理に利用されるプロセッサである。しかし、GPUは、数百基から数千基のプロセッサコアが集積された大規模な並列プロセッサの構造をとる。よって、GPUは、GPUの特性に適合する処理であれば、汎用のプロセッサと比較して数倍〜数十倍速く処理を実行できる。
一般的に、図11に示す動画像符号化装置100の動き予測部112が行う、動きベクトル探索処理に係る演算量は多い。よって、動き予測部112がGPUなどで実現されると、CPUで実現された場合に比べて、動きベクトル探索処理が速く実行される。
また、変換処理、量子化処理、スキャン処理などの処理に係る演算量も多い。また、量子化処理として、例えば非特許文献4に記載されている適応QP選択処理やRD最適量子化処理などが含まれた、より高度で複雑な量子化処理が実行されると、量子化処理に係る演算量はさらに増加する。
実行に求められる演算量が多い変換処理、量子化処理、およびスキャン処理を、GPUを用いて並列に実行する効率的な技術が特許文献1に記載されている。
特許文献1に記載されている情報処理装置は、変換処理、量子化処理、およびスキャン処理をGPUで並列に実行する。次いで、GPUは、並列処理の処理結果である中間データを汎用プロセッサであるCPUに入力する。CPUは、中間データに対して可逆圧縮処理を行う。可逆圧縮処理は、図11に示すエントロピー符号化部110が行うエントロピー符号化処理に相当する。
上記のように、特許文献1に記載されている情報処理装置は、実行する処理を、GPUとCPUに分散して割り当てる。具体的には、各ブロックに対する所定の演算を並列に実行可能な変換処理、量子化処理、およびスキャン処理は、並列計算が得意なGPUに割り当てられる。また、圧縮後のデータサイズが変動的で並列実行が困難な可逆圧縮処理は、複雑なビット解析などが得意なCPUに割り当てられる。GPUとCPUの各特性に合わせて処理が割り当てられると、装置全体としての処理の実行の効率性が高まる。
国際公開WO2014/167609号公報 特許第2871139号明細書 特許第2502898号明細書 特開2006−121538号公報 国際公開第2010/041488号
ITU-T Recommendation H.264,"Advanced video coding for generic audiovisual services",2010年3月 ITU-T Recommendation H.265,"Advanced video coding for generic audiovisual services",2013年4月 Joint Video Team (JVT) of ISO/IEC MPEG and ITU-T VCEG,Document JVT-O079,"Text Description of Joint Mode Reference Encoding Method and Decoding Concealment Method",2005年4月 Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,Document JCTVC-S1002,"High Efficiency Video Coding (HEVC) Test Model 16 (HM 16) Improved Encoder Description",2014年10月
特許文献1に記載されている情報処理装置における問題点は、フレーム内のレート制御処理が実現されないことである。情報処理装置におけるGPUは、複数のブロックに対する量子化処理を並列に実行し、実行結果をCPUに入力する。CPUは、量子化された複数のブロックに対するエントロピー符号化処理を実行する。
しかし、フレーム内のレート制御処理では、上記のようにフレーム内の符号化済みブロックにおける発生ビット数に応じて量子化パラメータが調整され、調整された量子化パラメータが次の量子化処理で用いられるようにフィードバックされることが求められる。
特許文献1に記載されている情報処理装置などでは、CPUによるエントロピー符号化処理よりも前に、GPUによる量子化処理が並列に実行される。すなわち、全ての量子化処理が完了してから符号化処理が開始されるため、特許文献1に記載されている情報処理装置は、上記のように制御されたレートを量子化処理にフィードバックできない。
制御されたレートが量子化処理にフィードバックされないと、フレームの発生ビット数がターゲットビット数に収束せず不安定になる。フレームの発生ビット数が不安定になると、フレーム間の画質の変動などによる画質低下や、フレームの発生ビット数のフレームあたりの上限ビット数の超過などの、ユーザが意図しない動作が引き起こされるおそれがある。
特許文献2および特許文献3には、他の符号化装置が記載されている。特許文献2に記載されている符号化装置は、量子化処理の並列実行とフレーム内のレート制御を両方実現するために、2パス処理を行う。
具体的には、特許文献2に記載されている符号化装置は、フレームの符号化処理を2回実行する。1回目の符号化処理(第1パス)では、符号化装置は、暫定的な量子化パラメータを用いてフレームの符号化処理を行い、フレーム内の符号化済みブロックにおける発生ビット数の情報を記録する。
2回目の符号化処理(第2パス)では、符号化装置は、第1パスで用いられた暫定的な量子化パラメータと、第1パスで得られた発生ビット数の関係から適切な量子化パラメータを推定する。
符号化装置は、推定された量子化パラメータを用いて、再度フレームの符号化処理を行う。また、符号化装置は、発生ビット数の上限ビット数の超過を防ぐため、並列に符号化を実行する対象の領域ごとに、高周波係数を強制的に打ち切る処理も実行できる。
特許文献2に記載されている符号化装置における問題点は、符号化が2回実行されるため、処理に係る演算量が2倍に増大することである。また、並列に符号化が実行される対象の領域ごとに高周波係数が打ち切られると、フレーム全体としてビット数超過が発生しない場合でも、特定領域で係数が打ち切られる可能性がある。特定領域で係数が打ち切られると、本来であれば不要な画質低下が発生する。
特許文献3に記載されている符号化装置は、符号化済みのフレームにおける量子化パラメータと発生ビット数の関係の履歴情報や、画像の複雑度分布解析などの情報に基づいて、符号化中のフレームの発生ビット数を予測する。符号化装置は、予測された発生ビット数に基づいて量子化パラメータを制御する。
特許文献3に記載されている符号化装置における問題点は、制御に使用される発生ビット数が予測値であるため、発生ビット数の予測の誤差が大きくなると、レート制御が不安定になることである。例えば、処理中のフレームの画像の性質が、過去に処理されたフレームの画像の性質から大きく変化すると、発生ビット数の予測の誤差が大きくなる。
上記のように、特許文献2および特許文献3に記載されている符号化装置は、量子化処理の並列実行とフレーム内のレート制御を両方実現できる。しかし、特許文献2および特許文献3に記載されている符号化装置が使用された場合、処理に係る演算量が増加するという問題や、レート制御が安定しないという問題が生じる。
そこで、本発明は、安定したレート制御処理が含まれる符号化処理を、演算量を大きく増加させずに高速で実行できる動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体を提供することを目的とする。
本発明による動画像符号化装置は、符号化対象画像を構成する画像のデータを、複数の量子化パラメータを使用して量子化パラメータごとにそれぞれ量子化する量子化部と、複数の量子化された画像のデータを、それぞれ量子化される際に使用された量子化パラメータと対応付けて記憶する記憶部と、記憶部から、所定の量子化パラメータを使用して所定の量子化された画像のデータを抽出する抽出部と、抽出された所定の量子化された画像のデータを符号化する符号化部と、符号化部による符号化結果に基づいて、抽出部が次に所定の量子化された画像のデータを抽出する際に使用される所定の量子化パラメータを決定する決定部とを備えることを特徴とする。
本発明による動画像符号化方法は、符号化対象画像を構成する画像のデータを、複数の量子化パラメータを使用して量子化パラメータごとにそれぞれ量子化し、複数の量子化された画像のデータを、それぞれ量子化される際に使用された量子化パラメータと対応付けて記憶し、記憶された複数の量子化された画像のデータから、所定の量子化パラメータを使用して所定の量子化された画像のデータを抽出し、抽出された所定の量子化された画像のデータを符号化し、符号化結果に基づいて、次に所定の量子化された画像のデータが抽出される際に使用される所定の量子化パラメータを決定することを特徴とする。
本発明による記録媒体は、コンピュータに、符号化対象画像を構成する画像のデータを、複数の量子化パラメータを使用して量子化パラメータごとにそれぞれ量子化する量子化処理、複数の量子化された画像のデータを、それぞれ量子化される際に使用された量子化パラメータと対応付けて記憶する記憶処理、記憶された複数の量子化された画像のデータから、所定の量子化パラメータを使用して所定の量子化された画像のデータを抽出する抽出処理、抽出された所定の量子化された画像のデータを符号化する符号化処理、および符号化処理による符号化結果に基づいて、次に所定の量子化された画像のデータが抽出される際に使用される所定の量子化パラメータを決定する決定処理を実行させることを特徴とする動画像符号化プログラムを記憶する。
本発明によれば、安定したレート制御処理が含まれる符号化処理を、演算量を大きく増加させずに高速で実行できる。
本発明による動画像符号化装置の第1の実施形態の構成例を示すブロック図である。 第1の実施形態の動画像符号化装置100による符号化処理全体の動作を示すフローチャートである。 本発明による動画像符号化装置の第2の実施形態の構成例を示すブロック図である。 第2の実施形態の動画像符号化装置100による符号化処理全体の動作を示すフローチャートである。 本発明による動画像符号化装置の第3の実施形態の構成例を示すブロック図である。 第3の実施形態の動画像符号化装置100による符号化処理全体の動作を示すフローチャートである。 本発明による動画像符号化装置の第4の実施形態の構成例を示すブロック図である。 第4の実施形態の動画像符号化装置100による符号化処理全体の動作を示すフローチャートである。 本発明による動画像符号化装置の機能を実現可能な情報処理装置の構成例を示すブロック図である。 本発明による動画像符号化装置の概要を示すブロック図である。 一般的な動画像符号化装置の構成例を示すブロック図である。
実施形態1.
[構成の説明]
以下、本発明の実施形態を、図面を参照して説明する。図1は、本発明による動画像符号化装置の第1の実施形態の構成例を示すブロック図である。
図1に示すように、本実施形態における動画像符号化装置100は、図11に示す動画像符号化装置100と比較して、複数量子化部200、中間情報バッファ201、および選択部202が含まれている点が異なる。複数量子化部200、中間情報バッファ201、および選択部202以外の図1に示す動画像符号化装置100の構成は、図11に示す動画像符号化装置100の構成と同様である。
複数量子化部200は、変換部102から入力される変換係数列に対して、2種類以上の複数の量子化パラメータを用いて量子化処理を行う機能を有する。
複数量子化部200は、入力された変換係数列を、種類が異なる量子化パラメータごとに量子化する。量子化した後、複数量子化部200は、複数の量子化された変換係数列を、各量子化処理において使用された量子化パラメータと対応付けて中間情報バッファ201に格納する。
中間情報バッファ201は、量子化された変換係数列を、変換係数列が量子化された際に使用された量子化パラメータと対応付けて記憶する機能を有する。
選択部202は、レート制御部111から入力される量子化パラメータを使用して、所定の量子化された変換係数列を、中間情報バッファ201に記憶されている量子化された変換係数列の中から選択して出力する機能を有する。
複数量子化部200は、H.264やH.265等の規格において選択可能な全ての量子化パラメータを用いて量子化処理を実行できる。例えば、H.264やH.265の規格では、0〜51の52通りの量子化パラメータが利用される。
よって、複数量子化部200は、0〜51のそれぞれの量子化パラメータに対応する52通りの量子化処理を実行できる。複数量子化部200は、量子化された変換係数列と量子化処理に使用された量子化パラメータとを対応付けて、中間情報バッファ201に格納する。
上記の例では、レート制御部111から入力される量子化パラメータに基づいて量子化された変換係数列が、中間情報バッファ201に必ず記憶されている。選択部202は、レート制御部111から入力される量子化パラメータと対応付けられて記憶されている量子化された変換係数列を選択して出力する。
また、複数量子化部200は、選択可能な全ての量子化パラメータを用いずに、例えば、1つ置きに量子化パラメータ(0、2、4、8、…など)を用いて量子化処理を実行してもよい。また、複数量子化部200は、2つ置きに量子化パラメータ(0、3、6、9、…など)を用いて量子化処理を実行してもよい。
また、複数量子化部200は、所定の量子化パラメータを中心とする所定の範囲内の複数の量子化パラメータを用いて量子化処理を実行してもよい。例えば、複数量子化部200は、量子化パラメータ30を中心とし、中心から+4を上限、中心から−4を下限とする範囲内の複数の量子化パラメータを用いてもよい。
例えば、1つ置きに量子化パラメータを用いる場合、複数量子化部200は、(26、28、30、32、34)の5つの量子化パラメータを用いて5通りの量子化処理を実行する。中心とされる量子化パラメータには、フレームの目標ビット数などの情報から算出された値が設定されてもよい。
複数量子化部200が用いる量子化パラメータは上記の例に限定されず、複数量子化部200は、様々なパターンの量子化パラメータを利用できる。また、複数量子化部200は、上述した量子化パラメータの選択手順以外にも、種々の選択手順を利用できる。
複数量子化部200が選択可能な全ての量子化パラメータを用いて量子化処理を実行しない場合、レート制御部111から入力される量子化パラメータに基づいて量子化された変換係数列が、中間情報バッファ201に記憶されていない可能性がある。
上記の場合、入力される量子化パラメータに基づいて量子化された変換係数列が記憶されていれば、選択部202は、入力される量子化パラメータに対応する変換係数列を抽出する。入力される量子化パラメータに基づいて量子化された変換係数列が記憶されていなければ、選択部202は、他の量子化された変換係数列を抽出してもよい。例えば、選択部202は、中間情報バッファ201に記憶されている変換係数列のうち、入力される量子化パラメータに値が最も近い量子化パラメータに基づいて量子化された変換係数列を抽出してもよい。
なお、選択部202がレート制御部111から入力される量子化パラメータと異なる量子化パラメータに対応する変換係数列を選択すると、量子化パラメータを決定する際にレート制御部111が割り当てたビット数と出力ビット数との間に誤差が発生する可能性がある。しかし、誤差が発生しても、次回以降の画像ブロックの符号化で誤差が発生しないように直ちにフィードバックされるため、フレーム全体では安定したレート制御が実現される。
以上により、レート制御部111は、図11に示す動画像符号化装置100と同様のフィードバック制御を実施できる。すなわち、本実施形態における動画像符号化装置も、安定したレート制御を実現できる。
[動作の説明]
以下、本実施形態の動画像符号化装置100の動作を図2を参照して説明する。図2は、第1の実施形態の動画像符号化装置100による符号化処理全体の動作を示すフローチャートである。
処理が開始されると、動画像符号化装置100は、フレーム内の各画像ブロックに対して量子化処理を実行する。動画像符号化装置100は、フレーム内の全画像ブロックに対して量子化処理が完了したか否かを確認する(ステップS101)。
フレーム内の全画像ブロックのうち量子化処理が完了していない画像ブロックがある場合(ステップS101におけるNo)、動き予測部112は、まだ量子化されていない対象の画像ブロックに対して動き補償予測処理を行い、動き補償予測画像を出力する。
次いで、減算部101は、入力画像から動き補償予測画像を減算する減算処理を行い、予測誤差画像を出力する。次いで、変換部102は、入力された予測誤差画像に対して変換処理を行い、変換係数列を出力する(ステップS102)。
次いで、複数量子化部200は、複数の量子化パラメータを用いて、変換係数列に対して量子化処理を複数回行う(ステップS103)。複数量子化部200は、量子化処理で生成された複数の量子化された変換係数列を、中間情報バッファ201に格納する。格納された後、動画像符号化装置100は、再度ステップS101の処理を行う。
フレーム内の全画像ブロックに対して量子化処理が完了した場合(ステップS101におけるYes)、動画像符号化装置100は、フレーム内の全画像ブロックに対して符号化処理が完了したか否かを確認する(ステップS104)。ステップS104の処理が実行される時点で、中間情報バッファ201には、フレーム内の画像ブロックに対応する量子化された変換係数列の情報が、フレーム内の全画像ブロック分記憶されている。
フレーム内の全画像ブロックのうち符号化処理が完了していない画像ブロックがある場合(ステップS104におけるNo)、選択部202は、まだ符号化されていない対象の画像ブロックに対応する量子化された変換係数列のうち、求められた量子化された変換係数列を中間情報バッファ201から選択する(ステップS105)。
求められた量子化された変換係数列は、例えば、レート制御部111から入力された量子化パラメータに基づいて量子化された変換係数列である。選択部202は、選択した量子化された変換係数列を出力する。
次いで、逆量子化部104は、入力された量子化された変換係数列に対して逆量子化処理を行い、変換係数列を出力する。次いで、逆変換部105は、入力された変換係数列に対して逆変換処理を行い、予測誤差画像を出力する。
次いで、加算部106は、入力された予測誤差画像と予測画像を加算する加算処理を行い、画像を出力する。次いで、フィルタ部107は、入力された画像に対してフィルタ処理を行い、ローカルデコード画像を生成する。フィルタ部107は、生成されたローカルデコード画像を、フレームバッファ108に格納する。
また、スキャン部109は、入力された量子化された変換係数列に対してスキャン処理を行い、並び替えられた変換係数列を出力する。次いで、エントロピー符号化部110は、入力された並び替えられた変換係数列に対してエントロピー符号化処理を行い、ビットストリームを出力する(ステップS106)。
次いで、レート制御部111は、ステップS106において出力されたビットストリームの情報を用いて、レート制御の内容を更新する(ステップS107)。
具体的には、レート制御部111は、例えば符号化された画像ブロックにおいて発生したビット数の情報を用いて、次回以降に符号化される画像ブロックに割り当てられるビット数、および選択部202に入力される量子化パラメータの情報を更新する。更新された後、動画像符号化装置100は、再度ステップS104の処理を行う。
全画像ブロックに対してステップS105〜S107の処理が終了すると、1フレームに対する符号化処理が完了する。フレーム内の全画像ブロックに対して符号化処理が完了した場合(ステップS104におけるYes)、動画像符号化装置100は、符号化処理全体を終了する。
なお、上記ではステップS102〜S103の処理が画像ブロックごとに順番に実行されると説明したが、ステップS102〜S103の処理は、複数の画像ブロックに対してそれぞれ並列に実行されてもよい。
本実施形態の動画像符号化装置は、複数量子化部200が複数の量子化パラメータを用いて量子化処理を複数回行うため、量子化処理に係る演算量は増加する。しかし、特許文献2に記載されている符号化処理全体を2回実行する方式に比べると、処理全体に係る演算量の増加量は小さい。
また、複数の量子化パラメータが用いられる複数の量子化処理は、並列に実行されてもよい。すなわち、特許文献1に記載されているように、GPUなどの並列処理に強いアクセラレータは、変換処理、量子化処理などを並列に実行できる。GPUが複数の画像ブロックに対する処理を並列に実行する場合、CPUが1ブロックずつ処理を実行する場合に比べて高速に処理が実行される。よって、本実施形態の動画像符号化装置は、GPU等を用いることによって、容易に複数の量子化処理を高速で実行できる。
また、GPU以外にも、複数のCPU、パーソナルコンピュータ(PC)クラスタ、FPGA、または専用LSI(Large Scale Integration)回路などが、並列処理により複数の量子化処理を高速で実行するアクセラレータとして利用されてもよい。従って、本実施形態の動画像符号化装置は、変換処理、量子化処理などを並列計算が得意なGPU等に割り当てることによって高速処理を実現し、かつ符号化結果をフィードバックすることによって安定したレート制御を実現する。
本実施形態の動画像符号化装置は、量子化処理に係る演算量の増加量を増大させることなく、符号化処理の高速な実行と安定したレート制御を共に実現できる。その理由は、中間情報バッファが複数の量子化パラメータそれぞれに基づいて量子化された変換係数列を記憶し、選択部がレート制御部により決定される符号化結果に基づいた量子化パラメータに対応する変換係数列を中間情報バッファから抽出する。
すなわち、動画像符号化装置はレート制御部が決定した量子化パラメータに基づいて量子化処理を再度実行する必要がないため、実行されない量子化処理分だけ処理全体が速く実行されるからである。また、抽出された変換係数列をエントロピー符号化部が符号化し、複数の画像ブロックに対して処理が繰り返し実行されるため、フレーム全体では安定したレート制御が実現されるからである。
実施形態2.
[構成の説明]
次に、本発明の第2の実施形態を、図面を参照して説明する。図3は、本発明による動画像符号化装置の第2の実施形態の構成例を示すブロック図である。
図3に示すように、本実施形態における動画像符号化装置100は、図1に示す動画像符号化装置100と比較して、量子化部103が含まれている点と、選択部202の代わりに選択部212が含まれている点が異なる。量子化部103および選択部212以外の図3に示す動画像符号化装置100の構成は、図1に示す動画像符号化装置100の構成と同様である。
量子化部103は、図11に示す量子化部103と同様の機能を有する。ただし、本実施形態における量子化部103は、複数量子化部200がレート制御部111から入力される量子化パラメータを用いて量子化処理を実行していなかった場合に動作する。よって、複数量子化部200が量子化処理に用いる量子化パラメータの数が増えると、複数量子化部200による量子化処理に係る演算量は増加し、量子化部103が量子化処理を実行する可能性は低くなる。
上記のように、複数量子化部200による複数の量子化処理は、並列に実行される。例えば、複数量子化部200がGPUで、量子化部103がCPUで実現されるようにそれぞれ構成された場合を考える。GPUとCPUの演算能力の比率に基づいて複数量子化部200が量子化処理に用いる量子化パラメータの数を調整することによって、GPUとCPUの双方がバランスよく稼動され、効率良く符号化処理全体が実行される。
本実施形態における選択部212は、レート制御部111から入力される量子化パラメータに基づいて量子化された変換係数列が中間情報バッファ201に記憶されていない場合、量子化部103を動作させる。
選択部212は、レート制御部111から入力される量子化パラメータを用いて変換係数列を量子化するように量子化部103を動作させる。次いで、選択部212は、量子化部103で量子化された変換係数列を選択し、出力する。
なお、レート制御部111から入力される量子化パラメータに基づいて量子化された変換係数列が中間情報バッファ201に記憶されている場合、選択部212は、第1の実施形態の選択部202と同様に、中間情報バッファ201から対応する変換係数列を抽出する。よって、本実施形態における選択部212は、常にレート制御部111から入力される量子化パラメータに基づいて量子化された変換係数列を出力できる。
[動作の説明]
以下、本実施形態の動画像符号化装置100の動作を図4を参照して説明する。図4は、第2の実施形態の動画像符号化装置100による符号化処理全体の動作を示すフローチャートである。
ステップS201〜S204の処理は、図2に示す第1の実施形態のステップS101〜S104の処理と同様であるため、説明を省略する。
フレーム内の全画像ブロックのうち符号化処理が完了していない画像ブロックがある場合(ステップS204におけるNo)、選択部212は、まだ符号化されていない対象の画像ブロックに対応する量子化された変換係数列のうち、求められた量子化された変換係数列を中間情報バッファ201から選択する(ステップS205)。
レート制御部111から入力される量子化パラメータに基づいて量子化された変換係数列が中間情報バッファ201に記憶されている時、選択部212は、対応する変換係数列を選択し、出力する。
レート制御部111から入力される量子化パラメータに基づいて量子化された変換係数列が中間情報バッファ201に記憶されていない時、選択部212は、入力される量子化パラメータを用いて変換係数列を量子化するように量子化部103を動作させる。次いで、選択部212は、量子化部103で量子化された変換係数列を選択し、出力する。
ステップS206〜S207の処理は、図2に示す第1の実施形態のステップS106〜S107の処理と同様であるため、説明を省略する。
本実施形態の動画像符号化装置は、GPUとCPUなどの異なるプロセッサや演算処理装置の各能力が活用された量子化処理を実現できる。また、動画像符号化装置は、符号化結果をフィードバックすることによって、安定したレート制御も実現できる。
また、本実施形態の動画像符号化装置は、複数量子化部200が量子化処理に使用していない量子化パラメータを使用して量子化部103が量子化処理を実行できるため、レート制御部111から入力される量子化パラメータに基づいて量子化された変換係数列を必ず符号化できる。
実施形態3.
[構成の説明]
次に、本発明の第3の実施形態を、図面を参照して説明する。図5は、本発明による動画像符号化装置の第3の実施形態の構成例を示すブロック図である。
図5に示すように、本実施形態における動画像符号化装置100は、図1に示す動画像符号化装置100と比較して、複数量子化部200の代わりに複数量子化スキャン部210が含まれている点が異なる。また、中間情報バッファ201の代わりに中間情報バッファ211が含まれている点と、選択部202の代わりに選択部222が含まれている点が異なる。また、スキャン部109が含まれていない点が異なる。
複数量子化スキャン部210、中間情報バッファ211、および選択部222以外の図5に示す動画像符号化装置100の構成は、図1に示す動画像符号化装置100の構成と同様である。
複数量子化スキャン部210は、複数の量子化パラメータを用いて複数の量子化処理を行った後、量子化された変換係数列に対してスキャン処理を行う。複数量子化スキャン部210が行うスキャン処理は、第1の実施形態および第2の実施形態のスキャン部109が行うスキャン処理と同様である。
複数量子化スキャン部210は、量子化された変換係数列、および量子化された変換係数列のスキャン処理結果を、量子化処理で使用された量子化パラメータと対応付けて中間情報バッファ211に格納する。本実施形態において中間情報バッファ211は、量子化された変換係数列に加えて、量子化された変換係数列のスキャン処理結果を記憶する。
選択部222は、レート制御部111から入力される量子化パラメータに基づいて量子化された変換係数列、および量子化された変換係数列のスキャン処理結果を、中間情報バッファ211から抽出する。抽出されるスキャン処理結果は、抽出される量子化された変換係数列と対応付けられて中間情報バッファ211に記憶されているスキャン処理結果である。
選択部222は、抽出された量子化された変換係数列を逆量子化部104に入力する。また、選択部222は、抽出されたスキャン処理結果をエントロピー符号化部110に入力する。
[動作の説明]
以下、本実施形態の動画像符号化装置100の動作を図6を参照して説明する。図6は、第3の実施形態の動画像符号化装置100による符号化処理全体の動作を示すフローチャートである。
ステップS301〜S302の処理は、図2に示す第1の実施形態のステップS101〜S102の処理と同様であるため、説明を省略する。
複数量子化スキャン部210は、複数の量子化パラメータを用いて、変換係数列に対して量子化処理を複数回行う。次いで、複数量子化スキャン部210は、量子化処理で生成された複数の量子化された変換係数列に対して、スキャン処理を行う(ステップS303)。
スキャン処理を行った後、複数量子化スキャン部210は、量子化された変換係数列と、量子化された変換係数列のスキャン処理結果を中間情報バッファ211に格納する。格納された後、動画像符号化装置100は、再度ステップS301の処理を行う。
ステップS304の処理は、図2に示す第1の実施形態のステップS104の処理と同様であるため、説明を省略する。
フレーム内の全画像ブロックのうち符号化処理が完了していない画像ブロックがある場合(ステップS304におけるNo)、選択部222は、まだ符号化されていない対象の画像ブロックに対応する量子化された変換係数列のうち、求められた量子化された変換係数列を中間情報バッファ211から選択する。
また、選択部222は、中間情報バッファ211に記憶されている、選択された量子化された変換係数列のスキャン処理結果を選択する(ステップS305)。選択部222は、選択された量子化された変換係数列および量子化された変換係数列のスキャン処理結果を出力する。
ステップS306〜S307の処理は、図2に示す第1の実施形態のステップS106〜S107の処理と同様であるため、説明を省略する。
本実施形態の映像符号化装置は、複数の量子化パラメータに基づいて量子化された複数の変換係数列に対するスキャン処理も先に実行できる。よって、本実施形態の映像符号化装置は、GPUが量子化処理とスキャン処理を並列に実行することなどによって、第1の実施形態の映像符号化装置よりもさらに高速で符号化処理全体を実施できる。
実施形態4.
[構成の説明]
次に、本発明の第4の実施形態を、図面を参照して説明する。図7は、本発明による動画像符号化装置の第4の実施形態の構成例を示すブロック図である。
第1の実施形態から第3の実施形態の動画像符号化装置は、動き補償予測が用いられるフレーム間予測のみを使用して符号化処理(インター符号化)を行う。しかし、H.264およびH.265では、インター符号化とは別に、画面内の近隣画素の情報を用いて予測画像を生成し符号化するイントラ符号化も利用される。本実施形態の動画像符号化装置は、インター符号化およびイントラ符号化の両方の符号化を実施できる。
図7に示すように、本実施形態における動画像符号化装置100は、図3に示す動画像符号化装置100と比較して、減算部101−2が含まれている点と、変換部102−2が含まれている点と、画面内予測部203が含まれている点と、イントラ/インター切替部204が含まれている点が異なる。また、選択部212の代わりに選択部232が含まれている点が異なる。
減算部101−2、変換部102−2、画面内予測部203、イントラ/インター切替部204および選択部232以外の図7に示す動画像符号化装置100の構成は、図3に示す動画像符号化装置100の構成と同様である。
画面内予測部203には、フィルタ処理が行われる前のローカルデコード画像が入力される。画面内予測部203は、入力されたローカルデコード画像に対して画面内予測処理を行い、画面内予測処理で生成された画面内予測画像を出力する。
イントラ/インター切替部204は、指定された符号化モードに基づいて、画面内予測画像または動き補償予測画像のいずれかの画像を選択し、選択した画像を出力する。イントラ符号化モードが指定された場合、イントラ/インター切替部204は、画面内予測画像を出力する。インター符号化モードが指定された場合、イントラ/インター切替部204は、動き補償予測画像を出力する。
減算部101−2には、イントラ符号化モードが指定された場合、画面内予測部203から画面内予測画像が入力される。次いで、減算部101−2は、入力画像から画面内予測画像を減算する。減算部101−2は、画面内予測画像を減算することによって得られた画像を予測誤差画像とし、予測誤差画像を出力する。
変換部102−2は、イントラ符号化モードが指定された場合、入力された予測誤差画像に対して変換処理を行い、変換係数列を出力する。
量子化部103は、イントラ符号化モードが指定された場合、変換部102−2から入力された変換係数列に対して量子化処理を行い、量子化された変換係数列を出力する。
選択部232は、インター符号化モードが指定された場合、第1の実施形態の選択部202と同様に動作する。イントラ符号化モードが指定された場合、選択部232は、量子化部103から入力された量子化された変換係数列を選択し、出力する。
イントラ符号化モードで符号化する場合、動画像符号化装置100は、近隣画像ブロックのローカルデコード画像情報を利用する。すなわち、イントラ符号化モードにおいて、動画像符号化装置100は、インター符号化モードにおける複数のブロックに対する動き予測処理や量子化処理のような処理に対して実行可能な並列処理を実行できない。
しかし、一般的に動画像符号化処理では、符号化対象の画像ブロックのうち、多くの画像ブロックがインター符号化モードで符号化される。よって、イントラ符号化とインター符号化の両方の符号化を実施可能な動画像符号化装置がインター符号化の処理だけでもGPU等を用いて高速に実行できることは、大きな効果を奏する。
[動作の説明]
以下、本実施形態の動画像符号化装置100の動作を図8を参照して説明する。図8は、第4の実施形態の動画像符号化装置100による符号化処理全体の動作を示すフローチャートである。
ステップS401〜S404の処理は、図2に示す第1の実施形態のステップS101〜S104の処理と同様であるため、説明を省略する。
フレーム内の全画像ブロックのうち符号化処理が完了していない画像ブロックがある場合(ステップS404におけるNo)、選択部232は、指定された符号化モードがイントラ符号化モードであるか否かを確認する(ステップS405)。
指定された符号化モードがイントラ符号化モードである場合(ステップS405におけるYes)、変換部102−2は、画面内予測部203から入力された画面内予測画像に対して変換処理を行い、変換係数列を出力する(ステップS406)。
次いで、量子化部103は、変換部102−2から入力された変換係数列に対して量子化処理を行い、量子化された変換係数列を出力する(ステップS407)。次いで、選択部232は、量子化部103から入力された量子化された変換係数列を選択し、出力する(ステップS408)。
指定された符号化モードがイントラ符号化モードでなくインター符号化モードである場合(ステップS405におけるNo)、選択部232は、求められた量子化された変換係数列を中間情報バッファ201から選択する(ステップS408)。
ステップS409〜S410の処理は、図2に示す第1の実施形態のステップS106〜S107の処理と同様であるため、説明を省略する。
本実施形態の動画像符号化装置は、インター符号化方式とイントラ符号化方式の両方の符号化方式に対応できる。また、本実施形態の動画像符号化装置は、第1の実施形態〜第3の実施形態と同様、インター符号化において、高速処理と安定したレート制御の両方を実現できる。
上記の各実施形態の動画像符号化装置は、H.264またはH.265に従って符号化を実施する。本発明による動画像符号化装置は、VC-1等の、H.264またはH.265の符号化方式以外の符号化方式や、国際標準の動画像符号化方式等に含まれない符号化方式に従って符号化を実施してもよい。
また、上記の各実施形態の動画像符号化装置は、動き補償予測や画面内予測を用いて符号化を実施する。本発明による動画像符号化装置は、動き補償予測や画面内予測以外の予測方式を用いて符号化を実施してもよい。また、本発明による動画像符号化装置は、予測方式を用いずに符号化を実施してもよい。
また、上記の各実施形態を、ハードウェアで構成することも可能であるが、例えば記録媒体に記録されたコンピュータプログラムにより実現することも可能である。
図9に示す情報処理装置は、プロセッサ1001、プログラムメモリ1002、映像データを格納するための記憶媒体(記録媒体)1003、およびビットストリーム等のデータを格納するための記憶媒体1004を備える。記憶媒体1003と記憶媒体1004とは、別個の記憶媒体であってもよいし、同一の記憶媒体からなる記憶領域であってもよい。記憶媒体として、ハードディスク等の磁気記憶媒体を用いることができる。記憶媒体1003において、少なくともプログラムが記憶される領域は、一時的でない有形な記憶領域(non-transitory tangible media )である。
図9に示された情報処理装置において、プログラムメモリ1002には、図1、図3、図5、および図7のそれぞれに示された各ブロックの機能を実現するためのプログラムが格納される。そして、プロセッサ1001は、プログラムメモリ1002に格納されているプログラムに従って処理を実行することによって、図1、図3、図5、および図7のそれぞれに示された動画像符号化装置の機能を実現する。
次に、本発明の概要を説明する。図10は、本発明による動画像符号化装置の概要を示すブロック図である。本発明による動画像符号化装置10は、符号化対象画像を構成する画像のデータを、複数の量子化パラメータを使用して量子化パラメータごとにそれぞれ量子化する量子化部11(例えば、複数量子化部200)と、複数の量子化された画像のデータを、それぞれ量子化される際に使用された量子化パラメータと対応付けて記憶する記憶部12(例えば、中間情報バッファ201)と、記憶部12から、所定の量子化パラメータを使用して所定の量子化された画像のデータを抽出する抽出部13(例えば、選択部202)と、抽出された所定の量子化された画像のデータを符号化する符号化部14(例えば、エントロピー符号化部110)と、符号化部14による符号化結果に基づいて、抽出部13が次に所定の量子化された画像のデータを抽出する際に使用される所定の量子化パラメータを決定する決定部15(例えば、レート制御部111)とを備える。
そのような構成により、動画像符号化装置は、安定したレート制御処理が含まれる符号化処理を、演算量を大きく増加させずに高速で実行できる。
また、所定の量子化された画像のデータは、所定の量子化パラメータと対応付けられて記憶部12に記憶されている量子化された画像のデータでもよい。
そのような構成により、動画像符号化装置は、レート制御部が決定した量子化パラメータに基づいて量子化された変換係数列を符号化できる。
また、所定の量子化された画像のデータは、所定の量子化パラメータに値が最も近い量子化パラメータと対応付けられて記憶部12に記憶されている量子化された画像のデータでもよい。
そのような構成により、動画像符号化装置は、レート制御部が決定した量子化パラメータに基づいて量子化された変換係数列以外の量子化された変換係数列を符号化できる。
また、動画像符号化装置10は、量子化部11が使用した複数の量子化パラメータ以外の量子化パラメータを使用して、符号化対象画像を構成する画像のデータを量子化する第2量子化部(例えば、量子化部103)を備え、抽出部13は、記憶部12の代わりに第2量子化部から所定の量子化された画像のデータを抽出してもよい。
そのような構成により、動画像符号化装置は、レート制御部が決定した量子化パラメータに基づいて量子化された変換係数列が中間情報バッファに存在しない場合であっても、決定された量子化パラメータに基づいて量子化された変換係数列を符号化できる。
また、量子化部11は、画像のデータを量子化した後、量子化された画像のデータを所定の手順でスキャンし、記憶部12は、スキャンされた画像のデータを、量子化された画像のデータと対応付けて記憶し、抽出部13は、所定の量子化された画像のデータと、所定の量子化された画像のデータと対応付けられて記憶部12に記憶されているスキャンされた画像のデータを抽出し、符号化部14は、所定の量子化された画像のデータの代わりに、抽出されたスキャンされた画像のデータを符号化してもよい。
そのような構成により、動画像符号化装置は、符号化処理をより高速で実行できる。
また、動画像符号化装置10は、符号化対象画像を構成する画像に対して動き補償予測処理を行うことによって動き補償予測画像を生成する動き予測部(例えば、動き予測部112)と、画像から生成された動き補償予測画像を減算することによって予測誤差画像を生成する減算部(例えば、減算部101)と、生成された予測誤差画像に対して変換処理を行うことによって変換係数列を生成する変換部(例えば、変換部102)とを備え、量子化部11は、生成された変換係数列を、符号化対象画像を構成する画像のデータとして量子化してもよい。
そのような構成により、動画像符号化装置は、インター符号化モードで符号化処理を実行できる。
また、動画像符号化装置10は、符号化対象画像を構成する画像に対して画面内予測処理を行うことによって画面内予測画像を生成する画面内予測部(例えば、画面内予測部203)を備え、減算部は、画像から生成された画面内予測画像を減算することによって予測誤差画像を生成してもよい。
そのような構成により、動画像符号化装置は、イントラ符号化モードで符号化処理を実行できる。
また、量子化部11は、符号化対象画像を構成する複数の画像のデータを並列に量子化してもよい。
そのような構成により、動画像符号化装置は、符号化処理をより高速で実行できる。
また、量子化部11は、使用可能な全ての量子化パラメータを使用して、画像のデータを量子化パラメータごとにそれぞれ量子化してもよい。
そのような構成により、動画像符号化装置は、レート制御部が決定した量子化パラメータに基づいて量子化された変換係数列が、必ず中間情報バッファに記憶されるようにすることができる。
また、抽出部13は、記憶部12に符号化対象画像を構成する全ての量子化された画像のデータが記憶された後に画像のデータを抽出してもよい。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2015年6月3日に出願された日本出願特願2015−112787を基礎とする優先権を主張し、その開示の全てをここに取り込む。
10、100 動画像符号化装置
11、103 量子化部
12 記憶部
13 抽出部
14 符号化部
15 決定部
101、101−2 減算部
102、102−2 変換部
104 逆量子化部
105 逆変換部
106 加算部
107 フィルタ部
108 フレームバッファ
109 スキャン部
110 エントロピー符号化部
111 レート制御部
112 動き予測部
200 複数量子化部
210 複数量子化スキャン部
201、211 中間情報バッファ
202、212、222、232 選択部
203 画面内予測部
204 イントラ/インター切替部
1001 プロセッサ
1002 プログラムメモリ
1003、1004 記憶媒体

Claims (10)

  1. 符号化対象画像を構成する画像のデータを、複数の量子化パラメータを使用して前記量子化パラメータごとにそれぞれ量子化する量子化手段と、
    複数の量子化された画像のデータを、それぞれ量子化される際に使用された前記量子化パラメータと対応付けて記憶する記憶手段と、
    前記記憶手段から、所定の量子化パラメータを使用して所定の量子化された画像のデータを抽出する抽出手段と、
    抽出された前記所定の量子化された画像のデータを符号化する符号化手段と、
    前記符号化手段による符号化結果に基づいて、前記抽出手段が次に所定の量子化された画像のデータを抽出する際に使用される所定の量子化パラメータを決定する決定手段とを備える
    ことを特徴とする動画像符号化装置。
  2. 所定の量子化された画像のデータは、所定の量子化パラメータと対応付けられて記憶手段に記憶されている量子化された画像のデータである
    請求項1記載の動画像符号化装置。
  3. 所定の量子化された画像のデータは、所定の量子化パラメータに値が最も近い量子化パラメータと対応付けられて記憶手段に記憶されている量子化された画像のデータである
    請求項1記載の動画像符号化装置。
  4. 量子化手段が使用した複数の量子化パラメータ以外の量子化パラメータを使用して、符号化対象画像を構成する画像のデータを量子化する第2量子化手段を備え、
    抽出手段は、記憶手段の代わりに前記第2量子化手段から所定の量子化された画像のデータを抽出する
    請求項1記載の動画像符号化装置。
  5. 量子化手段は、画像のデータを量子化した後、量子化された前記画像のデータを所定の手順でスキャンし、
    記憶手段は、スキャンされた前記画像のデータを、量子化された前記画像のデータと対応付けて記憶し、
    抽出手段は、所定の量子化された画像のデータと、前記所定の量子化された画像のデータと対応付けられて前記記憶手段に記憶されているスキャンされた画像のデータを抽出し、
    符号化手段は、前記所定の量子化された画像のデータの代わりに、抽出された前記スキャンされた画像のデータを符号化する
    請求項1から請求項4のうちのいずれか1項に記載の動画像符号化装置。
  6. 符号化対象画像を構成する画像に対して動き補償予測処理を行うことによって動き補償予測画像を生成する動き予測手段と、
    前記画像から生成された前記動き補償予測画像を減算することによって予測誤差画像を生成する減算手段と、
    生成された前記予測誤差画像に対して変換処理を行うことによって変換係数列を生成する変換手段とを備え、
    量子化手段は、生成された前記変換係数列を、符号化対象画像を構成する画像のデータとして量子化する
    請求項1から請求項5のうちのいずれか1項に記載の動画像符号化装置。
  7. 符号化対象画像を構成する画像に対して画面内予測処理を行うことによって画面内予測画像を生成する画面内予測手段を備え、
    減算手段は、前記画像から生成された前記画面内予測画像を減算することによって予測誤差画像を生成する
    請求項6記載の動画像符号化装置。
  8. 量子化手段は、符号化対象画像を構成する複数の画像のデータを並列に量子化する
    請求項1から請求項7のうちのいずれか1項に記載の動画像符号化装置。
  9. 符号化対象画像を構成する画像のデータを、複数の量子化パラメータを使用して前記量子化パラメータごとにそれぞれ量子化し、
    複数の量子化された画像のデータを、それぞれ量子化される際に使用された前記量子化パラメータと対応付けて記憶し、
    記憶された複数の量子化された画像のデータから、所定の量子化パラメータを使用して所定の量子化された画像のデータを抽出し、
    抽出された前記所定の量子化された画像のデータを符号化し、
    符号化結果に基づいて、次に所定の量子化された画像のデータが抽出される際に使用される所定の量子化パラメータを決定する
    ことを特徴とする動画像符号化方法。
  10. コンピュータに、
    符号化対象画像を構成する画像のデータを、複数の量子化パラメータを使用して前記量子化パラメータごとにそれぞれ量子化する量子化処理、
    複数の量子化された画像のデータを、それぞれ量子化される際に使用された前記量子化パラメータと対応付けて記憶する記憶処理、
    記憶された複数の量子化された画像のデータから、所定の量子化パラメータを使用して所定の量子化された画像のデータを抽出する抽出処理、
    抽出された前記所定の量子化された画像のデータを符号化する符号化処理、および
    前記符号化処理による符号化結果に基づいて、次に所定の量子化された画像のデータが抽出される際に使用される所定の量子化パラメータを決定する決定処理
    を実行させるための動画像符号化プログラムを記憶する記録媒体。
JP2017521699A 2015-06-03 2016-06-02 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体 Active JP6708211B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015112787 2015-06-03
JP2015112787 2015-06-03
PCT/JP2016/002676 WO2016194380A1 (ja) 2015-06-03 2016-06-02 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体

Publications (2)

Publication Number Publication Date
JPWO2016194380A1 true JPWO2016194380A1 (ja) 2018-04-19
JP6708211B2 JP6708211B2 (ja) 2020-06-10

Family

ID=57441121

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017521699A Active JP6708211B2 (ja) 2015-06-03 2016-06-02 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体

Country Status (3)

Country Link
US (1) US10536699B2 (ja)
JP (1) JP6708211B2 (ja)
WO (1) WO2016194380A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114424549B (zh) * 2019-10-31 2024-06-11 株式会社索思未来 运动图像编码方法、编码处理方法、运动图像编码装置及编码处理装置
CN112165618B (zh) * 2020-09-27 2022-08-16 北京金山云网络技术有限公司 一种视频编码方法、装置、设备和计算机可读存储介质
CN113238987B (zh) * 2021-06-08 2022-11-22 中科寒武纪科技股份有限公司 量化数据的统计量化器、存储装置、处理装置及板卡

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2871139B2 (ja) 1991-03-19 1999-03-17 オリンパス光学工業株式会社 画像デ―タの符号化装置および復号化装置
JP2502898B2 (ja) 1992-09-28 1996-05-29 松下電器産業株式会社 画像符号化装置
KR100381830B1 (ko) 1995-03-09 2003-08-02 소니 가부시끼 가이샤 화상신호의부호화방법및그장치
KR100579417B1 (ko) * 2004-04-06 2006-05-12 (주)씨앤에스 테크놀로지 고속 영상압축장치
JP4188878B2 (ja) 2004-06-07 2008-12-03 日本電信電話株式会社 動画像符号化方法,動画像符号化装置,動画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
US20060034522A1 (en) * 2004-08-10 2006-02-16 Nader Mohsenian Method and system for equalizing video quality using selective re-encoding
JP4281667B2 (ja) 2004-10-25 2009-06-17 株式会社日立製作所 画像符号化装置
BRPI0904324A2 (pt) * 2008-06-27 2015-06-30 Sony Corp Dispositivo de processamento de imagem, e, método de processamento de imagem
WO2010041488A1 (ja) 2008-10-10 2010-04-15 株式会社東芝 動画像符号化装置
JP5331024B2 (ja) 2010-02-16 2013-10-30 株式会社メガチップス 画像符号化装置及び画像変換装置
PT2811745T (pt) 2012-01-30 2018-12-17 Samsung Electronics Co Ltd Método e aparelho para codificação e descodificação de vídeo com base em unidade de dados hierárquicos que compreendem a previsão de parâmetros de quantificação
JP6186429B2 (ja) 2013-04-12 2017-08-23 株式会社スクウェア・エニックス・ホールディングス 情報処理装置、制御方法、プログラム、及び記録媒体

Also Published As

Publication number Publication date
JP6708211B2 (ja) 2020-06-10
US10536699B2 (en) 2020-01-14
WO2016194380A1 (ja) 2016-12-08
US20180176567A1 (en) 2018-06-21

Similar Documents

Publication Publication Date Title
KR102426721B1 (ko) 색차 성분 양자화 매개 변수 결정 방법 및 이러한 방법을 사용하는 장치
US10244262B2 (en) Pixel-based intra prediction for coding in HEVC
KR20220151140A (ko) 영상 부호화 방법 및 컴퓨터로 읽을 수 있는 기록 매체
JP6164660B2 (ja) ビデオ符号化での分割ブロック符号化方法、ビデオ復号化での分割ブロック復号化方法及びこれを実現する記録媒体
JP2018056685A (ja) 画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラム
WO2011007719A1 (ja) 画像処理装置および方法
JP7343669B2 (ja) Vvcにおける色変換のための方法及び機器
JP2011130410A (ja) 符号化方法、復号化方法及び装置
KR20140092374A (ko) 화상 부호화 및 복호 방법, 장치, 프로그램
US20220345703A1 (en) Image encoding method/device, image decoding method/device and recording medium having bitstream stored therein
TW201631967A (zh) 用於編碼及解碼之使用轉換係數以漸進更新
JP6708211B2 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体
JP6528635B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
WO2017082304A1 (ja) 情報圧縮装置、情報圧縮方法、記録媒体、及び、符号化装置
KR101688085B1 (ko) 고속 인트라 예측을 위한 영상 부호화 방법 및 장치
WO2018079444A1 (ja) 符号化装置、符号化方法およびプログラム記録媒体
JP2016025529A (ja) 符号化装置、方法、プログラム及び機器
KR20200008537A (ko) 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체
KR20170054338A (ko) 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체
KR20170051391A (ko) 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체
KR20170051390A (ko) 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체
KR20170051389A (ko) 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체
KR20170051388A (ko) 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171201

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190515

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200421

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200504

R150 Certificate of patent or registration of utility model

Ref document number: 6708211

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150