JP2015035785A - 動画像符号化装置、撮像装置、動画像符号化方法、プログラム、及び記録媒体 - Google Patents
動画像符号化装置、撮像装置、動画像符号化方法、プログラム、及び記録媒体 Download PDFInfo
- Publication number
- JP2015035785A JP2015035785A JP2013166995A JP2013166995A JP2015035785A JP 2015035785 A JP2015035785 A JP 2015035785A JP 2013166995 A JP2013166995 A JP 2013166995A JP 2013166995 A JP2013166995 A JP 2013166995A JP 2015035785 A JP2015035785 A JP 2015035785A
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- picture
- entropy
- parallel
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】動画像データの特定のピクチャの画面全体を高速に復号することを可能にするための技術を提供する。【解決手段】エントロピー符号化を含む符号化処理により動画像データを符号化する符号化手段であって、符号化対象ピクチャを構成する複数のブロックを逐次的にエントロピー符号化する逐次符号化モード、又は、前記複数のブロックを複数のグループに分割して当該複数のグループを少なくとも部分的に並列的にエントロピー符号化する並列符号化モードで動作可能な符号化手段と、前記符号化対象ピクチャのための符号化モードとして、前記符号化対象ピクチャの性質に基づき、前記逐次符号化モード又は前記並列符号化モードを選択する選択手段と、を備えることを特徴とする動画像符号化装置を提供する。【選択図】図4
Description
本発明は、動画像符号化装置、撮像装置、動画像符号化方法、プログラム、及び記録媒体に関する。
従来、被写体を撮影することにより得られた動画像データを圧縮符号化して記録するカメラ一体型動画像記録装置として、デジタルビデオカメラがよく知られている。圧縮方式としては、フレーム間で動き予測を用いて高い圧縮率で圧縮可能なMPEG2方式が一般的に用いられている。また、近年では、画面内の空間的な冗長性を利用した画面内予測等のより複雑な予測方式を用いて高い圧縮率で圧縮可能なH.264方式や、HEVC(High Effeiciency Video Coding)方式などが用いられるようになっている。デジタルビデオカメラは、このような圧縮符号化方式により符号化した動画像データを、例えばフラッシュメモリ等の記録媒体に記録する。
動画像データの再生装置は、一般的に、記録された動画像データの内容を簡単に把握できるようにするための機能を有する。例えば、再生装置は、動画像データの最初の画像をサムネイル画像として一覧表示したり、動画像データの所望シーンまで再生スキップしたりする、特殊再生機能を有する。特殊再生を行う場合、再生装置は、例えば、動画像データの中で、他のピクチャを参照せずに独立して復号可能な画面内符号化ピクチャ(Iピクチャ)のみを復号して表示する。
特殊再生時のユーザエクスペリエンスを向上させるためには、ピクチャを短時間で復号して迅速に表示する必要がある。近年、動画像データの画面サイズ(ピクセル数)が増加する傾向にあり、4K(3840x2160、又は4096x2160)、8K(7680x4320)といった大きな動画像データを扱うニーズもある。画面サイズが増加すると復号対象ピクチャのデータサイズも増加して復号に要する時間が長くなるため、ピクチャの迅速な表示を可能にするための技術が益々重要になる。
ピクチャの迅速な表示を可能にするための従来の技術として、特許文献1及び特許文献2が知られている。特許文献1では、フレーム画像を複数の領域に分割して、画面内符号化と画面間符号化を混在させた異なる符号化モードで符号化したストリームデータを作成する。そして、再生時には、各フレーム画像のうち、画面内符号化した領域に相当するブロックのみを順次復号させてサーチ画像を取得する。
また、特許文献2では、Iピクチャを水平方向に分割して、画面中央のエリアのデータを優先して1GOP分のデータの先頭に配置してストリームを作成する。そして、再生時には、画面中央エリアの符号化データのみを読み出してサーチ画像を取得する。
しかしながら、特許文献1及び特許文献2の技術は、画面の一部の領域に対応するデータのみを復号することにより復号に要する時間を短縮するものであるため、画面の一部の領域しか表示されない。そのため、ユーザが画面全体を見て動画像データの内容を把握することができない。
本発明はこのような状況に鑑みてなされたものであり、動画像データの特定のピクチャの画面全体を高速に復号することを可能にするための技術を提供することを目的とする。
上記課題を解決するために、本発明は、エントロピー符号化を含む符号化処理により動画像データを符号化する符号化手段であって、符号化対象ピクチャを構成する複数のブロックを逐次的にエントロピー符号化する逐次符号化モード、又は、前記複数のブロックを複数のグループに分割して当該複数のグループを少なくとも部分的に並列的にエントロピー符号化する並列符号化モードで動作可能な符号化手段と、前記符号化対象ピクチャのための符号化モードとして、前記符号化対象ピクチャの性質に基づき、前記逐次符号化モード又は前記並列符号化モードを選択する選択手段と、を備えることを特徴とする動画像符号化装置を提供する。
なお、その他の本発明の特徴は、添付図面及び以下の発明を実施するための形態における記載によって更に明らかになるものである。
本発明によれば、動画像データの特定のピクチャの画面全体を高速に復号することが可能となる。
以下、図面を参照して本発明の実施形態を詳細に説明するが、この発明は以下の実施の形態に限定されない。なお、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。
なお、本実施形態において説明される各機能ブロックは必ずしも個別のハードウェアである必要はない。すなわち、例えばいくつかの機能ブロックの機能は、1つのハードウェアにより実行されても良い。また、いくつかのハードウェアの連係動作により1つの機能ブロックの機能又は、複数の機能ブロックの機能が実行されても良い。また、各機能ブロックの機能は、CPUがメモリ上に展開したコンピュータプログラムにより実行されても良い。コンピュータプログラムは、記録媒体に記録されても良い。
以下の各実施形態では、動画像データを符号化するための規格としてHEVC(High Effeiciency Video Coding)規格を用いるが、本発明はHEVC規格に限定されず、例えば、H.264規格を用いても構わない。
また、以下の各実施形態では、エントロピー符号化のための技術として、WPP(Wavefront Parallel Processing)技術を使用する。エントロピー符号化されたデータを復号する場合、複数のプロセッサやスレッドを用いて並列処理を行えば復号に要する時間が短縮され、結果的に、ピクチャを迅速に表示することが可能になる。しかしながら、並列処理による復号を行うためには、符号化の時点で、並列処理による復号が可能なように符号化を行う必要がある。WPP技術は、並列処理による復号を可能にする技術の1つである。しかしながら、WPP技術により符号化を行うと、符号化の効率(圧縮率)が低下する。従って、動画像データ全体に対してWPP技術を適用すると、データサイズの増大が問題となる。そこで、以下の各実施形態では、動画像データを構成する各ピクチャのうち、一部のピクチャ(高速な復号が特に要求されるピクチャ)に対してのみWPP技術を適用する。なお、エントロピー符号化の復号を並列に実行可能にする技術であれば、WPPに限らず、いかなる技術を採用しても構わない。
[第1の実施形態]
<全体システム構成>
図1は、第1の実施形態に係る動画像符号化装置100の機能ブロック図である。動画像符号化装置100は、撮像部101、符号化部102、逐次/並列処理選択部103、及びピクチャタイプ指示部104を備える。動画像符号化装置100はまた、第1のエントロピー符号化部105、第2のエントロピー符号化部106、第3のエントロピー符号化部107、第4のエントロピー符号化部108、及びビットストリーム多重化部109を備える。
<全体システム構成>
図1は、第1の実施形態に係る動画像符号化装置100の機能ブロック図である。動画像符号化装置100は、撮像部101、符号化部102、逐次/並列処理選択部103、及びピクチャタイプ指示部104を備える。動画像符号化装置100はまた、第1のエントロピー符号化部105、第2のエントロピー符号化部106、第3のエントロピー符号化部107、第4のエントロピー符号化部108、及びビットストリーム多重化部109を備える。
撮像部101は、レンズやCCD等のカメラ部、光学部を含み、レンズから取り込んだ光信号をセンサにて電気信号へ変換した後、符号化に使用するフォーマットに変換したデジタル画像データとして後段の回路へ伝送する。従って、本実施形態の動画像符号化装置100は撮像装置としても機能するが、撮像部101は必須ではない。
符号化部102は、撮像部101から読み出したデジタル画像データを、画面内予測及び動き予測による画像データの圧縮符号化を行う。そして、符号化部102は、圧縮符号化後の出力として、マクロブロック等の所定ブロック画像サイズ単位で算出した動きベクトル、予測モード情報、量子化値、量子化後の整数変換係数等のシンタクス要素を中間データとして出力する。符号化部102内部の符号化処理の詳細については、図2を参照して後述する。
逐次/並列処理選択部103は、符号化部102が出力した中間データを入力として、ピクチャタイプ指示部104からの指示に基づき、エントロピー符号化の符号化モードとして、逐次符号化モード又は並列符号化モードを選択する。即ち、逐次/並列処理選択部103は、逐次符号化モード又は並列符号化モードで動作可能である。並列符号化モードは、中間データを第1から第4のエントロピー符号化部105,106,107,108に分配して並列処理する符号化モードである。逐次符号化モードは、中間データを第1のエントロピー符号化部105のみで逐次処理する符号化モードである。本実施形態では、並列処理時に中間データを各エントロピー符号化部に分配する時、符号化対象ピクチャの1画面分に相当する中間データをエントロピー符号化部の数で等分割したブロック単位で分配するものとする。
なお、本実施形態では、エントロピー符号化部を4つ並べて並列処理する構成が採用されているが、エントロピー符号化部の数は4つに限定されず、これより多くても少なくても構わない。
ピクチャタイプ指示部104は、符号化部102おいてピクチャ単位に符号化するピクチャタイプを決定し、決定したピクチャタイプを符号化部102と逐次/並列処理選択部103に通知する。ピクチャタイプには、画面内予測のみを適用したIピクチャ、前方向のフレーム間参照予測のみを適用したPピクチャ、及び、前方向及び後方向のフレーム間参照予測を適用したBピクチャの3種類がある。通知されるピクチャタイプは、これら3種類のピクチャタイプを識別可能な値として予め定義するものとする。本実施形態では、HEVC規格書(ISO/IEC 23008−2)に記載のスライスヘッダのシンタクス要素であるslice_typeの値を利用し、Iスライスを2、Pスライスを1、Bスライスを0とした定義値を利用する。しかし、これらの値に限定される訳ではなく、一意に識別可能な値であればいかなる値を用いても構わない。
第1のエントロピー符号化部105は、符号化部102から出力されて、逐次/並列処理選択部103によって分配された中間データを取得して、エントロピー符号化を行い、ビットストリームを出力する。同様に、第2のエントロピー符号化部106、第3のエントロピー符号化部107、及び第4のエントロピー符号化部108も、第1のエントロピー符号化部105と同様の動作を行う。また、並列処理を行うために、各エントロピー符号化部間で、発生確率等の統計情報のパラメータが送受信される。第1から第4のエントロピー符号化部105、106,107,108で行うエントロピー符号化の並列処理の詳細内容については、図3を参照して後述する。
ビットストリーム多重化部109は、第1から第4のエントロピー符号化部105,106,107,108から出力された符号化ピクチャデータを、1つのビットストリームデータに多重化する。
<符号化部102の構成>
図2は、符号化部102の詳細な構成を示すブロック図である。符号化部102は、フレームメモリ200、イントラ予測部201、インター予測部202、イントラ・インター判定部203、ループフィルタ204、及び予測画像生成部205を備える。符号化部102はまた、整数変換部206、量子化部207、逆量子化部208、及び逆整数変換部209を備える。
図2は、符号化部102の詳細な構成を示すブロック図である。符号化部102は、フレームメモリ200、イントラ予測部201、インター予測部202、イントラ・インター判定部203、ループフィルタ204、及び予測画像生成部205を備える。符号化部102はまた、整数変換部206、量子化部207、逆量子化部208、及び逆整数変換部209を備える。
フレームメモリ200は、撮像部101から入力された画像データや、後述する動き予測処理で用いる参照画像データを格納する。
イントラ予測部201は、フレームメモリ200に格納されたフレーム画像データから符号化対象ブロックの画像データを読み出し、符号化対象ブロック周辺の画素データから生成される複数のイントラ予測画像との相関を計算する。そして、イントラ予測部201は、最も相関の高いイントラ予測方式を選択してイントラ・インター判定部203へ通知する。
インター予測部202は、同様にフレームメモリ200に格納した符号化対象となる原画像と、既に符号化済みの画像データから、ブロック単位で画素データ同士のパターンマッチングを行って動きベクトルを算出する。
イントラ・インター判定部203は、前述のイントラ予測部201及びインター予測部202からの出力の結果に基づいて、符号化のための予測方式を選択する。具体的な選択方法としては、イントラ・インター判定部203は、符号化対象画像ブロックについてイントラ予測部201において計算した予測画像と、符号化対象画像との予測誤差を導出する。同様に、イントラ・インター判定部203は、インター予測部202において求めた動きベクトルを用いて参照画像から生成した予測画像と、符号化対象画像との予測誤差を導出する。そして、イントラ・インター判定部203は、導出した2つの予測誤差を比較し、予測誤差が小さい方の予測方式を選択して予測画像生成部205に出力する。また、イントラ・インター判定部203は、選択した予測方式、及び、インター予測部202で算出した動きベクトル値を、中間データとして、エントロピー符号化を行うために逐次/並列処理選択部103に出力する。
なお、イントラ・インター判定部203ではなく、イントラ予測部201や、インター予測部202で予測誤差を求めておいてもよい。この場合、イントラ・インター判定部203は、イントラ予測部201及びインター予測部202で求めた予測誤差を評価値として取得し、比較する。
ループフィルタ204は、逆整数変換部209から出力された画像データと予測画像とを加算した画像データに対して、ブロック境界で発生する符号化歪みを軽減するフィルタ処理を施した後、フレームメモリ200へ格納する。
予測画像生成部205は、イントラ・インター判定部203で選択された予測モード(予測方式)に応じて予測画像を生成する。生成された予測画像は、入力画像との差分画像算出のために、整数変換部206の前段の減算器へ出力される。また、生成された予測画像は、ローカルデコード画像生成のために逆整数変換部209の後段の加算器へも出力される。
整数変換部206は、隣接画素同士で類似性が高いという空間的相関を利用して、画像情報の冗長度を削減するために、ブロック単位で画素データを周波数変換する。
量子化部207は、目標符号量に基づいて量子化係数を算出し、整数変換部206で空間周波数領域に変換された係数データに対して量子化処理を行う。量子化された係数データは、エントロピー符号化を行うために逐次/並列処理選択部103へと出力される。また、量子化された係数データは、参照画像や予測画像を算出するために逆量子化部208へも出力される。
逆量子化部208は、量子化部207にて量子化した係数データに対して量子化係数を乗じて係数データを算出する。逆整数変換部209は、逆量子化部208から出力された係数データを画素データへと逆整数変換する。
なお、本実施形態では、特に断らない限り、16行x16列の画素データの集まりをマクロブロックと呼び、マクロブロック単位で動き予測やエントロピー符号化等の符号化処理を行うものとするが、特に限定するものではない。
<エントロピー符号化の並列処理>
続いて、本実施形態で適用するエントロピー符号化の逐次処理及び並列処理について、図3を参照して説明する。本実施形態では、逐次/並列処理選択部103は、逐次処理又は並列処理をピクチャ単位で選択可能である。
続いて、本実施形態で適用するエントロピー符号化の逐次処理及び並列処理について、図3を参照して説明する。本実施形態では、逐次/並列処理選択部103は、逐次処理又は並列処理をピクチャ単位で選択可能である。
本実施形態のエントロピー符号化の並列処理は、HEVC規格で新たに採用された算術符号を用いたエントロピー符号化の並列処理である、WPP(Wavefront Parallel Processing)技術を採用するものとする。しかしながら、エントロピー符号化の復号を並列に実行可能にする技術であれば、WPPに限らず、いかなる技術を採用しても構わない。
図3(a)は、従来の逐次処理を示し、図3(b)は、WPPによる並列処理を示す。従来の逐次処理では、マクロブロック単位で符号化部102から出力された2値データを、画面左上端から順次算術符号化によって符号化し、前回符号化したマクロブロックの発生確率に依存して、次回のマクロブロックのエントロピー符号化が行われる。即ち、本実施形態のエントロピー符号化は、コンテキスト適応型である。そのため、例えばX番目のブロックをエントロピー符号化するためには、左上、上、右上、左に位置するマクロブロックの動きベクトル、画素データ、及び前回符号化したブロックの発生確率を用いるため、これらが全て符号化済みである必要がある。即ち、X番目のブロックをエントロピー符号化するためには、N番目、さらにはM番目の上に位置するマクロブロック列が全て符号化済みでなければならない。従って、逐次符号化モードの場合、符号化対象ピクチャを構成する複数のブロックが逐次的にエントロピー符号化される。
一方、並列処理では、符号化対象ブロックよりも上に位置するブロックが全て符号化済みある必要がなく、2ブロック分先に符号化済みのブロックがあれば、下のマクロブロック行のエントロピー符号化が開始できる仕組みになっている。具体的には、或る列のマクロブロック群(第1のグループ)を途中までエントロピー符号化した時点の発生確率(コンテキスト)が、次の行のマクロブロック群(第2のグループ)をエントロピー符号化するための最初のコンテキストとして使用される。WPPでは、途中までエントロピー符号化した時点とは、2番目のブロックまでエントロピー符号化した時点である。従って、1行目のマクロブロック行において、2ブロックの符号化が済んだ時点から、2行目のマクロブロック行においてコンテキスト適応型のエントロピー符号化が開始可能となる。同様に、2行目のマクロブロック行で、2ブロックの符号化が済んだ時点で、3行目のマクロブロック行においてコンテキスト適応型のエントロピー符号化が開始可能となる。このように、WPPによれば、符号化対象ピクチャを構成する複数のブロックの各列(各グループ)を、少なくとも部分的に並列的にエントロピー符号化することができる。
そこで、本実施形態では、1行目のマクロブロック行のエントロピー符号化を第1のエントロピー符号化部105で行い、2行目のマクロブロック行のエントロピー符号化を第2のエントロピー符号化部106で行う。同様に、3行目以降のマクロブロック行についても各エントロピー符号化部に処理を割り振ることにより、並列処理を実現できる。
なお、並列処理において、符号化対象ピクチャを構成する複数のブロックの各列(各グループ)のコンテキストが相互に全く依存しないようにしても構わない。この場合、WPPと異なり、各グループを完全に並列的にエントロピー符号化することができる。
<動画像データの符号化処理>
図4は、第1の実施形態に係る動画像データの符号化処理を示すフローチャートである。本フローチャートの符号化処理は、符号化部102、逐次/並列処理選択部103、ピクチャタイプ指示部104、及び第1から第4のエントロピー符号化部105,106,107,108により実行される。また、符号化は、ピクチャ単位で実行される。
図4は、第1の実施形態に係る動画像データの符号化処理を示すフローチャートである。本フローチャートの符号化処理は、符号化部102、逐次/並列処理選択部103、ピクチャタイプ指示部104、及び第1から第4のエントロピー符号化部105,106,107,108により実行される。また、符号化は、ピクチャ単位で実行される。
本フローチャートの符号化処理は、符号化対象ピクチャがIピクチャの場合、並列符号化モードでエントロピー符号化を行い、それ以外の場合、逐次符号化モードでエントロピー符号化を行う。これは、サムネイル表示やサーチ再生においてはIピクチャが選択的に復号されることが多く、Iピクチャの復号に要する時間を短縮することがサムネイル表示等の高速化につながると考えられるからである。従って、並列符号化モードの対象とするのはIピクチャに限定される訳ではない。例えば、Pピクチャが選択的に復号される用途を想定する場合は、符号化対象ピクチャがPピクチャの場合、並列符号化モードでエントロピー符号化を行い、それ以外の場合、逐次符号化モードでエントロピー符号化を行っても構わない。或いは、符号化対象ピクチャがIピクチャ又はPピクチャの場合、並列符号化モードでエントロピー符号化を行い、それ以外の場合、逐次符号化モードでエントロピー符号化を行っても構わない。
S401で、動画像符号化装置100は、動画像データを最終ピクチャまで符号化したか否かを判定する。最終ピクチャまで符号化した場合、本フローチャートの処理は終了する。そうでない場合、処理はS402に進む。
S402で、符号化部102は、撮像部101からフレーム画像を取得し、図2を参照して上述した符号化を実行する。S403で、逐次/並列処理選択部103は、ピクチャタイプ指示部104から、符号化対象ピクチャのピクチャタイプを取得する。
S404で、逐次/並列処理選択部103は、S403で取得したピクチャタイプがIピクチャであるか否かを判定する。Iピクチャの場合、処理はS405に進み、そうでない場合、処理はS406に進む(ここでは、S450は存在しないものとして扱う)。
S405で、逐次/並列処理選択部103は、符号化部102が出力した符号化対象ピクチャの2値データを、各エントロピー符号化部に分配する。とりわけ、逐次/並列処理選択部103は、符号化対象ピクチャを構成する複数のブロックを複数のグループに分割し、各グループの2値データを各エントロピー符号化部に分配する。そして、各エントロピー符号化部は、図3を参照して説明した並列処理により、分配された2値データをエントロピー符号化し、ビットストリーム多重化部109へ出力する。
一方、符号化対象ピクチャがIピクチャ以外の場合、S406で、逐次/並列処理選択部103は、符号化部102が出力した符号化対象ピクチャの2値データを全てエントロピー符号化部105に入力する。そして、エントロピー符号化部105は、図3を参照して説明した逐次処理により、入力された2値データをエントロピー符号化し、ビットストリーム多重化部109へ出力する。
S407で、ビットストリーム多重化部109は、エントロピー符号化されたピクチャデータを、一本のビットストリームデータ形式に多重化する。その後、処理はS401に戻り、次の符号化対象ピクチャについて同様の処理が行われる。
以上の処理により、ピクチャ毎に、そのピクチャの性質(本実施形態では、そのピクチャがIピクチャであるか否か)に応じて、並列処理又は逐次処理によるエントロピー符号化が行われる。
なお、前述の通り、動画像符号化装置100は、符号化対象ピクチャがIピクチャ又はPピクチャの場合、並列符号化モードでエントロピー符号化を行い、それ以外の場合、逐次符号化モードでエントロピー符号化を行っても構わない。この場合、符号化対象ピクチャがIピクチャでなければ、処理はS404からS450に進む。そして、S450で、逐次/並列処理選択部103は、S403で取得したピクチャタイプがPピクチャであるか否かを判定する。Pピクチャの場合、処理はS405に進み、そうでない場合、処理はS406に進む。
<適用例>
図5は、第1の実施形態に係る動画像データの符号化処理の適用例を示す図である。上段は撮像部101からの入力フレーム画像を示し、各フレーム画像のピクチャタイプ、及び復号時の入力順(添え字)が示されている。また、フレーム同士の参照関係を矢印にて表し、矢印の始点にあるフレーム画像が、矢印の終点が指すフレーム画像を参照している。このように時間方向に対して過去及び未来に位置するフレーム画像との間でフレーム間差分を用いて符号化を行うため、図5の下段に示すように、フレーム画像の入力順と符号化順とは異なる。
図5は、第1の実施形態に係る動画像データの符号化処理の適用例を示す図である。上段は撮像部101からの入力フレーム画像を示し、各フレーム画像のピクチャタイプ、及び復号時の入力順(添え字)が示されている。また、フレーム同士の参照関係を矢印にて表し、矢印の始点にあるフレーム画像が、矢印の終点が指すフレーム画像を参照している。このように時間方向に対して過去及び未来に位置するフレーム画像との間でフレーム間差分を用いて符号化を行うため、図5の下段に示すように、フレーム画像の入力順と符号化順とは異なる。
画面内符号化されたIピクチャは、最初に符号化されるピクチャデータであり、復号時にも、Iピクチャを再生しなければ、後続のピクチャは正しく復号できない。換言すると、Iピクチャは、他のピクチャを復号しなくても単独で復号可能である。そして、本実施形態の符号化処理によれば、図5の下段に示すように、「I2」ピクチャが並列処理でエントロピー符号化され、その他のピクチャは逐次処理で符号化される。
以上説明したように、本実施形態によれば、動画像符号化装置100は、IピクチャについてはWPPを用いた並列処理によりエントロピー符号化し、それ以外のピクチャについては逐次処理によりエントロピー符号化する。
これにより、Iピクチャについては、WPPを用いた並列処理により画面全体を高速に復号することが可能となる。その結果、例えばIピクチャのみを選択的に復号するサムネイル表示やサーチ再生などを行う際に、Iピクチャを迅速に表示することが可能となる。
[第2の実施形態]
第1の実施形態では、符号化対象ピクチャがIピクチャである場合に並列符号化モードを選択し、それ以外は逐次符号化モードを選択する構成について説明した。これに対し、第2の実施形態では、符号化対象ピクチャがシーン先頭ピクチャ(動画像データにおいて最初に表示されるピクチャ)である場合に、並列符号化モードを選択する構成について説明する。このような構成により、例えばシーン先頭ピクチャをサムネイル表示する場合に、ピクチャの復号に要する時間が短縮され、迅速なサムネイル表示が可能となる。
第1の実施形態では、符号化対象ピクチャがIピクチャである場合に並列符号化モードを選択し、それ以外は逐次符号化モードを選択する構成について説明した。これに対し、第2の実施形態では、符号化対象ピクチャがシーン先頭ピクチャ(動画像データにおいて最初に表示されるピクチャ)である場合に、並列符号化モードを選択する構成について説明する。このような構成により、例えばシーン先頭ピクチャをサムネイル表示する場合に、ピクチャの復号に要する時間が短縮され、迅速なサムネイル表示が可能となる。
なお、以下の説明においては、符号化対象ピクチャがIピクチャである場合にも並列符号化モードが選択されるものとするが、代わりに、シーン先頭ピクチャでない場合はIピクチャであっても逐次符号化モードを選択してもよい。
以下、図6乃至図8を参照して、主に第1の実施形態と異なる点について説明する。図6は、第2の実施形態に係る動画像符号化装置600の機能ブロック図である。図6において、図1と同様の構成要素には同一の符号を付す。
図6において、シーン先頭ピクチャ指示部601は、符号化部102にて符号化するピクチャが、シーン先頭ピクチャであった場合に、そのことを示す情報を逐次/並列処理選択部602に通知する。逐次/並列処理選択部602は、シーン先頭ピクチャ指示部601からの通知に基づいて、並列符号化モード又は逐次符号化モードを選択する。
図7は、第2の実施形態に係る動画像データの符号化処理を示すフローチャートである。図7において、図4と同様の処理が行われるステップには同一の符号を付す。
S404において符号化対象ピクチャがIピクチャではないと判定された場合、S701で、逐次/並列処理選択部602は、シーン先頭ピクチャ指示部601からの通知に基づいて、符号化対象ピクチャがシーン先頭ピクチャであるか否かを判定する。シーン先頭ピクチャの場合、処理はS405に進み、符号化対象ピクチャは並列処理によりエントロピー符号化される。シーン先頭ピクチャでない場合、処理はS406に進み、符号化対象ピクチャは逐次処理によりエントロピー符号化される。
以上の処理により、ピクチャ毎に、そのピクチャの性質(本実施形態では、そのピクチャがIピクチャ又はシーン先頭ピクチャであるか否か)に応じて、並列処理又は逐次処理によるエントロピー符号化が行われる。
図8は、第2の実施形態に係る動画像データの符号化処理の適用例を示す図である。本実施形態の符号化処理によれば、図8の下段に示すように、「I2」ピクチャ及び「B0」ピクチャが並列処理でエントロピー符号化され、その他のピクチャは逐次処理でエントロピー符号化される。
以上説明したように、本実施形態によれば、動画像符号化装置600は、Iピクチャに加えて(或いは、Iピクチャの代わりに)シーン先頭ピクチャを並列処理によりエントロピー符号化する。これにより、例えばシーン先頭ピクチャをサムネイル表示する場合に、ピクチャの復号に要する時間が短縮され、迅速なサムネイル表示が可能となる。
[第3の実施形態]
第3の実施形態では、符号化対象ピクチャに顔画像が含まれる場合に並列符号化モードを選択する構成について説明する。このような構成により、例えば顔画像が存在するピクチャだけを動画像データから抽出して、複数並べてインデクス表示するような場合に、迅速なインデクス表示が可能となる。
第3の実施形態では、符号化対象ピクチャに顔画像が含まれる場合に並列符号化モードを選択する構成について説明する。このような構成により、例えば顔画像が存在するピクチャだけを動画像データから抽出して、複数並べてインデクス表示するような場合に、迅速なインデクス表示が可能となる。
なお、以下の説明においては、符号化対象ピクチャがIピクチャであり、且つ顔画像が含まれる場合に、並列符号化モードが選択されるものとするが、代わりに、顔画像が含まれればピクチャタイプに関わらず並列符号化モードを選択してもよい。或いは、符号化対象ピクチャがIピクチャである場合、又は、符号化対象ピクチャに顔画像が含まれる場合に、並列符号化モードを選択してもよい。
以下、図9乃至図11を参照して、主に第1の実施形態と異なる点について説明する。図9は、第3の実施形態に係る動画像符号化装置900の機能ブロック図である。図9において、図1と同様の構成要素には同一の符号を付す。
図9において、顔画像検出部901は、撮像部101から入力された入力フレーム画像中の顔画像の有無を検出して、検出結果を逐次/並列処理選択部902に通知する。また逐次/並列処理選択部902は、顔画像検出部901から通知される検出結果に基づいて、符号化対象ピクチャに顔画像が含まれるか否かを判定する。逐次/並列処理選択部902は、符号化対象ピクチャに顔画像が含まれ、且つ、符号化対象ピクチャがIピクチャの場合に、並列符号化モードを選択する。
図10は、第3の実施形態に係る動画像データの符号化処理を示すフローチャートである。図10において、図4と同様の処理が行われるステップには同一の符号を付す。
S404において符号化対象ピクチャがIピクチャであると判定された場合、S1001で、逐次/並列処理選択部902は、顔画像検出部901から通知される検出結果に基づいて、符号化対象ピクチャに顔画像が含まれているか否かを判定する。符号化対象ピクチャに顔画像が含まれている場合、処理はS405に進み、符号化対象ピクチャは並列処理によりエントロピー符号化される。符号化対象ピクチャに顔画像が含まれていない場合、処理はS406に進み、符号化対象ピクチャは逐次処理によりエントロピー符号化される。
以上の処理により、ピクチャ毎に、そのピクチャの性質(本実施形態では、そのピクチャがIピクチャであり且つ顔画像が含まれているか否か)に応じて、並列処理又は逐次処理によるエントロピー符号化が行われる。
図11は、第3の実施形態に係る動画像データの符号化処理の適用例を示す図である。本実施形態の符号化処理によれば、図11の下段に示すように、Iピクチャのうち顔画像が含まれる「Ib」ピクチャについては並列処理でエントロピー符号化されるが、顔画像が含まれない「Ia」ピクチャについては逐次処理でエントロピー符号化される。
以上説明したように、本実施形態によれば、動画像符号化装置900は、符号化対象ピクチャがIピクチャであり、且つ顔画像が含まれる場合に、並列符号化モードを選択する。これにより、例えば顔画像が存在するIピクチャだけを動画像データから抽出して、複数並べてインデクス表示するような場合に、迅速なインデクス表示が可能となる。
[第4の実施形態]
第4の実施形態では、符号化部102の出力である係数や動きベクトル値、予測モード等の中間データのサイズ(エントロピー符号化を行う前の符号化対象ピクチャのデータサイズ)が閾値以上である場合に並列符号化モードを選択する構成について説明する。中間データのサイズが大きいということは、エントロピー符号化において処理すべきデータ量が多いということである。従って、この場合に並列処理を行うと、処理に要する時間を効果的に短縮することができる。
第4の実施形態では、符号化部102の出力である係数や動きベクトル値、予測モード等の中間データのサイズ(エントロピー符号化を行う前の符号化対象ピクチャのデータサイズ)が閾値以上である場合に並列符号化モードを選択する構成について説明する。中間データのサイズが大きいということは、エントロピー符号化において処理すべきデータ量が多いということである。従って、この場合に並列処理を行うと、処理に要する時間を効果的に短縮することができる。
なお、以下の説明においては、符号化対象ピクチャがIピクチャであり、且つ中間データのサイズが閾値以上の場合に、並列符号化モードが選択されるものとする。しかしながら、代わりに、中間データのサイズが閾値以上であればピクチャタイプに関わらず並列符号化モードを選択してもよい。或いは、符号化対象ピクチャがIピクチャである場合、又は、中間データのサイズが閾値以上である場合に、並列符号化モードを選択してもよい。
以下、図12及び図13を参照して、主に第1の実施形態と異なる点について説明する。図12は、第4の実施形態に係る動画像符号化装置1200の機能ブロック図である。図12において、図1と同様の構成要素には同一の符号を付す。
図12において、中間データサイズ取得部1201は、符号化部102が出力した、符号化対象ピクチャの中間データのデータ量を取得し、逐次/並列処理選択部1202に通知する。逐次/並列処理選択部1202は、符号化対象ピクチャがIピクチャであり、且つ中間データのサイズが閾値以上の場合に、並列符号化モードをする。
図13は、第4の実施形態に係る動画像データの符号化処理を示すフローチャートである。図13において、図4と同様の処理が行われるステップには同一の符号を付す。
S404において符号化対象ピクチャがIピクチャであると判定された場合、S1301で、中間データサイズ取得部1201は、中間データサイズを取得し、逐次/並列処理選択部1202に通知する。S1302で、逐次/並列処理選択部1202は、中間データサイズ取得部1201から通知される中間データのサイズが閾値以上であるか否かを判定する。閾値以上である場合、処理はS405に進み、符号化対象ピクチャは並列処理によりエントロピー符号化される。閾値以上でない場合、処理はS406に進み、符号化対象ピクチャは逐次処理によりエントロピー符号化される。
以上の処理により、ピクチャ毎に、そのピクチャの性質(本実施形態では、そのピクチャがIピクチャであり且つ中間データサイズが閾値以上であるか否か)に応じて、並列処理又は逐次処理によるエントロピー符号化が行われる。
以上説明したように、本実施形態によれば、動画像符号化装置1200は、符号化対象ピクチャがIピクチャであり、且つ中間データのサイズが閾値以上の場合に、並列符号化モードを選択する。これにより、エントロピー符号化及びその復号に要する時間を効果的に短縮することができる。
[その他の実施形態]
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (12)
- エントロピー符号化を含む符号化処理により動画像データを符号化する符号化手段であって、符号化対象ピクチャを構成する複数のブロックを逐次的にエントロピー符号化する逐次符号化モード、又は、前記複数のブロックを複数のグループに分割して当該複数のグループを少なくとも部分的に並列的にエントロピー符号化する並列符号化モードで動作可能な符号化手段と、
前記符号化対象ピクチャのための符号化モードとして、前記符号化対象ピクチャの性質に基づき、前記逐次符号化モード又は前記並列符号化モードを選択する選択手段と、
を備えることを特徴とする動画像符号化装置。 - 前記エントロピー符号化はコンテキスト適応型であり、
前記並列符号化モードにおいて、前記符号化手段は、前記複数のグループのうちの第1のグループを途中までエントロピー符号化した時点のコンテキストを、前記複数のグループのうちの第2のグループをエントロピー符号化するための最初のコンテキストとして使用する
ことを特徴とする請求項1に記載の動画像符号化装置。 - 前記エントロピー符号化はコンテキスト適応型であり、
前記並列符号化モードにおいて、前記符号化手段は、前記複数のグループの各々のコンテキストが相互に依存しないようにエントロピー符号化を行う
ことを特徴とする請求項1に記載の動画像符号化装置。 - 前記選択手段は、前記符号化対象ピクチャがIピクチャである場合、前記並列符号化モードを選択する
ことを特徴とする請求項1乃至3のいずれか1項に記載の動画像符号化装置。 - 前記選択手段は、前記符号化対象ピクチャがPピクチャである場合、前記並列符号化モードを選択する
ことを特徴とする請求項1乃至4のいずれか1項に記載の動画像符号化装置。 - 前記選択手段は、前記符号化対象ピクチャが、前記動画像データにおいて最初に表示されるピクチャである場合、前記並列符号化モードを選択する
ことを特徴とする請求項1乃至5のいずれか1項に記載の動画像符号化装置。 - 前記符号化対象ピクチャに顔画像が含まれるか否かを判定する判定手段を更に備え、
前記選択手段は、前記符号化対象ピクチャに顔画像が含まれると判定された場合、前記並列符号化モードを選択する
ことを特徴とする請求項1乃至6のいずれか1項に記載の動画像符号化装置。 - 前記符号化処理においてエントロピー符号化を行う前の前記符号化対象ピクチャのデータサイズを取得する取得手段を更に備え、
前記選択手段は、前記データサイズが閾値以上である場合、前記並列符号化モードを選択する
ことを特徴とする請求項1乃至7のいずれか1項に記載の動画像符号化装置。 - 動画像データを撮像する撮像手段と、
請求項1乃至8のいずれか1項に記載の動画像符号化装置と、
を備えることを特徴とする撮像装置。 - 動画像符号化装置による動画像符号化方法であって、
前記動画像符号化装置の符号化手段が、エントロピー符号化を含む符号化処理により動画像データを符号化する符号化工程であって、符号化対象ピクチャを構成する複数のブロックを逐次的にエントロピー符号化する逐次符号化モード、又は、前記複数のブロックを複数のグループに分割して当該複数のグループを少なくとも部分的に並列的にエントロピー符号化する並列符号化モードで動作可能な符号化工程と、
前記動画像符号化装置の選択手段が、前記符号化対象ピクチャのための符号化モードとして、前記符号化対象ピクチャの性質に基づき、前記逐次符号化モード又は前記並列符号化モードを選択する選択工程と、
を備えることを特徴とする動画像符号化方法。 - コンピュータを、請求項1乃至8のいずれか1項に記載の動画像符号化装置の各手段として機能させるためのプログラム。
- コンピュータを、請求項1乃至8のいずれか1項に記載の動画像符号化装置の各手段として機能させるためのプログラムを記録したコンピュータが読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013166995A JP2015035785A (ja) | 2013-08-09 | 2013-08-09 | 動画像符号化装置、撮像装置、動画像符号化方法、プログラム、及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013166995A JP2015035785A (ja) | 2013-08-09 | 2013-08-09 | 動画像符号化装置、撮像装置、動画像符号化方法、プログラム、及び記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015035785A true JP2015035785A (ja) | 2015-02-19 |
Family
ID=52543996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013166995A Withdrawn JP2015035785A (ja) | 2013-08-09 | 2013-08-09 | 動画像符号化装置、撮像装置、動画像符号化方法、プログラム、及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015035785A (ja) |
-
2013
- 2013-08-09 JP JP2013166995A patent/JP2015035785A/ja not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111955007B (zh) | 视频解码的方法和装置 | |
JP2020092457A (ja) | 画像予測方法および装置 | |
US20120177120A1 (en) | Identification of samples in a transition zone | |
TWI520584B (zh) | 用信號發送用於一葉層級編碼單元之子集的轉換係數的語法元素 | |
TW201517599A (zh) | 內部運動補償延伸 | |
JP5869047B2 (ja) | デジタルビデオデータを符号化するための方法 | |
JP7413557B2 (ja) | サインデータハイディング関連映像デコーディング方法及びその装置 | |
JP2007067796A (ja) | 符号化方法 | |
US8379985B2 (en) | Dominant gradient method for finding focused objects | |
KR102558495B1 (ko) | Hls를 시그널링하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 컴퓨터 판독 가능한 기록 매체 | |
WO2016161674A1 (zh) | 一种视频图像压缩和读取的方法、装置及系统 | |
US8165217B2 (en) | Image decoding apparatus and method for decoding prediction encoded image data | |
JP2023065581A (ja) | ビデオ符号化及び復号化 | |
JP2023516336A (ja) | 混成nalユニットタイプに基づく画像符号化/復号化方法及び装置、並びにビットストリームを伝送する方法 | |
JP4875008B2 (ja) | 動画像符号化方法、動画像復号化方法、動画像符号化装置及び動画像復号化装置 | |
TWI577180B (zh) | Dynamic image prediction decoding device, dynamic image prediction decoding method | |
US9001892B2 (en) | Moving image encoder and moving image decoder | |
JP2008252682A (ja) | 画像表示装置およびそれを搭載した撮像装置 | |
JP2011055023A (ja) | 画像符号化装置及び画像復号化装置 | |
JP2008289105A (ja) | 画像処理装置およびそれを搭載した撮像装置 | |
JP2015035785A (ja) | 動画像符号化装置、撮像装置、動画像符号化方法、プログラム、及び記録媒体 | |
US20180124376A1 (en) | Video decoding device and image display device | |
JP7492023B2 (ja) | 混成nalユニットタイプに基づく画像符号化/復号化方法及び装置、並びにビットストリームを保存する記録媒体 | |
RU2793826C1 (ru) | Кодирование изображения или видео на основе режима палитры | |
CN116723315B (en) | Video decoding method and device, video encoding method and device, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160802 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20161118 |