JP2010177828A - スケーラブル画像符号化方法、スケーラブル画像符号化装置、スケーラブル画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

スケーラブル画像符号化方法、スケーラブル画像符号化装置、スケーラブル画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP2010177828A
JP2010177828A JP2009016062A JP2009016062A JP2010177828A JP 2010177828 A JP2010177828 A JP 2010177828A JP 2009016062 A JP2009016062 A JP 2009016062A JP 2009016062 A JP2009016062 A JP 2009016062A JP 2010177828 A JP2010177828 A JP 2010177828A
Authority
JP
Japan
Prior art keywords
encoding
region
interest
layer
scalable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009016062A
Other languages
English (en)
Other versions
JP5118075B2 (ja
Inventor
Yukihiro Bando
幸浩 坂東
Kazuya Hayase
和也 早瀬
Masayuki Takamura
誠之 高村
Kazuto Kamikura
一人 上倉
Yoshiyuki Yajima
由幸 八島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009016062A priority Critical patent/JP5118075B2/ja
Publication of JP2010177828A publication Critical patent/JP2010177828A/ja
Application granted granted Critical
Publication of JP5118075B2 publication Critical patent/JP5118075B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】本発明は、H.264/AVCのSVCのCGSの枠組みにおいて、興味領域に対応した画質スケーラビリティを実現する新たな符号化技術の提供を目的とする。
【解決手段】興味領域についての符号化情報を、基本階層と最下位拡張階層を起点とする1つ又は複数の下位側拡張階層の符号化情報とする構成を採り、さらに、その構成に従って下位側拡張階層よりも上位の拡張階層が不要となることで、非興味領域との間で拡張階層の数が合わなくなるのを防ぐために、その不要となった上位の拡張階層の符号化情報として、符号化情報がないことを示す符号量最小のスキップ情報を割り当てる構成を採り、さらに、下位側拡張階層における興味領域と非興味領域との間に強弱を与えるために、非興味領域における下位側拡張階層の符号化情報として、符号化情報がないことを示す符号量最小のスキップ情報を割り当てる構成を採る。
【選択図】図3

Description

本発明は、動画像や静止画像を階層的に符号化するスケーラブル画像符号化方法およびその装置と、そのスケーラブル画像符号化方法の実現に用いられるスケーラブル画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体とに関し、特に、H.264/AVCのスケーラブル拡張方式SVCのCGSの枠組みにおいて、興味領域に対応した画質スケーラビリティを実現するスケーラブル画像符号化方法およびその装置と、そのスケーラブル画像符号化方法の実現に用いられるスケーラブル画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体とに関する。
映像表示環境の多様化を背景にして、H.264/AVCのスケーラブル拡張方式SVCが策定された。
SVC(Scalable Video Coding)は、1解像度が1レイヤに対応したマルチレイヤ構造をとり、各レイヤで出力される符号化情報を多重化することで空間スケーラビリティを実現している。低解像度映像の処理レイヤを基本レイヤ、高解像度映像の処理レイヤを拡張レイヤと呼ぶ。基本レイヤでは、H.264/AVC準拠の符号化処理を行い、拡張レイヤでは、H.264/AVCの予測機構にレイヤ間予測を追加した符号化処理を行う。SVCは、時間・空間・画質の3種類のスケーラブル機能を備えている。
一方、画質スケーラブル機能の応用の一つとして、ROIスケーラビリティ(ROI:Regions of interest)が挙げられる(例えば、非特許文献1参照)。これは、フレーム内を興味領域(ROI)と非興味領域とに分け、興味領域に対する優先度を上げることで、帯域変動時にも興味領域の画質を保持することを目的としている。
P.Yin, J.Boyce, P.Pandit, "FMO and ROI Scalability", JVT-Q029, Nice, France, October, 2005
SVCでは、画質スケーラビリティの実現方法として、Coase Grain Scalability (CGS)とMedium Grain Scalability(MGS)をサポートしている。しかし、SVCは復号方式を規定した標準であり、符号化方式については自由度がある。
一方、ROIの実現方法は符号化方式に関する内容である。これから、ROIの具体的な実現方法は、SVCの標準化では何も規定されていない。
本発明はかかる事情に鑑みてなされたものであって、SVCにおける画質スケーラビリティ処理(CGS)において、SVCに与えられた規約の中でROIスケーラビリティを実現する新たなスケーラブル画像符号化技術の提供を目的とする。
〔1〕本発明の構成
〔1−1〕第1の構成
前記の目的を達成するために、第1の構成に従う本発明のスケーラブル画像符号化装置は、(1)興味領域についての符号化情報を、全て基本階層の符号化情報とする構成を採り、(2)さらに、その構成に従って、興味領域について、拡張階層が不要となることで、非興味領域との間で拡張階層の数が合わなくなるのを防ぐために、その不要となった拡張階層の符号化情報として、符号化情報がないことを示すスキップ情報(符号量が最小の情報)を割り当てる構成を採る。
すなわち、第1の構成に従う本発明のスケーラブル画像符号化装置は、基本階層と拡張階層とからなり、符号化対象画像の画面内の拡張階層の数が分類クラスによらずに一定に設定するように定められるスケーラブル画像符号化で画像符号化を実行する場合に、(イ)画面内に含まれる興味領域を検出して、その検出結果に基づいて、画面内を興味領域と非興味領域とに分類する分類手段と、(ロ)分類手段の分類した興味領域について、スケーラブル画像符号化における最高画質までの符号化を基本階層で完了し、拡張階層の符号化情報として、符号化情報がないことを示すスキップ情報を割り当てることで、興味領域についての符号化情報を生成する第1の符号化手段と、(ハ)分類手段の分類した非興味領域について、基本階層および拡張階層についての符号化をスケーラブル画像符号化で設定された符号化パラメータを用いて実行することで、非興味領域についての符号化情報を生成する第2の符号化手段とを備えるように構成する。
以上の各処理手段が動作することで実現される本発明のスケーラブル画像符号化方法はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。
〔1−2〕第2の構成
前記の目的を達成するために、第2の構成に従う本発明のスケーラブル画像符号化装置は、(1)興味領域についての符号化情報を、基本階層と最下位拡張階層を起点とする1つ又は複数の下位側拡張階層の符号化情報とする構成を採り、(2)さらに、その構成に従って、興味領域について、下位側拡張階層よりも上位の拡張階層が不要となることで、非興味領域との間で拡張階層の数が合わなくなるのを防ぐために、その不要となった上位の拡張階層の符号化情報として、符号化情報がないことを示すスキップ情報(符号量が最小の情報)を割り当てる構成を採る。
すなわち、第2の構成に従う本発明のスケーラブル画像符号化装置は、基本階層と拡張階層とからなり、符号化対象画像の画面内の拡張階層の数が分類クラスによらずに一定に設定するように定められるスケーラブル画像符号化で画像符号化を実行する場合に、(イ)画面内に含まれる興味領域を検出して、その検出結果に基づいて、画面内を興味領域と非興味領域とに分類する分類手段と、(ロ)分類手段の分類した興味領域について、基本階層についての符号化をスケーラブル画像符号化で設定された符号化パラメータを用いて実行するとともに、スケーラブル画像符号化における最高画質までの符号化を最下位拡張階層を起点とする1つ又は複数の下位側拡張階層で完了し、さらに、その下位側拡張階層よりも上位の拡張階層の符号化情報として、符号化情報がないことを示すスキップ情報を割り当てることで、興味領域についての符号化情報を生成する第1の符号化手段と、(ハ)分類手段の分類した非興味領域について、基本階層および拡張階層についての符号化をスケーラブル画像符号化で設定された符号化パラメータを用いて実行することで、非興味領域についての符号化情報を生成する第2の符号化手段と備えるように構成する。
以上の各処理手段が動作することで実現される本発明のスケーラブル画像符号化方法はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。
〔1−3〕第3の構成
前記の目的を達成するために、第3の構成に従う本発明のスケーラブル画像符号化装置は、(1)興味領域についての符号化情報を、基本階層と最下位拡張階層を起点とする1つ又は複数の下位側拡張階層の符号化情報とする構成を採り、(2)さらに、その構成に従って、興味領域について、下位側拡張階層よりも上位の拡張階層が不要となることで、非興味領域との間で拡張階層の数が合わなくなるのを防ぐために、その不要となった上位の拡張階層の符号化情報として、符号化情報がないことを示すスキップ情報(符号量が最小の情報)を割り当てる構成を採り、(3)さらに、下位側拡張階層における興味領域と非興味領域との間に第2の構成よりも大きな強弱を与えるために、非興味領域における下位側拡張階層の符号化情報として、符号化情報がないことを示すスキップ情報(符号量が最小の情報)を割り当てる構成を採る。
すなわち、第3の構成に従う本発明のスケーラブル画像符号化装置は、基本階層と拡張階層とからなり、符号化対象画像の画面内の拡張階層の数が分類クラスによらずに一定に設定するように定められるスケーラブル画像符号化で画像符号化を実行する場合に、(イ)画面内に含まれる興味領域を検出して、その検出結果に基づいて、画面内を興味領域と非興味領域とに分類する分類手段と、(ロ)分類手段の分類した興味領域について、基本階層についての符号化をスケーラブル画像符号化で設定された符号化パラメータを用いて実行するとともに、スケーラブル画像符号化における最高画質までの符号化を最下位拡張階層を起点とする1つ又は複数の下位側拡張階層で完了し、さらに、その下位側拡張階層よりも上位の拡張階層の符号化情報として、符号化情報がないことを示すスキップ情報を割り当てることで、興味領域についての符号化情報を生成する第1の符号化手段と、(ハ)分類手段の分類した非興味領域について、基本階層についての符号化をスケーラブル画像符号化で設定された符号化パラメータを用いて実行するとともに、下位側拡張階層の符号化情報として、符号化情報がないことを示すスキップ情報を割り当て、さらに、下位側拡張階層よりも上位の拡張階層についての符号化をスケーラブル画像符号化で設定された符号化パラメータを用いて実行することで、非興味領域についての符号化情報を生成する第2の符号化手段とを備えるように構成する。
以上の各処理手段が動作することで実現される本発明のスケーラブル画像符号化方法はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。
〔2〕本発明の具体的な手法について
次に、このように構成される本発明の具体的な手法について説明する。
本発明では、slice skip(前述のスキップ情報)と呼ばれるシンタックスを利用する。slice skipは、slice-skip-flag によりslice 単位で指定される符号化モードである。slice-skip-flag =1の場合、DCT係数・動きベクトルといった符号化情報は符号化ストリームには含まれず、slice header情報のみが伝送される。
本来、このシンタックスの導入目的は、複数のマクロブロックがDCT係数・動きベクトルなどの符号化情報を含まないskipやdirectといった符号化モードをとる場合に、複数のマクロブロックの符号化モードを一括して指定することにより符号量を削減することにある。
本発明では、このslice skipを利用することで、CGSにおいて、ROIスケーラビリティを効率的に実現する。以下、具体的手法について詳述する。
フレーム内の興味領域(ROI)を検出し、フレーム内を興味領域と非興味領域とに分類する。例えば、興味領域としては、顔が映っている領域や移動物体の領域などがあげられる。ここで、興味領域の検出方法については外部から与えられるものとする。例えば、興味領域として顔領域を設定するのであれば、顔領域の検出方法については既に数多く提案されており、こうした従来手法を用いることが可能である。
なお、以下では、説明の簡単化のために、興味領域と非興味領域とが各々1つずつの場合を例にとり説明する。しかし、領域数が2個以上に増えた場合にも、本手法は同様に適用可能である。
領域検出の結果に基づき、興味領域に属する画素をslice-1 とし、非興味領域に属する画素をslice-2 とする。なお、例えば、slice の最小構成単位はマクロブロック(16×16画素のY信号、4×4画素のCb信号、4×4画素のCr信号からなる)であり、slice の分類はマクロブロック単位でなされる。
〔イ〕符号化モード設定方法1
以下に説明する量子化パラメータQi についてはQ0 ≧Q1 ≧Q2 ≧Q3 ・・・・が成立し、量子化パラメータが小さいほど、量子化誤差が小さく、復号画像の画質が高いものとなる。
符号化モード設定方法1は、前述した第1の構成に相当するものであり、slice-1 (興味領域)に属するマクロブロックの情報を、全て基本階層の符号化情報とする方法である。
この場合、slice-1 の拡張階層の符号化データには、画質向上に寄与する情報は存在しない。しかし、SVCの規格において、拡張階層の数は、全slice に対して一定に設定するよう定められている。そこで、slice-1 の拡張階層の符号化データとして、最も発生符号量の少ないslice skipを割り当てることで、SVCの規格に従う形式の符号化ストリームを生成する。slice skipの場合、符号化ストリームに含まれるのはslice header情報のみであり、その符号量は、slice-skip-flag =1とする1ビットのフラグ情報を含めた数バイトの情報である。
一方、slice-2 (非興味領域)に対しては、基本階層と拡張階層に符号化情報を分散させる。
図1に、基本階層と1つの拡張階層からなる場合における具体例を示す。ここで、縦軸は符号量である。
0 を基本階層に対する量子化パラメータとし、Q1 を拡張階層に対する量子化パラメータとすると、基本階層と1つの拡張階層からなる場合、符号化モード設定方法1では、図1に示すように、slice-1 (興味領域)の基本階層については量子化パラメータをQ1 として、slice-2 (非興味領域)の拡張階層と同程度に小さくして符号化処理を行うことで高画質の復号画像を与えるようにし、拡張階層についてはslice skipを割り当てる。
一方、slice-2 (非興味領域)の基本階層については量子化パラメータをQ0 として符号化を行い、拡張階層については量子化パラメータをQ1 として符号化処理を行う。
図2に、基本階層と2つの拡張階層(下位拡張階層・上位拡張階層)からなる場合における具体例を示す。ここで、縦軸は符号量である。
0 を基本階層に対する量子化パラメータとし、Q1 を下位拡張階層に対する量子化パラメータとし、Q2 を上位拡張階層に対する量子化パラメータとすると、基本階層と2つの拡張階層からなる場合、符号化モード設定方法1では、図2に示すように、slice-1 (興味領域)の基本階層については量子化パラメータをQ2 として、slice-2 (非興味領域)の上位拡張階層と同程度に小さくして符号化処理を行うことで高画質の復号画像を与えるようにし、上位拡張階層および下位拡張階層についてはslice skipを割り当てる。
一方、slice-2 (非興味領域)の基本階層については量子化パラメータをQ0 として符号化を行い、下位拡張階層については量子化パラメータをQ1 として符号化を行い、上位拡張階層については量子化パラメータをQ2 として符号化処理を行う。
〔ロ〕符号化モード設定方法2
以下に説明する量子化パラメータQi についてはQ0 ≧Q1 ≧Q2 ≧Q3 ・・・・が成立し、量子化パラメータが小さいほど、量子化誤差が小さく、復号画像の画質が高いものとなる。
符号化モード設定方法2は、前述した第3の構成に相当するものであり、slice-1 (興味領域)に属するマクロブロックの情報を、基本階層と最下位拡張階層を起点とする1つ又は複数の下位側拡張階層の符号化情報とし、さらに、下位側拡張階層における興味領域と非興味領域との間に大きな強弱を与えるために、非興味領域における下位側拡張階層の符号化情報として、符号化情報がないことを示すスキップ情報を割り当てるという方法である。
〔ロ−1〕下位側拡張階層=最下位拡張階層のみの場合
符号化モード設定方法2において、下位側拡張階層を最下位拡張階層のみとする構成を採ることが可能である。
この場合、slice-1 の上位の拡張階層の符号化データには、画質向上に寄与する情報は存在しない。しかし、SVCの規格において、拡張階層の数は、全slice に対して一定に設定するよう定められている。そこで、slice-1 の上位の拡張階層の符号化データとして、最も発生符号量の少ないslice skipを割り当てることで、SVCの規格に従う形式の符号化ストリームを生成する。slice skipの場合、符号化ストリームに含まれるのはslice header情報のみであり、その符号量は、slice-skip-flag =1とする1ビットのフラグ情報を含めた数バイトの情報である。
一方、slice-2 (非興味領域)に対しては、基本階層と拡張階層に符号化情報を分散させることを基本にして、その例外として、最下位の拡張階層についてはslice-1 (興味領域)との間で強弱を与えるためにslice skipを割り当てるようにする。
図3に、基本階層と3つの拡張階層(最下位拡張階層・中位拡張階層・最上位拡張階層)からなる場合における具体例を示す。ここで、縦軸は符号量である。
0 を基本階層に対する量子化パラメータとし、Q1 を最下位拡張階層に対する量子化パラメータとし、Q2 を中位拡張階層に対する量子化パラメータとし、Q3 を最上位拡張階層に対する量子化パラメータとすると、基本階層と3つの拡張階層からなる場合、符号化モード設定方法2では、図3に示すように、slice-1 (興味領域)の基本階層については量子化パラメータをQ0 として符号化を行い、最下位拡張階層については量子化パラメータをQ3 として、slice-2 (非興味領域)の最上位拡張階層と同程度に小さくして符号化処理を行うことで高画質の復号画像を与えるようにし、中位拡張階層および最上位拡張階層についてはslice skipを割り当てる。
一方、slice-2 (非興味領域)の基本階層については量子化パラメータをQ0 として符号化を行い、最下位拡張階層についてはslice-1 (興味領域)との間で強弱を与えるためにslice skipを割り当て、中位拡張階層については量子化パラメータをQ2 として符号化を行い、最上位拡張階層については量子化パラメータをQ3 として符号化処理を行う。
ここで、図3では、slice-2 (非興味領域)における最下位拡張階層に対してslice skipを割り当てるという構成を採ったが、前述した第2の構成に従う場合には、図4に示すように、通常通り、基本階層および2つの拡張階層についての符号化を、スケーラブル画像符号化で設定された符号化パラメータ(この場合は量子化パラメータQ0,1,2,3 )を用いて実行する。
〔ロ−2〕下位側拡張階層=最下位拡張階層+それに続く拡張階層の場合
図3では、前述した下位側拡張階層を最下位拡張階層のみとする場合を示したが、この下位側拡張階層を最下位拡張階層とそれに続く拡張階層とすることも可能である。
図5に、基本階層と4つの拡張階層(最下位拡張階層・第2位拡張階層・第3位拡張階層・最上位拡張階層)からなり、かつ、slice-1 (興味領域)に属するマクロブロックの情報を、基本階層および2つの下位側の拡張階層の符号化情報とする場合の具体例を示す。
0 を基本階層に対する量子化パラメータとし、Q1 を最下位拡張階層に対する量子化パラメータとし、Q2 を第2位拡張階層に対する量子化パラメータとし、Q3 を第3位拡張階層に対する量子化パラメータとし、Q4 を最上位拡張階層に対する量子化パラメータとすると、基本階層と4つの拡張階層からなる場合、符号化モード設定方法2では、図5に示すように、slice-1 (興味領域)の基本階層については量子化パラメータをQ0 として符号化を行い、最下位拡張階層については量子化パラメータをQ3 として、slice-2 (非興味領域)の第3位拡張階層と同程度に小さくして符号化処理を行うことで高画質の復号画像を与えるようにし、第2位拡張階層については量子化パラメータをQ4 として、slice-2 (非興味領域)の最上位拡張階層と同程度に小さくして符号化処理を行うことで高画質の復号画像を与えるようにし、第3位拡張階層および最上位拡張階層についてはslice skipを割り当てる。
一方、slice-2 (非興味領域)の基本階層については量子化パラメータをQ0 として符号化を行い、最下位拡張階層および第2位拡張階層についてはslice-1 (興味領域)との間で強弱を与えるためにslice skipを割り当て、第3位拡張階層については量子化パラメータをQ3 として符号化を行い、最上位拡張階層については量子化パラメータをQ4 として符号化処理を行う。
ここで、図5では、slice-2 (非興味領域)における下位側拡張階層(最下位拡張階層・第2位拡張階層)に対してslice skipを割り当てるという構成を採ったが、前述した第2の構成に従う場合には、図6に示すように、通常通り、基本階層および4つの拡張階層についての符号化を、スケーラブル画像符号化で設定された符号化パラメータ(この場合は量子化パラメータQ0,1,2,3,4 )を用いて実行する。
〔ハ〕興味領域検出方法
各フレームに対する興味領域の検出処理が演算量的に高負荷な場合、リアルタイム処理が要求されるアプリケーションでは、全フレームについての処理が行えず、処理のリアルタイム性を確保するためには、検出処理の対象となるフレーム数が制限される。例えば、顔検出処理では、高負荷処理を要求するため、リアルタイム処理が求められる場合、単位時間当たりに処理可能なフレーム数はフレームレート30〔フレーム/秒〕を大きく下回る。
こうした場合、検出処理の対象から外れたフレームに対しては、符号化処理において、興味領域を検出する必要がある。
ここでは、入力されたフレームに対して、フレーム番号を表すインデックスをtとし、t=L×mフレーム(m:自然数)に対して、興味領域の検出処理が行われた場合、つまり、Lフレームに一枚、興味領域の検出処理が実施される場合を考える。このとき、t=L×m+nフレーム(n=1,....,L−1)に対する検出処理を以下に示す。なお、以下では、興味領域の検出処理が行われるt=L×mフレームをアンカーフレームと呼び、それ以外のフレームを非アンカーフレームと呼ぶ。
アンカーフレーム(t=L×mフレーム)の興味領域内の各マクロブロックに対して、非アンカーフレーム(t=L×m+nフレーム)内において両ブロック間の差分絶対値和を最小化するブロック(16×16画素のY信号、4×4画素のCb信号、4×4画素のCr信号からなる)を検出する。両ブロック間を対応付ける情報として、両ブロックの座標位置の差を表す二次元ベクトル(対応付けベクトル)で表現する。
この処理により、アンカーフレームの興味領域内のマクロブロックと対応付けられた非アンカーフレーム内のブロックに対して、そのブロックの一部を含む位置にあるマクロブロックは、その非アンカーフレーム内における興味領域として、その非アンカーフレーム内におけるslice-1 に分類される。
非アンカーフレーム(t=L×m+nフレーム)内のslice-1 に属するマクロブロックに対しては、フレーム間予測の参照フレームをアンカーフレーム(t=L×mフレーム)とする。このフレーム間予測における動きベクトルを求める際、前記の対応付けベクトルの向きを逆転したベクトルを動きベクトル推定時の初期位置とする。その初期位置の周辺を対応付けベクトルの検出時よりも小さな範囲に対して、絶対値誤差和最小化を実現する動きベクトルを求める。これにより、対応付けベクトル検出時の計算結果を流用することで、演算量の増加を抑えることができる。
以上説明したように、本発明によれば、H.264/AVCのSVCのCGSの枠組みにおいて、ユーザが興味を持つ領域(興味領域)に対応した画質スケーラビリティを実現することができるようになる。
これから、本発明によれば、帯域が制限され、十分な符号量を割り当てることができない通信環境下であっても、ユーザが重要と考える領域の画質を確保することができるようになる。
しかも、本発明では、この実現にあたって、符号量が最小のslice skipを用いることから、少ないオーバヘットで、ユーザが興味を持つ領域(興味領域)に対応した画質スケーラビリティを実現することができるようになる。
本発明の処理の説明図である。 本発明の処理の説明図である。 本発明の処理の説明図である。 本発明の処理の説明図である。 本発明の処理の説明図である。 本発明の処理の説明図である。 本発明を具備するスケーラブル映像符号化装置の装置構成の一例である。 スケーラブル映像符号化部の実行するフローチャートである。 スケーラブル映像符号化部の実行するフローチャートである。 スケーラブル映像符号化部の実行するフローチャートである。 スケーラブル映像符号化部の実行するフローチャートである。 スケーラブル映像符号化部の実行するフローチャートである。 スケーラブル映像符号化部の実行するフローチャートである。
以下、実施の形態に従って本発明を詳細に説明する。
図7に、本発明を具備するスケーラブル映像符号化装置1の装置構成の一例を図示する。
この図に示すように、本発明のスケーラブル映像符号化装置1は、映像情報を入力する映像入力部10と、映像入力部10の入力した映像フレームに含まれる興味領域を検出する興味領域検出部11と、興味領域検出部11が連続する映像フレームについて興味領域を検出することができない場合に備えられて、興味領域検出部11の検出した興味領域を使って補間処理を行うことで、興味領域検出部11が検出対象としなかった映像フレームについて興味領域を検出する興味領域補間検出部12と、興味領域検出部11や興味領域補間検出部12により興味領域の検出された映像フレームを入力として、その映像フレームを階層的に符号化するスケーラブル映像符号化部13と、スケーラブル映像符号化部13の生成した符号化情報を統合する符号化情報統合部14とを備える。
本発明に特徴的な処理を行うスケーラブル映像符号化部13は、基本階層の符号化処理を行う基本階層符号化部130と、拡張階層の符号化処理を行う拡張階層符号化部131と、基本階層および拡張階層の符号化処理で使用する量子化パラメータQi (i=0〜L)を記憶して、基本階層符号化部130および拡張階層符号化部131に提供する量子化パラメータ記憶部132とを備える。
ここで、量子化パラメータ記憶部132の記憶する量子化パラメータQi (i=0〜L)は、興味領域・非興味領域を区別しないで行われる通常のスケーラブル符号化で使用する量子化パラメータであり、結局のところ、非興味領域に対してのスケーラブル符号化で使用する量子化パラメータ(従来技術に従った設定された量子化パラメータ)である。
スケーラブル映像符号化部13の備える基本階層符号化部130は、本発明を実現するために、興味領域の基本階層についての符号化処理を実行する興味領域基本階層符号化部1300と、非興味領域の基本階層についての符号化処理を実行する非興味領域基本階層符号化部1301とを備える。
一方、スケーラブル映像符号化部13の備える拡張階層符号化部131は、本発明を実現するために、slice skipを割り当てる処理を行うスキップモード割当部13100を有して、興味領域の拡張階層についての符号化処理を実行する興味領域拡張階層符号化部1310と、slice skipを割り当てる処理を行うスキップモード割当部13110を有して、非興味領域の拡張階層についての符号化処理を実行する非興味領域拡張階層符号化部1311とを備える。
ここで、前述した第1の符号化手段は、興味領域基本階層符号化部1300および興味領域拡張階層符号化部1310で構成されることになり、前述した第2の符号化手段は、非興味領域基本階層符号化部1301および非興味領域拡張階層符号化部1311で構成されることになる。
図8〜図13に、このように構成されるスケーラブル映像符号化部13の実行するフローチャートの一例を図示する。
次に、これらのフローチャートに従って、スケーラブル映像符号化部13が本発明を実現すべく実行する処理について詳細に説明する。
〔1〕図2に示す符号化処理の実行
まず最初に、図8および図9のフローチャートに従って、図2で説明した符号化処理を実行する場合にスケーラブル映像符号化部13が実行することになる処理について詳細に説明する。
スケーラブル映像符号化部13は、符号化対象の映像フレームに対して図2で説明した符号化処理を実行する場合には、図8および図9のフローチャートに示すように、まず最初に、ステップS101で、符号化対象の映像フレームのどの領域が興味領域であるのかということについて示す興味領域の検出結果を読み込み、続くステップS102で、その興味領域の数Nを読み込む。
すなわち、興味領域検出部11や興味領域補間検出部12により検出された興味領域の検出結果と、その興味領域の数Nとを読み込むのである。
続いて、ステップS103で、検出された興味領域のそれぞれをslice-1 からslice-N に対応付けるとともに、非興味領域(検出された興味領域以外のフレーム領域)をslice-N+1 に対応付け、続くステップS104で、設定された拡張階層数Lを読み込む。
続いて、ステップS105で、量子化パラメータ記憶部132から、非興味領域の基本階層および各拡張階層に対しての量子化パラメータQi (i=0〜L)を読み込む。ここで、Q0 は基本階層に対しての量子化パラメータで、QL は最上位の拡張階層に対しての量子化パラメータである。
続いて、ステップS106で、n番目の興味領域であるslice-n を指定する変数nに初期値である1をセットして、そのslice-n (興味領域)に対して、以下に説明するステップS107〜ステップS111の処理を実行する。
すなわち、ステップS107で、slice-n の基本階層に対して、量子化パラメータをQL として符号化処理を行う。slice-n (興味領域)の基本階層に対して、slice-N+1 (非興味領域)の最上位の拡張階層と同程度に量子化パラメータを小さくして、高画質の復号画像を与えるようにして符号化処理を行うのである。
続いて、ステップS108で、最下位の拡張階層から数えて何番目の拡張階層であるのを示す変数iに初期値である1(最下位の拡張階層を示す値)をセットする。
続いて、ステップS109で、slice-n の第i位の拡張階層に対して、slice-skipモードを割り当てる。
続いて、ステップS110で、変数iの値がL以上となったのか否かを判断して、変数iの値がL以上となっていないことを判断するときには、ステップS111に進んで、変数iの値を1つインクリメントしてから、その1つ上の拡張階層に対してslice-skipモードを割り当てるべく、ステップS109の処理に戻る。
このようにして、ステップS107〜ステップS111の処理を実行することで、図2に示すような形で、slice-n (興味領域)に対しての符号化処理を実行するのである。
一方、ステップS110の判断処理で、変数iの値がL以上となったことを判断するときには、ステップS112に進んで、変数nの値がN以上となったのか否かを判断して、変数nの値がN以上となっていないことを判断するときには、ステップS113に進んで、変数nの値を1つインクリメントしてから、次のslice-n に対して符号化処理を実行すべく、ステップS107の処理に戻る。
このようにして、ステップS107〜ステップS113の処理を実行することで、全ての興味領域(slice-1 〜slice-N )についての符号化処理を終了すると、slice-N+1 (非興味領域)の符号化処理に入って、ステップS114に進んで、基本階層から数えて何番目の階層(基本階層・拡張階層)であるのを示す変数iに初期値である0(基本階層を示す値)をセットする。
続いて、ステップS115で、slice-N+1 (非興味領域)の第i位の拡張階層(但し、i=0は基本階層を示す)に対して、量子化パラメータをQi として符号化処理を行う。すなわち、通常のスケーラブル符号化で用いられている量子化パラメータQi を用いて符号化処理を行うのである。
続いて、ステップS116で、変数iの値がL以上となったのか否かを判断して、変数iの値がL以上となっていないことを判断するときには、ステップS117に進んで、変数iの値を1つインクリメントしてから、その1つ上の拡張階層に対してスケーラブル符号化を実行すべく、ステップS115の処理に戻る。
このようにして、ステップS115〜ステップS117の処理を実行することで、図2に示すような形で、slice-N+1 (非興味領域)に対しての符号化処理を実行するのである。
そして、ステップS116で、変数iの値がL以上となったことを判断するときには、符号化対象の映像フレームに対しての全ての符号化処理を終了したことを判断して、処理を終了する。
このようにして、スケーラブル映像符号化部13は、図2に示すような形で符号化処理を行うことで、H.264/AVCのSVCのCGSの枠組みにおいて、ユーザが興味を持つ領域(興味領域)に対応した画質スケーラビリティを実現するように処理するのである。
〔2〕図3に示す符号化処理の実行
次に、図10および図11のフローチャートに従って、図3で説明した符号化処理を実行する場合にスケーラブル映像符号化部13が実行することになる処理について詳細に説明する。
スケーラブル映像符号化部13は、符号化対象の映像フレームに対して図3で説明した符号化処理を実行する場合には、図10および図11のフローチャートに示すように、まず最初に、ステップS201で、符号化対象の映像フレームのどの領域が興味領域であるのかということについて示す興味領域の検出結果を読み込み、続くステップS202で、その興味領域の数Nを読み込む。
すなわち、興味領域検出部11や興味領域補間検出部12により検出された興味領域の検出結果と、その興味領域の数Nとを読み込むのである。
続いて、ステップS203で、検出された興味領域のそれぞれをslice-1 からslice-N に対応付けるとともに、非興味領域(検出された興味領域以外のフレーム領域)をslice-N+1 に対応付け、続くステップS204で、設定された拡張階層数Lを読み込む。
続いて、ステップS205で、量子化パラメータ記憶部132から、非興味領域の基本階層および各拡張階層に対しての量子化パラメータQi (i=0〜L)を読み込む。ここで、Q0 は基本階層に対しての量子化パラメータで、QL は最上位の拡張階層に対しての量子化パラメータである。
続いて、ステップS206で、n番目の興味領域であるslice-n を指定する変数nに初期値である1をセットして、そのslice-n (興味領域)に対して、以下に説明するステップS207〜ステップS212の処理を実行する。
すなわち、ステップS207で、slice-n の基本階層に対して、量子化パラメータをQ0 として符号化処理を行う。
続いて、ステップS208で、slice-n の最下位の拡張階層に対して、量子化パラメータをQL として符号化処理を行う。slice-n (興味領域)の最下位の拡張階層に対して、slice-N+1 (非興味領域)の最上位の拡張階層と同程度に量子化パラメータを小さくして、高画質の復号画像を与えるようにして符号化処理を行うのである。
続いて、ステップS209で、最下位の拡張階層から数えて何番目の拡張階層であるのを示す変数iに初期値である2(最下位の拡張階層の1つ上の拡張階層を示す値)をセットする。
続いて、ステップS210で、slice-n の第i位の拡張階層に対して、slice-skipモードを割り当てる。
続いて、ステップS211で、変数iの値がL以上となったのか否かを判断して、変数iの値がL以上となっていないことを判断するときには、ステップS212に進んで、変数iの値を1つインクリメントしてから、その1つ上の拡張階層に対してslice-skipモードを割り当てるべく、ステップS210の処理に戻る。
このようにして、ステップS207〜ステップS212の処理を実行することで、図3に示すような形で、slice-n (興味領域)に対しての符号化処理を実行するのである。
一方、ステップS211の判断処理で、変数iの値がL以上となったことを判断するときには、ステップS213に進んで、変数nの値がN以上となったのか否かを判断して、変数nの値がN以上となっていないことを判断するときには、ステップS214に進んで、変数nの値を1つインクリメントしてから、次のslice-n に対して符号化処理を実行すべく、ステップS207の処理に戻る。
このようにして、ステップS207〜ステップS214の処理を実行することで、全ての興味領域(slice-1 〜slice-N )についての符号化処理を終了すると、slice-N+1 (非興味領域)の符号化処理に入って、ステップS215に進んで、slice-N+1 (非興味領域)の基本階層に対して、量子化パラメータをQ0 として符号化処理を行う。
続いて、ステップS216で、slice-N+1 (非興味領域)の最下位の拡張階層に対して、slice-skipモードを割り当てる。
続いて、ステップS217で、最下位の拡張階層から数えて何番目の拡張階層であるのを示す変数iに初期値である2(最下位の拡張階層の1つ上の拡張階層を示す値)をセットする。
続いて、ステップS218で、slice-N+1 (非興味領域)の第i位の拡張階層に対して、量子化パラメータをQi として符号化処理を行う。すなわち、通常のスケーラブル符号化で用いられている量子化パラメータQi を用いて符号化処理を行うのである。
続いて、ステップS219で、変数iの値がL以上となったのか否かを判断して、変数iの値がL以上となっていないことを判断するときには、ステップS220に進んで、変数iの値を1つインクリメントしてから、その1つ上の拡張階層に対してスケーラブル符号化を実行すべく、ステップS218の処理に戻る。
このようにして、ステップS215〜ステップS220の処理を実行することで、図3に示すような形で、slice-N+1 (非興味領域)に対しての符号化処理を実行するのである。
そして、ステップS219で、変数iの値がL以上となったことを判断するときには、符号化対象の映像フレームに対しての全ての符号化処理を終了したことを判断して、処理を終了する。
このようにして、スケーラブル映像符号化部13は、図3に示すような形で符号化処理を行うことで、H.264/AVCのSVCのCGSの枠組みにおいて、ユーザが興味を持つ領域(興味領域)に対応した画質スケーラビリティを実現するように処理するのである。
ここで、図3では、slice-N+1 (非興味領域)における最下位拡張階層に対してslice skipを割り当てるという構成を採ったが、図4に示すように、通常通り、基本階層および拡張階層についての符号化をスケーラブル符号化で設定された符号化パラメータを用いて実行するようにすることも可能である。
〔3〕図5に示す符号化処理の実行
次に、図12および図13のフローチャートに従って、図5で説明した符号化処理を実行する場合にスケーラブル映像符号化部13が実行することになる処理について詳細に説明する。
スケーラブル映像符号化部13は、符号化対象の映像フレームに対して図5で説明した符号化処理を実行する場合には、図12および図13のフローチャートに示すように、まず最初に、ステップS301で、符号化対象の映像フレームのどの領域が興味領域であるのかということについて示す興味領域の検出結果を読み込み、続くステップS302で、その興味領域の数Nを読み込む。
すなわち、興味領域検出部11や興味領域補間検出部12により検出された興味領域の検出結果と、その興味領域の数Nとを読み込むのである。
続いて、ステップS303で、検出された興味領域のそれぞれをslice-1 からslice-N に対応付けるとともに、非興味領域(検出された興味領域以外のフレーム領域)をslice-N+1 に対応付け、続くステップS304で、設定された拡張階層数Lおよび下位側拡張階層数Kを読み込む。ここで、下位側拡張階層数Kは、最下位の拡張階層を起点として、それに続く拡張階層で定義される下位側拡張階層の数を表している。
続いて、ステップS305で、量子化パラメータ記憶部132から、非興味領域の基本階層および各拡張階層に対しての量子化パラメータQi (i=0〜L)を読み込む。ここで、Q0 は基本階層に対しての量子化パラメータで、QL は最上位の拡張階層に対しての量子化パラメータである。
続いて、ステップS306で、n番目の興味領域であるslice-n を指定する変数nに初期値である1をセットして、そのslice-n (興味領域)に対して、以下に説明するステップS307〜ステップS315の処理を実行する。
すなわち、ステップS307で、slice-n の基本階層に対して、量子化パラメータをQ0 として符号化処理を行う。
続いて、ステップS308で、最下位の拡張階層から数えて何番目の拡張階層であるのを示す変数jに初期値である1(最下位の拡張階層を示す値)をセットする。
続いて、ステップS309で、slice-n の第j位の拡張階層に対して、量子化パラメータをQL-(K-j) として符号化処理を行う。slice-n (興味領域)の第j位の拡張階層に対して、slice-N+1 (非興味領域)の第L−(K−j)位の拡張階層と同程度に量子化パラメータを小さくして、高画質の復号画像を与えるようにして符号化処理を行うのである。
続いて、ステップS310で、変数jの値がK以上となったのか否かを判断して、変数jの値がK以上となっていないことを判断するときには、ステップS311に進んで、変数jの値を1つインクリメントしてから、その1つ上の拡張階層に対して高画質の復号画像を与えるようにして符号化処理を行うべく、ステップS309の処理に戻る。
一方、ステップS310の判断処理で、変数jの値がK以上となったことを判断するときには、ステップS312に進んで、最下位の拡張階層から数えて何番目の拡張階層であるのを示す変数iに初期値であるK+1(下位側拡張階層の1つ上の拡張階層を示す値)をセットする。
続いて、ステップS313で、slice-n の第i位の拡張階層に対して、slice-skipモードを割り当てる。
続いて、ステップS314で、変数iの値がL以上となったのか否かを判断して、変数iの値がL以上となっていないことを判断するときには、ステップS315に進んで、変数iの値を1つインクリメントしてから、その1つ上の拡張階層に対してslice-skipモードを割り当てるべく、ステップS313の処理に戻る。
このようにして、ステップS307〜ステップS315の処理を実行することで、図5に示すような形で、slice-n (興味領域)に対しての符号化処理を実行するのである。
一方、ステップS314の判断処理で、変数iの値がL以上となったことを判断するときには、ステップS316に進んで、変数nの値がN以上となったのか否かを判断して、変数nの値がN以上となっていないことを判断するときには、ステップS317に進んで、変数nの値を1つインクリメントしてから、次のslice-n に対して符号化処理を実行すべく、ステップS307の処理に戻る。
このようにして、ステップS307〜ステップS317の処理を実行することで、全ての興味領域(slice-1 〜slice-N )についての符号化処理を終了すると、slice-N+1 (非興味領域)の符号化処理に入って、ステップS318に進んで、slice-N+1 (非興味領域)の基本階層に対して、量子化パラメータをQ0 として符号化処理を行う。
続いて、ステップS319で、最下位の拡張階層から数えて何番目の拡張階層であるのを示す変数jに初期値である1(最下位の拡張階層を示す値)をセットする。
続いて、ステップS320で、slice-N+1 (非興味領域)の第j位の拡張階層に対して、slice-skipモードを割り当てる。
続いて、ステップS321で、変数jの値がK以上となったのか否かを判断して、変数jの値がK以上となっていないことを判断するときには、ステップS322に進んで、変数jの値を1つインクリメントしてから、その1つ上の拡張階層に対してslice-skipモードを割り当てるべく、ステップS320の処理に戻る。
一方、ステップS321の判断処理で、変数jの値がK以上となったことを判断するときには、ステップS323に進んで、最下位の拡張階層から数えて何番目の拡張階層であるのを示す変数iに初期値であるK+1(下位側拡張階層の1つ上の拡張階層を示す値)をセットする。
続いて、ステップS324で、slice-N+1 (非興味領域)の第i位の拡張階層に対して、量子化パラメータをQi として符号化処理を行う。すなわち、通常のスケーラブル符号化で用いられている量子化パラメータQi を用いて符号化処理を行うのである。
続いて、ステップS325で、変数iの値がL以上となったのか否かを判断して、変数iの値がL以上となっていないことを判断するときには、ステップS326に進んで、変数iの値を1つインクリメントしてから、その1つ上の拡張階層に対してスケーラブル符号化を実行すべく、ステップS324の処理に戻る。
このようにして、ステップS318〜ステップS326の処理を実行することで、図5に示すような形で、slice-N+1 (非興味領域)に対しての符号化処理を実行するのである。
そして、ステップS325で、変数iの値がL以上となったことを判断するときには、符号化対象の映像フレームに対しての全ての符号化処理を終了したことを判断して、処理を終了する。
このようにして、スケーラブル映像符号化部13は、図5に示すような形で符号化処理を行うことで、H.264/AVCのSVCのCGSの枠組みにおいて、ユーザが興味を持つ領域(興味領域)に対応した画質スケーラビリティを実現するように処理するのである。
ここで、図5では、slice-N+1 (非興味領域)における下位側拡張階層に対してslice skipを割り当てるという構成を採ったが、図6に示すように、通常通り、基本階層および拡張階層についての符号化をスケーラブル符号化で設定された符号化パラメータを用いて実行するようにすることも可能である。
本発明は、動画像や静止画像を階層的に符号化するスケーラブル画像符号化に適用できるものであり、本発明を適用することで、H.264/AVCのSVCのCGSの枠組みにおいて、ユーザが興味を持つ領域(興味領域)に対応した画質スケーラビリティを実現することができるようになる。
これから、本発明によれば、帯域が制限され、十分な符号量を割り当てることができない通信環境下であっても、ユーザが重要と考える領域の画質を確保することができるようになる。
1 スケーラブル映像符号化装置
10 映像入力部
11 興味領域検出部
12 興味領域補間検出部
13 スケーラブル映像符号化部
14 符号化情報統合部
130 基本階層符号化部
131 拡張階層符号化部
132 量子化パラメータ記憶部
1300 興味領域基本階層符号化部
1301 非興味領域基本階層符号化部
1310 興味領域拡張階層符号化部
1311 非興味領域拡張階層符号化部
13100 スキップモード割当部
13110 スキップモード割当部

Claims (8)

  1. 基本階層と拡張階層とからなり、符号化対象画像の画面内の拡張階層の数が分類クラスによらずに一定に設定するように定められるスケーラブル画像符号化で画像符号化を実行するスケーラブル画像符号化方法において、
    画面内に含まれる興味領域を検出して、その検出結果に基づいて、画面内を興味領域と非興味領域とに分類する過程と、
    前記興味領域について、前記スケーラブル画像符号化における最高画質までの符号化を基本階層で完了し、拡張階層の符号化情報として、符号化情報がないことを示すスキップ情報を割り当てることで、前記興味領域についての符号化情報を生成する過程と、
    前記非興味領域について、基本階層および拡張階層についての符号化を前記スケーラブル画像符号化で設定された符号化パラメータを用いて実行することで、前記非興味領域についての符号化情報を生成する過程とを備えることを、
    特徴とするスケーラブル画像符号化方法。
  2. 基本階層と拡張階層とからなり、符号化対象画像の画面内の拡張階層の数が分類クラスによらずに一定に設定するように定められるスケーラブル画像符号化で画像符号化を実行するスケーラブル画像符号化方法において、
    画面内に含まれる興味領域を検出して、その検出結果に基づいて、画面内を興味領域と非興味領域とに分類する過程と、
    前記興味領域について、基本階層についての符号化を前記スケーラブル画像符号化で設定された符号化パラメータを用いて実行するとともに、前記スケーラブル画像符号化における最高画質までの符号化を最下位拡張階層を起点とする1つ又は複数の下位側拡張階層で完了し、さらに、その下位側拡張階層よりも上位の拡張階層の符号化情報として、符号化情報がないことを示すスキップ情報を割り当てることで、前記興味領域についての符号化情報を生成する過程と、
    前記非興味領域について、基本階層および拡張階層についての符号化を前記スケーラブル画像符号化で設定された符号化パラメータを用いて実行することで、前記非興味領域についての符号化情報を生成する過程とを備えることを、
    特徴とするスケーラブル画像符号化方法。
  3. 基本階層と拡張階層とからなり、符号化対象画像の画面内の拡張階層の数が分類クラスによらずに一定に設定するように定められるスケーラブル画像符号化で画像符号化を実行するスケーラブル画像符号化方法において、
    画面内に含まれる興味領域を検出して、その検出結果に基づいて、画面内を興味領域と非興味領域とに分類する過程と、
    前記興味領域について、基本階層についての符号化を前記スケーラブル画像符号化で設定された符号化パラメータを用いて実行するとともに、前記スケーラブル画像符号化における最高画質までの符号化を最下位拡張階層を起点とする1つ又は複数の下位側拡張階層で完了し、さらに、その下位側拡張階層よりも上位の拡張階層の符号化情報として、符号化情報がないことを示すスキップ情報を割り当てることで、前記興味領域についての符号化情報を生成する過程と、
    前記非興味領域について、基本階層についての符号化を前記スケーラブル画像符号化で設定された符号化パラメータを用いて実行するとともに、前記下位側拡張階層の符号化情報として前記スキップ情報を割り当て、さらに、前記下位側拡張階層よりも上位の拡張階層についての符号化を前記スケーラブル画像符号化で設定された符号化パラメータを用いて実行することで、前記非興味領域についての符号化情報を生成する過程とを備えることを、
    特徴とするスケーラブル画像符号化方法。
  4. 基本階層と拡張階層とからなり、符号化対象画像の画面内の拡張階層の数が分類クラスによらずに一定に設定するように定められるスケーラブル画像符号化で画像符号化を実行するスケーラブル画像符号化装置において、
    画面内に含まれる興味領域を検出して、その検出結果に基づいて、画面内を興味領域と非興味領域とに分類する手段と、
    前記興味領域について、前記スケーラブル画像符号化における最高画質までの符号化を基本階層で完了し、拡張階層の符号化情報として、符号化情報がないことを示すスキップ情報を割り当てることで、前記興味領域についての符号化情報を生成する手段と、
    前記非興味領域について、基本階層および拡張階層についての符号化を前記スケーラブル画像符号化で設定された符号化パラメータを用いて実行することで、前記非興味領域についての符号化情報を生成する手段とを備えることを、
    特徴とするスケーラブル画像符号化装置。
  5. 基本階層と拡張階層とからなり、符号化対象画像の画面内の拡張階層の数が分類クラスによらずに一定に設定するように定められるスケーラブル画像符号化で画像符号化を実行するスケーラブル画像符号化装置において、
    画面内に含まれる興味領域を検出して、その検出結果に基づいて、画面内を興味領域と非興味領域とに分類する手段と、
    前記興味領域について、基本階層についての符号化を前記スケーラブル画像符号化で設定された符号化パラメータを用いて実行するとともに、前記スケーラブル画像符号化における最高画質までの符号化を最下位拡張階層を起点とする1つ又は複数の下位側拡張階層で完了し、さらに、その下位側拡張階層よりも上位の拡張階層の符号化情報として、符号化情報がないことを示すスキップ情報を割り当てることで、前記興味領域についての符号化情報を生成する手段と、
    前記非興味領域について、基本階層および拡張階層についての符号化を前記スケーラブル画像符号化で設定された符号化パラメータを用いて実行することで、前記非興味領域についての符号化情報を生成する手段とを備えることを、
    特徴とするスケーラブル画像符号化装置。
  6. 基本階層と拡張階層とからなり、符号化対象画像の画面内の拡張階層の数が分類クラスによらずに一定に設定するように定められるスケーラブル画像符号化で画像符号化を実行するスケーラブル画像符号化装置において、
    画面内に含まれる興味領域を検出して、その検出結果に基づいて、画面内を興味領域と非興味領域とに分類する手段と、
    前記興味領域について、基本階層についての符号化を前記スケーラブル画像符号化で設定された符号化パラメータを用いて実行するとともに、前記スケーラブル画像符号化における最高画質までの符号化を最下位拡張階層を起点とする1つ又は複数の下位側拡張階層で完了し、さらに、その下位側拡張階層よりも上位の拡張階層の符号化情報として、符号化情報がないことを示すスキップ情報を割り当てることで、前記興味領域についての符号化情報を生成する手段と、
    前記非興味領域について、基本階層についての符号化を前記スケーラブル画像符号化で設定された符号化パラメータを用いて実行するとともに、前記下位側拡張階層の符号化情報として前記スキップ情報を割り当て、さらに、前記下位側拡張階層よりも上位の拡張階層についての符号化を前記スケーラブル画像符号化で設定された符号化パラメータを用いて実行することで、前記非興味領域についての符号化情報を生成する手段とを備えることを、
    特徴とするスケーラブル画像符号化装置。
  7. 請求項1ないし3のいずれか1項に記載のスケーラブル画像符号化方法をコンピュータに実行させるためのスケーラブル画像符号化プログラム。
  8. 請求項1ないし3のいずれか1項に記載のスケーラブル画像符号化方法をコンピュータに実行させるためのスケーラブル画像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2009016062A 2009-01-28 2009-01-28 スケーラブル画像符号化方法、スケーラブル画像符号化装置、スケーラブル画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP5118075B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009016062A JP5118075B2 (ja) 2009-01-28 2009-01-28 スケーラブル画像符号化方法、スケーラブル画像符号化装置、スケーラブル画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009016062A JP5118075B2 (ja) 2009-01-28 2009-01-28 スケーラブル画像符号化方法、スケーラブル画像符号化装置、スケーラブル画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2010177828A true JP2010177828A (ja) 2010-08-12
JP5118075B2 JP5118075B2 (ja) 2013-01-16

Family

ID=42708375

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009016062A Expired - Fee Related JP5118075B2 (ja) 2009-01-28 2009-01-28 スケーラブル画像符号化方法、スケーラブル画像符号化装置、スケーラブル画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP5118075B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013135464A (ja) * 2011-12-27 2013-07-08 Fujitsu Ltd 符号化装置、復号装置、動画像処理システム、符号化方法、復号方法、符号化プログラム、および復号プログラム
WO2016098280A1 (ja) * 2014-12-16 2016-06-23 日本電気株式会社 映像符号化装置、映像復号装置および映像配信システム
JP2017098898A (ja) * 2015-11-27 2017-06-01 キヤノン株式会社 画像符号化装置及びその制御方法及びプログラム並びに記憶媒体
CN111479113A (zh) * 2020-04-15 2020-07-31 腾讯科技(深圳)有限公司 码率控制方法和装置、存储介质和电子设备
JP2020120322A (ja) * 2019-01-25 2020-08-06 日本放送協会 距離画像符号化装置およびそのプログラム、ならびに、距離画像復号装置およびそのプログラム

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08130733A (ja) * 1994-10-31 1996-05-21 Sanyo Electric Co Ltd 動画像処理装置及び方法
JP2000067223A (ja) * 1998-08-25 2000-03-03 Fuji Photo Film Co Ltd ファイル作成方法および装置、ファイル転送制御方法および装置並びに記録媒体
WO2003079692A1 (en) * 2002-03-19 2003-09-25 Fujitsu Limited Hierarchical encoder and decoder
JP2007043719A (ja) * 2005-08-04 2007-02-15 Samsung Electronics Co Ltd ピクチャースキップ方法及び装置
JP2007174568A (ja) * 2005-12-26 2007-07-05 Sanyo Electric Co Ltd 符号化方法
JP2007235314A (ja) * 2006-02-28 2007-09-13 Sanyo Electric Co Ltd 符号化方法
WO2007114617A1 (en) * 2006-04-04 2007-10-11 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding using extended macro-block skip mode
JP2007312399A (ja) * 2007-05-31 2007-11-29 Sanyo Electric Co Ltd 画像符号化装置および画像復号装置、ならびにそれらを利用可能な画像表示装置および方法
WO2008047257A2 (en) * 2006-10-20 2008-04-24 Nokia Corporation System and method for providing picture output indications in video coding

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08130733A (ja) * 1994-10-31 1996-05-21 Sanyo Electric Co Ltd 動画像処理装置及び方法
JP2000067223A (ja) * 1998-08-25 2000-03-03 Fuji Photo Film Co Ltd ファイル作成方法および装置、ファイル転送制御方法および装置並びに記録媒体
WO2003079692A1 (en) * 2002-03-19 2003-09-25 Fujitsu Limited Hierarchical encoder and decoder
JP2007043719A (ja) * 2005-08-04 2007-02-15 Samsung Electronics Co Ltd ピクチャースキップ方法及び装置
JP2007174568A (ja) * 2005-12-26 2007-07-05 Sanyo Electric Co Ltd 符号化方法
JP2007235314A (ja) * 2006-02-28 2007-09-13 Sanyo Electric Co Ltd 符号化方法
WO2007114617A1 (en) * 2006-04-04 2007-10-11 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding using extended macro-block skip mode
WO2008047257A2 (en) * 2006-10-20 2008-04-24 Nokia Corporation System and method for providing picture output indications in video coding
JP2007312399A (ja) * 2007-05-31 2007-11-29 Sanyo Electric Co Ltd 画像符号化装置および画像復号装置、ならびにそれらを利用可能な画像表示装置および方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
横関大子郎(外2名): "画像任意部分適応階層化方式の一検討", 1997年電子情報通信学会情報・システムソサイエティ大会講演論文集, JPN6012008621, 13 August 1997 (1997-08-13), JP, pages 11 - 52, ISSN: 0002152037 *
横関大子郎(外3名): "JPEG動画像の階層化", 1996年電子情報通信学会情報・システムソサイエティ大会講演論文集, JPN6012008620, 30 August 1996 (1996-08-30), JP, pages 252 - 254, ISSN: 0002152036 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013135464A (ja) * 2011-12-27 2013-07-08 Fujitsu Ltd 符号化装置、復号装置、動画像処理システム、符号化方法、復号方法、符号化プログラム、および復号プログラム
WO2016098280A1 (ja) * 2014-12-16 2016-06-23 日本電気株式会社 映像符号化装置、映像復号装置および映像配信システム
JP2017098898A (ja) * 2015-11-27 2017-06-01 キヤノン株式会社 画像符号化装置及びその制御方法及びプログラム並びに記憶媒体
JP2020120322A (ja) * 2019-01-25 2020-08-06 日本放送協会 距離画像符号化装置およびそのプログラム、ならびに、距離画像復号装置およびそのプログラム
JP7257152B2 (ja) 2019-01-25 2023-04-13 日本放送協会 距離画像符号化装置およびそのプログラム、ならびに、距離画像復号装置およびそのプログラム
CN111479113A (zh) * 2020-04-15 2020-07-31 腾讯科技(深圳)有限公司 码率控制方法和装置、存储介质和电子设备
CN111479113B (zh) * 2020-04-15 2021-04-09 腾讯科技(深圳)有限公司 码率控制方法和装置、存储介质和电子设备

Also Published As

Publication number Publication date
JP5118075B2 (ja) 2013-01-16

Similar Documents

Publication Publication Date Title
JP7096896B2 (ja) ビデオ符号化のための方法及び装置
TWI532369B (zh) 用於基於高效率視訊寫碼之可擴縮寫碼視訊資訊之裝置及方法
JP6716836B2 (ja) 動画像符号化データ
TWI639333B (zh) Decoding method and decoding device
CN102124495B (zh) 用于对数字化图像序列进行编码的方法
CN112470474A (zh) 基于历史的仿射合并和运动矢量预测
CN103329535B (zh) 视频编码设备、视频解码设备、视频编码方法、视频解码方法以及程序
CN105706450A (zh) 根据基于散列的块匹配的结果的编码器决定
EP1851969A2 (en) Method and system for motion vector prediction in scalable video coding
CN1774930A (zh) 视频转码
KR20110083365A (ko) 움직임 벡터를 부호화, 복호화하는 방법 및 장치
KR20110008653A (ko) 움직임 벡터 예측 방법과 이를 이용한 영상 부호화/복호화 장치 및 방법
TW201313032A (zh) 動畫像編碼裝置、動畫像解碼裝置、動畫像編碼方法以及動畫像解碼方法
JP5118075B2 (ja) スケーラブル画像符号化方法、スケーラブル画像符号化装置、スケーラブル画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5038367B2 (ja) スケーラブル動画像符号化方法、スケーラブル動画像符号化装置およびスケーラブル動画像符号化プログラム
TW202135530A (zh) 用於編碼和解碼視訊樣本區塊的方法、設備及系統
JP2016154395A (ja) 以前ブロックの動きベクトルを現在ブロックの動きベクトルとして用いる映像符号化/復号化方法及び装置
KR20130059422A (ko) 화상 부호화 방법 및 장치, 화상 복호 방법 및 장치, 및 그 프로그램
CN115428445A (zh) 用于视频编码的方法和装置
TW202205852A (zh) 一種編解碼方法、裝置及其設備
WO2013014693A1 (ja) 動画像復号化方法及び画像符号化方法
CN101491100B (zh) 从低分辨率画面的运动数据导出高分辨率画面的运动数据的方法和设备
KR20210018862A (ko) 동화상 부호화 장치, 동화상 복호 장치, 동화상 부호화 방법 및 동화상 복호 방법
JP2017073598A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2017028372A (ja) 符号化方式変換装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120411

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121016

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121018

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5118075

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151026

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees