JP2015002512A - 画像符号化装置及び画像符号化方法 - Google Patents
画像符号化装置及び画像符号化方法 Download PDFInfo
- Publication number
- JP2015002512A JP2015002512A JP2013127392A JP2013127392A JP2015002512A JP 2015002512 A JP2015002512 A JP 2015002512A JP 2013127392 A JP2013127392 A JP 2013127392A JP 2013127392 A JP2013127392 A JP 2013127392A JP 2015002512 A JP2015002512 A JP 2015002512A
- Authority
- JP
- Japan
- Prior art keywords
- scene
- video
- encoded data
- unit
- stream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】処理量の増加や映像品質の低下を招くことなく、効率的な圧縮を行うことができるようにする。【解決手段】シーン間予測参照箇所抽出部53がマスターストリーム(2)内の符号化データのうち、マスターシーンIDが示すシーン映像の符号化データに対するH.264復号処理を実施してマスターフトリーム復号画像を生成し、シーン間予測符号化部55が、そのマスターフトリーム復号画像を再符号化せずに、そのマスターフトリーム復号画像を用いて、H.264復号部51により生成された復号画像に対するシーン間予測符号化処理を実施する。【選択図】図1
Description
この発明は、画像を圧縮符号化して符号化データを伝送又は記録する画像符号化装置及び画像符号化方法に関するものである。
従来の画像符号化装置が所定の映像シーケンスを圧縮符号化する際には、当該映像シーケンス内の空間的相関又は時間的相関を利用して予測符号化を行うことで、圧縮効率を高めるように構成されている。
一方、近年のHDD内蔵型デジタル録画機器やクラウド型システム等においては、膨大な記録空間内において、多数の圧縮された映像ストリームが管理されるため、条件によっては、異なる映像シーケンス間でも映像の内容が類似する状況が増加する。
一方、近年のHDD内蔵型デジタル録画機器やクラウド型システム等においては、膨大な記録空間内において、多数の圧縮された映像ストリームが管理されるため、条件によっては、異なる映像シーケンス間でも映像の内容が類似する状況が増加する。
このような状況下では、異なる映像シーケンス間に存在する相関も活用して、更なるデータ圧縮を行うことができる。
以下の特許文献1には、HDD内蔵型デジタル録画機器において、複数の異なる録画番組間で比較を行い、その比較結果に基づいて得られる差分情報を圧縮符号化することで、複数の録画番組を高い圧縮効率で記録する技術が開示されている。
以下の特許文献1には、HDD内蔵型デジタル録画機器において、複数の異なる録画番組間で比較を行い、その比較結果に基づいて得られる差分情報を圧縮符号化することで、複数の録画番組を高い圧縮効率で記録する技術が開示されている。
従来の画像符号化装置は以上のように構成されているので、異なる映像ストリーム間で常に同一時刻のフレームの信号を比較評価尺度として差分をとり、その差分信号を圧縮符号化している。このため、映像間で類似するカットの時刻にずれがある等の場合には、効率的な圧縮を行うことができない課題があった。
また、映像ストリームの全般に亘って、画像信号レベルでの比較を実施することにより処理量の増加を招いてしまい、また、差分を取る映像ストリームの引く側と引かれる側の両方を再圧縮することにより処理量の増加と映像品質の低下を招いてしまう課題もあった。
また、映像ストリームの全般に亘って、画像信号レベルでの比較を実施することにより処理量の増加を招いてしまい、また、差分を取る映像ストリームの引く側と引かれる側の両方を再圧縮することにより処理量の増加と映像品質の低下を招いてしまう課題もあった。
この発明は上記のような課題を解決するためになされたもので、処理量の増加や映像品質の低下を招くことなく、効率的な圧縮を行うことができる画像符号化装置及び画像符号化方法を得ることを目的とする。
この発明に係る画像符号化装置は、第1の映像符号化方式に従う第1の映像符号化データ内のシーン映像単位の符号化データに対する復号処理を実施して、シーン映像単位の復号画像を生成する復号画像生成手段と、第1の映像符号化方式に従う第2の映像符号化データ内のシーン映像単位の符号化データの中に、第1の映像符号化データ内のシーン映像単位の符号化データと相関がある符号化データが含まれていれば、その符号化データに対する復号処理を実施して、予測参照用の復号画像を生成する予測参照用画像生成手段と、第1の映像符号化データ内のシーン映像単位の符号化データと相関がある符号化データが含まれていなければ、復号画像生成手段により生成された復号画像に対するシーン内予測符号化処理を実施して、第2の映像符号化方式に従う映像符号化データを生成する第1の映像符号化データ生成手段と、予測参照用画像生成手段により生成された予測参照用の復号画像を再符号化せずに、その復号画像を用いて、復号画像生成手段により生成された復号画像に対するシーン間予測符号化処理を実施して、第2の映像符号化方式に従う映像符号化データを生成する第2の映像符号化データ生成手段とを設け、多重化手段が、第1の映像符号化データ生成手段により生成された映像符号化データと第2の映像符号化データ生成手段により生成された映像符号化データを多重化するようにしたものである。
この発明によれば、第1の映像符号化方式に従う第2の映像符号化データ内のシーン映像単位の符号化データの中に、第1の映像符号化データ内のシーン映像単位の符号化データと相関がある符号化データが含まれていれば、その符号化データに対する復号処理を実施して、予測参照用の復号画像を生成する予測参照用画像生成手段と、第1の映像符号化データ内のシーン映像単位の符号化データと相関がある符号化データが含まれていなければ、復号画像生成手段により生成された復号画像に対するシーン内予測符号化処理を実施して、第2の映像符号化方式に従う映像符号化データを生成する第1の映像符号化データ生成手段と、予測参照用画像生成手段により生成された予測参照用の復号画像を再符号化せずに、その復号画像を用いて、復号画像生成手段により生成された復号画像に対するシーン間予測符号化処理を実施して、第2の映像符号化方式に従う映像符号化データを生成する第2の映像符号化データ生成手段とを設け、多重化手段が、第1の映像符号化データ生成手段により生成された映像符号化データと第2の映像符号化データ生成手段により生成された映像符号化データを多重化するように構成したので、処理量の増加や映像品質の低下を招くことなく、効率的な圧縮を行うことができる効果がある。
実施の形態1.
この実施の形態1では、MPEG−2ビデオビットストリームを受信し、そのMPEG−2ビデオビットストリームを再圧縮して記録する機器ないしシステムにおいて、品質低下を抑制して効率的に再圧縮を行う画像符号化装置と、当該画像符号化装置から出力された符号化データに基づいて映像信号を再生する画像復号装置について説明する。
この実施の形態1では、MPEG−2ビデオビットストリームを受信し、そのMPEG−2ビデオビットストリームを再圧縮して記録する機器ないしシステムにおいて、品質低下を抑制して効率的に再圧縮を行う画像符号化装置と、当該画像符号化装置から出力された符号化データに基づいて映像信号を再生する画像復号装置について説明する。
図1はこの発明の実施の形態1による画像符号化装置を示す構成図である。
図1において、シーン相関測定パラメータ算出部1は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、MPEG−2映像符号化方式によって圧縮符号化されたMPEG−2ビデオビットストリーム(第1の映像符号化データ)を入力すると、そのMPEG−2ビデオビットストリームに含まれている各シーンの映像(以下、「シーン映像」と称する)毎に、他のシーン映像との相関を測定する尺度となるシーン相関測定パラメータを算出する処理を実施する。
ここで、シーンは、所定の時間の単位でもよいし、MPEG−2ビデオビットストリームのデータ構造を規定するGOP(Group Of Picture)、即ち、MPEG−2ビデオビットストリームに対してランダムアクセスが可能なデータ単位(2つのIピクチャ間に含まれる全ピクチャデータ)などでもよい。
図1において、シーン相関測定パラメータ算出部1は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、MPEG−2映像符号化方式によって圧縮符号化されたMPEG−2ビデオビットストリーム(第1の映像符号化データ)を入力すると、そのMPEG−2ビデオビットストリームに含まれている各シーンの映像(以下、「シーン映像」と称する)毎に、他のシーン映像との相関を測定する尺度となるシーン相関測定パラメータを算出する処理を実施する。
ここで、シーンは、所定の時間の単位でもよいし、MPEG−2ビデオビットストリームのデータ構造を規定するGOP(Group Of Picture)、即ち、MPEG−2ビデオビットストリームに対してランダムアクセスが可能なデータ単位(2つのIピクチャ間に含まれる全ピクチャデータ)などでもよい。
データ記録部2は例えばハードディスクやSSDなどの記録媒体から構成されており、シーン相関測定パラメータ算出部1により算出されたシーン相関測定パラメータを記録する。
また、データ記録部2は後述するH.264変換部4により変換されたマスターストリーム(第2の映像符号化データ)を記録するとともに、後述する多重化部7から出力されたスレーブ符号化データなどを記録する。
スレーブ符号化データの詳細は後述するが、シーン内・シーン間適応符号化部6により変換されたスレーブストリーム(第3の映像符号化データ)の中で、シーン間予測判定部5により検索された符号化データを用いずに変換されたシーン映像単位の符号化データ(シーン内予測符号化データ)と、シーン間予測判定部5により検索された符号化データなどを示すスレーブストリーム符号化管理情報とから構成されている。
また、データ記録部2は後述するH.264変換部4により変換されたマスターストリーム(第2の映像符号化データ)を記録するとともに、後述する多重化部7から出力されたスレーブ符号化データなどを記録する。
スレーブ符号化データの詳細は後述するが、シーン内・シーン間適応符号化部6により変換されたスレーブストリーム(第3の映像符号化データ)の中で、シーン間予測判定部5により検索された符号化データを用いずに変換されたシーン映像単位の符号化データ(シーン内予測符号化データ)と、シーン間予測判定部5により検索された符号化データなどを示すスレーブストリーム符号化管理情報とから構成されている。
スイッチ3は外部から与えられる再圧縮方法識別信号が「MPEG−2ビデオビットストリームをマスターストリームとして再圧縮する」旨を指示している場合、シーン相関測定パラメータ算出部1から出力されたMPEG−2ビデオビットストリームをH.264変換部4に与え、その再圧縮方法識別信号が「MPEG−2ビデオビットストリームをスレーブストリームとして再圧縮する」旨を指示している場合、シーン相関測定パラメータ算出部1から出力されたMPEG−2ビデオビットストリームをシーン内・シーン間適応符号化部6に与える処理を実施する。
H.264変換部4は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、スイッチ3からMPEG−2ビデオビットストリームが与えられると、そのMPEG−2ビデオビットストリームを所定の処理手順によってH.264映像符号化方式に従うビデオビットストリームに変換し、そのビデオビットストリームをマスターストリームとしてデータ記録部2に記録する処理を実施する。
シーン間予測判定部5は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、シーン相関測定パラメータ算出部1により算出されたシーン相関測定パラメータ(相関測定パラメータA,相関測定パラメータB)に基づいて、データ記録部2に記録されているマスターストリーム内のシーン映像単位の符号化データの中から、シーン内・シーン間適応符号化部6が予測符号化する際に、MPEG−2ビデオビットストリーム内のシーン映像単位の符号化データの代わりに予測参照に用いる符号化データを検索する処理を実施する。
シーン相関測定パラメータAは、再圧縮方法識別信号が「MPEG−2ビデオビットストリームをマスターストリームとして再圧縮する」旨を指示している際に算出されたパラメータであり、シーン相関測定パラメータBは、再圧縮方法識別信号が「MPEG−2ビデオビットストリームをスレーブストリームとして再圧縮する」旨を指示している際に算出されたパラメータである。
シーン相関測定パラメータAは、再圧縮方法識別信号が「MPEG−2ビデオビットストリームをマスターストリームとして再圧縮する」旨を指示している際に算出されたパラメータであり、シーン相関測定パラメータBは、再圧縮方法識別信号が「MPEG−2ビデオビットストリームをスレーブストリームとして再圧縮する」旨を指示している際に算出されたパラメータである。
即ち、シーン間予測判定部5はシーン相関測定パラメータ算出部1により算出されたシーン相関測定パラメータA,Bを用いて、MPEG−2ビデオビットストリーム内の各々のシーン映像と、データ記録部2に記録されているマスターストリーム内の各々のシーン映像との相関値を測定するとともに、MPEG−2ビデオビットストリーム内の各々のシーン映像に対して、相関値が最高のマスターストリーム内のシーン映像を特定し、その相関値が所定値以上であれば、そのシーン映像の符号化データを予測参照に用いる符号化データに決定する処理を実施する。
また、シーン間予測判定部5は予測参照に用いる符号化データが見つかれば(相関が高いシーン映像が存在する場合)、「当該処理対象のシーンでは、マスターストリーム内の相関が高いシーン映像の符号化データを利用して符号化を行う」旨を示し、予測参照に用いる符号化データが見つからなければ(相関が高いシーン映像の符号化データが存在しない場合)、「当該処理対象のシーンでは、マスターストリーム内の符号化データを使用せず、シーン内に閉じた符号化を行う」旨を示すスレーブストリーム符号化管理情報をシーン内・シーン間適応符号化部6及び多重化部7に出力する処理を実施する。
また、シーン間予測判定部5は予測参照に用いる符号化データが見つかれば(相関が高いシーン映像が存在する場合)、「当該処理対象のシーンでは、マスターストリーム内の相関が高いシーン映像の符号化データを利用して符号化を行う」旨を示し、予測参照に用いる符号化データが見つからなければ(相関が高いシーン映像の符号化データが存在しない場合)、「当該処理対象のシーンでは、マスターストリーム内の符号化データを使用せず、シーン内に閉じた符号化を行う」旨を示すスレーブストリーム符号化管理情報をシーン内・シーン間適応符号化部6及び多重化部7に出力する処理を実施する。
なお、スレーブストリーム符号化管理情報には、少なくとも、データ記録部2に記録される複数のビットストリームデータのうち、マスターストリームを特定するマスターストリームID、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いるか否かを特定するシーン間予測指示フラグ、マスターストリーム上でのマスターシーン(予測参照に用いるシーン)を特定するマスターシーンIDなどを含んでいる。
シーン内・シーン間適応符号化部6は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、データ記録部2に記録されたマスターストリーム内のシーン映像単位の符号化データの中で、シーン間予測判定部5により予測参照に用いる代わりの符号化データが検索されていない符号化データと、シーン間予測判定部5により検索された符号化データとを予測参照に用いて、そのMPEG−2ビデオビットストリームをスレーブストリームに変換する処理を実施する。
多重化部7は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、シーン内・シーン間適応符号化部6により変換されたスレーブストリームと、シーン間予測判定部5から出力されたスレーブストリーム符号化管理情報とを多重化し、その多重化結果をスレーブ符号化データとしてデータ記録部2に記録する処理を実施する。
図1の例では、画像符号化装置の構成要素であるシーン相関測定パラメータ算出部1、データ記録部2、スイッチ3、H.264変換部4、シーン間予測判定部5、シーン内・シーン間適応符号化部6及び多重化部7のそれぞれが専用のハードウェアで構成されているものを想定しているが、画像符号化装置がコンピュータで構成されていてもよい。
画像符号化装置がコンピュータで構成されている場合、データ記録部2をコンピュータのメモリ上に構成するとともに、シーン相関測定パラメータ算出部1、スイッチ3、H.264変換部4、シーン間予測判定部5、シーン内・シーン間適応符号化部6及び多重化部7の処理内容を記述しているプログラムをコンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにすればよい。
図2はこの発明の実施の形態1による画像符号化装置の処理内容(画像符号化方法)を示すフローチャートである。
画像符号化装置がコンピュータで構成されている場合、データ記録部2をコンピュータのメモリ上に構成するとともに、シーン相関測定パラメータ算出部1、スイッチ3、H.264変換部4、シーン間予測判定部5、シーン内・シーン間適応符号化部6及び多重化部7の処理内容を記述しているプログラムをコンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにすればよい。
図2はこの発明の実施の形態1による画像符号化装置の処理内容(画像符号化方法)を示すフローチャートである。
図3はこの発明の実施の形態1による画像符号化装置のシーン内・シーン間適応符号化部6を示す構成図である。
図3において、MPEG−2復号部11はスイッチ3からMPEG−2ビデオビットストリームが与えられると、そのMPEG−2ビデオビットストリーム内の各々のシーン映像の符号化データに対する復号処理を実施して、シーン映像単位に復号画像を生成する処理を実施する。
スイッチ12はシーン間予測判定部5から出力されたスレーブストリーム符号化管理情報に含まれているシーン間予測指示フラグが、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いない旨を示していれば、MPEG−2復号部11により生成された復号画像をシーン内予測符号化部14に出力し、そのシーン間予測指示フラグが、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いる旨を示していれば、MPEG−2復号部11により生成された復号画像をシーン間予測符号化部15に出力する処理を実施する。
図3において、MPEG−2復号部11はスイッチ3からMPEG−2ビデオビットストリームが与えられると、そのMPEG−2ビデオビットストリーム内の各々のシーン映像の符号化データに対する復号処理を実施して、シーン映像単位に復号画像を生成する処理を実施する。
スイッチ12はシーン間予測判定部5から出力されたスレーブストリーム符号化管理情報に含まれているシーン間予測指示フラグが、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いない旨を示していれば、MPEG−2復号部11により生成された復号画像をシーン内予測符号化部14に出力し、そのシーン間予測指示フラグが、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いる旨を示していれば、MPEG−2復号部11により生成された復号画像をシーン間予測符号化部15に出力する処理を実施する。
シーン間予測参照箇所抽出部13はシーン間予測判定部5から出力されたスレーブストリーム符号化管理情報に含まれているシーン間予測指示フラグが、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いる旨を示していれば、そのスレーブストリーム符号化管理情報に含まれているマスターストリームIDが示すマスターストリームの中から、マスターシーンIDが示すシーン映像の符号化データを抽出し、その符号化データに対するH.264復号処理を実施して、そのシーン映像の復号画像(以下、「マスターストリーム復号画像」と称する)を生成する処理を実施する。
シーン内予測符号化部14はマスターストリーム内の符号化データを一切使用することなく、スイッチ12から出力された復号画像に対してH.264圧縮符号化処理を実施し、その符号化処理結果であるシーン内予測符号化データを出力する処理を実施する。
シーン間予測符号化部15はスイッチ12から出力された復号画像の時間相関と、その復号画像とシーン間予測参照箇所抽出部13により生成されたマスターストリーム復号画像における同一時刻位置の画像データ間の相関とを利用して、H.264の動き補償処理ないしイントラ予測を用いた圧縮符号化処理を実行して、その処理結果であるシーン間予測符号化データを出力する処理を実施する。
シーン間予測符号化部15はスイッチ12から出力された復号画像の時間相関と、その復号画像とシーン間予測参照箇所抽出部13により生成されたマスターストリーム復号画像における同一時刻位置の画像データ間の相関とを利用して、H.264の動き補償処理ないしイントラ予測を用いた圧縮符号化処理を実行して、その処理結果であるシーン間予測符号化データを出力する処理を実施する。
スレーブストリーム多重化部16はシーン内予測符号化部14から出力されたシーン内予測符号化データとシーン間予測符号化部15から出力されたシーン間予測符号化データを多重化してスレーブストリームを生成し、そのスレーブストリームを多重化部7に出力する処理を実施する。
図4はこの発明の実施の形態1による画像復号装置を示す構成図である。
図4において、データ記録部2は図1の画像符号化装置のデータ記録部2と同じ記録部である。
スイッチ21は外部から与えられるストリーム種別識別信号が「当該符号化データをマスターストリームとして復号する」旨を指示している場合、データ記録部2に記録されているマスターストリームを読み込んでH.264復号部22に出力し、そのストリーム種別識別信号が「当該符号化データをスレーブ符号化データとして復号する」旨を指示している場合、データ記録部2に記録されているスレーブ符号化データを多重分離部23に出力する処理を実施する。
図4において、データ記録部2は図1の画像符号化装置のデータ記録部2と同じ記録部である。
スイッチ21は外部から与えられるストリーム種別識別信号が「当該符号化データをマスターストリームとして復号する」旨を指示している場合、データ記録部2に記録されているマスターストリームを読み込んでH.264復号部22に出力し、そのストリーム種別識別信号が「当該符号化データをスレーブ符号化データとして復号する」旨を指示している場合、データ記録部2に記録されているスレーブ符号化データを多重分離部23に出力する処理を実施する。
H.264復号部22は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、スイッチ21からマスターストリームを受けると、そのマスターストリームに対してH.264映像符号化方式に従う所定の復号処理を実施することで、再生映像を生成する処理を実施する。
多重分離部23は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、スイッチ21からスレーブ符号化データを受けると、そのスレーブ符号化データをスレーブストリームとスレーブストリーム符号化管理情報に分離する処理を実施する。
復号ストリーム成型部24は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、データ記録部2に記録されている複数のマスターストリームのうち、多重分離部23により分離されたスレーブストリーム符号化管理情報に含まれているマスターストリームIDが示すマスターストリームを読み出すとともに、そのマスターストリームの中から、そのスレーブストリーム符号化管理情報に含まれているマスターシーンIDが示すシーン映像の符号化データを抽出し、その符号化データを多重分離部23により分離されたスレーブストリームの対応するシーン映像の位置に埋め込むことで、復号ストリームを成型する処理を実施する。
復号ストリーム成型部24は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、データ記録部2に記録されている複数のマスターストリームのうち、多重分離部23により分離されたスレーブストリーム符号化管理情報に含まれているマスターストリームIDが示すマスターストリームを読み出すとともに、そのマスターストリームの中から、そのスレーブストリーム符号化管理情報に含まれているマスターシーンIDが示すシーン映像の符号化データを抽出し、その符号化データを多重分離部23により分離されたスレーブストリームの対応するシーン映像の位置に埋め込むことで、復号ストリームを成型する処理を実施する。
スレーブ映像復号部25は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、復号ストリーム成型部24により成型された復号ストリームに対して、所定の復号処理を実施することで、スレーブ符号化データに対応する再生映像を生成する処理を実施する。
図4の例では、画像復号装置の構成要素であるデータ記録部2、スイッチ21、H.264復号部22、多重分離部23、復号ストリーム成型部24及びスレーブ映像復号部25のそれぞれが専用のハードウェアで構成されているものを想定しているが、画像復号装置がコンピュータで構成されていてもよい。
画像復号装置がコンピュータで構成されている場合、データ記録部2をコンピュータのメモリ上に構成するとともに、スイッチ21、H.264復号部22、多重分離部23、復号ストリーム成型部24及びスレーブ映像復号部25の処理内容を記述しているプログラムをコンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにすればよい。
図5はこの発明の実施の形態1による画像復号装置の処理内容(画像復号方法)を示すフローチャートである。
画像復号装置がコンピュータで構成されている場合、データ記録部2をコンピュータのメモリ上に構成するとともに、スイッチ21、H.264復号部22、多重分離部23、復号ストリーム成型部24及びスレーブ映像復号部25の処理内容を記述しているプログラムをコンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにすればよい。
図5はこの発明の実施の形態1による画像復号装置の処理内容(画像復号方法)を示すフローチャートである。
次に動作について説明する。
最初に、図1の画像符号化装置の処理内容を説明する。
シーン相関測定パラメータ算出部1は、MPEG−2映像符号化方式によって圧縮符号化されたMPEG−2ビデオビットストリームを入力すると、そのMPEG−2ビデオビットストリームのシーン映像毎に、他のシーン映像との相関を測定する尺度となるシーン相関測定パラメータを算出する(図2のステップST1)。
ここで、シーンは、所定の時間の単位でもよいし、MPEG−2ビデオビットストリームのデータ構造を規定するGOP、即ち、MPEG−2ビデオビットストリームに対してランダムアクセスが可能なデータ単位(2つのIピクチャ間に含まれる全ピクチャデータ)などでもよい。
シーン相関測定パラメータ算出部1により算出されたシーン映像毎のシーン相関測定パラメータは、データ記録部2に記録される。
最初に、図1の画像符号化装置の処理内容を説明する。
シーン相関測定パラメータ算出部1は、MPEG−2映像符号化方式によって圧縮符号化されたMPEG−2ビデオビットストリームを入力すると、そのMPEG−2ビデオビットストリームのシーン映像毎に、他のシーン映像との相関を測定する尺度となるシーン相関測定パラメータを算出する(図2のステップST1)。
ここで、シーンは、所定の時間の単位でもよいし、MPEG−2ビデオビットストリームのデータ構造を規定するGOP、即ち、MPEG−2ビデオビットストリームに対してランダムアクセスが可能なデータ単位(2つのIピクチャ間に含まれる全ピクチャデータ)などでもよい。
シーン相関測定パラメータ算出部1により算出されたシーン映像毎のシーン相関測定パラメータは、データ記録部2に記録される。
ここで、シーン相関測定パラメータの具体的な事例について述べる。
シーン相関測定パラメータは、「2つのシーンの間の類似度」を測ることを可能とする量を用いるものである。
例えば、MPEG−2ビデオビットストリームのIピクチャ符号化データに含まれるDCT係数のDC成分から縮小画像を構成して、その縮小画像の輝度平均や輝度分散などのテクスチャ特徴、あるいは、その縮小画像の色平均や色分散などの色特徴を示す量を生成して、そのテクスチャ特徴又は色特徴を示す量をシーン相関測定パラメータとして利用することが考えられる。
また、そのDC成分からなる縮小画像に対して、以下の非特許文献1に開示されている「Image Signature」を生成し、「Image Signature」をシーン相関測定パラメータとして利用するようにしてもよい。
[非特許文献1]
西川,P.Brasnett他、“MPEG−7 技術 Image Signature:画像同定技術”、三菱電機技報2008年12月号
シーン相関測定パラメータは、「2つのシーンの間の類似度」を測ることを可能とする量を用いるものである。
例えば、MPEG−2ビデオビットストリームのIピクチャ符号化データに含まれるDCT係数のDC成分から縮小画像を構成して、その縮小画像の輝度平均や輝度分散などのテクスチャ特徴、あるいは、その縮小画像の色平均や色分散などの色特徴を示す量を生成して、そのテクスチャ特徴又は色特徴を示す量をシーン相関測定パラメータとして利用することが考えられる。
また、そのDC成分からなる縮小画像に対して、以下の非特許文献1に開示されている「Image Signature」を生成し、「Image Signature」をシーン相関測定パラメータとして利用するようにしてもよい。
[非特許文献1]
西川,P.Brasnett他、“MPEG−7 技術 Image Signature:画像同定技術”、三菱電機技報2008年12月号
「Image Signature」は、以下の非特許文献2に開示されているトレース変換を用いて、輝度情報を空間的周波数で表現した量であり、画像の同一性を評価するパラメータとして国際標準化されている。
具体的には、シーン先頭の「Image Signature」、または、シーン内に含まれる複数のIピクチャの縮小画像に対応する「Image Signature」の集合をシーン相関測定パラメータとして利用することが考えられる。
[非特許文献2]
A. Kadyrov、 M. Petrou、 “The Trace Transform and Its Applications”、IEEE Trans.Pattern Analysis and Machine Intelligence、vol.23 no.8 pp.811−828 2001
具体的には、シーン先頭の「Image Signature」、または、シーン内に含まれる複数のIピクチャの縮小画像に対応する「Image Signature」の集合をシーン相関測定パラメータとして利用することが考えられる。
[非特許文献2]
A. Kadyrov、 M. Petrou、 “The Trace Transform and Its Applications”、IEEE Trans.Pattern Analysis and Machine Intelligence、vol.23 no.8 pp.811−828 2001
また、以下の非特許文献3に開示される「Video Signature」を生成し、「Video Signature」をシーン相関測定パラメータとして利用するようにしてもよい。
[非特許文献3]
工藤、西川、“画像同定技術(Visual Signature)”、 三菱電機技報2011年11月号
[非特許文献3]
工藤、西川、“画像同定技術(Visual Signature)”、 三菱電機技報2011年11月号
上記のいずれにおいても、MPEG−2ビデオビットストリームのIピクチャ符号化データに含まれるDCT係数のDC成分から縮小画像を生成して、その縮小画像に対する特徴量をシーン相関測定パラメータとしているが、MPEG−2ビデオビットストリームを画像データに復号して、復号画像レベルで同様の特徴量の抽出を実行するようにしてもよい。
これにより、処理量は増加するが、実際の画像データに即した特徴量を抽出することができる。
これにより、処理量は増加するが、実際の画像データに即した特徴量を抽出することができる。
スイッチ3は、外部から与えられる再圧縮方法識別信号が「MPEG−2ビデオビットストリームをマスターストリームとして再圧縮する」旨を指示していれば(ステップST2)、シーン相関測定パラメータ算出部1から出力されたMPEG−2ビデオビットストリームをH.264変換部4に与える。
一方、その再圧縮方法識別信号が「MPEG−2ビデオビットストリームをスレーブストリームとして再圧縮する」旨を指示していれば(ステップST2)、シーン相関測定パラメータ算出部1から出力されたMPEG−2ビデオビットストリームをシーン内・シーン間適応符号化部6に与える。
一方、その再圧縮方法識別信号が「MPEG−2ビデオビットストリームをスレーブストリームとして再圧縮する」旨を指示していれば(ステップST2)、シーン相関測定パラメータ算出部1から出力されたMPEG−2ビデオビットストリームをシーン内・シーン間適応符号化部6に与える。
H.264変換部4は、スイッチ3からMPEG−2ビデオビットストリームが与えられると、そのMPEG−2ビデオビットストリームを所定の処理手順によってH.264映像符号化方式に従うビデオビットストリームに変換し、そのビデオビットストリームをマスターストリームとしてデータ記録部2に記録する(ステップST3)。
シーン間予測判定部5は、シーン相関測定パラメータ算出部1がシーン相関測定パラメータA又はシーン相関測定パラメータBを算出すると、そのシーン相関測定パラメータA,Bに基づいて、データ記録部2に記録されているマスターストリーム内のシーン映像単位の符号化データの中から、シーン内・シーン間適応符号化部6が予測符号化する際に、MPEG−2ビデオビットストリーム内のシーン映像単位の符号化データの代わりに予測参照に用いる符号化データを検索する。
シーン相関測定パラメータAは、再圧縮方法識別信号が「MPEG−2ビデオビットストリームをマスターストリームとして再圧縮する」旨を指示している際に算出されたパラメータであり、シーン相関測定パラメータBは、再圧縮方法識別信号が「MPEG−2ビデオビットストリームをスレーブストリームとして再圧縮する」旨を指示している際に算出されたパラメータである。
以下、シーン間予測判定部5による符号化データの検索処理を具体的に説明する。
シーン相関測定パラメータAは、再圧縮方法識別信号が「MPEG−2ビデオビットストリームをマスターストリームとして再圧縮する」旨を指示している際に算出されたパラメータであり、シーン相関測定パラメータBは、再圧縮方法識別信号が「MPEG−2ビデオビットストリームをスレーブストリームとして再圧縮する」旨を指示している際に算出されたパラメータである。
以下、シーン間予測判定部5による符号化データの検索処理を具体的に説明する。
まず、シーン間予測判定部5は、シーン相関測定パラメータ算出部1により算出されたシーン相関測定パラメータA,Bを用いて、MPEG−2ビデオビットストリーム内の各々のシーン映像と、データ記録部2に記録されているマスターストリーム内の各々のシーン映像との相関値を測定する。
次に、シーン間予測判定部5は、MPEG−2ビデオビットストリーム内のシーン映像毎に、当該シーン映像に対するマスターストリーム内の各々のシーン映像の相関値を比較し、最も相関値が大きいマスターストリーム内のシーン映像を探索する。
シーン間予測判定部5は、最も相関値が大きいマスターストリーム内のシーン映像を探索すると、その相関値が予め設定している所定値以上であれば、そのシーン映像の符号化データを予測参照に用いるシーン映像に決定する。
一方、その相関値が予め設定している所定値に満たなければ、そのマスターストリーム内のシーン映像の符号化データを予測参照に用いないものとする。
次に、シーン間予測判定部5は、MPEG−2ビデオビットストリーム内のシーン映像毎に、当該シーン映像に対するマスターストリーム内の各々のシーン映像の相関値を比較し、最も相関値が大きいマスターストリーム内のシーン映像を探索する。
シーン間予測判定部5は、最も相関値が大きいマスターストリーム内のシーン映像を探索すると、その相関値が予め設定している所定値以上であれば、そのシーン映像の符号化データを予測参照に用いるシーン映像に決定する。
一方、その相関値が予め設定している所定値に満たなければ、そのマスターストリーム内のシーン映像の符号化データを予測参照に用いないものとする。
なお、シーン間予測判定部5による最も相関値が大きいマスターストリーム内のシーン映像を探索する処理は、シーン相関測定パラメータAとシーン相関測定パラメータBのマッチング処理に対応し、例えば、上記の非特許文献3に開示されている「Image Signature」や「Video Signature」などのマッチング処理を利用することができる。
シーン間予測判定部5は、シーン内・シーン間適応符号化部6が予測参照に用いる符号化データが見つかれば(MPEG−2ビデオビットストリーム内のシーン映像と相関が高いマスターストリーム内のシーン映像が存在する場合)、「当該処理対象のシーンでは、マスターストリーム内の相関が高いシーン映像の符号化データを利用して符号化を行う」旨を示すスレーブストリーム符号化管理情報をシーン内・シーン間適応符号化部6及び多重化部7に出力する。
一方、シーン内・シーン間適応符号化部6が予測参照に用いる符号化データが見つからなければ(MPEG−2ビデオビットストリーム内のシーン映像と相関が高いマスターストリーム内のシーン映像が存在しない場合)、「当該処理対象のシーンでは、マスターストリーム内の符号化データを使用せず、シーン内に閉じた符号化を行う」旨を示すスレーブストリーム符号化管理情報をシーン内・シーン間適応符号化部6及び多重化部7に出力する。
一方、シーン内・シーン間適応符号化部6が予測参照に用いる符号化データが見つからなければ(MPEG−2ビデオビットストリーム内のシーン映像と相関が高いマスターストリーム内のシーン映像が存在しない場合)、「当該処理対象のシーンでは、マスターストリーム内の符号化データを使用せず、シーン内に閉じた符号化を行う」旨を示すスレーブストリーム符号化管理情報をシーン内・シーン間適応符号化部6及び多重化部7に出力する。
なお、スレーブストリーム符号化管理情報には、少なくとも、データ記録部2に記録される複数のビットストリームデータのうち、マスターストリームを特定するマスターストリームID、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いるか否かを特定するシーン間予測指示フラグ、マスターストリーム上でのマスターシーン(予測参照に用いるシーン)を特定するマスターシーンIDなどを含んでいる。
シーン間予測判定部5からスレーブストリーム符号化管理情報が出力された後は、シーン相関測定パラメータBは不要になるため、データ記録部2から消去するように構成してもよい。
シーン相関測定パラメータAについては、後々、別のスレーブストリームを生成する際に必要となるため、データ記録部2に保存しておくように構成してもよいし、データ記録部2の記録容量を確保するため、スレーブストリームを生成する度に、マスターストリームから随時生成するように構成してもよい。
なお、スレーブストリームを生成する際に、マスターストリームを使用しないようにする場合には、シーン相関測定パラメータAも不要になるため、データ記録部2から消去するように構成する。
シーン相関測定パラメータAについては、後々、別のスレーブストリームを生成する際に必要となるため、データ記録部2に保存しておくように構成してもよいし、データ記録部2の記録容量を確保するため、スレーブストリームを生成する度に、マスターストリームから随時生成するように構成してもよい。
なお、スレーブストリームを生成する際に、マスターストリームを使用しないようにする場合には、シーン相関測定パラメータAも不要になるため、データ記録部2から消去するように構成する。
シーン内・シーン間適応符号化部6は、データ記録部2に記録されたマスターストリーム内のシーン映像単位の符号化データの中で、シーン間予測判定部5により予測参照に用いる代わりの符号化データが検索されていない符号化データと、シーン間予測判定部5により検索された符号化データとを予測参照に用いて、そのMPEG−2ビデオビットストリームをスレーブストリームに変換する。
ここで、図6はスレーブ符号化データとマスターストリームの関係を示す説明図である。
図6に示すマスターストリームは、データ記録部2に記録されている1以上のマスターストリームのうち、スレーブストリーム符号化管理情報に含まれているマスターストリームIDが示すマスターストリームであり、H.264映像符号化方式によって生成されている。
スレーブストリームは、スレーブストリーム符号化管理情報に含まれているシーン間予測指示フラグによって、マスターストリーム内のシーン映像単位の符号化データと、マスターストリーム内のシーン映像単位の符号化データが代わりに使用されない符号化データとに分類される。
また、スレーブストリーム符号化管理情報に含まれているマスターシーンIDによって、マスターストリーム上でのマスターシーン(予測参照に用いるシーン)が特定される。
図6に示すマスターストリームは、データ記録部2に記録されている1以上のマスターストリームのうち、スレーブストリーム符号化管理情報に含まれているマスターストリームIDが示すマスターストリームであり、H.264映像符号化方式によって生成されている。
スレーブストリームは、スレーブストリーム符号化管理情報に含まれているシーン間予測指示フラグによって、マスターストリーム内のシーン映像単位の符号化データと、マスターストリーム内のシーン映像単位の符号化データが代わりに使用されない符号化データとに分類される。
また、スレーブストリーム符号化管理情報に含まれているマスターシーンIDによって、マスターストリーム上でのマスターシーン(予測参照に用いるシーン)が特定される。
以下、シーン内・シーン間適応符号化部6によるストリームの変換処理を具体的に説明する。
まず、シーン内・シーン間適応符号化部6のMPEG−2復号部11は、スイッチ3からMPEG−2ビデオビットストリームが与えられると、そのMPEG−2ビデオビットストリーム内の各々のシーン映像の符号化データに対する復号処理を実施して、シーン映像単位に復号画像を生成する(ステップST4)。
まず、シーン内・シーン間適応符号化部6のMPEG−2復号部11は、スイッチ3からMPEG−2ビデオビットストリームが与えられると、そのMPEG−2ビデオビットストリーム内の各々のシーン映像の符号化データに対する復号処理を実施して、シーン映像単位に復号画像を生成する(ステップST4)。
スイッチ12は、シーン間予測判定部5から出力されたスレーブストリーム符号化管理情報に含まれているシーン間予測指示フラグが、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いない旨を示していれば(ステップST5)、MPEG−2復号部11により生成された復号画像をシーン内予測符号化部14に出力する。
そのシーン間予測指示フラグが、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いる旨を示していれば(ステップST5)、MPEG−2復号部11により生成された復号画像をシーン間予測符号化部15に出力する。
そのシーン間予測指示フラグが、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いる旨を示していれば(ステップST5)、MPEG−2復号部11により生成された復号画像をシーン間予測符号化部15に出力する。
シーン間予測参照箇所抽出部13は、シーン間予測判定部5から出力されたスレーブストリーム符号化管理情報に含まれているシーン間予測指示フラグが、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いる旨を示していれば(ステップST5)、そのスレーブストリーム符号化管理情報に含まれているマスターストリームIDが示すマスターストリームの中から、マスターシーンIDが示すシーン映像の符号化データを抽出する(ステップST6)。
シーン間予測参照箇所抽出部13は、マスターシーンIDが示すシーン映像の符号化データを抽出すると、その符号化データに対するH.264復号処理を実施して、そのシーン映像の復号画像であるマスターストリーム復号画像を生成する(ステップST7)。
シーン間予測参照箇所抽出部13は、マスターシーンIDが示すシーン映像の符号化データを抽出すると、その符号化データに対するH.264復号処理を実施して、そのシーン映像の復号画像であるマスターストリーム復号画像を生成する(ステップST7)。
この際、マスターストリームから抽出されるシーン映像の符号化データは、シーン先頭のピクチャがIDRピクチャであって、ランダムアクセスが可能なデータとして構成するようにしてもよいし、シーン先頭のピクチャがIDRピクチャでない状態で構成してもよい。
前者は抽出処理が簡易となる利点があるが、IDRピクチャを頻繁に挿入することになるため、マスターストリーム自体の圧縮効率が制限されるというトレードオフの関係がある。
後者は逆に、IDR挿入の影響を受けないので、マスターストリーム自体の圧縮効率を維持することができるが、シーン先頭のピクチャを正常に復号可能となる最も時間的に近いIDRピクチャ位置から符号化データを抽出して復号するなど、抽出処理が複雑になるというトレードオフの関係がある。これらは実際の装置の要求条件に基づいて構成することが可能である。
前者は抽出処理が簡易となる利点があるが、IDRピクチャを頻繁に挿入することになるため、マスターストリーム自体の圧縮効率が制限されるというトレードオフの関係がある。
後者は逆に、IDR挿入の影響を受けないので、マスターストリーム自体の圧縮効率を維持することができるが、シーン先頭のピクチャを正常に復号可能となる最も時間的に近いIDRピクチャ位置から符号化データを抽出して復号するなど、抽出処理が複雑になるというトレードオフの関係がある。これらは実際の装置の要求条件に基づいて構成することが可能である。
ここで、図7はシーン内・シーン間適応符号化部6におけるシーン内予測符号化部14及びシーン間予測符号化部15の処理を示す説明図である。
図7において、記号I,P,Bは、マスターストリームから抽出されるシーン映像単位の符号化データの中の各ピクチャの符号化タイプを示しており、記号I’,P’,B’は、記号I,P,Bのピクチャの時刻位置に対応するスレーブストリーム上の各ピクチャの符号化タイプを示している。
図7では、I’,P’,B’ピクチャは、マスターストリーム上の対応するI,P,Bピクチャと等価なシーン内予測符号化に加えて、同一時刻位置に対応するピクチャからのシーン間予測参照も可能とする構成を図示している。
このことは、本発明が、I’,P’,B’ピクチャに対して、I,P,Bピクチャと常に等価な予測符号化処理を実行する制約を課すものではない。
図7において、記号I,P,Bは、マスターストリームから抽出されるシーン映像単位の符号化データの中の各ピクチャの符号化タイプを示しており、記号I’,P’,B’は、記号I,P,Bのピクチャの時刻位置に対応するスレーブストリーム上の各ピクチャの符号化タイプを示している。
図7では、I’,P’,B’ピクチャは、マスターストリーム上の対応するI,P,Bピクチャと等価なシーン内予測符号化に加えて、同一時刻位置に対応するピクチャからのシーン間予測参照も可能とする構成を図示している。
このことは、本発明が、I’,P’,B’ピクチャに対して、I,P,Bピクチャと常に等価な予測符号化処理を実行する制約を課すものではない。
例えば、B’ピクチャでは、P’ピクチャに相当する符号化処理を行うように構成してもよい。
この実施の形態1では、説明の便宜上、マスターストリーム上から抽出される符号化データは、IDRピクチャから始まり(図7のIピクチャは「IDRピクチャ」とする)、Pピクチャ及びBピクチャの符号化データを用いて符号化されているものとし、スレーブストリームのI’,P’,B’ピクチャは、I,P,Bピクチャと等価な予測符号化処理とシーン間予測符号化処理とを併用するものとする。
この実施の形態1では、説明の便宜上、マスターストリーム上から抽出される符号化データは、IDRピクチャから始まり(図7のIピクチャは「IDRピクチャ」とする)、Pピクチャ及びBピクチャの符号化データを用いて符号化されているものとし、スレーブストリームのI’,P’,B’ピクチャは、I,P,Bピクチャと等価な予測符号化処理とシーン間予測符号化処理とを併用するものとする。
シーン間予測符号化部15は、スイッチ12から復号画像を受けると、その復号画像の時間相関と、その復号画像とシーン間予測参照箇所抽出部13により生成されたマスターストリーム復号画像における同一時刻位置の画像データ間の相関とを利用して、H.264の動き補償処理ないしイントラ予測を用いた圧縮符号化処理を実行して、その処理結果であるシーン間予測符号化データを出力する(ステップST8)。
シーン内予測符号化部14は、スイッチ12から復号画像を受けると、マスターストリーム内の符号化データを一切使用することなく、その復号画像に対してH.264圧縮符号化処理を実施し、その符号化処理結果であるシーン内予測符号化データを出力する(ステップST9)。
シーン内予測符号化部14は、スイッチ12から復号画像を受けると、マスターストリーム内の符号化データを一切使用することなく、その復号画像に対してH.264圧縮符号化処理を実施し、その符号化処理結果であるシーン内予測符号化データを出力する(ステップST9)。
ここで、I’ピクチャについては、スレーブ映像内の時間相関を使用せずに、Iピクチャからのシーン間相関を利用して予測符号化を行う。
これにより、スレーブストリーム上でのランダムアクセス性を維持しながら、符号化効率を高める効果が得られる。
なお、シーン間予測は、マクロブロック、ないし動き補償予測の単位となるブロックなど、所定の処理単位で使用するかしないかを局所的に選択可能とし、予測効率が高まる画像上の局所箇所のみシーン間予測を利用可能とするように構成する。
これにより、スレーブストリーム上でのランダムアクセス性を維持しながら、符号化効率を高める効果が得られる。
なお、シーン間予測は、マクロブロック、ないし動き補償予測の単位となるブロックなど、所定の処理単位で使用するかしないかを局所的に選択可能とし、予測効率が高まる画像上の局所箇所のみシーン間予測を利用可能とするように構成する。
この予測参照の制約と符号化データ配列とを、H.264の勧告AnnexHに規定されるMVC(マルチビュー符号化)仕様に従うように構成することにより、シーン間予測参照箇所抽出部13により抽出されるマスターストリームの符号化データをベースビューとして、シーン内予測符号化データとシーン間予測符号化データとからなるスレーブストリームをエンハンスビューとするMVC規格に従う符号化データとして構成することができる。
このように構成することによって、スレーブ符号化データに対応する映像信号を再生するために、図4のスレーブ映像復号部25をまったく新しい処理仕様でなく、標準仕様に準拠した既存の復号装置を採用して所望の動作を実現することが可能になる。
このように構成することによって、スレーブ符号化データに対応する映像信号を再生するために、図4のスレーブ映像復号部25をまったく新しい処理仕様でなく、標準仕様に準拠した既存の復号装置を採用して所望の動作を実現することが可能になる。
スレーブストリーム多重化部16は、シーン内予測符号化部14から出力されたシーン内予測符号化データと、シーン間予測符号化部15から出力されたシーン間予測符号化データとを多重化してスレーブストリームを生成し、そのスレーブストリームを多重化部7に出力する(ステップST10)。
多重化部7は、シーン内・シーン間適応符号化部6により変換されたスレーブストリームと、シーン間予測判定部5から出力されたスレーブストリーム符号化管理情報とを多重化し、その多重化結果をスレーブ符号化データとしてデータ記録部2に記録する(ステップST11)。
多重化部7は、シーン内・シーン間適応符号化部6により変換されたスレーブストリームと、シーン間予測判定部5から出力されたスレーブストリーム符号化管理情報とを多重化し、その多重化結果をスレーブ符号化データとしてデータ記録部2に記録する(ステップST11)。
ここで、多重化部7は、スレーブストリームとスレーブストリーム符号化管理情報を、物理的に1つのファイルないしストリーム等の形式で記録してもよいし、スレーブストリーム符号化管理情報は、例えば、XML形式のデータ等で管理し、スレーブストリームとのリンクを構成するように記録してもよい。
スレーブストリームは、それ単体で復号・映像再生を行う形式とせず、復号・映像再生を行う際、マスターストリームの符号化データをシーン映像毎に、適応的に抽出・追加するように構成する。
マスターストリームはデータ記録部2に記録されているので、マスターストリームの符号化データの抽出・追加処理は、スレーブストリームに対応する映像を復号再生する場合に随時実行するように構成すればよい。
これによって、マスターストリームを符号化に使用するシーン映像については、実際には復号に必要になるマスターストリームの符号化データを逐一記録データとして含まないように構成できるため、品質劣化を伴うことなく、スレーブストリームとして記録すべきデータ量を削減することができ、データ記録部2の記録容量を効率的に使用することができる。
スレーブストリームは、それ単体で復号・映像再生を行う形式とせず、復号・映像再生を行う際、マスターストリームの符号化データをシーン映像毎に、適応的に抽出・追加するように構成する。
マスターストリームはデータ記録部2に記録されているので、マスターストリームの符号化データの抽出・追加処理は、スレーブストリームに対応する映像を復号再生する場合に随時実行するように構成すればよい。
これによって、マスターストリームを符号化に使用するシーン映像については、実際には復号に必要になるマスターストリームの符号化データを逐一記録データとして含まないように構成できるため、品質劣化を伴うことなく、スレーブストリームとして記録すべきデータ量を削減することができ、データ記録部2の記録容量を効率的に使用することができる。
次に、図4の画像復号装置の処理内容を説明する。
まず、スイッチ21は、外部から与えられるストリーム種別識別信号にしたがってデータ記録部2に記録されている符号化データの復号処理手順の選択を行う。
即ち、スイッチ21は、外部から与えられるストリーム種別識別信号が「当該符号化データをマスターストリームとして復号する」旨を指示している場合(図5のステップST21)、データ記録部2に記録されているマスターストリームを読み込んで、そのマスターストリームをH.264復号部22に出力する(ステップST22)。
一方、そのストリーム種別識別信号が「当該符号化データをスレーブ符号化データとして復号する」旨を指示している場合(ステップST21)、データ記録部2に記録されているスレーブ符号化データを読み込んで、そのスレーブ符号化データを多重分離部23に出力する(ステップST23)。
まず、スイッチ21は、外部から与えられるストリーム種別識別信号にしたがってデータ記録部2に記録されている符号化データの復号処理手順の選択を行う。
即ち、スイッチ21は、外部から与えられるストリーム種別識別信号が「当該符号化データをマスターストリームとして復号する」旨を指示している場合(図5のステップST21)、データ記録部2に記録されているマスターストリームを読み込んで、そのマスターストリームをH.264復号部22に出力する(ステップST22)。
一方、そのストリーム種別識別信号が「当該符号化データをスレーブ符号化データとして復号する」旨を指示している場合(ステップST21)、データ記録部2に記録されているスレーブ符号化データを読み込んで、そのスレーブ符号化データを多重分離部23に出力する(ステップST23)。
H.264復号部22は、スイッチ21からマスターストリームを受けると、そのマスターストリームに対して、H.264映像符号化方式に従う所定の復号処理を実施することで、再生映像を生成する(ステップST24)。
多重分離部23は、スイッチ21からスレーブ符号化データを受けると、そのスレーブ符号化データをスレーブストリームとスレーブストリーム符号化管理情報に分離し、そのスレーブストリームとスレーブストリーム符号化管理情報を復号ストリーム成型部24に出力する(ステップST25)。
復号ストリーム成型部24は、多重分離部23からスレーブストリームとスレーブストリーム符号化管理情報を受けると、データ記録部2に記録されている複数のマスターストリームのうち、そのスレーブストリーム符号化管理情報に含まれているマスターストリームIDが示すマスターストリームの読み出しを行う。
また、復号ストリーム成型部24は、読み出したマスターストリームの中から、そのスレーブストリーム符号化管理情報に含まれているマスターシーンIDが示すシーン映像の符号化データを抽出する。図6のマスターストリームにおいて、斜線が施されている部分のシーン映像の符号化データを抽出する。
また、復号ストリーム成型部24は、読み出したマスターストリームの中から、そのスレーブストリーム符号化管理情報に含まれているマスターシーンIDが示すシーン映像の符号化データを抽出する。図6のマスターストリームにおいて、斜線が施されている部分のシーン映像の符号化データを抽出する。
復号ストリーム成型部24は、マスターシーンIDが示すシーン映像の符号化データを抽出すると、多重分離部23により分離されたスレーブストリーム内のシーン映像のうち、マスターシーンIDが示すシーン映像に対応するシーン映像を特定する。図6のスレーブストリームにおいて、斜線が施されている部分のシーン映像を特定する。
そして、復号ストリーム成型部24は、マスターストリームから抽出した符号化データをスレーブストリームの対応するシーン映像の位置に埋め込むことにより、復号ストリームを成型する(ステップST26)。
そして、復号ストリーム成型部24は、マスターストリームから抽出した符号化データをスレーブストリームの対応するシーン映像の位置に埋め込むことにより、復号ストリームを成型する(ステップST26)。
ここで、マスターストリームから抽出する符号化データについては、図6に示すように、一般には、シーン先頭フレームが、スレーブストリーム側の当該シーンの先頭と時間的に合致していないため、それらが整合するように、抽出したマスターストリームの各ピクチャ(アクセスユニット)に対応する符号化データの時刻情報を変換してスレーブストリームに追加する。
この構成によって、復号ストリームは、例えば、マスターストリームをベースビューとするストリーム(H.264勧告 Annex Hに規定されるMVC(マルチビュー符号化)形式のストリーム)として成型することが可能である。
この構成によって、復号ストリームは、例えば、マスターストリームをベースビューとするストリーム(H.264勧告 Annex Hに規定されるMVC(マルチビュー符号化)形式のストリーム)として成型することが可能である。
スレーブ映像復号部25は、復号ストリーム成型部24が復号ストリームを成型すると、その復号ストリームに対して、所定の復号処理を実施することで、スレーブ符号化データに対応する再生映像を生成する(ステップST27)。
以上で明らかなように、この実施の形態1によれば、MPEG−2ビデオビットストリーム内のシーン映像毎に、他のシーン映像との相関を測定する尺度となるシーン相関測定パラメータを算出するシーン相関測定パラメータ算出部1と、MPEG−2ビデオビットストリームをH.264映像符号化方式に従うビデオビットストリームに変換するH.264変換部4と、シーン相関測定パラメータ算出部1により算出されたシーン相関測定パラメータA,Bに基づいて、データ記録部2に記録されているマスターストリーム内のシーン映像単位の符号化データの中から、シーン内・シーン間適応符号化部6が予測符号化する際に、MPEG−2ビデオビットストリーム内のシーン映像単位の符号化データの代わりに予測参照に用いる符号化データを検索するシーン間予測判定部5とを設け、シーン内・シーン間適応符号化部6が、データ記録部2に記録されたマスターストリーム内のシーン映像単位の符号化データの中で、シーン間予測判定部5により予測参照に用いる代わりの符号化データが検索されていない符号化データと、シーン間予測判定部5により検索された符号化データとを予測参照に用いて、そのMPEG−2ビデオビットストリームをスレーブストリームに変換するように構成したので、処理量の増加や映像品質の低下を招くことなく、効率的な圧縮を行うことができる画像符号化装置が得られる効果を奏する。
また、この実施の形態1によれば、データ記録部2に記録されている複数のマスターストリームのうち、多重分離部23により分離されたスレーブストリーム符号化管理情報に含まれているマスターストリームIDが示すマスターストリームを読み出すとともに、そのマスターストリームの中から、そのスレーブストリーム符号化管理情報に含まれているマスターシーンIDが示すシーン映像の符号化データを抽出し、その符号化データを多重分離部23により分離されたスレーブストリームの対応するシーン映像の位置に埋め込むことで、復号ストリームを成型する復号ストリーム成型部24を設け、スレーブ映像復号部25が、復号ストリーム成型部24により成型された復号ストリームに対して、所定の復号処理を実施することで、スレーブ符号化データに対応する再生映像を生成するように構成したので、効率的に圧縮されている画像を復号することができる画像復号装置が得られる効果を奏する。
この実施の形態1では、画像符号化装置に入力されるビデオビットストリームがMPEG−2ビデオビットストリームであり、そのMPEG−2ビデオビットストリームの符号化方式を、H.264を用いたシーン内・シーン間適応予測符号化処理によって変換するものを示したが、画像符号化装置に入力されるビデオビットストリームがMPEG−2ビデオビットストリームに限るものではなく、例えば、MPEG−4ビジュアル(ISO/IEC 14496−2)や、H.264(ISO/IEC 14496−10)など、どのような映像符号化形式でもよい。
また、変換符号化に用いる符号化方式もH.264に限定するものではない。
また、変換符号化に用いる符号化方式もH.264に限定するものではない。
また、シーン相関測定パラメータ算出部1により算出されるシーン相関測定パラメータは、画像符号化装置に入力されるビデオビットストリームの映像符号化形式に基づいて定義するように構成できる。
また、スレーブ符号化データに対応する映像信号の符号化データフォーマットとして、H.264の勧告Annex Hに規定されるMVCを例に挙げたが、これもMVC形式に限定するものではなく、この実施の形態1における画像符号化装置や画像復号装置の構成に従うことによって、他の同様の標準符号化方式に対応するように構成することができる。
また、スレーブ符号化データに対応する映像信号の符号化データフォーマットとして、H.264の勧告Annex Hに規定されるMVCを例に挙げたが、これもMVC形式に限定するものではなく、この実施の形態1における画像符号化装置や画像復号装置の構成に従うことによって、他の同様の標準符号化方式に対応するように構成することができる。
実施の形態2.
上記実施の形態1では、マスターストリームとして再圧縮する「MPEG−2ビデオビットストリーム」、または、スレーブストリームとして再圧縮する「MPEG−2ビデオビットストリーム」がシーン相関測定パラメータ算出部1に入力されるものを示したが、マスターストリームとして再圧縮する「MPEG−2ビデオビットストリーム」とスレーブストリームとして再圧縮する「MPEG−2ビデオビットストリーム」とが単一のビデオビットストリームに含まれており、単一のビデオビットストリームがシーン相関測定パラメータ算出部1に入力されるものであってもよい。
上記実施の形態1では、マスターストリームとして再圧縮する「MPEG−2ビデオビットストリーム」、または、スレーブストリームとして再圧縮する「MPEG−2ビデオビットストリーム」がシーン相関測定パラメータ算出部1に入力されるものを示したが、マスターストリームとして再圧縮する「MPEG−2ビデオビットストリーム」とスレーブストリームとして再圧縮する「MPEG−2ビデオビットストリーム」とが単一のビデオビットストリームに含まれており、単一のビデオビットストリームがシーン相関測定パラメータ算出部1に入力されるものであってもよい。
図8はこの発明の実施の形態2による画像符号化装置を示す構成図であり、図において、図1と同一符号は同一または相当部分を示すので説明を省略する。
スイッチ31は外部から与えられる再圧縮方法識別信号が、「シーン相関測定パラメータ算出部1に入力されるMPEG−2ビデオビットストリームの前半部分がマスターストリームとして再圧縮するビデオビットストリームであり、後半部分がスレーブストリームとして再圧縮するビデオビットストリームである」旨を指示している場合、シーン相関測定パラメータ算出部1から出力されたMPEG−2ビデオビットストリームを分割して、そのMPEG−2ビデオビットストリームの前半部分をH.264変換部4に与え、そのMPEG−2ビデオビットストリームの後半部分をシーン内・シーン間適応符号化部6に与える処理を実施する。
スイッチ31は外部から与えられる再圧縮方法識別信号が、「シーン相関測定パラメータ算出部1に入力されるMPEG−2ビデオビットストリームの前半部分がマスターストリームとして再圧縮するビデオビットストリームであり、後半部分がスレーブストリームとして再圧縮するビデオビットストリームである」旨を指示している場合、シーン相関測定パラメータ算出部1から出力されたMPEG−2ビデオビットストリームを分割して、そのMPEG−2ビデオビットストリームの前半部分をH.264変換部4に与え、そのMPEG−2ビデオビットストリームの後半部分をシーン内・シーン間適応符号化部6に与える処理を実施する。
次に動作について説明する。
上記実施の形態1では、マスターストリームとして再圧縮する「MPEG−2ビデオビットストリーム」、または、スレーブストリームとして再圧縮する「MPEG−2ビデオビットストリーム」がシーン相関測定パラメータ算出部1に入力される例を示しているが、この実施の形態2では、図9に示すように、マスターストリームとして再圧縮する「MPEG−2ビデオビットストリーム」とスレーブストリームとして再圧縮する「MPEG−2ビデオビットストリーム」とが単一のビデオビットストリームに含まれており、単一のビデオビットストリームがシーン相関測定パラメータ算出部1に入力される例について説明する。
上記実施の形態1では、マスターストリームとして再圧縮する「MPEG−2ビデオビットストリーム」、または、スレーブストリームとして再圧縮する「MPEG−2ビデオビットストリーム」がシーン相関測定パラメータ算出部1に入力される例を示しているが、この実施の形態2では、図9に示すように、マスターストリームとして再圧縮する「MPEG−2ビデオビットストリーム」とスレーブストリームとして再圧縮する「MPEG−2ビデオビットストリーム」とが単一のビデオビットストリームに含まれており、単一のビデオビットストリームがシーン相関測定パラメータ算出部1に入力される例について説明する。
単一のビデオビットストリームがシーン相関測定パラメータ算出部1に入力される場合、図1の画像符号化装置と比べて、スイッチ31の処理内容だけが相違する。
スイッチ31には、「シーン相関測定パラメータ算出部1に入力されるMPEG−2ビデオビットストリームの前半部分がマスターストリームとして再圧縮するビデオビットストリームであり、後半部分がスレーブストリームとして再圧縮するビデオビットストリームである」旨を指示する再圧縮方法識別信号が外部から入力される。
スイッチ31には、「シーン相関測定パラメータ算出部1に入力されるMPEG−2ビデオビットストリームの前半部分がマスターストリームとして再圧縮するビデオビットストリームであり、後半部分がスレーブストリームとして再圧縮するビデオビットストリームである」旨を指示する再圧縮方法識別信号が外部から入力される。
スイッチ31は、外部から上記の再圧縮方法識別信号が与えられたのち、シーン相関測定パラメータ算出部1からMPEG−2ビデオビットストリームが出力されると、そのMPEG−2ビデオビットストリームを前半部分と後半部分に分割し、そのMPEG−2ビデオビットストリームの前半部分をH.264変換部4に与え、そのMPEG−2ビデオビットストリームの後半部分をシーン内・シーン間適応符号化部6に与える。
スイッチ31以外の画像符号化装置の処理内容は、上記実施の形態1と同様であるため詳細な説明を省略するが、そのMPEG−2ビデオビットストリームの前半部分がH.264変換部4に与えられることで、そのMPEG−2ビデオビットストリームの前半部分がH.264映像符号化方式に従うビデオビットストリームに変換され、そのビデオビットストリームがマスターストリームとしてデータ記録部2に記録される。
一方、そのMPEG−2ビデオビットストリームの後半部分がシーン内・シーン間適応符号化部6に与えられることで、そのMPEG−2ビデオビットストリームの後半部分がスレーブストリームに変換され、そのスレーブストリームとシーン間予測判定部5から出力されたスレーブストリーム符号化管理情報とが多重化されているスレーブ符号化データがデータ記録部2に記録される。
一方、そのMPEG−2ビデオビットストリームの後半部分がシーン内・シーン間適応符号化部6に与えられることで、そのMPEG−2ビデオビットストリームの後半部分がスレーブストリームに変換され、そのスレーブストリームとシーン間予測判定部5から出力されたスレーブストリーム符号化管理情報とが多重化されているスレーブ符号化データがデータ記録部2に記録される。
画像復号装置の処理内容は、上記実施の形態1と同様であり、データ記録部2により記録されているマスターストリームの中から、スレーブストリーム符号化管理情報が示すシーン映像の符号化データを抽出し(図10を参照)、そのシーン映像の符号化データをスレーブストリームの対応シーン映像の位置に埋め込むことで復号ストリームを成型して、画像の復号処理を行う。
例えば、テレビ番組などでは、1つの番組内に相関が高いシーン映像が含まれていることが多いが、上記のように、マスターストリームとスレーブストリームが単一のビデオビットストリームに含まれている場合、相関が高いシーン映像を効率よく検索して利用することができる。
例えば、テレビ番組などでは、1つの番組内に相関が高いシーン映像が含まれていることが多いが、上記のように、マスターストリームとスレーブストリームが単一のビデオビットストリームに含まれている場合、相関が高いシーン映像を効率よく検索して利用することができる。
この実施の形態2では、シーン相関測定パラメータ算出部1に入力されるMPEG−2ビデオビットストリームの前半部分がマスターストリームとして再圧縮する「MPEG−2ビデオビットストリーム」、後半部分がスレーブストリームとして再圧縮する「MPEG−2ビデオビットストリーム」に分けられている例を示したが、図11に示すように、マスターストリームとスレーブストリームが交互に繰り返されている単一のMPEG−2ビデオビットストリームがシーン相関測定パラメータ算出部1に入力されるものであってもよい。
一般的に、時間的に近いシーン映像から予測する方が、時間的に遠いシーン映像から予測するよりも符号化効率がよいが、図11に示すように、マスターストリームとスレーブストリームが交互に繰り返されている場合には、マスターストリームとスレーブストリームの時間的な距離が近づくため、符号化効率が高いストリームを生成することが可能になる。
一般的に、時間的に近いシーン映像から予測する方が、時間的に遠いシーン映像から予測するよりも符号化効率がよいが、図11に示すように、マスターストリームとスレーブストリームが交互に繰り返されている場合には、マスターストリームとスレーブストリームの時間的な距離が近づくため、符号化効率が高いストリームを生成することが可能になる。
ここでは、マスターストリームとスレーブストリームが交互に繰り返されている例を示したが、図12に示すように、マスターストリームの時間的な長さと、スレーブストリームの時間的な長さとが異なっていてもよい。
図12の例では、MPEG−2ビデオビットストリーム内のマスターストリームの個数が2個であり、MPEG−2ビデオビットストリーム内のスレーブストリームの個数が6個であるため、スレーブストリームの時間的な長さが、マスターストリームの時間的な長さの3倍となっている。
このように、スレーブストリームの時間的な長さを、マスターストリームの時間的な長さより長くすることで、シーン間相関を用いた符号化を行うシーン映像が増えるため、符号化効率の改善に寄与する。
このとき、マスターシーンの符号化管理情報に対して、マスターストリームとスレーブストリームの長さ情報を多重化するようにしてもよい。
図12の例では、MPEG−2ビデオビットストリーム内のマスターストリームの個数が2個であり、MPEG−2ビデオビットストリーム内のスレーブストリームの個数が6個であるため、スレーブストリームの時間的な長さが、マスターストリームの時間的な長さの3倍となっている。
このように、スレーブストリームの時間的な長さを、マスターストリームの時間的な長さより長くすることで、シーン間相関を用いた符号化を行うシーン映像が増えるため、符号化効率の改善に寄与する。
このとき、マスターシーンの符号化管理情報に対して、マスターストリームとスレーブストリームの長さ情報を多重化するようにしてもよい。
ただし、MPEG−2ビデオビットストリームの形態が上記のような形態であるとき、符号化対象のシーケンス内には、シーンチェンジを含む可能性がある。
シーンチェンジ前後では、シーン映像間に相関がない可能性が高いため、図13に示すように、シーンチェンジ直後のシーン映像がマスターストリームであれば、シーンチェンジによる符号化効率の低下を防ぐことが可能になる。
そこで、シーンチェンジ直後のシーン映像が必ずマスターストリームであるMPEG−2ビデオビットストリームがシーン相関測定パラメータ算出部1に入力されるものであってもよい。
シーンチェンジ前後では、シーン映像間に相関がない可能性が高いため、図13に示すように、シーンチェンジ直後のシーン映像がマスターストリームであれば、シーンチェンジによる符号化効率の低下を防ぐことが可能になる。
そこで、シーンチェンジ直後のシーン映像が必ずマスターストリームであるMPEG−2ビデオビットストリームがシーン相関測定パラメータ算出部1に入力されるものであってもよい。
この実施の形態2では、マスターストリームとスレーブストリームが単一のMPEG−2ビデオビットストリームに含まれているものを示したが、図14に示すように、特定の単位(例えば、GOP)で、単一のMPEG−2ビデオビットストリームに含まれている各々のストリームがマスターストリームであるのか、スレーブストリームであるのかを示すflagをマスターシーンの符号化管理情報として、画像復号装置にシグナリングするようにしてもよい。
例えば、多重化部7が、当該符号化管理情報をデータ記録部2に記録することで、画像復号装置にシグナリングするようにしてもよいし、当該符号化管理情報を画像復号装置に送信することで、画像復号装置にシグナリングするようにしてもよい。
このようにすることで、映像の特性に応じて、マスターストリームとするのか、スレーブストリームとするのかを自由に決定することができるようになり、符号化効率を改善することができる。
例えば、多重化部7が、当該符号化管理情報をデータ記録部2に記録することで、画像復号装置にシグナリングするようにしてもよいし、当該符号化管理情報を画像復号装置に送信することで、画像復号装置にシグナリングするようにしてもよい。
このようにすることで、映像の特性に応じて、マスターストリームとするのか、スレーブストリームとするのかを自由に決定することができるようになり、符号化効率を改善することができる。
また、図15に示すように、シーケンスの途中に、符号化中のシーン映像とは明らかに性質が異なるシーン映像が挿入されている可能性がある(例えば、テレビ番組におけるCMなどが該当する)。
このような場合、事前に、符号化中のシーン映像とは明らかに性質が異なるシーン映像を検出し、そのシーン映像内で閉じた形でシーン相関測定パラメータを検出して符号化を行うことが考えられる。
このようにすることで、シーン相関測定パラメータを検出するシーン映像を減らして、処理量を低減することができるので、符号化中のシーン映像とは明らかに性質が異なるシーン映像が飛ばされている(当該シーン映像のストリームを含んでいない)MPEG−2ビデオビットストリームがシーン相関測定パラメータ算出部1に入力されるものであってもよい。
このような場合、事前に、符号化中のシーン映像とは明らかに性質が異なるシーン映像を検出し、そのシーン映像内で閉じた形でシーン相関測定パラメータを検出して符号化を行うことが考えられる。
このようにすることで、シーン相関測定パラメータを検出するシーン映像を減らして、処理量を低減することができるので、符号化中のシーン映像とは明らかに性質が異なるシーン映像が飛ばされている(当該シーン映像のストリームを含んでいない)MPEG−2ビデオビットストリームがシーン相関測定パラメータ算出部1に入力されるものであってもよい。
この実施の形態2では、MPEG−2ビデオビットストリームをH.264映像符号化方式に従うビデオビットストリームに変換し、そのビデオビットストリームをマスターストリームとしてデータ記録部2に記録するものを示したが、映像符号化方式はH.264映像符号化方式に限るものではなく、例えば、MPEG−4などの他の映像符号化方式を用いるようにしてもよい。また、入力ビットストリームをMPEG−2ビデオビットストリームとしたが、これはMPEG−2ビデオビットストリームに限るものではなく、例えば、MPEG−4やH.264などの他の映像符号化方式で符号化されたビデオビットストリームを入力として使用してもよい。
上記実施の形態1,2では、特に言及していないが、画像符号化装置及び画像復号装置は、データ記録部2により記録されているマスターストリーム又はスレーブ符号化データを編集する編集機能(例えば、キーボードやマウスなどのマンマシンインタフェースを備え、マンマシンインタフェースにより受け付けられた操作内容にしたがってマスターストリーム又はスレーブ符号化データを編集するCPUなどの処理部などが該当する)を備えている場合がある。
しかし、ユーザが編集機能を操作することで、マスターストリームが削除されてしまう状況が発生することがある。
しかし、ユーザが編集機能を操作することで、マスターストリームが削除されてしまう状況が発生することがある。
そこで、画像符号化装置及び画像復号装置の編集機能は、マスターストリームを削除する操作が行われた場合、「マスターストリームを削除する操作が行われている」旨を示す警告メッセージをディスプレイに表示するようにしてもよい。
また、マスターストリームからの予測については再符号化を行うなどの処理を行うことで、マスターストリームが消去されることによって復号が不可能になることを防ぐようにしてもよい。
また、マスターストリームからの予測については再符号化を行うなどの処理を行うことで、マスターストリームが消去されることによって復号が不可能になることを防ぐようにしてもよい。
実施の形態3.
上記実施の形態1,2では、マスターストリーム及びスレーブ符号化データがデータ記録部2に記録されるものを示したが、マスターストリームについては、データ記録部2に記録せずに、画像符号化装置及び画像復号装置の外部装置に記録されるようにしてもよい。
図16はレコード(画像符号化装置、画像復号装置)がネットワークに接続されているシステム例を示す構成図である。
上記実施の形態1,2では、マスターストリーム及びスレーブ符号化データがデータ記録部2に記録されるものを示したが、マスターストリームについては、データ記録部2に記録せずに、画像符号化装置及び画像復号装置の外部装置に記録されるようにしてもよい。
図16はレコード(画像符号化装置、画像復号装置)がネットワークに接続されているシステム例を示す構成図である。
図16の例では、レコーダである画像符号化装置のH.264変換部4が、マスターストリームをデータ記録部2に記録せずに、ネットワークインタフェースを介して、そのマスターストリームを外部装置であるサーバ(例えば、公共サーバ、サービス業者が提供する専用サーバ、個人所有のサーバ)に転送し、そのサーバがマスターストリームを記録するようにしてもよい。
例えば、サーバに記録されているマスターストリームについては、ユーザの操作では消去できない構成に設定されていれば、誤ってマスターストリームを消去することによってストリームが復号できなくなることを防ぐことが可能になる。
また、サーバの管理者が特定のユーザに限り、マスターストリームを開示するシステムを構成することが可能になり、このような構成にすることで、セキュアな映像管理が可能になる。
また、サーバの管理者が特定のユーザに限り、マスターストリームを開示するシステムを構成することが可能になり、このような構成にすることで、セキュアな映像管理が可能になる。
実施の形態4.
上記実施の形態1では、シーン間予測符号化部15が、スイッチ12から復号画像を受けると、その復号画像の時間相関と、その復号画像とシーン間予測参照箇所抽出部13により生成されたマスターストリーム復号画像における同一時刻位置の画像データ間の相関とを利用して、H.264の動き補償処理ないしイントラ予測を用いた圧縮符号化処理を実行して、その処理結果であるシーン間予測符号化データを出力するものを示したが(I,P,Bピクチャのそれぞれにおいて、同一時刻位置に対応するピクチャからのシーン間予測を可能にしている)、図17に示すように、Iピクチャに限り、シーン間予測を可能にしてもよい。あるいは、図18に示すように、I,Pピクチャに限り、シーン間予測を可能にしてもよい。
シーン間予測を制限することで、相関が高いシーン映像の場合、符号化効率は落ちるが、変換する際の処理量を削減することができる。
上記実施の形態1では、シーン間予測符号化部15が、スイッチ12から復号画像を受けると、その復号画像の時間相関と、その復号画像とシーン間予測参照箇所抽出部13により生成されたマスターストリーム復号画像における同一時刻位置の画像データ間の相関とを利用して、H.264の動き補償処理ないしイントラ予測を用いた圧縮符号化処理を実行して、その処理結果であるシーン間予測符号化データを出力するものを示したが(I,P,Bピクチャのそれぞれにおいて、同一時刻位置に対応するピクチャからのシーン間予測を可能にしている)、図17に示すように、Iピクチャに限り、シーン間予測を可能にしてもよい。あるいは、図18に示すように、I,Pピクチャに限り、シーン間予測を可能にしてもよい。
シーン間予測を制限することで、相関が高いシーン映像の場合、符号化効率は落ちるが、変換する際の処理量を削減することができる。
また、シーン間予測符号化部15が、Iピクチャに限り、シーン間予測を行う処理(図17を参照)と、I,Pピクチャに限り、シーン間予測を行う処理(図18を参照)とをシーン相関度に応じて切り替えるようにしてもよい。
例えば、シーン途中でシーンチェンジがある場合など、相関が高いシーン映像が先頭のみの場合は、先頭のIピクチャのみシーン間予測を実施し、また、ほぼ同一のシーンである場合は、I,P,Bピクチャのすべてに対してシーン間予測を実施するように構成にすることで、符号化効率を落とすことなく、処理量を削減することができる効果を奏する。
例えば、シーン途中でシーンチェンジがある場合など、相関が高いシーン映像が先頭のみの場合は、先頭のIピクチャのみシーン間予測を実施し、また、ほぼ同一のシーンである場合は、I,P,Bピクチャのすべてに対してシーン間予測を実施するように構成にすることで、符号化効率を落とすことなく、処理量を削減することができる効果を奏する。
図19はこの発明の実施の形態4による画像符号化装置の処理内容を示すフローチャートである。
以下、図19に示す処理内容を説明する。
シーン相関測定パラメータ算出部1は、MPEG−2映像符号化方式によって圧縮符号化されたMPEG−2ビデオビットストリームを入力すると、上記実施の形態1と同様に、そのMPEG−2ビデオビットストリームのシーン映像毎に、他のシーン映像との相関を測定する尺度となるシーン相関測定パラメータを算出する(ステップST31)。
以下、図19に示す処理内容を説明する。
シーン相関測定パラメータ算出部1は、MPEG−2映像符号化方式によって圧縮符号化されたMPEG−2ビデオビットストリームを入力すると、上記実施の形態1と同様に、そのMPEG−2ビデオビットストリームのシーン映像毎に、他のシーン映像との相関を測定する尺度となるシーン相関測定パラメータを算出する(ステップST31)。
スイッチ3は、外部から与えられる再圧縮方法識別信号が「MPEG−2ビデオビットストリームをマスターストリームとして再圧縮する」旨を指示していれば(ステップST32)、上記実施の形態1と同様に、シーン相関測定パラメータ算出部1から出力されたMPEG−2ビデオビットストリームをH.264変換部4に与える。
一方、その再圧縮方法識別信号が「MPEG−2ビデオビットストリームをスレーブストリームとして再圧縮する」旨を指示していれば(ステップST32)、上記実施の形態1と同様に、シーン相関測定パラメータ算出部1から出力されたMPEG−2ビデオビットストリームをシーン内・シーン間適応符号化部6に与える。
一方、その再圧縮方法識別信号が「MPEG−2ビデオビットストリームをスレーブストリームとして再圧縮する」旨を指示していれば(ステップST32)、上記実施の形態1と同様に、シーン相関測定パラメータ算出部1から出力されたMPEG−2ビデオビットストリームをシーン内・シーン間適応符号化部6に与える。
H.264変換部4は、スイッチ3からMPEG−2ビデオビットストリームが与えられると、上記実施の形態1と同様に、そのMPEG−2ビデオビットストリームを所定の処理手順によってH.264映像符号化方式に従うビデオビットストリームに変換し、そのビデオビットストリームをマスターストリームとしてデータ記録部2に記録する(ステップST33)。
シーン間予測判定部5は、シーン相関測定パラメータ算出部1がシーン相関測定パラメータA又はシーン相関測定パラメータBを算出すると、上記実施の形態1と同様に、そのシーン相関測定パラメータA,Bに基づいて、データ記録部2に記録されているマスターストリーム内のシーン映像単位の符号化データの中から、シーン内・シーン間適応符号化部6が予測符号化する際に、MPEG−2ビデオビットストリーム内のシーン映像単位の符号化データの代わりに予測参照に用いる符号化データを検索する。
以下、シーン間予測判定部5による符号化データの検索処理を具体的に説明する。
以下、シーン間予測判定部5による符号化データの検索処理を具体的に説明する。
まず、シーン間予測判定部5は、上記実施の形態1と同様に、シーン相関測定パラメータ算出部1により算出されたシーン相関測定パラメータA,Bを用いて、MPEG−2ビデオビットストリーム内の各々のシーン映像と、データ記録部2に記録されているマスターストリーム内の各々のシーン映像との相関値を測定する。
次に、シーン間予測判定部5は、MPEG−2ビデオビットストリーム内のシーン映像毎に、当該シーン映像に対するマスターストリーム内の各々のシーン映像の相関値を比較し、最も相関値が大きいマスターストリーム内のシーン映像を探索する。
シーン間予測判定部5は、最も相関値が大きいマスターストリーム内のシーン映像を探索すると、上記実施の形態1と同様に、その相関値が予め設定している所定値以上であれば、そのシーン映像の符号化データを予測参照に用いるシーン映像に決定する。
一方、その相関値が予め設定している所定値に満たなければ、そのマスターストリーム内のシーン映像の符号化データを予測参照に用いないものとする。
次に、シーン間予測判定部5は、MPEG−2ビデオビットストリーム内のシーン映像毎に、当該シーン映像に対するマスターストリーム内の各々のシーン映像の相関値を比較し、最も相関値が大きいマスターストリーム内のシーン映像を探索する。
シーン間予測判定部5は、最も相関値が大きいマスターストリーム内のシーン映像を探索すると、上記実施の形態1と同様に、その相関値が予め設定している所定値以上であれば、そのシーン映像の符号化データを予測参照に用いるシーン映像に決定する。
一方、その相関値が予め設定している所定値に満たなければ、そのマスターストリーム内のシーン映像の符号化データを予測参照に用いないものとする。
シーン間予測判定部5は、シーン内・シーン間適応符号化部6が予測参照に用いる符号化データが見つかれば(MPEG−2ビデオビットストリーム内のシーン映像と相関が高いマスターストリーム内のシーン映像が存在する場合)、上記実施の形態1と同様に、「当該処理対象のシーンでは、マスターストリーム内の相関が高いシーン映像の符号化データを利用して符号化を行う」旨を示すスレーブストリーム符号化管理情報をシーン内・シーン間適応符号化部6及び多重化部7に出力する。
一方、シーン内・シーン間適応符号化部6が予測参照に用いる符号化データが見つからなければ(MPEG−2ビデオビットストリーム内のシーン映像と相関が高いマスターストリーム内のシーン映像が存在しない場合)、上記実施の形態1と同様に、「当該処理対象のシーンでは、マスターストリーム内の符号化データを使用せず、シーン内に閉じた符号化を行う」旨を示すスレーブストリーム符号化管理情報をシーン内・シーン間適応符号化部6及び多重化部7に出力する。
一方、シーン内・シーン間適応符号化部6が予測参照に用いる符号化データが見つからなければ(MPEG−2ビデオビットストリーム内のシーン映像と相関が高いマスターストリーム内のシーン映像が存在しない場合)、上記実施の形態1と同様に、「当該処理対象のシーンでは、マスターストリーム内の符号化データを使用せず、シーン内に閉じた符号化を行う」旨を示すスレーブストリーム符号化管理情報をシーン内・シーン間適応符号化部6及び多重化部7に出力する。
シーン内・シーン間適応符号化部6は、データ記録部2に記録されたマスターストリーム内のシーン映像単位の符号化データの中で、シーン間予測判定部5により予測参照に用いる代わりの符号化データが検索されていない符号化データと、シーン間予測判定部5により検索された符号化データとを予測参照に用いて、そのMPEG−2ビデオビットストリームをスレーブストリームに変換する。
以下、シーン内・シーン間適応符号化部6によるストリームの変換処理を具体的に説明する。
以下、シーン内・シーン間適応符号化部6によるストリームの変換処理を具体的に説明する。
まず、シーン内・シーン間適応符号化部6のMPEG−2復号部11は、スイッチ3からMPEG−2ビデオビットストリームが与えられると、上記実施の形態1と同様に、そのMPEG−2ビデオビットストリーム内の各々のシーン映像の符号化データに対する復号処理を実施して、シーン映像単位に復号画像を生成する(ステップST34)。
スイッチ12は、シーン間予測判定部5から出力されたスレーブストリーム符号化管理情報に含まれているシーン間予測指示フラグが、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いない旨を示していれば、上記実施の形態1と同様に、MPEG−2復号部11により生成された復号画像をシーン内予測符号化部14に出力する。
そのシーン間予測指示フラグが、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いる旨を示していれば、上記実施の形態1と同様に、MPEG−2復号部11により生成された復号画像をシーン間予測符号化部15に出力する。
そのシーン間予測指示フラグが、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いる旨を示していれば、上記実施の形態1と同様に、MPEG−2復号部11により生成された復号画像をシーン間予測符号化部15に出力する。
シーン間予測参照箇所抽出部13は、シーン間予測判定部5から出力されたスレーブストリーム符号化管理情報に含まれているシーン間予測指示フラグが、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いる旨を示していれば、上記実施の形態1と同様に、そのスレーブストリーム符号化管理情報に含まれているマスターストリームIDが示すマスターストリームの中から、マスターシーンIDが示すシーン映像の符号化データを抽出する。
シーン間予測参照箇所抽出部13は、マスターシーンIDが示すシーン映像の符号化データを抽出すると、上記実施の形態1と同様に、その符号化データに対するH.264復号処理を実施して、そのシーン映像の復号画像であるマスターストリーム復号画像を生成する。
シーン間予測参照箇所抽出部13は、マスターシーンIDが示すシーン映像の符号化データを抽出すると、上記実施の形態1と同様に、その符号化データに対するH.264復号処理を実施して、そのシーン映像の復号画像であるマスターストリーム復号画像を生成する。
シーン間予測符号化部15は、スイッチ12から復号画像を受けると、例えば、シーン相関度が予め設定された閾値である第1の相関度より低い場合(例えば、シーン途中でシーンチェンジがある場合)、Iピクチャに限り、シーン相関を利用することにして(ステップST35)、図17に示すように、Iピクチャのみシーン間予測を実施して、再符号化を行う(ステップST36)。
また、シーン間予測符号化部15は、例えば、シーン相関度が第1の相関度より高いが、予め設定された閾値である第2の相関度より低い場合、I,Pピクチャに限り、シーン相関を利用することにして(ステップSTST35,ST37)、図18に示すように、I,Pピクチャのみシーン間予測を実施して、再符号化を行う(ステップST38)。
また、シーン間予測符号化部15は、例えば、シーン相関度が第1の相関度より高いが、予め設定された閾値である第2の相関度より低い場合、I,Pピクチャに限り、シーン相関を利用することにして(ステップSTST35,ST37)、図18に示すように、I,Pピクチャのみシーン間予測を実施して、再符号化を行う(ステップST38)。
また、シーン間予測符号化部15は、例えば、シーン相関度が第2の相関度より高い場合、I,P,Bピクチャのすべてに対してシーン相関を利用することにして(ステップST37)、I,P,Bピクチャのすべてに対してシーン間予測を実施して、再符号化を行う(ステップST39)。
なお、シーン間予測符号化部15は、シーン間予測を実施して、再符号化を行うと、その再符号化結果であるシーン間予測符号化データをスレーブストリーム多重化部16に出力する。
なお、シーン間予測符号化部15は、シーン間予測を実施して、再符号化を行うと、その再符号化結果であるシーン間予測符号化データをスレーブストリーム多重化部16に出力する。
シーン内予測符号化部14は、スイッチ12から復号画像を受けると、上記実施の形態1と同様に、マスターストリーム内の符号化データを一切使用することなく、その復号画像に対してH.264圧縮符号化処理を実施し、その符号化処理結果であるシーン内予測符号化データを出力する。
スレーブストリーム多重化部16は、上記実施の形態1と同様に、シーン内予測符号化部14から出力されたシーン内予測符号化データと、シーン間予測符号化部15から出力されたシーン間予測符号化データとを多重化してスレーブストリームを生成し、そのスレーブストリームを多重化部7に出力する(ステップST40)。
多重化部7は、上記実施の形態1と同様に、シーン内・シーン間適応符号化部6により変換されたスレーブストリームと、シーン間予測判定部5から出力されたスレーブストリーム符号化管理情報とを多重化し、その多重化結果をスレーブ符号化データとしてデータ記録部2に記録する(ステップST41)。
多重化部7は、上記実施の形態1と同様に、シーン内・シーン間適応符号化部6により変換されたスレーブストリームと、シーン間予測判定部5から出力されたスレーブストリーム符号化管理情報とを多重化し、その多重化結果をスレーブ符号化データとしてデータ記録部2に記録する(ステップST41)。
以上で明らかなように、この実施の形態4によれば、シーン間予測符号化部15が、Iピクチャに限り、シーン間予測を行う処理と、I,Pピクチャに限り、シーン間予測を行う処理とをシーン相関度に応じて切り替えるように構成したので、シーン間予測を行わないピクチャについては、再符号化前のストリーム情報(モード情報、動き情報など)を再利用することで処理を簡略化することができる効果を奏する。このような処理をすることで、符号化効率は多少落ちるが、再符号化に伴う処理量を削減することができる。特に、組み込み機器などの低消費電力や低CPUを用いたシステムでは有用である。
実施の形態5.
上記実施の形態1〜4では、外部から与えられる再圧縮方法識別信号が「MPEG−2ビデオビットストリームをマスターストリームとして再圧縮する」旨を指示していれば、H.264変換部4が、MPEG−2ビデオビットストリームをH.264映像符号化方式に従うビデオビットストリームに変換して、そのビデオビットストリームをマスターストリームとしてデータ記録部2に記録し、その再圧縮方法識別信号が「MPEG−2ビデオビットストリームをスレーブストリームとして再圧縮する」旨を指示していれば、シーン内・シーン間適応符号化部6が、シーン間予測判定部5により検索された符号化データを予測参照に用いて、そのMPEG−2ビデオビットストリームをスレーブストリームに変換するものを示したが、予め、MPEG−2ビデオビットストリーム(例えば、多視点映像に係る時系列の映像ストリーム)をH.264映像符号化方式に従うビデオビットストリーム(マスターストリーム)に変換して記録しておき、その後、時系列のマスターストリームをスレーブストリームに変換するようにしてもよい。
上記実施の形態1〜4では、外部から与えられる再圧縮方法識別信号が「MPEG−2ビデオビットストリームをマスターストリームとして再圧縮する」旨を指示していれば、H.264変換部4が、MPEG−2ビデオビットストリームをH.264映像符号化方式に従うビデオビットストリームに変換して、そのビデオビットストリームをマスターストリームとしてデータ記録部2に記録し、その再圧縮方法識別信号が「MPEG−2ビデオビットストリームをスレーブストリームとして再圧縮する」旨を指示していれば、シーン内・シーン間適応符号化部6が、シーン間予測判定部5により検索された符号化データを予測参照に用いて、そのMPEG−2ビデオビットストリームをスレーブストリームに変換するものを示したが、予め、MPEG−2ビデオビットストリーム(例えば、多視点映像に係る時系列の映像ストリーム)をH.264映像符号化方式に従うビデオビットストリーム(マスターストリーム)に変換して記録しておき、その後、時系列のマスターストリームをスレーブストリームに変換するようにしてもよい。
図20はこの発明の実施の形態5による画像符号化装置を示す構成図である。
図20において、H.264変換部41は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、MPEG−2ビデオビットストリーム(例えば、多視点映像に係る時系列の映像ストリーム)が与えられると、そのMPEG−2ビデオビットストリームを所定の処理手順によってH.264映像符号化方式(第1の映像符号化方式)に従うビデオビットストリームに変換し、そのビデオビットストリームをマスターストリームとしてデータ記録部42に記録する処理を実施する。なお、H.264変換部41は映像符号化データ変換手段を構成している。
データ記録部42は例えばハードディスクやSSDなどの記録媒体から構成されており、H.264変換部41により変換されたマスターストリームを記録するとともに、多重化部46から出力されたスレーブ符号化データなどを記録する。なお、データ記録部42はデータ記録手段を構成している。
図20において、H.264変換部41は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、MPEG−2ビデオビットストリーム(例えば、多視点映像に係る時系列の映像ストリーム)が与えられると、そのMPEG−2ビデオビットストリームを所定の処理手順によってH.264映像符号化方式(第1の映像符号化方式)に従うビデオビットストリームに変換し、そのビデオビットストリームをマスターストリームとしてデータ記録部42に記録する処理を実施する。なお、H.264変換部41は映像符号化データ変換手段を構成している。
データ記録部42は例えばハードディスクやSSDなどの記録媒体から構成されており、H.264変換部41により変換されたマスターストリームを記録するとともに、多重化部46から出力されたスレーブ符号化データなどを記録する。なお、データ記録部42はデータ記録手段を構成している。
シーン相関測定パラメータ算出部43は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、データ記録部42により記録されている時系列のマスターストリームであるマスターストリーム(1)(第1の映像符号化データ)及びマスターストリーム(2)(第2の映像符号化データ)を入力すると、そのマスターストリーム(1)(2)に含まれている各シーンの映像(以下、「シーン映像」と称する)毎に、他のシーン映像との相関を測定する尺度となるシーン相関測定パラメータB1,B2を算出する処理を実施する。
ここで、シーンは、所定の時間の単位でもよいし、ビデオビットストリームのデータ構造を規定するGOP、即ち、ビデオビットストリームに対してランダムアクセスが可能なデータ単位(2つのIピクチャ間に含まれる全ピクチャデータ)などでもよい。
ここで、シーンは、所定の時間の単位でもよいし、ビデオビットストリームのデータ構造を規定するGOP、即ち、ビデオビットストリームに対してランダムアクセスが可能なデータ単位(2つのIピクチャ間に含まれる全ピクチャデータ)などでもよい。
シーン間予測判定部44は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、シーン相関測定パラメータ算出部43により算出されたシーン相関測定パラメータB1,B2に基づいて、データ記録部42により記録されているマスターストリーム(2)内のシーン映像単位の符号化データの中に、データ記録部42により記録されているマスターストリーム(1)内のシーン映像単位の符号化データと相関がある符号化データが含まれているか否かを判定し、相関がある符号化データが含まれていれば、その符号化データを特定するデータ識別情報を含むスレーブストリーム符号化管理情報をシーン内・シーン間適応符号化部45及び多重化部46に出力する処理を実施する。なお、シーン相関測定パラメータ算出部43及びシーン間予測判定部44から判定手段が構成されている。
即ち、シーン間予測判定部44はシーン相関測定パラメータ算出部43により算出されたシーン相関測定パラメータB1,B2を用いて、データ記録部42により記録されているマスターストリーム(1)内の各々のシーン映像と、マスターストリーム(2)内の各々のシーン映像との相関値を測定するとともに、マスターストリーム(1)内の各々のシーン映像に対して、相関値が最高のマスターストリーム(2)内のシーン映像を特定し、その相関値が所定値以上であれば、そのシーン映像の符号化データを予測参照に用いる符号化データに決定する処理を実施する。
また、シーン間予測判定部44は予測参照に用いる符号化データが見つかれば(相関が高いシーン映像が存在する場合)、「当該処理対象のシーンでは、マスターストリーム(2)内の相関が高いシーン映像の符号化データを利用して符号化を行う」旨を示し、予測参照に用いる符号化データが見つからなければ(相関が高いシーン映像の符号化データが存在しない場合)、「当該処理対象のシーンでは、マスターストリーム(2)内の符号化データを使用せず、シーン内に閉じた符号化を行う」旨を示すスレーブストリーム符号化管理情報をシーン内・シーン間適応符号化部45及び多重化部46に出力する処理を実施する。
また、シーン間予測判定部44は予測参照に用いる符号化データが見つかれば(相関が高いシーン映像が存在する場合)、「当該処理対象のシーンでは、マスターストリーム(2)内の相関が高いシーン映像の符号化データを利用して符号化を行う」旨を示し、予測参照に用いる符号化データが見つからなければ(相関が高いシーン映像の符号化データが存在しない場合)、「当該処理対象のシーンでは、マスターストリーム(2)内の符号化データを使用せず、シーン内に閉じた符号化を行う」旨を示すスレーブストリーム符号化管理情報をシーン内・シーン間適応符号化部45及び多重化部46に出力する処理を実施する。
なお、スレーブストリーム符号化管理情報には、データ記録部42に記録される複数のマスターストリームのうち、マスターストリーム(2)を特定するマスターストリームID、マスターストリーム(2)内のシーン映像単位の符号化データを予測参照に用いるか否かを特定するシーン間予測指示フラグ、マスターストリーム(2)上でのマスターシーン(予測参照に用いるシーン)を特定するマスターシーンID(データ識別情報)などを含んでいる。ただし、マスターストリーム(2)内のシーン映像単位の符号化データを予測参照に用いない場合、マスターシーンIDは含まれない。
シーン内・シーン間適応符号化部45は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、マスターストリーム(1)内のシーン映像単位の符号化データに対する復号処理を実施して、シーン映像単位の復号画像を生成するとともに、シーン間予測判定部44から出力されたスレーブストリーム符号化管理情報内にマスターシーンIDが含まれていれば、そのマスターシーンIDが示す符号化データに対する復号処理を実施して、マスターストリーム復号画像(予測参照用の復号画像)を生成する処理を実施する。
また、シーン内・シーン間適応符号化部45はシーン間予測判定部44から出力されたスレーブストリーム符号化管理情報内にマスターシーンIDが含まれていなければ、先の復号処理で生成した復号画像に対するシーン内予測符号化処理を実施して、スレーブストリーム(第2の映像符号化方式に従う映像符号化データ)を生成し、そのスレーブストリーム符号化管理情報内にマスターシーンIDが含まれていれば、そのマスターストリーム復号画像を用いて、先の復号処理で生成した復号画像に対するシーン間予測符号化処理を実施して、スレーブストリーム(第2の映像符号化方式に従う映像符号化データ)を生成する処理を実施する。
また、シーン内・シーン間適応符号化部45はシーン間予測判定部44から出力されたスレーブストリーム符号化管理情報内にマスターシーンIDが含まれていなければ、先の復号処理で生成した復号画像に対するシーン内予測符号化処理を実施して、スレーブストリーム(第2の映像符号化方式に従う映像符号化データ)を生成し、そのスレーブストリーム符号化管理情報内にマスターシーンIDが含まれていれば、そのマスターストリーム復号画像を用いて、先の復号処理で生成した復号画像に対するシーン間予測符号化処理を実施して、スレーブストリーム(第2の映像符号化方式に従う映像符号化データ)を生成する処理を実施する。
多重化部46は例えばCPUを実装している半導体集積回路、あるいは、ワンチップマイコンなどから構成されており、シーン内・シーン間適応符号化部45により生成されたスレーブストリームと、シーン間予測判定部44から出力されたスレーブストリーム符号化管理情報とを多重化し、その多重化結果をスレーブ符号化データとしてデータ記録部42に記録する処理を実施する。
図20の例では、画像符号化装置の構成要素であるH.264変換部41、データ記録部42、シーン相関測定パラメータ算出部43、シーン間予測判定部44、シーン内・シーン間適応符号化部45及び多重化部46のそれぞれが専用のハードウェアで構成されているものを想定しているが、画像符号化装置がコンピュータで構成されていてもよい。
画像符号化装置がコンピュータで構成されている場合、データ記録部42をコンピュータのメモリ上に構成するとともに、H.264変換部41、シーン相関測定パラメータ算出部43、シーン間予測判定部44、シーン内・シーン間適応符号化部45及び多重化部46の処理内容を記述しているプログラムをコンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにすればよい。
画像符号化装置がコンピュータで構成されている場合、データ記録部42をコンピュータのメモリ上に構成するとともに、H.264変換部41、シーン相関測定パラメータ算出部43、シーン間予測判定部44、シーン内・シーン間適応符号化部45及び多重化部46の処理内容を記述しているプログラムをコンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにすればよい。
図21はこの発明の実施の形態5による画像符号化装置のシーン内・シーン間適応符号化部45を示す構成図である。
図21において、H.264復号部51はデータ記録部42により記録されているマスターストリーム(1)内の各々のシーン映像の符号化データに対するH.264復号処理を実施して、シーン映像単位に復号画像を生成する処理を実施する。なお、H.264復号部51は復号画像生成手段を構成している。
スイッチ52はシーン間予測判定部44から出力されたスレーブストリーム符号化管理情報に含まれているシーン間予測指示フラグが、マスターストリーム(2)内のシーン映像単位の符号化データを予測参照に用いない旨を示していれば、H.264復号部51により生成された復号画像をシーン内予測符号化部54に出力し、そのシーン間予測指示フラグが、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いる旨を示していれば、H.264復号部51により生成された復号画像をシーン間予測符号化部55に出力する処理を実施する。
図21において、H.264復号部51はデータ記録部42により記録されているマスターストリーム(1)内の各々のシーン映像の符号化データに対するH.264復号処理を実施して、シーン映像単位に復号画像を生成する処理を実施する。なお、H.264復号部51は復号画像生成手段を構成している。
スイッチ52はシーン間予測判定部44から出力されたスレーブストリーム符号化管理情報に含まれているシーン間予測指示フラグが、マスターストリーム(2)内のシーン映像単位の符号化データを予測参照に用いない旨を示していれば、H.264復号部51により生成された復号画像をシーン内予測符号化部54に出力し、そのシーン間予測指示フラグが、マスターストリーム内のシーン映像単位の符号化データを予測参照に用いる旨を示していれば、H.264復号部51により生成された復号画像をシーン間予測符号化部55に出力する処理を実施する。
シーン間予測参照箇所抽出部53はシーン間予測判定部44から出力されたスレーブストリーム符号化管理情報に含まれているシーン間予測指示フラグが、マスターストリーム(2)内のシーン映像単位の符号化データを予測参照に用いる旨を示していれば、そのスレーブストリーム符号化管理情報に含まれているマスターストリームIDが示すマスターストリーム(2)の中から、マスターシーンIDが示すシーン映像の符号化データを抽出し、その符号化データに対するH.264復号処理を実施して、そのシーン映像の復号画像であるマスターストリーム復号画像(予測参照用の復号画像)を生成する処理を実施する。なお、シーン間予測参照箇所抽出部53は予測参照用画像生成手段を構成している。
シーン内予測符号化部54はスイッチ52から復号画像を受けると、マスターストリーム(2)内の符号化データを一切使用することなく、その復号画像に対して圧縮符号化処理を実施し、その符号化処理結果であるシーン内予測符号化データ(第2の映像符号化方式に従う映像符号化データ)を出力する処理を実施する。なお、シーン内予測符号化部54は第1の映像符号化データ生成手段を構成している。
シーン間予測符号化部55はスイッチ52から出力された復号画像の時間相関と、その復号画像とシーン間予測参照箇所抽出部53により生成されたマスターストリーム復号画像における同一時刻位置の画像データ間の相関とを利用して、スイッチ52から出力された復号画像に対して、動き補償処理又はイントラ予測処理を用いた圧縮符号化処理を実行して、その処理結果であるシーン間予測符号化データ(第2の映像符号化方式に従う映像符号化データ)を出力する処理を実施する。なお、シーン間予測符号化部55は第2の映像符号化データ生成手段を構成している。
シーン間予測符号化部55はスイッチ52から出力された復号画像の時間相関と、その復号画像とシーン間予測参照箇所抽出部53により生成されたマスターストリーム復号画像における同一時刻位置の画像データ間の相関とを利用して、スイッチ52から出力された復号画像に対して、動き補償処理又はイントラ予測処理を用いた圧縮符号化処理を実行して、その処理結果であるシーン間予測符号化データ(第2の映像符号化方式に従う映像符号化データ)を出力する処理を実施する。なお、シーン間予測符号化部55は第2の映像符号化データ生成手段を構成している。
スレーブストリーム多重化部56はシーン内予測符号化部54から出力されたシーン内予測符号化データとシーン間予測符号化部55から出力されたシーン間予測符号化データを多重化してスレーブストリームを生成し、そのスレーブストリームを多重化部46に出力する処理を実施する。なお、スレーブストリーム多重化部56は多重化手段を構成している。
図23はこの発明の実施の形態5による画像符号化装置のシーン内・シーン間適応符号化部45の処理内容を示すフローチャートである。
図23はこの発明の実施の形態5による画像符号化装置のシーン内・シーン間適応符号化部45の処理内容を示すフローチャートである。
図22はシーン間予測符号化部55の内部を示す構成図である。
図22において、スイッチ61はスイッチ52から復号画像が出力されると、その復号画像を符号化部63に出力し、シーン間予測参照箇所抽出部53からマスターストリーム復号画像が出力されると、そのマスターストリーム復号画像を予測参照用フレームメモリ62に出力する処理を実施する。
予測参照用フレームメモリ62は例えばハードディスクやSSDなどの記録媒体から構成されており、マスターストリーム復号画像を格納する。
図22において、スイッチ61はスイッチ52から復号画像が出力されると、その復号画像を符号化部63に出力し、シーン間予測参照箇所抽出部53からマスターストリーム復号画像が出力されると、そのマスターストリーム復号画像を予測参照用フレームメモリ62に出力する処理を実施する。
予測参照用フレームメモリ62は例えばハードディスクやSSDなどの記録媒体から構成されており、マスターストリーム復号画像を格納する。
符号化部63はスイッチ61から出力された復号画像の時間相関と、その復号画像と予測参照用フレームメモリ62により格納されているマスターストリーム復号画像における同一時刻位置の画像データ間の相関とを利用して、スイッチ61から出力された復号画像に対して、動き補償処理又はイントラ予測処理を用いた圧縮符号化処理を実行して、その処理結果であるシーン間予測符号化データをスレーブストリーム多重化部56に出力する処理を実施する。
ただし、符号化部63は、シーン間予測符号化データの映像符号化方式(第2の映像符号化方式)が、H.264映像符号化方式と異なる方式であれば、次回の圧縮符号化処理に備えるために、そのシーン間予測符号化データに対する復号処理を実施することで再復号画像を生成して、その再復号画像を予測参照用フレームメモリ62に格納する。また、圧縮符号化処理を実施する際には、既に予測参照用フレームメモリ62に格納されている再復号画像を用いて、スイッチ61から出力された復号画像に対して、第2の映像符号化方式の動き補償処理又はイントラ予測処理を用いた圧縮符号化処理を実行して、その処理結果であるシーン間予測符号化データをスレーブストリーム多重化部56に出力する。
ただし、符号化部63は、シーン間予測符号化データの映像符号化方式(第2の映像符号化方式)が、H.264映像符号化方式と異なる方式であれば、次回の圧縮符号化処理に備えるために、そのシーン間予測符号化データに対する復号処理を実施することで再復号画像を生成して、その再復号画像を予測参照用フレームメモリ62に格納する。また、圧縮符号化処理を実施する際には、既に予測参照用フレームメモリ62に格納されている再復号画像を用いて、スイッチ61から出力された復号画像に対して、第2の映像符号化方式の動き補償処理又はイントラ予測処理を用いた圧縮符号化処理を実行して、その処理結果であるシーン間予測符号化データをスレーブストリーム多重化部56に出力する。
この実施の形態5でも、上記実施の形態1と同様に、予測参照の制約と符号化データ配列とが、例えば、H.264の勧告AnnexHに規定されるMVC(マルチビュー符号化)仕様に従うように構成するものとする。
これにより、シーン間予測参照箇所抽出部53により抽出されるマスターストリームの符号化データをベースビューとして、シーン内予測符号化データとシーン間予測符号化データとからなるスレーブストリームをエンハンスビューとするMVC規格に従う符号化データとして構成することができる。
これにより、シーン間予測参照箇所抽出部53により抽出されるマスターストリームの符号化データをベースビューとして、シーン内予測符号化データとシーン間予測符号化データとからなるスレーブストリームをエンハンスビューとするMVC規格に従う符号化データとして構成することができる。
次に動作について説明する。
H.264変換部41は、外部からMPEG−2ビデオビットストリーム(例えば、多視点映像に係る時系列の映像ストリーム)が与えられると、そのMPEG−2ビデオビットストリームを所定の処理手順によってH.264映像符号化方式に従うビデオビットストリームに変換し、そのビデオビットストリームをマスターストリームとしてデータ記録部42に記録する。
この実施の形態5では、上記実施の形態1〜4のように、外部から再圧縮方法識別信号が与えられないため、外部からMPEG−2ビデオビットストリームが与えられると、常に、そのMPEG−2ビデオビットストリームをH.264映像符号化方式に従うビデオビットストリームに変換し、そのビデオビットストリームをマスターストリームとしてデータ記録部42に記録する。
即ち、この実施の形態5では、MPEG−2ビデオビットストリームをマスターストリームに変換するタイミングと、スレーブストリームを生成するタイミングとを別々にするため、H.264変換部41が、事前に、MPEG−2ビデオビットストリームをH.264映像符号化方式に従うビデオビットストリームに変換し、そのビデオビットストリームをマスターストリームとしてデータ記録部42に記録する。
H.264変換部41は、外部からMPEG−2ビデオビットストリーム(例えば、多視点映像に係る時系列の映像ストリーム)が与えられると、そのMPEG−2ビデオビットストリームを所定の処理手順によってH.264映像符号化方式に従うビデオビットストリームに変換し、そのビデオビットストリームをマスターストリームとしてデータ記録部42に記録する。
この実施の形態5では、上記実施の形態1〜4のように、外部から再圧縮方法識別信号が与えられないため、外部からMPEG−2ビデオビットストリームが与えられると、常に、そのMPEG−2ビデオビットストリームをH.264映像符号化方式に従うビデオビットストリームに変換し、そのビデオビットストリームをマスターストリームとしてデータ記録部42に記録する。
即ち、この実施の形態5では、MPEG−2ビデオビットストリームをマスターストリームに変換するタイミングと、スレーブストリームを生成するタイミングとを別々にするため、H.264変換部41が、事前に、MPEG−2ビデオビットストリームをH.264映像符号化方式に従うビデオビットストリームに変換し、そのビデオビットストリームをマスターストリームとしてデータ記録部42に記録する。
シーン相関測定パラメータ算出部43は、H.264変換部41が時系列のマスターストリームをデータ記録部42に記録すると、データ記録部42から時系列のマスターストリームであるマスターストリーム(1)(2)を入力し、そのマスターストリーム(1)(2)のシーン映像毎に、他のシーン映像との相関を測定する尺度となるシーン相関測定パラメータB1,B2を算出する。シーン相関測定パラメータB1,B2の算出処理自体は、図1のシーン相関測定パラメータ算出部1と同様である。
シーン間予測判定部44は、シーン相関測定パラメータ算出部43がシーン相関測定パラメータB1,B2を算出すると、そのシーン相関測定パラメータB1,B2に基づいて、データ記録部42により記録されているマスターストリーム(2)内のシーン映像単位の符号化データの中に、データ記録部42により記録されているマスターストリーム(1)内のシーン映像単位の符号化データと相関がある符号化データが含まれているか否かを判定し、相関がある符号化データが含まれていれば、その符号化データを特定するマスターシーンID(データ識別情報)を含むスレーブストリーム符号化管理情報をシーン内・シーン間適応符号化部45及び多重化部46に出力する。
以下、シーン間予測判定部44の処理内容を具体的に説明する。
以下、シーン間予測判定部44の処理内容を具体的に説明する。
まず、シーン間予測判定部44は、シーン相関測定パラメータ算出部43により算出されたシーン相関測定パラメータB1,B2を用いて、データ記録部42により記録されているマスターストリーム(1)内の各々のシーン映像と、マスターストリーム(2)内の各々のシーン映像との相関値を測定する。
次に、シーン間予測判定部44は、マスターストリーム(1)内のシーン映像毎に、当該シーン映像に対するマスターストリーム(2)内の各々のシーン映像の相関値を比較し、最も相関値が大きいマスターストリーム(2)内のシーン映像を探索する。
シーン間予測判定部44は、最も相関値が大きいマスターストリーム(2)内のシーン映像を探索すると、その相関値が予め設定している所定値以上であれば、そのシーン映像の符号化データを予測参照に用いるシーン映像に決定する。
一方、その相関値が予め設定している所定値に満たなければ、そのマスターストリーム(2)内のシーン映像の符号化データを予測参照に用いないものとする。
次に、シーン間予測判定部44は、マスターストリーム(1)内のシーン映像毎に、当該シーン映像に対するマスターストリーム(2)内の各々のシーン映像の相関値を比較し、最も相関値が大きいマスターストリーム(2)内のシーン映像を探索する。
シーン間予測判定部44は、最も相関値が大きいマスターストリーム(2)内のシーン映像を探索すると、その相関値が予め設定している所定値以上であれば、そのシーン映像の符号化データを予測参照に用いるシーン映像に決定する。
一方、その相関値が予め設定している所定値に満たなければ、そのマスターストリーム(2)内のシーン映像の符号化データを予測参照に用いないものとする。
なお、シーン間予測判定部44による最も相関値が大きいマスターストリーム(2)内のシーン映像を探索する処理は、シーン相関測定パラメータB1とシーン相関測定パラメータB2のマッチング処理に対応し、例えば、上記の非特許文献3に開示されている「Image Signature」や「Video Signature」などのマッチング処理を利用することができる。
シーン間予測判定部44は、シーン内・シーン間適応符号化部45が予測参照に用いる符号化データが見つかれば(マスターストリーム(1)内のシーン映像と相関が高いマスターストリーム(2)内のシーン映像が存在する場合)、「当該処理対象のシーンでは、マスターストリーム(2)内の相関が高いシーン映像の符号化データを利用して符号化を行う」旨を示すスレーブストリーム符号化管理情報をシーン内・シーン間適応符号化部45及び多重化部46に出力する。
一方、シーン内・シーン間適応符号化部45が予測参照に用いる符号化データが見つからなければ(マスターストリーム(1)内のシーン映像と相関が高いマスターストリーム(2)内のシーン映像が存在しない場合)、「当該処理対象のシーンでは、マスターストリーム(2)内の符号化データを使用せず、シーン内に閉じた符号化を行う」旨を示すスレーブストリーム符号化管理情報をシーン内・シーン間適応符号化部45及び多重化部46に出力する。
一方、シーン内・シーン間適応符号化部45が予測参照に用いる符号化データが見つからなければ(マスターストリーム(1)内のシーン映像と相関が高いマスターストリーム(2)内のシーン映像が存在しない場合)、「当該処理対象のシーンでは、マスターストリーム(2)内の符号化データを使用せず、シーン内に閉じた符号化を行う」旨を示すスレーブストリーム符号化管理情報をシーン内・シーン間適応符号化部45及び多重化部46に出力する。
なお、スレーブストリーム符号化管理情報には、データ記録部42に記録される複数のマスターストリームのうち、マスターストリーム(2)を特定するマスターストリームID、マスターストリーム(2)内のシーン映像単位の符号化データを予測参照に用いるか否かを特定するシーン間予測指示フラグ、マスターストリーム(2)上でのマスターシーン(予測参照に用いるシーン)を特定するマスターシーンID(データ識別情報)などを含んでいる。ただし、マスターストリーム(2)内のシーン映像単位の符号化データを予測参照に用いない場合、マスターシーンIDは含まれない。
シーン内・シーン間適応符号化部45は、データ記録部42に記録されているマスターストリーム(2)内のシーン映像単位の符号化データの中で、シーン間予測判定部44により予測参照に用いる代わりの符号化データが検索されていない符号化データと、シーン間予測判定部44により検索された符号化データとを予測参照に用いて、マスターストリーム(1)をスレーブストリームに変換する。
以下、シーン内・シーン間適応符号化部45によるストリームの変換処理を具体的に説明する。
以下、シーン内・シーン間適応符号化部45によるストリームの変換処理を具体的に説明する。
シーン内・シーン間適応符号化部45のH.264復号部51は、データ記録部42により記録されているマスターストリーム(1)を入力すると、そのマスターストリーム(1)内の各々のシーン映像の符号化データに対するH.264復号処理を実施して、シーン映像単位に復号画像を生成する(図23のステップST51)。
スイッチ52は、シーン間予測判定部44から出力されたスレーブストリーム符号化管理情報に含まれているシーン間予測指示フラグが、マスターストリーム(2)内のシーン映像単位の符号化データを予測参照に用いない旨を示していれば(ステップST52)、H.264復号部51により生成された復号画像をシーン内予測符号化部54に出力する。
そのシーン間予測指示フラグが、マスターストリーム(2)内のシーン映像単位の符号化データを予測参照に用いる旨を示していれば(ステップST52)、H.264復号部51により生成された復号画像をシーン間予測符号化部55に出力する。
そのシーン間予測指示フラグが、マスターストリーム(2)内のシーン映像単位の符号化データを予測参照に用いる旨を示していれば(ステップST52)、H.264復号部51により生成された復号画像をシーン間予測符号化部55に出力する。
シーン間予測参照箇所抽出部53は、シーン間予測判定部44ら出力されたスレーブストリーム符号化管理情報に含まれているシーン間予測指示フラグが、マスターストリーム(2)内のシーン映像単位の符号化データを予測参照に用いる旨を示していれば(ステップST52)、そのスレーブストリーム符号化管理情報に含まれているマスターストリームIDが示すマスターストリーム(2)の中から、マスターシーンIDが示すシーン映像の符号化データを抽出する(ステップST53)。
シーン間予測参照箇所抽出部53は、マスターシーンIDが示すシーン映像の符号化データを抽出すると、その符号化データに対するH.264復号処理を実施して、そのシーン映像の復号画像であるマスターストリーム復号画像を生成する(ステップST54)。
シーン間予測参照箇所抽出部53は、マスターシーンIDが示すシーン映像の符号化データを抽出すると、その符号化データに対するH.264復号処理を実施して、そのシーン映像の復号画像であるマスターストリーム復号画像を生成する(ステップST54)。
この際、マスターストリーム(2)から抽出されるシーン映像の符号化データは、シーン先頭のピクチャがIDRピクチャであって、ランダムアクセスが可能なデータとして構成するようにしてもよいし、シーン先頭のピクチャがIDRピクチャでない状態で構成してもよい。
前者は抽出処理が簡易となる利点があるが、IDRピクチャを頻繁に挿入することになるため、マスターストリーム自体の圧縮効率が制限されるというトレードオフの関係がある。
後者は逆に、IDR挿入の影響を受けないので、マスターストリーム自体の圧縮効率を維持することができるが、シーン先頭のピクチャを正常に復号可能となる最も時間的に近いIDRピクチャ位置から符号化データを抽出して復号するなど、抽出処理が複雑になるというトレードオフの関係がある。これらは実際の装置の要求条件に基づいて構成することが可能である。
前者は抽出処理が簡易となる利点があるが、IDRピクチャを頻繁に挿入することになるため、マスターストリーム自体の圧縮効率が制限されるというトレードオフの関係がある。
後者は逆に、IDR挿入の影響を受けないので、マスターストリーム自体の圧縮効率を維持することができるが、シーン先頭のピクチャを正常に復号可能となる最も時間的に近いIDRピクチャ位置から符号化データを抽出して復号するなど、抽出処理が複雑になるというトレードオフの関係がある。これらは実際の装置の要求条件に基づいて構成することが可能である。
シーン間予測符号化部55は、スイッチ52から復号画像を受けると、その復号画像の時間相関と、その復号画像とシーン間予測参照箇所抽出部53により生成されたマスターストリーム復号画像における同一時刻位置の画像データ間の相関とを利用して、スイッチ52から出力された復号画像に対して、動き補償処理又はイントラ予測処理を用いた圧縮符号化処理を実行して、その処理結果であるシーン間予測符号化データをスレーブストリーム多重化部56に出力する(ステップST55)。
即ち、シーン間予測符号化部55のスイッチ61は、スイッチ52から復号画像を受けると、その復号画像を符号化部63に出力し、シーン間予測参照箇所抽出部53からマスターストリーム復号画像を受けると、そのマスターストリーム復号画像を予測参照用フレームメモリ62に格納する。
シーン間予測符号化部55の符号化部63は、スイッチ61から出力された復号画像の時間相関と、その復号画像と予測参照用フレームメモリ62により格納されているマスターストリーム復号画像における同一時刻位置の画像データ間の相関とを利用して、スイッチ61から出力された復号画像に対して、動き補償処理又はイントラ予測処理を用いた圧縮符号化処理を実行して、その処理結果であるシーン間予測符号化データをスレーブストリーム多重化部56に出力する。
シーン間予測符号化部55の符号化部63は、スイッチ61から出力された復号画像の時間相関と、その復号画像と予測参照用フレームメモリ62により格納されているマスターストリーム復号画像における同一時刻位置の画像データ間の相関とを利用して、スイッチ61から出力された復号画像に対して、動き補償処理又はイントラ予測処理を用いた圧縮符号化処理を実行して、その処理結果であるシーン間予測符号化データをスレーブストリーム多重化部56に出力する。
ただし、符号化部63は、シーン間予測符号化データの映像符号化方式(第2の映像符号化方式)が、H.264映像符号化方式と異なる方式であれば、次回の圧縮符号化処理に備えるために、そのシーン間予測符号化データに対する復号処理を実施することで再復号画像を生成して、その再復号画像を予測参照用フレームメモリ62に格納する。また、圧縮符号化処理を実施する際には、既に予測参照用フレームメモリ62に格納されている再復号画像を用いて、スイッチ61から出力された復号画像に対して、第2の映像符号化方式の動き補償処理又はイントラ予測処理を用いた圧縮符号化処理を実行して、その処理結果であるシーン間予測符号化データをスレーブストリーム多重化部56に出力する。
シーン間予測符号化部55は、図22のように構成されているため、シーン間予測参照箇所抽出部53から出力されたマスターストリーム復号画像が、直接、予測参照用フレームメモリ62に保存されるようになる。その結果、マスターストリーム復号画像については、符号化部63で再符号化されることなく、シーン間予測符号化データをスレーブストリーム多重化部56に出力することができるようになるため、マスターストリームの品質劣化がない再符号化を実現することができる。
シーン内予測符号化部54は、スイッチ52から復号画像を受けると、マスターストリーム(2)内の符号化データを一切使用することなく、その復号画像に対して圧縮符号化処理を実施し、その符号化処理結果であるシーン内予測符号化データを出力する(ステップST56)。
なお、シーン間予測符号化データの映像符号化方式(第2の映像符号化方式)が、H.264映像符号化方式であれば、H.264復号部51により生成された復号画像に対するシーン内予測符号化処理を実施せずに、第2の映像符号化方式に従う映像符号化データとして、データ記録部42により記録されているマスターストリーム(1)をスレーブストリーム多重化部56に出力する。
なお、シーン間予測符号化データの映像符号化方式(第2の映像符号化方式)が、H.264映像符号化方式であれば、H.264復号部51により生成された復号画像に対するシーン内予測符号化処理を実施せずに、第2の映像符号化方式に従う映像符号化データとして、データ記録部42により記録されているマスターストリーム(1)をスレーブストリーム多重化部56に出力する。
ここで、I’ピクチャについては、スレーブ映像内の時間相関を使用せずに、Iピクチャからのシーン間相関を利用して予測符号化を行う。
これにより、スレーブストリーム上でのランダムアクセス性を維持しながら、符号化効率を高める効果が得られる。
なお、シーン間予測は、マクロブロック、ないし動き補償予測の単位となるブロックなど、所定の処理単位で使用するかしないかを局所的に選択可能とし、予測効率が高まる画像上の局所箇所のみシーン間予測を利用可能とするように構成する。
これにより、スレーブストリーム上でのランダムアクセス性を維持しながら、符号化効率を高める効果が得られる。
なお、シーン間予測は、マクロブロック、ないし動き補償予測の単位となるブロックなど、所定の処理単位で使用するかしないかを局所的に選択可能とし、予測効率が高まる画像上の局所箇所のみシーン間予測を利用可能とするように構成する。
この予測参照の制約と符号化データ配列とを、例えば、H.264の勧告AnnexHに規定されるMVC(マルチビュー符号化)仕様に従うように構成することにより、シーン間予測参照箇所抽出部53により抽出されるマスターストリームの符号化データをベースビューとして、シーン内予測符号化データとシーン間予測符号化データとからなるスレーブストリームをエンハンスビューとするMVC規格に従う符号化データとして構成することができる。
このように構成することによって、スレーブ符号化データに対応する映像信号を再生するために、図4のスレーブ映像復号部25をまったく新しい処理仕様でなく、標準仕様に準拠した既存の復号装置を採用して所望の動作を実現することが可能になる。
このように構成することによって、スレーブ符号化データに対応する映像信号を再生するために、図4のスレーブ映像復号部25をまったく新しい処理仕様でなく、標準仕様に準拠した既存の復号装置を採用して所望の動作を実現することが可能になる。
スレーブストリーム多重化部56は、シーン内予測符号化部54から出力されたシーン内予測符号化データと、シーン間予測符号化部55から出力されたシーン間予測符号化データとを多重化してスレーブストリームを生成し、そのスレーブストリームを多重化部46に出力する(ステップST57)。
多重化部46は、シーン内・シーン間適応符号化部45のスレーブストリーム多重化部56から出力されたスレーブストリームと、シーン間予測判定部44から出力されたスレーブストリーム符号化管理情報とを多重化し、その多重化結果をスレーブ符号化データとしてデータ記録部42に記録する。
多重化部46は、シーン内・シーン間適応符号化部45のスレーブストリーム多重化部56から出力されたスレーブストリームと、シーン間予測判定部44から出力されたスレーブストリーム符号化管理情報とを多重化し、その多重化結果をスレーブ符号化データとしてデータ記録部42に記録する。
ここで、多重化部46は、スレーブストリームとスレーブストリーム符号化管理情報を、物理的に1つのファイルないしストリーム等の形式で記録してもよいし、スレーブストリーム符号化管理情報は、例えば、XML形式のデータ等で管理し、スレーブストリームとのリンクを構成するように記録してもよい。
スレーブストリームは、それ単体で復号・映像再生を行う形式とせず、復号・映像再生を行う際、マスターストリームの符号化データをシーン映像毎に、適応的に抽出・追加するように構成する。
マスターストリームはデータ記録部42に記録されているので、マスターストリームの符号化データの抽出・追加処理は、スレーブストリームに対応する映像を復号再生する場合に随時実行するように構成すればよい。
これによって、マスターストリームを符号化に使用するシーン映像については、実際には復号に必要になるマスターストリームの符号化データを逐一記録データとして含まないように構成できるため、品質劣化を伴うことなく、スレーブストリームとして記録すべきデータ量を削減することができ、データ記録部42の記録容量を効率的に使用することができる。
スレーブストリームは、それ単体で復号・映像再生を行う形式とせず、復号・映像再生を行う際、マスターストリームの符号化データをシーン映像毎に、適応的に抽出・追加するように構成する。
マスターストリームはデータ記録部42に記録されているので、マスターストリームの符号化データの抽出・追加処理は、スレーブストリームに対応する映像を復号再生する場合に随時実行するように構成すればよい。
これによって、マスターストリームを符号化に使用するシーン映像については、実際には復号に必要になるマスターストリームの符号化データを逐一記録データとして含まないように構成できるため、品質劣化を伴うことなく、スレーブストリームとして記録すべきデータ量を削減することができ、データ記録部42の記録容量を効率的に使用することができる。
この実施の形態5では、上記実施の形態1と同様に、スレーブ符号化データに対応する映像信号を再生するために、図4のスレーブ映像復号部25をまったく新しい処理仕様でなく、標準仕様に準拠した既存の復号装置を採用して所望の動作を実現することが可能になる。
例えば、マスタストリームの映像符号化方式にH.264を使用し、シーン間予測符号化部55の映像符号化方式にMVCを使用する場合は、このような条件に適する。
例えば、マスタストリームの映像符号化方式にH.264を使用し、シーン間予測符号化部55の映像符号化方式にMVCを使用する場合は、このような条件に適する。
この実施の形態5では、画像符号化装置が図20のように構成されているものを説明したが、MPEG−2ビデオビットストリームをマスターストリームに変換するタイミングと、スレーブストリームを生成するタイミングとを別々にしているため、図24及び図25に示すように、画像符号化装置の構成を2つに分割することもできる。
図26はシーン間予測符号化データを含むスレーブストリームと、マスターストリームの形式を示す説明図である。
シーン間予測符号化データを含むスレーブストリームは、シーン間予測符号化部55で用いられた映像符号化方式を再生するためのヘッダー情報を含んでおり、スレーブ映像復号部25でヘッダー情報が読み出される。
例えば、シーン間予測符号化部55の映像符号化方式にMVCを用いている場合には、「subsetSPS」が、このヘッダー情報に相当する。
シーン間予測符号化データを含むスレーブストリームは、シーン間予測符号化部55で用いられた映像符号化方式を再生するためのヘッダー情報を含んでおり、スレーブ映像復号部25でヘッダー情報が読み出される。
例えば、シーン間予測符号化部55の映像符号化方式にMVCを用いている場合には、「subsetSPS」が、このヘッダー情報に相当する。
実施の形態6.
上記実施の形態5では、シーン相関測定パラメータ算出部43が、データ記録部42により記録されている複数のマスターストリームの中から、マスターストリーム(1)とマスターストリーム(2)を入力する例を示したが、例えば、処理対象のマスターストリームがマスターストリーム(1)である場合、シーン相関測定パラメータ算出部43が、データ記録部42により記録されている複数のマスターストリームの中から、マスターストリーム(1)内のシーン映像と類似しているシーン映像を含んでいるマスターストリームをマスターストリーム(2)として入力するようにしてもよい。
上記実施の形態5では、シーン相関測定パラメータ算出部43が、データ記録部42により記録されている複数のマスターストリームの中から、マスターストリーム(1)とマスターストリーム(2)を入力する例を示したが、例えば、処理対象のマスターストリームがマスターストリーム(1)である場合、シーン相関測定パラメータ算出部43が、データ記録部42により記録されている複数のマスターストリームの中から、マスターストリーム(1)内のシーン映像と類似しているシーン映像を含んでいるマスターストリームをマスターストリーム(2)として入力するようにしてもよい。
画像符号化装置が所定の映像シーケンスを圧縮符号化する際には、圧縮効率を高めるために、当該映像シーケンス内の空間的相関又は時間的相関を利用して予測符号化を行うようにしている。
予測符号化方法の1つとして、動きベクトルを用いる動き補償予測処理がある。
予測符号化方法の1つとして、動きベクトルを用いる動き補償予測処理がある。
動きベクトルを用いる動き補償予測処理は、図27に示すように、時刻Tの画像ブロックを予測符号化する場合、他の時刻T’の画像の中から、時刻Tの画像ブロックに類似している画像ブロックを探索する。即ち、図中、点線で囲まれている或る大きさの探索範囲から、時刻Tの画像ブロックと類似している画像ブロックを探索する。
この動き補償予測処理では、時刻Tの画像ブロックに類似している画像ブロックを探索すると、時刻Tの画像ブロックと、その類似している画像ブロックとの位置ずれを動きベクトルとして符号化するとともに、双方の画像ブロックの差分を予測残差として符号化することで、圧縮効率を高めるようにする。
シーン内・シーン間適応符号化部45のシーン間予測符号化部55でも、動き補償予測処理を実施して、シーン間予測符号化データを生成する場合、マスターストリーム(1)内のシーン映像と、マスターストリーム(2)内のシーン映像との類似度が高い程、シーン相関測定パラメータ算出部43により算出されるシーン相関測定パラメータの定義より、類似するシーン映像同士の符号化に用いる動きベクトルの絶対値が小さくなる。
この動き補償予測処理では、時刻Tの画像ブロックに類似している画像ブロックを探索すると、時刻Tの画像ブロックと、その類似している画像ブロックとの位置ずれを動きベクトルとして符号化するとともに、双方の画像ブロックの差分を予測残差として符号化することで、圧縮効率を高めるようにする。
シーン内・シーン間適応符号化部45のシーン間予測符号化部55でも、動き補償予測処理を実施して、シーン間予測符号化データを生成する場合、マスターストリーム(1)内のシーン映像と、マスターストリーム(2)内のシーン映像との類似度が高い程、シーン相関測定パラメータ算出部43により算出されるシーン相関測定パラメータの定義より、類似するシーン映像同士の符号化に用いる動きベクトルの絶対値が小さくなる。
類似するシーン映像同士の符号化に用いる動きベクトルの絶対値が小さければ、時刻Tの画像ブロックと類似している画像ブロックの探索範囲である図27の点線の矩形を小さな範囲に設定(例えば、近傍16画素を探索範囲に設定)しても、類似している画像ブロックを探索することが可能であり、類似している画像ブロックの探索範囲が小さければ、符号化の処理が軽減されて効率化を図ることができる。
そこで、シーン相関測定パラメータ算出部43は、処理対象のマスターストリームがマスターストリーム(1)である場合、シーン相関測定パラメータを用いて、マスターストリーム(1)内の各々のシーン映像と、データ記録部42により記録されている複数のマスターストリーム内の各々のシーン映像との相関値を測定して、各々のシーン映像の相関値の統計値(例えば、各々のシーン映像の相関値の平均値、最大値など)を算出する。
シーン相関測定パラメータ算出部43は、データ記録部42により記録されている複数のマスターストリームの中で、最も、相関値の統計値が高いマスターストリームをマスターストリーム(2)に決定し、そのマスターストリーム(2)を入力する。
これにより、シーン間予測符号化部55における符号化処理の効率化を図ることができる。
シーン相関測定パラメータ算出部43は、データ記録部42により記録されている複数のマスターストリームの中で、最も、相関値の統計値が高いマスターストリームをマスターストリーム(2)に決定し、そのマスターストリーム(2)を入力する。
これにより、シーン間予測符号化部55における符号化処理の効率化を図ることができる。
なお、本願発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。
1 シーン相関測定パラメータ算出部、2 データ記録部、3 スイッチ、4 H.264変換部、5 シーン間予測判定部、6 シーン内・シーン間適応符号化部、7 多重化部、11 MPEG−2復号部、12 スイッチ、13 シーン間予測参照箇所抽出部、14 シーン内予測符号化部、15 シーン間予測符号化部、16 スレーブストリーム多重化部、21 スイッチ、22 H.264復号部、23 多重分離部、24 復号ストリーム成型部、25 スレーブ映像復号部、31 スイッチ、41 H.264変換部(映像符号化データ変換手段)、42 データ記録部(データ記録手段)、43 シーン相関測定パラメータ算出部(判定手段)、44 シーン間予測判定部(判定手段)、45 シーン内・シーン間適応符号化部、46 多重化部、51 H.264復号部(復号画像生成手段)、52 スイッチ、53 シーン間予測参照箇所抽出部(予測参照用画像生成手段)、54 シーン内予測符号化部(第1の映像符号化データ生成手段)、55 シーン間予測符号化部(第2の映像符号化データ生成手段)、56 スレーブストリーム多重化部(多重化手段)、61 スイッチ、62 予測参照用フレームメモリ、63 符号化部。
Claims (6)
- 第1の映像符号化方式に従う第1の映像符号化データ内のシーン映像単位の符号化データに対する復号処理を実施して、シーン映像単位の復号画像を生成する復号画像生成手段と、
上記第1の映像符号化方式に従う第2の映像符号化データ内のシーン映像単位の符号化データの中に、上記第1の映像符号化データ内のシーン映像単位の符号化データと相関がある符号化データが含まれていれば、上記符号化データに対する復号処理を実施して、予測参照用の復号画像を生成する予測参照用画像生成手段と、
上記第1の映像符号化データ内のシーン映像単位の符号化データと相関がある符号化データが含まれていなければ、上記復号画像生成手段により生成された復号画像に対するシーン内予測符号化処理を実施して、第2の映像符号化方式に従う映像符号化データを生成する第1の映像符号化データ生成手段と、
上記予測参照用画像生成手段により生成された予測参照用の復号画像を再符号化せずに、上記復号画像を用いて、上記復号画像生成手段により生成された復号画像に対するシーン間予測符号化処理を実施して、上記第2の映像符号化方式に従う映像符号化データを生成する第2の映像符号化データ生成手段と、
上記第1の映像符号化データ生成手段により生成された映像符号化データと上記第2の映像符号化データ生成手段により生成された映像符号化データを多重化する多重化手段と
を備えた画像符号化装置。 - 第1及び第2の映像符号化データを第1の映像符号化方式に従う映像符号化データに変換する映像符号化データ変換手段と、
上記映像符号化データ変換手段により変換された第1及び第2の映像符号化データを記録するデータ記録手段と、
上記データ記録手段により記録されている第2の映像符号化データ内のシーン映像単位の符号化データの中に、上記データ記録手段により記録されている第1の映像符号化データ内のシーン映像単位の符号化データと相関がある符号化データが含まれているか否かを判定し、相関がある符号化データが含まれていれば、上記符号化データを特定するデータ識別情報を含む符号化管理情報を出力する判定手段とを備え、
予測参照用画像生成手段は、上記判定手段から出力された符号化管理情報内にデータ識別情報が含まれていれば、上記データ識別情報が示す符号化データに対する復号処理を実施して、予測参照用の復号画像を生成し、
第1の映像符号化データ生成手段は、上記判定手段から出力された符号化管理情報内にデータ識別情報が含まれていなければ、復号画像生成手段により生成された復号画像に対するシーン内予測符号化処理を実施して、第2の映像符号化方式に従う映像符号化データを生成することを特徴とする請求項1記載の画像符号化装置。 - 第1の映像符号化データ生成手段は、第1の映像符号化方式と第2の映像符号化方式が同じ方式である場合、復号画像生成手段により生成された復号画像に対するシーン内予測符号化処理を実施せずに、上記第2の映像符号化方式に従う映像符号化データとして、上記復号画像生成手段により入力される第1の映像符号化データを多重化手段に出力することを特徴とする請求項1または請求項2記載の画像符号化装置。
- 第1及び第2の映像符号化データが多視点映像に係る時系列の映像ストリームであり、多重化手段による多重化後の映像符号化データが多視点映像の符号化規格に従う符号化データであることを特徴とする請求項1から請求項3のうちのいずれか1項記載の画像符号化装置。
- データ記録手段により記録されている映像符号化データのうち、第1の映像符号化データ内のシーン映像と類似しているシーン映像を含んでいる映像符号化データが、第2の映像符号化データとして用いられることを特徴とする請求項2記載の画像符号化装置。
- 復号画像生成手段が、第1の映像符号化方式に従う第1の映像符号化データ内のシーン映像単位の符号化データに対する復号処理を実施して、シーン映像単位の復号画像を生成する復号画像生成処理ステップと、
予測参照用画像生成手段が、上記第1の映像符号化方式に従う第2の映像符号化データ内のシーン映像単位の符号化データの中に、上記第1の映像符号化データ内のシーン映像単位の符号化データと相関がある符号化データが含まれていれば、上記符号化データに対する復号処理を実施して、予測参照用の復号画像を生成する予測参照用画像生成処理ステップと、
第1の映像符号化データ生成手段が、上記第1の映像符号化データ内のシーン映像単位の符号化データと相関がある符号化データが含まれていなければ、上記復号画像生成処理ステップで生成された復号画像に対するシーン内予測符号化処理を実施して、第2の映像符号化方式に従う映像符号化データを生成する第1の映像符号化データ生成処理ステップと、
第2の映像符号化データ生成手段が、上記予測参照用画像生成処理ステップで生成された予測参照用の復号画像を再符号化せずに、上記復号画像を用いて、上記復号画像生成処理ステップで生成された復号画像に対するシーン間予測符号化処理を実施して、上記第2の映像符号化方式に従う映像符号化データを生成する第2の映像符号化データ生成処理ステップと、
多重化手段が、上記第1の映像符号化データ生成処理ステップで生成された映像符号化データと上記第2の映像符号化データ生成処理ステップで生成された映像符号化データを多重化する多重化処理ステップと
を備えた画像符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013127392A JP2015002512A (ja) | 2013-06-18 | 2013-06-18 | 画像符号化装置及び画像符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013127392A JP2015002512A (ja) | 2013-06-18 | 2013-06-18 | 画像符号化装置及び画像符号化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015002512A true JP2015002512A (ja) | 2015-01-05 |
Family
ID=52296770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013127392A Pending JP2015002512A (ja) | 2013-06-18 | 2013-06-18 | 画像符号化装置及び画像符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015002512A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109640089A (zh) * | 2018-11-02 | 2019-04-16 | 西安万像电子科技有限公司 | 图像编解码方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005303773A (ja) * | 2004-04-14 | 2005-10-27 | Nippon Telegr & Teleph Corp <Ntt> | 映像符号化方法、映像符号化装置、映像符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体、並びに、映像復号方法、映像復号装置、映像復号プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2008136187A (ja) * | 2006-10-26 | 2008-06-12 | Matsushita Electric Ind Co Ltd | トランスコード装置及びトランスコード方法 |
JP2012023652A (ja) * | 2010-07-16 | 2012-02-02 | Sony Corp | 画像処理装置と画像処理方法 |
JP2012533963A (ja) * | 2009-07-23 | 2012-12-27 | トムソン ライセンシング | ビデオ符号化及び復号化のための適応的変換選択のための方法及び装置 |
-
2013
- 2013-06-18 JP JP2013127392A patent/JP2015002512A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005303773A (ja) * | 2004-04-14 | 2005-10-27 | Nippon Telegr & Teleph Corp <Ntt> | 映像符号化方法、映像符号化装置、映像符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体、並びに、映像復号方法、映像復号装置、映像復号プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2008136187A (ja) * | 2006-10-26 | 2008-06-12 | Matsushita Electric Ind Co Ltd | トランスコード装置及びトランスコード方法 |
JP2012533963A (ja) * | 2009-07-23 | 2012-12-27 | トムソン ライセンシング | ビデオ符号化及び復号化のための適応的変換選択のための方法及び装置 |
JP2012023652A (ja) * | 2010-07-16 | 2012-02-02 | Sony Corp | 画像処理装置と画像処理方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109640089A (zh) * | 2018-11-02 | 2019-04-16 | 西安万像电子科技有限公司 | 图像编解码方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4838253B2 (ja) | 画像符号化装置、画像符号化方法、画像復号化装置、画像復号化方法、および記録方法 | |
US8538181B2 (en) | Image signal encoding apparatus and image signal encoding method | |
JP4838251B2 (ja) | 画像復号化装置、画像復号化方法および画像復号化システム | |
US8139877B2 (en) | Image processing apparatus, image processing method, and computer-readable recording medium including shot generation | |
JP6320450B2 (ja) | 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法 | |
JP2015002512A (ja) | 画像符号化装置及び画像符号化方法 | |
AU2015202063B2 (en) | Image signal decoding device, image signal decoding method, image signal encoding device, image signal encoding method, and program | |
JP2017536027A (ja) | 符号化されたビデオデータ処理方法及びその装置、符号化されたビデオデータ生成方法及びその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170131 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170808 |