JP2011083038A - 伸張復号化装置、伸張復号化方法、及び、プログラム - Google Patents

伸張復号化装置、伸張復号化方法、及び、プログラム Download PDF

Info

Publication number
JP2011083038A
JP2011083038A JP2011012168A JP2011012168A JP2011083038A JP 2011083038 A JP2011083038 A JP 2011083038A JP 2011012168 A JP2011012168 A JP 2011012168A JP 2011012168 A JP2011012168 A JP 2011012168A JP 2011083038 A JP2011083038 A JP 2011083038A
Authority
JP
Japan
Prior art keywords
frame
camera
motion prediction
compression encoding
imaged
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011012168A
Other languages
English (en)
Other versions
JP5402953B2 (ja
Inventor
Kimihiko Kazui
君彦 数井
Koji Yamada
幸二 山田
Takashi Ito
伊藤  隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2011012168A priority Critical patent/JP5402953B2/ja
Publication of JP2011083038A publication Critical patent/JP2011083038A/ja
Application granted granted Critical
Publication of JP5402953B2 publication Critical patent/JP5402953B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】ユーザが希望する視点の動画像を伸張復号化するためには必要のない伸張復号化処理を行わないようにすることで、処理の高速化や装置規模の増大防止を実現することが可能となる装置や方法などを提供する。
【解決手段】伸張復号化装置であって、出力すべきフレームについての指示を受ける指示入力手段と、動き予測情報を動画像データから読み出し、出力すべきフレームの圧縮符号化における動き予測に用いられたフレームを判断する判断手段と、判断手段によって判断されたフレーム、及び出力すべきフレームについてのみ伸張復号化を実行する伸張復号化手段とを含む。
【選択図】 図1

Description

本発明は、多視点において撮像された画像を符号化・復号化する装置や方法などに適用されて有効な技術に関する。
近年、多視点において同時に撮像された動画像を活用する技術が注目されている。このような動画像を用いることにより、従来のステレオカメラシステムでは不可能だったことが可能となる。例えば、立体視ディスプレイを用いることなく、ユーザが自由な視点でカメラ動画像を見ることが可能となった。具体的には、コンサートの模様を多視点において同時に撮像することにより、ユーザは、コンサートの状況を一つの視点からだけではなく、横方向や後方向など任意の視点から鑑賞することが可能となる。
ところで、一般的に動画像の情報量は非常に大きい。このため、動画像のデータを圧縮することなくメディア蓄積やネットワーク伝送を行うことは、伝送速度やコスト面で不利である。このため、動画像のデータを可逆若しくは不可逆の方式で圧縮符号化する技術が開発されてきた。例えば、Moving Picture Experts Group(MPEG)で標準化されたMPEG−1,MPEG−2,MPEG−4等である。
しかし、同時に撮像を行う視点の数が増加する(カメラの台数が増加する)に伴い、動画像の数も増加する。このため、多視点において同時に撮像された動画像の総データ量は、単一のカメラを用いて撮像された動画像のデータ量に比べて増大する。このため、多視点において同時に撮像された動画像のデータを効率的に圧縮符号化する技術が要望されている。
このような問題に対し、各視点において撮像された動画像間の相関性を用いることにより、予測効率を向上させる技術が提案されている。これらの技術では、予測効率が向上することに伴い、符号化効率が向上する。各視点において撮像された動画像間の相関性とは、ある視点カメラに映っている物体や背景は、他視点のカメラにもその一部が映っていることを指す。例えば、ある視点カメラにおけるフレームと、他の視点カメラにおける同時刻のフレームとを比較すると、両カメラが近い位置で近い方向を撮像している場合、同一物体や同一背景が撮像される場合がある。このため、このような異なるカメラによって同時刻に撮像されたフレームを、同一のカメラによって撮像されたフレームとみなすことにより、動きベクトルを用いた予測符号化を行うことができる。例えば、後者のカメラのフレームを、これまでのように同一カメラ(後者のカメラ)によって撮像されたフレームのみを用いて動き予測符号化する場合に比べて、他のカメラ(前者のカメラ)によるフレームをさらに用いて動き予測符号化する場合は、符号化効率を高めることが可能となる。この場合、動きベクトルは、二つのカメラ間の視差に相当する。このような技術の例として、特許文献1〜7がある。
特開2001−186516号公報 特表2002−523943号公報 特開2002−300607号公報 特許3426668号公報 特開平06−98312号公報 特開平10−191394号公報 特開2000−23918号公報
上記のような技術により作成される動画像データは、一つの動画像データに複数視点の動画像を含む。このため、従来の伸張復号化技術によって伸張復号化を実行した場合、ユーザが希望する視点における動画像のみならず、当該動画像データに含まれる他の全ての視点についての動画像データが伸張復号化されていた。このため、不要な処理に処理能力と処理時間が費やされ、処理の遅延などの問題を生じていた。
そこで本発明はこれらの問題を解決し、ユーザが希望する視点の動画像を伸張復号化するためには必要のない伸張復号化処理を行わないようにすることで、処理の高速化や装置規模の増大防止を実現することが可能となる装置や方法などを提供することを目的とする。
上記問題を解決するため、本発明は以下のような構成をとる。本発明の一態様は、
複数のカメラによって撮像された各フレームを圧縮符号化する圧縮符号化装置であって、あるカメラにより撮像されたフレームを、当該カメラによって撮像されたフレームを用いた動き予測と他のカメラによって撮像されたフレームを用いた動き予測とにより圧縮符号化する圧縮符号化手段と、各フレームについて、当該フレームと、他のカメラによって撮像された動き予測に用いられたフレームとを対応づけるための情報及び他のカメラによって撮像されたフレームを用いた動き予測が実施されたか否かを示す情報を含む動き予測情報を生成する動き予測情報作成手段と、複数の圧縮符号化後のフレームと、前記動き予測情報とを含む一つの動画像データを生成する合成手段とを含む圧縮符号化装置によって生成された動画像データを伸張復号化する伸張復号化装置であって、
出力すべきフレームについての指示を受ける指示入力手段と、
前記動き予測情報を前記動画像データから読み出し、前記出力すべきフレームの圧縮符号化における動き予測に用いられたフレームを撮像したとみなされるカメラを判断し、当該カメラによって撮像されたフレームのうち、前記出力すべきフレームについての前記動き予測が実施されることなく圧縮符号化された時間に対応するフレームを除くフレームを出力すべきフレームの圧縮符号化における動き予測に用いられたフレームと判断する判断手段と、
前記判断手段によって判断されたフレーム、及び前記出力すべきフレームについてのみ伸張復号化を実行する伸張復号化手段と
を含む伸張復号化装置である。
本発明の一態様は、プログラムが情報処理装置によって実行されることによって実現されても良い。即ち、本発明は、上記した態様における各手段が実行する処理を、情報処理装置に対して実行させるためのプログラム、或いは当該プログラムを記録した記録媒体として特定することができる。また、本発明は、上記した各手段が実行する処理を情報処理装置が実行する方法をもって特定されても良い。
本発明によれば、複数視点の動画像を含む動画像データを伸張復号化するにあたり、処理の高速化や装置規模の増大防止を実現することが可能となる。
基準カメラによって撮像された各フレームの予測符号化方法と、参照カメラによって撮像された各フレームの予測符号化方法とを示す図である。 動画像データの構成例を示す図である。 圧縮符号化装置の機能ブロックの例を示す図である。 基準カメラ決定処理と参照先決定処理の処理例を示すフローチャートである。 カメラの配置例を示す図である。 各カメラが基準カメラとなるか否か、及び、参照カメラである場合に参照先となるフレームはどの基準カメラとなるかを示す表である。 伸張復号化装置の機能ブロックの例を示す図である。 復号化カメラ判断処理の処理例を示すフローチャートである。 従来の技術の問題点を示す図である。 従来の技術の問題点を示す図である。
[原理]
まず、本発明における予測符号化の方法の原理について説明する。図1は、基準カメラによって撮像された各フレームの予測符号化方法と、参照カメラによって撮像された各フレームの予測符号化方法とを示す図である。図1において、矢印の根に位置するフレームは、矢印の先に位置するフレームを参照することにより予測符号化される。
Iフレームは、フレーム内符号化を行うフレームを示す。Iフレームは、他のフレームを一切参照することなく符号化される。Pフレームは、前方向時間予測符号化フレームを示す。Pフレームは、同一カメラによって撮像されたフレームであって、時間的に直前に位置するIフレーム又は他のPフレームを参照することにより予測符号化される。このように同一カメラによって撮像された他のフレームを参照することにより予測符号化することを、以下では「動き予測符号化」と呼ぶ。Bフレームは、双方向時間予測符号化フレームを示す。Bフレームは、同一カメラによって撮像されたフレームであって、時間的に直前に位置するIフレーム又はPフレーム及び時間的に直後に位置するIフレーム又はPフレームを参照することにより予測符号化される。Iフレーム,Pフレーム,Bフレームの概念は、MPEG−1,2,4と同じである。
I’フレームは、基準カメラによって撮像された同時刻のIフレームのみを参照することにより予測符号化される。このように他のカメラによって撮像されたフレームを参照することにより予測符号化することを、以下では「視差予測符号化」と呼ぶ。P’フレームは、基準カメラによって撮像された同時刻のPフレーム、及び同一カメラによって撮像されたフレームであって時間的に直前に位置するI’フレーム又は他のP’フレームを参照することにより予測符号化される。B’フレームは、基準カメラによって撮像された同時刻のBフレーム、同一カメラによって撮像されたフレームであって時間的に直前に位置するI’フレーム又はP’フレーム、及び同一カメラによって撮像されたフレームであって時間的に直後に位置するI’フレーム又はP’フレームを参照することにより予測符号化される。
次に、本発明における予測符号化によって作成される動画像データの構成について説明する。図2は、動画像データの構成例を示す図である。動画像データには、SEQHとGOPとが含まれる。SEQHは、GOP(Group of pictures)の全カメラ単位に挿入される。SEQH(n)は、以下に続くGOPが、n番目のGOPであることを示す。SEQHは、カメラ総数,各カメラの視差予測タイプ(即ち、各フレームを撮像したカメラが基準カメラと参照カメラのいずれであるか),各参照カメラにおける参照先のカメラを示す識別子を含む。GOPは、時間軸に沿って並んでいるフレームをグループ化したデータである。GOP(m,n)は、カメラmのn番目のGOPであることを示す。
一つのGOPには、GOPHと複数のFrameが含まれる。GOPHは、GOPのヘッダ情報である。GOPHには、このフレームを撮像したカメラを示す識別子,視差予測を行っていない時間情報(GOP先頭からのフレーム番号相対値)を含む。Frameは、符号化されたフレームのデータである。
一つのFrameには、Frame Headerと複数のMB(Macro Block)が含まれる。Frame Headerは、フレームのヘッダ情報である。Frame Headerは、そのフレームの予測種別(I,P,B,I’,P’,B’)が含まれる。MBは、マクロブロック情報を示す。
各MBには、MBType,MV,及びDCTCoeffが含まれる。MBTypeは、各マクロブロックの予測種別(Intra,Inter,Bi−Direction)、及び量子化係数を含む。予測種別は、片方向予測(Inter)や両方向予測(Bi−Direction)で参照するフレームの識別子をさらに含む。予測種別は、片方向予測の場合は一つの識別子を、両方向予測の場合は二つの識別子を含む。MVは、ベクトル情報である。以下、このベクトル情報を動きベクトルと視差ベクトルとに区別して記載する。動きベクトルとは同一カメラによって撮像されたフレーム間のベクトル情報を示し、視差ベクトルとは異なるカメラによって撮像されたフレーム間のベクトル情報を示す。DCTCoeffは、予測誤差の量子化DCT係数情報である。
次に、各カメラによって撮像された動画像を圧縮符号化することにより上記のような動画像データを生成する圧縮符号化装置1と、この圧縮符号化装置1によって生成された動画像データを復号化する伸張復号化装置2とについて説明する。
[圧縮符号化装置]
まず、圧縮符号化装置1の構成例について説明する。圧縮符号化装置1は、ハードウェア的には、バスを介して接続されたCPU(中央演算処理装置),主記憶装置(RAM),補助記憶装置などを備える。補助記憶装置は、不揮発性記憶装置を用いて構成される。ここで言う不揮発性記憶装置とは、いわゆるROM(Read−Only Memory:EPROM(Erasable Programmable Read−Only Memory),EEPROM(Electrically Erasable Programmable Read−Only Memory),マスクROM等を含む),FRAM(Ferroelectric RAM),ハードディスク等を指す。
図3は、圧縮符号化装置1の機能ブロックの例を示す図である。圧縮符号化装置1は、補助記憶装置に記憶された各種のプログラム(OS,アプリケーション等)が主記憶装置にロードされCPUにより実行されることによって、入力フレームバッファ101,減算器102,DCT量子化部103,IDCT逆量子化部104,加算器105,フレームバッファ106,動き・視差ベクトル補償部107,可変長符号部108,ヘッダ付加部109,及び制御部110等を含む装置として機能する。DCT量子化部103,IDCT逆量子化部104,動き・視差ベクトル補償部107,可変長符号部108,ヘッダ付加部109,及び制御部110は、プログラムがCPUによって実行されることにより実現される。また、DCT量子化部103,IDCT逆量子化部104,動き・視差ベクトル補償部107,可変長符号部108,ヘッダ付加部109,及び制御部110は専用のチップとして構成されても良い。次に、圧縮符号化装置1が含む各機能部について説明する。
〈入力フレームバッファ〉
入力フレームバッファ101は、圧縮符号化装置1に入力される動画像をバッファリン
グする。圧縮符号化装置1には、基本カメラによって撮像された動画像と、参照カメラによって撮像された動画像とが入力される。従って、入力フレームバッファ101は、基本カメラによって撮像された動画像と、参照カメラによって撮像された動画像とをバッファリングする。入力フレームバッファ101は、制御部110からの指示に従って、各カメラの符号化処理単位でフレームデータを出力する。符号化処理単位とは、1フレームであっても良いし、1GOP(Group of Pictures)といった複数フレームであっても良い。以下、入力フレームバッファ101によって出力されたフレーム、即ち圧縮符号化の処理対象となるフレームを入力フレームと呼ぶ。
〈減算器〉
減算器102は、入力フレームと、動き補償や視差補償による予測情報との差分を計算し、その結果を予測差分情報として出力する。
〈DCT量子化部〉
DCT量子化部103は、DCT(Discrete Cosine Transform)演算、量子化演算を行う。DCT量子化部103は、減算器102により算出される予測差分情報をブロック単位でDCT演算し、DCT係数を量子化し、その結果である量子化DCT係数を出力する。
〈IDCT逆量子化部〉
IDCT逆量子化部104は、IDCT(Inverse Discrete Cosine Transform)演算(以下、「逆DCT演算」とも呼ぶ)、逆量子化演算を行う。IDCT逆量子化部104は、量子化DCT係数の逆量子化及び逆DCT演算を行い、逆DCT演算結果を得る。
〈加算器〉
加算器105は、逆DCT演算結果と、動き補償や視差補償による予測結果とを足し合わせて、ローカル復号化動画像を生成する。
〈フレームバッファ〉
フレームバッファ106は、ローカル復号化動画像を蓄積する。また、フレームバッファ106は、制御部110からの指示に従って、指定されたカメラ動画像の指定されたフレームを出力する。以下、フレームバッファ106によって出力されたフレーム、即ち動き予測や視差予測に用いられるフレームを予測元フレームと呼ぶ。
〈動き・視差ベクトル補償部〉
動き・視差ベクトル補償部107は、制御部110からの指示に従って、入力フレームと、予測元フレームとを用いてブロックマッチングによる予測を行う。動き・視差ベクトル補償部107は、動きベクトル情報及び視差ベクトル情報を可変長符号部108へ出力する。また、動き・視差ベクトル補償部107は、予測情報を減算器102へ出力する。動きベクトル情報や視差ベクトル情報や予測情報は、予測誤差を最小にするために使用される。また、動き・視差ベクトル補償部107は、フレーム全体での動きベクトル情報を制御部110に出力する。動きベクトル情報とは、例えば全ブロックでの動きベクトル情報の平均と分散などである。
〈可変長符号部〉
可変長符号部108は、量子化の結果を可変長符号化することにより、圧縮符号化されたフレームのデータを生成する。また、動き補償に用いられた動きベクトル情報、視差補償に用いられた視差ベクトル情報をヘッダ付加部109へ渡す。
〈ヘッダ付加部〉
ヘッダ付加部109は、カメラ番号、カメラ種別(基準カメラ又は参照カメラ)、参照する他のカメラ、等の情報を、圧縮符号化された後各フレーム又は複数フレーム単位に付加することにより動画像データを生成する。
〈制御部〉
制御部110は、各カメラにより撮像された動画像の符号化制御、基準カメラの決定(基準カメラ決定処理)、参照カメラにより撮像されたフレームの予測符号化のために参照するフレームの決定(参照先決定処理)などを行う。また、制御部110は、各機能部に指示をすることが可能となるように接続される。また、制御部110には、各カメラのパラメタ(各カメラについての配置情報)が外部から入力される。配置情報は、各カメラの絶対位置であってもよいし相対位置でも良い)。以下、基準カメラ決定処理と参照先決定処理について説明する。
図4は、基準カメラ決定処理と参照先決定処理における制御部110の動作例を示すフローチャートである。図4を用いて、制御部110の動作例について説明する。なお、以下の処理は一組のGOP単位で実行される。即ち、一つのSEQHによってまとめられる複数のGOP単位で、図4の処理が実行される。
まず、制御部110は、直前のGOPの最後のフレームにおいてパニング(Panning)が生じていたか否か判断する(S01)。制御部110は、例えば、直前のGOPの最後のフレームにおける動きベクトル情報(例えば、全ブロックでの動きベクトル情報の平均及び分散など)に基づいて、パニングの発生について判断する。言い換えれば、この最後のフレームにおいて撮像されていた被写体の画像内での動きに基づいて、パニングの発生が判断される。この場合、制御部110は、横方向の動きベクトルの平均値が閾値以上であるか否か、及び分散が閾値以下であるか否か判断する。この二つの条件が満たされる場合に、制御部110は、パニングが発生していると判断する。一方、この二つの条件の一方でも満たされない場合は、制御部110は、パニングが発生していないと判断する。
パニングが発生していないと判断した場合(S01−No)、制御部110は、C(N/2±nK)を計算し、その計算結果に該当するカメラを基準カメラとする(S03)。なお、C(m)は、m番目のカメラを示す識別子であり、一方向に向けて並ぶ複数のカメラに並んでいる順番で数字が割り当てられていると仮定する。また、Nはカメラの総数を示す。また、nは0以上の整数を示す。また、Kの値は、正の値を示す値であり、カメラ間の間隔やカメラと被写体との距離などに応じて設計者により適宜設定される値である。この場合は、カメラ列の中心、及び中心から等間隔(K)に左右両方向にあるカメラが基準カメラとして設定される。
そして、処理対象となるGOPに含まれるフレームのうち、参照カメラによって撮像されたフレームを予測符号化するための参照先フレームが決定される。この場合は、制御部110は、各フレームにとって、中心側の直近の基準フレームを参照先フレームとなるように決定する(S06)。図5は、カメラの配置例を示す図である。また、図6は、各カメラが基準カメラとなるか否か、及び、参照カメラである場合に参照先となるフレームはどの基準カメラとなるかを示す表である。図5では、7台のカメラC(1)〜C(7)がX軸上に番号順に並んでいる。また、図5では、各カメラは撮影方向(Z軸方向)に垂直方向に等間隔若しくは任意の間隔で並んでいる。また、図6では、Kの値は“2”と設定されている。また、図6では、○は基準カメラであることを示し、C(m)はそのカメラによって撮像されたフレームが参照先フレームとなることを示す。上記のようにパニングが生じていないと判断された場合、S03の処理の結果、C(2),C(4),C(6)
が基準カメラとして設定される。そして、C(1)はC(2)を、C(3)及びC(5)はC(4)を、C(7)はC(6)を参照先とする。
次に、パニングが発生していると判断した場合(S01−Yes)について説明する。この場合、制御部110は、パニングがどの方向に生じているか判断する(S02)。この方向は、パニングの発生を判断する際に使用された動きベクトル情報により判断できる。即ち、このベクトルの向きによってパニングの発生方向が判断できる。制御部110は、左にパニングが生じていると判断した場合(S02−左)、C(1+nK)を基準カメラとする(S04)。そして、制御部110は、参照カメラにより撮像された各フレームにとっての参照先フレームを、右側の直近の基準フレームに決定する(S07)。言い換えれば、制御部110は、参照カメラにより撮像された各フレームにとっての参照先フレームを、パニングが発生している方向と逆方向に設置された直近の基準カメラとして設定する。
一方、制御部110は、右にパニングが生じていると判断した場合(S02−右)、C(N−nK)を基準カメラとする(S05)。そして、制御部110は、参照カメラにより撮像された各フレームにとっての参照先フレームを、左側の直近の基準フレームに決定する(S08)。
[伸張復号化装置]
次に、伸張復号化装置2の構成例について説明する。伸張復号化装置2は、ハードウェア的には、バスを介して接続されたCPU(中央演算処理装置),主記憶装置(RAM),補助記憶装置などを備える。補助記憶装置は、不揮発性記憶装置を用いて構成される。ここで言う不揮発性記憶装置とは、いわゆるROM(Read−Only Memory:EPROM(Erasable Programmable Read−Only Memory),EEPROM(Electrically Erasable Programmable Read−Only Memory),マスクROM等を含む),FRAM(Ferroelectric RAM),ハードディスク等を指す。
図7は、伸張復号化装置2の機能ブロックの例を示す図である。伸張復号化装置2は、補助記憶装置に記憶された各種のプログラム(OS,アプリケーション等)が主記憶装置にロードされCPUにより実行されることによって、ヘッダ解析部201,符号化動画像バッファ202,可変長復号部203,IDCT逆量子化部204,加算器205,表示動画像バッファ206,フレームバッファ207,動き・視差ベクトル補償部208,及び制御部209等を含む装置として機能する。ヘッダ解析部201,可変長復号部203,IDCT逆量子化部204,及び動き・視差ベクトル補償部208,及び制御部209は、プログラムがCPUによって実行されることにより実現される。また、ヘッダ201,可変長復号部203,IDCT逆量子化部204,動き・視差ベクトル補償部208,及び制御部209は専用のチップとして構成されても良い。次に、伸張復号化装置2が含む各機能部について説明する。
〈ヘッダ解析部〉
ヘッダ解析部201は、入力された動画像データ(圧縮符号化装置1により作成された動画像データ)から、ヘッダ情報を抽出する。ヘッダ情報とは、具体的には、各フレームを撮像したカメラの識別子やその種別(基準カメラ又は参照カメラ)、参照先フレームを撮像したカメラの識別子などである。また、ヘッダ解析部201は、制御部209から、復号化すべきフレームを撮像したカメラの識別子を受け取る。そして、ヘッダ解析部201は、この識別子に基づいて、入力された各フレームについて復号化すべきか否か判断し、復号化すべきと判断したフレームのみを符号化動画像バッファ202へ渡す。具体的には、ヘッダ解析部201は、各カメラによって撮像されたフレームを含むGOPのうち、
復号化すべきカメラに対応するGOPを判断する(復号化カメラ判断処理)。この処理が実行されることにより、不要なフレームについての復号化処理を省略することが可能となり、処理の高速化を図ることができる。同時に、バッファリングすべきデータ量の削減も図ることができ、例えば表示動画像バッファ206やフレームバッファ207の規模を小さくすることができる。さらに、ヘッダ解析部201は、制御部209に対し、符号化動画像バッファ202に渡したフレームの識別子を通知する。
以下、復号化カメラ判断処理について説明する。なお、以下の説明では、参照カメラによって撮像された画像は、参照先フレームとして基準カメラによって撮像されたフレームのみを用いて圧縮符号化されたと仮定している。ただし、このように限定される必要はない。図8は、復号化カメラ判断処理におけるヘッダ解析部201の動作例を示すフローチャートである。このフローチャートに示される処理は、SEQHが検出される度に実行される。まず、ヘッダ解析部201は、制御部209からカメラを示す識別子を取得する(S11)。次に、ヘッダ解析部201は、入力される動画像データからSEQHを抽出し解析する(S12)。この解析により、ヘッダ解析部201は、各カメラの誤差予測タイプや参照先となるカメラの識別子などを取得する。
次に、ヘッダ解析部201は、GOPHを探索する。このとき、次のSEQHが検出された場合、即ち次のカメラによって撮像されたフレームが無い場合はこの処理を終了する(S13−No)。一方、GOPHが検出された場合は(S13−Yes)、ヘッダ解析部201は、このGOPHを解析し、カメラの識別子を取得する。そして、ヘッダ解析部201は、GOPHに含まれる識別子と、制御部209から渡された識別子とが一致するか否か判断する。一致する場合(S14−Yes)、このGOPに含まれる各フレームについての復号化を実行すべきと判断する(S19)。そして、S13以降の処理が再び実行される。
一方、ヘッダ解析部201は、識別子が一致しない場合(S14−No)、制御部209から渡された識別子のカメラの参照先に対応するカメラであるか否か判断する。参照先でない場合(S15−No)、S13以降の処理が実行される。一方、参照先である場合(S15−Yes)、ヘッダ解析部201は、GOPHを解析し視差予測を行っていない時間を解析する(S16)。そして、全時間で視差予測を行っている場合は(S17−Yes)、このGOPに含まれる各フレームについての復号化を実行すべきと判断する(S19)。一方、一部の時間で視差予測を行っていない場合には(S17−No)、ヘッダ解析部201は、視差予測を行っているフレームを判断し、そのフレームのみについて復号化すべきと判断する(S18)。そして、S13以降の処理が再び実行される。
〈符号化動画像バッファ〉
符号化動画像バッファ202は、ヘッダ解析部201によって復号化すべきと判断された各フレームをバッファリングする。符号化動画像バッファ202は、制御部209からの指示に従って、復号化処理単位でフレームを出力する。復号化処理単位とは、1フレームであっても良いし、GOPのように複数フレームであっても良い。
〈可変長復号部〉
可変長復号部203は、可変長符号化されている量子化DCT係数を可変長復号化し、その結果をIDCT逆量子化部204に渡す。また、可変長復号化部203は、動きベクトル情報や視差ベクトル情報についても可変長復号化し、動き・視差ベクトル補償部208に渡す。
〈IDCT逆量子化部〉
IDCT逆量子化部204は、IDCT演算、逆量子化演算を行う。IDCT逆量子化
部204は、量子化DCT係数の逆量子化及び逆DCT演算を行い、逆DCT演算結果を得る。
〈加算器〉
加算器205は、逆DCT演算結果と、動き補償や視差補償による予測結果とを足し合わせて、復号化動画像を生成する。
〈表示動画像バッファ〉
表示動画像バッファ206は、加算器205によって生成された復号化動画像のデータをバッファリングする。このとき、表示動画像バッファ208は、外部から表示することを指定されたカメラに対応する復号化動画像のデータをバッファリングする。そして、表示動画像バッファ206は、バッファリングしているデータを順次出力する。
〈フレームバッファ〉
フレームバッファ207は、表示動画像バッファ206と同様に、復号化動画像のデータをバッファリングする。さらに、フレームバッファ207は、外部からの指定に関わらず、処理対象のフレームの復号化に必要となる他のカメラにより撮像されたフレームも蓄積する。
〈動き・視差ベクトル補償部〉
動き・視差ベクトル補償部208は、制御部209からの指示に従い、処理対象となっているフレームの復号化に必要な動き予測・視差予測に用いるフレームを、フレームバッファ207から読み出す。そして、動き・視差ベクトル補償部208は、可変長復号部203から動きベクトル情報・視差ベクトル情報を取得する。そして、予測結果を取得し、その予測結果を加算器205へ渡す。
〈制御部〉
制御部209は、入力される動画像データについての復号化制御を行う。また、制御部209は、各機能部に指示をすることが可能となるように接続される。また、制御部209には、外部から、表示動画像バッファ208から外部へ出力すべき動画像を撮像したカメラを示す識別子が入力される。この識別子は、一つでも複数でも良い。そして、制御部209は、入力されたこの識別子をヘッダ解析部201に渡す。
〔作用/効果〕
〔変形例〕
参照カメラにより撮像された各フレーム(I’フレーム,P’フレーム,B’フレーム)は、基準カメラによって同時刻に撮像されたフレームに限らず、他の参照カメラによって撮像されたフレームを参照して予測符号化されても良いし、基準カメラや他の参照カメラによって異なる時刻によって撮像されたフレームを参照して予測符号化されても良い。
また、カメラは一直線上に並ぶように設置される必要はなく、波線状や円状や十字状や四角状など、どのように並ぶように設置されても良い。
本発明は、多視点において撮像された画像を符号化・復号化する装置に対して利用することにより、効果を得ることができる。
1 圧縮符号化装置
101 入力フレームバッファ
102 減算器
103 DCT量子化部
104 IDCT逆量子化部
105 加算器
106 フレームバッファ
107 動き・視差ベクトル補償部
108 可変長符号部
109 ヘッダ付加部
110 制御部
2 伸張復号化装置
201 ヘッダ解析部
202 符号化動画像バッファ
203 可変長復号部
204 IDCT逆量子化部
205 加算器
206 表示動画像バッファ
207 フレームバッファ
208 動き・視差ベクトル補償部
209 制御部

Claims (3)

  1. 複数のカメラによって撮像された各フレームを圧縮符号化する圧縮符号化装置であって、あるカメラにより撮像されたフレームを、当該カメラによって撮像されたフレームを用いた動き予測と他のカメラによって撮像されたフレームを用いた動き予測とにより圧縮符号化する圧縮符号化手段と、各フレームについて、当該フレームと、他のカメラによって撮像された動き予測に用いられたフレームとを対応づけるための情報及び他のカメラによって撮像されたフレームを用いた動き予測が実施されたか否かを示す情報を含む動き予測情報を生成する動き予測情報作成手段と、複数の圧縮符号化後のフレームと、前記動き予測情報とを含む一つの動画像データを生成する合成手段とを含む圧縮符号化装置によって生成された動画像データを伸張復号化する伸張復号化装置であって、
    出力すべきフレームについての指示を受ける指示入力手段と、
    前記動き予測情報を前記動画像データから読み出し、前記出力すべきフレームの圧縮符号化における動き予測に用いられたフレームを撮像したとみなされるカメラを判断し、当該カメラによって撮像されたフレームのうち、前記出力すべきフレームについての前記動き予測が実施されることなく圧縮符号化された時間に対応するフレームを除くフレームを出力すべきフレームの圧縮符号化における動き予測に用いられたフレームと判断する判断手段と、
    前記判断手段によって判断されたフレーム、及び前記出力すべきフレームについてのみ伸張復号化を実行する伸張復号化手段と
    を含む伸張復号化装置。
  2. 複数のカメラによって撮像された各フレームを圧縮符号化する圧縮符号化装置であって、あるカメラにより撮像されたフレームを、当該カメラによって撮像されたフレームを用いた動き予測と他のカメラによって撮像されたフレームを用いた動き予測とにより圧縮符号化する圧縮符号化手段と、各フレームについて、当該フレームと、他のカメラによって撮像された動き予測に用いられたフレームとを対応づけるための情報及び他のカメラによって撮像されたフレームを用いた動き予測が実施されたか否かを示す情報を含む動き予測情報を生成する動き予測情報作成手段と、複数の圧縮符号化後のフレームと、前記動き予測情報とを含む一つの動画像データを生成する合成手段とを含む圧縮符号化装置によって生成された動画像データを伸張復号化する伸張復号化方法であって、
    情報処理装置が、出力すべきフレームについての指示を受けるステップと、
    情報処理装置が、前記動き予測情報を前記動画像データから読み出し、前記出力すべきフレームの圧縮符号化における動き予測に用いられたフレームを撮像したとみなされるカメラを判断し、当該カメラによって撮像されたフレームのうち、前記出力すべきフレームについての前記動き予測が実施されることなく圧縮符号化された時間に対応するフレームを除くフレームを、出力すべきフレームの圧縮符号化における動き予測に用いられたフレームと判断するステップと、
    情報処理装置が、前記判断するステップにおいて判断されたフレーム、及び前記出力すべきフレームについてのみ伸張復号化を実行するステップと
    を含む伸張復号化方法。
  3. 複数のカメラによって撮像された各フレームを圧縮符号化する圧縮符号化装置であって、あるカメラにより撮像されたフレームを、当該カメラによって撮像されたフレームを用いた動き予測と他のカメラによって撮像されたフレームを用いた動き予測とにより圧縮符号化する圧縮符号化手段と、各フレームについて、当該フレームと、他のカメラによって撮像された動き予測に用いられたフレームとを対応づけるための情報及び他のカメラによって撮像されたフレームを用いた動き予測が実施されたか否かを示す情報を含む動き予測情報を生成する動き予測情報作成手段と、複数の圧縮符号化後のフレームと、前記動き予測情報とを含む一つの動画像データを生成する合成手段とを含む圧縮符号化装置によって
    生成された動画像データの伸張復号化を情報処理装置に実行させるためのプログラムであって、
    出力すべきフレームについての指示を受けるステップと、
    前記動き予測情報を前記動画像データから読み出し、前記出力すべきフレームの圧縮符号化における動き予測に用いられたフレームを撮像したとみなされるカメラを判断し、当該カメラによって撮像されたフレームのうち、前記出力すべきフレームについての前記動き予測が実施されることなく圧縮符号化された時間に対応するフレームを除くフレームを、出力すべきフレームの圧縮符号化における動き予測に用いられたフレームと判断するステップと、
    前記判断するステップにおいて判断されたフレーム、及び前記出力すべきフレームについてのみ伸張復号化を実行するステップと
    を情報処理装置に実行させるためのプログラム。
JP2011012168A 2011-01-24 2011-01-24 伸張復号化装置、伸張復号化方法、及び、プログラム Expired - Fee Related JP5402953B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011012168A JP5402953B2 (ja) 2011-01-24 2011-01-24 伸張復号化装置、伸張復号化方法、及び、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011012168A JP5402953B2 (ja) 2011-01-24 2011-01-24 伸張復号化装置、伸張復号化方法、及び、プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2006550570A Division JP4825137B2 (ja) 2005-01-07 2005-01-07 圧縮符号化装置、伸張復号化装置

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2011037441A Division JP5402960B2 (ja) 2011-02-23 2011-02-23 伸張復号化装置、及び、伸張復号化方法
JP2011037440A Division JP2011130499A (ja) 2011-02-23 2011-02-23 伸張復号化装置、及び、伸張復号化方法

Publications (2)

Publication Number Publication Date
JP2011083038A true JP2011083038A (ja) 2011-04-21
JP5402953B2 JP5402953B2 (ja) 2014-01-29

Family

ID=44076533

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011012168A Expired - Fee Related JP5402953B2 (ja) 2011-01-24 2011-01-24 伸張復号化装置、伸張復号化方法、及び、プログラム

Country Status (1)

Country Link
JP (1) JP5402953B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013042279A (ja) * 2011-08-12 2013-02-28 Renesas Electronics Corp 動画像復号装置及び画像表示装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09261653A (ja) * 1996-03-18 1997-10-03 Sharp Corp 多視点画像符号化装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09261653A (ja) * 1996-03-18 1997-10-03 Sharp Corp 多視点画像符号化装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013042279A (ja) * 2011-08-12 2013-02-28 Renesas Electronics Corp 動画像復号装置及び画像表示装置

Also Published As

Publication number Publication date
JP5402953B2 (ja) 2014-01-29

Similar Documents

Publication Publication Date Title
US8488678B2 (en) Moving image encoding apparatus and moving image encoding method
JP5197591B2 (ja) 映像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体
WO2010095207A1 (ja) 動画撮像装置
US8681864B2 (en) Video coding apparatus and video coding control method
US20120207219A1 (en) Picture encoding apparatus, picture encoding method, and program
JP2010041354A (ja) 動画像符号化方法、符号化装置及び符号化プログラム
CN112073737A (zh) 在直播视频流应用中重新编码预测的图像帧
JP4825137B2 (ja) 圧縮符号化装置、伸張復号化装置
JP4893311B2 (ja) 圧縮符号化装置、伸張復号化装置
KR20090046812A (ko) 비디오 압축 방법
JP5402953B2 (ja) 伸張復号化装置、伸張復号化方法、及び、プログラム
JP2002199392A (ja) 映像符号化方法および装置
JP5402960B2 (ja) 伸張復号化装置、及び、伸張復号化方法
US8897368B2 (en) Image coding device, image coding method, image coding integrated circuit and image coding program
JP2011130499A (ja) 伸張復号化装置、及び、伸張復号化方法
KR100926608B1 (ko) 압축 부호화 장치, 신장 복호화 장치
KR100926607B1 (ko) 압축 부호화 장치, 신장 복호화 장치
JP5741073B2 (ja) 画像符号化装置、画像符号化方法、及び画像符号化プログラム
JP5189618B2 (ja) 映像符号化方法,映像符号化装置および映像符号化プログラム
JP4700992B2 (ja) 画像処理装置
US20160127742A1 (en) Video coding device, video decoding device, video system, video coding method, video decoding method, and computer readable storage medium
JP2010062999A (ja) 動画像符号化装置、動画像符号化方法、及び、コンピュータプログラム
JP2008245237A (ja) 画像処理方法、画像処理装置およびそれを用いた撮像装置
JP2008258769A (ja) 画像符号化装置及びその制御方法、並びに、コンピュータプログラム
JP2011176700A (ja) 画像符号化装置および画像符号化方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121211

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130212

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130402

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130702

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130710

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131001

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131014

R150 Certificate of patent or registration of utility model

Ref document number: 5402953

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees