JP2010212811A - 動画像符号化装置及び動画像復号化装置 - Google Patents

動画像符号化装置及び動画像復号化装置 Download PDF

Info

Publication number
JP2010212811A
JP2010212811A JP2009054220A JP2009054220A JP2010212811A JP 2010212811 A JP2010212811 A JP 2010212811A JP 2009054220 A JP2009054220 A JP 2009054220A JP 2009054220 A JP2009054220 A JP 2009054220A JP 2010212811 A JP2010212811 A JP 2010212811A
Authority
JP
Japan
Prior art keywords
moving image
resolution
image data
data
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009054220A
Other languages
English (en)
Inventor
Takuma Chiba
琢麻 千葉
Seishi Abe
清史 安倍
Hiroaki Shimazaki
浩昭 島崎
Kenjiro Tsuda
賢治郎 津田
Tatsuro Shigesato
達郎 重里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2009054220A priority Critical patent/JP2010212811A/ja
Publication of JP2010212811A publication Critical patent/JP2010212811A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】低解像度画像データ内の注目領域の位置を特定するための情報を転送することによる転送データ量の増加を防ぐことができる画像符号化装置を提供する。
【解決手段】動画像符号化装置200であって、入力される動画像データの符号化を行い、符号化データを出力する符号化部220と、動画像データ中の予め定められた領域である注目領域を指定する注目領域指定部210とを備え、符号化部220は、注目領域を高解像度の動画像として符号化して動画像データを低解像度の動画像として符号化する際に、動画像データにおける注目領域の位置を特定するための情報を含む符号化データを生成する。
【選択図】図1

Description

本発明は、動画像の符号化装置及び復号化装置に関する。
近年、地デジに代表されるデジタル放送が開始され、ハイビジョン放送が一般的となってきている。同時に、動画像を撮影するビデオカメラにおいても、ハイビジョン撮影が当たり前となってきている。
ハイビジョン動画の撮影は、今までのSD(Standard Definition)画角の動画の撮影と比較して、撮影される画素数が、大幅に増加している。フルハイビジョン動画は、1フレームの画素数が、1920×1080であるのに対し、SD画角では、640×480であり、画素数は、6倍になっている。そのため、動画像の処理や符号化の処理にかかる演算についても、6倍の演算が必要となる。つまり、画素数が増加すると、その分処理速度も向上しなければならない。
近年、撮像素子の進化は目覚しく、ハイビジョン動画以上の画素数を持った動画像の撮影も可能となってきている。例えば、4K2Kと呼ばれる、フルハイビジョンの4倍の画素数(4096×2048画素)の規格や、スーパーハイビジョンと呼ばれるフルハイビジョンの16倍(7680×4320画素)の規格も存在する。
このような画像の高精細化は、きれいな動画像を残すことが可能となるが、その画像を処理、保存する際に、非常に演算量が大きくなったり、データレートが大きくなったりするため、課題となっている。
この課題に対応する技術として、特許文献1では、静止画の画像データを転送する際に指定領域を設定し、指定領域は高解像度画像データを転送し、指定領域以外の領域については、低解像度の画像データを転送することにより、画像データの転送量を削減している。また、特許文献1では、低解像度画像データ内の指定領域情報を転送することで、低解像度画像データ内の指定領域の位置を伝達している。
特開2007−081465号公報
しかしながら、上記の特許文献1では、具体的なコーデックへの適用事例が、静止画であるJPEG 2000のみに限定されており、動画像のような他のコーデックへの適用については開示されていない。特に、近年、圧縮率の高いコーデックとして普及しているMPEG−4 AVC/H.264に適用する方法については、言及されていない。
また、特許文献1では、低解像度画像データ内の指定領域(以下、注目領域という)の情報を転送することで、低解像度画像データ内の注目領域の位置を伝達しているが、この方式では、注目領域の位置情報にかかる情報を転送する分だけ、転送データ量が増加するという課題がある。特に、動画像に適用すると、転送データ量が累積され増加する。
そこで、本発明は、このような課題に鑑みてなされたものであり、低解像度画像データ内の注目領域の位置を特定するための情報を転送することによる転送データ量の増加を防ぐことができる画像符号化装置を提供することを目的とする。
上記目的を達成するために、本発明に係る画像符号化装置は、入力される動画像データの符号化を行い、符号化データを出力する符号化部と、前記動画像データ中の予め定められた領域である注目領域を指定する注目領域指定部とを備え、前記符号化部は、前記注目領域を第一の解像度の動画像として符号化して前記動画像データを第二の解像度の動画像として符号化する際に、前記動画像データにおける前記注目領域の位置を特定するための情報を含む符号化データを生成する。
これによれば、第一の解像度及び第二の解像度の動画像を符号化した際に生成される2つの符号化データに、注目領域の位置を特定するための情報が含まれる。このため、当該2つの符号化データから、注目領域の位置を特定するための情報を取得することが可能となる。したがって、当該注目領域の位置を特定するための情報を転送する必要がないため、転送データ量の増加を防ぐことができる。
また、好ましくは、前記符号化部は、前記注目領域の位置を特定するための情報として、前記注目領域の位置情報を、前記第一の解像度の動画像を符号化した際に出力する符号化データのユーザー領域、もしくは、前記第二の解像度の動画像を符号化した際に出力する符号化データのユーザー領域に保存して前記符号化データを生成する。
これによれば、注目領域の位置情報が、符号化データのユーザー領域に保存される。これにより、第一の解像度及び第二の解像度の動画像を符号化した際に生成される2つの符号化データに、注目領域の位置情報が含まれる。つまり、当該2つの符号化データから、注目領域の位置情報を取得することが可能となり、注目領域の位置情報を示すデータを管理する必要がなくなる。このため、当該2つの符号化データだけあれば、第一の解像度の動画像データと第二の解像度の動画像データとを重ね合わせることが可能となる。したがって、当該注目領域の位置を特定するための情報を転送する必要がないため、転送データ量の増加を防ぐことができる。
また、好ましくは、前記符号化部は、前記動画像データを前記第二の解像度の動画像として符号化する場合には、前記動画像データのうち、前記注目領域以外の領域を、前記第二の解像度の動画像として符号化する。又は、前記符号化部は、前記動画像データを前記第二の解像度の動画像として符号化する場合には、前記動画像データのうち、前記注目領域の全部もしくは一部を、単一色の画像として符号化することにしてもよい。又は、前記符号化部は、前記動画像データを前記第二の解像度の動画像として符号化する場合には、前記動画像データが画面間参照を使用するピクチャであった場合、前記注目領域の全部もしくは一部を、スキップマクロブロックとして符号化することにしてもよい。
これによれば、第二の解像度の動画像において、注目領域を符号化しないことにしたり、注目領域を単一色の画像として符号化したり、注目領域をスキップマクロブロックとして符号化することで、その符号化データのサイズを小さくすることが可能となる。
また、前記符号化部は、前記注目領域の上下左右端のそれぞれからマクロブロック1つ分小さくした領域を、単一色の画像として符号化することにしてもよい。又は、前記符号化部は、前記注目領域の上下左右端のそれぞれからマクロブロック1つ分小さくした領域を、スキップマクロブロックとして符号化することにしてもよい。
これによれば、第二の解像度の動画像において、注目領域の上下左右端のそれぞれから、マクロブロック1つ分小さくした領域を、単一色の画像に変更して符号化するか、もしくは、スキップマクロブロックとして符号化することで、注目領域の境界付近での画質劣化を防ぐことが可能となる。
また、前記符号化部は、前記動画像データを前記第二の解像度の動画像として符号化する際に、前記注目領域の位置を特定するための情報として、前記注目領域の全部もしくは一部を、ある特定の符号化条件で符号化したデータを含む符号化データを生成することにしてもよい。
これによれば、第二の解像度の動画像において、注目領域をある特定の符号化条件で符号化することで、注目領域の位置情報を保存しなくても、注目領域が判別可能となり、注目領域保存にかかる処理を削減することが可能となる。したがって、当該注目領域の位置を特定するための情報を転送する必要がないため、転送データ量の増加を防ぐことができる。
なお、本発明は、このような動画像符号化装置として実現することができるだけでなく、被写体像を撮像し動画像データを出力する撮像部をも備えた撮像装置として実現することができ、また、当該動画像符号化装置が符号化した符号化データを復号化する動画像復号化装置として実現することもできる。
また、本発明は、このような動画像符号化装置や撮像装置、動画像復号化装置として実現することができるだけでなく、その装置を構成する各処理部を備え当該装置を制御する集積回路として実現したり、当該各処理部の処理をステップとする方法として実現したりすることができる。さらに、本発明は、それらステップをコンピュータに実行させるプログラムとして実現したり、そのプログラムを記録したコンピュータ読み取り可能なCD−ROMなどの記録媒体として実現したり、そのプログラムを示す情報、データ又は信号として実現したりすることもできる。そして、それらプログラム、情報、データ及び信号は、インターネット等の通信ネットワークを介して配信してもよい。
本発明により、動画像の符号化装置において、符号化データに注目領域の位置を特定するための情報を含めることで、注目領域の位置を特定するための情報を転送することによる転送データ量の増加を防ぐことができる。
(実施の形態1)
図1は、本発明の実施の形態1における撮像装置10の機能構成を示すブロック図である。
同図に示すように、撮像装置10は、撮像部100及び動画像符号化装置200を備えている。また、動画像符号化装置200は、注目領域指定部210及び符号化部220を備えている。
撮像部100は、被写体像を撮像し、動画像データを出力する。動画像データは、符号化部220に入力される。
注目領域指定部210は、動画像データを構成する画像の注目領域を指定する。ここで、注目領域は、動画像データ中の予め定められた領域であり、例えば、ユーザーによって指定される。
符号化部220は、入力される動画像データの符号化を行い、符号化データを出力する。具体的には、符号化部220は、注目領域を第一の解像度の動画像として符号化して動画像データを第二の解像度の動画像として符号化する際に、動画像データにおける注目領域の位置を特定するための情報を含む符号化データを生成する。
ここで、以下では、第一の解像度は高解像度であり、第二の解像度は低解像度であることとする。つまり、符号化部220は、動画像データと注目領域とから、注目領域を切り出し、高解像度の動画像として符号化する。また、符号化部220は、動画像データを縮小して低解像度の動画像として符号化する。
図2は、高解像度の動画像データと低解像度の動画像データの具体的な例を示す図である。
撮像部100が画像を撮影し、注目領域指定部210が注目領域を指定する。ここでは、同図に示すように、撮像部100により、横3840画素×縦2160画素の時間的に連続する画像が撮影されて、動画像として出力される。そして、注目領域指定部210によって、注目領域が、左上の画素の座標(1440,640)、注目領域の大きさ横1920画素×縦1080画素として指定される。なお、撮像部100によって出力された画像は、左上の画素の座標が(0,0)、右下の画素の座標が(3839,2159)となっている。
注目領域は、動画像データから切り出されて、横1920画素×縦1080画素の画像となり、高解像度の動画像データとして、符号化部220で符号化される。
また、動画像データとして入力された画像は、縦・横、それぞれ1/2に縮小されて、横1920画素×縦1080画素の画像となり、低解像度の動画像データとして、符号化部220で符号化される。
図3は、本発明で示される動画像符号化装置200が出力する符号化データのストリームの構造の一例を示す図である。
一般に、H.264/AVCのデータストリームは、複数の「NAL unit」で構成される(図3では図示を省略している)。「NAL unit」は、「NAL unit」内の先頭で符号化されているパラメータ、即ち「nal_unit_type」により、その種類が決定されている。「nal_unit_type=9」のとき、「NAL unit」は、「access unit delimiter」である。なお、「NAL unit type」の一覧を図4に示す。
図3に示す符号化画像データは、先頭が「access unit delimiter」であり、そのすぐ後に、「SEI」が置かれる。
この「SEI(Suplemental Enhancement Information)」は、VCL(Video Coding Layer)を復号化する際に使用される補足的な付加情報を格納するNAL unitである。SEI内のpayloadTypeが5のとき、そのSEIは、「user_data_unsigned_SEI」となる。「user_data_unsigned_SEI」は、ユーザーが独自に定義する情報を格納することが可能である。
符号化部220は、符号化データを作成する際に、注目領域の位置情報を、この「user_data_unsigned_SEI」に格納する。具体的には、例えば、図2の場合は、注目領域の左上の画素の座標(1440,640)と、注目領域の大きさ 横1920画素×縦1080画素を、この「user_data_unsigned_SEI」に格納する。なお、注目領域の位置情報は、全ての「user_data_unsigned_SEI」に格納される必要はなく、注目領域の位置情報の変更があった場合にのみ格納されることにしてもよい。
また、この注目領域の位置情報は、高解像度の動画像データを符号化した結果出力される符号化データに付加されてもよいし、低解像度の動画像データを符号化した結果出力される符号化データに付加されてもよい。また、その両方に付加されてもよい。
このように、符号化部220は、注目領域の位置を特定するための情報として、注目領域の位置情報を、高解像度の動画像を符号化した際に出力する符号化データのユーザー領域、もしくは、低解像度の動画像を符号化した際に出力する符号化データのユーザー領域に保存して符号化データを生成する。
図5は、低解像度の動画像データを符号化する際に、注目領域以外を符号化する場合の例を示した図である。
低解像度の動画像データは、縦・横それぞれ1/2に縮小され、横1920×縦1080の大きさの画像である。注目領域は、縮小前の画像において、左上の座標(1440,640)、大きさ 横1920×縦1080と指定されている。縮小後の低解像度の画像における注目領域は、左上の座標(720,320)、大きさ 横960×縦540の領域となる。符号化部220は、この領域以外の領域をスライス分割して符号化を行う。図5の例では、4つのスライスに分割されている。
つまり、符号化部220は、
スライス1は、左上の座標(0,0)、大きさ 横1920×縦320、
スライス2は、左上の座標(0,320)、大きさ 横720×縦540、
スライス3は、左上の座標(1680,320)、大きさ 横240×縦540、
スライス4は、左上の座標(0,860)、大きさ 横1920×縦220、
の領域として、符号化を行う。
このように、符号化部220は、動画像データを低解像度の動画像として符号化する場合には、動画像データのうち、注目領域以外の領域を、低解像度の動画像として符号化する。
図6は、撮像装置10の動作の一例を示すフローチャートである。
まず、撮像部100は、被写体像を撮像する(S102)。そして、撮像部100は、動画像データを符号化部220に出力する(S104)。
そして、注目領域指定部210は、動画像データ中の注目領域を指定する(S106)。
次に、符号化部220は、入力される動画像データの符号化を行い、符号化データを生成する(S108)。具体的には、符号化部220は、注目領域を高解像度の動画像として符号化して動画像データを低解像度の動画像として符号化する際に、動画像データにおける注目領域の位置を特定するための情報を含む符号化データを生成する。さらに具体的には、符号化部220は、注目領域の位置を特定するための情報として、注目領域の位置情報を、高解像度の動画像を符号化した際に出力する符号化データのユーザー領域、もしくは、低解像度の動画像を符号化した際に出力する符号化データのユーザー領域に保存して符号化データを生成する。
そして、符号化部220は、符号化データを出力する(S110)。
このように、注目領域の位置情報が、符号化データのユーザー領域に保存される。これにより、高解像度及び低解像度の動画像を符号化した際に生成される2つの符号化データに、注目領域の位置情報が含まれる。つまり、当該2つの符号化データから、注目領域の位置情報を取得することが可能となり、注目領域の位置情報を示すデータを管理する必要がなくなる。
このため、当該2つの符号化データだけあれば、高解像度の動画像データと低解像度の動画像データとを重ね合わせることが可能となる。したがって、当該注目領域の位置を特定するための情報を転送する必要がないため、転送データ量の増加を防ぐことができる。
また、低解像度の動画像において、注目領域を符号化しないことで、符号化データのサイズを小さくすることが可能となる。
(実施の形態2)
図7は、本発明の実施の形態2における撮像装置10の機能構成を示すブロック図である。
同図に示すように、撮像装置10は、撮像部100及び動画像符号化装置200を備えており、動画像符号化装置200は、注目領域指定部210、符号化部220及び画像変換部230を備えている。
撮像部100は、被写体像を撮像し、動画像データを出力する。注目領域指定部210は、注目領域を指定する。詳細については、図1での説明と同様であるため、省略する。
画像変換部230は、注目領域をもとに、撮像部100が出力した動画像データを、高解像度の動画像データと、低解像度の動画像データとに変換する。また、画像変換部230は、低解像度の動画像データを作成する際に、動画像データを、注目領域が単一色の画像に変更された動画像データに変換する。
符号化部220は、動画像データを符号化して符号化データを出力する。具体的には、符号化部220は、動画像データを低解像度の動画像として符号化する場合に、変換された動画像データを符号化する。つまり、符号化部220は、動画像データを低解像度の動画像として符号化する場合に、動画像データのうち、注目領域を単一色の画像として符号化する。
図8は、低解像度の動画像データにおける注目領域を単一色に変換した場合の例を示す図である。
まず、撮像部100により、横3840画素×縦2160画素の時間的に連続する画像が撮像されて、動画像データとして出力される。そして、注目領域指定部210によって、注目領域が、左上の画素の座標(1440,640)、注目領域の大きさ横1920画素×縦1080画素として指定される。
この場合、同図に示すように、画像変換部230によって、低解像度の動画像データは、縦・横それぞれ1/2に縮小されて、横1920画素×縦1080画素の画像となる。そして、注目領域は、左上の画素の座標(720,320)、大きさ横960画素×縦540画素として指定される。
画像変換部230は、この指定された領域を、元の画像がどんな画像であっても、単一色の画像に変換する。具体的には、輝度値Y=一定、色差値Cb=一定、Cr=一定とする。
そして、符号化部220は、動画像データを低解像度の動画像として符号化する場合に、動画像データのうち、注目領域を単一色の画像として符号化する。
また、符号化部220は、動画像データを低解像度の動画像として符号化する場合に、動画像データのうち、注目領域の一部を単一色の画像として符号化してもよい。
図9は、低解像度の動画像データにおける注目領域からマクロブロック(16画素×16画素)一つ分小さい領域を、単一色に変換した場合の例を示す図である。
同図に示すように、低解像度の動画像データが、横1920画素×縦1080画素の画像であり、注目領域が、左上の画素の座標(720,320)、大きさ横960画素×縦540画素である。この場合、画像変換部230は、当該注目領域の上下左右端のそれぞれからマクロブロック(16画素×16画素)一つ分小さい領域を、単一色に変換してもよい。
つまり、符号化部220は、注目領域の上下左右端のそれぞれからマクロブロック1つ分小さくした領域を、単一色の画像として符号化する。
また、上記で示された単一色に変換する領域の2つの方式について、画像が、画面間参照を使用するピクチャであった場合、それぞれ、単一色に変換せずに、スキップマクロブロックとして、符号化部220が符号化するとしてもよい。なお、スキップマクロブロックとは、全画面の画像がコピーされたマクロブロックである。
つまり、符号化部220は、動画像データを低解像度の動画像として符号化する場合には、動画像データが画面間参照を使用するピクチャであった場合、注目領域の全部もしくは一部を、スキップマクロブロックとして符号化する。具体的には、符号化部220は、注目領域の全部を符号化してもよく、また、注目領域の上下左右端のそれぞれからマクロブロック1つ分小さくした領域を符号化してもよい。
これによれば、低解像度の動画像において、注目領域を単一色の画像として符号化したり、注目領域をスキップマクロブロックとして符号化することで、その符号化データのサイズを小さくすることが可能となる。また、低解像度の動画像において、注目領域の上下左右端のそれぞれから、マクロブロック1つ分小さくした領域を符号化することで、注目領域の境界付近での画質劣化を防ぐことが可能となる。
(実施の形態3)
上記実施の形態1及び2では、注目領域の位置情報を符号化データのユーザー領域に保存することにした。しかし、本実施の形態3では、低解像度の動画像データの注目領域を、ある特定の条件の符号化形式で符号化する。
ここで、本実施の形態における撮像装置10は、図1と同様の機能構成を有している。そして、同図に示される符号化部220は、動画像データを低解像度の動画像として符号化する際に、注目領域の位置を特定するための情報として、注目領域をある特定の符号化条件で符号化したデータを含む符号化データを生成する。
具体的には、AVC/H.264で符号化する場合、画像の状態に関わらず、Coded Block Pattern=0として符号化したり、mb_type=Intra4x4かつprev_intra4x4_pred_mode_flagを全て1として符号化したり、mb_type=I_16x16_0_0_0として符号化したりする。つまり、符号化部220がある特定の符号化条件で符号化するように、図3に示された符号化データのうち、いずれかの領域に注目領域の位置を特定するための情報が含まれる。例えば、mb_type=I_16x16_0_0_0は、Iスライスに対するマクロブロックのタイプであり、図3に示される符号化画像データに保存される。
これにより、低解像度の動画像データを符号化して得られる符号化データを、復号化したときに、注目領域の位置情報を見なくても、注目領域を判別することが可能となる。
次に、本実施の形態3における撮像装置10の動作の一例について説明する。ここで、本実施の形態3における撮像装置10は、符号化処理(S108)以外は図6に示された処理と同様の処理を行う。このため、以下では、符号化処理についての説明を詳細に行う。
図10は、実施の形態3における、高解像度の動画像データ及び、低解像度の動画像データを符号化する際の動作の一例を示すフローチャートである。以下では、注目領域を、mb_type=I_16x16_0_0_0として符号化する。また、符号化は、マクロブロック単位で行われる。
まず、動画像データ内の全てのマクロブロックについての処理が、マクロブロックごとに開始される(ループ1:S202〜S212)。
符号化部220は、符号化対象のマクロブロックが高解像度の動画像データか、低解像度の動画像データかを判定する(S204)。符号化部220は、高解像度の動画像データであると判定した場合(S204でYES)、そのマクロブロックを通常符号化する(S208)する。
符号化部220は、符号化対象のマクロブロックが低解像度の動画像データであると判定した場合(S204でNO)、そのマクロブロックが注目領域のマクロブロックかどうかの判定を行う(S206)。
符号化部220は、符号化対象のマクロブロックが、注目領域のマクロブロックでないと判定した場合(S206でNO)、当該マクロブロックを通常符号化する(S208)。このとき、符号化部220は、当該マクロブロックをmb_type=I_16x16_0_0_0で符号化することを禁止したほうがよい。
符号化部220は、符号化対象のマクロブロックが、注目領域のマクロブロックであると判定した場合は(S206でYES)、当該マクロブロックをmb_type=I_16x16_0_0_0として符号化する(S210)。このとき、このマクロブロックにおいては、符号化前の画像を再現することを考えなくてもよい。ただ、このマクロブロックの下及び右のマクロブロックや、前後のピクチャを復号化する際に、このマクロブロックが参照されるので、再構成画像はmb_type=I_16x16_0_0_0として正しく作成する。つまり、このマクロブロックの再構成画像は、隣接画素の平均の輝度と色差の単一色となる。
そして、符号化部220は、動画像データ内の全てのマクロブロックについての処理が終了するまで、上記の処理(S204〜S210)を繰り返す(ループ1:S202〜S212)。このようにして、動画像データの符号化処理が終了する。
以上により、低解像度の動画像において、注目領域をある特定の符号化条件で符号化することで、注目領域の位置情報を保存しなくても、注目領域が判別可能となり、注目領域保存にかかる処理を削減することが可能となる。したがって、当該注目領域の位置を特定するための情報を転送する必要がないため、転送データ量の増加を防ぐことができる。
なお、符号化部220は、注目領域の上下左右端のそれぞれからマクロブロック1つ分小さくした領域を、ある特定の符号化条件で符号化することにしてもよい。これにより、注目領域の境界付近での画質劣化を防ぐことが可能となる。
また、ある特定の符号化条件で符号化するとは、実施の形態2で示した注目領域の全部もしくは一部を、単一色の画像として符号化したり、スキップマクロブロックとして符号化したりすることも含まれる。
次に、上記実施の形態における動画像符号化装置によって符号化された符号化データを復号化する動画像復号化装置について、説明する。
図11は、上記のような符号化データを復号化した際に、注目領域を判定して画像を合成する動画像復号化装置20の機能構成を示すブロック図である。
同図に示す動画像復号化装置20は、復号化部300、注目領域抽出部400及び画像合成部500を備えている。
復号化部300には、動画像データ中の予め定められた領域である注目領域の動画像データにおける位置を特定するための情報を含む符号化データが入力される。そして、復号化部300は、符号化データを第一の解像度の動画像データと第二の解像度の動画像データとに復号化する。
注目領域抽出部400は、符号化データに含まれる注目領域の位置を特定するための情報を抽出する。注目領域抽出部400は、注目領域判定部410及び画像バッファ420を備えている。
注目領域判定部410は、復号化した動画像データのマクロブロックが、注目領域のマクロブロックかどうかを判定する。画像バッファ420は、復号化した画像を一時蓄積する。
画像合成部500は、注目領域抽出部400が抽出した注目領域の位置を特定するための情報に基づき、低解像度の動画像データ中の注目領域に高解像度の動画像データが位置するように、高解像度の動画像データと低解像度の動画像データとを合成する。そして、画像合成部500は、合成した画像を生成し、出力する。
図12は、図11で示される動画像復号化装置20において、符号化データを復号化して画像バッファに画像を格納するまでの動作の一例を示すフローチャートである。
動画像復号化装置20に符号化データが入力され、ピクチャの復号化が開始されると、復号化部300は、当該ピクチャが高解像度の動画像データか否かを判定する(S302)。
復号化部300は、当該ピクチャが高解像度の動画像データであると判定した場合(S302でYES)、そのピクチャについては通常の復号化を行う(S304)。そして、復号化部300は、復号化した画像を、画像バッファに転送する(S306)。
そして、復号化部300は、復号化するピクチャが低解像度の動画像データであると判定した場合は(S302でNO)、当該ピクチャを通常復号化する他に、注目領域の判定が行われる。具体的には、当該ピクチャ内の全てのマクロブロックについて、以下の処理がマクロブロックごとに開始される(ループ2:S308〜S318)。
まず、復号化部300は、マクロブロックを復号化する(S310)。
次に、注目領域判定部410は、復号化されたマクロブロックの符号化データに、注目領域の位置を特定するための情報が含まれているか否かを判定する(S312)。そして、注目領域判定部410は、注目領域の位置を特定するための情報が含まれていると判定した場合(S312でYES)、当該マクロブロックを注目領域のマクロブロックと判定する(S314)。
例えば、注目領域が、mb_type=I_16x16_0_0_0として符号化されている場合、注目領域判定部410は、復号化されたマクロブロックのmb_typeが、I_16x16_0_0_0である場合に(S312でYES)、そのマクロブロックを注目領域のマクロブロックと判定する(S314)。
なお、注目領域のマクロブロックではないのに、当該マクロブロックの符号化データに注目領域の位置を特定するための情報が含まれていることがある。このため、注目領域判定部410は、連続するマクロブロックが注目領域のマクロブロックと判定された場合にのみ、当該マクロブロックを注目領域のマクロブロックと判定することにしてもよい。
そして、注目領域判定部410は、復号化されたマクロブロックの画像を、画像バッファに転送する(S316)。
そして、注目領域判定部410は、ピクチャ内の全てのマクロブロックについての処理が終了するまで、上記の処理(S310〜S316)を繰り返す(ループ2:S308〜S318)。
そして、注目領域判定部410は、抽出した注目領域の位置を特定するための情報を画像バッファ420に転送(S209)する。このようにして、ピクチャの復号化は終了する。
また、画像バッファ420に転送された、高解像度の動画像データと、低解像度の動画像データと、注目領域の位置を特定するための情報は、画像合成部500によって読み出される。そして、画像合成部500は、低解像度の動画像データの、注目領域の位置を特定するための情報で指定される位置に、高解像度の動画像データを貼り付けて、出力画像として出力する。
このとき、画像合成部500は、出力画像の解像度を、低解像度の動画像データに合わせるときは、高解像度の動画像データの解像度を落として貼り付けを行う。また、画像合成部500は、出力画像の解像度を、高解像度の動画像データに合わせるときは、低解像度の動画像データの解像度をアップコンバートや超解像技術で大きくしてから、高解像度の動画像データの貼り付けを行う。
以上、本発明に係る動画像符号化装置、撮像装置及び動画像復号化装置について、上記実施の形態を用いて説明したが、本発明は、これに限定されるものではない。
つまり、今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。
例えば、図1、図7及び図11に示されたブロック図の各機能ブロックは集積回路であるLSIとして実現されてもよい。これらは個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されても良い。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
注目領域を指定した画像を、2つの画像に分割して、指定領域を高解像度で符号化し、指定領域を含む全体の画像を低解像度で符号化する装置において、転送データ量の増加を防ぎつつ、その符号量を削減したり、画質を向上したりすることが可能である。
本発明は、特に、H.264/AVCで符号化されたデータを扱う場合に有効に作用する。
本発明の実施の形態1における撮像装置10の機能構成を示すブロック図である。 高解像度の動画像データと低解像度の動画像データの具体的な例を示す図である。 本発明で示される動画像符号化装置が出力する符号化データのストリームの構造の一例を示す図である。 NAL unit typeの一覧を示す図である。 低解像度の動画像データを符号化する際に、注目領域以外を符号化する場合の例を示した図である。 撮像装置の動作の一例を示すフローチャートである。 本発明の実施の形態2における撮像装置の機能構成を示すブロック図である。 低解像度の動画像データにおける注目領域を単一色に変換した場合の例を示す図である。 低解像度の動画像データにおける注目領域からマクロブロック一つ分小さい領域を、単一色に変換した場合の例を示す図である。 本発明の実施の形態3における、高解像度の動画像データ及び、低解像度の動画像データを符号化する際の動作の一例を示すフローチャートである。 符号化データを復号化する動画像復号化装置の機能構成を示すブロック図である。 動画像復号化装置が符号化データを復号化する際の動作の一例を示すフローチャートである。
10 撮像装置
20 動画像復号化装置
100 撮像部
200 動画像符号化装置
210 注目領域指定部
220 符号化部
230 画像変換部
300 復号化部
400 注目領域抽出部
410 注目領域判定部
420 画像バッファ
500 画像合成部

Claims (15)

  1. 入力される動画像データの符号化を行い、符号化データを出力する符号化部と、
    前記動画像データ中の予め定められた領域である注目領域を指定する注目領域指定部とを備え、
    前記符号化部は、前記注目領域を第一の解像度の動画像として符号化して前記動画像データを第二の解像度の動画像として符号化する際に、前記動画像データにおける前記注目領域の位置を特定するための情報を含む符号化データを生成する
    動画像符号化装置。
  2. 前記符号化部は、前記注目領域の位置を特定するための情報として、前記注目領域の位置情報を、前記第一の解像度の動画像を符号化した際に出力する符号化データのユーザー領域、もしくは、前記第二の解像度の動画像を符号化した際に出力する符号化データのユーザー領域に保存して前記符号化データを生成する
    請求項1に記載の動画像符号化装置。
  3. 前記符号化部は、前記動画像データを前記第二の解像度の動画像として符号化する場合には、前記動画像データのうち、前記注目領域以外の領域を、前記第二の解像度の動画像として符号化する
    請求項1又は2に記載の動画像符号化装置。
  4. 前記符号化部は、前記動画像データを前記第二の解像度の動画像として符号化する場合には、前記動画像データのうち、前記注目領域の全部もしくは一部を、単一色の画像として符号化する
    請求項1又は2に記載の動画像符号化装置。
  5. 前記符号化部は、前記動画像データを前記第二の解像度の動画像として符号化する場合には、前記動画像データが画面間参照を使用するピクチャであった場合、前記注目領域の全部もしくは一部を、スキップマクロブロックとして符号化する
    請求項1又は2に記載の動画像符号化装置。
  6. 前記符号化部は、前記注目領域の上下左右端のそれぞれからマクロブロック1つ分小さくした領域を、単一色の画像として符号化する
    請求項4に記載の動画像符号化装置。
  7. 前記符号化部は、前記注目領域の上下左右端のそれぞれからマクロブロック1つ分小さくした領域を、スキップマクロブロックとして符号化する
    請求項5に記載の動画像符号化装置。
  8. 前記符号化部は、前記動画像データを前記第二の解像度の動画像として符号化する際に、前記注目領域の位置を特定するための情報として、前記注目領域の全部もしくは一部を、ある特定の符号化条件で符号化したデータを含む符号化データを生成する
    請求項1に記載の動画像符号化装置。
  9. 前記符号化部は、前記注目領域の上下左右端のそれぞれからマクロブロック1つ分小さくした領域を、ある特定の符号化条件で符号化する
    請求項8に記載の動画像符号化装置。
  10. 被写体像を撮像し、動画像データを出力する撮像部と、
    前記撮像部から入力される前記動画像データの符号化を行い、符号化データを出力する符号化部と、
    前記動画像データ中の予め定められた領域である注目領域を指定する注目領域指定部とを備え、
    前記符号化部は、前記注目領域を第一の解像度の動画像として符号化して前記動画像データを第二の解像度の動画像として符号化する際に、前記動画像データにおける前記注目領域の位置を特定するための情報を含む符号化データを生成する
    撮像装置。
  11. 動画像データ中の予め定められた領域である注目領域の前記動画像データにおける位置を特定するための情報を含む符号化データが入力され、前記符号化データを第一の解像度の動画像データと第二の解像度の動画像データとに復号化する復号化部と、
    前記符号化データに含まれる前記注目領域の位置を特定するための情報を抽出する注目領域抽出部と、
    抽出された前記注目領域の位置を特定するための情報に基づき、前記第二の解像度の動画像データ中の前記注目領域に前記第一の解像度の動画像データが位置するように、前記第一の解像度の動画像データと前記第二の解像度の動画像データとを合成する画像合成部と
    を備える動画像復号化装置。
  12. 入力される動画像データの符号化を行い、符号化データを出力する符号化ステップと、
    前記動画像データ中の予め定められた領域である注目領域を指定する注目領域指定ステップとを含み、
    前記符号化ステップでは、前記注目領域を第一の解像度の動画像として符号化して前記動画像データを第二の解像度の動画像として符号化する際に、前記動画像データにおける前記注目領域の位置を特定するための情報を含む符号化データを生成する
    動画像符号化方法。
  13. 動画像データ中の予め定められた領域である注目領域の前記動画像データにおける位置を特定するための情報を含む符号化データが入力され、前記符号化データを第一の解像度の動画像データと第二の解像度の動画像データとに復号化する復号化ステップと、
    前記符号化データに含まれる前記注目領域の位置を特定するための情報を抽出する注目領域抽出ステップと、
    抽出された前記注目領域の位置を特定するための情報に基づき、前記第二の解像度の動画像データ中の前記注目領域に前記第一の解像度の動画像データが位置するように、前記第一の解像度の動画像データと前記第二の解像度の動画像データとを合成する画像合成ステップと
    を含む動画像復号化方法。
  14. 入力される動画像データの符号化を行い、符号化データを出力する符号化部と、
    前記動画像データ中の予め定められた領域である注目領域を指定する注目領域指定部とを備え、
    前記符号化部は、前記注目領域を第一の解像度の動画像として符号化して前記動画像データを第二の解像度の動画像として符号化する際に、前記動画像データにおける前記注目領域の位置を特定するための情報を含む符号化データを生成する
    集積回路。
  15. 動画像データ中の予め定められた領域である注目領域の前記動画像データにおける位置を特定するための情報を含む符号化データが入力され、前記符号化データを第一の解像度の動画像データと第二の解像度の動画像データとに復号化する復号化部と、
    前記符号化データに含まれる前記注目領域の位置を特定するための情報を抽出する注目領域抽出部と、
    抽出された前記注目領域の位置を特定するための情報に基づき、前記第二の解像度の動画像データ中の前記注目領域に前記第一の解像度の動画像データが位置するように、前記第一の解像度の動画像データと前記第二の解像度の動画像データとを合成する画像合成部と
    を備える集積回路。
JP2009054220A 2009-03-06 2009-03-06 動画像符号化装置及び動画像復号化装置 Pending JP2010212811A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009054220A JP2010212811A (ja) 2009-03-06 2009-03-06 動画像符号化装置及び動画像復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009054220A JP2010212811A (ja) 2009-03-06 2009-03-06 動画像符号化装置及び動画像復号化装置

Publications (1)

Publication Number Publication Date
JP2010212811A true JP2010212811A (ja) 2010-09-24

Family

ID=42972574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009054220A Pending JP2010212811A (ja) 2009-03-06 2009-03-06 動画像符号化装置及び動画像復号化装置

Country Status (1)

Country Link
JP (1) JP2010212811A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013014884A1 (ja) * 2011-07-22 2013-01-31 パナソニック株式会社 動画像符号化方法、動画像符号化装置、動画像復号化方法、および動画像復号化装置
JP2013232724A (ja) * 2012-04-27 2013-11-14 Fujitsu Ltd 動画像処理装置、動画像処理方法および動画像処理プログラム
JP2014116922A (ja) * 2012-11-19 2014-06-26 Nippon Telegr & Teleph Corp <Ntt> 映像再生装置及び映像配信装置
JP2014519773A (ja) * 2011-06-07 2014-08-14 クゥアルコム・インコーポレイテッド 複数結合ダイバーシティを用いたマルチ・ディスクリプション・コーディング
JP2014176017A (ja) * 2013-03-12 2014-09-22 Nippon Telegr & Teleph Corp <Ntt> 映像再生装置、映像配信装置、映像再生方法及び映像配信方法
JP2016519517A (ja) * 2013-04-08 2016-06-30 ソニー株式会社 Shvcでの注目領域スケーラビリティ
JPWO2015132881A1 (ja) * 2014-03-04 2017-03-30 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法及びプログラム
US9762916B2 (en) 2013-08-30 2017-09-12 Canon Kabushiki Kaisha Encoding apparatus and method
JP2019519981A (ja) * 2016-05-19 2019-07-11 クアルコム,インコーポレイテッド 画像中の最上位関心領域
JP2020080479A (ja) * 2018-11-13 2020-05-28 Necプラットフォームズ株式会社 動画記録再生装置、動画伝送システムおよび方法
JP2020110005A (ja) * 2016-05-26 2020-07-16 ヴィド スケール インコーポレイテッド ビューポート適応360度映像配信の方法および装置

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014519773A (ja) * 2011-06-07 2014-08-14 クゥアルコム・インコーポレイテッド 複数結合ダイバーシティを用いたマルチ・ディスクリプション・コーディング
JP2017055421A (ja) * 2011-06-07 2017-03-16 クゥアルコム・インコーポレイテッドQualcomm Incorporated 複数結合ダイバーシティを用いたマルチ・ディスクリプション・コーディング
WO2013014884A1 (ja) * 2011-07-22 2013-01-31 パナソニック株式会社 動画像符号化方法、動画像符号化装置、動画像復号化方法、および動画像復号化装置
JP2013232724A (ja) * 2012-04-27 2013-11-14 Fujitsu Ltd 動画像処理装置、動画像処理方法および動画像処理プログラム
JP2014116922A (ja) * 2012-11-19 2014-06-26 Nippon Telegr & Teleph Corp <Ntt> 映像再生装置及び映像配信装置
JP2014176017A (ja) * 2013-03-12 2014-09-22 Nippon Telegr & Teleph Corp <Ntt> 映像再生装置、映像配信装置、映像再生方法及び映像配信方法
KR101972284B1 (ko) 2013-04-08 2019-04-24 소니 주식회사 Shvc를 이용한 관심 영역 확장성
JP2016519517A (ja) * 2013-04-08 2016-06-30 ソニー株式会社 Shvcでの注目領域スケーラビリティ
US10390024B2 (en) 2013-04-08 2019-08-20 Sony Corporation Region of interest scalability with SHVC
KR101852669B1 (ko) * 2013-04-08 2018-04-26 소니 주식회사 Shvc를 이용한 관심 영역 확장성
KR20180045050A (ko) * 2013-04-08 2018-05-03 소니 주식회사 Shvc를 이용한 관심 영역 확장성
US9762916B2 (en) 2013-08-30 2017-09-12 Canon Kabushiki Kaisha Encoding apparatus and method
JPWO2015132881A1 (ja) * 2014-03-04 2017-03-30 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法及びプログラム
JP2019519981A (ja) * 2016-05-19 2019-07-11 クアルコム,インコーポレイテッド 画像中の最上位関心領域
JP2020110005A (ja) * 2016-05-26 2020-07-16 ヴィド スケール インコーポレイテッド ビューポート適応360度映像配信の方法および装置
JP7288875B2 (ja) 2016-05-26 2023-06-08 ヴィド スケール インコーポレイテッド ビューポート適応360度映像配信の方法および装置
JP2020080479A (ja) * 2018-11-13 2020-05-28 Necプラットフォームズ株式会社 動画記録再生装置、動画伝送システムおよび方法

Similar Documents

Publication Publication Date Title
JP2010212811A (ja) 動画像符号化装置及び動画像復号化装置
US11812042B2 (en) Image decoding device and method for setting information for controlling decoding of coded data
EP2579597A1 (en) Method of and device for encoding an HDR image, method of and device for reconstructing an HDR image and non-transitory storage medium
US20100232504A1 (en) Supporting region-of-interest cropping through constrained compression
JP6555541B2 (ja) 画像符号化装置および方法
TWI684351B (zh) 解碼裝置、解碼方法、編碼裝置,以及編碼方法
KR100630983B1 (ko) 화상 처리 방법과, 이 방법을 이용가능한 화상 부호화장치 및 화상 복호 장치
US20170214914A1 (en) Image coding device and method, and image decoding device and method
US20200288123A1 (en) Image processing apparatus and image processing method
JP7345051B2 (ja) サブピクチャ、スライス、およびタイルをサポートするビデオ符号化
JP2011527841A (ja) 画像処理装置およびそれを用いた撮像装置
US10820010B2 (en) Methods and devices for encoding a video stream using a first and a second encoder
JP4411220B2 (ja) 映像信号処理装置、及びその映像信号処理方法
JP2009253470A (ja) 画像符号化装置及びその制御方法
US20180302629A1 (en) Image processing apparatus and method
GB2449631A (en) Transcoding of Very High Definition(XHD) images for processing as HD images.
WO2011010431A1 (ja) 画像処理装置、画像処理方法および撮像装置
JP7416820B2 (ja) ビデオコーディングにおけるヌルタイルコーディング
JP2005217493A (ja) 撮像装置
JP2005051810A (ja) デジタルカメラ
JP2006295492A (ja) 画像処理装置
JP3877742B2 (ja) デジタルカメラ
JP2001218206A (ja) 画像符号化装置及び方法、媒体
WO2020175905A1 (ko) 시그널링된 정보에 기반한 픽처 파티셔닝 방법 및 장치
JP2001346158A (ja) メモリ制御装置、デジタルカメラおよび画像処理装置