JP2019083368A - 符号化装置及び復号装置及びそれらの制御方法及びプログラム - Google Patents

符号化装置及び復号装置及びそれらの制御方法及びプログラム Download PDF

Info

Publication number
JP2019083368A
JP2019083368A JP2017208511A JP2017208511A JP2019083368A JP 2019083368 A JP2019083368 A JP 2019083368A JP 2017208511 A JP2017208511 A JP 2017208511A JP 2017208511 A JP2017208511 A JP 2017208511A JP 2019083368 A JP2019083368 A JP 2019083368A
Authority
JP
Japan
Prior art keywords
image
sub
encoding
frame
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017208511A
Other languages
English (en)
Other versions
JP2019083368A5 (ja
JP7148236B2 (ja
Inventor
章弘 田邉
Akihiro Tanabe
章弘 田邉
考博 阿部
Naruhiro Abe
考博 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017208511A priority Critical patent/JP7148236B2/ja
Publication of JP2019083368A publication Critical patent/JP2019083368A/ja
Publication of JP2019083368A5 publication Critical patent/JP2019083368A5/ja
Application granted granted Critical
Publication of JP7148236B2 publication Critical patent/JP7148236B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 高解像度の画像の符号化を行いながらも、主被写体を含む部分領域を復号可能な符号化データを生成する。【解決手段】 符号化しようとする着目フレームから、主被写体を含み、予め設定されたサイズの副画像の領域の位置を決定する決定部と、該決定部で決定した副画像の領域の境界に基づき着目フレームを複数の領域に分割する分割部と、分割部で分割して得た各領域の画像を符号化する符号化部と、符号化部で得た符号化データと、着目フレームにおける副画像の領域の位置、並びに、副画像の符号化データの格納アドレスを示す付加情報とから着目フレームの符号化データを生成する生成部とを有する。【選択図】 図6

Description

本発明は、映像の符号化/復号技術に関するものである。
動画像はその情報量が非常に大きい。それ故、動画像を撮像する装置(ビデオカメラやカメラ内蔵の携帯型通信装置等)では、撮像した動画像を圧縮符号化してから記憶媒体に記録する。
近年、1920×1080画素をはじめ、それを超える8192×4320画素等の多種のサイズ(解像度)の再生可能な装置が登場してきている。このような再生環境の多様化にともない、たとえば特許文献1のような、複数の画像サイズの動画像の符号化を実現する方法が提案されてきている。特許文献1では、動画像に対して、注目領域を切り出した小サイズ画像の動画像と、切出していない動画像の2つの動画像を符号化する技術を開示している。特許文献1では、動画像の注目領域に対応する画素値を単一色に置き換えることで符号量を抑えつつ、2つの異なる画像サイズの動画像データを符号化している。
特開2010−212811号公報
しかしながら、特許文献1で符号化された動画データは元画像を縮小したものであるので、画質の劣化が発生する。更に、注目領域の動画像を再生する場合に2つの符号化データを復号化し、1つの再生画像として合成する処理が必要となる。
本発明はかかる問題に鑑みなされたものであり、高い解像度の画像の符号化を行いながらも、主被写体を含む部分領域を復号可能な符号化データを生成する技術を提供しようとするものである。
この課題を解決するため、例えば本発明の符号化装置は以下の構成を備える。すなわち、
動画像を符号化する符号化装置であって、
符号化しようとする着目フレームから、主被写体を含み、予め設定されたサイズの副画像の領域の位置を決定する決定手段と、
該決定手段で決定した前記副画像の領域の境界に基づき前記着目フレームを複数の領域に分割する分割手段と、
該分割手段で分割して得た各領域の画像を符号化する符号化手段と、
前記符号化手段で得た符号化データと、前記着目フレームにおける前記副画像の領域の位置、並びに、前記副画像の符号化データの格納アドレスを示す付加情報とから前記着目フレームの符号化データを生成する生成手段とを有する。
本発明によれば、高解像度の画像の符号化を行いながらも、主被写体を含む部分領域を復号可能な符号化データを生成することができる。
また、本発明によれば、高解像度の符号化データから、主被写体を含む部分領域のみを復号し再生することが可能になる。
実施形態におけるシステムの一例を示す図。 実施形態における符号化装置及び復号化装置のブロック構成図。 実施形態における符号化処理部のブロック構成図。 実施形態における符号化処理におけるタイル分割の例を示す図。 実施形態における符号化装置の処理を示すフローチャート。 実施形態における符号化装置のタイル構成の決定処理と符号化処理を示すフローチャート。 実施形態における復号装置の処理を示すフローチャート。 フレーム間でタイル位置が変わる場合の不具合を説明するための図。 第2の実施形態における復号した画像の画面内をトリミングする例を示す図。 第2の実施形態における符号化装置の処理を示すフローチャート。 第2の実施形態における復号装置の処理を示すフローチャート。 第2の実施形態における復号画像のトリミング位置決定の処理の一例を示すフローチャート。
以下、添付図面に従って本発明に係る実施形態を詳細に説明する。
<システム構成図>
図1に示すように、本実施形態のシステムは、符号化装置100、復号装置200、及び、表示装置300を有する。
符号化装置100は、ユーザによる操作部104のシャッタースイッチによる撮影指示により撮像を行い、画像データを得る。符号化装置100は、撮像して得た画像データを符号化することで、画像データのデータ量を圧縮することが可能である。符号化装置100は符号化して得た符号化画像データを着脱式の不揮発性記録媒体に記録するか、或いは、無線通信を使用して復号装置200等の装置に転送する。復号装置200は、着脱式の不揮発性記録媒体、または無線通信を使用して符号化画像データを受信する。そして、復号装置200は、操作部204または、不図示のリモコンより操作させることで、符号化画像データを復号してた画像データを表示装置300に出力することで再生を行う。表示装置300は復号装置200からの画像データ(画像信号)を受信し、表示部にその画像を表示する。
符号化装置100は、デジタルスチルカメラ、スマートフォン、カメラ付き携帯電話、デジタルビデオカメラ等の撮像装置である。復号装置200は、画像データや音声データの再生を行うプレイヤ等の再生装置であってもよく、デジタルスチルカメラ、スマートフォン、カメラ付き携帯電話、デジタルビデオカメラ等の撮像装置であっても構わない。表示装置300は、液晶や有機EL等のディスプレイ装置である。なお、符号化装置100は、復号化装置200と同様の復号化処理を行ってもよい。また、復号化装置200は表示装置300を含んでもよい。
<全体ブロック図>
図2は、符号化装置100と、復号装置200のブロック構成を示す図である。
符号化装置100は、CPU101、メモリ102、不揮発性メモリ103、操作部104、撮像レンズ111、撮像部112、画像処理部113、符号化処理部114を有する。また、符号化装置100は、表示制御部115、表示部116、通信制御部117、通信部118、記録媒体制御部119、記録媒体120、及び、内部バス130を有する。
CPU101は、不揮発性メモリ103に記憶されているコンピュータプログラムを実行することによって、符号化装置100の各部の動作を制御する。CPU101は、ユーザによって操作される操作部104から入力されるシャッターボタン、メニューボタン等の信号により、主被写体となる人物等を予め撮影しておき、不揮発性メモリ103に主被写体情報として記録する。また、CPU101は、ユーザにより操作部104から入力されるメニューボタン等の信号により、特定の主被写体を含む画像サイズ小の画面領域のサイズを判断する。CPU101は、ユーザにより指定された画面領域のサイズ情報をメモリ102に保存する。
メモリ102は、書き換え可能な揮発性メモリであり、一時的に符号化装置100の各部の動作を制御するコンピュータプログラム、各部の動作に関するパラメータ等の情報、通信制御部117によって受信した情報等を記録する。メモリ102は、撮像部112、画像処理部113、符号化処理部114等で処理した画像や情報を一時的に記録するための十分な記憶容量を備えている。
不揮発性メモリ103は、電気的に消去・記録可能なメモリであり、例えばEEPROM等が用いられる。不揮発性メモリ103は、符号化装置100の各部の動作を制御するコンピュータプログラム及び各部の動作に関するパラメータ等の情報を記憶する。ここでいう、コンピュータプログラムとは、本実施形態にて後述する各種フローチャートを実行するためのプログラムのことである。
操作部104は、符号化装置100を操作するためのユーザインターフェースを提供する。操作部104は、符号化装置100の電源ボタン及びメニューボタン、シャッターボタン等を有し、各ボタンはスイッチ、タッチパネル等により構成される。CPU101は、操作部104を介して入力されたユーザの指示に従って符号化装置100を制御する。なお、操作部104は、不図示のリモートコントローラから受信したリモコン信号や、不図示の携帯端末から通信制御部117を介して通知された要求に応じて符号化装置100を制御してもよい。
撮像レンズ111は、ズームレンズ、フォーカスレンズを含むレンズ群、レンズ制御部、絞りなどにより構成される。撮像レンズ111は図示しないレンズ制御部を有し、CPU101から送信される制御信号により、焦点の調整や絞り値(F値)を制御する。
撮像部112は、被写体の光学像を電気信号に変換する撮像素子を備える。撮像素子は、例えばCCD(電荷結合素子)やCMOS(相補型金属酸化膜半導体)素子等で構成されるエリアイメージセンサである。撮像部112は撮像して得たアナログ画像信号をデジタル画像信号(画像データ)に変換し、画像処理部113またはメモリ102に出力する。
画像処理部113は、撮像部112からの画像データ、又は、メモリ102から読み出された画像データに対し所定の画素補間、縮小といったリサイズ処理や色変換処理等を行う。また、画像処理部113では、撮像した画像データを用いて所定の演算処理が行われ、得られた演算結果に基づいてCPU101が露光制御、測距制御を行う。これにより、AE(自動露出)処理、AWB(オートホワイトバランス)処理、AF(オートフォーカス)処理が行われる。また、画像処理部113では予め不揮発性メモリ103に記録された顔や人物の特徴量と、撮像部112から受信した画像データから算出した特徴量の比較を行う。画像処理部113は、比較した特徴量と画素の座標から、画像データ内における主被写体の座標位置と範囲を特定する。
ここで主被写体検出機能について説明する。CPU101は顔検出対象の画像データを画像処理部113に送る。CPU101の制御下で画像処理部113は、当該画像データに水平方向バンドパスフィルタを作用させる。また、CPU101の制御下で画像処理部113は処理された画像データに垂直方向バンドパスフィルタを作用させる。これら水平及び垂直方向のバンドパスフィルタにより、画像データよりエッジ成分が検出される。その後、CPU101は、検出されたエッジ成分に関してパターンマッチングを行い、候補群を抽出する。そして、CPU101は、抽出された候補群の中から、予め設定された条件を満たすものを絞り込む。そして、CPU101は、絞り込まれた候補群とそれに対応する人物を形成する対応付け、また、予め設定した非人物条件フィルタを通すことで、人物を検出する。CPU101は、人物の検出結果に応じて上記人物情報を出力し、処理を終了する。このとき、人物などの特徴量をメモリ102に記憶する。
以上のようにライブビュー表示あるいは再生表示される画像データを画像解析して、画像データの特徴量を抽出して主被写体(人物)を検出することが可能である。
符号化処理部114は、入力された画像データを画面内予測及び画面間予測符号化することで画像データのデータ量を圧縮する。符号化処理部114は、例えばH.265(ITU H.265又はISO/IEC23008−2)方式で圧縮処理を行う。符号化処理部114の詳細な説明は図3を用いて後述する。
表示制御部115は、表示部116を制御する。表示制御部115は表示部116で表示可能な画像になるようにリサイズ処理や色変換処理等を行い、画像信号を表示部116に出力する。表示部116は、液晶ディスプレイや有機EL等で構成されており、表示制御部115から送られてきた画像信号を表示する。表示部116はタッチパネルでありユーザからの操作を受け付ける操作部も兼ねる。
通信制御部117は、CPU101に制御され、IEEE802.11等で予め定められた無線通信規格に適用した変調信号を生成して、通信部118へ出力する。また、通信制御部117は、通信部118より無線通信規格に適用した変調信号を受信して復号することでアナログ信号をデジタル信号変換してCPU101に通知する。また、通信制御部108は通信を設定するためのレジスタを持っており、CPU101から制御されることで通信時の送受信感度を調整し、所定の変調方式で送受信をおこなうことができる。通信部118は、通信制御部117から送られてくる変調信号を外部へ出力、もしくは外部からの変調信号を受信するアンテナ及び、アナログ回路等により構成される。
記録媒体制御部119は、記録媒体120を制御するための制御部であり、CPU101から要求を受けて、記録媒体120を制御するための制御信号を出力する。記録媒体120は、撮像され符号化された画像データを記録するための着脱式、または内蔵式の不揮発性メモリや磁気ディスク等から構成される。なお、CPU101が記録媒体120に記録する場合には、記録媒体のファイルシステムに適応した形式でファイルデータとして保存する。ここでいうファイルデータとは、MP4ファイル(ISO/IEC 14496-14:2003)やMXF(Material eXchange Format)ファイル等のコンテナを示す。
内部バス130は、CPU101とメモリ102に各処理部がアクセスするための内部バスである。以上、実施形態における符号化装置100を説明した。
復号装置200は、図2に示すように、CPU201、メモリ202、不揮発性メモリ203、操作部204、通信制御部211、通信部212、復号処理部213、記録媒体制御部214、記録媒体215、表示制御部216、及び内部バス220を有する。
CPU201は、不揮発性メモリ203に記憶されているコンピュータプログラムを実行することによって、復号装置200の各部の動作を制御する。
メモリ202は、書き換え可能な揮発性メモリであり、一時的に復号装置200の各部の動作を制御するコンピュータプログラム、各部の動作に関するパラメータ等の情報、通信部212によって受信した情報等を記録する。不揮発性メモリ203は、不揮発性メモリ203に記憶されているコンピュータプログラムを実行することによって、復号装置200の各部の動作を制御する。
操作部204は、復号装置200を操作するためのユーザインターフェースを提供する。操作部204は、復号装置200の電源ボタン及び再生、停止ボタン等を有し、各ボタンはスイッチ、タッチパネル等により構成される。CPU201は、操作部204を介して入力されたユーザの指示に従って復号装置200を制御する。なお、操作部204は、不図示のリモートコントローラから受信したリモコン信号や、不図示の携帯端末から通信制御部211を介して通知された要求に応じて復号装置200を制御してもよい。
通信制御部211は、CPU201に制御され、IEEE802.11等で予め定められた無線通信規格に適用した変調信号を生成して、通信部212へ出力する。また、通信制御部211は、通信部212より無線通信規格に適用した変調信号を受信して復号することでアナログ信号をデジタル信号変換してCPU201に通知する。また、通信制御部212は通信を設定するためのレジスタを持っており、CPU201から制御されることで通信時の送受信感度を調整し、所定の変調方式で送受信をおこなうことができる。通信部212は、通信制御部211から送られてくる変調信号を外部へ出力、もしくは外部からの変調信号を受信するアンテナ及び、アナログ回路等により構成される。
復号処理部213は、画面内予測及び画面間予測復号された符号化画像データ(符号化ストリーム)の復号処理を行う。例えばH.265方式で符号化された画像データの復号処理を行い、復号処理を行った画像データはメモリ202に一時的に保存される。
記録媒体制御部214は、記録媒体215を制御するための制御部であり、CPU201から要求を受けて、記録媒体215を制御するための制御信号を出力する。記録媒体215は、符号化された画像データを記録するための着脱式、または内蔵式の不揮発性メモリや磁気ディスク等から構成される。
表示制御部216は、表示装置300に画像信号を出力するための制御部である。表示制御部216は表示装置300で表示可能な画像になるようにリサイズ処理や色変換処理等を行い、画像信号を表示装置300に出力する。なお、表示装置300への出力は、例えばHDMI(High Definition Multimedeia Interface)(登録商標)等のケーブルを介して行われる。
内部バス220は、CPU201とメモリ202に各処理部及び制御部がアクセスするための内部バスである。
<符号化処理部114の詳細>
次に実施形態における符号化装置100における符号化処理部114の構成と処理の流れを図3を参照して説明する。符号化処理部114は、H.265方式に従って符号化を行うものとする。
画面分割部301は、符号化対象の入力画像の画面サイズよりも小さい、いくつかの画面サイズに画面を分割する。具体的には、ユーザに設定された表示画面のサイズや主被写体の位置情報を基に、主被写体が含まれるように、符号化対象の入力画像の画面サイズよりも小さい、いくつかのスライスまたは及びタイルの分割サイズを決定する。なお、主被写体の位置はCPU101、または画像処理部113から取得する。スライスまたは及びタイルの分割が画面の分割に相当する。なお、スライスの分割数は、num_tile_columns_minus1により水平方向が決まり、num_tile_rows_minus1により垂直方向が決定される。なお、本実施形態においてはタイルの分割方法は全てのビットスリームで一意である場合のtiles_fixed_structure_flagを0にセットする。
画面サイズは、水平、垂直方向の画素数で定義されるものとする。ただし、一方の辺の画素数とアスペクト比があれば画面サイズは特定できるので、この限りではない。
画面分割部301は、決定した座標位置で、符号化対象の画面をタイル状に分割した各領域(以下、この領域を単にタイルと呼ぶ)に番号(以下、タイル番号という)を付す。そして、タイル番号で示されるタイル番号と符号化対象の画面におけるタイルの位置とを対応づける。なお、各タイルのサイズはCTB(Cording Tree Block)の数を示す各種情報で決定される。
そして、画面分割部301は、符号化処理中に、タイル毎の予測符号化条件を予測符号化方法決定部302へ出力する。この予測符号化条件には、或るタイル内の着目画素ブロックを符号化する際、その着目画素ブロック(符号化対象ブロック)の予測画素ブロックを取得する範囲を規定する情報が含まれる(詳細後述)。
予測符号化方法決定部302は、画面分割部301から入力される画面分割情報及び予測符号化条件に基づき符号化対象画面内の各画素ブロックに対する予測方法を決定する。予測符号化方法決定部302は、入力される画像信号と、符号化済みの領域の復号画像を格納するメモリ102から読み出した符号化済み画素値から簡易的な画面内予測又は動き検出を含む画面間予測処理を行うことにより符号化効率を示す評価値を算出する。そして、その符号化効率が最適となる予測方式を決定する。
符号化対象画素ブロックがIスライスの場合は、画面内予測画素ブロックサイズ及び予測モードを決定する。Pスライス又はBスライスの場合には、画面内予測又は画面間予測の内、符号化効率の高い方を選択する。フレーム内の全てのスライスがIスライスのフレームをIフレーム、フレーム内の全てのスライスがPスライスのフレームをPフレーム、フレーム内の全てのスライスがBスライスのフレームをBフレームと呼ぶ。
ここで、画面間予測の場合には画面内予測画素ブロックサイズ及び画面内予測モード等の画面内予測符号化用パラメータを決定する。また、画面間予測の場合には、参照画像フレーム、画素ブロック分割パターン、動きベクトル等の画面間予測符号化用パラメータを決定する。
予測符号化方法決定部302は、決定した予測符号化用パラメータを予測符号化処理部303へ出力する。
予測符号化処理部303は、符号化対象のフレーム中の着目タイル内の着目画素ブロックを符号化する際、予測符号化方法決定部302により決定された予測符号化用パラメータに応じて、メモリ102から読出した符号化済み画像から予測画素ブロックを生成する。そして、予測符号化処理部303は、着目画素ブロックと予測画素ブロックの差分である予測残差ブロックを、直交変換・量子化部305へ出力する。また、予測画素ブロックを、局所復号部306にも出力する。
直交変換・量子化部305は、与えられた予測残差ブロックに対して直交変換処理を行う。また、直交変換・量子化部305は、後述する符号量制御部307から設定された量子化パラメータに応じた量子化ステップを用いて、直交変換して得られた係数を量子化する。その量子化後の係数(量子化データ)はエントロピー符号化部308、局所復号部306へ供給される。
局所復号部306は、入力した量子化データに対し逆量子化処理、逆直交変換処理を行うことで、予測残差データを生成する。そして、局所復号部306は、その予測残差データに、予測符号化処理部303から入力される予測画像を加算して復号処理を行い、得られた画素ブロックが示す画像データをメモリ102へ格納する。メモリ102へ格納された復号後の画像データは、以降の画面内予測処理に利用される。更にデブロッキングフィルタ処理が施された復号画像データをメモリ102へ保持する。メモリ102へ保持されたデブロッキングフィルタ処理後の復号データは、以降の画面間予測処理にも利用される。
エントロピー符号化部308では、入力された量子化データに対してスライス単位にCABAC(コンテキスト適応型2値算術符号化)によるエントロピー符号化処理を行う。エントロピー符号化部308は、このため入力される量子化データ(多値データ)を2値データに変換する2値化部、その2値化部により生成された2値化データを格納する2値化データ・メモリを有する。また、エントロピー符号化部308は、2値化データの発生確率をコンテキストに応じて計算し、保持するコンテキスト計算部、及びコンテキスト計算部により供給される発生確率に応じて算術符号化を行う算術符号化部を有する。こうして符号化したデータをタイル単位に多重化処理部309へ供給すると共に、発生符号量を符号量制御部307へ出力する。
符号量制御部307は、符号化ピクチャバッファをオーバーフロー、又はアンダーフローさせないように符号化データの符号量を制御する処理部である。符号量制御部307は、エントロピー符号化部308から供給されるエントロピー符号化後の発生符号量を元に、後続して入力するフレームに対する量子化パラメータを生成し、直交変換・量子化部305へ供給する。
多重化処理部309は、画像の符号化の開始時には、ファイルヘッダに符号化対象のフレームのサイズ等の情報に加えて、各タイルの分割位置と、設定された画面サイズ、タイル番号、並びに、主被写体が存在するタイル番号を示す情報を格納する。
なお、タイル番号が、タイルを単位とするラスタースキャン順に符番されることが、符号化、復号を行う装置双方の共通事項である場合にはタイル番号は不要としてもよい。
<画面分割部301によるタイル分割例>
図4に、本実施形態における、タイル構成の一例を示す。
図4(a)は、入力される画像データに対する有る時点におけるタイル構成の一例を示した図である。図4(a)は、タイルA1乃至A8、及び、タイルBの9つのタイルで構成されている。図4(a)に示すように、画面分割部301は、主被写体となる人物を含むタイルBの位置を決定し、タイルBの位置に合わせて、その他のタイル構成を決定する。具体的には、タイルBの位置が決まると、タイルBの4辺を表す線分を延長を主画面の分割の境界線とすることで、タイルAを決定する。なお、タイルBのように主被写体を含むタイルのことを以降、「主タイル」とする。また、入力される画像を「主画像」とし、主画像内の「主タイル」が表す、主画面よりも小さい画面を「副画像」と定義する。
図4(b)は、実施形態における、同図(a)に対して時系列で後のフレームにおける、タイル構成の一例を示した図である。図4(b)に示すように、画面分割部301は、主被写体となる人物が移動したことで、タイルB(主タイル)の位置を移動する。画面分割部301は、タイルBの位置に合わせてタイルA1、タイルA2、タイルA3、タイルA4、タイルA5のサイズ及び位置も変更され、図示の場合、タイルA6乃至8は存在しなくなる。
なお、タイルBのサイズは図4(a)及び図4(b)で同サイズとする。また、主画面のサイズが例えば8192×4320画素である場合には、タイルB(主タイル)はその1/4サイズである、4096×2160画素等、DCI(Digital Cinema Initiatives)等の規格団体で決定されている一般的に使用される画面サイズに設定してもよい。
また、図4(b)の状態から主被写体が更に左方向に移動して、タイルBが主画面の左下隅の位置に移動した場合、分割するタイルの総数は最小の“4”になる。つまり、主画面を分割するタイル数は、主タイルの位置に応じて、4乃至9の範囲で変動する。なお、符号化はタイル単位に行うことになる。タイル数の増加は符号化効率を下げる要因となる。それ故、先に示した条件で主画面をタイル分割した場合に、タイルのサイズ(面積)が予め設定された閾値以下であって、互いに接続しても矩形の形状を維持できる場合には、それらのタイルを1つに統合しても良い。例えば、図4(a)の状態で、タイルA6、A7,A8それぞれのサイズが閾値以下であって、互いに接続したとしても矩形形状が維持できるので、タイルA6、A7,A8を1つのタイルとして決定するようにしても良い。
<符号化装置100の全体の処理フロー>
符号化装置100における処理全体の一例を図5のフローチャートに示す。なお、本実施形態におけるフローチャートの制御プログラムは、不揮発性メモリ103に格納されている。そして、符号化装置100の電源がONの状態において、CPU101がその不揮発性メモリ103に格納されているプログラムをメモリ102に展開して実行する。本実施形態における符号化装置100の制御プログラムは、定期的に処理を繰り返し実行してもよい。
S501において、CPU101は、撮像部112で撮影した画像よりも小さい画面サイズである副画像の画面サイズを決定する。CPU101は、操作部104からの操作により、ユーザから設定された画面サイズを設定値として、不揮発性メモリ103に保存しておいた設定情報から、主被写体が含まれる主画面より画面サイズが小さい副画像の画面サイズを決定する。CPU101は、本フローチャートにおける処理をS501からS502へ進める。
S502において、CPU101は、主被写体を指定する。CPU101は、操作部104からの操作によりユーザにより選択された、予め不揮発性メモリ103に保存されている複数の主被写体情報から主被写体を決定する。また、CPU101は、不揮発性メモリ103に主被写体情報が存在しない場合は、表示部116のライブビュー画像にタッチ操作を促すような表示を重畳し、ユーザによりタッチされた被写体(オブジェクト)を主被写体とする。または、表示部116に重畳される被写体を登録する枠内に主被写体が入るように撮影された被写体を主被写体として不揮発性メモリ103に登録する。CPU101は、本フローチャートにおける処理をS502からS503へ進める。
S503において、CPU101は、操作部104の動画記録開始ボタンが押されたか否かを判断する。CPU101は、動画記録開始ボタンが押されたと判断した場合(S503のYES)、本フローチャートにおける処理をS503からS504へ進める。また、CPU101は、動画記録開始ボタンが押されていないと判断した場合(S503のNO)、本フローチャートにおける処理をS503で継続する。
S504において、CPU101は、符号化処理部114による符号化処理を行う前の設定を行う。CPU101は、符号化処理部114の画面分割部301が参照するための主被写体の情報をメモリ102に書き込む。また、CPU101は、主画面の符号化画像のみファイルに記録するか、主画面と副画面の2画面の符号化画像を別々のファイルに記録するか設定する。更に、CPU101は符号化処理を行うための各種レジスタ設定等を行い、符号化処理部114が動作可能な状態にし、本フローチャートにおける処理をS504からS505に進める。
S505において、CPU101は、画像処理部113がメモリ102に保存した画像データのアドレスを符号化処理部114に通知し、符号化処理の実行を命令する。なお、符号化処理部114における詳細な符号化処理に関して図6を用いて後述する。そして、CPU101は、本フローチャートにおける処理をS505からS506へ進める。
S506において、CPU101は、S505で符号化処理部114により生成された符号化画像データとシンタックス情報(付加情報)を記録媒体制御部119により記録媒体120を制御して順次記録する。主画面のみファイルに記録する場合は、主画面の符号化画像データと主画面のシンタックス情報を記録する。主画面と副画面を別々のファイルに記録する場合、主画面の符号化画像データと主画面のシンタックス情報と、副画面の符号化画像データと副画面のシンタックス情報をそれぞれ別々のファイルとなるように記録する。CPU101は、本フローチャートにおける処理をS506からS507に進める。
S507において、CPU101は、撮影が終了したか否かを判断する。CPU101は、ユーザからの操作による操作部104からの信号を受信して、撮影が終了したことを判断する。CPU101は、撮影が終了したと判断した場合(S508のYES)、本フローチャートにおける処理をS507からS508へ進める。CPU101は、撮影が終了していないと判断した場合(S507のNO)、本フローチャートにおける処理をS507からS505へ戻す。
S508において、CPU101は、符号化処理部114に対して符号化処理の終了処理を行う。具体的には、符号化処理部114に存在する不図示のレジスタに終了の値を設定する。CPU101は、本フローチャートにおける処理をS508からS509へ進める。
S509において、CPU101は、記録媒体制御部119を制御して記録媒体120に記録しているファイルの生成を完了させ、1つのファイルとして読み取り可能な状態とする。CPU101は、本フローチャートにおける処理を終了する。
なお、図5で示したフローチャートにおいては、ファイルを記録媒体120に記録したが、通信制御部により通信部を制御して復号装置200にファイルを送信してもよい。
<符号化装置100のタイル構成の決定処理と符号化処理>
符号化装置100におけるタイル構成の決定と符号化の処理の一例を図6に示す。本処理は、図5を用いて前述したS505におけるCPU101からの要求により実行される、符号化処理部114の処理に関して詳細に説明したものである。
S601において、符号化処理部114は、着目フレームがタイル構成の更新タイミングのフレームであるか否かを判定する。これはタイルの分割位置の決定を、フレーム毎に実行するのではなく、ある程度のフレーム間隔で行うためである。実施形態では、予測符号化方法決定部302により着目フレームをIピクチャとして符号化すると判定した場合を、タイル構成の更新タイミングであるものとする。なお、より精度を高くするのであれば、Iピクチャだけでなく、Iピクチャを参照するP,Bピクチャの場合も更新タイミングとしても構わない。
符号化処理部114は、着目フレームがタイル構成の更新タイミングであると判断した場合(S601のYES)、本フローチャートにおける処理をS601からS602へ進める。符号化処理部114は、着目フレームがタイル構成の更新タイミングではないと判断した場合(S601のNO)、処理をS611に進め、前フレームと同じタイル構成に基づく符号化を行うことになる。
S602において、符号化処理部114は、画像処理部113あるいはCPU101が、メモリ102の所定アドレスに書き込んだ主被写体範囲情報NEW(着目フレーム内の主被写体のサイズと位置を示す情報)を取得する。符号化処理部114は、本フローチャートにおける処理をS602からS603へ進める。なお、符号化処理部114は、画面分割部301により主被写体の範囲を検出してもよい。また、主被写体の範囲は、主被写体の外接矩形とする。
S603において、符号化処理部114は、画面分割部301により主被写体の範囲が副画像の画像サイズよりも大きいか否かを判断する。実施形態では、主被写体の範囲を規定する水平又は垂直方向の画素数のいずれかが副画像のそれよりも大きい場合に、主被写体の範囲が副画像の画像サイズよりも大きいと判定される。符号化処理部114は、主被写体の範囲が副画像の画像サイズよりも大きい場合(S603のYES)、本フローチャートにおける処理をS603からS608へ進める。符号化処理部114は、主被写体の範囲が副画像の画像サイズ以下である場合(S603のNO)、本フローチャートにおける処理をS603からS604へ進める。
S604において、符号化処理部114は、画面分割部301により主被写体の位置が移動したか否かを判断する。符号化処理部114は、メモリ102に保存されている主被写体範囲情報NEWと、前回のタイル構成の更新タイミング時のピクチャ(前回のIピクチャ)における主被写体範囲情報OLDの位置から移動したか否かを判断する。符号化処理部114は、主被写体が移動したと判断した場合(S604のYES)、本フローチャートにおける処理をS604からS605へ進める。符号化処理部114は、主被写体が移動しなかったと判断した場合(S604のNO)、タイルの構成は変更しないと判断し、本フローチャートにおける処理をS604からS611へ進める。なお、符号化処理部114は、予測符号化処理部303による主被写体が存在する画像ブロックの動きベクトル量により、主被写体が移動したか否かを判断してもよい。
S605において、符号化処理部114は、画面分割部301により主被写体範囲情報NEWと主被写体範囲情報OLDから移動量を算出する。符号化処理部114は、移動量が不揮発性メモリ103に予め記録されている所定値と比較し、移動量が所定値以下である場合、本フローチャートにおける処理をS605からS607へ進める。符号化処理部114は、移動量が不揮発性メモリ103に記録されている所定値より大きい場合、本フローチャートにおける処理をS605からS606へ進める。
S606において、符号化処理部114は、画面分割部301により主タイルの位置を、主被写体範囲情報OLDから主被写体範囲情報NEWの方向に、所定値だけ副画像を移動させた位置を、新たな主タイルの位置とする。そして、符号化処理部114は、図4で示したように、主タイル以外のタイル位置を主タイルの位置に合わせて決定する。符号化処理部114は、本フローチャートにおける処理をS606からS611へ進める。
S607において、符号化処理部114は、画面分割部301により、主被写体範囲情報NEWの位置にあわせて主タイルを決定する。例えば、主被写体の中心位置が、主体タイルの中心位置に合わせる等がその代表的な処理である。また、符号化処理部114は、図4で示したように、主タイル以外のタイル位置を主タイルの位置に合わせて決定する。符号化処理部114は、本フローチャートにおける処理をS606からS611へ進める。
S608において、符号化処理部114は、画面分割部301により、副画像の動画を別ファイルとして生成しているか否かを判断する。符号化処理部114は、CPU101により設定されたレジスタを確認する。S608にて、符号化処理部114は、副画像の動画を別ファイルとして生成しないと判断した場合、本フローチャートにおける処理をS608からS610へ進める。符号化処理部114は、副画像の動画を別ファイルとして生成しないと判断した場合、本フローチャートにおける処理をS608からS609へ進める。
S609において、符号化処理部114は、画面分割部301により、主タイルを生成しない。つまり、符号化処理部114は、主画像の複数のタイルへの分割を行わず、主画像全体を1つのタイルとして決定する。符号化処理部114は、本フローチャートにおける処理をS606からS611へ進める。
S610において、符号化処理部114は、画像処理部113に対して縮小処理を要求する。画像処理部113は、要求に従い主画像を副画像の画像サイズに縮小してメモリ102に保存する。なお、主画像はそのままメモリ102に残しておくものとする。符号化処理部114は、本フローチャートにおける処理をS610からS611へ進める。
S611において、符号化処理部114は、主被写体範囲情報NEWを主被写体範囲情報OLDとしてメモリ102に保存する。符号化処理部114は、本フローチャートにおける処理をS611からS612へ進める。
S612において、符号化処理部114は、符号量制御部307により設定される量子化テーブルにおける値として、主タイルに対しては予め設定された小さい値を設定し、主タイル以外において、それよりも大きい値を設定する。符号化処理部114は、本フローチャートにおける処理をS612からS613へ進める。
S613において、符号化処理部114は、主画像に対する符号化処理を実行する。符号化処理に関しては、図3を用いて上述した通りであるが、主タイルの符号化では、着目フレームの種類を問わず、主タイル外の領域を参照せずに符号化を行う。これは、主タイルを単独で復号できるようにするためである。なお、S608の判断処理と同様に、副画像の動画を別ファイルで生成する場合には、副画像に対する符号化処理を別途実施する。符号化処理部114は、S610において縮小処理により副画像が別データとして存在する場合は、縮小画像を副画像として符号化処理する。
なお、後述するように、復号装置200が主タイル単独で復号できるようにするためには、主タイルの符号化データの格納アドレス位置が判明している必要がある。そこで、符号化処理部114は、主画像の左上隅のタイルからラスタースキャン順に符号化を行う際に、各タイルの符号化データの符号量を累積加算していく。そして、復号装置200が主タイルの符号化データを開始する際の累積加算結果(正確には累積加算結果+1)を、主タイルの符号化データの先頭アドレスとして、着目フレームのシンタックス情報に含めるようにする。
以上の着目フレームに対する符号化処理を終えると、符号化処理部114は本フローチャートにおける処理をS613からS614へ進める。
S614において、符号化処理部114は、符号化された主画像データのシンタックス情報にタイルの構成を示した情報を付加してメモリ102に記録する。また、主画像のシンタックス情報には、副画像の存在と主タイルの範囲情報を付加してメモリ102に保存する。なお、の動画を別ファイルで生成する場合には、符号化された副画像データのシンタックス情報にタイルの構成を示した情報を付加してメモリ102に記録する。なお、副画像の存在と主タイルの範囲情報は、シンタックス以外にファイルとして生成する際のコンテナ情報に含めてもよいものとする。符号化処理部114は、本フローチャートにおける処理をS614で終了する。
なお、図6を用いて上述した処理はCPU101で行ってもよいものとする。また、主画像と副画像の両方を生成する処理としたが、主画像または副画像のいずれかのみを生成してもよいものとする。また、図5、図6で説明した符号化装置100においてタイルにより処理を行う構成としたが、スライス方向で構成できる横長の副画像であればタイルの代わりにスライスにより構成してもよいものとする。更に、タイル及び主タイルの中にスライスが含まれていてもよいものとする。
<復号装置200の全体の処理フロー>
復号装置200における副画像(主タイル)を復号して再生する際の処理全体の一例を示す。これは、表示装置300の表示解像度が主タイルと同じである場合と考える分かりやすい。なお、本実施形態におけるフローチャートの制御プログラムは、復号装置200の電源がONの状態において、不揮発性メモリ203に格納されているプログラムをメモリ202に展開してCPU201が実行する。本実施形態における復号装置200の制御プログラムは、定期的に処理を繰り返し実行してもよい。なお、本制御プログラムは操作部204の再生開始ボタンをユーザにより押下されて開始するものとする。また、本制御プログラムは記録媒体制御部214により記録媒体215を制御することで、ファイル情報を読み取り、メモリ202に保存してから処理を実行する。または、本制御プログラムは通信制御部211により通信部212を制御して、ファイル情報を受信して、メモリ202に保存してから処理を実行してもよい。
S701において、CPU201は、ファイルのコンテナ情報あるいは、シンタックス情報から、再生を行うフレームにおけるタイル情報を取得してメモリ202へ記録する。CPU201は、本フローチャートにおける処理をS701からS702へ進める。
S702において、CPU201は、S701により取得したタイル情報から再生するフレームにおける副画像の有無を判断する。CPU201は、副画像が存在する場合(S702のYES)、本フローチャートにおける処理をS702からS703へ進める。CPU201は、副画像が存在しない場合(S702のNO)、本フローチャートにおける処理をS702からS704へ進める。
S703において、CPU201は、シンタックス情報に含まれる副画像の符号化データの格納アドレスを用いて復号処理部213を制御することで副画像を構成する主タイルのみの復号処理を行わせる。復号処理部213により復号されたデータはメモリ202に保存される。CPU201は、本フローチャートにおける処理をS703からS706へ進める。
S704において、CPU201は、復号処理部213を制御することで主画像の符号化画像データの復号処理を行わせる。復号処理部213により復号して得た主画像はメモリ202に保存される。CPU201は、本フローチャートにおける処理をS704からS705へ進める。S705において、CPU201は、メモリ202に保存された画像データを、副画像の画像サイズにまで縮小して、メモリ202に保存する。実施形態では、主画像は8192×4320画素であり、副画像は4096×2160画素である。それ故、CPU201は、例えば主画像における2×2画素から、縮小画像の1画素を求める処理を行う。例えば、CPU201は、主画像内の2×2画素内の予め設定された位置の1画素、或いは、2×2画素の平均値を縮小画像の1画素とすれば良い。CPU201は、本フローチャートにおける処理をS704からS705へ進める。
S706において、CPU201は、表示制御部216を制御して表示装置300に対してメモリ202に保存された、復号処理で得た画像データを出力する。なお、CPU201は、表示装置300が表示可能な画像フォーマットに変換して出力するものとする。CPU201は、本フローチャートにおける処理をS706からS707へ進める。
S707において、CPU201は、操作部204の再生停止ボタンをユーザにより押下されたか否かを判断する。CPU201は、操作部204の再生停止ボタンをユーザにより押下された場合(S707のYES)、本フローチャートにおける処理をS707で終了する。CPU201は、操作部204の再生停止ボタンをユーザにより押下されていない場合(S707のNO)、本フローチャートにおける処理をS707からS702へ処理を戻す。
なお、図7で説明した復号装置200において、タイルにより処理を行う構成としたが、スライス方向で構成できる横長の副画像であればタイルの代わりにスライスにより構成してもよいものとする。更に、タイル及び主タイルの中にスライスが含まれていてもよい。
以上説明したように実施形態の符号化装置100によれば、主画像は勿論のこと、主画像内の主被写体を含む副画像領域のみを復号可能な符号化画像データを生成できる。また、副画像と同じ解像度の表示装置を有する復号装置200では、副画像のみを復号して再生することも可能になる。
なお、上記実施形態では、符号化しようとするフレームが8192×4320画素であり、副画像(主タイル)のサイズを4096×2160画素であるものとして説明したが、副画像のサイズはユーザが所有する表示装置の解像度に合わせて設定できるようにしても良い。この結果、ユーザが所有する表示装置に特化した動画像の部分復号が可能となる。
[第2の実施形態]
第2の実施形態として、副画面の画面サイズが主タイルの画面サイズと同じサイズで、主タイルの画面サイズを固定のサイズとし、タイル位置を可変としてH.265の符号化を行い、主タイルを復号して得た画面をトリミングして表示する処理を示す。主タイルの位置が変わった場合、復号した画面内からトリミングする位置を徐々に変更する。なお、装置構成は前述した実施形態(第1の実施形態)と同等とし説明は省略する。
H.265では、タイルの境界位置とタイルのサイズはCTU(Coding Tree Unit)単位となる。CTUが取り得る設定値は16×16、32×32、64×64画素のいずれかである。このため、主タイルのみ復号して表示した場合、あるフレーム間でタイル位置が変わると、表示位置が1フレーム間で少なくとも16画素変わるため、不自然な動画となってしまうケースがある。
図8を参照して、フレーム間でタイル位置が変わり、不自然な動画となる例を説明する。図8は連続するN乃至N+3の4フレーム分の画像を示しており、図8における参照符号801乃至804は主画像を示し、同811乃至814は副画像(主タイル)を示している。Nフレーム、N+1フレームでは、副画像の左隣のタイルの水平方向サイズはL1であったのに対し、N+2、N+3フレームでの左隣のタイルの水平方向サイズはL1とは異なるL2(L2<L1)となっていることを示している。つまり、副画像の位置は、N+1フレームとN+2フレームで異なった例を示している。この状態で副画像のみを復号して再生すると、N+1フレーム目の副画像と、N+2フレーム目の副画像とで主被写体や背景が突然にずれた位置に表示され、不自然な動画となってしまう。
そこで本実施形態では、図9に示すように、連続する主画像901〜904から復号して得た副画像(主タイル)911乃至914の画面内をトリミングして表示する。この際、タイル位置が変わった場合、トリミング位置が徐々に変わるようにすることで、タイル位置が変わってた際の不自然さを軽減する。図9の説明は図12のフローチャートと共に後述する。ここで、図9のN+1フレーム目のタイル位置をタイル位置α、N+2フレーム目のタイル位置をタイル位置βとする。
符号化装置100の全体の処理フローは、第1の実施形態と同様とし説明を省略する。ただし、本第2の実施形態では、副画像(主タイル)の画面サイズは固定のサイズとし、主画面のみファイルに記録するものとして説明する。
<符号化装置100のタイル構成決定と符号化の処理フロー>
図10は、第2の実施形態における符号化装置100におけるタイル構成の決定と符号化処理を示すフローチャートである。本処理は、図5を用いて前述したS505におけるCPU101からの要求により実行される、符号化処理部114の処理に関して詳細に説明したものである。
S1001において、符号化処理部114はタイル更新のタイミングであるか否かを判定する。第1の実施形態と同様、予測符号化方法決定部302により着目フレームをIピクチャとする符号化すると判定した場合を、タイル更新のタイミングとする。勿論、これに加えてIピクチャを参照するP,Bピクチャの符号化タイミングを更新タイミングとしても構わない。着目フレームに対してタイル構成の更新をすべきと判定された場合、符号化処理部114は、本フローチャートにおける処理をS1001からS1002へ進める。符号化処理部114は、更新タイミングではないと判定した場合、本フローチャートにおける処理をS1001からS1006へ進める。
S1002において、符号化処理部114は、画像処理部113あるいはCPU101が、メモリ102の所定アドレスに書き込んだ主被写体範囲情報NEWを取得する。符号化処理部114は、本フローチャートにおける処理をS1002からS1003へ進める。なお、符号化処理部114は、画面分割部301により主被写体の範囲を検出してもよい。
S1003において、符号化処理部114は、画面分割部301により主被写体の位置が移動したか否かを判断する。符号化処理部114は、メモリ102に保存されている主被写体範囲情報NEWで示される位置と、前回の更新タイミング(前回のIピクチャの符号化タイミング)における主被写体範囲情報OLDが示す位置の差分に基づき、移動したか否かを判断する。符号化処理部114は、主被写体が移動したと判断した場合、本フローチャートにおける処理をS1003からS1004へ進める。また、符号化処理部114は、主被写体が移動しなかったと判断した場合、タイル構成は変更しないと判断し、本フローチャートにおける処理をS1003からS1006へ進める。なお、符号化処理部114は、予測符号化処理部303による主被写体が存在する画像ブロックの動きベクトル量により、主被写体が移動したか否かを判断してもよい。
S1004において、符号化処理部114は、画面分割部301により主被写体範囲情報NEWと主被写体範囲情報OLDから移動量を算出する。そして、符号化処理部114は、移動量が不揮発性メモリ103に記録されている所定値以下である場合、本フローチャートにおける処理をS1004からS1006へ進める。符号化処理部114は、移動量が不揮発性メモリ103に記録されている所定値より大きい場合、本フローチャートにおける処理をS1004からS1005へ進める。
S1005において、符号化処理部114は、主被写体範囲情報OLDから主被写体範囲情報NEWの方向に、所定値だけ副画像を移動させた位置を、更新後の主タイルの位置として決定する。そして、符号化処理部114は、図4で説明したように、主タイルの位置に従って、主タイル以外のタイルの位置を決定する。符号化処理部114は、本フローチャートにおける処理をS1005からS1006へ進める。
S1006において、符号化処理部114は、主被写体範囲情報NEWを主被写体範囲情報OLDとしてメモリ102に保存する。符号化処理部114は、本フローチャートにおける処理をS1006からS1007へ進める。
S1007において、符号化処理部114は、符号量制御部307により設定される量子化テーブルにおける値として、主タイルに対しては予め設定された小さい値を設定し、主タイル以外のタイルに対してはそれよりも大きい値を設定する。符号化処理部114は、本フローチャートにおける処理をS1007からS1008へ進める。
S1008において、符号化処理部114は、主画像に対する符号化処理を実行する。符号化処理に関しては、図3を用いて上述した通りである。符号化処理部114は、符号化した画像データをメモリ102に保存する。符号化処理部114は、本フローチャートにおける処理をS1008からS1009へ進める。
S1009において、符号化処理部114は、符号化された主画像データのシンタックス情報にタイルの構成を示した情報を付加してメモリ102に記録する。また、主画像のシンタックス情報には、副画像の存在と主タイルの範囲情報を付加してメモリ102に保存する。なお、副画像(主タイル)の範囲情報は、シンタックス以外にファイルとして生成する際のコンテナ情報に含めてもよい。符号化処理部114は、本フローチャートにおける処理をS1009で終了する。
なお、図10を用いて上述した処理はCPU101で行ってもよいものとする。また、タイル及び主タイルの中にスライスが含まれていてもよいものとする。
<復号装置200の全体の処理フロー>
図11に第2の実施形態における復号装置200における副画像を復号して再生する際の処理を示す。なお、本実施形態におけるフローチャートの制御プログラムは、復号装置200の電源がONの状態において、不揮発性メモリ203に格納されているプログラムをメモリ202に展開してCPU201が実行する。本実施形態における復号装置200の制御プログラムは、定期的に処理を繰り返し実行してもよい。なお、本制御プログラムは操作部204の再生開始ボタンをユーザにより押下されて開始するものとする。また、本制御プログラムは記録媒体制御部214により記録媒体215を制御することで、ファイル情報を読み取り、メモリ202に保存してから処理を実行する。または、本制御プログラムは通信制御部211により通信部212を制御して、ファイル情報を受信して、メモリ202に保存してから処理を実行してもよい。
S1101において、CPU201は、ファイルのコンテナ情報あるいは、シンタックス情報から再生を行うフレームにおけるタイル情報を取得してメモリ202へ記録する。CPU201は、本フローチャートにおける処理をS1101からS1102へ進める。
S1102において、CPU201は、S1101により取得したタイル情報から再生するフレームにおける副画像の有無を判断する。CPU201は、副画像が存在すると判断した場合、本フローチャートにおける処理をS1102からS1105へ進める。CPU201は、副画像が存在しないと判断した場合、本フローチャートにおける処理をS1102からS1103へ進める。
S1103において、CPU201は、復号処理部213を制御することで主画像を符号化した画像データの復号処理を行う。復号処理部213により復号されたデータはメモリ202に保存される。CPU201は、本フローチャートにおける処理をS1103からS1104へ進める。
S1104において、CPU201は、メモリ202に保存された画像データを副画像の画像サイズに縮小してメモリ202に保存する。CPU201は、本フローチャートにおける処理をS1104からS1108へ進める。
S1105において、CPU201は、復号処理部213を制御することで副画像を構成する主タイルのみを復号処理する。復号処理部213により復号されたデータはメモリ202に保存される。CPU201は、本フローチャートにおける処理をS1105からS1106へ進める。
S1106において、CPU201は、復号された画像のトリミング位置を決定する。画像のトリミング位置決定の処理は図12にて後述する。CPU201は、本フローチャートにおける処理をS1106からS1107へ進める。
S1107において、CPU201は、S1106で決定した画像のトリミング位置情報と画像処理部113により画像をトリミングしてメモリ202に保存する。CPU201は、本フローチャートにおける処理をS1107からS1108へ進める。
S1108において、CPU201は、表示制御部216を制御して表示装置300に、メモリ202に保存された画像データを出力する。なお、CPU201は、表示装置300が表示可能な画像フォーマットに変換して出力するものとする。CPU201は、本フローチャートにおける処理をS1108からS1109へ進める。
S1109において、CPU201は、操作部204の再生停止ボタンをユーザにより押下されたか否かを判断する。CPU201は、操作部204の再生停止ボタンをユーザにより押下されたと判断した場合、本フローチャートにおける処理をS1109で終了する。CPU201は、操作部204の再生停止ボタンをユーザにより押下されていないと判断した場合、本フローチャートにおける処理をS1109からS1110へ進める。
S1110において、CPU201は、全フレームの再生が終了したか否かを判断する。CPU201は、全フレームの再生が終了したと判断した場合、本フローチャートにおける処理をS1110で終了する。また、CPU201は、全フレームの処理が終了していないと判断した場合、本フローチャートにおける処理をS1110からS1102へ処理を戻す。
なお、図11で説明した復号装置200において、タイルにより処理を行う構成としたが、スライス方向で構成できる横長の副画像であればタイルの代わりにスライスにより構成してもよいものとする。更に、タイル及び主タイルの中にスライスが含まれていてもよいものとする。
<トリミング位置の決定処理>
図12のフローチャートを参照して、本第2の実施形態におけるトリミング位置の決定処理の流れを説明する。
S1201において、CPU201は、復号対象の着目フレームが1フレーム目か否かを判断する。CPU201は、着目フレームが1フレーム目であると判断した場合、本フローチャートにおける処理をS1201からS1202へ進める。また、CPU201は、復号対象の着目フレームが1フレーム目ではないと判断した場合、本フローチャートにおける処理をS1201からS1204へ進める。
S1202において、CPU201は、メモリ202に保存されているトリミング位置変更フラグを0に設定し、本フローチャートにおける処理をS1202からS1203へ進める。
S1203において、CPU201は、図9の副画像911、912のように、副画像の中央部をトリミングの境界位置として決定し、本フローチャートにおける処理をS1203で終了する。
S1204において、CPU201は、トリミング位置変更フラグが1となっているか否かを判断する。CPU201は、トリミング位置変更フラグが1であると判断した場合、本フローチャートにおける処理をS1204からS1208へ進める。また、CPU201は、トリミング位置変更フラグが1ではないと判断した場合、本フローチャートにおける処理をS1204からS1205へ進める。
S1205において、CPU201は、タイルに関するシンタックス情報から現フレームの主タイルの位置が1つ前のフレームの主タイルの位置から変わったか否かを判断する。CPU201は、主タイルの位置が変わったと判断した場合、本フローチャートにおける処理をS1205からS1206へ進める。また、CPU201は、主タイルの位置が変わっていないと判断した場合、本フローチャートにおける処理をS1204からS1203へ進める。
S1206において、CPU201は、トリミング位置変更フラグを1にし、本フローチャートにおける処理をS1206からS1207へ進める。
S1207において、CPU201は、トリミングカウンタを0にし、本フローチャートにおける処理をS1207からS1208へ進める。
S1208において、CPU201は、トリミングカウンタの値に応じてトリミング位置を決め、本フローチャートにおける処理をS1208からS1209へ進める。トリミング位置は、トリミングカウンタの値に応じて、図9の副画像913や914のように、主画面を基準とした位置で考えた時のタイル位置αの中央部からタイル位置βの中央部に徐々に変わるようにする。トリミングカウンタの値に応じたトリミング位置は、フレームレートや主被写体の移動速度に応じて可変としてもよい。
S1209において、CPU201は、トリミングカウンタをインクリメントし、本フローチャートにおける処理をS1209からS1210へ進める。
S1210において、CPU201は、トリミングカウンタの値が閾値以上か否かを判断する。CPU201は、トリミングカウンタの値が閾値以上であると判断した場合、本フローチャートにおける処理をS1210からS1211へ進める。また、CPU201は、トリミングカウンタの値が閾値未満であると判断した場合、本フローチャートにおける処理をS1210で終了する。
S1211において、CPU201は、トリミング位置変更フラグを0にし、本フローチャートにおける処理をS1211で終了する。
以上説明したように本第2の実施形態によれば、第1の実施形態と比較して、主画像内の副画像をより自然な動画像として再生できるようになる。
(他の実施形態)
本発明に係る符号化装置100は、本実施形態で説明した符号化装置100に限定されるものではない。また、本発明に係る復号装置200も本実施形態で説明した復号装置200に限定されるものではない。例えば、本発明に係る符号化装置100及び復号装置200は、複数の装置から構成されるシステムにより実現することも可能である。
また、本実施形態で説明した様々な処理及び機能は、コンピュータプログラムにより実現することも可能である。この場合、本発明に係るコンピュータプログラムは、コンピュータ(CPU等を含む)で実行可能であり、本実施形態で説明した様々な機能を実現することになる。
本発明に係るコンピュータプログラムは、コンピュータ上で稼動しているOS(Operating System)などを利用して、本実施形態で説明した様々な処理及び機能を実現してもよいことは言うまでもない。
また、本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
100…符号化装置、101…CPU、102…メモリ、103…不揮発性メモリ、104…操作部、111…レンズ、112…撮像部、113…画像処理部、114…符号化処理部、115…表示制御部、116…表示部、117…通信制御部、118…通信部、119…記録媒体制御部、120…記録媒体、130…内部バス、200…復号装置、201…CPU、202…メモリ、203…不揮発性メモリ、204…操作部、210…通信制御部、211…通信部、212…復号処理部、213…記録媒体制御部、214…記録媒体、215…表示制御部、220…内部バス、300…表示装置、301…画面分割部、302…予測符号化方法決定部、303…予測符号化処理部、305…直交変換量子化部、306…局所復号部、307…符号量制御部、308…エントロピー符号化部、309…多重化処理部

Claims (19)

  1. 動画像を符号化する符号化装置であって、
    符号化しようとする着目フレームから、主被写体を含み、予め設定されたサイズの副画像の領域の位置を決定する決定手段と、
    該決定手段で決定した前記副画像の領域の境界に基づき前記着目フレームを複数の領域に分割する分割手段と、
    該分割手段で分割して得た各領域の画像を符号化する符号化手段と、
    前記符号化手段で得た符号化データと、前記着目フレームにおける前記副画像の領域の位置、並びに、前記副画像の符号化データの格納アドレスを示す付加情報とから前記着目フレームの符号化データを生成する生成手段と
    を有することを特徴とする符号化装置。
  2. 前記決定手段は、符号化しようとするフレームが予め設定された種類のフレームの場合に前記副画像の領域の位置を決定し、
    前記符号化手段は、符号化しようとするフレームが前記予め設定された種類とは異なるフレームの場合には、前記副画像の領域の位置が前のフレームと同じであるとして符号化を行う
    ことを特徴とする請求項1に記載の符号化装置。
  3. 前記決定手段は、
    (1)前記着目フレームにおける主被写体が、前回の主被写体の位置から移動していない場合は、前記副画像の領域の位置を変更せず、
    (2)前記着目フレームにおける主被写体が、前回の主被写体の位置から移動し、当該移動量が予め設定された閾値以下の場合には前記着目フレームにおける主被写体の位置に基づいて前記副画像の領域の位置を決定し、
    (3)前記着目フレームにおける主被写体が、前回の主被写体の位置から移動し、当該移動量が前記閾値を超える場合には、前記前回の主被写体の位置から前記着目フレームの主被写体の位置に向かう予め設定された位置に前記副画像の領域を移動する
    ことを特徴とする請求項2に記載の符号化装置。
  4. 前記決定手段は、符号化しようとするフレームがIピクチャ、又は、Iピクチャ及びIピクチャを参照するピクチャである場合に前記副画像の領域を決定する
    ことを特徴とする請求項2に記載の符号化装置。
  5. 前記主被写体の特徴を設定する設定手段と、
    符号化しようとするフレーム内に、前記設定手段で設定した前記主被写体の特徴を有する主被写体の領域を検出する検出手段とを有し、
    前記決定手段は、前記主被写体の領域のサイズが前記副画像のサイズ以下の場合、前記副画像の領域を決定する
    ことを特徴とする請求項1乃至4のいずれか1項に記載の符号化装置。
  6. 前記決定手段は、前記主被写体の領域のサイズが前記副画像のサイズよりも大きい場合、前記着目フレームを前記複数の領域への分割を行わず、前記着目フレームを1つの領域として決定することを特徴とする請求項5に記載の符号化装置。
  7. 前記設定手段は、表示手段に表示される動画像にてユーザが選択したオブジェクトを前記主被写体として決定し、当該決定した主被写体の特徴を抽出する手段を含む
    ことを特徴とする請求項5に記載の符号化装置。
  8. 前記副画像の領域のサイズを設定する第2の設定手段を有することを特徴とする請求項1乃至7のいずれか1項に記載の符号化装置。
  9. 前記符号化手段は、前記副画像の領域を符号化する際に第1の量子化パラメータを用いて符号化し、前記副画像の領域を除く領域を符号化する際には前記第1の量子化パラメータより大きい第2の量子化パラメータを用いて符号化する
    ことを特徴とする請求項1乃至8のいずれか1項に記載の符号化装置。
  10. 前記副画像の領域の符号化データの別ファイルを生成することを指定する指定手段を更に有し、
    前記生成手段は、前記指定手段により別ファイルとして生成することが指定された場合、符号化しようとするフレームから得た符号化データを表すファイルと、前記副画像の領域から得た符号化データを表すファイルとを生成する
    ことを特徴とする請求項1乃至9に記載の符号化装置。
  11. 符号化対象となる画像を撮像する撮像手段を更に有することを特徴とする符号化装置。
  12. 動画像の符号化データを復号する復号装置であって、
    着目フレームの符号化データの付加情報を解析することで、当該着目フレームに副画像の領域があるか否かを判定する判定手段と、
    該判定手段で前記副画像の領域があると判定した場合、前記着目フレームの符号化データから、前記付加情報に含まれる情報に基づき、前記副画像の符号化データを抽出し、復号する復号手段と、
    該復号手段で得た前記副画像を表す画像データを表示装置に出力する出力手段と
    を有することを特徴とする復号装置。
  13. 前記付加情報は、符号化データのストリームにおけるシンタックス情報又はファイルのコンテナ情報であることを特徴とする請求項12に記載の復号装置。
  14. 前記判定手段により前記着目フレームに副画像の領域が無いと判定された場合、前記復号手段に前記着目フレームの画像を復号させ、復号して得た画像を前記副画像のサイズにリサイズし、前記出力手段に出力させる制御手段を更に有することを特徴とする請求項12又は13に記載の復号装置。
  15. 前記付加情報を解析することで、前記副画像の領域の位置を表す情報を抽出する抽出手段と、
    前記着目フレームより前のフレームにおける前記副画像の領域を示す位置と、前記着目フレームに含まれる前記副画像の領域を示す位置とに基づき、前記復号手段で得た前記副画像におけるトリミングする領域を決定し、決定した領域をトリミングするトリミング手段とを更に有し、
    前記出力手段は前記トリミング手段によるトリミングした後の副画像を表す画像データを出力することを特徴とする請求項12乃至15のいずれか1項に記載の復号装置。
  16. 前記トリミング手段は、前回のトリミングした領域の位置に対し、前記着目フレーム内の副画像に対するトリミングする領域の位置が予め設定された閾値以下となるようにトリミングを行うことを特徴とする請求項15に記載の復号装置。
  17. 動画像を符号化する符号化装置の制御方法であって、
    符号化しようとする着目フレームから、主被写体を含み、予め設定されたサイズの副画像の領域の位置を決定する決定工程と、
    該決定工程で決定した前記副画像の領域の境界に基づき前記着目フレームを複数の領域に分割する分割工程と、
    該分割工程で分割して得た各領域の画像を符号化する符号化工程と、
    前記符号化工程で得た符号化データと、前記着目フレームにおける前記副画像の領域の位置、並びに、前記副画像の符号化データの格納アドレスを示す付加情報とから前記着目フレームの符号化データを生成する生成工程と
    を有することを特徴とする符号化装置の制御方法
  18. 動画像の符号化データを復号する復号装置の制御方法であって、
    着目フレームの符号化データの付加情報を解析することで、当該着目フレームに副画像の領域があるか否かを判定する判定工程と、
    該判定工程で前記副画像の領域があると判定した場合、前記着目フレームの符号化データから、前記付加情報に含まれる情報に基づき、前記副画像の符号化データを抽出し、復号する復号工程と、
    該復号工程で得た前記副画像を表す画像データを表示装置に出力する出力工程と
    を有することを特徴とする復号装置の制御方法。
  19. コンピュータが読み込み実行することで、前記コンピュータに、請求項17又は18に記載の方法の各工程を実行させるためのプログラム。
JP2017208511A 2017-10-27 2017-10-27 符号化装置及びその制御方法及びプログラム Active JP7148236B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017208511A JP7148236B2 (ja) 2017-10-27 2017-10-27 符号化装置及びその制御方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017208511A JP7148236B2 (ja) 2017-10-27 2017-10-27 符号化装置及びその制御方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2019083368A true JP2019083368A (ja) 2019-05-30
JP2019083368A5 JP2019083368A5 (ja) 2020-11-19
JP7148236B2 JP7148236B2 (ja) 2022-10-05

Family

ID=66671217

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017208511A Active JP7148236B2 (ja) 2017-10-27 2017-10-27 符号化装置及びその制御方法及びプログラム

Country Status (1)

Country Link
JP (1) JP7148236B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10271499A (ja) * 1997-03-26 1998-10-09 Sanyo Electric Co Ltd 画像領域を用いる画像処理方法、その方法を用いた画像処理装置および画像処理システム
JP2011527841A (ja) * 2008-07-11 2011-11-04 三洋電機株式会社 画像処理装置およびそれを用いた撮像装置
JP2013232724A (ja) * 2012-04-27 2013-11-14 Fujitsu Ltd 動画像処理装置、動画像処理方法および動画像処理プログラム
WO2014002619A1 (ja) * 2012-06-25 2014-01-03 ソニー株式会社 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法
JP2015050584A (ja) * 2013-08-30 2015-03-16 キヤノン株式会社 画像符号化装置及びその制御方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10271499A (ja) * 1997-03-26 1998-10-09 Sanyo Electric Co Ltd 画像領域を用いる画像処理方法、その方法を用いた画像処理装置および画像処理システム
JP2011527841A (ja) * 2008-07-11 2011-11-04 三洋電機株式会社 画像処理装置およびそれを用いた撮像装置
JP2013232724A (ja) * 2012-04-27 2013-11-14 Fujitsu Ltd 動画像処理装置、動画像処理方法および動画像処理プログラム
WO2014002619A1 (ja) * 2012-06-25 2014-01-03 ソニー株式会社 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法
JP2015050584A (ja) * 2013-08-30 2015-03-16 キヤノン株式会社 画像符号化装置及びその制御方法

Also Published As

Publication number Publication date
JP7148236B2 (ja) 2022-10-05

Similar Documents

Publication Publication Date Title
JP6373056B2 (ja) 撮像装置、撮像装置の制御方法及び画像処理方法
US10674110B2 (en) Image encoding apparatus, and control method thereof
WO2017002328A1 (en) Data recording apparatus and method of controlling the same, and image capture apparatus
JP2008193530A (ja) 画像記録装置、画像記録方法、及びプログラム
JP5156704B2 (ja) 画像符号化装置、画像符号化方法、集積回路及びカメラ
CN107079131B (zh) 图像处理设备和图像处理方法
TW202015403A (zh) 視訊編碼和解碼
JP6929044B2 (ja) 撮像装置、撮像装置の制御方法、及び、プログラム
CN107079130B (zh) 图像处理设备和图像处理方法
JP2001333430A (ja) 画像処理装置、方法、及びコンピュータ読み取り可能な記憶媒体
JP7148236B2 (ja) 符号化装置及びその制御方法及びプログラム
JP2019075638A (ja) 画像処理装置
JP2022082596A (ja) 画像復号化装置、画像復号化方法及び画像復号化プログラム
US8953055B2 (en) Image pickup apparatus
JP6366268B2 (ja) 撮像装置及びその制御方法
JP2017103753A (ja) 撮像装置および記録方法
JP2021118403A (ja) 画像処理装置、その制御方法、プログラム並びに画像処理システム
JP2020057898A (ja) 画像符号化装置
JP7076983B2 (ja) 符号化装置、画像処理装置及び画像処理方法
JP2015119403A (ja) 画像記録装置、画像記録方法およびプログラム並びに撮像装置
JP4164268B2 (ja) 符号化装置、符号化方法、プログラム、記憶媒体
JP2011023928A (ja) 撮像装置、画像処理装置および画像処理方法
JP2018191136A (ja) 符号化装置、符号化方法およびプログラム
JP7213657B2 (ja) 撮像装置及びその制御方法及びプログラム
WO2020181540A1 (zh) 一种视频处理方法、装置、编码设备及解码设备

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201009

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201009

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220506

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220526

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220826

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220922

R151 Written notification of patent or utility model registration

Ref document number: 7148236

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151