JP2016103808A - 画像処理装置、画像処理方法及びプログラム - Google Patents
画像処理装置、画像処理方法及びプログラム Download PDFInfo
- Publication number
- JP2016103808A JP2016103808A JP2014242468A JP2014242468A JP2016103808A JP 2016103808 A JP2016103808 A JP 2016103808A JP 2014242468 A JP2014242468 A JP 2014242468A JP 2014242468 A JP2014242468 A JP 2014242468A JP 2016103808 A JP2016103808 A JP 2016103808A
- Authority
- JP
- Japan
- Prior art keywords
- image
- tile
- roi
- sequence
- tiles
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】一画面内に注目領域などの所定の領域が複数存在する場合に、これらの複数の所定の領域を用いた新たな動画を生成する方法を提供する。【解決手段】第1の画像と第2の画像を含む第1の動画を用いて第2の動画を生成する画像処理装置300であって、第1の画像に複数の所定の領域が含まれる場合に、当該複数の所定の領域と、第1の画像より第1の動画における再生順序が前である第2の画像に含まれる所定の領域との位置関係に関する情報を取得する取得手段301と、取得手段によって取得された位置関係に関する情報に基づいて、第1の画像の複数の所定の領域の第2の動画における再生順序を決定する決定手段303と、決定手段によって決定された第2の動画における再生順序に基づいて、第1の画像の複数の所定の領域を結合して、第2の動画を生成する生成手段304とを有する。【選択図】図3
Description
本発明は画像処理装置、画像処理方法及びプログラムに関し、特に所定の領域を用いて動画を生成する技術に関する。
動画像の圧縮記録の符号化方式として、H.264/MPEG−4 AVC(以下、H.264)及びHEVC(High Efficiency Video Coding)符号化方式(以下、HEVC)が知られている。HEVCでは、符号化及び復号の並列処理、及びエラー耐性の向上等の目的のために、1枚のピクチャ(フレーム)を符号化順に水平方向に分割するスライス分割と呼ばれる手法、及び1枚のピクチャを矩形領域に分割するタイル分割と呼ばれる手法等がある。さらに、HEVCでは、タイル分割を利用してビットストリーム(符号化データ)の連続するピクチャのうち、一部のタイルのみを独立して復号可能にするMotion−Constrained Tile Sets(以下、MCTS)と呼ばれる手法がある。このMCTSにおいては、ピクチャ内の1つ以上のタイルから構成されるタイルセットが定義され、符号化されたストリームからこのタイルセットだけを部分動画として再生することが可能である。
MCTS SEIメッセージが符号化ストリームに含まれていると、当該ビデオ・シーケンスにおいては以下の制約により符号化されていなければならない。
・ビデオ・シーケンス内の各ピクチャが同様のタイル分割を使用して符号化する。
・MCTSの符号化においては、参照ピクチャ上において当該タイルセット外の参照画素を必要とする動きベクトルを使用して符号化しない。
・ビデオ・シーケンス内の各ピクチャが同様のタイル分割を使用して符号化する。
・MCTSの符号化においては、参照ピクチャ上において当該タイルセット外の参照画素を必要とする動きベクトルを使用して符号化しない。
符号化ストリームの復号において、このMCTS SEIメッセージが符号化ストリームに含まれている場合、連続するピクチャからMCTSとして指定されたタイルセットのみを抽出して部分動画として高速に復号・再生することができる。MCTSを用いることで、例えばユーザの注目領域(所定の領域)であるROI(Region of interest)を含んだタイルのみを高速に復号することができる。
一方、監視カメラやハイエンドカメラを用いて広範囲を撮影した動画を、タブレット等の携帯端末で再生するユースケースがある。このようなユースケースにおいては、撮影される動画は水平4096画素×垂直2048画素(以下、4096×2048画素と表記する)のように高解像度であるのに対し、再生される動画は1024x726画素等の低い解像度となる。このように、撮影時の解像度に比べ、再生時の解像度が低いユースケースにおいては、カメラが撮影した画面全体を低解像度に変換して再生するモードと共に、注目領域等を、解像度を落とさずに動画の一部分のみを再生するモードを備えることが望ましい。このような、動画の一部分のみを再生するモードに関し、画像の一部のみを符号化して伝送する技術が知られている(特許文献1)。特許文献1には、ネットワークの負荷が高い場合に、複数に分割された領域のうち所定の領域についてのみ符号化して伝送する画像符号化装置に関する技術が記載されている。
しかしながら、従来技術では、一画面内において注目領域が複数存在する場合について考慮されていない。即ち、従来技術では、一画面内に注目領域などの所定の領域が複数存在する場合に、これらの複数の所定の領域を用いた動画を生成することができないという課題がある。
上記の課題を解決するため、本発明の画像処理装置は、以下の構成を有する。即ち、第1の画像と第2の画像を含む第1の動画を用いて第2の動画を生成する画像処理装置であって、第1の画像に複数の所定の領域が含まれる場合に、当該複数の所定の領域と、当該第1の画像より前記第1の動画における再生順序が前である第2の画像に含まれる所定の領域との位置関係に関する情報を取得する取得手段と、前記取得手段によって取得された位置関係に関する情報に基づいて、前記第1の画像の複数の所定の領域の前記第2の動画における再生順序を決定する決定手段と、前記決定手段によって決定された前記第2の動画における再生順序に基づいて、前記第1の画像の複数の所定の領域を結合して、前記第2の動画を生成する生成手段とを有することを特徴とする。
動画の所定の領域部分を用いた動画を生成することが可能である。これにより、特定の領域が複数存在する場合であっても、ユーザが注目すべき領域を視認しやすい動画を生成することができる。
以下、添付の図面を参照して、本発明を実施形態の一例に基づいて詳細に説明する。尚、以下の実施形態において示す構成は一例に過ぎず、図示された構成に限定されるものではない。
(実施形態1)
以下、本実施形態に係る画像処理装置について、図面を用いて説明する。
以下、本実施形態に係る画像処理装置について、図面を用いて説明する。
まず、本実施形態の画像処理装置300へ入力される動画像を符号化した符号化ストリーム(以下、画像処理装置300へ入力される符号化ストリームを入力ストリームと称す)の構成について、図1を参照して説明する。
図1(a)は、本実施形態における入力ストリームのフォーマットである。本実施形態において、入力ストリームはHEVCを用いて符号化されたストリームである。入力ストリーム先頭には、シーケンス全体の符号化に関わる情報が含まれたヘッダ情報であるシーケンス・パラメータ・セット(SPS:Sequence Parameter Set)が存在する。SPSには、復号可能な処理の組み合わせを示すプロファイル、復号可能なパラメータ値の範囲を示すレベル、フレームの水平・垂直解像度(水平画素数及び垂直画素数)、タイルの分割状態を示したタイル分割情報等が含まれる。
タイル分割情報には、フレーム内の水平方向のタイル数(以下、水平タイル数)及び垂直方向のタイル数(以下、垂直タイル数)に関する情報が含まれる。また、図1(a)において、フレーム内の水平タイル数に関する情報はNumTilesH、フレーム内の垂直タイル数に関する情報はNumTilesVである。尚、NumTilesH、NumTilesVは、それぞれnum_tile_columns_minus1、num_tile_rows_minus1と示される場合もある。ここで、num_tile_columns_minus1及びnum_tile_rows_minus1は、それぞれフレーム内の水平タイル数及び垂直タイル数から1を減じた数を示す。
また、タイル分割情報に含まれるフレーム内の水平タイル数及び垂直タイル数に関する情報に基づいて、フレームがタイル単位で分割されているか否かを判定することが可能である。そして、水平タイル数または垂直タイル数のうち少なくともいずれかが2以上の場合(タイル分割されいている場合)には、タイル分割情報にuniform_spacing_idcが挿入されている。ここで、uniform_spacing_idcは、フレーム内の各タイルの大きさ(サイズ)が等しいか否かを示す情報である。尚、本実施形態において、uniform_spacing_idc=1の場合にフレーム内の各タイルの大きさが等しいものとし、uniform_spacing_idc=0の場合にフレーム内の各タイルの大きさが等しくないものとする。
ここで、本実施形態におけるフレームのタイル分割の様子を図2(a)に示す。本実施形態において、フレーム内の水平タイル数が3、垂直タイル数が2、uniform_spacing_idc=1(フレーム内の各タイルの大きさが等しい)であるため、各フレームは図2(a)に示すように6個のタイルに分割されている。また、図2(a)に示すように、各タイルには、タイル番号としてタイル0、1、2、3、4、5が付されている。即ち、本実施形態においてフレーム内のN個のタイルのそれぞれのタイル番号は、フレームの左上端のタイルをタイル番号0として、ラスタ・スキャン順(左上⇒右上⇒左下⇒右下)に0、1、2、・・・、(N−1)と割り当てた番号とする。
また、図1(a)に示す入力ストリームには、SPSに続いて、エンハンスメント補足情報(SEI:Supplemental Enhancement Information)が含まれる。SEIは、符号化データ(入力ストリーム)を復号する場合に必要に応じて参照することが可能な補足情報である。尚、本実施形態におけるSEIは、説明を容易にするために、H.264のSEIと同様のものとする。SEIには、表示する時刻に関する表示時刻情報、MCTS(Motion−Constrained Tile Sets)に関するMCTS情報、及びROI(Region of Interest)を含むタイルに関するROIタイル情報等が含まれる。尚、ROIタイル情報は、ペイロード(データ本体)としてのデータである。また、本実施形態においてROIタイルは、注目領域(注目度の高い領域)及び特徴領域などの所定の領域を示す。そして、本実施形態においてROIタイルは、入力ストリームを生成する符号化装置(不図示)による符号化処理の前に、検知部(不図示)で検知(認識)された結果に基づいて決定(設定)されるものとする。例えば、本実施形態においてROIタイルは、監視カメラ等で撮影された動画の内に含まれる人物や物体(認識対象)を検知部(不図示)が検知し、認識対象が含まれる領域に基づいて決定される。尚、ROIタイルの決定方法はこれに限定されず、ユーザがタッチパネル等の指示部(不図示)を用いて指定した領域に基づいて決定されても構わない。
また、MCTS情報には、MCTSのタイルセットの水平画素数に関する情報、及び垂直画素数に関する情報が含まれており、これらの値は符号化時に決定される。尚、MCTSの各タイルセットの水平画素数及び垂直画素数は、符号化対象となるフレームの水平画素数及び垂直画素数に関する情報、タイルの水平画素数及び垂直画素数に関する情報、及び、以下のパラメータに基づいて決定される。尚、下記の各パラメータは、入力ストリームを生成する符号化装置によって、符号化時に決定される。
・num_tile_rects_in_set_minus1[i]
・top_left_tile_index[i][j]
・bottom_right_tile_index[i][j]
MCTSを用いることにより、上記の各パラメータに基づいて決定されるタイルセットの水平画素数及び垂直画素数に対応する部分動画を、MCTSを用いずに全体動画(全タイル)を復号及び解析する場合よりも、高速に復号及び解析することが可能である。
・num_tile_rects_in_set_minus1[i]
・top_left_tile_index[i][j]
・bottom_right_tile_index[i][j]
MCTSを用いることにより、上記の各パラメータに基づいて決定されるタイルセットの水平画素数及び垂直画素数に対応する部分動画を、MCTSを用いずに全体動画(全タイル)を復号及び解析する場合よりも、高速に復号及び解析することが可能である。
また、ROIタイル情報の先頭には、ペイロードの内容がROIタイル情報であることを示すペイロード識別情報が挿入されている。ここで、ペイロード識別情報が1である場合にペイロードの内容がROIであり、ペイロード識別情報が0である場合にペイロードの内容がROIでないことを示すようにしてもよい。
さらに、ROIタイル情報には、ペイロード識別情報に続いて、ペイロード・データサイズ、及び、ROIタイル情報のデータ本体であるフレーム内の各ROIタイルの座標(水平位置及び垂直位置)に関する情報が含まれる。
ここで、本実施形態におけるフレームの各タイルの座標(以下、タイル座標)を、図2(b)に示す。例えば、図2(a)のタイル0に対応するタイル座標は図2(b)における(0,0)、タイル1に対応するタイル座標は(1,0)、タイル2に対応するタイル座標は(2,0)となる。また、本実施形態においてROIタイルは、図2(a)のタイル2(タイル座標(1,0))及びタイル4(タイル座標(1,1))とする。この場合、入力ストリームは図1(b)に示すように、ROIタイル情報のデータ本体である各ROIタイルの座標に関する情報として、各ROIタイル(タイル2及びタイル4)の座標に対応する水平位置及び垂直位置が挿入されている構成となる。
尚、本実施形態においてROIタイルの水平位置及び垂直位置は、フレーム内の水平タイル数及び垂直タイル数を表現可能なバイト数で表現される。図1(b)の例において、水平位置及び垂直位置はデータサイズが1バイトのペイロードであり、タイル数×2バイトを示す情報がROIタイル情報のペイロード・データサイズとして挿入されている。尚、水平位置及び垂直位置のデータサイズはこれに限定されず、各タイル番号のデータサイズをビット単位で表しても構わないし、プロファイルやレベルに基づいて予め定められる固定のデータサイズとしても構わない。
また、図1(a)に示す入力ストリームには、SEIに続いて、ピクチャ・パラメータ・セット(PPS:Picture Parameter Set)、及びフレーム内の各タイルの符号化データが多重化されている。ここで、PPSは、ピクチャ(フレーム)の符号化に関わる情報を含むヘッダ情報である。
次に、本実施形態における画像処理装置の構成について図3を用いて説明する。図3は、本実施形態における画像処理装置300の各処理部を示す機能ブロック図である。
図3における全体制御部306は、画像処理装置300内の各処理ブロックの制御、及び各処理ブロック間のパラメータ伝達を行う。尚、図3において、全体制御部306と画像処理装置300内の各処理ブロックとの間の結線を省略している。そして、全体制御部306は画像処理装置300内の各処理ブロックの制御、及び各処理ブロック間のパラメータの読み書きを、パラメータ信号線またはレジスタバスの少なくともいずれかを通じて行うことが可能である。また、本実施形態において、図3の全体制御部306は、画像処理装置300内に設置されているが、これに限定されない。即ち、全体制御部306は、当該画像処理装置300外に設置され、当該画像処理装置300内の各処理部の制御、及び処理間のパラメータの読み書きを、パラメータ信号線またはレジスタバスの少なくともいずれかを通じて行ってもよい。
取得部301は、外部から画像処理装置300に入力された入力ストリームに対して、ROIタイルが存在するか否かに関する情報を取得する。即ち、本実施形態において取得部301は、図1(a)に示す入力ストリームのSEIに含まれる情報に基づいて、入力ストリーム内にROIタイル存在するか否かを解析する。尚、本実施形態において、取得部301は、画像処理装置300の内部の他の処理部または外部の処理部が入力ストリームを解析した結果に基づいて、入力ストリームにROIタイルが存在するか否かに関する情報を取得しても構わない。
セレクタ部302は、取得部301で取得されたROIタイルが存在するか否かに関する情報に基づいて、入力ストリームのうちROIタイルと判定されたタイルのみを抽出(選択)する。そして、セレクタ部302は、抽出したROIタイルを保持し、それ以外のタイルをダイジェストムービー用の出力ストリームとしては用いない。尚、本実施形態においてセレクタ部302は、ROIタイルを保持し、ROIタイル以外のタイルを破棄するが、これに限定されない。即ち、セレクタ部302が、抽出したROIタイルを画像処理装置300内の他の処理部や記録部(不図示)に記録するよう制御しても構わない。また、画像処理装置300内の記録部(不図示)が、入力ストリームに含まれる全タイルを一時的に保存して、セレクタ部302によって抽出されたROIタイルに関する情報に基づいて所定時間後にROIタイル以外のタイルを破棄する構成でも構わない。
算出部305は、図1に示す入力ストリームのROIタイル情報に含まれるROIタイルの水平位置及び垂直位置に関する情報に基づいて、セレクタ部302によって抽出された複数のROIタイル間の距離(位置関係に関する情報)を算出する。尚、複数のROIタイル間の距離の算出方法についての詳細は、後述する。
決定部303は、セレクタ部302で抽出されたROIタイルの出力順序(ダイジェストムービーにおける再生順序)を決定する。そして、決定部303は、決定した出力順序に基づいて、入力ストリームに含まれるROIタイルを並び替える。ここで、決定部303は、同一シーケンス内に複数のROIタイルが存在している場合に、シーケンス毎に時分割し、算出部305によって算出された位置関係に関する情報に基づいてタイルを並び替える。尚、同一シーケンス内で抽出されたROIタイルを並び替えてストリームを生成する方法(以下、ROI編集モードと称す)についての詳細は後述する。
結合部304は、決定部303で並び替えられたROIタイルを結合して編集し、ROIタイルを用いたダイジェストムービー用の符号化ストリーム(以下、ダイジェストムービー用の符号化ストリームを出力ストリームと称す)を生成する。尚、本実施形態においてダイジェストムービーとは、動画の1画面の所定の領域(部分領域)であるROIタイルをまとめた部分的な動画を示す。そして、結合部304は、ユーザの指示に基づいて、生成した符号化ストリームを出力ストリームとしてユーザの指示する画像処理装置300外部へ出力する。尚、結合部304によって生成された出力ストリームの出力先はこれに限定されず、画像処理装置300内部に表示部(不図示)を設け、この表示部(不図示)に符号化ストリームを出力するようにしても構わない。また、画像処理装置300の全体制御部306が、結合部304によって生成された符号化ストリームを、所定のタイミング毎に上述した出力先へ出力するよう制御しても構わない。
次に、本実施形態の画像処理装置300において、出力ストリームを生成する方法としてROI編集モードを用いる場合の処理について、図4のフローチャートを用いて説明する。尚、本実施形態において編集対象となる入力ストリームは、監視カメラ等で撮影された動画の複数のシーケンスとする。また、各1シーケンス分のストリームは、一定の期間単位で撮影されたものとする。
まず、ユーザによる指示に基づいてROI編集モードが開始されると、ステップS401において取得部301は、入力ストリームの処理対象のシーケンス(現シーケンス)に対応する符号化ストリームの中にROIタイルが存在しているか否かを判定する。そして、ステップS401においてROIタイルが存在していない場合(ステップS401においてNO)は、ステップS402の処理に進む。ステップS402においてセレクタ部302は入力ストリーム内の全てのタイルを破棄して、さらにステップS408の処理に進む。また、ROIタイルの有無に関する解析は、符号化前にサーバー(不図示)等によって行われ、符号化装置(不図示)が解析結果であるROIタイルの有無に関する情報を入力ストリームに挿入する。取得部301は、このように入力ストリームに挿入されたROIタイルの有無に関する情報に基づいて、ROIタイルの有無を判定することができる。
ステップS401において、処理対象のシーケンスに対応する符号化ストリーム内にROIタイルが存在している場合(ステップS401においてYES)は、ステップS403の処理に進む。ステップS403においてセレクタ部302は、ROIタイルが含まれている座標(領域)に対応するタイルの符号化データのみ抽出して、1シーケンス(処理対象のシーケンス)分を保持する。尚、セレクタ部302は、最初にROIタイルが存在したフレームを基にして、処理対象のシーケンス内のROIタイルを1シーケンス分全て保持する。また、セレクタ部302は、ROIタイルのフレームにおける位置に関する情報を、図1及び図2に示したように、タイル座標(X[i]、Y[i])として保持する。
次に、ステップS404において取得部301は、処理対象のシーケンスに対応する符号化ストリーム内にROIタイルが複数存在するか否かの判定を行う。ステップS404において処理対象のシーケンス内にROIタイルが複数存在しない場合(ステップS404においてNO)は、ステップS407の処理に進む。一方、ステップS404において処理対象のシーケンス内にROIタイルが複数存在する場合(ステップS404においてYES)は、ステップS405の処理に進む。
ステップS405において算出部305は、処理対象のシーケンス内のROIタイルと、処理対象のシーケンスより前に処理されたシーケンスにおいて存在したROIタイルとの位置関係に関する情報を算出する。尚、算出部305は、図1に示す入力ストリームのROIタイル情報に含まれるROIタイルの水平位置及び垂直位置に関する情報に基づいて、各ROIタイルの位置(座標)を取得することができる。
さらに、ステップS406において決定部303は、ステップS405において算出された各シーケンスのROIタイル間の位置関係に関する情報に基づいて、各ROIタイルを用いてダイジェストムービーにおける出力順序(再生順序)を決定する。そして、決定部303は、決定した順序に基づいて、各ROIタイルを並び替える。ここで、本実施形態において決定部303は、各シーケンスの1画面(1フレーム)におけるROIタイル間の距離が空間的に近いROIタイルが先に並ぶように順序(再生順序)を決定する。
以下、処理対象のシーケンスより再生順序が前のシーケンスにおけるROIタイルと、処理対象のシーケンスにおけるROIタイルとの距離の算出方法、及びROIタイルの出力順序の決定方法についての詳細を説明する。ここで、前のシーケンスにおけるROIタイルと、処理対象のシーケンスにおけるROIタイルとの距離は、次のことを意味する。即ち、前記距離は、前のシーケンスにおけるROIタイルに対応する処理対象のシーケンスにおける領域(タイル)の位置と、処理対象のシーケンスにおけるROIタイルとの位置との間の距離を示す。まず、各シーケンスのROIタイル間の距離Dは、式1を用いて算出することができる。
上記の式1において、X[i]及びY[i]は処理対象のシーケンス内に含まれるROIタイルのX座標及びY座標を表している。また、X[0]及びY[0]は処理対象のシーケンスより前のシーケンス内に含まれるROIタイルのX座標及びY座標を表している。上記の式1を用いてDを算出し、処理対象のシーケンス内のROIタイルのうち、距離Dがより小さい値になったROIタイルを空間的に近いROIタイルと判定して、距離Dがより大きい値になったROIタイルよりも優先的に(早い順序に)並び替える。
尚、各シーケンスのROIタイル間の距離Dの算出方法について上術の方法に限定されない。例えば、|X[i]−X[0]|及び|Y[i]−Y[0]|がそれぞれ0であるか否かを判定し、どちらの算出結果も0になれば距離D=0である(同じ位置にある)とし、どちらかの算出結果が0でなければ、式1を用いて距離Dを算出しても構わない。このように|X[i]−X[0]|及び|Y[i]−Y[0]|がそれぞれ0であるか否かを判定することにより、各シーケンスのROIタイルが同じ位置に存在する場合に、式1を計算する必要がなく、計算処理の負荷が軽減される。
また、処理対象のシーケンスにおいて複数のROIタイルが存在している場合であって、上記の方法により前のシーケンスにおけるROIタイルとの距離の算出結果が同一の距離であった場合、次のように順序を決定しても構わない。例えば、横方向の距離(即ち|X[i]−X[0]|)と、縦方向の距離(即ち|Y[i]−Y[0]|)とのうち、どちらの順序を先にするかを示す優先度に応じて、各ROIタイルの順序を決定しても構わない。ここで、横方向と縦方向のどちらの方向を優先にするのかについては、ユーザにより任意に設定し、設定された情報に基づいて全体制御部306が決定部303における並び替え処理を制御するようにしても構わない。
次に、本実施形態の画像処理装置300において、ROIタイルを並び替える様子を、図5を用いて説明する。図5に示すように、シーケンス1においては、ROIタイルとして認識されたタイルの座標は(2,0)のみである。即ち、画像処理装置300のセレクタ部302は、ROIタイルとして認識されたタイル(タイル座標(2,0))の符号化データのみを出力ストリームに挿入するために保持し、他のタイルの符号化データを破棄する。ここで、シーケンス1は、入力ストリームのうち1番目のシーケンスであるため、シーケンス1においてROIタイルとして認識されたタイル(タイル座標(2,0))の符号化データは、出力ストリームの先頭の符号化データとなる。
シーケンス2においては、ROIタイルとして認識されたタイルがないため、セレクタ部302は、シーケンス2における全てのタイルを破棄し、出力ストリームにシーケンス2における符号化データを追加しない。
シーケンス3においては、ROIタイルとして認識されたタイルの座標は(0,1)のみであるため、セレクタ部302は、ROIタイルとして認識されたタイル(タイル座標(0,1))の符号化データのみを出力ストリームに挿入するために保持する。そして、セレクタ部302は、他のタイルの符号化データを破棄する。ここで、シーケンス3においてROIタイルは1つしかないため、シーケンス1におけるROIタイルとシーケンス3におけるROIタイルの間の距離を算出する必要がない。即ち、シーケンス3より前のシーケンスにおけるROIタイルの位置に関わらず、決定部303は、シーケンス3においてROIタイルとして認識されたタイル(タイル座標(0,1))の符号化データを出力ストリームに追加する。これにより、本実施形態の図5に示す例において、シーケンス3におけるROIタイルの符号化データの順序は、シーケンス1におけるROIタイルの符号化データの次となる。
シーケンス4においては、シーケンス2と同様に、ROIタイルとして認識されたタイルがなかいため、決定部303は、シーケンス4における全てのタイルは破棄し、出力ストリームにシーケンス4における符号化データを追加しない。
シーケンス5においては、ROIタイルとして認識されたタイルの座標は(2,0)及び(1,1)である。シーケンス5のようにROIタイルが複数存在する場合に、決定部303は次のような処理を行う。即ち決定部303は、シーケンス5のROIタイル1(タイル座標(2,0))及びROIタイル2(タイル座標(1,1))と、前のシーケンス(本実施形態の図5の場合はシーケンス3)のROIタイル(タイル座標(0,1))との距離をそれぞれ算出する。
まず、算出部305は、シーケンス5のROIタイル1(タイル座標(2,0))と、シーケンス3のROIタイル(タイル座標(0,1))との距離(距離D1)に関し、式2を用いて算出する。尚、|X[i]−X[0]|及び|Y[i]−Y[0]|のどちらも0でないことから、シーケンス5のROIタイル1とシーケンス3のROIタイルとは同じ位置に存在しない。
また、算出部305は、シーケンス5のROIタイル2(タイル座標(1,1))と、シーケンス3のROIタイル(タイル座標(0,1))との距離(距離D2)に関し、式3を用いて算出する。尚、|Y[i]−Y[0]|は0であるが、|X[i]−X[0]|は0でないことから、シーケンス5のROIタイル2とシーケンス3のROIタイルとは同じ位置に存在しない。
距離D2=|X[i]−X[0]|+|Y[i]−Y[0]|
=|1−0|+|1−1|
=1 (式3)
上記の式2及び式3に示すように、算出部305は、距離D1及び距離D2を算出することができる。そして、決定部303は、算出部305による算出結果に基づいて、距離D2の方が距離D1よりも小さいと判定する。即ち、決定部303は、シーケンス5におけるROIタイル1(タイル座標(2,0))よりもROIタイル2(タイル座標(1,1))の方が、前のシーケンス(シーケンス3)におけるROIタイル(タイル座標(0,1))からの距離が近いと判定する。よって、決定部303は、出力ストリームにおいて、シーケンス5のROIタイル2(タイル座標(1,1))の符号化データの方が、ROIタイル1(タイル座標(2,0))の符号化データよりも先の順序になるように、出力順序を決定する。即ち、本実施形態の図5に示す例において、シーケンス5におけるROIタイル2(タイル座標(1,1))の符号化データの順序は、シーケンス3におけるROIタイルの符号化データの次となる。さらに、シーケンス5におけるROIタイル1(タイル座標(2,0))の符号化データの順序は、シーケンス5におけるROIタイル2(タイル座標(1,1))の符号化データの次となる。
距離D2=|X[i]−X[0]|+|Y[i]−Y[0]|
=|1−0|+|1−1|
=1 (式3)
上記の式2及び式3に示すように、算出部305は、距離D1及び距離D2を算出することができる。そして、決定部303は、算出部305による算出結果に基づいて、距離D2の方が距離D1よりも小さいと判定する。即ち、決定部303は、シーケンス5におけるROIタイル1(タイル座標(2,0))よりもROIタイル2(タイル座標(1,1))の方が、前のシーケンス(シーケンス3)におけるROIタイル(タイル座標(0,1))からの距離が近いと判定する。よって、決定部303は、出力ストリームにおいて、シーケンス5のROIタイル2(タイル座標(1,1))の符号化データの方が、ROIタイル1(タイル座標(2,0))の符号化データよりも先の順序になるように、出力順序を決定する。即ち、本実施形態の図5に示す例において、シーケンス5におけるROIタイル2(タイル座標(1,1))の符号化データの順序は、シーケンス3におけるROIタイルの符号化データの次となる。さらに、シーケンス5におけるROIタイル1(タイル座標(2,0))の符号化データの順序は、シーケンス5におけるROIタイル2(タイル座標(1,1))の符号化データの次となる。
ここで、本実施形態において画像処理装置300により生成された出力ストリームのうちシーケンス5に対応するストリームを図6(a)に示す。図6(a)に示すように、シーケンス5に対応する出力ストリームにおいてタイル座標(1,1)の符号化データは、タイル座標(2,0)の符号化データよりも先の順序で並べられている。これは上述したように、前のシーケンス(シーケンス3)のROIタイル(0,1)との間の距離が、タイル座標(1,1)のROIタイルの方が、タイル座標(2,0)のROIタイルよりも近い(小さい)ことに基づいて順序が決定されるためである。
また、図6(a)において斜線で示したブロックに関しては、図1において斜線で示したブロックから適宜変更する必要がある。即ち、図6のSPSにおけるpic_width_in_luma_samples、pic_height_in_luma_samplesは、設定されたROIタイルのサイズに基づいて修正される。これにより、フレームサイズを変更する(タイルサイズをフレームサイズとして設定する)ことができる。また、タイル分割情報を示したNumTilesH、及びNumTilesVも必要に応じて変更する。また、スライス・セグメント・ヘッダにおけるタイル分割されている符号化データへ直接アクセスするためのポインタ情報(entry_point_offset_minus1)を必要に応じて変更する。さらに、PPSにおけるtiles_enable_flag、スライス・セグメント・ヘッダにおけるfirst_slice_segment_in_pic_flag等を必要に応じて変更する。
また、本実施形態において画像処理装置300により生成された出力ストリームの一例を図6(b)に示す。図6(b)に示すように、ROIタイルが含まれる各シーケンスに対応して符号化データが挿入される。尚、各シーケンスに対応する符号化データの間に、それぞれSPS、PPS、スライス・セグメント・ヘッダが挿入されているがこれに限定されない。例えば、前のシーケンスと変更する情報がなければ、省略しても構わない。
以下、図4の説明に戻る。ステップS407において結合部304は、ステップS406において決定部303によって決定された順位に基づいて、ROIタイルを結合する。次に、ステップS408において全体制御部306は、入力ストリーム内の全てのシーケンスにおけるROIタイルを結合済みか否かを判定する。ステップS408において、入力ストリームにおける全てのシーケンスの処理が完了していないと判定した場合(ステップS408においてNO)は、ステップS401へ戻り、次のシーケンスの処理に移行する。一方、ステップS408において、入力ストリームにおける全てのシーケンスの処理が完了していた場合(ステップS408においてYES)は、ROI編集モードを用いた出力ストリームの生成処理を終了する。
本実施形態により、動画の所定の領域部分を用いた動画を生成することが可能である。これにより、特定の領域が複数存在する場合であっても、ユーザが注目すべき領域を視認しやすい動画を生成することができる。また、全ての領域を用いた動画よりも少ない容量で、特定の領域に部分を用いた動画を生成することができる。また、動画の全ての領域のストリームを再生装置へ送信する場合と比較して、処理負荷を軽減させ処理時間を減少させることができる。また、再生装置の処理性能が低い場合であっても、再生可能な出力ストリームを生成することができる。即ち、動画の全ての領域のストリームを復号して再生する場合と比較して、本実施形態で生成されるストリームのように動画の一部の領域のストリームを復号して再生する場合の方が、復号及び再生に係る処理負荷を軽減することができる。
また、上述したように本実施形態では、同一シーケンス内で抽出されたROIタイルを、前のシーケンスのROIタイルの位置からの距離が近い順に並び替えて、ダイジェストムービー用の出力ストリームを生成する。前のシーケンスのROIタイルの位置からの距離が近いROIタイルは、距離が遠いROIタイルと比較して、前のシーケンスのROIタイル内に含まれるオブジェクトと同じオブジェクトを含んでいる可能性が高い。即ち、現シーケンスにおいて距離が近いROIタイルを距離が遠いROIタイルより先の順序にすることにより、前のシーケンスのROIタイル内に含まれるオブジェクトを、前のシーケンスと現シーケンスとで連続して再生することができる。
尚、本実施形態において、算出部305は複数のROIタイル間の距離を算出し、決定部303は算出部305で算出された距離に基づいてROIタイルの出力順序を決定するが、これに限定されない。即ち、決定部303が複数のROIタイル間の距離を算出しても構わないし、画像処理装置300の他の処理部または画像処理装置300外部の処理部(不図示)が複数のROIタイル間の距離を算出して決定部303が算出結果を取得する構成でも構わない。
(実施形態2)
上述した実施形態1では、ROI編集モードを用いた出力ストリームの生成処理について説明した。本実施形態では、複数シーケンスに跨って空間的に同じ位置のタイルデータがROIタイルである場合に、該同じ位置のタイルデータが連続して再生されるように並び替えてストリームを生成する方法(以下、同一ROI編集モードと称す)が行われる。尚、本実施形態に係る画像処理装置の構成に関しては、実施形態1と同じく図3の構成を利用できるため、ここでの説明を省略する。
上述した実施形態1では、ROI編集モードを用いた出力ストリームの生成処理について説明した。本実施形態では、複数シーケンスに跨って空間的に同じ位置のタイルデータがROIタイルである場合に、該同じ位置のタイルデータが連続して再生されるように並び替えてストリームを生成する方法(以下、同一ROI編集モードと称す)が行われる。尚、本実施形態に係る画像処理装置の構成に関しては、実施形態1と同じく図3の構成を利用できるため、ここでの説明を省略する。
本実施形態の画像処理装置300において、出力ストリームを生成する方法として同一ROI編集モードを用いる場合の処理について、図7のフローチャートを用いて説明する。尚、図7において実施形態1における図4と同じ処理を行うものは、同じ符号を付して説明を省略する。また、本実施形態において編集対象となる入力ストリームには、実施形態1と同様に、MCTS情報及びタイルROIタイル情報が含まれているものとする。
ユーザによる指示に基づいて同一ROI編集モードが開始されると、画像処理装置300は図7の処理を行う。本実施形態のステップS404において処理対象のシーケンス内にROIタイルが複数存在する場合(ステップS704においてYES)は、ステップS705の処理に進む。ステップS705において取得部301は、処理対象のシーケンス内に、前のシーケンスのROIタイルと同じ位置(座標)のROIタイルが存在するか否かを判定する。尚、処理対象のシーケンス内のROIタイルであって、前のシーケンスのROIタイルと同じ位置のROIタイルについては、以下、同一ROIタイルと称す。
ここで、ステップS705において取得部301は、処理対象のシーケンス内に同一ROIタイルが存在するか否かの判定を、以下のように式4を用いて行う。
S=|(X[i]−X[0])|+|(Y[i]−Y[0])| (式4)
上記の式4において、X[i]及びY[i]は、式1と同様に、処理対象のシーケンス内に含まれるROIタイルのX座標及びY座標を表している。また、X[0]及びY[0]も、式1と同様に、処理対象のシーケンスより前のシーケンス内に含まれるROIタイルのX座標及びY座標を表している。さらに、式4を用いて算出されるSは、処理対象のシーケンス内のROIタイルと、前のシーケンスのROIタイルとが同じ位置に存在しているかどうかを表し、S=0である場合は、同じ位置にROIタイルが存在していることを示す。一方、S=0でない(S≠0)場合には、同じ位置にROIタイルが存在しないことを示す。即ち、ステップS705において算出部305は、式4を用いてSを算出し、取得部301は算出されたSを用いることにより、処理対象のシーケンス内のROIタイルが前のシーケンス内のROIタイルと同じ位置に存在するか否かを判定することができる。
S=|(X[i]−X[0])|+|(Y[i]−Y[0])| (式4)
上記の式4において、X[i]及びY[i]は、式1と同様に、処理対象のシーケンス内に含まれるROIタイルのX座標及びY座標を表している。また、X[0]及びY[0]も、式1と同様に、処理対象のシーケンスより前のシーケンス内に含まれるROIタイルのX座標及びY座標を表している。さらに、式4を用いて算出されるSは、処理対象のシーケンス内のROIタイルと、前のシーケンスのROIタイルとが同じ位置に存在しているかどうかを表し、S=0である場合は、同じ位置にROIタイルが存在していることを示す。一方、S=0でない(S≠0)場合には、同じ位置にROIタイルが存在しないことを示す。即ち、ステップS705において算出部305は、式4を用いてSを算出し、取得部301は算出されたSを用いることにより、処理対象のシーケンス内のROIタイルが前のシーケンス内のROIタイルと同じ位置に存在するか否かを判定することができる。
ステップS705において処理対象のシーケンス内に同一ROIタイルが存在しない(S≠0)場合(ステップS705においてNO)は、ステップS707の処理へ進む。一方、ステップS705において処理対象のシーケンス内に同一ROIタイルが存在する(S=0)場合(ステップS705においてYES)は、ステップS706の処理へ進む。ステップS706において決定部303は、処理対象のシーケンス内の複数のROIタイルのうち、同一ROIタイルが他のROIタイルよりも先に並ぶように順序を決定する。そして、ステップS706の処理を完了すると、ステップS707の処理へ進む。ここで、本実施形態において決定部303は、処理対象のシーケンス内に同一ROIタイルが一つだけある場合には、当該一つの同一ROIタイルの符号化データを、処理対象のシーケンスに対応する出力シーケンスの符号化データの先頭に並べる。また、決定部303は、処理対象のシーケンス内に同一ROIタイルが複数ある場合には、これらの同一ROIタイルをタイル番号に基づいて並べる。例えば、複数の同一ROIタイルを、タイル番号の小さい(若い)順(本実施形態においては、図2に示すようにタイル0、1、2、3、4、5の順)に先の順序になるように並べても構わない。
ステップS707において決定部303は、処理対象のシーケンス内の複数のROIタイルを、タイル番号の小さい順番からROIタイルを並べる。ステップS707の処理を完了すると、ステップS407へ進むが、実施形態1における図4と同様なので説明を省略する。さらに、ステップS408において、入力ストリームにおける全てのシーケンスの処理が完了した場合(ステップS408においてYES)は、同一ROI編集モードを用いた出力ストリームの生成処理を終了する。
次に、本実施形態の画像処理装置300において、ROIタイルを並び替える様子を、図8を用いて説明する。図8に示すように、シーケンス1においてはROIタイルとして認識されたタイルがないため、セレクタ部302はシーケンス1における全てのタイルを破棄し、出力ストリームは作成しない(出力ストリームにシーケンス1における符号化データを挿入しない)。
シーケンス2においては、ROIタイルとして認識されたタイルの座標は(2,0)及び(0,1)である。シーケンス2より前のシーケンス(シーケンス1)ではROIタイルがないため、シーケンス2に含まれる各ROIタイルをフレーム内の左上のタイルから順番に並べ替える。即ち、図8におけるシーケンス2では、ROIタイル3(タイル座標(2,0))の符号化データの方が、ROIタイル4(タイル座標(0,1))の符号化データよりも先の順序になるように、決定部303は出力順序を決定する。尚、本実施形態においてセレクタ部302は、シーケンス2内のROIタイルでない他のタイルの符号化データを破棄する。
シーケンス3においては、ROIタイルとして認識されたタイルの座標は(2,0)及び(0,1)である。即ち、シーケンス3において複数のROIタイルが存在し、且つ、シーケンス3より前のシーケンスにおいてROIタイルが存在するため、取得部301は、シーケンス3内に、同一ROIタイルがあるか否かを判定する。ここで、シーケンス2にはROIタイル3(タイル座標(2,0))とROIタイル4(タイル座標(0,1))とが存在するため、これらのROIタイルと、シーケンス3内の各ROIタイルとが、同じ位置に存在するか否かを、上述の式4に基づいて判定する。例えば、シーケンス3におけるROIタイル5(タイル座標(2,0))が、前シーケンス(シーケンス2)におけるROIタイル3(タイル座標(2,0))と同じ位置に存在するか否かは、下記の式5を用いることにより判定できる。
S=|(X[i]−X[0])|+|(Y[i]−Y[0])|
=|(2−2)|+|(0−0)|
=0 (式5)
上記の式5に示すように、S=0であるため、シーケンス3におけるROIタイル5(タイル座標(2,0))が、シーケンス2におけるROIタイル3(タイル座標(2,0))と同じ位置に存在していることがわかる。この結果から、決定部303は、シーケンス3におけるROIタイル5を、シーケンス2におけるROIタイル3の次の順番になるように、順序を決定し、並び替える。
S=|(X[i]−X[0])|+|(Y[i]−Y[0])|
=|(2−2)|+|(0−0)|
=0 (式5)
上記の式5に示すように、S=0であるため、シーケンス3におけるROIタイル5(タイル座標(2,0))が、シーケンス2におけるROIタイル3(タイル座標(2,0))と同じ位置に存在していることがわかる。この結果から、決定部303は、シーケンス3におけるROIタイル5を、シーケンス2におけるROIタイル3の次の順番になるように、順序を決定し、並び替える。
同様に、シーケンス3におけるROIタイル6(タイル座標(0,1))が、シーケンス2におけるROIタイル4(タイル座標(0,1))と同じ位置に存在するか否かを、下記の式6を用いることにより判定できる。
S=|(X[i]−X[0])|+|(Y[i]−Y[0])|
=|(0−0)|+|(1−1)|
=0 (式6)
上記の式6に示すように、S=0であるため、シーケンス3におけるROIタイル6(タイル座標(0,1))が、シーケンス2におけるROIタイル4(タイル座標(0,1))と同じ位置に存在していることがわかる。この結果から、決定部303は、シーケンス3におけるROIタイル6を、シーケンス2におけるROIタイル4の次の順番になるように、順序を決定し、並び替える。
S=|(X[i]−X[0])|+|(Y[i]−Y[0])|
=|(0−0)|+|(1−1)|
=0 (式6)
上記の式6に示すように、S=0であるため、シーケンス3におけるROIタイル6(タイル座標(0,1))が、シーケンス2におけるROIタイル4(タイル座標(0,1))と同じ位置に存在していることがわかる。この結果から、決定部303は、シーケンス3におけるROIタイル6を、シーケンス2におけるROIタイル4の次の順番になるように、順序を決定し、並び替える。
上述したように、シーケンス3におけるROIタイルの順序を決定し、並び替えることができる。尚、本実施形態においてセレクタ部302は、シーケンス3内のROIタイルでない他のタイルの符号化データを破棄する。
また、本実施形態において画像処理装置300により生成された出力ストリームの一例を図6(c)に示す。図6(c)に示すように、上述の方法で決定された各シーケンスの各ROIタイルの順序に基づいて、各ROIタイルに対応する符号化データが挿入される。尚、図6(c)についても、各シーケンスに対応する符号化データの間に、それぞれSPS、PPS、スライス・セグメント・ヘッダが挿入されているがこれに限定されない。例えば、前のシーケンスと変更する情報がなければ、省略しても構わない。
本実施形態により、動画の所定の領域であるROIタイルを用いた動画を生成することが可能である。これにより、特定の領域が複数存在する場合であっても、ユーザが注目すべき領域を視認しやすい動画を生成することができる。また、全ての領域を用いた動画よりも少ない容量で、特定の領域に部分を用いた動画を生成することができる。また、動画の全ての領域のストリームを再生装置へ送信する場合と比較して、処理負荷を軽減させ処理時間を減少させることができる。また、再生装置の処理性能が低い場合であっても、再生可能な出力ストリームを生成することができる。即ち、動画の全ての領域のストリームを復号して再生する場合と比較して、本実施形態で生成されるストリームのように動画の一部の領域のストリームを復号して再生する場合の方が、復号及び再生に係る処理負荷を軽減することができる。
また、上述したように本実施形態では、同一シーケンス内で抽出されたROIタイルを、前のシーケンスのROIタイルの位置と同じ位置にあるROIタイルから順に並び替えて、ダイジェストムービー用の出力ストリームを生成する。現シーケンスにおいて前のシーケンスのROIタイルの位置と同じ位置にあるROIタイルは、前のシーケンスのROIタイル内に含まれるオブジェクトと同じオブジェクトを含んでいる可能性が高い。即ち、現シーケンスにおいて、前のシーケンスのROIタイルと同じ位置のROIタイルを優先した順序にすることにより、前のシーケンスのROIタイル内に含まれるオブジェクトを、前のシーケンスと現シーケンスとで連続して再生することができる。
尚、本実施形態において決定部303は、処理対象のシーケンス内に同一ROIタイルが複数ある場合に、これらの同一ROIタイルをタイル番号の小さい(若い)順に並べるが、これに限定されない。即ちタイル番号の大きい順に並べてもよいし、タイル番号以外の所定の条件(例えばユーザによる設定)に基づいて並べても構わない。
(実施形態3)
上述した各実施形態では、ROI編集モード及び同一ROI編集モードを用いた出力ストリームの生成処理について説明した。本実施形態では、1つのシーケンス内でROIタイルの位置が動的に変更される場合に、ROIタイルの位置が変更される毎にROIタイルのタイルデータを並び替えてストリームを生成する方法(以下、動的ROI編集モードと称す)が行われる。尚、本実施形態に係る画像処理装置の構成に関しては、実施形態1と同じく図3の構成を利用できるため、ここでの説明を省略する。
上述した各実施形態では、ROI編集モード及び同一ROI編集モードを用いた出力ストリームの生成処理について説明した。本実施形態では、1つのシーケンス内でROIタイルの位置が動的に変更される場合に、ROIタイルの位置が変更される毎にROIタイルのタイルデータを並び替えてストリームを生成する方法(以下、動的ROI編集モードと称す)が行われる。尚、本実施形態に係る画像処理装置の構成に関しては、実施形態1と同じく図3の構成を利用できるため、ここでの説明を省略する。
本実施形態の画像処理装置300において、出力ストリームを生成する方法として動的ROI編集モードを用いる場合の処理について、図9のフローチャートを用いて説明する。尚、図9において実施形態1における図4と同じ処理を行うものは、同じ符号を付して説明を省略する。また、本実施形態において編集対象となる入力ストリームには、実施形態1及び実施形態2と同様に、MCTS情報及びタイルROIタイル情報が含まれているものとする。
ユーザによる指示に基づいて動的ROI編集モードが開始されると、画像処理装置300は図9の処理を行う。本実施形態のステップS401においてROIタイルが存在している場合(ステップS401のにおいてYES)は、ステップS903へ進む。そして、ステップS903において取得部301は、入力ストリームに含まれるSEIに基づいて、1シーケンス内でROIタイルの座標に関する情報が変更されているか否かを判定する。尚、本実施形態において入力ストリームは、1シーケンス内の途中でROIタイルの座標が変更された場合、図11(a)に示すようにSEIが複数箇所に挿入されるものとする。このことから、本実施形態のステップS903において取得部301は、1シーケンス分の入力ストリームに、SEIが複数存在するか否かを判定する。
ステップS903において、1シーケンス内でROIタイルの座標が変更されていない(SEIが複数存在しない)場合(ステップS903においてNO)は、ステップS904の処理へ進む。ステップS904において画像処理装置300は、図4に示したROI編集モードへ移行し、ステップS403以降の処理を行う。ここで、ステップS904において画像処理装置300は、図4のROI編集モードに移行するとしているが、これに限定されない。例えば、図7に示した同一ROI編集モードへ以降しても構わない。即ち、ステップS904においてどのモードに移行するかは限定されず、ユーザによって設定されたモードへ移行することも可能である。
一方、ステップS903において1シーケンス内でROIタイルの座標が変更されている(SEI情報が複数存在する)場合(ステップS903においてYES)は、ステップS905の処理へ進む。ステップS905においてセレクタ部302は、入力ストリームのROIタイルの座標が変更される前における(次のSEIが挿入されるまでの間の)ROIタイルの出力順序を、ROIタイルのタイル番号に基づいて決定する。例えば、図11(a)に示す入力ストリームにおいて、まず、セレクタ部302は、最初のSEIが挿入された後から次のSEIが挿入されるまでの間のROIタイルの出力順序を決定する。ここで、本実施形態のステップS905においてセレクタ部302は、ROIタイルの出力順序をROIタイルの小さい(若い)順番に決定する。そして、ステップS905において決定部303は、セレクタ部302で決定された出力順序に基づいて、ROIタイルを並び替える。尚、セレクタ部302はROIタイル以外のタイルを破棄する。
ステップS906において全体制御部306は、1シーケンス分のROIタイルの並び替えが完了したか否かを判定する。ステップS906において1シーケンス分のROIタイルの並び替えが完了していない場合(ステップS906においてNO)は、ステップS905の処理へ戻る。そして、決定部303は、ROIタイルの座標が更に変更される前における(更に次のSEIが挿入されるまでの間の)ROIタイルの出力順序を、ROIタイルのタイル番号に基づいて決定する。尚、本実施形態において図11(a)に示す例では、ROIタイルの座標が変更されるのは1回である。即ち、2度目のステップS906においてセレクタ部302は、1度目にROIタイルの座標が変更された後(2つ目に挿入されたSEIの後)のROIタイルの出力順序を決定する。そして、決定部303は、セレクタ部302で決定された出力順序に基づいて、ROIタイルを並び替える。
一方、ステップS906において1シーケンス分のROIタイルの並び替えが完了した場合(ステップS906においてYES)は、ステップS408の処理へ進む。ステップS408において、入力ストリームにおける全てのシーケンスの処理が完了した場合(ステップS408においてYES)は、動的ROI編集モードを用いた出力ストリームの生成処理を終了する。
次に、本実施形態の画像処理装置300において、ROIタイルを並び替える様子を、図10及び図11を用いて説明する。まず、図10(a)に図示すように、1シーケンス内の途中でROIタイルの座標が変更される場合に、画像処理装置300に入力される入力ストリームを図11(a)に示す。図10(a)において、最初はROIタイルのタイル座標は(0,1)と(2,0)であるため、図11(a)に示すように、最初のSEIには、タイル座標(0,1)と(2,0)とが、ROIタイルのタイル座標を示す情報として含まれている。その後、途中でROIタイルのタイル座標が(0,1)と(1,0)に変更されたため、図11(a)に示すように、次の(2つ目の)SEIには、タイル座標(0,1)と(1,0)とが、ROIタイルのタイル座標を示す情報として含まれている。
そして、このような図11(a)に示す入力ストリームを入力した画像処理装置300は、上述した図9に示す動的ROI編集モードを用いて出力ストリームを生成する。ここで、本実施形態の画像処理装置300によって生成された出力ストリームを図11(b)に示す。まず、最初のSEIから次の(2つ目の)SEIが挿入されるまでの間のストリームについて、ROIタイルとして認識されたタイル座標(0,1)と(2,0)の符号化データを並び替える。ここで、セレクタ部302は、ラスタ・スキャン順(左上⇒右上⇒左下⇒右下)に付けられたタイル番号の小さい順番(この場合はタイル座標(2,0)の後にタイル座標(0,1)の順番)で、ROIタイルの順序を決定する。
さらに、2つ目のSEIが挿入された後のストリームについては、ROIタイルとして認識されたタイル座標(0,1)と(1,0)の符号化データを並び替える。ここで、セレクタ部302は、タイル番号の小さい順番(この場合はタイル座標(1,0)の後にタイル座標(0,1)の順番)で、ROIタイルの順序を決定する。
上述した動作により、本実施形態において画像処理装置300は、動的ROI編集モードを用いることにより、図11(b)に示すように、1ストリーム分の出力ストリームを生成することができる。そして、ダイジェストムービーとして再生される時には、図10(b)に図示されているような再生順序になる。
本実施形態により、動画の特定の領域であるROIタイルを用いた動画を生成することが可能である。これにより、特定の領域が複数存在する場合であっても、ユーザが注目すべき領域を視認しやすい動画を生成することができる。また、全ての領域を用いた動画よりも少ない容量で、特定の領域に部分を用いた動画を生成することができる。また、動画の全ての領域のストリームを再生装置へ送信する場合と比較して、処理負荷を軽減させ処理時間を減少させることができる。また、再生装置の処理性能が低い場合であっても、再生可能な出力ストリームを生成することができる。即ち、動画の全ての領域のストリームを復号して再生する場合と比較して、本実施形態で生成されるストリームのように動画の一部の領域のストリームを復号して再生する場合の方が、復号及び再生に係る処理負荷を軽減することができる。
また、上述したように本実施形態では、1シーケンス内でROIタイルの位置が動的に変更される場合に、ROIタイルの位置が変更される毎にROIタイルを並び替えて、ダイジェストムービー用の出力ストリームを生成する。即ち、1シーケンス内でROIタイルの位置が変更された場合であっても、ROIタイルを適切な順序で並べた出力ストリームを生成することができる。
尚、本実施形態において決定部303は、1シーケンス内でROIタイルの位置が変更される場合に、ROIタイルの位置が変更された後において、複数のROIタイルをタイル番号に基づいて出力順序を決定するが、これに限定されない。即ち、図10(c)に示すように、ROIタイルの位置が変更される前におけるROIタイルに含まれるオブジェクトと同じオブジェクトを含むROIタイルを連続して再生できるように並べても構わない。この場合、検出部(不図示)が動画内のオブジェクトを検出し、決定部303は検出された結果に基づいて、同じオブジェクトを含むROIタイルを連続に並べるよう出力順序を決定する。
また、本実施形態においてSEIはROIタイルの位置はGOP単位で変更可能であるが、これに限定されない。即ち、複数のGOP毎に変更しても構わないし、その他の単位で変更しても構わない。
(実施形態4)
図3に示した画像処理装置300の各処理部はハードウェアでもって構成しているものとして上記実施形態では説明した。しかし、これらの図に示した各処理部で行う処理をコンピュータプログラムでもって構成しても良い。以下、図12を用いて本実施形態について説明する。図12は、上記各実施形態に係る画像処理装置に適用可能なコンピュータのハードウェアの構成例を示すブロック図である。
図3に示した画像処理装置300の各処理部はハードウェアでもって構成しているものとして上記実施形態では説明した。しかし、これらの図に示した各処理部で行う処理をコンピュータプログラムでもって構成しても良い。以下、図12を用いて本実施形態について説明する。図12は、上記各実施形態に係る画像処理装置に適用可能なコンピュータのハードウェアの構成例を示すブロック図である。
CPU1201は、RAM1202やROM1203に格納されているコンピュータプログラムやデータを用いてコンピュータ全体の制御を行うと共に、上記各実施形態に係る画像処理システムが行うものとして上述した各処理を実行する。即ち、CPU1201は、図12に示した各処理部として機能することになる。
RAM1202は、外部記憶装置1206からロードされたコンピュータプログラムやデータ、I/F(インターフェース)1207を介して外部から取得したデータなどを一時的に記憶するためのエリアを有する。更に、RAM1202は、CPU1201が各種の処理を実行する際に用いるワークエリアを有する。即ち、RAM1202は、例えば、ピクチャメモリとして割り当てたり、その他の各種のエリアを適宜提供したりすることができる。
ROM1203には、本コンピュータの設定データや、ブートプログラムなどが格納されている。操作部1204は、キーボードやマウスなどにより構成されており、本コンピュータのユーザが操作することで、各種の指示をCPU1201に対して入力することができる。出力部1205は、CPU1201による処理結果を表示する。また出力部1205は例えば液晶ディスプレイで構成される。
外部記憶装置1206は、ハードディスクドライブ装置に代表される、大容量情報記憶装置である。外部記憶装置1206には、OS(オペレーティングシステム)や、図12に示した各部の機能をCPU1201に実現させるためのコンピュータプログラムが保存されている。更には、外部記憶装置1206には、処理対象としての各画像データが保存されていても良い。
外部記憶装置1206に保存されているコンピュータプログラムやデータは、CPU1201による制御に従って適宜、RAM1202にロードされ、CPU1201による処理対象となる。I/F1207には、LANやインターネット等のネットワーク、投影装置や表示装置などの他の機器を接続することができ、本コンピュータはこのI/F1207を介して様々な情報を取得したり、送出したりすることができる。1208は上述の各部を繋ぐバスである。
上述の構成からなる作動は前述のフローチャートで説明した処理をCPU1201が中心となってその制御を行う。
(その他の実施形態)
上述した各実施形態では、ROIタイルのみを用いてダイジェストムービー用の出力ストリームを生成したが、これに限定されない。即ち、ROIタイルの周囲のタイルを含めてダイジェストムービーを生成しても構わない。
上述した各実施形態では、ROIタイルのみを用いてダイジェストムービー用の出力ストリームを生成したが、これに限定されない。即ち、ROIタイルの周囲のタイルを含めてダイジェストムービーを生成しても構わない。
また、上述した各実施形態では、HEVCを用いて符号化された入力ストリームを用いたが、これに限定されず、所定の領域のみを処理可能なように符号化する種々の符号化方式を用いることができる。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
300 画像処理装置
301 取得部
302 セレクタ部
303 決定部
304 結合部
305 算出部
306 全体制御部
301 取得部
302 セレクタ部
303 決定部
304 結合部
305 算出部
306 全体制御部
Claims (7)
- 第1の画像と第2の画像を含む第1の動画を用いて第2の動画を生成する画像処理装置であって、
第1の画像に複数の所定の領域が含まれる場合に、当該複数の所定の領域と、当該第1の画像より前記第1の動画における再生順序が前である第2の画像に含まれる所定の領域との位置関係に関する情報を取得する取得手段と、
前記取得手段によって取得された位置関係に関する情報に基づいて、前記第1の画像の複数の所定の領域の前記第2の動画における再生順序を決定する決定手段と、
前記決定手段によって決定された前記第2の動画における再生順序に基づいて、前記第1の画像の複数の所定の領域を結合して、前記第2の動画を生成する生成手段と
を有することを特徴とする画像処理装置。 - 前記決定手段は、前記第1の画像に含まれる複数の所定の領域のうち、前記第2の画像に含まれる所定の領域と対応する領域との距離が短い所定の領域ほど先の順序になるように、前記第1の画像の所定の領域の順序を決定することを特徴とする請求項1に記載の画像処理装置。
- 前記決定手段は、前記第1の画像に含まれる複数の所定の領域のうち、前記第2の画像に含まれる所定の領域と対応する位置にある所定の領域を、前記第2の画像に含まれる所定の領域の次の順序になるように、前記第1の画像の所定の領域の順序を決定することを特徴とする請求項1または請求項2に記載の画像処理装置。
- 前記決定手段は、前記第1の画像に含まれる複数の所定の領域のうち、前記第2の画像に含まれる所定の領域と同じ位置にある所定の領域を、前記第2の画像に含まれる所定の領域と異なる位置にある所定の領域よりも先の順序になるように、前記第1の画像の所定の領域の順序を決定することを特徴とする請求項3に記載の画像処理装置。
- 前記決定手段は、前記第1の画像に含まれる複数の所定の領域のうち、前記第1の画像を含む第1のシーケンスより再生順序が前である第2のシーケンス内の前記第2の画像に含まれる所定の領域と対応する領域との距離が短い所定の領域ほど先の順序になるように、前記第1の画像の所定の領域の順序を決定することを特徴とする請求項2に記載の画像処理装置。
- 第1の画像と第2の画像を含む第1の動画を用いて第2の動画を生成する画像処理方法であって、
第1の画像に複数の所定の領域が含まれる場合に、当該複数の所定の領域と、当該第1の画像より前記第1の動画における再生順序が前である第2の画像に含まれる所定の領域との位置関係に関する情報を取得する取得工程と、
前記取得工程によって取得された位置関係に関する情報に基づいて、前記第1の画像の複数の所定の領域の前記第2の動画における再生順序を決定する決定工程と、
前記決定工程によって決定された前記第2の動画における再生順序に基づいて、前記第1の画像の複数の所定の領域を結合して、前記第2の動画を生成する生成工程と
を有することを特徴とする画像処理方法。 - コンピュータを、請求項1乃至請求項5のいずれか一項に記載の画像処理装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014242468A JP2016103808A (ja) | 2014-11-28 | 2014-11-28 | 画像処理装置、画像処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014242468A JP2016103808A (ja) | 2014-11-28 | 2014-11-28 | 画像処理装置、画像処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016103808A true JP2016103808A (ja) | 2016-06-02 |
Family
ID=56088078
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014242468A Pending JP2016103808A (ja) | 2014-11-28 | 2014-11-28 | 画像処理装置、画像処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016103808A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018123608A1 (ja) * | 2016-12-27 | 2018-07-05 | ソニー株式会社 | 画像処理装置および方法 |
WO2018225449A1 (ja) * | 2017-06-09 | 2018-12-13 | ソニーセミコンダクタソリューションズ株式会社 | 映像送信装置および映像受信装置 |
-
2014
- 2014-11-28 JP JP2014242468A patent/JP2016103808A/ja active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018123608A1 (ja) * | 2016-12-27 | 2018-07-05 | ソニー株式会社 | 画像処理装置および方法 |
CN110100442A (zh) * | 2016-12-27 | 2019-08-06 | 索尼公司 | 图像处理装置和方法 |
JPWO2018123608A1 (ja) * | 2016-12-27 | 2019-10-31 | ソニー株式会社 | 画像処理装置および方法 |
JP7052732B2 (ja) | 2016-12-27 | 2022-04-12 | ソニーグループ株式会社 | 画像処理装置および方法 |
CN110100442B (zh) * | 2016-12-27 | 2022-04-15 | 索尼公司 | 图像处理装置和方法 |
US11336909B2 (en) | 2016-12-27 | 2022-05-17 | Sony Corporation | Image processing apparatus and method |
WO2018225449A1 (ja) * | 2017-06-09 | 2018-12-13 | ソニーセミコンダクタソリューションズ株式会社 | 映像送信装置および映像受信装置 |
KR20200016229A (ko) * | 2017-06-09 | 2020-02-14 | 소니 세미컨덕터 솔루션즈 가부시키가이샤 | 영상 송신 장치 및 영상 수신 장치 |
JPWO2018225449A1 (ja) * | 2017-06-09 | 2020-04-09 | ソニーセミコンダクタソリューションズ株式会社 | 映像送信装置および映像受信装置 |
JP7163285B2 (ja) | 2017-06-09 | 2022-10-31 | ソニーセミコンダクタソリューションズ株式会社 | 映像送信装置および映像受信装置 |
KR102509132B1 (ko) | 2017-06-09 | 2023-03-13 | 소니 세미컨덕터 솔루션즈 가부시키가이샤 | 영상 송신 장치 및 영상 수신 장치 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10448031B2 (en) | Method of generating media file and storage medium storing media file generation program | |
US10863192B2 (en) | Image coding apparatus, image coding method, image decoding apparatus, image decoding method, and storage medium | |
US20230421794A1 (en) | Description of image composition with hevc still image file format | |
US8699581B2 (en) | Image processing device, image processing method, information processing device, and information processing method | |
EP2023637A1 (en) | Image decoding device | |
KR101784579B1 (ko) | 호환 가능 깊이 독립 코딩 방법 및 장치 | |
JP6209026B2 (ja) | 画像符号化装置及びその制御方法 | |
KR102279310B1 (ko) | 부호화 방법 및 장치와, 복호 방법 및 장치 | |
JP2016103808A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2013211776A (ja) | 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム | |
US10897628B2 (en) | System and method for improved video operations | |
JP2013243761A (ja) | 動画像圧縮復号システム | |
JP2011186620A (ja) | 映像処理装置及びその制御方法 | |
TW202101998A (zh) | 圖像編碼裝置、圖像解碼裝置、圖像編碼方法、圖像解碼方法 | |
US20240095387A1 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium | |
KR20230110178A (ko) | 이머시브 영상 복호화 방법 및 이머시브 영상 부호화 방법 | |
KR20240013709A (ko) | 이머시브 영상 복호화 방법 및 이머시브 영상 부호화방법 | |
JP4165567B2 (ja) | ストリーム任意領域抽出方式及び装置及びそのプログラム及びそれを記録した記録媒体 | |
JP2023181935A (ja) | 情報生成装置、情報生成方法、およびプログラム | |
JP2017147749A (ja) | 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム | |
JP2005175943A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム及び記録媒体 |