JP2018011198A - 映像符号化装置、映像符号化方法及び映像符号化プログラム - Google Patents

映像符号化装置、映像符号化方法及び映像符号化プログラム Download PDF

Info

Publication number
JP2018011198A
JP2018011198A JP2016138869A JP2016138869A JP2018011198A JP 2018011198 A JP2018011198 A JP 2018011198A JP 2016138869 A JP2016138869 A JP 2016138869A JP 2016138869 A JP2016138869 A JP 2016138869A JP 2018011198 A JP2018011198 A JP 2018011198A
Authority
JP
Japan
Prior art keywords
video
encoding
area
bit stream
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016138869A
Other languages
English (en)
Inventor
亀田 明男
Akio Kameda
明男 亀田
豊 國田
Yutaka Kunida
豊 國田
越智 大介
Daisuke Ochi
大介 越智
愛 磯貝
Ai Isogai
愛 磯貝
明 小島
Akira Kojima
明 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016138869A priority Critical patent/JP2018011198A/ja
Publication of JP2018011198A publication Critical patent/JP2018011198A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】注目領域の映像の符号化を行う際に、重複した領域の符号化処理の効率化を図り、符号化時の予測画像と異なることに起因する画質劣化を防止する。【解決手段】映像符号化装置は、符号化対象の映像を入力する映像入力部と、映像を所定の大きさの部分領域に分割し、部分領域の映像を含み、かつ、符号化処理において部分領域以外からの予測が行われないように部分領域の映像を加工する映像加工部34と、加工を行った部分領域の映像のそれぞれを符号化したビットストリームを出力する符号化部32とを備えた。【選択図】図6

Description

本発明は、映像符号化装置、映像符号化方法及び映像符号化プログラムに関する。
従来から、入力映像を複数解像度に変換し、それらをタイルと呼ばれる部分領域ごとに分割して符号化しておくことにより、限られた帯域で全体映像と高解像度映像を配信することができる映像配信システムが知られている(例えば、非特許文献1参照)。この映像配信システムは、視聴者からの注目領域の要求に応じて、全体の低解像度タイルと、注目領域の高解像度タイルを配信し、再生端末側で表示する際、低解像度タイルの注目領域部分のみの画素を高解像度タイルの画素と置き換えることで、注目領域が変更された場合にも映像が途切れることを防止することができる。
ここで領域に関する言葉を定義しておく。注目領域とは、ROI(Region of Interest)と呼ばれ、大きなサイズの映像のうち、視聴者が注目している映像の一部の領域のことである。ただし、注目領域の大きさは視聴者によって変更可能であり、注目領域を最大の注目領域とした場合は、注目領域と映像サイズが一致する場合もある。タイルとは、全領域の映像を複数の小さい部分領域に分けたものである。部分領域とは、全領域を予め決められた数の小さな矩形領域に分割したものであり、複数の部分領域を組み合わせてタイルが構成される場合もある。最小範囲領域とは、注目領域に対応するビットストリームを得る際に分割する必要がない映像の部分領域を纏めた映像の部分領域の集合または部分領域そのものである。スライスとは、隣接する複数の部分領域(タイル)を組み合わせたものである。例えば、全領域の映像を縦方向に分割した短冊状の部分領域の集合などをスライスとして扱う。ただし、スライスの形状は短冊状に限るものではない。
図13は、非特許文献1に記載の映像配信システムの構成を示す図である。この図において、符号1は、映像を配信する配信サーバである。符号21は、ヘッドマウントディスプレイで構成されたクライアント端末である。符号22は、液晶ディスプレイ等で構成されたデスクトップ型のクライアント端末である。符号23は、スマートフォンを挿入して簡易型のヘッドマウントディスプレイを構成するクライアント端末である。
配信サーバ1では、図13に示すように、入力映像を複数解像度に変換し、それらをタイルと呼ばれる領域ごとに分割して符号化しておく(図13に示す(1)エンコード)。そして、配信サーバ1は、クライアント端末21〜23のいずれかからのタイル配信要求に応じて、2枚のタイルを配信する(図13に示す(2)配信)。配信された2枚のタイルを表示する際に、低解像度タイルの注目領域部分のみの画素を高解像度タイルの画素と置き換えてクライアント端末21〜23の画面に表示する。
図13においては、タイルAは高解像度のタイルであり、これが注目領域となる。一方、タイルBは低解像度の注目領域を含む注目領域以上の広範囲のタイルであり、注目領域が変更された場合に、高解像度のタイルが配信されるまでの間の映像としても用いられる。このようにすることにより、注目領域の変更があった場合でも映像が途切れることなる映像表示を行うことが可能となる。
図14は、タイル分割の例を示す図である。この図において、実線で示す矩形が巨大パノラマ映像の1フレームを表している。また、破線で示す矩形が1つのタイルである。図14に示す例では、高精細映像(最高解像度)のフレームはタイル番号1〜24の24枚のタイルで構成されている。また、中解像度のフレームは、タイル番号25〜30の6枚のタイルで構成されている。また、低解像度のフレームは、タイル番号31の1枚のタイルで構成されている。
次に、映像配信動作を説明する。図15は、図13に示す映像配信システムの映像配信動作を示す説明図である。非特許文献1の映像配信システムは、巨大なパノラマ映像を、まず複数の解像度に分割した上で、さらに、各解像度の映像を一定サイズの矩形を少しずつずらしたタイルに分割し、それぞれのタイル単位で映像符号化を行っている。さらに、国際標準規格であるH.264/MVCフォーマットに従って、各タイルの映像符号化データをまとめて1つのパノラマ映像ストリームを構成している。
その上で、視聴者が、巨大なパノラマ映像から、注目領域の位置や大きさを自由に操作しながら視聴する場合は、この1つのパノラマ映像ストリームから、視聴者の視聴している領域(表示領域)を含む最適な解像度のタイルと、パノラマ映像全体を含んだ最低解像度のタイルの2つのタイルを読み込んで復号される。そして、これらの最適な解像度の映像と最低解像度の映像の復号結果を表示する際に、低解像度タイルの注目領域部分のみの画素を高解像度タイルの画素と置き換えたうえで、1枚のフレームからクリッピングしてクライアント端末への表示が行なわれる。
なお、視聴者の操作により注目領域に基づく表示画像の位置や大きさが変化した場合は、これに追随して読み込む最適な解像度のタイルの位置を変更(位置変化時)や、あるいは最適な解像度を変更(大きさ変化時)して、これらを復号化することで、映像が時間的にも、空間的にも途切れることなく表示を継続可能とするシステムとなっている。
この処理例を図15を参照して説明する。まず、クライアント端末(ここでは、タブレット端末)24は、映像の表示領域が含まれる適切な高解像度のタイル(図15のタイルA)と最低解像度のタイル(図15のタイルB)とを配信要求する(図15(i))。要求する表示領域は、視聴者の操作に応じた注目領域に基づいて決定される。次に、配信サーバ1は、クライアント端末24から要求されたタイルAとタイルBとを配信する(図15(ii))。
これを受けて、クライアント端末24は、適切な高解像度のタイル(タイルA)と最低解像度のタイル(タイルB)を同時にデコード(2つのタイルを復号)して低解像度タイル(タイルB)の注目領域部分のみの画素を高解像度タイル(タイルA)の画素と置き換えた映像を得る(図15(iii))。そして、クライアント端末24は、得られた映像から視聴者の要求する位置、大きさの映像をクリッピングして、画面表示する(図15(iv))。そして、クライアント端末24は、視聴者の要求する位置、大きさ(注目領域)が変更された場合は、適切な高解像度のタイルを変更して(i)に戻る。
次に、図13に示す映像配信システムの詳細な構成と動作を説明する。図16は、映像配信システムの詳細な構成を示すブロック図である。この図において、符号1は、映像配信を行う配信サーバである。符号25は、形態を特定しないクライアント端末である。クライアント端末25は、例えば、ヘッドマウントディスプレイ等である。
符号11は、注目領域に対応するビットストリームを選択して配信するビットストリーム選択部である。符号12は、ROI候補領域毎のビットストリームを蓄積するビットストリーム蓄積部である。ビットストリーム選択部11は、ビットストリーム蓄積部12に蓄積されたビットストリームのうち、ROI候補領域のビットストリームを選択して配信する。
符号26は、視聴者の注目領域を特定する情報に基づいて、注目領域の配信要求を出す配信要求部である。符号27は、注目領域のビットストリームを復号して、注目領域の映像を得る復号部である。符号28は、低解像度タイルの注目領域部分のみの画素を高解像度タイルの画素と置き換えた映像を表示して提示する表示部である。
次に、ビットストリーム蓄積部12に符号化したビットストリームを出力する符号化装置について説明する。図17は、配信サーバ1に符号化装置3を接続した構成を示すブロック図である。図17においては、符号化装置3に関係する構成のみが図示されており、クライアント端末25やビットストリーム選択部11等は省略されている。符号化装置3は、8分割された部分領域を含む全領域の映像を入力する。ROI映像取得部31は、全領域の映像から、予め定めた複数個(ここでは3個)のROI候補領域それぞれの映像を切り出して取得する。ここでいうROI候補領域とは、ROIの候補となる領域であり、各ROI候補領域は事前に映像中の領域と対応付けてある。
次に、符号化部32は、各ROI候補領域の映像を、所定の符号化方式で符号化して、各ROI候補領域に対応するビットストリームを得て、このビットストリームをビットストリーム蓄積部12に蓄積する。図17においては、ROI候補領域が4つの部分領域であるタイルで構成される場合の例を示している。
従来の符号化方式では、注目領域(ROI)以外の部分領域を含んで符号化してしまうと、注目領域(ROI)以外の部分を用いて注目領域(ROI)部分を符号化する、イントラ予測等の処理が行われる。このため、ROI候補領域を符号化するためには、ROI候補領域の周辺領域を含めて符号化対象とする必要がある。
Hideaki Kimata, Daisuke Ochi, Akio Kameda, Hajime Noto, Katsuhiko Fukazawa, and Akira Kojima, "Mobile and Multi-device Interactive Panorama Video Distribution System,"IEEE GCCE 2012,2012.
前述したように、従来技術による符号化装置では、各タイルに重なりを持たせている。そのため、図17に示す符号化装置3にあっては、3つのROI候補領域を切り出してそれぞれを符号化する構成であり、同じ部分領域の符号化を複数回符号化してしまう。図17に示すように、従来の符号化装置3は、部分領域1、2、5、6からなるROI候補領域R1と、部分領域2、3、6、7からなるROI候補領域R2と、部分領域3、4、7、8からなるROI候補領域R3とをそれぞれ符号化する。この場合、部分領域2、6からなるタイルと部分領域3、7からなるタイルとは、同じ部分領域であるにもかかわらず、2回符号化処理が実行されてしまう。
そこで、重複の無いタイル構成の映像符号化結果から、各スライスの映像符号化結果を合成することで、重複領域において、同一の符号化処理が実行されることを防止することが考えられる。このような合成手法により、符号化処理の効率化を図ることができるとともに、注目領域別の各タイルを高速に生成することができる。
ここで、上記の高速化処理では、各タイルの相互依存性を可能な限り排除するため、例えばH.264のスライスの概念を導入すると、画面内(イントラ)予測はスライス内に閉じて符号化することができる。
しかしながら、符号化方式自体はH.264等の従来のものを用いることができるものの、符号化対象(例えばH.264のスライスといった部分領域)はは、当然、映像の大きさや形状が元の映像(映像全体)と異なってしまう。このため、画面間(インター)予測を用いる場合は、従来の符号化処理のモジュールそのものを使って符号化装置を実装する際には、画面間(インター)予測において、動ベクトル探索範囲の制約が発生する。仮に、制約を設けず実装してしまうと、画面間(インター)予測で問題が生じる。具体的には、画面間(インター)予測では、動ベクトルの参照画像の領域として、このスライスの領域外を参照することが許容される。このため、スライスの概念での従来の処理において、注目領域別のタイルで構成される各ストリームで領域外参照が発生した場合で、かつ、タイルの構成要素に参照先のスライスの領域が含まれていないケースでは、参照画像が無く、予測画像に誤差が生じるため、符号化時の予測画像と異なることに起因する画質劣化が発生するという問題がある。
本発明は、このような事情に鑑みてなされたもので、注目領域の映像の符号化を行う際に、重複した領域の符号化処理の効率化を図り、符号化時の予測画像と異なることに起因する画質劣化を防止することができる映像符号化装置、映像符号化方法及び映像符号化プログラムを提供することを目的とする。
本発明の一態様は、符号化対象の映像を入力する映像入力部と、前記映像を所定の大きさの部分領域に分割し、前記部分領域の映像を含み、かつ符号化処理において前記部分領域以外からの予測が行われないように前記部分領域の映像を加工する映像加工部と、加工を行った前記部分領域の映像のそれぞれを符号化したビットストリームを出力する符号化部とを備えた映像符号化装置である。
本発明の一態様は、前記映像符号化装置であって、前記符号化部は、前記ビットストリームを、前記映像を表示する端末装置から要求された注目領域に対応するビットストリームに再構成された前記ビットストリームを前記端末装置に対して配信するための符号化を行う。
本発明の一態様は、前記映像符号化装置であって、前記映像を表示する端末装置に対して配信するために、前記ビットストリームを、前記映像を表示する端末装置から要求された注目領域に対応するビットストリームに再構成するトランスコード部をさらに備えた。
本発明の一態様は、前記映像符号化装置であって、前記部分領域が前記映像を縦方向または横方向にスライスしたスライス領域であり、前記映像加工部は、隣り合う前記スライス同士が相反する色となるように、前記映像を加工する。
本発明の一態様は、前記映像符号化装置であって、前記部分領域が前記映像を縦方向または横方向にスライスしたスライス領域であり、前記映像加工部は、符号化対象の前記スライス以外のスライスを、符号化対象の前記スライスに対して相反する色となるように、前記映像を加工する。
本発明の一態様は、前記映像符号化装置であって、前記部分領域が前記映像を縦方向または横方向にスライスしたスライス領域であり、前記映像加工部は、符号化対象の前記スライス周辺領域を、符号化対象の前記スライスに対して相反する色となるように、前記映像を加工する。
本発明の一態様は、映像を符号化する映像符号化装置が行う映像符号化方法であって、符号化対象の前記映像を入力する映像入力ステップと、前記映像を所定の大きさの部分領域に分割し、前記部分領域の映像を含み、かつ符号化処理において前記部分領域以外からの予測が行われないように前記部分領域の映像を加工する映像加工ステップと、加工を行った前記部分領域の映像のそれぞれを符号化したビットストリームを出力する符号化ステップとを有する映像符号化方法である。
本発明の一態様は、前記映像符号化方法であって、前記符号化ステップは、前記ビットストリームを、前記映像を表示する端末装置から要求された注目領域に対応するビットストリームに再構成された前記ビットストリームを前記端末装置に対して配信するための符号化を行う。
本発明の一態様は、前記映像符号化方法であって、前記映像を表示する端末装置に対して配信するために、前記ビットストリームを、前記映像を表示する端末装置から要求された注目領域に対応するビットストリームに再構成するトランスコードステップをさらに有する。
本発明の一態様は、コンピュータを、前記映像符号化装置として機能させるための映像符号化プログラムである。
本発明によれば、符号化対象となる映像の大きさや形状を変えずに、映像の各部分領域に対応するビットストリームを、部分領域の相互依存性を抑制して生成することができる。これにより、重複を許して複数の領域に分割された映像の、複数の領域それぞれのビットストリームを生成する際の符号化処理の効率化を図ることができる。
本発明の第1実施形態による映像符号化装置の構成を示すブロックである。 図1に示す符号化装置3の動作を示すフローチャートである。 タイル指定による並列処理ができないHEVCエンコーダを活用して符号化を行う動作を示す説明図である。 タイル指定による並列処理が可能なHEVCエンコーダを活用して符号化を行う動作を示す説明図である。 図4に示す方法を用いて実時間配信する映像配信システムの構成例を示す模式図である。 本発明の第2実施形態による映像符号化装置の構成を示すブロックである。 図6に示す符号化装置3の動作を示すフローチャートである。 タイル指定による並列処理が可能なH.264エンコーダを活用して符号化を行う基本動作を示す説明図である。 図6に示す映像加工部34の動作の詳細を示す説明図である。 図6に示す映像加工部34の動作の詳細の変形例を示す説明図である。 第1実施形態と第2実施形態との符号化装置3における共通概念を示すブロック図である。 本発明の第3実施形態による映像符号化装置の構成を示すブロックである。 非特許文献1に記載の映像配信システムの構成を示す図である。 タイル分割の例を示す図である。 図13に示す映像配信システムの映像配信動作を示す説明図である。 映像配信システムの詳細な構成を示すブロック図である。 配信サーバ1に符号化装置3を接続した構成を示すブロック図である。
<第1実施形態>
以下、図面を参照して、本発明の第1実施形態による映像符号化装置を説明する。図1は同実施形態の構成を示すブロック図である。この図において、図16、図17に示す従来の装置と同一の部分には同一の符号を付し、その説明を省略する。この図に示す装置が従来の装置と異なる点は、トランスコード部33が新たに設けられていることと、符号化装置3の動作が異なる点である。トランスコード部33は、符号化済みの映像をそれぞれクライアント端末に応じた仕様の映像を生成して出力する。
次に、図1に示す映像配信システムの動作を説明する。ここで、ビットストリーム選択部11、配信要求部26、復号部27、表示部28の動作は、図16に示す装置と同様であるので、ここでは詳細な動作の説明を省略する。図1に示す映像配信システムにおいて、従来の映像配信システムと異なる点は、符号化装置3の動作であるので、この動作について説明する。図2は、図1に示す符号化装置3の動作を示すフローチャートである。
まず、ROI映像取得部31は、ソースとなる全領域の映像を入力する(ステップS1)。例えば、図1に示す1〜8の部分領域を含む全領域の映像を入力する。続いて、ROI映像取得部31は、全領域の映像から、ROI候補領域に必要な最小単位の部分領域ごとの映像を切り出す(ステップS2)。例えば、ROI映像取得部31は、図1に示すように、4つの最小単位領域それぞれの映像を切り出して出力する。
ここで、最小単位として、部分領域1と5、部分領域2と6、部分領域3と7、部分領域4と8は、何れのROI候補領域のビットストリームを作る際にも分ける必要が無いので、纏めたものを「最小単位」にしている。もちろん、更に細かい部分領域1〜8それぞれを最小単位としてもよい。このようにすれば、重複のない最小単位とすることにより、複数回符号化される部分領域を無くすことができる。
次に、符号化部32は、ROI映像取得部31が出力した各最小単位領域の映像を入力とし、各最小単位領域の映像をそれぞれ符号化して、各最小単位領域それぞれに対応するビットストリームを出力する(ステップS3)。例えば、図1に示すように、部分領域1と5からなる領域、部分領域2と6からなる領域、部分領域3と7からなる領域、部分領域4と8からなる領域、の4つの最小単位領域それぞれに対応するビットストリームを出力する。なお、符号化は、例えばH.264やHEVCなどの一般的な規格で行われ、ビットストリームにはそれらに準拠したヘッダが付与されるものとする。
次に、トランスコード部33は、符号化部32から出力された各最小単位領域それぞれに対応するビットストリームを入力とし、各ROI候補領域について、ROI候補領域を構成する各最小単位領域のビットストリームからヘッダを切り離し、ROI候補領域を再構成する順に並べて統合した上でヘッダを付与し、ROI候補領域に対応するビットストリームを得る(ステップS4)。例えば、図1に示す例では、3つのROI候補領域に対応するビットストリームを得る。具体的には、部分領域1と5からなる領域、部分領域2と6からなる領域、部分領域3と7からなる領域、部分領域4と8からなる領域、の4つの最小単位領域のビットストリームを再構成して、部分領域1と2と5と6からなる領域、部分領域2と3と6と7からなる領域、部分領域3と4と7と8からなる領域、の3つのROI候補領域に対応するビットストリームを得る。
ビットストリーム蓄積部12は、トランスコード部33から出力されたビットストリームを蓄積する(ステップS5)。この動作によって、図1に示す3つのROI候補領域(図1に示す例では、部分領域1と2と5と6からなる領域、部分領域2と3と6と7からなる領域、部分領域3と4と7と8からなる領域、の3つのROI候補領域)に対応するビットストリームがビットストリーム蓄積部12に蓄積される。
次に、具体例を挙げて、符号化の動作を説明する。図3は、ROI候補領域に含まれる複数の部分領域であるタイルを指定して同時に並列処理ができないHEVCエンコーダを活用して符号化を行う動作を示す説明図である。まず、ROI映像取得部31は、全体映像を部分領域であるタイル毎に分割する。ここでは、例えば、縦4つ、横8つの32分割とし、32の部分領域であるタイルを最小単位領域とする。
そして、符号化部32は、タイルごとに順次符号化する(エンコードする)。これによって、タイル毎にヘッダが付与されたタイル毎のビットストリームが生成される。
次に、トランスコード部33は、ROI候補領域に対応するタイルを組み合わせてROI候補領域毎のビットストリームを再構成する。この再構成されたROI候補領域毎のビットストリームをビットストリーム蓄積部12へ蓄積する。ROI候補領域と対応する最小単位領域(または部分領域)の組み合わせは、予め定めてあるものとする。
図4は、最小単位領域を部分領域(タイル)とし、ROI候補領域に含まれる複数の部分領域であるタイルを指定して同時に並列処理が可能なHEVCエンコーダを活用して符号化を行う動作を示す説明図である。まず符号化部32は、全体映像を入力し、ヘッダを付与した1つのビットストリームとして符号化を行う。全体映像は、図4の例では、縦4つ、横8つの32個のタイルから構成する。
次に、トランスコード部33は、1つのビットストリームからヘッダを切り離し、ROI候補領域を構成する各タイルのビットストリームを、このROI候補領域を再構築する順に統合した上でこのROI候補領域に対応したヘッダを付与し、ROI候補領域毎のビットストリームを得る。この再構成されたROI候補領域毎のビットストリームをビットストリーム蓄積部12へ蓄積する。
次に、図4に示す方法(ROI候補領域に含まれる複数の部分領域であるタイルを指定して同時に並列処理が可能なHEVCエンコーダを活用して符号化を行う方法)を用いて実時間配信する映像配信システムの構成例を説明する。図5は、図4に示す方法を用いて実時間配信する映像配信システムの構成例を示す模式図である。
この図において、符号100は、全天球カメラである。符号200は、全天球カメラの映像を実時間で符号化してビットストリームを出力するライブエンコーダである。全天球カメラ100とライブエンコーダ200は、撮影現場(例えば、スポーツ競技会場など)に設置される。
符号300は、ライブエンコーダ200との間が専用線または安定したネットワーク(NW)で接続され、ビットストリームの再構成を行うトランスコーダである。符号400は、配信要求に応じてビットストリームを選択してクライアント端末へ配信する配信サーバである。トランスコーダ300と配信サーバ400は、データセンタに設置される。
符号500は、インターネット網やCDN(コンテンツデリバリネットワーク)である。符号600は、スポーツバーやパブリックビューイングなどのクライアント端末に表示した映像である。符号700は、家庭のクライアント端末に表示した映像である。符号800は、会場のクライアント端末に表示した映像である。
次に、図5に示す映像配信システムの動作を説明する。まず、ライブエンコーダ200は、全天球カメラで撮影した映像全体を部分領域であるタイルに分割し、分割したタイル毎に符号化を行い、映像全体に対するヘッダを付与した1つのビットストリームを出力する。図5では最小単位領域をタイルとして説明している。このビットストリームは、全体データ量は小さいが、1ストリームあたりのデータ量は大きくなる。このビットストリームは、トランスコーダ300へ転送される。
トランスコード300は、映像全体を表す1つのビットストリームを入力とし、当該ビットストリームからヘッダを外した後、各タイル毎のビットストリームに分割する。トランスコード300は、分割された各タイル毎のビットストリームから、各ROI候補領域に対応するタイルのビットストリームを並べてROI候補領域毎のビットストリームを生成する。言い換えれば、映像全体を表す1つのビットストリームから、ROI候補領域毎のビットストリームに各ROI候補領域に対するヘッダを付与したものに分割して、ROI候補領域毎のビットストリームを生成する。このビットストリームは、全体データ量は、大きくなるが、1ストリームあたりのデータ量は小さくなる。この複数のビットストリームは配信サーバ400へ転送され、配信サーバ400内に蓄積される。
そして、クライアント端末から要求された注目領域の配信要求に応じて、蓄積されているROI候補領域のうち、クライアント端末から要求された注目領域に対応するROI候補領域のビットストリームを配信する。これによって、各クライアント端末において、注目領域の映像を視聴することができる。
以上説明したように、第1実施形態では、映像全体の領域の部分集合となる複数の注目領域を符号化する際、領域の重なりで重複する符号化演算量を低減することができる。また、重複する部分の符号量の増大による伝送帯域および蓄積容量を低減することができる。
<第2実施形態>
次に、本発明の第2実施形態による映像符号化装置を説明する。図6は同実施形態の構成を示すブロック図である。この図において、図1に示す装置と同一の部分には同一の符号を付し、その説明を省略する。この図に示す装置が図1に示す装置と異なる点は、ROI映像取得部31に代えて、映像加工部34が新たに設けられていることと、符号化装置3の動作が異なる点である。
次に、図6に示す映像配信システムの動作を説明する。ここで、ビットストリーム選択部11、配信要求部26、復号部27、表示部28の動作は、図16に示す装置と同様であるので、ここでは詳細な動作の説明を省略する。図6に示す映像配信システムにおいて、従来の映像配信システムと異なる点は、符号化装置3の動作であるので、この動作について説明する。図7は、図6に示す符号化装置3の動作を示すフローチャートである。
まず、映像加工部34は、ソースとなる全領域の映像を入力する(ステップS11)。例えば、図6に示す1〜8の部分領域を含む全領域の映像を入力する。
次に、映像加工部34は、全領域の映像から、少なくともROI候補領域に必要な最小単位領域ごとの映像が含まれ、かつ、符号化処理で最小単位領域以外からの予測が行われないように加工した映像を得る(ステップS12)。例えば、図6に示す符号R4、R5で示す2つの映像を得る。
この例では、部分領域1と5については、隣り合う部分領域2と6であった領域からのイントラ予測(例えば一般的なH.264やHEVC符号化で用いられるPlanar予測,DC予測,Angular予測等)が行われないように、映像中の部分領域2と6の部分を相反色に置き換えるような加工(例えば、部分領域1と5が白色に近い色であれば部分領域2と6を黒色でマスキング)を施した加工済み映像を生成し、加工済み映像を用いて符号化する。隣接する領域を相反色に置き換えるような加工を施した加工済み映像を用いて符号化すると、他の領域からの予測、部分領域1と5の領域の符号化であれば部分領域2と6からの予測が行われない。映像のビットストリームから、他の領域からの予測が行われない状態で符号化したビットストリーム、ここでは部分領域1と5に対応するビットストリームを切り出しても、他の領域、ここでは部分領域2と6からの予測情報がなくても復号できるビットストリーム、すなわち、部分領域1と5に対応するビットストリームそのものとなる。他の領域についても加工済み映像を用いて符号化することで、同様に当該領域そのもののビットストリームが得られる。符号化対象の映像の一部を相反色に置き換え、加工済み映像とする方法についての詳細は、後述する。図6に示す例であれば、部分領域1と5に対応するビットストリームそのものを作成するための加工を施した加工済み映像、部分領域2と6に対応するビットストリームそのものを作成するための加工を施した加工済み映像、というように、複数の加工済み映像を生成する。
次に、符号化部32は、映像加工部34が出力した各加工済み映像を入力とし、各加工済み映像それぞれ符号化して、各加工済み映像それぞれに対応するビットストリームを得る(ステップS13)。例えば、図6に示す符号B1、B2で示すビットストリームを得る。
次に、トランスコード部33は、符号化部32が出力した加工済み映像のビットストリームを入力とし、加工済み映像のビットストリームからROI候補領域に含まれる部分領域に対応するビットストリームを切り出し、切り出したビットストリームを統合して、ROI候補領域に対応するビットストリームを得る(ステップS14)。
そして、トランスコード部33は、例えば、3つのROI候補領域に対応するビットストリームB3、B4、B5をビットストリーム蓄積部12に蓄積する(ステップS15)。
次に、具体例を挙げて、符号化の動作を説明する。はじめに、ROI候補領域に含まれる複数の部分領域であるスライスを指定して同時に並列処理ができないHEVCエンコーダを活用して符号化を行う基本動作を説明する。図8は、ROI候補領域に含まれる複数の部分領域であるスライスを指定して同時に並列処理ができないHEVCエンコーダを活用して符号化を行う基本動作を示す説明図である。ここでいうスライスとは、隣接する複数の部分領域(タイル)を組み合わせたものである。
まず、符号化部32は、スライス分割された全領域の映像を入力する。このスライス分割は、可能な限りイントラ予測をさせないようにする。そして、符号化部32は、各スライスに対して、ヘッダを付与した1つのビットストリームとして符号化を行う。なお、各スライスは、1枚のタイルと等価であってもよい。
次に、トランスコード部33は、1つのビットストリームを入力し、必要なタイルを組み合わせてROI候補領域毎のビットストリームを再構成する。この例では、3つのタイル(スライス)で1つのROI候補領域を構成している。この複数のビットストリームはビットストリーム蓄積部12に蓄積される。
次に、図9を参照して、図6に示す映像加工部34の動作の詳細を説明する。図9は、図6に示す映像加工部34の動作の詳細を示す説明図である。
まず、ある映像がフレーム1〜Nまで、各フレームの中でスライスが1〜nで構成されているとする。ここで、符号化対象の奇数スライスのイントラ予測時には、参照画像において偶数スライスを別の輝度/色(相反色)に置き換える(図9(1)−1参照)。また、偶数スライスでは、奇数スライスを同様に相反色に置き換える(図9(1)−2参照)。ここでは、相反色を黒で表現している。
ここで相反色は、参照元のフレーム全体の特徴と相反するようにする。すなわち、イントラ予測で参照されづらいようにする。例えば、輝度信号が8bit(0〜255)で表現されているとして、参照元のフレームの輝度値の平均xを取り、相反色(輝度値)を
平均x>127 ならば、相反色=0(黒)
平均x≦127 ならば、相反色=255(白)
とする。
これにより、参照元のフレームの特徴として明るい場合は、相反色=黒に、暗い場合は相反色=白になり、フレームの特徴の相反色を使用することで、イントラ予測として参照しづらいようにする。
また、RGB信号が各8bitで表現されているとして、参照元のフレームの各RGB信号の平均をそれぞれr,g,bとし、相反色をr’,g’,b’とすると、
r’=z−r
g’=z−g
b’=z−b
とする。
ここで、z=max(r,g,b)+min(r,g,b)で、maxは要素の最大値、minは要素の最小値を表す。これにより参照元のフレームの補色が相反色となり、動ベクトルとして参照しづらいようにする。なお、前述した説明はある映像の特定のフレームに対する処理について説明したが、それを映像(特定のフレームの前後フレーム)にも適用し、複数フレーム間の動ベクトル探索時にも適用できることは明白である。
<変形例1>
次に、図6に示す映像加工部34の動作の詳細の変形例1を説明する。変形例1においてもある映像がフレーム1〜Nまで、各フレームの中でスライス1〜nで構成されているとする。ここで、符号化対象のスライスにおける、動ベクトルの参照画像の当該スライス領域以外は相反色に置き換える(図9(2)参照)。
ここで相反色は、参照元のスライスの特徴と相反するようにする。すなわち、イントラ予測で参照されづらいようにする。例えば、輝度信号が8bit(0〜255)で表現されているとして、参照元のスライスの輝度値の平均xを取り、相反色(輝度値)を
平均x>127 ならば、相反色=0(黒)
平均x≦127 ならば、相反色=255(白)
とする。
これにより、参照元のスライスの特徴として明るい場合は、相反色=黒に、暗い場合は相反色=白になり、スライスの特徴の相反色を使用することで、動ベクトルとして参照しづらいようにする。
また、RGB信号が各8bitで表現されているとして、参照元のスライスの各RGB信号の平均をそれぞれr,g,bとし、相反色をr’,g’,b’とすると、
r’=z−r
g’=z−g
b’=z−b
とする。
ここで、z=max(r,g,b)+min(r,g,b)で、maxは要素の最大値、minは要素の最小値を表す。
これにより参照元のスライスの補色が相反色となり、動ベクトルとして参照しづらいようにする。なお、前述した説明はある映像の特定のフレームに対する処理について説明したが、それを映像(特定のフレームの前後フレーム)にも適用し、複数フレーム間の動ベクトル探索時にも適用できることは明白である。
<変形例2>
次に、図10を参照して、図6に示す映像加工部34の動作の詳細の変形例を説明する。図10は、図6に示す映像加工部34の動作の詳細の変形例を示す説明図である。この変形例においてもある映像がフレーム1〜Nまで、各フレームの中でスライス1〜nで構成されているとする。ここで、符号化対象のスライスmにおける、イントラ予測時の参照画像のこのスライス領域の周辺領域を相反色に置き換える(図10参照)。
ここで相反色は、参照元のスライスの特徴と相反するようにする。すなわち、イントラ予測で参照されづらいようにする。例えば、輝度信号が8bit(0〜255)で表現されているとして、参照元のスライスの輝度値の平均xを取り、相反色(輝度値)を
平均x>127 ならば、相反色=0(黒)
平均x≦127 ならば、相反色=255(白)
とする。
これにより、参照元のスライスの特徴として明るい場合は、相反色=黒に、暗い場合は相反色=白になり、スライスの特徴の相反色を使用することで、イントラ予測として参照しづらいようにする。
また、RGB信号が各8bitで表現されているとして、参照元のスライスの各RGB信号の平均をそれぞれr,g,bとし、相反色をr’,g’,b’とすると、
r’=z−r
g’=z−g
b’=z−b
とする。
ここで、z=max(r,g,b)+min(r,g,b)で、maxは要素の最大値、minは要素の最小値を表す。
これにより参照元のスライスの補色が相反色となり、動ベクトルとして参照しづらいようにする。なお、前述した説明はある映像の特定のフレームに対する処理について説明したが、それを映像(特定のフレームの前後フレーム)にも適用し、複数フレーム間の動ベクトル探索時にも適用できることは明白である。
以上説明したように、第2実施形態では、映像全体を領域の重複の無いスライスで分割/符号化した後、各スライスからROI領域候補別のタイルを作成する手法において、符号化装置への簡易な改造で実施可能な手法として動ベクトルの参照画像を一部変更する加工を行う。参照画像の一部変更においては、イントラ予測または動ベクトルの参照元のフレーム全体の特徴と、スライスそれぞれの特徴を使用したそれぞれの相反色の導出手法を用いている。
また、第2実施形態では、スライスの相互依存性をさらに抑制するため、領域外参照の防止を行う。各スライスの画面間予測での依存性を排除するため、イントラ予測または動ベクトルの参照画像において、相反色で参照画像を一部変更することで、該当するスライスの領域外参照を抑止することができる。また、相反色で参照画像の一部変更することは、あわせて、エンコーダ改修の容易となる。すなわち、可変ブロックサイズ動き補償でのブロック位置/サイズに基づき、それぞれのブロックでの探索範囲計算をせず、参照画像の一部変更のみで対応可能となる。
また、第2の実施形態では、ROI候補領域別のタイルで構成される各ストリームを生成する際に、映像全体を領域の重複の無いスライスで分割/符号化する。その後、各スライスからROI候補領域別のタイルを作成する手法において、スライス単位の符号化時の相互依存性を抑制することで、領域外参照による画質低下を低減することができる。また、インタラクティブ映像配信に適用することで、従来のタイルで構成される各ストリームを、領域外参照による画質低下を低減しつつ、より高速に生成することが可能となる。
図11は、第1実施形態と第2実施形態との符号化装置3における共通概念を示すブロック図である。ここで、ビットストリーム選択部11、配信要求部26、復号部27、表示部28の動作は、図16に示す装置と同様であるので、ここでは詳細な動作の説明を省略する。符号化処理部35は、全領域の映像を入力する。ここで入力される全領域の映像は、部分領域1〜8を含む映像である。
次に、符号化処理部35は、前述した処理によって符号化処理を行う。符号化処理部35は、全領域の映像から、ROI候補領域に必要な最小単位の部分領域ごとの映像を切り出す。符号化処理部35は、各最小単位領域の映像をそれぞれ符号化して、各最小単位領域それぞれに対応するビットストリームを出力する。各最小単位領域の映像をそれぞれ符号化する際、最小単位領域を、最小単位領域外からの予測を含まないように符号化して、最小単位領域毎に独立したビットストリームを得る。
符号化処理部35によって得られるビットストリームは、図11に示すように、例えば、4つの最小単位領域それぞれに対応するビットストリームを含むビットストリームである。
次に、トランスコード部33は、符号化処理部35から出力された、最小単位領域毎に独立したビットストリームを入力とし、各ROI候補領域について、ROI候補領域に含まれる最小単位領域に対応するビットストリームを統合して、ROI候補領域に対応するビットストリームを得る。
トランスコード部33によって得られるビットストリームは、図11に示すように、例えば、3つのROI候補領域に対応するビットストリームである。このビットストリームは、ビットストリーム蓄積部12に蓄積される。
<第3実施形態>
次に、本発明の第3実施形態による映像符号化装置を説明する。図12は同実施形態の構成を示すブロック図である。この図において、図11に示す装置と同一の部分には同一の符号を付し、その説明を省略する。この図に示す装置が図1に示す装置と異なる点は、トランスコード部33に代えて、トランスコード部13が配信サーバ1内に設けられている点である。トランスコード部13が、配信サーバ1内に設けられたことで、ビットストリームを選択後にトランスコードを行う。
次に、図12に示す装置の動作を説明する。まず、符号化処理部35は、全領域の映像を入力する。続いて、符号化処理部35は、最小単位領域を、最小単位領域外からの予測を含まないように符号化して最小単位領域毎に独立したビットストリームを得るように符号化する。符号化処理部35は、このビットストリームを出力し、ビットストリーム蓄積部12に蓄積する。ストリーム蓄積部12には、ROI候補領域に対応するビットストリームではなく、最小単位領域それぞれに対応するビットストリームを含むビットストリームが蓄積される。
ビットストリーム選択部11は、配信要求に応じて、ビットストリーム蓄積部12に蓄積されたビットストリームのうち、注目領域に含まれる最小単位領域のビットストリームを選択して出力する。これを受けて、トランスコード部13は、ビットストリーム選択部11が選択した注目領域に含まれる最小単位領域に対応するビットストリームを統合して、注目領域に対応するビットストリームを得て、クライアント端末26に対して配信する。
以上説明したように、第3実施形態では、ストリーム蓄積部12には、注目領域に対応するビットストリームではなく、最小単位領域それぞれに対応するビットストリームを含むビットストリームが蓄積される。この構成によれば、符号化装置3内において、ROI候補領域毎のトランスコード処理を行わなくても済むようになる。この結果、符号化装置3の構成を簡単にすることができる。また、配信サーバ1内に設けたトランスコード部13は、配信要求された注目領域についてのみトランスコードを行えばいため、トランスコード部13の能力が高くなくとも適用可能となる。
前述した実施形態における映像符号化装置の全部または一部をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、PLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されるものであってもよい。
以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行ってもよい。
注目領域の映像の符号化を行う際に、重複した領域の符号化処理の効率化を図り、符号化時の予測画像と異なることに起因する画質劣化を防止することが不可欠な用途にも適用できる。
1・・・配信サーバ、11・・・ビットストリーム選択部、12・・・ビットストリーム蓄積部、13・・・トランスコード部、21〜25・・・クライアント端末、26・・・配信要求部、27・・・復号部、28・・・表示部、3・・・符号化装置、31・・・ROI映像取得部、32・・・符号化部、33トランスコード部、34・・・映像加工部、35・・・符号化処理部

Claims (10)

  1. 符号化対象の映像を入力する映像入力部と、
    前記映像を所定の大きさの部分領域に分割し、前記部分領域の映像を含み、かつ符号化処理において前記部分領域以外からの予測が行われないように前記部分領域の映像を加工する映像加工部と、
    加工を行った前記部分領域の映像のそれぞれを符号化したビットストリームを出力する符号化部と
    を備えた映像符号化装置。
  2. 前記符号化部は、前記ビットストリームを、前記映像を表示する端末装置から要求された注目領域に対応するビットストリームに再構成された前記ビットストリームを前記端末装置に対して配信するための符号化を行う請求項1に記載の映像符号化装置。
  3. 前記映像を表示する端末装置に対して配信するために、前記ビットストリームを、前記映像を表示する端末装置から要求された注目領域に対応するビットストリームに再構成するトランスコード部をさらに備えた請求項1に記載の映像符号化装置。
  4. 前記部分領域が前記映像を縦方向または横方向にスライスしたスライス領域であり、
    前記映像加工部は、隣り合う前記スライス同士が相反する色となるように、前記映像を加工する
    請求項1に記載の映像符号化装置。
  5. 前記部分領域が前記映像を縦方向または横方向にスライスしたスライス領域であり、
    前記映像加工部は、符号化対象の前記スライス以外のスライスを、符号化対象の前記スライスに対して相反する色となるように、前記映像を加工する
    請求項1に記載の映像符号化装置。
  6. 前記部分領域が前記映像を縦方向または横方向にスライスしたスライス領域であり、
    前記映像加工部は、符号化対象の前記スライス周辺領域を、符号化対象の前記スライスに対して相反する色となるように、前記映像を加工する
    請求項1に記載の映像符号化装置。
  7. 映像を符号化する映像符号化装置が行う映像符号化方法であって、
    符号化対象の前記映像を入力する映像入力ステップと、
    前記映像を所定の大きさの部分領域に分割し、前記部分領域の映像を含み、かつ符号化処理において前記部分領域以外からの予測が行われないように前記部分領域の映像を加工する映像加工ステップと、
    加工を行った前記部分領域の映像のそれぞれを符号化したビットストリームを出力する符号化ステップと
    を有する映像符号化方法。
  8. 前記符号化ステップは、前記ビットストリームを、前記映像を表示する端末装置から要求された注目領域に対応するビットストリームに再構成された前記ビットストリームを前記端末装置に対して配信するための符号化を行う請求項7に記載の映像符号化方法。
  9. 前記映像を表示する端末装置に対して配信するために、前記ビットストリームを、前記映像を表示する端末装置から要求された注目領域に対応するビットストリームに再構成するトランスコードステップをさらに有する請求項7に記載の映像符号化方法。
  10. コンピュータを、請求項1から3のいずれか一項に記載の映像符号化装置として機能させるための映像符号化プログラム。
JP2016138869A 2016-07-13 2016-07-13 映像符号化装置、映像符号化方法及び映像符号化プログラム Pending JP2018011198A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016138869A JP2018011198A (ja) 2016-07-13 2016-07-13 映像符号化装置、映像符号化方法及び映像符号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016138869A JP2018011198A (ja) 2016-07-13 2016-07-13 映像符号化装置、映像符号化方法及び映像符号化プログラム

Publications (1)

Publication Number Publication Date
JP2018011198A true JP2018011198A (ja) 2018-01-18

Family

ID=60994440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016138869A Pending JP2018011198A (ja) 2016-07-13 2016-07-13 映像符号化装置、映像符号化方法及び映像符号化プログラム

Country Status (1)

Country Link
JP (1) JP2018011198A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019169929A (ja) * 2018-03-26 2019-10-03 Kddi株式会社 Vr映像配信装置および方法、vr映像再生装置および方法ならびにvr映像システム
WO2020261617A1 (ja) * 2019-06-27 2020-12-30 株式会社ソニー・インタラクティブエンタテインメント 画像処理システム、画像処理用集積回路、および画像処理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019169929A (ja) * 2018-03-26 2019-10-03 Kddi株式会社 Vr映像配信装置および方法、vr映像再生装置および方法ならびにvr映像システム
WO2020261617A1 (ja) * 2019-06-27 2020-12-30 株式会社ソニー・インタラクティブエンタテインメント 画像処理システム、画像処理用集積回路、および画像処理方法
JPWO2020261617A1 (ja) * 2019-06-27 2020-12-30

Similar Documents

Publication Publication Date Title
US11683491B2 (en) Encoding and decoding based on blending of sequences of samples along time
US10484682B2 (en) Reference picture derivation and motion compensation for 360-degree video coding
US10771796B2 (en) Encoding and decoding based on blending of sequences of samples along time
JP6219464B2 (ja) 高ダイナミックレンジ画像を生成するデコーダ及びその方法
JP6437096B2 (ja) ビデオ合成
US9445111B2 (en) Image processing apparatus and image processing method
JP6305279B2 (ja) 映像圧縮装置および映像再生装置
US10798417B2 (en) Deblock filtering for 360-degree video coding
CN105409217B (zh) 图像处理装置、图像处理方法和计算机可读介质
CN113574873A (zh) 图块和子图像分割
KR101625910B1 (ko) 영상 분할을 이용한 영상 처리 방법 및 장치
US20130195186A1 (en) Scalable Video Coding Extensions for High Efficiency Video Coding
JP6006680B2 (ja) 映像配信装置及び映像配信プログラム
JP2018011198A (ja) 映像符号化装置、映像符号化方法及び映像符号化プログラム
JP2018011197A (ja) 映像配信装置、映像符号化装置、映像配信方法、映像符号化方法、映像配信プログラム及び映像符号化プログラム
US20240056591A1 (en) Method for image coding based on signaling of information related to decoder initialization
JP5436501B2 (ja) 映像符号化装置及び映像復号装置
GB2561812A (en) Method of video transmission and display