JP2014116922A - Video playback device and video distribution device - Google Patents
Video playback device and video distribution device Download PDFInfo
- Publication number
- JP2014116922A JP2014116922A JP2013108404A JP2013108404A JP2014116922A JP 2014116922 A JP2014116922 A JP 2014116922A JP 2013108404 A JP2013108404 A JP 2013108404A JP 2013108404 A JP2013108404 A JP 2013108404A JP 2014116922 A JP2014116922 A JP 2014116922A
- Authority
- JP
- Japan
- Prior art keywords
- video
- video data
- resolution
- data
- view
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
本発明は、低スペックの再生端末に対して高精細映像を配信するために、映像品質を制御して映像の配信、映像の再生を行う映像再生装置及び映像配信装置に関する。 The present invention relates to a video playback apparatus and a video distribution apparatus that control video quality and perform video distribution and video playback in order to distribute high-definition video to a low-spec playback terminal.
近年、4K解像度、8K解像度及び巨大なパノラマ映像等のハイビジョン品質を大きく上回る解像度を持つ高精細映像から、視聴者が好みの位置や大きさで自由に操作しながら映像を視聴する技術の研究が行われている(例えば、非特許文献1参照)。非特許文献1では、ハイビジョン品質を越える解像度の巨大なパノラマ映像を対象としている。非特許文献1は、巨大なパノラマ映像を、まず複数のタイルに分割し、それぞれのタイル単位で映像符号化を行っている。図10にタイル分割の例を示す。図10は、巨大なパノラマ映像を、複数のタイルに分割した例を示す説明図である。さらに、国際標準規格であるH.264/MVCフォーマットに従って、各タイルの映像符号化データをまとめて1つのパノラマ映像ストリームを構成している。
In recent years, research has been conducted on technologies that allow viewers to freely view high-definition images with resolutions that greatly exceed high-definition quality, such as 4K resolution, 8K resolution, and huge panoramic images, while allowing viewers to freely operate images at their preferred positions and sizes. (For example, refer nonpatent literature 1). Non-Patent
その上で、視聴者が、巨大なパノラマ映像から、前述した視聴スタイルのように好みの位置や大きさを自由に操作しながら視聴する場合は、この1つのパノラマ映像ストリームから、視聴者の視聴している領域(表示領域)を含むいくつかのタイルのみを読み込んで復号し、その復号結果の画像からクリッピングして表示装置への表示を行っている(図11参照)。図11は、縦3タイル、横4タイルを読み込んで復号し、表示画像部分の画像をクリッピングして表示する例を示す説明図である。 In addition, when a viewer views a huge panoramic video while freely manipulating a favorite position and size as in the above-described viewing style, the viewer can view the video from this single panoramic video stream. Only some tiles including the current area (display area) are read and decoded, and the resulting decoded image is clipped and displayed on the display device (see FIG. 11). FIG. 11 is an explanatory diagram illustrating an example in which the vertical 3 tiles and the horizontal 4 tiles are read and decoded, and the image of the display image portion is clipped and displayed.
なお、視聴者の操作により表示画像の位置や大きさが変化した場合は、これに追随して読み込むタイルの位置を変更したり、大きさに応じて数を増減させ、これらを復号化することで、映像が途切れることなく表示を継続可能とするシステムとなっている。 If the position or size of the display image changes due to the viewer's operation, the position of the tile to be read can be changed following this, or the number can be increased or decreased according to the size, and these can be decoded. In this system, the video can be continuously displayed without interruption.
ところで、非特許文献1のシステムは、汎用的な計算機上においてソフトウェアで構成することが可能であり、以下の(a)、(b)の特性を有している。
(a)表示画像を得るのに、通常は複数のタイルを復号する必要がある。
(b)表示画像の位置や大きさが変化すると、通常復号するタイルの数が増減する。
Incidentally, the system of Non-Patent
(A) Usually, it is necessary to decode a plurality of tiles in order to obtain a display image.
(B) When the position or size of the display image changes, the number of tiles that are normally decoded increases or decreases.
しかしながら、(a)を行うためには、複数のタイルをリアルタイムに復号可能な高スペックな復号化を行うことができる再生装置が必要となるため、低スペックな再生装置では復号化の処理能力が不足し、表示画像を得るのに必要となるタイルが復号できない状況が発生し、この結果、映像が欠けてしまうという問題がある。 However, in order to perform (a), a playback device capable of performing high-spec decoding capable of decoding a plurality of tiles in real time is required. Therefore, a low-spec playback device has a decoding processing capability. There is a problem that the tiles necessary for obtaining the display image are insufficient and the tiles necessary for obtaining the display image cannot be decoded, and as a result, the video is missing.
また、このような問題を解決するために、ハードウェアによる専用復号化装置を導入した場合、(b)の特性から、最大で高精細映像全体を表示画像とすることを想定した全てのタイル数分の専用復号化装置が必要となるが、低スペックな再生装置では一般には専用復号化装置は1つ程度である。仮に、図11に示す表示画像を得ようとする場合、12個(縦3個×横4個)のタイルのうちの1つのタイルしか復号化ができない状況が発生し、同様に映像が欠けてしまうという問題がある。 Further, in order to solve such a problem, when a dedicated decoding device by hardware is introduced, the number of all tiles assuming that the entire high-definition video is the maximum display image from the characteristic of (b). However, a low-spec playback device generally has only one dedicated decoding device. If the display image shown in FIG. 11 is to be obtained, a situation occurs in which only one tile out of 12 tiles (3 vertical × 4 horizontal) can be decoded, and similarly, the video is missing. There is a problem of end.
本発明は、このような事情に鑑みてなされたもので、視聴中に表示する画面位置や画面の大きさが変化しても再生するべき映像が欠けてしまうことなく、映像の視聴を行うことができる映像再生装置及び映像配信装置を提供することを目的とする。 The present invention has been made in view of such circumstances, and allows viewing of a video without missing a video to be reproduced even if the screen position or the screen size displayed during viewing changes. It is an object of the present invention to provide a video reproduction device and a video distribution device capable of performing the above.
本発明は、全体映像データのうち指定した一部領域である映像再生領域の符号化映像データを映像配信装置から受信して再生する映像再生装置であって、前記映像配信装置に対して、指定した画面に映像を表示するために必要な解像度の前記映像再生領域の第1の映像データと、前記全体映像データを含み前記映像再生装置に表示する際の最低解像度の前記映像再生領域の第2の映像データとの配信を要求する配信要求手段と、前記第1の映像データと、前記第2の映像データとをそれぞれ符号化し、前記符号化映像データとして前記映像配信装置から配信された前記符号化映像データを受信する受信手段と、受信した前記符号化映像データを復号し、前記第1の映像データと前記第2の映像データとを重畳して指定した前記画面に表示する表示手段とを備えることを特徴とする。 The present invention is a video playback device that receives and plays back encoded video data of a video playback area, which is a specified partial area of the entire video data, from the video distribution device. A first video data in the video playback area having a resolution necessary for displaying video on the screen, and a second video playback area in the video resolution including the entire video data and displayed on the video playback device. The distribution request means for requesting distribution of the video data, the first video data, and the second video data, respectively, and the code distributed from the video distribution device as the encoded video data Receiving means for receiving the encoded video data, decoding the received encoded video data, and displaying the first video data and the second video data superimposed on the designated screen Characterized in that it comprises a shows means.
本発明は、前記全体映像データ上の前記画面の空間的位置、または前記画面の大きさが変更になった場合は、新たな前記画面に表示するべき前記符号化映像データを前記映像配信装置から受信し、受信した前記符号化映像データを復号して変更後の前記画面に表示することを特徴とする。 In the present invention, when the spatial position of the screen on the entire video data or the size of the screen is changed, the encoded video data to be displayed on the new screen is transferred from the video distribution device. Receiving, decoding the received encoded video data, and displaying the decoded video data on the changed screen.
本発明は、全体映像データのうち指定された一部領域である映像再生領域の符号化映像データを映像再生装置に対して配信する映像配信装置であって、前記映像再生装置から指定された画面に映像を表示するために必要な解像度の前記映像再生領域の第1の映像データと、前記全体映像データを含む前記映像再生装置に表示する際の最低解像度の前記映像再生領域の第2の映像データとを前記全体映像データからそれぞれ生成する配信データ生成手段と、前記第1の映像データと、前記第2の映像データとをそれぞれ符号化して、前記符号化映像データを生成する符号化手段と、前記符号化映像データを前記映像再生装置に対して配信する映像配信手段とを備えることを特徴とする。 The present invention is a video distribution device that distributes to a video playback device encoded video data in a video playback region that is a specified partial region of the entire video data, and a screen specified by the video playback device. The first video data in the video playback area having a resolution necessary for displaying video on the screen and the second video in the video playback area having the lowest resolution when displayed on the video playback device including the entire video data Distribution data generating means for generating data from the entire video data, encoding means for encoding the first video data and the second video data, respectively, and generating the encoded video data; And a video distribution means for distributing the encoded video data to the video reproduction device.
本発明は、前記第1の映像データの候補となる所定の条件を満たす映像データと、前記第2の映像データとを予め符号化した前記符号化映像データを複数保存しておく映像データ保存手段をさらに備え、前記映像配信手段は、前記映像データ保存手段から前記符号化映像データを読み出して前記映像再生装置に対して配信することを特徴とする。 The present invention provides video data storage means for storing a plurality of encoded video data obtained by previously encoding video data satisfying a predetermined condition as candidates for the first video data and the second video data. The video distribution means reads out the encoded video data from the video data storage means and distributes the encoded video data to the video reproduction device.
本発明は、前記映像データ保存手段は、データ量が最小となる前記符号化映像データのみを保存しておくことを特徴とする。 The present invention is characterized in that the video data storage means stores only the encoded video data having a minimum data amount.
本発明は、前記配信データ生成手段は、必要な解像度の数と、前記映像再生領域の位置ずらし量に基づき、前記全体映像データから複数の前記第1の映像データを生成し、前記符号化手段は、前記映像再生装置から指定された前記第1の映像データ及び前記第2の映像データのみを符号化することを特徴とする。 According to the present invention, the distribution data generating means generates a plurality of the first video data from the whole video data based on the number of required resolutions and the position shift amount of the video reproduction area, and the encoding means Only encodes the first video data and the second video data designated by the video playback device.
本発明によれば、視聴者の好みの画面位置や画面の大きさに合わせた解像度の映像データと、視聴中に表示する位置や大きさが変化しても映像が欠けることのないように映像全体を含む最低解像度の映像データとを重畳して表示するようにしたため、再生するべき映像が欠けてしまうことなく、映像の視聴を行うことができるという効果が得られる。 According to the present invention, video data having a resolution adapted to the viewer's favorite screen position and screen size and video so that the video is not lost even if the position or size displayed during viewing changes. Since the video data with the lowest resolution including the whole is superimposed and displayed, the video can be viewed without missing the video to be reproduced.
<第1実施形態>
以下、図面を参照して、本発明の第1実施形態による映像配信装置及び映像再生装置を説明する。図1は第1実施形態の構成を示すブロック図である。この図において、符号1は、映像を配信するサーバコンピュータ装置で構成する映像配信装置である。符号2は、映像配信装置1から配信された映像を再生する映像再生装置であり、コンピュータ端末装置で構成する。
<First Embodiment>
Hereinafter, a video distribution device and a video reproduction device according to a first embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing the configuration of the first embodiment. In this figure,
符号10は、配信する映像/音声情報を記憶する情報記憶部である。符号11は、映像再生装置2に対して送信すべき映像/音声情報を情報記憶部10から読み出して、さらに映像情報を複数の解像度に変換して出力する映像/音声情報出力部である。なお、映像/音声情報は、カメラ等から映像/音声情報出力部11に対してリアルタイムに直接入力された情報であってもよい。
符号12は、映像/音声情報出力部11から出力する映像/音声情報を符号化して出力する映像/音声符号化部である。映像/音声符号化部12は、映像/音声情報のうち、映像情報を複数の映像に分割(例えば、図10に示す分割)して符号化する。このとき、映像/音声符号化部12は、分割して得られた複数の映像の位置を示す複数映像位置情報を送出する。複数映像位置情報は、例えば図10のような分割の場合は、映像のサイズ(複数の解像度が有る場合は、それぞれの解像度毎の映像サイズ)、タイルのサイズを映像位置情報とし、予め左上からラスタスキャンして番号を付与するといった取り決めにより、映像位置を確定することができる情報である。
符号13は、映像/音声符号化部12から出力する複数映像位置情報を入力し、映像再生装置2に対して送信する複数映像情報送信部である。符号14は、映像/音声符号化部12から出力する符号化した映像/音声情報を保存する映像/音声情報保存部である。符号15は、送信バッファを備え、映像/音声情報保存部14に保存されている符号化映像/音声情報を映像再生装置2へ送信する送信部である。符号16は、注視領域を制御する注視領域制御部である。映像/音声情報保存部14は、注視領域制御部16が出力する注視領域を示す情報に基づき保存されている映像/音声情報のうち、該当する映像/音声情報を読み出して、送信部15へ出力する。
符号21は、複数映像位置情報送信部13から送信された複数映像位置情報を受信する複数映像位置情報受信部である。符号22は、複数映像位置情報受信部21が受信した複数映像位置情報に基づき、視聴している画面の操作結果から、次に必要となる適切な解像度のタイル群(=注視領域)を決定する画面操作制御部である。符号23は、映像配信装置1が配信すべき映像/音声情報として画面操作に応じた注視領域の映像/音声情報を映像配信装置1に対して要求する注視領域要求部である。注視領域制御部16は、注視領域要求部23から要求された注視領域の映像/音声情報を読み出すように映像/音声情報保存部14に対して指示する。
符号24は、受信バッファを備え、送信部15から送信された符号化映像/音声情報を受信する受信部である。符号25は、受信部24において受信した符号化映像/音声情報を入力し、復号して出力する映像/音声復号化部である。符号26は、映像/音声復号化部25において復号された映像/音声情報を再生するための表示装置とスピーカとから構成する映像/音声再生部である。
図1に示す映像配信装置1及び映像再生装置2は、映像再生装置2側の複数映像位置情報受信部21から画面操作制御部22に対して、複数映像位置情報を伝え、視聴者が視聴している注視領域が変更された場合には、複数映像位置情報から、変更された視聴者の注視領域を抽出し、これを注視領域要求部23に伝え、さらに、これを映像配信装置1側の注視領域制御部16に送出する。これにより、映像配信装置1側では映像再生装置2側の注視領域にあった複数の映像を送信部15に送出することで、視聴者の注視領域に適合した符号化済の映像情報が送信され、変更された視聴者の注視領域が視聴可能となる。
The
次に、図1に示す映像配信装置1及び映像再生装置2の動作を説明する。図2は、高精細映像(最高解像度)に対するビューの構成を示す図である。ビューとは、隣のタイルとの重なりの無い図10に示すタイル構成とは異なり、隣と重なりのある冗長性を持つ構成で、この構成のうち固定されたサイズの1枚の映像情報のことである。ここでは、高スペックな映像再生装置向けのタイルと区別するためビューと称する。まず、映像/音声情報出力部11は、情報記憶部10に記憶されている最高解像度の高精細映像から複数の解像度(高解像度、中解像度、低解像度)の映像を生成し出力する。図2の中解像度は1つに限らず複数あっても良い。また、低解像度は、1つのビューのサイズに高精細映像全体が収まるサイズとなる(図2に示す低解像度に該当する)。
Next, operations of the
次に、映像/音声符号化部12は、ある解像度の映像に対して、予め固定されたビューのサイズで、左端から少しずつビューの位置を右方向及び下方向にずらして、各ビューを構成する。図2に示す例では、高解像度の映像において、左端から(1)、(2)、(3)のように少しずつ右に位置をずらしてビューを構成している。また、ビューの複数映像位置情報は、映像のサイズ(複数の解像度が有る場合は、それぞれの解像度毎の映像サイズ)、ビューのサイズ、隣り合う右および下のビューのずらし量を映像位置情報とし、予め左上からラスタスキャンして番号を付与するといった取り決めにより、映像位置を確定することができる情報である。
Next, the video /
その後、映像/音声符号化部12は、それぞれのビュー単位で映像符号化を行い、さらに、国際標準規格であるH.264/MVCフォーマットに従って、各ビューの映像符号化データをまとめて1つの高精細映像用ストリームを構成して、映像/音声情報保存部14に保存する。このような高精細映像用ストリームを構成することで、図3に示す処理動作によって、低スペックの映像再生装置2において、高精細映像を視聴者が好きな位置や大きさで視聴することができるようにうなる。図3は、図1に示す映像配信装置1及び映像再生装置2の動作を示す図である。
Thereafter, the video /
まず、低スペックの映像再生装置2から、映像の表示領域が含まれる適切な高解像度のビュー(図3に示すビューAで、注視領域に相当する)と最低解像度のビュー(図3に示すビューB)を配信要求する(図3(i))。
First, from the low-spec
これを受けて、映像配信装置1は、映像再生装置2から要求されたビューA、Bを配信する(図3(ii))。映像再生装置2は、適切な高解像度のビューAと最低解像度のビューBを同時にデコード(2つのビューを復号)して重畳した映像を得る(図3(iii)。
In response to this, the
次に、映像再生装置2は、得られた映像から視聴者の要求する位置、大きさの映像をクリッピングして、映像/音声再生部26において映像を再生して表示する(図3(iv))。そして、視聴者の要求する位置、大きさ(映像の表示領域)が変更された場合は、適切な高解像度のビューを変更して、前述した処理動作を繰り返す。
Next, the
候補となる“適切な高解像度のビュー”(図3に示すビューA)を予め多数符号化して準備しておくと、高い映像品質が得られることになるが、ビュー数が膨大となるとデータ量が飛躍的に増大する問題がある。しかし、一方で候補となる“適切な高解像度のビュー”の数を減らすと、デジタルズームの拡大率が上がり、映像品質(映像の鮮明さ)が低下するという問題が生じる。 If a large number of candidate “appropriate high-resolution views” (view A shown in FIG. 3) are encoded and prepared in advance, high video quality can be obtained. However, if the number of views becomes large, the amount of data However, there is a problem that the number increases dramatically. However, if the number of “appropriate high-resolution views” that are candidates is reduced, the enlargement ratio of the digital zoom increases and the video quality (the sharpness of the video) decreases.
そこで、これらの問題を解決するため以下の処理動作によって、映像品質を維持しながらも、符号化対象となるビュー数を抑制する高精細映像ストリームのビューの構成を決定する。 Therefore, in order to solve these problems, a view configuration of a high-definition video stream that suppresses the number of views to be encoded while maintaining the video quality is determined by the following processing operation.
まず、各パラメータの定義を行う(図4参照)。図4は、各パラメータの定義を示す図である。
Vx:ビューの横のサイズ(pixel)
Vy:ビューの縦のサイズ(pixel)
α:隣り合うビューのずらし量の割合を表す係数(ビューずらし量係数(0<α<1))
β:隣り合う解像度との映像サイズの割合(解像度変換率(β>1))
Dx:低スペックの映像再生装置2の横の表示解像度(pixel)
Dy:低スペックの映像再生装置2の縦の表示解像度(pixel)
First, each parameter is defined (see FIG. 4). FIG. 4 is a diagram showing the definition of each parameter.
Vx: View horizontal size (pixel)
Vy: vertical size of the view (pixel)
α: coefficient indicating the ratio of the shift amount between adjacent views (view shift amount coefficient (0 <α <1))
β: Ratio of video size with adjacent resolution (resolution conversion rate (β> 1))
Dx: horizontal display resolution of the low-spec video playback device 2 (pixel)
Dy: Vertical display resolution (pixel) of the low-spec
ここでは、最適な高解像度のビューを1つのみデコードする前提があるため、以下の制約がある。
制約:表示領域が(Vx・(1−α),Vy・(1−α))(=右及び下との隣り合うビューとの重なりのサイズ)より大きくなったら、下の解像度のビューに移る。
この制約を越えて表示領域が大きくなると、その解像度では、1つのビューで表示領域をカバーできないケースが発生し、最適な解像度の映像が欠ける問題が発生するためにこの制約が必要である(図5参照)。図5は、最適な解像度の映像が欠ける問題を示す図である。
Here, since there is a premise that only one optimal high-resolution view is decoded, there are the following restrictions.
Restriction: When the display area becomes larger than (Vx · (1−α), Vy · (1−α)) (= size of overlap with adjacent views on the right and the lower side), the view shifts to the lower resolution view. .
If the display area becomes larger than this restriction, there may be a case where the display area cannot be covered by one view at that resolution, and this restriction is necessary because there is a problem that the video with the optimum resolution is missing (see FIG. 5). FIG. 5 is a diagram illustrating a problem that an image with an optimal resolution is missing.
上記の制約のもとで、映像品質として映像の鮮明さに影響をあたえるデジタルズームの拡大率(γ:γ>1)を一定以下とした上で、符号化対象となるビュー数を抑制する処理動作を図6を参照して説明する。図6は、映像/音声符号化部12が符号化対象となるビュー数を抑制するための解像度数nの候補を抽出する処理動作を示すフローチャートである。
Under the above constraints, the processing operation to suppress the number of views to be encoded with the digital zoom magnification ratio (γ: γ> 1) having an influence on the clearness of the video as the video quality Will be described with reference to FIG. FIG. 6 is a flowchart showing a processing operation in which the video /
まず、映像/音声符号化部12は、解像度数nの初期値を決定する(ステップS1)。
ビューずらし量=0で拡大率γwが閾値γ´以下になるような最小の解像度数nを決定する。最初にオリジナルコンテンツサイズと最低解像度のサイズを以下で定義する。
オリジナルコンテンツサイズは、横:Zx(pixel)、縦:Zy(pixel)とする。最低解像度のサイズは、横:Vx(ビューの横のサイズ)、縦:Vy(ビューの縦のサイズ)とする。
First, the video /
The minimum number of resolutions n is determined such that the view shift amount = 0 and the enlargement ratio γw is less than or equal to the threshold γ ′. First, the original content size and the minimum resolution size are defined below.
The original content size is horizontal: Zx (pixel) and vertical: Zy (pixel). The minimum resolution size is horizontal: Vx (horizontal size of view) and vertical: Vy (vertical size of view).
このとき、解像度数nのときの解像度変換率βは(1)式となる。なお、ここでは、オリジナルコンテンツサイズとビューのサイズのアスペクト比は同一もしくは、オリジナルコンテンツの方がビューのサイズよりもアスペクト比としては横に長いものとする(以下、コンテンツ条件1という)。
もしくは、オリジナルコンテンツの方がビューのサイズよりもアスペクト比としては縦に長いものの場合は(2)式となる(以下、コンテンツ条件2という)。
次に、デジタルズームの拡大率γは、コンテンツ条件1の場合は(3)式、コンテンツ条件2の場合は(4)式によって求める。ここでは、前述の制約(表示領域が(Vx・(1−α),Vy・(1−α))(=右及び下との隣り合うビューとの重なりのサイズ)より大きくなったら、下の解像度のビューに移る。)という条件から、下の解像度のビューに解像度が切り替わった直後のデジタルズームの拡大率γがもっとも大きくなる(映像の鮮明さが最も悪い)ことから、これをワーストケースのデジタルズームの拡大率としてγwとする。
上記の式より、映像品質として映像の鮮明さに影響をあたえるワーストケースのデジタルズームの拡大率が求められる。 From the above equation, the worst-case digital zoom magnification ratio that affects the sharpness of the image as the image quality is required.
なお、コンテンツ設計者によりデジタルズームの拡大率(γ:γ>1)の閾値(γ´)を規定する。 The threshold value (γ ′) of the digital zoom magnification (γ: γ> 1) is defined by the content designer.
ここから、仮想的にα=0としてデジタルズームの拡大率の最大値を求める。まず、初期値n=2のときのγwを求め、γw≦γ´を満たすまでnを1つずつ増加させ、最初に満たした解像度数nを初期値として決定する。 From this, the maximum value of the enlargement ratio of the digital zoom is obtained by virtually setting α = 0. First, γw when the initial value n = 2 is obtained, n is incremented by 1 until γw ≦ γ ′ is satisfied, and the initially satisfied resolution number n is determined as the initial value.
次に、映像/音声符号化部12は、ビューずらし量係数αを決定する(ステップS2)。すなわち、解像度数nを前提とした場合のγw≦γ´を満たす、最大のαを求める。なお、解像度変換率βは解像度数nに依存するため、前述の計算式で解像度数nに合わせてその都度βを算出する。コンテンツ条件1の場合は、(5)式によってαを求める。また、コンテンツ条件2の場合は、(6)式によってαを求める。
次に、映像/音声符号化部12は、制約条件のチェックを行う(ステップS3)。解像度数n、ビューずらし量係数αが決定すると、必要となるビューの総数が算出可能となる。なお、例えば、複数のビューを1つの映像ストリームとして扱えるH.264MVCを使用した場合は、規格の制約上、ビューの総数は1024であり、これを超えることはできない。以下、制約条件となるビューの総数をHresとする。
Next, the video /
このような制約条件のチェックのため、ビューの総数を算出する。まず、ビューずらし量係数αから「ビューずらし量」Ex,Eyを(7)式、(8)式によって算出する。
横:Ex=Even(Vx×α) ・・・(7)
縦:Ey=Even(Vy×α) ・・・(8)
なお、上記で関数Evenにて偶数化しているが、ビューの符号化時に支障が無ければ他の関数で整数化されても良い。
The total number of views is calculated for checking such a constraint condition. First, “view shift amounts” Ex and Ey are calculated from the view shift amount coefficient α according to equations (7) and (8).
Horizontal: Ex = Even (Vx × α) (7)
Vertical: Ey = Even (Vy × α) (8)
In the above description, the function Even is used to make the number even, but if there is no problem when the view is encoded, it may be converted to an integer using another function.
次に、ある解像度na(na=0,1,2,3…,n−1)のコンテンツサイズを、横:Fnax,縦:Fnayと定義する。
ある解像度na(na=0,1,2,3…,n−1)のコンテンツサイズは、オリジナルコンテンツサイズZx,Zyと解像度変換率βから(9)式、(10)式によって導出できる。ここで、解像度0がオリジナルコンテンツサイズとし、以後、解像度が低くなる毎に解像度1,2,3,4…,n−1となる。
Fnax=Even(Zx/βna) ・・・(9)
Fnay=Even(Zy/βna) ・・・(10)
なお、(9)式、(10)式において関数Evenにて偶数化しているが、ビューの符号化時に支障が無ければ他の関数で整数化されても良い。
Next, the content size of a certain resolution na (na = 0, 1, 2, 3,..., N−1) is defined as horizontal: Fnax, vertical: Fnay.
The content size of a certain resolution na (na = 0, 1, 2, 3,..., N−1) can be derived from the original content sizes Zx, Zy and the resolution conversion rate β by the equations (9) and (10). Here, the
Fnax = Even (Zx / β na ) (9)
Fnay = Even (Zy / β na ) (10)
Note that although the even number is set by the function Even in the formulas (9) and (10), it may be converted into an integer by another function as long as there is no problem when the view is encoded.
また、ある解像度naにおいて、コンテンツサイズから導出される、実際に符号化対象となる画像サイズを以下のように定義、算出する。ある解像度na(na=0,1,2,3,…)において実際に符号化対象となる画像サイズは、
横:Fnax−Vx≦0の場合
Gnax=Vx ・・・(11)
Fnax−Vx>0の場合
Gnax=Roundup(Fnax−Vx)/Ex,0)×Ex+Vx ・・・(12)
縦:Fnay−Vy≦0の場合
Gnay=Vy ・・・(13)
Fnay−Vy>0の場合
Gnay=Roundup(Fnay−Vy)/Ey,0)×Ey+Vy ・・・(14)
ここで、Roundup(a,b)は、aを小数点第b位まで表示して以下切り上げの意味である。
Also, the image size that is actually encoded, derived from the content size at a certain resolution na, is defined and calculated as follows. The image size actually to be encoded at a certain resolution na (na = 0, 1, 2, 3,...)
Horizontal: When Fnax−Vx ≦ 0 Gnax = Vx (11)
When Fnax−Vx> 0 Gnax = Roundup (Fnax−Vx) / Ex, 0) × Ex + Vx (12)
Vertical: When Fnay−Vy ≦ 0 Gnay = Vy (13)
When Fnay−Vy> 0 Gnay = Roundup (Fnay−Vy) / Ey, 0) × Ey + Vy (14)
Here, Roundup (a, b) means that “a” is displayed to the second decimal place and rounded up.
さらに、Ex,Eyから、ある解像度na(na=0,1,2,3…)において符号化で必要となるビュー数は、(15)式、(16)式によって算出する。
Hnax=Roundup(Gnax−Vx/Ex,0)+1 ・・・(15)
Hnay=Roundup(Gnay−Vy/Ey,0)+1 ・・・(16)
ここで算出されたHnax,Hnayより必要となるビューの総数(Hsum)を(17)式で算出する。
Hnax = Roundup (Gnax−Vx / Ex, 0) +1 (15)
Hnay = Roundup (Gnay−Vy / Ey, 0) +1 (16)
The total number of views (Hsum) required from Hnax and Hnay calculated here is calculated by equation (17).
そして、Hsum≦Hresの判定を行い、NGであればn←n+1としてステップS2に戻る。 Then, Hsum ≦ Hres is determined. If NG, n ← n + 1 and the process returns to step S2.
次に、映像/音声符号化部12は、データ量を算出する(ステップS4)。解像度数nに対するデータ量Hsum(n)はHsum(n)=Hsumとする。
Next, the video /
次に、映像/音声符号化部12は、終了条件のチェックを行う(ステップS5)。終了条件のチェックは、解像度n≦Hresの判定を行い、OKであればn←n+1としステップS2に戻り、NGであれば処理を終了する。
Next, the video /
最後に、映像/音声符号化部12は、min(Hsum(n))を満たすn(=nmin)を求め、この解像度数nminと対応するビューずらし量係数αでコンテンツの符号化を行い、高精細映像用ストリームを作成する。min(a(n))は、取りうるnのなかから、最小のa(n)を求める関数である。
Finally, the video /
このように、低スペックな映像再生装置でも復号可能なように、復号するタイル数(ビュー数)は最低限の数とする。具体的には、視聴者の好みの位置や大きさに合わせた適切な解像度のビュー(1つ目のビュー)と、その後、視聴中に表示する位置や大きさが変化しても映像が欠けることのないように同時に高精細映像全体を含む最低解像度のビュー(2つ目のビュー)の合計2つのビューを復号するようにした。さらに、復号するビューの数は2つで固定とした。これにより、2つのビューという最低限のデコード能力を持ちうれば、低スペックの映像再生装置であっても、映像が欠ける問題を解決しつつ、視聴者の好みの位置や大きさに合わせた高精細映像の視聴が可能となる。 In this way, the number of tiles to be decoded (the number of views) is set to a minimum so that even a low-spec video reproduction device can decode. Specifically, a view with the appropriate resolution (first view) that matches the viewer's preferred position and size, and then the image is missing even if the position or size displayed during viewing changes. In order to prevent this, a total of two views of the lowest resolution view (second view) including the entire high-definition video are decoded at the same time. Furthermore, the number of views to be decoded is fixed at two. As a result, if you have the minimum decoding capability of two views, even if it is a low-spec video playback device, it solves the problem of lacking video, and it is highly adapted to the viewer's preferred position and size. Fine video can be viewed.
また、低スペックの映像配信装置にビューから映像を切り出して表示する際のデジタルズームの拡大率を一定に抑えた上で、ビューの総数が最小となる(データ量が最小となる)ように高精細映像に対してビューを構成するようにした。これにより、ビューの数が膨大となると、データ量(符号化後に配信サーバに配置するファイルサイズ)が飛躍的に増大(例えば、H.264/MVCの規格上、通常の映像の最大1024倍)してしまう問題が発生することを防ぐことができる。 In addition, high-definition so that the total number of views is minimized (data amount is minimized) while keeping the zoom ratio of digital zoom constant when video is cut out and displayed on a low-spec video distribution device. The view is configured for the video. As a result, when the number of views becomes enormous, the amount of data (file size to be placed on the distribution server after encoding) increases dramatically (for example, a maximum of 1024 times that of normal video according to the H.264 / MVC standard). Can be prevented from occurring.
以上説明したように、高精細映像用ストリームに「ビュー」の概念を導入し、さらに、2つのビューのみを配信、再生するために、必要となる高精細映像用ストリームを作成する際に必要となる解像度数nとビューのずらし量係数αと、映像再生時のデジタルズームの拡大率γとの関係を最適化した。また、解像度数n、ビューのずらし量係数α、映像再生時のデジタルズームの拡大率γの関係から、ワーストケースのデジタルズームの拡大率γw以下でデータ量が最小となる高精細映像用ストリームの作成するようにした。 As explained above, it is necessary to introduce the concept of “view” into a high-definition video stream, and to create a high-definition video stream that is necessary to deliver and play back only two views. The relationship between the resolution number n, the view shift amount coefficient α, and the digital zoom magnification rate γ during video playback was optimized. Also, from the relationship between the number of resolutions n, the view shift amount coefficient α, and the digital zoom enlargement ratio γ during video reproduction, a high-definition video stream that produces a minimum amount of data below the worst case digital zoom enlargement ratio γw is created. I did it.
これにより、4K解像度、8K解像度及び巨大なパノラマ映像等のハイビジョン(HD)品質を大きく上回る解像度の高精細映像を、視聴者の好きな位置や大きさで視聴する際に、低スペックな映像再生装置であっても視聴することができる。また、視聴者が好きな位置や大きさを変更する際に、映像が欠けることなく、位置や大きさを変更することができる。さらに、高精細映像用ストリームの符号化に際して、ワーストケースのデジタルズームの拡大率以下で、データ量を最小限に抑えることができる。 As a result, low-spec video playback is possible when viewing high-definition video with a resolution that greatly exceeds high-definition (HD) quality, such as 4K resolution, 8K resolution, and huge panoramic video, at the viewer's favorite position and size. Even devices can be viewed. In addition, when changing the position and size that the viewer likes, the position and size can be changed without missing the video. Furthermore, when encoding a high-definition video stream, the amount of data can be kept to a minimum below the worst-case digital zoom magnification.
<第2実施形態>
次に、本発明の第2実施形態による映像配信装置及び映像再生装置を説明する。第2実施形態による映像配信装置及び映像再生装置は、ライブ映像の配信に対応するために、規格内のビューの総数(例えば、国際標準規格であるH.264/MVCであれば最大ビュー数は1024以内)、もしくはビューの切り出しを行うシステム上の性能限界に抑えて高精細映像のビューを構成し、一度、全てのビューを高精細映像から切り出した上で、その後、切り出した全てのビューでは無く、復号に必要な最低限の2つのビューのみを符号化して配信するものである。高精細映像を構成するビューの数が膨大となると、ライブ配信を前提として全ビューを符号化しようとした場合、飛躍的に増大したビューを符号化する装置の負荷を考慮すると、負荷の増大にあわせてシステム構成する装置数が膨大な数となる。さらに、映像/音声符号化部のクラスタ構成のスイッチ等の性能限界を超える可能性が高くなる問題が発生する。第2実施形態による映像配信装置及び映像再生装置は、このような問題を解決することができる。
Second Embodiment
Next, a video distribution device and a video playback device according to a second embodiment of the present invention will be described. The video distribution apparatus and the video reproduction apparatus according to the second embodiment have a total number of views within the standard (for example, the maximum number of views in the case of H.264 / MVC which is an international standard) in order to support the distribution of live video. (Up to 1024), or a high-definition video view is configured to limit the performance limit on the system that cuts out the view. Once all the views have been cut out from the high-definition video, Without encoding, only the minimum two views necessary for decoding are encoded and distributed. If the number of views that make up high-definition video becomes enormous, when trying to encode all the views on the premise of live distribution, the load on the device that encodes a dramatically increased view will be increased. In addition, the number of devices constituting the system is enormous. Furthermore, there is a problem that the possibility of exceeding the performance limit of the switch of the cluster configuration of the video / audio encoding unit is increased. The video distribution device and the video playback device according to the second embodiment can solve such problems.
図7は第2実施形態の構成を示すブロック図である。この図において、図1に示す第1実施形態による装置と同一の部分には同一の符号を付し、その説明を省略する。この図に示す装置が図1に示す装置と異なる点は、情報記憶部10、映像/音声情報出力部11、映像/音声符号化部12及び映像/音声情報保存部14に代えて、映像/音声情報取得部17及び映像/音声符号化部18が設けられている点である。
FIG. 7 is a block diagram showing the configuration of the second embodiment. In this figure, the same parts as those in the apparatus according to the first embodiment shown in FIG. The apparatus shown in this figure is different from the apparatus shown in FIG. 1 in that a video / audio
映像/音声情報取得部17は、ライブ演奏等を撮像するカメラ等で構成し、撮像によって得られた映像/音声情報を映像/音声符号化部18へ出力する。映像/音声符号化部18は、映像/音声情報取得部17から出力する映像/音声情報を符号化して出力する映像/音声符号化部である。映像/音声符号化部18は、映像/音声情報のうち、映像情報を複数の映像に分割(例えば、図10に示す分割)して符号化する。このとき、映像/音声符号化部12は、分割して得られた複数の映像の位置を示す複数映像位置情報を複数映像位置情報送信部13に対して送出する。複数映像位置情報は、例えば図10のような分割の場合は、映像のサイズ(複数の解像度が有る場合は、それぞれの解像度毎の映像サイズ)、タイルのサイズを映像位置情報とし、予め左上からラスタスキャンして番号を付与するといった取り決めにより、映像位置を確定することができる情報である。映像/音声符号化部18は、注視領域制御部16が出力する注視領域を示す情報に基づき映像/音声情報のうち、該当する映像/音声情報を読み出して、送信部15へ出力する。
The video / audio
次に、第2実施形態における高精細映像(最高解像度)に対するビューの構成を説明する。ビューは、前述した第1実施形態におけるビューと同等である。まず、最高解像度の高精細映像から複数の解像度(高解像度、中解像度、低解像度:図2参照)の映像を生成し出力する。中解像度は1つに限らず複数あっても良い。また、低解像度は、1つのビューのサイズに高精細映像全体が収まるサイズとなる(図2に示す低解像度に該当する)。 Next, a view configuration for high-definition video (maximum resolution) in the second embodiment will be described. The view is equivalent to the view in the first embodiment described above. First, a plurality of resolutions (high resolution, medium resolution, low resolution: see FIG. 2) are generated and output from a high-definition video with the highest resolution. The medium resolution is not limited to one and may be a plurality. Also, the low resolution is a size that fits the entire high-definition video in one view size (corresponding to the low resolution shown in FIG. 2).
次に、映像/音声符号化部18は、ある解像度の映像に対して、予め固定されたビューのサイズで、左端から少しずつビューの位置を右方向及び下方向にずらして、各ビューを構成する。図2に示す例では、高解像度の映像において、左端から(1)、(2)、(3)のように少しずつ右に位置をずらしてビューを構成している。
Next, the video /
その後、映像再生装置2から要求されたビューのみ映像符号化を行い、さらに、国際標準規格であるH.264/MVCフォーマットに従って、前述で要求されたビューの映像符号化データをまとめて1つの高精細映像用ストリームを構成する。このような高精細映像用ストリームを構成することで、図8に示す処理動作によって、低スペックの映像再生装置2において、高精細映像を視聴者が好きな位置や大きさで視聴することができるようになる。図8は、図7に示す映像配信装置1及び映像再生装置2の動作を示す図である。
Thereafter, only the view requested by the
まず、低スペックの映像再生装置2から、映像の表示領域が含まれる適切な高解像度のビュー(図8のビューAに相当)と最低解像度のビュー(図8のビューBに相当)を配信要求する(図8(i))。これを受けて、注視領域制御部16は、映像/音声符号化部18に対して、適切な高解像度のビューと、最低解像度のビューの符号化を要求する(図8(ii))。映像/音声符号化部18は、高精細映像から構成する全てのビューの映像を切り出した後、適切な高解像度のビューと、最低解像度のビューの2つのビューのみを符号化する(図8(iii))。そして、映像/音声符号化部18は、適切な高解像度のビューと、最低解像度のビューの2つのビューを1つのストリームとして送信する(図8(iv))。
First, an appropriate high-resolution view (corresponding to the view A in FIG. 8) and the lowest-resolution view (corresponding to the view B in FIG. 8) including the video display area are requested to be distributed from the low-spec
次に、送信部15は、適切な高解像度のビューと、最低解像度のビューの2つのビュー(ビューA、B)を配信する(図8(v))。これを受けて、映像/音声復号化部25は、適切な高解像度のビュー(ビューA)と最低解像度のビュー(ビューB)を同時にデコード(2つのビューを復号)して重畳した映像を得る(図8(vi))。そして、映像/音声再生部26は、得られた映像から視聴者の要求する位置、大きさの映像をクリッピングして、再生することにより映像を表示する(図8(vii))。そして、視聴者の要求する位置、大きさ(映像の表示領域)が変更された場合は、適切な高解像度のビューを変更して、前述した処理動作を繰り返す。
Next, the
このような処理を行うことにより、ビューBを同時に配信して映像が欠けなくなるようにすることができるとともに、高精細映像用のビューを構成した上で、復号に必要なビューのみを符号化することより符号化の負荷を低減することもできる。 By performing such processing, the view B can be simultaneously distributed so that the video is not lost, and a view for high-definition video is configured, and only the view necessary for decoding is encoded. Thus, the encoding load can be reduced.
次に、具体的にビューの構成するための処理動作について説明する。規格内のビューの総数(例えば、H.264/MVCであれば最大1024)、もしくは、高精細映像からビューの切り出しを行うシステム上の性能限界が規格内のビュー数以下であればその総数に抑えて高精細映像用のビューを構成する必要がある。そこで、規格内のビューの数もしくは、高精細映像からビューの切り出しを行うシステム上の性能限界のビュー数(以後、規格内およびシステム上の性能限界のビュー数のうち少ない方を「最大ビュー数」とする)以内で映像品質を最大とするように高精細映像用のビューの構成を決定する。 Next, the processing operation for constructing the view will be specifically described. The total number of views within the standard (for example, a maximum of 1024 for H.264 / MVC), or the total number of views if the performance limit on the system for extracting views from high-definition video is less than the number of views within the standard It is necessary to construct a view for high-definition video while suppressing it. Therefore, the number of views within the standard or the number of views with a performance limit on the system that extracts a view from a high-definition video (hereinafter, the smaller of the number of views with a performance limit within the standard and on the system is referred to as “the maximum number of views. “)” Is determined so that the video quality is maximized within the range.
まず、各パラメータの定義を行う。各パラメータは、第1実施形態のパラメータと同様である(図4参照)。
Vx:ビューの横のサイズ(pixel)
Vy:ビューの縦のサイズ(pixel)
α:隣り合うビューのずらし量の割合を表す係数(ビューずらし量係数(0<α<1))
β:隣り合う解像度との映像サイズの割合(解像度変換率(β>1))
Dx:低スペックの映像再生装置2の横の表示解像度(pixel)
Dy:低スペックの映像再生装置2の縦の表示解像度(pixel)
First, each parameter is defined. Each parameter is the same as the parameter of the first embodiment (see FIG. 4).
Vx: View horizontal size (pixel)
Vy: vertical size of the view (pixel)
α: coefficient indicating the ratio of the shift amount between adjacent views (view shift amount coefficient (0 <α <1))
β: Ratio of video size with adjacent resolution (resolution conversion rate (β> 1))
Dx: horizontal display resolution of the low-spec video playback device 2 (pixel)
Dy: Vertical display resolution (pixel) of the low-spec
ここでは、最適な高解像度のビューを1つのみデコードする前提があるため、以下の制約がある。
制約:表示領域が(Vx・(1−α),Vy・(1−α))(=右及び下との隣り合うビューとの重なりのサイズ)より大きくなったら、下の解像度のビューに移る。
この制約を越えて表示領域が大きくなると、その解像度では、1つのビューで表示領域をカバーできないケースが発生し、最適な解像度の映像が欠ける問題が発生するためにこの制約が必要である(図5参照)。
Here, since there is a premise that only one optimal high-resolution view is decoded, there are the following restrictions.
Restriction: When the display area becomes larger than (Vx · (1−α), Vy · (1−α)) (= size of overlap with adjacent views on the right and the lower side), the view shifts to the lower resolution view. .
If the display area becomes larger than this restriction, there may be a case where the display area cannot be covered by one view at that resolution, and this restriction is necessary because there is a problem that the video with the optimum resolution is missing (see FIG. 5).
上記の制約下のもとで、最大ビュー数以内で映像品質を最大とするように、映像品質として映像の鮮明さに影響をあたえるデジタルズームの拡大率(γ:γ>1)が最小となるビューの構成(=ビューずらし量:α、複数解像度の解像度数n)を決定する処理動作を図9を参照して説明する。図9は、映像/音声符号化部18が最大ビュー数以内で映像品質を最大とするように、映像品質として映像の鮮明さに影響をあたえるデジタルズームの拡大率(γ:γ>1)が最小となるビューの構成を決定する処理動作を示すフローチャートである。
Under the above restrictions, a view that minimizes the zoom ratio (γ: γ> 1) of the digital zoom that affects the sharpness of the video as the video quality so that the video quality is maximized within the maximum number of views. The processing operation for determining the configuration (= view shift amount: α, resolution number n of multiple resolutions) will be described with reference to FIG. FIG. 9 shows that the zoom ratio (γ: γ> 1) of the digital zoom that affects the clearness of the video as the video quality is minimized so that the video /
まず、映像/音声符号化部18は、解像度数nの初期値(=2)を設定する(ステップS11)。次に、映像/音声符号化部18は、解像度数nにおけるビューずらし量αnを算出する(ステップS12〜S15)。解像度数nにおけるビューずらし量αnを算出は、まず、オリジナルコンテンツサイズと最低解像度のサイズを以下で定義する。オリジナルコンテンツサイズは、横:Zx(pixel)、縦:Zy(pixel)とする。最低解像度のサイズは、横:Vx(ビューの横のサイズ)、縦:Vy(ビューの縦のサイズ)とする。
First, the video /
このとき、解像度数nのときの解像度変換率βは(1)式(第1実施形態と同様)となる。なお、ここでは、オリジナルコンテンツサイズとビューのサイズのアスペクト比は同一もしくは、オリジナルコンテンツの方がビューのサイズよりもアスペクト比としては横に長いものとする(以下、コンテンツ条件1という)。 At this time, the resolution conversion rate β when the number of resolutions is n is the expression (1) (similar to the first embodiment). Here, it is assumed that the aspect ratio of the original content size and the view size is the same, or that the original content has an aspect ratio longer than the view size (hereinafter referred to as content condition 1).
もしくは、オリジナルコンテンツの方がビューのサイズよりもアスペクト比としては縦に長いものの場合は(2)式(第1実施形態と同様)となる(以下、コンテンツ条件2という)。 Alternatively, when the original content has a vertically longer aspect ratio than the view size, the expression (2) (similar to the first embodiment) is used (hereinafter referred to as content condition 2).
次に、映像/音声符号化部18は、ビューずらし量の初期値としてαにΔα(Δαは0に近い非常に小さい数値)を設定する(ステップS12)。続いて、映像/音声符号化部18は、解像度数n、ビューずらし量係数αからビューの総数を算出する(ステップS13)。まず、ビューずらし量係数αから「ビューずらし量」Ex,Eyを(7)式、(8)式(第1実施形態と同様)によって算出する。なお、(7)式、(8)式において、関数Evenにて偶数化しているが、ビューの符号化時に支障が無ければ他の関数で整数化されても良い。
Next, the video /
次に、ある解像度na(na=0,1,2,3…,n−1)のコンテンツサイズを、横:Fnax,縦:Fnayと定義する。ある解像度na(na=0,1,2,3…,n−1)のコンテンツサイズは、オリジナルコンテンツサイズZx,Zyと解像度変換率βから(9)式、(10)式(第1実施形態と同様)によって導出できる。ここで、解像度0がオリジナルコンテンツサイズとし、以後、解像度が低くなる毎に解像度1,2,3,4…,n−1となる。なお、(9)式、(10)式において関数Evenにて偶数化しているが、ビューの符号化時に支障が無ければ他の関数で整数化されても良い。
Next, the content size of a certain resolution na (na = 0, 1, 2, 3,..., N−1) is defined as horizontal: Fnax, vertical: Fnay. The content size of a certain resolution na (na = 0, 1, 2, 3,..., N−1) is expressed by the equations (9) and (10) (first embodiment) from the original content sizes Zx and Zy and the resolution conversion rate β. As well). Here, the
また、ある解像度naにおいて、コンテンツサイズから導出される、実際に符号化対象となる画像サイズを以下のように定義、算出する。ある解像度na(na=0,1,2,3,…)において実際に符号化対象となる画像サイズは、第1実施形態と同様に、(11)式〜(14)式によって算出できる。 Also, the image size that is actually encoded, derived from the content size at a certain resolution na, is defined and calculated as follows. The image size that is actually the encoding target at a certain resolution na (na = 0, 1, 2, 3,...) Can be calculated by the equations (11) to (14), as in the first embodiment.
さらに、Ex,Eyから、ある解像度na(na=0,1,2,3…)において符号化で必要となるビュー数は、(15)式、(16)式(第1実施形態と同様)によって算出する。ここで算出されたHnax,Hnayより必要となるビューの総数(Hsum)を(17)式(第1実施形態と同様)で算出する。 Furthermore, from Ex and Ey, the number of views required for encoding at a certain resolution na (na = 0, 1, 2, 3...) Is expressed by equations (15) and (16) (similar to the first embodiment). Calculated by The total number of views (Hsum) required from the calculated Hnax and Hnay is calculated by equation (17) (similar to the first embodiment).
そして、映像/音声符号化部18は、終了条件のチェックを行う(ステップS14)。複数のビューを1つの映像ストリームとして扱えるH.264MVCを使用した場合は、規格の制約上、規格内のビュー数の総数は1024であり、これを超えることはできない。また、高精細映像からビューの切り出しを行うシステム上の性能限界のビュー数が、規格内のビュー数以下であれば、最大ビュー数は規格内のビュー数以下となる。これに合わせて、制約条件となるビューの総数(=最大ビュー数)をHresとする。したがって、映像/音声符号化部18は、Hsum≦Hresを満たすかを判定し、NGであれば、αにΔαを加算(α←α+Δα)して、再度ビューの総数を算出する。一方、OKであれば、このときのαをαn=α(αnは解像度nでのビューずらし量係数を示す)とする(ステップS15)。
Then, the video /
次に、映像/音声符号化部18は、ワーストケースのデジタルズームの拡大率を算出する(ステップS16)。デジタルズームの拡大率γは、コンテンツ条件1の場合は(3)式、コンテンツ条件2の場合は(4)式によって求める(第1実施形態と同様)。ここでは、前述の制約(表示領域が(Vx・(1−α),Vy・(1−α))(=右及び下との隣り合うビューとの重なりのサイズ)より大きくなったら、下の解像度のビューに移る。)という条件から、下の解像度のビューに解像度が切り替わった直後のデジタルズームの拡大率γがもっとも大きくなる(映像の鮮明さが最も悪い)ことから、これをワーストケースのデジタルズームの拡大率としてγwとする。上記の式より、映像品質として映像の鮮明さに影響をあたえるワーストケースのデジタルズームの拡大率が求められる。このγwより、r(n)=γw(r(n)は解像度数nのときのワーストケースのデジタルズームの拡大率を示す)として、解像度数nのときのワーストケースのデジタルズームの拡大率を保存する。
Next, the video /
次に、映像/音声符号化部18は、終了条件のチェックを行う(ステップS17)。終了条件のチェックは、解像度n≦Hresの判定を行い、OKであればn←n+1としステップS12に戻り、NGであれば処理を終了する。
Next, the video /
最後に、映像/音声符号化部18は、min(r(n))を満たす解像度数n(=nmin)を求め、この解像度数nminと対応するビューずらし量係数αnで、高精細映像から全てのビューの映像を切り出した後、配信要求のあったビューのみ映像符号化を行う。min(r(n))は、取りうるnのなかから、最小のr(n)を求める関数である。
Finally, the video /
以上説明したように、ライブ映像の符号化に際して「ビュー」の概念を導入し、さらに、2つのビューのみを配信、再生するようにした。また、ライブ映像の符号化に際して、「ビュー」の符号化の際には映像再生装置が必要とするビューのみを符号化するようにして、符号化クラスタの規模を縮小した。さらに、必要となるライブ映像の符号化を行う際の「ビューの構成」として解像度数nとビューのずらし量係数αを決定する際に、最大ビュー数以内で、映像再生時のワーストケースのデジタルズームを最小限に抑え高品質な映像で再生するようにした。 As described above, the concept of “view” is introduced when encoding live video, and only two views are distributed and reproduced. Also, when encoding a live video, only the view required by the video playback device is encoded when encoding a “view”, thereby reducing the size of the encoding cluster. Furthermore, when determining the resolution number n and view shift amount coefficient α as the “view configuration” when encoding the necessary live video, the worst-case digital zoom during video playback within the maximum number of views. It was made to play with high quality video.
これにより、4K、8Kおよび巨大なパノラマ映像等のハイビジョン(HD)品質を大きく上回る解像度の高精細のライブ映像を、視聴者の好きな位置や大きさで視聴する際に、低スペックな映像再生装置で視聴することができる。また、視聴者が好きな位置や大きさを変更する際に、映像が欠けることなく、位置や大きさを変更することができる。また、最大ビュー数以内で、ワーストケースのデジタルズームの拡大率を最小化したビューの構成で、ライブ映像の符号化を行うことができる。このため、ライブ映像を対象とした低スペックな映像再生装置で視聴者の好きな位置や大きさで視聴するスタイルの高品質な高精細映像の視聴が可能となる。 This enables low-spec video playback when viewing high-definition live video with a resolution that greatly exceeds high-definition (HD) quality, such as 4K, 8K, and huge panoramic video, at the viewer's favorite position and size. Can be viewed on the device. In addition, when changing the position and size that the viewer likes, the position and size can be changed without missing the video. Also, live video can be encoded with a view configuration that minimizes the worst-case digital zoom magnification within the maximum number of views. For this reason, it is possible to view high-quality high-definition video in the style of viewing at a viewer's favorite position and size with a low-spec video playback device for live video.
前述した実施形態における映像配信装置及び映像再生装置をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、PLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されるものであってもよい。 You may make it implement | achieve the video delivery apparatus and video reproduction apparatus in embodiment mentioned above with a computer. In that case, a program for realizing this function may be recorded on a computer-readable recording medium, and the program recorded on this recording medium may be read into a computer system and executed. Here, the “computer system” includes an OS and hardware such as peripheral devices. The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, the “computer-readable recording medium” dynamically holds a program for a short time like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory inside a computer system serving as a server or a client in that case may be included and a program held for a certain period of time. Further, the program may be for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in the computer system. It may be realized using hardware such as PLD (Programmable Logic Device) or FPGA (Field Programmable Gate Array).
以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行ってもよい。 As mentioned above, although embodiment of this invention has been described with reference to drawings, the said embodiment is only the illustration of this invention, and it is clear that this invention is not limited to the said embodiment. is there. Therefore, additions, omissions, substitutions, and other modifications of the components may be made without departing from the technical idea and scope of the present invention.
低スペックの再生端末に対して高精細映像を配信するために、映像品質を制御して映像の配信、映像の再生を行うことが不可欠な用途に適用できる。 In order to deliver high-definition video to low-spec playback terminals, it can be applied to applications where it is indispensable to control video quality and distribute video and play video.
1・・・映像配信装置、10・・・情報記憶部、11・・・映像/音声情報出力部、12・・・映像/音声符号化部、13・・・複数映像位置情報送信部、14・・・映像/音声情報保存部、15・・・送信部、16・・・注視領域制御部、17・・・映像/音声情報取得部、18・・・映像/音声符号化部、2・・・映像再生装置、21・・・複数映像位置情報受信部、22・・・画面操作制御部、23・・・注視領域要求部、24・・・受信部、25・・・映像/音声復号化部、26・・・映像/音声再生部
DESCRIPTION OF
Claims (6)
前記映像配信装置に対して、指定した画面に映像を表示するために必要な解像度の前記映像再生領域の第1の映像データと、前記全体映像データを含み前記映像再生装置に表示する際の最低解像度の前記映像再生領域の第2の映像データとの配信を要求する配信要求手段と、
前記第1の映像データと、前記第2の映像データとをそれぞれ符号化し、前記符号化映像データとして前記映像配信装置から配信された前記符号化映像データを受信する受信手段と、
受信した前記符号化映像データを復号し、前記第1の映像データと前記第2の映像データとを重畳して指定した前記画面に表示する表示手段と
を備えることを特徴とする映像再生装置。 A video playback device that receives and plays back encoded video data of a video playback area that is a specified partial area of the entire video data,
The video distribution device includes a first video data in the video playback area having a resolution necessary for displaying video on a designated screen, and a minimum at the time of display on the video playback device including the entire video data. Distribution request means for requesting distribution of the second video data in the video reproduction area of resolution;
Receiving means for encoding the first video data and the second video data, respectively, and receiving the encoded video data distributed from the video distribution device as the encoded video data;
A video reproduction apparatus comprising: display means for decoding the received encoded video data and displaying the first video data and the second video data on the designated screen by superimposing the first video data and the second video data.
前記映像再生装置から指定された画面に映像を表示するために必要な解像度の前記映像再生領域の第1の映像データと、前記全体映像データを含む前記映像再生装置に表示する際の最低解像度の前記映像再生領域の第2の映像データとを前記全体映像データからそれぞれ生成する配信データ生成手段と、
前記第1の映像データと、前記第2の映像データとをそれぞれ符号化して、前記符号化映像データを生成する符号化手段と、
前記符号化映像データを前記映像再生装置に対して配信する映像配信手段と
を備えることを特徴とする映像配信装置。 A video distribution device that distributes encoded video data of a video playback area, which is a specified partial area of the entire video data, to a video playback device,
The first video data in the video playback area having the resolution necessary for displaying video on the screen designated by the video playback device, and the minimum resolution for displaying on the video playback device including the entire video data. Distribution data generating means for generating second video data in the video playback area from the entire video data,
Encoding means for encoding the first video data and the second video data, respectively, to generate the encoded video data;
A video distribution device comprising: video distribution means for distributing the encoded video data to the video reproduction device.
前記映像配信手段は、前記映像データ保存手段から前記符号化映像データを読み出して前記映像再生装置に対して配信することを特徴とする請求項3に記載の映像配信装置。 Video data storage means for storing a plurality of encoded video data obtained by previously encoding video data satisfying a predetermined condition as candidates for the first video data and the second video data;
4. The video distribution device according to claim 3, wherein the video distribution unit reads the encoded video data from the video data storage unit and distributes the encoded video data to the video reproduction device.
前記符号化手段は、前記映像再生装置から指定された前記第1の映像データ及び前記第2の映像データのみを符号化することを特徴とする請求項3に記載の映像配信装置。 The distribution data generating means generates a plurality of the first video data from the whole video data based on the number of necessary resolutions and the position shift amount of the video playback area,
4. The video distribution apparatus according to claim 3, wherein the encoding means encodes only the first video data and the second video data designated by the video reproduction apparatus.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013108404A JP6006680B2 (en) | 2012-11-19 | 2013-05-22 | Video distribution apparatus and video distribution program |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012252899 | 2012-11-19 | ||
JP2012252899 | 2012-11-19 | ||
JP2013108404A JP6006680B2 (en) | 2012-11-19 | 2013-05-22 | Video distribution apparatus and video distribution program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014116922A true JP2014116922A (en) | 2014-06-26 |
JP6006680B2 JP6006680B2 (en) | 2016-10-12 |
Family
ID=51172470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013108404A Active JP6006680B2 (en) | 2012-11-19 | 2013-05-22 | Video distribution apparatus and video distribution program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6006680B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016090849A (en) * | 2014-11-06 | 2016-05-23 | 株式会社アクセル | Image reproduction method, image reproduction device, and image reproduction program |
JP2019022132A (en) * | 2017-07-20 | 2019-02-07 | 日本放送協会 | Video transmission apparatus, video reception apparatus, and program therefor |
JP2019516297A (en) * | 2016-04-08 | 2019-06-13 | ヴィズビット インコーポレイテッド | View-aware 360-degree video streaming |
CN110710207A (en) * | 2017-12-17 | 2020-01-17 | 谷歌有限责任公司 | Searching for video distortion in360degree video |
JP2021022773A (en) * | 2019-07-25 | 2021-02-18 | 日本放送協会 | Video encoder, regenerator and program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08149356A (en) * | 1994-11-17 | 1996-06-07 | Canon Inc | Moving picture display device |
JP2007081465A (en) * | 2005-09-09 | 2007-03-29 | Canon Inc | Remote controller and imaging apparatus |
JP2010212811A (en) * | 2009-03-06 | 2010-09-24 | Panasonic Corp | Moving image encoding device and moving image decoding device |
-
2013
- 2013-05-22 JP JP2013108404A patent/JP6006680B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08149356A (en) * | 1994-11-17 | 1996-06-07 | Canon Inc | Moving picture display device |
JP2007081465A (en) * | 2005-09-09 | 2007-03-29 | Canon Inc | Remote controller and imaging apparatus |
JP2010212811A (en) * | 2009-03-06 | 2010-09-24 | Panasonic Corp | Moving image encoding device and moving image decoding device |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016090849A (en) * | 2014-11-06 | 2016-05-23 | 株式会社アクセル | Image reproduction method, image reproduction device, and image reproduction program |
JP2019516297A (en) * | 2016-04-08 | 2019-06-13 | ヴィズビット インコーポレイテッド | View-aware 360-degree video streaming |
JP2019022132A (en) * | 2017-07-20 | 2019-02-07 | 日本放送協会 | Video transmission apparatus, video reception apparatus, and program therefor |
CN110710207A (en) * | 2017-12-17 | 2020-01-17 | 谷歌有限责任公司 | Searching for video distortion in360degree video |
CN110710207B (en) * | 2017-12-17 | 2023-10-20 | 谷歌有限责任公司 | Method for streaming video, content server and readable storage medium |
CN110710207B9 (en) * | 2017-12-17 | 2023-11-17 | 谷歌有限责任公司 | Method for streaming video, content server and readable storage medium |
JP2021022773A (en) * | 2019-07-25 | 2021-02-18 | 日本放送協会 | Video encoder, regenerator and program |
JP7417373B2 (en) | 2019-07-25 | 2024-01-18 | 日本放送協会 | Video encoding device, playback device and program |
Also Published As
Publication number | Publication date |
---|---|
JP6006680B2 (en) | 2016-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6305279B2 (en) | Video compression device and video playback device | |
JP5089658B2 (en) | Transmitting apparatus and transmitting method | |
US11218773B2 (en) | Video delivery | |
EP2490179B1 (en) | Method and apparatus for transmitting and receiving a panoramic video stream | |
JP6075889B2 (en) | Video distribution device and video playback device | |
JP6013920B2 (en) | Apparatus and method for processing video content | |
US9756328B2 (en) | System, terminal, and method for dynamically adjusting video | |
KR101528863B1 (en) | Method of synchronizing tiled image in a streaming service providing system of panoramic image | |
JP6006680B2 (en) | Video distribution apparatus and video distribution program | |
KR20170005366A (en) | Method and Apparatus for Extracting Video from High Resolution Video | |
TWI786572B (en) | Immersive media providing method and acquiring method, device, equipment and storage medium | |
US20200228837A1 (en) | Media information processing method and apparatus | |
US10666903B1 (en) | Combining encoded video streams | |
JP5941000B2 (en) | Video distribution apparatus and video distribution method | |
JP2017123503A (en) | Video distribution apparatus, video distribution method and computer program | |
US9628769B2 (en) | Apparatus and method for generating a disparity map in a receiving device | |
US11457053B2 (en) | Method and system for transmitting video | |
CN104038776A (en) | Video processing apparatus and video processing method | |
JP2012222399A (en) | Video playback system, video playback method, and video playback device and program | |
JPWO2016009507A1 (en) | Video transmission / reception device and video display device | |
JP2018011197A (en) | Video distribution device, video coding device, video distribution method, video coding method, video distribution program and video coding program | |
JP2018011198A (en) | Video coding device, video coding method and video coding program | |
KR20170045633A (en) | Method for providing panoramic video service, panoramic video providing server and system | |
JP6224522B2 (en) | Video distribution device, video distribution method, and video distribution program | |
Stamos Katsigiannis et al. | 5G: Disruption in media and entertainment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150526 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160531 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160727 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160906 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160909 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6006680 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |