JP5941000B2 - Video distribution apparatus and video distribution method - Google Patents

Video distribution apparatus and video distribution method Download PDF

Info

Publication number
JP5941000B2
JP5941000B2 JP2013049387A JP2013049387A JP5941000B2 JP 5941000 B2 JP5941000 B2 JP 5941000B2 JP 2013049387 A JP2013049387 A JP 2013049387A JP 2013049387 A JP2013049387 A JP 2013049387A JP 5941000 B2 JP5941000 B2 JP 5941000B2
Authority
JP
Japan
Prior art keywords
video
size
resolution
video data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013049387A
Other languages
Japanese (ja)
Other versions
JP2014176017A (en
Inventor
亀田 明男
明男 亀田
勝彦 深澤
勝彦 深澤
木全 英明
英明 木全
明 小島
明 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013049387A priority Critical patent/JP5941000B2/en
Publication of JP2014176017A publication Critical patent/JP2014176017A/en
Application granted granted Critical
Publication of JP5941000B2 publication Critical patent/JP5941000B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、像配信装置び映像配信方法に関する。 The present invention relates to a Film image distribution apparatus beauty video distribution method.

近年、4K解像度、8K解像度及び巨大なパノラマ映像等のハイビジョン品質を大きく上回る解像度を持つ高精細映像から、視聴者が好みの位置や大きさで自由に操作しながら視聴する技術の研究が行われている。例えば、非特許文献1では、ハイビジョン品質を越える解像度の巨大なパノラマ映像を対象としている。   In recent years, research has been conducted on technologies that allow viewers to freely view high-definition images with resolutions that greatly exceed high-definition quality, such as 4K resolution, 8K resolution, and huge panoramic images, while freely operating them at their preferred positions and sizes. ing. For example, Non-Patent Document 1 targets a huge panoramic image with a resolution exceeding the high-vision quality.

非特許文献1によると、巨大なパノラマ映像を、まず複数のタイルに分割し、それぞれのタイル単位で映像符号化を行っている。さらに、国際標準規格であるH.264/MVCフォーマットに従って、各タイルの映像符号化データをまとめて1つのパノラマ映像ストリームを構成している。図6は、巨大なパノラマ映像などの高精細映像を複数のタイルに分割した例を示す図である。   According to Non-Patent Document 1, a huge panoramic video is first divided into a plurality of tiles, and video encoding is performed for each tile. In addition, H.I., an international standard. According to the H.264 / MVC format, the video encoded data of each tile is combined to form one panoramic video stream. FIG. 6 is a diagram illustrating an example in which a high-definition video such as a huge panoramic video is divided into a plurality of tiles.

その上で、視聴者が、巨大なパノラマ映像から、視聴スタイルに応じて好みの位置や大きさを自由に操作しながら視聴する場合は、この1つのパノラマ映像ストリームから、視聴者の視聴している領域(表示領域)を含むいくつかのタイルのみを読み込んで復号し、その復号結果の映像からクリッピングして表示デバイスへの表示を行っている。図7は、復号対象のタイルと表示画像の関係を示す図である。図7に示す例では、縦3タイル、横4タイルを読み込んで復号し、枠で囲った表示画像をクリッピングして、これを表示領域として表示することなる。   In addition, when the viewer views from a huge panoramic video while freely manipulating the desired position and size according to the viewing style, the viewer views from this single panoramic video stream. Only some tiles including the area (display area) are read and decoded, and the decoded video is clipped and displayed on the display device. FIG. 7 is a diagram illustrating a relationship between a tile to be decoded and a display image. In the example shown in FIG. 7, three vertical tiles and four horizontal tiles are read and decoded, and the display image surrounded by the frame is clipped and displayed as a display area.

なお、視聴者の操作により表示画像の位置や大きさが変化した場合は、これに追随して読み込むタイルの位置を変更したり、大きさに応じて数を増減させ、これらを復号化することで、映像が途切れることなく表示を継続可能とするシステムとなっている。   If the position or size of the display image changes due to the viewer's operation, the position of the tile to be read can be changed following this, or the number can be increased or decreased according to the size, and these can be decoded. In this system, the video can be continuously displayed without interruption.

ここで、図8を参照して、従来技術による映像配信システムの構成を説明する。図8は、従来技術による映像配信システムの構成を示すブロック図である。映像配信システムは、コンピュータ装置で構成するサーバ10と、コンピュータ装置で構成するクライアント20によって構成する。図8において、映像/音声情報出力部11が映像情報と音声情報を出力すると、映像/音声符号化部12は、この映像情報と音声情報を符号化する。なお、映像情報と音声情報は、映像/音声情報出力部11に予め保管されたファイル情報や、もしくは、カメラ等からリアルタイムに入力された情報でも良い。   Here, with reference to FIG. 8, the structure of the video delivery system by a prior art is demonstrated. FIG. 8 is a block diagram showing the configuration of a video distribution system according to the prior art. The video distribution system includes a server 10 configured by a computer device and a client 20 configured by the computer device. In FIG. 8, when the video / audio information output unit 11 outputs video information and audio information, the video / audio encoding unit 12 encodes the video information and audio information. The video information and audio information may be file information stored in advance in the video / audio information output unit 11 or information input in real time from a camera or the like.

次に、映像/音声符号化部12は、映像情報を、例えば図6に示すように複数のタイルに分割して、タイル毎に符号化する。このとき、映像/音声符号化部12は、分割した複数のタイルの位置を示す複数映像位置情報を複数映像位置情報送信部に対して出力する。なお、複数映像位置情報は、例えば図6に示す分割の場合には、全体映像のサイズ(複数の解像度が有る場合は、それぞれの解像度毎の映像サイズ)、タイルのサイズを映像位置情報とし、予め左上からラスタスキャンして番号を付与するといった取り決めにより、映像位置を確定した情報によって構成する。   Next, the video / audio encoding unit 12 divides the video information into a plurality of tiles, for example, as shown in FIG. At this time, the video / audio encoding unit 12 outputs multiple video position information indicating the positions of the divided plurality of tiles to the multiple video position information transmitting unit. For example, in the case of the division shown in FIG. 6, the multiple video position information includes the size of the entire video (if there are multiple resolutions, the video size for each resolution) and the tile size as the video position information, The image position is configured by information that is determined in advance by raster scanning from the upper left and assigning numbers.

一方、映像/音声情報保存部14は、符号化を行った映像情報と音声情報を一時保存する。送信部15は、映像/音声情報保存部14に一時保存されている符号化映像情報と符号化音声情報とをクライアント20へ送信する。これを受けて、クライアント20の受信部は、符号化済の映像情報、符号化済の音声情報を受信する。そして、映像/音声復号部は符号化済の映像情報、符号化済の音声情報の復号を行う。映像/音声再生部は、復号された映像情報と音声情報を再生する。これにより、視聴者は映像/音声を視聴することが可能となる。   On the other hand, the video / audio information storage unit 14 temporarily stores the encoded video information and audio information. The transmission unit 15 transmits the encoded video information and the encoded audio information temporarily stored in the video / audio information storage unit 14 to the client 20. In response to this, the receiving unit of the client 20 receives the encoded video information and the encoded audio information. The video / audio decoding unit decodes the encoded video information and the encoded audio information. The video / audio reproduction unit reproduces the decoded video information and audio information. As a result, the viewer can view the video / audio.

複数映像位置情報受信部21は、画面操作制御部22に対して複数映像位置情報を出力する。画面操作制御部22は、視聴者が視聴している注視領域(注視領域は表示領域を含む複数のタイルから構成される)が変更された場合には、複数映像位置情報から、変更された視聴者の注視領域を抽出し、これを注視領域要求部23に伝える。これを受けて、注視領域要求部23は、サーバ10の注視領域制御部16に対して送信する。注視領域制御部16は、注視領域の情報を映像/音声情報保存部14へ出力する。映像/音声情報保存部14は、注視領域を含む複数のタイルを送信部15に出力することで、視聴者の注視領域に適合した符号化済の映像情報が送信され、変更された視聴者の注視領域が視聴可能となる。   The multiple video position information receiving unit 21 outputs the multiple video position information to the screen operation control unit 22. When the gaze area that the viewer is watching (the gaze area is composed of a plurality of tiles including the display area) is changed, the screen operation control unit 22 changes the viewing from the plurality of video position information. The person's gaze area is extracted, and this is transmitted to the gaze area request unit 23. In response to this, the gaze area request unit 23 transmits the gaze area request unit 23 to the gaze area control unit 16 of the server 10. The gaze area control unit 16 outputs the gaze area information to the video / audio information storage unit 14. The video / audio information storage unit 14 outputs a plurality of tiles including the gaze area to the transmission unit 15 so that the encoded video information suitable for the viewer's gaze area is transmitted and the changed viewer's gaze information is changed. The gaze area can be viewed.

ところで、従来技術による映像配信システムは、表示画像を得るのに、通常は複数のタイルを復号する必要がある、復号するタイルの数は、表示画像の位置や大きさが変化すると通常は増減する、という特性を有している。そのため、複数のタイルをリアルタイムに復号可能な高機能な復号化を行うことができるクライアント20が必要となるため、低機能なクライアント20では復号化の処理能力が不足し、表示画像を得るのに必要となるタイルが復号できず、この結果、映像が欠けてしまうという問題がある。   By the way, in order to obtain a display image, a video distribution system according to the prior art usually needs to decode a plurality of tiles. The number of tiles to be decoded usually increases or decreases as the position or size of the display image changes. It has the characteristic of. For this reason, a client 20 capable of performing high-performance decoding capable of decoding a plurality of tiles in real time is required. Therefore, the low-function client 20 lacks the decoding processing capability and obtains a display image. Necessary tiles cannot be decoded, and as a result, there is a problem that the video is missing.

また、この問題を解決するために、ハードウェアによる専用復号化装置を導入したとした場合、最大で高精細映像全体を表示画像とすることを想定した全てのタイル数分の専用復号化装置が必要となるが、低機能なクライアント20では一般には専用復号化装置は1〜2つ程度備えているのが一般的であり、仮に図7に示す表示画像を得ようとしても、復号すべき12個のタイルのうちの1〜2つのタイルしか復号化できないため、依然として映像が欠けてしまう問題は解決できない。   In addition, in order to solve this problem, when a dedicated decoding device by hardware is introduced, dedicated decoding devices for all the tiles assuming that the entire high-definition video is a display image at the maximum are used. Although it is necessary, the low-functional client 20 generally has about one or two dedicated decoding devices. Even if it is intended to obtain the display image shown in FIG. Since only one or two of the tiles can be decoded, the problem that the video is still missing cannot be solved.

そこで、前述した視聴スタイルを前提に、複数のタイル(H.264/MVC形式)から1枚の映像(H.264/AVC形式)を生成する技術が検討されている(例えば、非特許文献2参照)。この技術により、複数のタイルを復号化することなく、1枚の映像のみを復号化することで低機能な端末でも、専用復号化装置等を使用することにより、前述の問題を解決することができる可能性がある。   Therefore, on the premise of the viewing style described above, a technique for generating one video (H.264 / AVC format) from a plurality of tiles (H.264 / MVC format) has been studied (for example, Non-Patent Document 2). reference). With this technology, it is possible to solve the above-mentioned problem by using a dedicated decoding device or the like even in a low-function terminal by decoding only one video without decoding a plurality of tiles. There is a possibility.

Hideaki Kimata, Shinya Shimizu, Yutaka Kunita, Megumi Isogai, and Yoshimitsu Ohtani :「Panorama video coding for user-driven interactive video application」,IEEE International Symposium on Consumer Electronics (ISCE) 2009,2009Hideaki Kimata, Shinya Shimizu, Yutaka Kunita, Megumi Isogai, and Yoshimitsu Ohtani: `` Panorama video coding for user-driven interactive video application '', IEEE International Symposium on Consumer Electronics (ISCE) 2009,2009 N.Uchihara,H.kasai,"Fast stream joiner for next-generation interactive video",IEEE Int.Conf.Consumer Electronisc2011(ICCE),pp.319-320,2011N. Uchihara, H.kasai, "Fast stream joiner for next-generation interactive video", IEEE Int. Conf. Consumer Electronisc 2011 (ICCE), pp. 319-320, 2011

しかしながら、非特許文献2に記載の映像配信システムにあっては、以下の特性を有している。
(1)1枚の映像を得るために復号するタイルの数は、表示画像の位置や大きさが変化すると通常は増減するため、1枚の映像サイズが変化する。
(2)1枚の映像のみでは、視聴者の好みの位置や大きさが変化した際に、視聴者の操作が想定よりも速いと、映像が欠けてしまう。
However, the video distribution system described in Non-Patent Document 2 has the following characteristics.
(1) Since the number of tiles to be decoded to obtain one image usually increases or decreases when the position or size of the display image changes, the size of one image changes.
(2) With only one video, when the viewer's favorite position and size change, if the viewer operates faster than expected, the video will be lost.

上記の(1)の特性は、低機能なクライアント端末で復号化する際には映像サイズが常に変化するため専用復号化装置の復号化の負荷が増大し、復号化できなくなる事象が発生しやすいという問題がある。さらに、上記の(2)の特性は、視聴者の好みの位置や大きさが変化した際に、適切な映像が配信されるまでの時間、映像が欠ける状態が発生するという問題がある。   The above characteristic (1) is that when decoding is performed by a low-function client terminal, the video size always changes, so that the decoding load of the dedicated decoding apparatus increases, and an event in which decoding cannot be performed easily occurs. There is a problem. Further, the characteristic (2) has a problem that when the viewer's favorite position or size changes, a state in which the video is missing for a time until an appropriate video is delivered occurs.

本発明は、このような事情に鑑みてなされたもので、再生処理の負荷を軽減できるとともに、映像が欠けることを抑えて高精細映像の視聴を可能にすることができる像配信装置び映像配信方法を提供することを目的とする。 The present invention has such has been made in view of the circumstances, it is possible to reduce the load of the regeneration process, image movies can allow the viewing of high-definition video with reduced that video lacks distribution device beauty An object is to provide a video distribution method.

本発明は、全体映像データのうち指定された一部の領域を符号化した符号化映像データを受信して再生する映像再生装置であって、映像表示画面に前記表示領域の映像を表示するために必要な解像度を有する第1の映像データと、最低解像度を有する前記全体映像データからなる第2の映像データとの配信を要求する配信要求手段と、前記第1の映像データ及び前記第2の映像データのそれぞれが符号化された前記符号化映像データを受信する受信手段と、受信した前記符号化映像データを復号し、前記第2の映像データに対して前記第1の映像データを重畳した映像データを前記映像表示画面に表示する表示手段とを備えることを特徴とする。   The present invention is a video playback apparatus that receives and plays back encoded video data obtained by encoding a specified part of the entire video data, and displays the video in the display area on a video display screen. Distribution request means for requesting distribution of the first video data having a resolution required for the second video data and the second video data composed of the entire video data having the lowest resolution, the first video data, and the second video data Receiving means for receiving the encoded video data in which each of the video data is encoded, and decoding the received encoded video data, and superimposing the first video data on the second video data Display means for displaying video data on the video display screen.

本発明は、前記表示手段は、前記全体映像データ上の前記表示領域の位置または大きさが変更になった場合に、新たな前記符号化映像データを受信し、受信した前記符号化映像データを復号して変更後の前記表示領域を前記映像表示画面に表示することを特徴とする。   In the present invention, when the position or size of the display area on the entire video data is changed, the display means receives the new encoded video data, and receives the received encoded video data. The display area after decoding and changing is displayed on the video display screen.

本発明は、前記映像表示画面のサイズを前記映像データの配信元に対して送信する装置情報送信手段を更に備え、前記受信手段は、前記映像表示画面のサイズに基づいて生成された前記符号化映像データを受信することを特徴とする。   The present invention further includes apparatus information transmitting means for transmitting the size of the video display screen to a distribution source of the video data, wherein the receiving means is configured to generate the encoding generated based on the size of the video display screen. It is characterized by receiving video data.

本発明は、全体映像データのうち指定した一部の領域を符号化した符号化映像データを配信する映像配信装置であって、映像表示画面に前記表示領域の映像データを表示するために必要な解像度を有する第1の映像データと、最低解像度を有する前記全体映像データからなる第2の映像データとを前記全体映像データからそれぞれ生成する配信データ生成手段と、前記第1の映像データと、前記第2の映像データとをそれぞれ符号化することにより前記符号化映像データを生成する符号化手段と、前記符号化映像データを配信する映像配信手段とを備えることを特徴とする。   The present invention is a video distribution device that distributes encoded video data obtained by encoding a specified part of the entire video data, and is necessary for displaying the video data of the display area on a video display screen. Distribution data generating means for generating first video data having resolution and second video data composed of the whole video data having the lowest resolution from the whole video data, the first video data, It comprises encoding means for generating the encoded video data by encoding second video data, and video distribution means for distributing the encoded video data.

本発明は、前記配信データ生成手段は、指定された拡大率に基づき決定されるN枚(Nは2以上の整数)の解像度の異なる前記全体映像データを用いて前記第1の映像データと第2の映像データを生成することを特徴とする。   In the present invention, the distribution data generating means uses the entire video data having different resolutions of N (N is an integer of 2 or more) determined based on a specified enlargement ratio, and the first video data and the first video data. 2 video data is generated.

本発明は、前記配信データ生成手段は、前記映像表示画面のサイズに基づき前記第1の映像データの解像度を決定することを特徴とする。   The present invention is characterized in that the distribution data generating means determines the resolution of the first video data based on the size of the video display screen.

本発明は、全体映像データのうち指定した一部の表示領域を符号化した符号化映像データを受信して再生する映像再生装置が行う映像再生方法であって、映像表示画面に前記表示領域の映像を表示するために必要な解像度を有する第1の映像データと、最低解像度を有する前記全体映像データからなる第2の映像データとの配信を要求する配信要求ステップと、前記第1の映像データ及び前記第2の映像データのそれぞれが符号化された前記符号化映像データを受信する受信ステップと、受信した前記符号化映像データを復号し、前記第2の映像データに対して前記第1の映像データを重畳した映像データを前記映像表示画面に表示する表示ステップとを有することを特徴とする。   The present invention relates to a video playback method performed by a video playback device that receives and plays back encoded video data obtained by encoding a specified part of a display area of the entire video data, and includes the display area on the video display screen. A distribution requesting step for requesting distribution of first video data having a resolution necessary for displaying video and second video data including the entire video data having the lowest resolution; and the first video data Receiving the encoded video data in which each of the second video data is encoded, decoding the received encoded video data, and performing the first video on the second video data And a display step of displaying the video data on which the video data is superimposed on the video display screen.

本発明は、全体映像データのうち指定した一部の領域を符号化した符号化映像データを配信する映像配信装置が行う映像配信方法であって、映像表示画面に前記表示領域の映像データを表示するために必要な解像度を有する第1の映像データと、最低解像度を有する前記全体映像データからなる第2の映像データとを前記全体映像データからそれぞれ生成する配信データ生成ステップと、前記第1の映像データと、前記第2の映像データとをそれぞれ符号化することにより前記符号化映像データを生成する符号化ステップと、前記符号化映像データを配信する映像配信ステップとを有することを特徴とする。   The present invention is a video distribution method performed by a video distribution apparatus that distributes encoded video data obtained by encoding a specified part of the entire video data, and displays the video data of the display area on a video display screen A distribution data generating step for generating first video data having a resolution necessary for performing the second video data including the whole video data having the lowest resolution from the whole video data; And a video distribution step for generating the encoded video data by encoding the video data and the second video data, respectively, and a video distribution step for distributing the encoded video data. .

本発明によれば、常に一定の映像サイズを復号化すればよいため、再生処理の負荷を軽減できるとともに、視聴者の好みの位置や大きさ変化しても映像が欠けることを抑えて高精細映像の視聴を可能にすることができるという効果が得られる。   According to the present invention, since it is only necessary to always decode a certain video size, it is possible to reduce the load of playback processing, and to suppress high-definition video even if the viewer's favorite position and size change. There is an effect that it is possible to view the video.

本発明の一実施形態の構成を示すブロック図である。It is a block diagram which shows the structure of one Embodiment of this invention. 高精細映像に対する合成タイルの構成例を示す図である。It is a figure which shows the structural example of the synthetic | combination tile with respect to a high definition image | video. 高精細映像ストリームを持つサーバからクライアントへの映像ストリームの配信動作を示す図である。It is a figure which shows the delivery operation | movement of the video stream from the server which has a high definition video stream to a client. 高精細映像の最低解像度と再生端末のアスペクト比の例を示す図である。It is a figure which shows the example of the minimum resolution of a high-definition image | video, and the aspect-ratio of a reproduction | regeneration terminal. 解像度数nを決定する処理動作を示すフローチャートである。It is a flowchart which shows the processing operation which determines the resolution number n. 巨大なパノラマ映像などの高精細映像を複数のタイルに分割した例を示す図である。It is a figure which shows the example which divided | segmented high-definition images, such as a huge panoramic image, into several tiles. 復号対象のタイルと表示画像の関係を示す図である。It is a figure which shows the relationship between the tile of decoding object, and a display image. 従来技術による映像配信システムの構成を示すブロック図である。It is a block diagram which shows the structure of the video delivery system by a prior art.

以下、図面を参照して、本発明の一実施形態による映像配信システムを説明する。図1は同実施形態の構成を示すブロック図である。この図において、図8に示す従来の装置と同一の部分には同一の符号を付し、その説明を省略する。この図に示す装置が従来の装置と異なる点は、サーバ10内に、合成タイル生成部17、再生端末情報受信部18が設けられ、クライアント20内に、再生端末情報送信部27が設けられている点である。   A video distribution system according to an embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the configuration of the embodiment. In this figure, the same parts as those in the conventional apparatus shown in FIG. The apparatus shown in this figure is different from the conventional apparatus in that a composite tile generation unit 17 and a reproduction terminal information reception unit 18 are provided in the server 10, and a reproduction terminal information transmission unit 27 is provided in the client 20. It is a point.

図1において、注視領域制御部16は、映像/音声情報保存部14に対して注視領域を出力する。映像/音声情報保存部14は、合成タイル生成部17に対して、注視領域の映像情報、音声情報を出力する。これを受けて、合成タイル生成部17は、受信した映像情報から合成タイルを生成し、合成タイルとして再度符号化された映像情報及び音声情報を送信部15に出力する。   In FIG. 1, the gaze area control unit 16 outputs the gaze area to the video / audio information storage unit 14. The video / audio information storage unit 14 outputs video information and audio information of the gaze area to the composite tile generation unit 17. In response to this, the composite tile generation unit 17 generates a composite tile from the received video information, and outputs the video information and audio information encoded again as the composite tile to the transmission unit 15.

一方、再生端末情報送信部27は、クライアント20(再生端末)の表示用ディスプレイの縦及び横のサイズを送信する。再生端末情報受信部18は、この表示用ディスプレイの縦及び横のサイズを映像/音声符号化部12へ出力する。このように再生端末情報送信部27から表示用ディスプレイの縦及び横のサイズを送信することにより、サーバ10側で合成タイルの大きさを決定することが可能になるとともに、クライアント20に対して表示用ディスプレイのサイズに基づく最低解像度の映像サイズを決定できるようになる。   On the other hand, the reproduction terminal information transmission unit 27 transmits the vertical and horizontal sizes of the display for display of the client 20 (reproduction terminal). The reproduction terminal information receiving unit 18 outputs the vertical and horizontal sizes of the display for display to the video / audio encoding unit 12. In this way, by transmitting the vertical and horizontal sizes of the display for display from the playback terminal information transmitting unit 27, the size of the composite tile can be determined on the server 10 side and displayed on the client 20 The minimum resolution video size based on the display size can be determined.

次に、高精細映像に対する複数の解像度の映像の作成及び合成タイルの構成例について説明する。図2は、高精細映像に対する合成タイルの構成例を示す図である。合成タイルを作成する場合、まず、図2(a)の最高解像度の高精細映像から複数の解像度(中解像度、低解像度)の映像を作成する。図2(b)の中解像度は1つに限らず複数あっても良い。また、図2(c)の最低解像度は、1つの合成タイルのサイズに高精細映像全体が収まるサイズとなる。映像/音声符号化部12は、映像/音声情報出力部11から出力された最高解像度の映像から複数の解像度の映像を生成する。   Next, an example of creating a plurality of resolution videos for high-definition video and a composition tile will be described. FIG. 2 is a diagram illustrating a configuration example of a composite tile for high-definition video. When creating a composite tile, first, a video having a plurality of resolutions (medium resolution and low resolution) is created from the high-definition video having the highest resolution shown in FIG. The medium resolution in FIG. 2B is not limited to one and may be plural. In addition, the minimum resolution in FIG. 2C is a size that allows the entire high-definition video to fit within the size of one composite tile. The video / audio encoding unit 12 generates a video having a plurality of resolutions from the highest resolution video output from the video / audio information output unit 11.

次に、ある解像度の映像に対して、固定化された縦及び横のタイル数から成る固定された合成タイル(図2の例では、横3タイル、縦2タイルで固定された合成タイル)を、左端から1タイルずつ合成タイルの位置を右方向及び下方向にずらして、各合成タイルを構成する。図2(a)では、高解像度の映像において、左端から右方向(横)に2タイル分、下方向(縦)1タイル分位置をずらした合成タイルを示している。そして、それぞれの合成タイル単位で、非特許文献2の手法により、複数のタイルを合成タイル化する。また、映像/音声情報保存部14に保存されている映像情報を一度デコード(復号化)し、合成タイルと一致する位置の映像情報を再度エンコード(符号化)してもよい。   Next, a fixed composite tile consisting of a fixed number of vertical and horizontal tiles (a composite tile fixed in 3 horizontal and 2 vertical tiles in the example of FIG. 2) for a certain resolution image. Each composite tile is configured by shifting the position of the composite tile one tile at a time from the left end in the right direction and the downward direction. FIG. 2A shows a composite tile in which the positions of two tiles are shifted from the left end to the right (horizontal) by one tile and the downward (vertical) one tile from the left end. Then, a plurality of tiles are synthesized into tiles by the method of Non-Patent Document 2 for each synthesized tile. Alternatively, the video information stored in the video / audio information storage unit 14 may be once decoded (decoded), and the video information at a position matching the combined tile may be encoded (encoded) again.

次に、映像の視聴処理動作を説明する。図3は、高精細映像ストリームを持つサーバ10から低機能端末(クライアント20)への映像ストリームの配信動作を示す図である。前述したように、一度、複数の解像度に分解し、それぞれをタイル分割したうえで、合成タイルを構成することで、図3に示すように、以下の手順で低機能端末で、高精細映像を、視聴者が好きな位置や大きさで視聴することができる。   Next, the video viewing processing operation will be described. FIG. 3 is a diagram illustrating a video stream distribution operation from the server 10 having the high-definition video stream to the low-function terminal (client 20). As described above, once the image is decomposed into a plurality of resolutions and divided into tiles, and a composite tile is formed. As shown in FIG. , Viewers can watch at any position and size.

まず、クライアント20(低機能端末)から、映像の表示領域が含まれる、適切な高解像度の合成タイル(図3に示す合成タイルA)、最低解像度の合成タイル(図3の合成タイルB)を配信要求する(図3(i))。これを受けて、サーバ10は、クライアント20から要求された合成タイルA、合成タイルBを生成し、送信する(図3(ii))。   First, an appropriate high-resolution composite tile (composite tile A shown in FIG. 3) and a minimum-resolution composite tile (composite tile B in FIG. 3) including a video display area are included from the client 20 (low function terminal). A distribution request is made (FIG. 3 (i)). In response to this, the server 10 generates and transmits the composite tile A and composite tile B requested by the client 20 (FIG. 3 (ii)).

次に、クライアント20は、適切な高解像度の合成タイル(合成タイルA)と最低解像度の合成タイル(合成タイルB)を同時にデコード(2つの合成タイルを復号)して重畳した映像を得る。そして、クライアント20は、得られた映像から視聴者の要求する位置、大きさの映像をクリッピングし、クリッピングした表示領域を表示装置に表示する(図3(iii))。   Next, the client 20 simultaneously decodes an appropriate high-resolution composite tile (composite tile A) and a lowest-resolution composite tile (composite tile B) (decodes two composite tiles) to obtain a superimposed video. Then, the client 20 clips the video of the position and size requested by the viewer from the obtained video, and displays the clipped display area on the display device (FIG. 3 (iii)).

次に、視聴者の要求する位置、大きさ(映像の表示領域)が変更された場合は、適切な高解像度の合成タイルを変更して、前述した処理動作を繰り返す。例えば、一定以上の位置だけの変更があった場合は、同じ解像度の映像の別の合成タイルを選択する。また、一定以上の表示領域の拡大があった場合は、より低い解像度の映像の合成タイルを選択することになる。   Next, when the position and size (video display area) requested by the viewer are changed, an appropriate high-resolution composite tile is changed, and the above-described processing operation is repeated. For example, if there is a change only at a certain position or more, another composite tile of the video with the same resolution is selected. If the display area is enlarged beyond a certain level, a composite tile of a video with a lower resolution is selected.

次に、最低解像度の映像サイズを決定する動作について説明する。まず、クライアント20の表示用ディスプレイの縦及び横のサイズを映像/音声符号化部12に出力する。映像/音声符号化部12は、高精細映像のアスペクト比と、クライアント20の表示用ディスプレイのアスペクト比を比較して、複数解像度の最低解像度のサイズを決定する。   Next, the operation for determining the video size of the lowest resolution will be described. First, the vertical and horizontal sizes of the display for display of the client 20 are output to the video / audio encoding unit 12. The video / audio encoding unit 12 compares the aspect ratio of the high-definition video with the aspect ratio of the display for display of the client 20, and determines the minimum resolution size of the plurality of resolutions.

具体的には、「表示用ディスプレイの横のサイズ/縦のサイズ」≧「高精細映像の横のサイズ/縦のサイズ」を満たす場合は、最低解像度の縦のサイズを表示用ディスプレイの縦のサイズに合わせる。最低解像度の横のサイズは、この縦のサイズを基準に高精細映像のアスペクト比に合わせて決定する。   Specifically, if “horizontal size / vertical size of the display for display” ≧ “horizontal size / vertical size of the high-definition video” is satisfied, the vertical size of the minimum resolution is set to the vertical size of the display for display. Fit to size. The horizontal size of the minimum resolution is determined in accordance with the aspect ratio of the high-definition video based on this vertical size.

一方、「表示用ディスプレイの横のサイズ/縦のサイズ」<「高精細映像の横のサイズ/縦のサイズ」を満たす場合は、最低解像度の横のサイズを表示用ディスプレイの縦のサイズに合わせる。最低解像度の縦のサイズは、この横のサイズを基準に高精細映像のアスペクト比に合わせて決定する。   On the other hand, if “horizontal size of display display / vertical size” <“horizontal size of high-definition video / vertical size” is satisfied, the horizontal size of the lowest resolution is adjusted to the vertical size of the display display. . The vertical size of the lowest resolution is determined in accordance with the aspect ratio of the high-definition video based on the horizontal size.

上記のような2つの合成タイルの配信動作により、映像が欠けてしまうという問題を解決しつつ、視聴者が好きな位置や大きさで視聴することができるようになる。   The distribution operation of the two composite tiles as described above enables the viewer to view at the desired position and size while solving the problem that the video is missing.

次に、拡大率γwの観点から最適となる解像度数を決定する動作を説明する。常に一定の映像サイズで復号化することでクライアント20の負荷を軽減するために、どのくらいの表示領域のサイズの時に、最適な解像度の合成タイルを使用するかを決定する必要がある。そこで、まず以下のパラメータを定義する。
Zx:高精細のオリジナル画像の横のサイズ(pixel)
Zy:高精細のオリジナル画像の縦のサイズ(pixel)
Dx:クライアント20の表示用ディスプレイの横のサイズ(pixel)
Dy:クライアント20の表示用ディスプレイの縦のサイズ(pixel)
Vx:タイルの横のサイズ(pixel)
Vy:タイルの縦のサイズ(pixel)
Cx:合成タイルの横のサイズ(pixel)
Cy:合成タイルの縦のサイズ(pixel)
n:解像度数(n≧2を満たす整数)
β:隣り合う解像度との映像サイズの割合(解像度変換率(β>1))
Next, an operation for determining the optimum number of resolutions from the viewpoint of the enlargement ratio γw will be described. In order to reduce the load on the client 20 by always decoding with a constant video size, it is necessary to determine the size of the display area and the use of the composite tile having the optimum resolution. First, the following parameters are defined.
Zx: Horizontal size of high-definition original image (pixel)
Zy: Vertical size of high-definition original image (pixel)
Dx: the horizontal size of the display for display of the client 20 (pixel)
Dy: Vertical size (pixel) of the display for display of the client 20
Vx: size next to the tile (pixel)
Vy: vertical size of the tile (pixel)
Cx: Horizontal size of composite tile (pixel)
Cy: Vertical size of the composite tile (pixel)
n: Resolution number (integer satisfying n ≧ 2)
β: Ratio of video size with adjacent resolution (resolution conversion rate (β> 1))

ここで、解像度数とは異なる解像度の数を表す。例えば、図2及び図3の場合は3(最高解像度、中解像度、最低解像度)となる。なお、合成タイルのサイズは、クライアント20の表示用ディスプレイでのDot by Dot表示を可能とするため、以下の条件をAND条件で満たす(以下、合成タイル条件)ものとする。
合成タイル条件:Cx≧Dx AND Cy≧Dy を満たすCx,Cy
Here, the number of resolutions different from the number of resolutions is represented. For example, in the case of FIG. 2 and FIG. 3, it is 3 (highest resolution, middle resolution, lowest resolution). The size of the composite tile is assumed to satisfy the following condition with an AND condition (hereinafter referred to as a composite tile condition) in order to enable the dot by dot display on the display for display of the client 20.
Composite tile condition: Cx, Cy satisfying Cx ≧ Dx AND Cy ≧ Dy

ここで、クライアント20が低機能であることが前提であるため、合成タイルのサイズCx,Cyは、合成タイル条件を満たしつつ、最小のCx,Cyであることが推奨される。また、Cx,Cyは合成タイルのサイズであることから、1つのタイルの横のサイズ(Vx)及び縦のサイズ(Vy)の整数倍になる。   Here, since it is assumed that the client 20 has a low function, it is recommended that the size Cx, Cy of the composite tile is the minimum Cx, Cy while satisfying the composite tile condition. Since Cx and Cy are the sizes of the composite tiles, they are integral multiples of the horizontal size (Vx) and vertical size (Vy) of one tile.

次に、解像度数nのときの解像度変換率βは以下となる。図4は、高精細映像の最低解像度と再生端末のアスペクト比の例を示す図である。ここでは、図4に示すように、2つのパターンに分類して解像度変換率の計算を行う。   Next, the resolution conversion rate β when the number of resolutions is n is as follows. FIG. 4 is a diagram illustrating an example of the minimum resolution of high-definition video and the aspect ratio of the playback terminal. Here, as shown in FIG. 4, the resolution conversion rate is calculated by classifying into two patterns.

第1のパターンは、(Dx/Dy)≧(Zx/Zy)(以下、第1のコンテンツ条件という)の場合である。この場合は、オリジナルコンテンツより、クライアント20の表示用ディスプレイの方が横長となるため、最低解像度の縦のサイズがDyとして決定されることから、縦のサイズから

Figure 0005941000
として算出する(図4(a))。 The first pattern is a case where (Dx / Dy) ≧ (Zx / Zy) (hereinafter referred to as a first content condition). In this case, since the display for display of the client 20 is horizontally longer than the original content, the vertical size of the lowest resolution is determined as Dy.
Figure 0005941000
(FIG. 4 (a)).

第2のパターンは、(Dx/Dy)<(Zx/Zy)(以下、第2のコンテンツ条件という)の場合である。この場合は、オリジナルコンテンツより、クライアント20の表示用ディスプレイの方が縦長となるため、最低解像度の横のサイズがDxとして決定されることから、横のサイズから

Figure 0005941000
として算出する(図4(b))。 The second pattern is a case of (Dx / Dy) <(Zx / Zy) (hereinafter referred to as a second content condition). In this case, since the display for display of the client 20 is longer than the original content, the horizontal size of the lowest resolution is determined as Dx.
Figure 0005941000
(FIG. 4B).

さらに、解像度変更時のルールを適用する。解像度変更時のルールは、「再生端末において、Dot by Dotで表示された状態になったら、1つ下の解像度に変更する」である。このルール化において、最適な解像度数nを求めるため、図5に示す処理を適用する。図5は、解像度数nを決定する処理動作を示すフローチャートである。   Furthermore, the rules for changing the resolution are applied. The rule for changing the resolution is “change to the next lower resolution when the playback terminal is displayed as“ Dot by Dot ”.” In this rule formation, the processing shown in FIG. 5 is applied in order to obtain the optimum resolution number n. FIG. 5 is a flowchart showing a processing operation for determining the resolution number n.

まず、映像/音声符号化部12は、拡大率γwを決定する(ステップS1)。拡大率γwは、コンテンツ設計者が映像品質として規定したワーストケースのデジタルズームの拡大率を用いる(γw>1)。なお、ワーストケースのデジタルズームの拡大率とは、合成タイルの映像からクライアント20の表示ディスプレイに表示する際のデジタルズームの拡大率のうち、最も大きい拡大率(映像品質としては、最も悪い状態)を指す。また、ワーストケースが発生するのは、ある解像度から1つ解像度が下がった直後である。   First, the video / audio encoding unit 12 determines the enlargement ratio γw (step S1). The enlargement ratio γw uses the worst-case digital zoom enlargement ratio defined by the content designer as the video quality (γw> 1). Note that the worst-case digital zoom magnification rate is the largest magnification rate (the worst video quality state) among the digital zoom magnification rates when the composite tile image is displayed on the display of the client 20. . Also, the worst case occurs immediately after one resolution is lowered from a certain resolution.

次に、映像/音声符号化部12は、解像度数nの初期値を設定する(ステップS2)。解像度数nは、図3の高精細映像ストリームを持つサーバ10から低機能のクライアント20への映像ストリームの配信例から、最低値が「2」である必要があるため、これを初期値とする。   Next, the video / audio encoding unit 12 sets an initial value of the resolution number n (step S2). The resolution number n is set to an initial value because the minimum value needs to be “2” from the example of the distribution of the video stream from the server 10 having the high-definition video stream shown in FIG. .

次に、映像/音声符号化部12は、制約条件のチェックを行う(ステップS3)。高精細映像用ストリームを生成するに際しては、ストリームとして採用する符号化規格により、使用できるタイルの総数の上限が規定される(例えば、H.264/MVCを採用した場合は上限は1024)。このタイルの総数の上限(以下、Hresという)を超えないことが制約条件となる。   Next, the video / audio encoding unit 12 checks the constraint condition (step S3). When generating a high-definition video stream, the upper limit of the total number of tiles that can be used is defined by the encoding standard employed as the stream (for example, the upper limit is 1024 when H.264 / MVC is employed). The constraint is that the upper limit of the total number of tiles (hereinafter referred to as Hres) is not exceeded.

そこで、解像度数nで生成される高精細映像用ストリームのタイルの総数を以下にて算出する。まず、ある解像度na(na=0,1,2,3…,n−1)の画像サイズを横Fnax、 縦Fnayと定義する。これは、オリジナル画像サイズZx,Zyと解像度変換率βから以下のような数3の式、および数4の式から導出できる。ここで、解像度0がオリジナル画像サイズとし、以後、解像度が低くなる毎に解像度1,2,3,4,...,n−1となる。   Therefore, the total number of tiles of the high-definition video stream generated with the resolution number n is calculated as follows. First, the image size of a certain resolution na (na = 0, 1, 2, 3,..., N−1) is defined as horizontal Fnax and vertical Fnay. This can be derived from the following equations (3) and (4) from the original image sizes Zx, Zy and the resolution conversion rate β. Here, the resolution 0 is the original image size, and the resolutions 1, 2, 3, 4,. . . , N−1.

また、解像度数nが決定されると、解像度変換率βの算出が可能となる。具体的には、上述の第1のコンテンツ条件、第2のコンテンツ条件のどちらかから、解像度変換率βを算出し、以下にて解像度na(na=0,1,2,3…,n−1)の画像サイズを算出する。

Figure 0005941000
Figure 0005941000
ここで、関数Evenにて偶数化しているが、各解像度の映像符号化時に支障が無ければ他の関数で整数化されても良い。 When the resolution number n is determined, the resolution conversion rate β can be calculated. Specifically, the resolution conversion rate β is calculated from either the first content condition or the second content condition described above, and the resolution na (na = 0, 1, 2, 3,... The image size of 1) is calculated.
Figure 0005941000
Figure 0005941000
Here, the even number is set by the function Even, but it may be converted to an integer by another function as long as there is no problem at the time of video encoding at each resolution.

次に、Fnax,Fnayから、ある解像度na(na=0,1,2,3…,n−1)において符号化で必要となるタイル総数を以下の式で算出する。

Figure 0005941000
Figure 0005941000
ここで、Roundup(a,b)は、aを小数点第b位まで表示して以下切り上げの関数である。 Next, the total number of tiles necessary for encoding at a certain resolution na (na = 0, 1, 2, 3,..., N−1) is calculated from Fnax and Fna by the following formula.
Figure 0005941000
Figure 0005941000
Here, Roundup (a, b) is a function of displaying a up to the second decimal place and rounding up.

次に、算出されたHnax,Hnayより必要となるタイルの総数(Hsum)を以下の式で算出する。

Figure 0005941000
Next, the total number of tiles (Hsum) required from the calculated Hnax and Hnay is calculated by the following formula.
Figure 0005941000

そして、「Hsum≦Hres」の判定を行い、NGであればワーストケースのデジタルズームの拡大率(γw)に微小な量の値(Δγw)を増加(γw←γw+Δγw)させて(ワーストケースのデジタルズームの拡大率を少し大きくして)、ステップS1の処理に戻る。   Then, a determination of “Hsum ≦ Hres” is made, and if it is NG, the value (Δγw) of the minute amount is increased (γw ← γw + Δγw) to the enlargement ratio (γw) of the worst case digital zoom (worst case digital zoom The enlargement ratio is slightly increased), and the process returns to step S1.

一方、ステップS3において、OKであれば、映像/音声符号化部12は、拡大率のチェックを行う(ステップS4)。ステップS3において算出された解像度変換率βを用いると、解像度数nのときのワーストケースのデジタルズームの拡大率(γw_n)は解像度変換率βと同じ値になる。   On the other hand, if it is OK in step S3, the video / audio encoding unit 12 checks the enlargement ratio (step S4). When the resolution conversion rate β calculated in step S3 is used, the worst-case digital zoom magnification rate (γw_n) when the number of resolutions is n becomes the same value as the resolution conversion rate β.

そこで、γw_n(=β)≦γwを満たすか否かに基づき拡大率のチェックを行う。この結果、OKであれば、この時点の解像度数nを採用して処理を終了し、NGであればnを1増やして(n←n+1)としてステップS3の処理に戻る。   Therefore, the enlargement ratio is checked based on whether or not γw_n (= β) ≦ γw is satisfied. As a result, if OK, the number of resolutions n at this time is adopted and the process is terminated. If NG, n is incremented by 1 (n ← n + 1) and the process returns to step S3.

次に、解像度のレベルを一つ下げるか否かを判定するための閾値について説明する。前述した処理によって解像度数nが決定されたら、解像度変更時のルール「再生端末において、Dot by Dotで表示された状態になったら、1つ下の解像度に変更する」を用いて、解像度変換の閾値が以下のように算出可能となる。   Next, a threshold for determining whether or not to lower the resolution level by one will be described. When the number of resolutions n is determined by the above-described processing, the resolution conversion rule is changed using the rule for changing the resolution “change to the next lower resolution when the playback terminal is displayed as“ Dot by Dot ””. The threshold can be calculated as follows.

(Dx/Dy)≧(Zx/Zy)(第1のコンテンツ条件)の場合は、まず、最高解像度から次の解像度(解像度0→解像度1)の解像度変換の閾値は、解像度変更時のルールから以下にて定義され算出される。

Figure 0005941000
Figure 0005941000
In the case of (Dx / Dy) ≧ (Zx / Zy) (first content condition), first, the threshold for resolution conversion from the highest resolution to the next resolution (resolution 0 → resolution 1) is based on the rule at the time of resolution change. It is defined and calculated below.
Figure 0005941000
Figure 0005941000

以降の解像度(解像度na→解像度na+1)の解像度変換の閾値では、各解像度の大きさの比率は解像度変換率βで定義されていることから、以下にて算出できる。

Figure 0005941000
Figure 0005941000
In the resolution conversion threshold values of the subsequent resolutions (resolution na → resolution na + 1), the ratio of the size of each resolution is defined by the resolution conversion rate β, and can be calculated as follows.
Figure 0005941000
Figure 0005941000

(Dx/Dy)<(Zx/Zy)(第2のコンテンツ条件)の場合は、まず、最高解像度から次の解像度(解像度0→解像度1)の解像度変換の閾値は、解像度変更時のルールから以下にて定義され算出される。

Figure 0005941000
Figure 0005941000
In the case of (Dx / Dy) <(Zx / Zy) (second content condition), first, the threshold for resolution conversion from the highest resolution to the next resolution (resolution 0 → resolution 1) is based on the rule when changing the resolution. It is defined and calculated below.
Figure 0005941000
Figure 0005941000

以降の解像度(解像度na→解像度na+1)の解像度変換の閾値では、各解像度の大きさの比率は解像度変換率βで定義されていることから、以下にて算出できる。

Figure 0005941000
Figure 0005941000
In the resolution conversion threshold values of the subsequent resolutions (resolution na → resolution na + 1), the ratio of the size of each resolution is defined by the resolution conversion rate β, and can be calculated as follows.
Figure 0005941000
Figure 0005941000

このように、4K解像度、8K解像度及び巨大なパノラマ映像等のハイビジョン(HD)品質を大きく上回る解像度の高精細映像を、多視点映像符号化データとして作成した後、タブレット端末等の低機能な再生端末でも復号、再生を行えることを前提に、視聴者が視聴領域を拡大/縮小しても映像サイズを一定に保つことで復号化のための負荷を抑えた上で、高精細映像の一部を部分的に配信することができるようになる。   In this way, after creating high-definition video with a resolution that greatly exceeds high-definition (HD) quality, such as 4K resolution, 8K resolution, and enormous panoramic video, as multi-view video encoded data, low-performance playback on tablet devices, etc. Assuming that decoding and playback can be performed on the terminal as well, a portion of the high-definition video can be used while reducing the load for decoding by keeping the video size constant even when the viewer expands or reduces the viewing area. Can be partially delivered.

これを実現するために、低機能な再生端末でも復号可能なように、映像を拡大/縮小しても復号する際の映像サイズを常に一定のサイズにするようにする。具体的には、視聴対象の高精細映像を予め複数の解像度で構成し、視聴者の好みの位置や大きさに合わせた適切な解像度のタイルから1枚の映像(合成タイル)を得るようにした。   In order to realize this, the video size at the time of decoding is always set to a constant size even when the video is enlarged / reduced so that it can be decoded even by a low-function playback terminal. Specifically, a high-definition video to be viewed is configured in advance with a plurality of resolutions, and a single video (composite tile) is obtained from tiles with an appropriate resolution that matches the viewer's preferred position and size. did.

また、視聴中に表示する位置や大きさが変化しても映像が欠けることのないように、視聴者の好みの位置や大きさに合わせた適切な解像度のタイルから生成される1枚の映像(1つ目の映像)に加えて、同時に高精細映像全体を含むタイルから生成される1枚の映像(2つ目の映像)の合計2つの映像を復号するようにした。   In addition, one image generated from tiles having an appropriate resolution matched to the viewer's preferred position and size so that the image will not be lost even if the position or size displayed during viewing changes. In addition to (first video), a total of two videos of one video (second video) generated from tiles including the entire high-definition video at the same time are decoded.

このようにすることで、2つの映像という最低限の復号化能力を持ちうれば、低機能再生端末であっても、常に一定の映像サイズで復号化することで負荷を軽減し、さらに、視聴者の好みの位置や大きさに合わせて、映像が欠けることなしに高精細映像の視聴を可能とすることができる。   In this way, if it has the minimum decoding capability of two videos, even if it is a low function playback terminal, the load is reduced by always decoding with a constant video size, and further viewing and listening. It is possible to view high-definition video without missing the video according to the position and size desired by the user.

以上説明したように、高精細映像用ストリームに「合成タイル」の概念を導入し、さらに、2つの合成タイルのみを配信して、再生するようにした。また、必要となる高精細映像用ストリームを作成する際に必要となる解像度数nと、映像再生時のデジタルズームの拡大率γとの関係を明らかにした。さらに、解像度数n、映像再生時のデジタルズームの拡大率γの関係から、ワーストケースのデジタルズームの拡大率γw以下で実現可能な、タイル符号化時の負荷を最小化した高精細映像用ストリームの作成を可能とした。   As described above, the concept of “composite tile” is introduced into a high-definition video stream, and only two composite tiles are distributed and reproduced. Also, the relationship between the number of resolutions n required when creating the necessary high-definition video stream and the digital zoom magnification γ during video playback has been clarified. Furthermore, from the relationship between the number of resolutions n and the digital zoom magnification rate γ during video playback, the creation of a high-definition video stream that minimizes the load at the time of tile encoding that can be achieved with the worst-case digital zoom magnification rate γw or less. Made possible.

これにより、4K解像度、8K解像度及び巨大なパノラマ映像等のハイビジョン(HD)品質を大きく上回る解像度の高精細映像を、視聴者の好きな位置や大きさで視聴する際に、低機能なクライアント(再生端末)で視聴することができる。また、視聴者が好きな位置や大きさを変更する際に、映像が欠けることなく、位置や大きさを変更することができる。また、解像度数nの決定方法として、ワーストケースのデジタルズームの拡大率以下で、最小の解像度数nを決定することができ、タイルの符号化時の負荷を最小限に抑えることができる。   This makes it possible to use a low-functional client (4K resolution, 8K resolution, and high-definition video such as a huge panoramic video at a position and size desired by the viewer when viewing high-definition video that greatly exceeds the high-definition (HD) quality. Can be viewed on a playback terminal. In addition, when changing the position and size that the viewer likes, the position and size can be changed without missing the video. In addition, as a method for determining the number of resolutions n, the minimum number of resolutions n can be determined below the worst-case digital zoom magnification rate, and the load at the time of tile encoding can be minimized.

なお、図1におけるサーバ10、クライアント20の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより映像配信処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。   A program for realizing the functions of the server 10 and the client 20 in FIG. 1 is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system and executed to execute a video. Distribution processing may be performed. Here, the “computer system” includes an OS and hardware such as peripheral devices. The “computer system” includes a WWW system having a homepage providing environment (or display environment). The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Further, the “computer-readable recording medium” refers to a volatile memory (RAM) in a computer system that becomes a server or a client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line. In addition, those holding programs for a certain period of time are also included.

また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。   The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, what is called a difference file (difference program) may be sufficient.

以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行っても良い。   As mentioned above, although embodiment of this invention has been described with reference to drawings, the said embodiment is only the illustration of this invention, and it is clear that this invention is not limited to the said embodiment. is there. Accordingly, additions, omissions, substitutions, and other changes of the components may be made without departing from the technical idea and scope of the present invention.

再生処理の負荷を軽減できるとともに、映像が欠けることなしに高精細映像の視聴を可能にすることが不可欠な用途に適用できる。   It is possible to reduce the load of reproduction processing and to be applied to an application indispensable to enable high-definition video viewing without video loss.

10・・・サーバ、11・・・映像/音声情報出力部、12・・・映像/音声符号化部、13・・・複数映像位置情報送信部、14・・・映像/音声情報保存部、15・・・送信部、16・・・注視領域制御部、17・・・合成タイル生成部、18・・・再生端末情報受信部、20・・・クライアント、21・・・複数映像位置情報受信部、22・・・画面操作制御部、23・・・注視領域要求部、24・・・受信部、25・・・映像/音声復号化部、26・・・映像/音声再生部、27・・・再生端末情報送信部   DESCRIPTION OF SYMBOLS 10 ... Server, 11 ... Video / audio information output unit, 12 ... Video / audio encoding unit, 13 ... Multiple video position information transmission unit, 14 ... Video / audio information storage unit, DESCRIPTION OF SYMBOLS 15 ... Transmission part, 16 ... Gaze area control part, 17 ... Synthetic tile production | generation part, 18 ... Reproduction terminal information reception part, 20 ... Client, 21 ... Multiple video position information reception , 22... Screen operation control unit, 23... Gaze area request unit, 24... Reception unit, 25... Video / audio decoding unit, 26. ..Reproducing terminal information transmitter

Claims (4)

全体映像データのうち指定した一部の領域を符号化した符号化映像データを配信する映像配信装置であって、
映像表示画面に示領域の映像データを表示するために必要な解像度を有する第1の映像データと、前記全体映像のアスペクト比と前記映像表示画面のアスペクト比とに基づく最低解像度を有する前記全体映像データからなる第2の映像データとを前記全体映像データからそれぞれ生成する配信データ生成手段と、
前記第1の映像データと、前記第2の映像データとをそれぞれ符号化することにより前記符号化映像データを生成する符号化手段と、
前記符号化映像データを配信する映像配信手段と
を備え
前記配信データ生成手段は、
「前記映像表示画面の横のサイズ/縦のサイズ」≧「前記全体映像の横のサイズ/縦のサイズ」を満たす場合、前記最低解像度の縦のサイズは前記映像表示画面の縦のサイズに合わせ、前記最低解像度の横のサイズは前記最低解像度の縦のサイズを基準に前記全体映像のアスペクト比に合わせ、
「前記映像表示画面の横のサイズ/縦のサイズ」<「前記全体映像の横のサイズ/縦のサイズ」を満たす場合、前記最低解像度の横のサイズは前記映像表示画面の縦のサイズに合わせ、前記最低解像度の縦のサイズは前記最低解像度の横のサイズを基準に前記全体映像のアスペクト比に合わせることを特徴とする映像配信装置。
A video distribution device that distributes encoded video data obtained by encoding a specified part of the entire video data,
Entire with the lowest resolution based on the first image data having a resolution required, the aspect ratio of the entire image and the aspect ratio of the video display screen for displaying the video data in the table display region on the video display screen Distribution data generating means for generating second video data consisting of video data from the whole video data;
Encoding means for generating the encoded video data by encoding each of the first video data and the second video data;
Video distribution means for distributing the encoded video data ,
The delivery data generating means
When “horizontal size / vertical size of the video display screen” ≧ “horizontal size / vertical size of the entire video” is satisfied, the vertical size of the minimum resolution is set to the vertical size of the video display screen. The horizontal size of the lowest resolution is matched to the aspect ratio of the whole image based on the vertical size of the lowest resolution,
When “horizontal size / vertical size of the video display screen” <“horizontal size / vertical size of the entire video” is satisfied, the horizontal size of the minimum resolution is set to the vertical size of the video display screen. , vertical size of the minimum resolution video distribution device according to claim Rukoto fit the aspect ratio of the entire image based on the size of the lateral of the lowest resolution.
前記配信データ生成手段は、指定された拡大率に基づき決定されるN枚(Nは2以上の整数)の解像度の異なる前記全体映像データを用いて前記第1の映像データと第2の映像データを生成することを特徴とする請求項1に記載の映像配信装置。   The distribution data generation means uses the whole video data having different resolutions of N (N is an integer of 2 or more) determined based on a specified enlargement ratio, and the first video data and the second video data The video distribution apparatus according to claim 1, wherein: 前記配信データ生成手段は、前記映像表示画面のサイズに基づき前記第1の映像データの解像度を決定することを特徴とする請求項1または2に記載の映像配信装置。   The video distribution apparatus according to claim 1, wherein the distribution data generation unit determines a resolution of the first video data based on a size of the video display screen. 全体映像データのうち指定した一部の領域を符号化した符号化映像データを配信する映像配信装置が行う映像配信方法であって、
映像表示画面に示領域の映像データを表示するために必要な解像度を有する第1の映像データと、前記全体映像のアスペクト比と前記映像表示画面のアスペクト比とに基づく最低解像度を有する前記全体映像データからなる第2の映像データとを前記全体映像データからそれぞれ生成する配信データ生成ステップと、
前記第1の映像データと、前記第2の映像データとをそれぞれ符号化することにより前記符号化映像データを生成する符号化ステップと、
前記符号化映像データを配信する映像配信ステップと
を有し、
前記配信データ生成ステップでは、
「前記映像表示画面の横のサイズ/縦のサイズ」≧「前記全体映像の横のサイズ/縦のサイズ」を満たす場合、前記最低解像度の縦のサイズは前記映像表示画面の縦のサイズに合わせ、前記最低解像度の横のサイズは前記最低解像度の縦のサイズを基準に前記全体映像のアスペクト比に合わせ、
「前記映像表示画面の横のサイズ/縦のサイズ」<「前記全体映像の横のサイズ/縦のサイズ」を満たす場合、前記最低解像度の横のサイズは前記映像表示画面の縦のサイズに合わせ、前記最低解像度の縦のサイズは前記最低解像度の横のサイズを基準に前記全体映像のアスペクト比に合わせることを特徴とする映像配信方法。
A video distribution method performed by a video distribution apparatus that distributes encoded video data obtained by encoding a specified part of the entire video data,
Entire with the lowest resolution based on the first image data having a resolution required, the aspect ratio of the entire image and the aspect ratio of the video display screen for displaying the video data in the table display region on the video display screen A distribution data generation step of generating second video data composed of video data from the whole video data;
An encoding step of generating the encoded video data by encoding each of the first video data and the second video data;
Have a video distribution step of distributing the coded image data,
In the delivery data generation step,
When “horizontal size / vertical size of the video display screen” ≧ “horizontal size / vertical size of the entire video” is satisfied, the vertical size of the minimum resolution is set to the vertical size of the video display screen. The horizontal size of the lowest resolution is matched to the aspect ratio of the whole image based on the vertical size of the lowest resolution,
When “horizontal size / vertical size of the video display screen” <“horizontal size / vertical size of the entire video” is satisfied, the horizontal size of the minimum resolution is set to the vertical size of the video display screen. , vertical size of the minimum resolution video distribution wherein the Rukoto fit the aspect ratio of the entire image based on the size of the lateral of the lowest resolution.
JP2013049387A 2013-03-12 2013-03-12 Video distribution apparatus and video distribution method Expired - Fee Related JP5941000B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013049387A JP5941000B2 (en) 2013-03-12 2013-03-12 Video distribution apparatus and video distribution method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013049387A JP5941000B2 (en) 2013-03-12 2013-03-12 Video distribution apparatus and video distribution method

Publications (2)

Publication Number Publication Date
JP2014176017A JP2014176017A (en) 2014-09-22
JP5941000B2 true JP5941000B2 (en) 2016-06-29

Family

ID=51696826

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013049387A Expired - Fee Related JP5941000B2 (en) 2013-03-12 2013-03-12 Video distribution apparatus and video distribution method

Country Status (1)

Country Link
JP (1) JP5941000B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016191694A1 (en) * 2015-05-27 2016-12-01 Google Inc. Streaming spherical video
EP3440843A4 (en) * 2016-04-08 2019-08-28 Visbit Inc. View-aware 360 degree video streaming
JP7069970B2 (en) * 2017-07-18 2022-05-18 株式会社リコー Browsing system, image distribution device, image distribution method, program
US11307968B2 (en) * 2018-05-24 2022-04-19 The Calany Holding S. À R.L. System and method for developing, testing and deploying digital reality applications into the real world via a virtual world
JPWO2020036099A1 (en) * 2018-08-17 2021-09-02 ソニーグループ株式会社 Image processing device, image processing method and image processing program

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4795001B2 (en) * 2005-11-25 2011-10-19 船井電機株式会社 Content distribution system and content distribution apparatus
JP5068557B2 (en) * 2007-02-09 2012-11-07 三菱電機株式会社 Image transmission system
JP2009016934A (en) * 2007-06-29 2009-01-22 Toshiba Corp Video reproducing device
JP2010212811A (en) * 2009-03-06 2010-09-24 Panasonic Corp Moving image encoding device and moving image decoding device
JP5500649B2 (en) * 2010-09-29 2014-05-21 Kddi株式会社 Video distribution server
JP5594842B2 (en) * 2011-02-25 2014-09-24 Kddi株式会社 Video distribution device
JP5603840B2 (en) * 2011-07-11 2014-10-08 日本電信電話株式会社 Video tile size determination method
JP5603841B2 (en) * 2011-07-12 2014-10-08 日本電信電話株式会社 Video transmission method, video transmission apparatus, and program

Also Published As

Publication number Publication date
JP2014176017A (en) 2014-09-22

Similar Documents

Publication Publication Date Title
US8988506B2 (en) Transcoder supporting selective delivery of 2D, stereoscopic 3D, and multi-view 3D content from source video
US9148646B2 (en) Apparatus and method for processing video content
JP6305279B2 (en) Video compression device and video playback device
US9094657B2 (en) Electronic apparatus and method
CN108780584B (en) Conversion and preprocessing of spherical video for streaming and rendering
JP6075889B2 (en) Video distribution device and video playback device
JP5941000B2 (en) Video distribution apparatus and video distribution method
KR101528863B1 (en) Method of synchronizing tiled image in a streaming service providing system of panoramic image
KR102308604B1 (en) Method, apparatus and stream for formatting immersive video for legacy and immersive rendering devices
US20150304640A1 (en) Managing 3D Edge Effects On Autostereoscopic Displays
US10666903B1 (en) Combining encoded video streams
JP6006680B2 (en) Video distribution apparatus and video distribution program
EP2676446B1 (en) Apparatus and method for generating a disparity map in a receiving device
Kara et al. Towards adaptive light field video streaming
US20230099405A1 (en) Image data transfer apparatus, image display system, and image data transfer method
US10529129B2 (en) Dynamic selection mechanism for interactive video
US11659223B2 (en) System, device and method for displaying display-dependent media files
Stamos Katsigiannis et al. 5G: Disruption in media and entertainment
RU2583755C2 (en) Method of capturing and displaying entertaining activities and user interface for realising said method
JP6224522B2 (en) Video distribution device, video distribution method, and video distribution program
CN110213645A (en) Image transmission system
KR101521890B1 (en) Multi-view video steaming system and providing method thereof
JP2018148443A (en) Image transmission device and image transmission method, and image reception device and image reception method
JP2013183391A (en) Image processing apparatus, image processing method, electronic apparatus and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160517

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160519

R150 Certificate of patent or registration of utility model

Ref document number: 5941000

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees