JP7351398B2 - VR video encoding parameter calculation device, VR video encoding parameter calculation method, and program - Google Patents
VR video encoding parameter calculation device, VR video encoding parameter calculation method, and program Download PDFInfo
- Publication number
- JP7351398B2 JP7351398B2 JP2022502365A JP2022502365A JP7351398B2 JP 7351398 B2 JP7351398 B2 JP 7351398B2 JP 2022502365 A JP2022502365 A JP 2022502365A JP 2022502365 A JP2022502365 A JP 2022502365A JP 7351398 B2 JP7351398 B2 JP 7351398B2
- Authority
- JP
- Japan
- Prior art keywords
- quality
- video
- area
- estimate
- image quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
特許法第30条第2項適用 2019年7月11日に電子情報通信学会 信学技報 コミュニケーションクオリティ研究会(CQ) vol.119 No.125 CQ2019-52 pp.79-83にて発表Application of Article 30,
本発明は、VRの映像配信における符号化パラメータを算出するための技術に関連するものである。 The present invention relates to a technique for calculating encoding parameters in VR video distribution.
近年、ヘッドマウントディスプレイ(HMD)や符号化技術の発展により、ユーザが360°見渡すことのできる仮想現実(VR)映像を視聴する機会が増加している。それに伴い、VR映像配信サービスも増加し、ユーザがHMDやスマートフォン、従来の据え置き型ディスプレイ等を用いてVR映像を視聴する機会も増加している。 In recent years, with the development of head-mounted displays (HMDs) and encoding technology, opportunities for users to view virtual reality (VR) images that can be viewed 360° are increasing. Along with this, the number of VR video distribution services is increasing, and the opportunities for users to view VR video using HMDs, smartphones, conventional stationary displays, etc. are also increasing.
ユーザがVR映像を視聴するとき、例えば、HMDを装着して、ユーザが首を振る、体を動かすなどの行動によって視線方向を変えることができ、また、従来の据え置き型のディスプレイをマウス等で操作することによって映像の視聴方向を変えることができる。 When a user views a VR video, for example, by wearing an HMD, the user can change the direction of the line of sight by shaking his head or moving his body. You can change the viewing direction of the video by operating it.
VR映像配信においては、例えば非特許文献1で示されたMPEG-DASHと呼ばれる配信方式を用いて、サーバ側で複数のビットレートで符号化したファイルを用意し、帯域に応じて、最適なビットレートの映像を配信する。
In VR video distribution, for example, using a distribution method called MPEG-DASH shown in Non-Patent
また、VR映像の符号化・配信手法は大きく2種類ある。従来の2D映像と同様に、映像全体を一様な画質で配信する一様型の配信手法と、HMD等に表示されるユーザの視聴方向の映像を高画質で配信し、その他のHMD等に表示されない映像を低画質で配信、もしくは配信しないことによって帯域を抑えるというタイルベース配信と呼ばれる手法がある。 Furthermore, there are broadly two types of VR video encoding/distribution methods. Similar to conventional 2D video, there is a uniform distribution method that distributes the entire video with uniform image quality, and a high-quality distribution method that distributes the video in the user's viewing direction displayed on an HMD, etc., to other HMDs, etc. There is a method called tile-based distribution that reduces bandwidth by distributing videos that are not displayed in low quality or not distributing them at all.
一様型及びタイルベースのそれぞれに共通するVR映像の符号化による品質劣化として、ぼけや精細度の低下などによる空間的ひずみ、滑らかさの劣化やちらつきなどの時間的ひずみや、エッジ部分のノイズなどの時空間的ひずみなどによる劣化が存在する。 Quality deterioration due to VR video encoding that is common to both uniform type and tile-based methods includes spatial distortion due to blurring and reduction in definition, temporal distortion such as deterioration of smoothness and flickering, and noise at edges. There is deterioration due to spatiotemporal distortion such as.
また、タイルベースVR映像配信においては、ユーザは視線方向を変えない場合に視聴される高画質で送られるタイル(以下、高画質タイル)及び視線方向を変えた場合に一時的に視聴するタイル(以下、低画質タイル)の両方の映像を視聴する。ユーザが視聴方向を変化させた場合において、新しい視聴方向のタイルを低画質タイルから高画質タイルに切り替えるまでの間に時間(以下、切り替え遅延)があり、低画質の映像を視聴するため、映像品質の劣化を知覚する。切り替え遅延は符号化時の1チャンクの長さや、配信の際のバッファ時間等を変更することによってある程度設計することが可能であるが、切り替え遅延が長い場合では、低画質タイルを視聴する時間が長くなるため、低画質タイルによってユーザが体感する品質に対する寄与率がより大きくなると考えられる。 In addition, in tile-based VR video distribution, the user can view tiles sent in high image quality (hereinafter referred to as high-quality tiles) that are viewed when the user does not change the viewing direction, and tiles (hereinafter referred to as high-quality tiles) that are viewed temporarily when the user changes the viewing direction. Watch both videos (low quality tiles below). When a user changes the viewing direction, there is a time (hereinafter referred to as switching delay) until the tile in the new viewing direction is switched from a low-quality tile to a high-quality tile, and the video is Perceiving a deterioration in quality. The switching delay can be designed to some extent by changing the length of one chunk during encoding, the buffer time during distribution, etc., but if the switching delay is long, the time spent viewing low-quality tiles may be reduced. Since the tiles are longer, it is thought that the contribution rate to the quality experienced by the user by the low-quality tiles becomes larger.
また、高画質タイル及び低画質タイルの解像度によってHMD等に表示される高画質タイルの大きさも変化するため、ユーザが体感する品質に対する寄与率が解像度によって変化すると考えられる。また、タイルベースVR映像配信において低画質の映像を配信しない場合は、視聴方向を変化させた場合に一時的に映像が視聴できなくなるため、品質の劣化を知覚する。 Furthermore, since the size of a high-quality tile displayed on an HMD or the like changes depending on the resolution of the high-quality tile and the low-quality tile, it is thought that the contribution rate to the quality experienced by the user changes depending on the resolution. Furthermore, if low-quality video is not distributed in tile-based VR video distribution, the user will perceive a deterioration in quality because the video will temporarily become unwatchable when the viewing direction is changed.
前述のように、MPEG-DASHのような配信方式において、ユーザにとって最適な品質制御を実現するためには、予め用意する配信品質の最適化が必要である。配信品質は、映像コンテンツを符号化する際に与える符号化パラメータによって大きく変化するため、一様型、タイルベースそれぞれにおいて映像コンテンツに適した符号化パラメータを算出する技術の開発が重要である。符号化パラメータには、ビットレート、解像度、フレームレート、量子化パラメータなどがある。また、タイルベースVR映像配信においては、高画質領域と低画質領域の配信から感じる総合的な配信品質を考慮した符号化パラメータの導出も重要である。 As described above, in a distribution system such as MPEG-DASH, in order to achieve optimal quality control for users, it is necessary to optimize the distribution quality prepared in advance. Since distribution quality varies greatly depending on the encoding parameters given when encoding video content, it is important to develop techniques for calculating encoding parameters suitable for video content in both uniform and tile-based formats. Encoding parameters include bit rate, resolution, frame rate, and quantization parameters. Furthermore, in tile-based VR video distribution, it is important to derive encoding parameters that take into account the overall distribution quality felt from the distribution of high-quality areas and low-quality areas.
特許文献1では、従来の2Dの映像配信を対象として、配信品質の最適化を行うために、入力の目標品質に対応したビットレート等の符号化パラメータを導出する手法を記述している。具体的には、多くの符号化パラメータ値の組み合わせに対する品質を推定することで、目標品質を満たす組み合わせを導出している。なお、目標品質とは、1から5の間の任意の値でもよく、0から100の間の値としてもよい。
従来の2D映像の品質推定技術としては上記の特許文献1の他に、例えば、非特許文献2において標準化された技術が開示されている。
As a conventional 2D video quality estimation technique, in addition to the above-mentioned
しかし、これらの品質推定技術は2D映像を対象としており、VR映像を対象とした品質推定技術に関しては確立されていない。また、タイルベースVR映像配信においては、ユーザは高画質タイル及び低画質タイルの両方の映像を視聴するため、高品質及び低画質タイルそれぞれの画質が総合的な品質に影響を与える。 However, these quality estimation techniques are aimed at 2D images, and quality estimation techniques for VR images have not been established. Furthermore, in tile-based VR video distribution, since the user views videos of both high-quality tiles and low-quality tiles, the image quality of each of the high-quality and low-quality tiles affects the overall quality.
前述の通り、非特許文献2及び特許文献1などの従来の2D映像の品質推定や符号化パラメータ算出では一様型及びタイルベースVR映像を対象としていない。特に、タイルベースのVR映像配信では、このような高画質及び低画質タイルの総合的な品質に基づいた符号化パラメータ算出はできていない。
As mentioned above, conventional 2D video quality estimation and encoding parameter calculation such as Non-Patent
本発明は上記の点を鑑みてなされたものであり、VR映像配信において、目標品質に基づいてVR映像の符号化パラメータを算出することを可能とする技術を提供することを目的とする。 The present invention has been made in view of the above points, and an object of the present invention is to provide a technology that makes it possible to calculate encoding parameters of VR video based on target quality in VR video distribution.
開示の技術によれば、複数の符号化パラメータのそれぞれに対するVR映像の総合品質推定値を算出する品質推定部と、
与えられた目標品質を満たす総合品質推定値に対応する符号化パラメータを前記複数の符号化パラメータの中から抽出するVR映像パラメータ抽出部と、を備えるVR映像符号化パラメータ算出装置であって、
前記品質推定部は、
前記VR映像における高画質領域の品質推定値と前記VR映像における低画質領域の品質推定値とを算出するVR映像品質推定部と、
前記高画質領域の品質推定値と、前記低画質領域の品質推定値とに基づいて、前記総合品質推定値を算出する総合品質推定部と、を備え、
前記総合品質推定部は、
低画質領域表示状態から高画質領域表示状態に切り替わるまでの時間に関するパラメータと低画質領域の占める面積に関する情報のうちの少なくともいずれか1つに基づいて、高画質領域の品質と低画質領域の品質の総合品質に対する寄与度を算出し、
前記寄与度と、前記高画質領域の品質推定値と、前記低画質領域の品質推定値とに基づいて、前記総合品質推定値を算出する
VR映像符号化パラメータ算出装置が提供される。
According to the disclosed technology, a quality estimator that calculates an overall quality estimate of a VR video for each of a plurality of encoding parameters;
A VR video encoding parameter calculation device comprising: a VR video parameter extraction unit that extracts an encoding parameter corresponding to an overall quality estimate that satisfies a given target quality from among the plurality of encoding parameters,
The quality estimator includes:
a VR video quality estimator that calculates a quality estimate of a high-quality area in the VR video and a quality estimate of a low-quality area in the VR video;
an overall quality estimation unit that calculates the overall quality estimate based on the quality estimate of the high image quality area and the quality estimate of the low image quality area,
The overall quality estimating unit is
The quality of the high image quality area and the quality of the low image quality area based on at least one of the parameters related to the time taken to switch from the low image quality area display state to the high image quality area display state and information regarding the area occupied by the low image quality area. Calculate the contribution of
The overall quality estimate is calculated based on the contribution, the quality estimate of the high image quality area, and the quality estimate of the low image quality area.
A VR video encoding parameter calculation device is provided.
開示の技術によれば、VR映像配信において、目標品質に基づいてVR映像の符号化パラメータを算出することを可能とする技術を提供を達成する。 According to the disclosed technology, it is possible to provide a technology that makes it possible to calculate encoding parameters of VR video based on target quality in VR video distribution.
以下、図面を参照して本発明の実施の形態を説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。 Embodiments of the present invention will be described below with reference to the drawings. The embodiments described below are merely examples, and embodiments to which the present invention is applied are not limited to the following embodiments.
以下の実施形態においては、ユーザが360°見渡すことのできるVR映像を、ヘッドマウントディスプレイ(HMD)等を装着し、ユーザが首を振る、体を動かすなどの行動によって視線方向を変えることのできる状態、あるいは従来の据え置き型のディスプレイをマウス等の操作によって映像の視聴方向を変えることのできる等の状態で視聴した際に体感するVR映像品質の目標となる値に基づいて、VR映像の符号化パラメータ(ビットレート、解像度、フレームレート、量子化パラメータ等)を算出するVR映像符号化パラメータ算出装置について説明する。 In the following embodiments, the user can view a 360° VR image by wearing a head-mounted display (HMD), etc., and can change the direction of the user's line of sight by shaking his head, moving his body, etc. The coding of VR images is determined based on the target value of the VR image quality experienced when viewing the image on a conventional stationary display or in a state where the viewing direction of the image can be changed by operating a mouse, etc. A VR video encoding parameter calculation device that calculates encoding parameters (bit rate, resolution, frame rate, quantization parameter, etc.) will be described.
(第1の実施形態)
以下、図面とともに本発明の第1の実施形態について詳細に説明する。図1に本発明の第1の実施形態におけるVR映像符号化パラメータ算出装置10の構成を示す。(First embodiment)
Hereinafter, a first embodiment of the present invention will be described in detail with reference to the drawings. FIG. 1 shows the configuration of a VR video encoding
図1に示すように、VR映像符号化パラメータ算出装置10は、VR映像品質推定部15、寄与度算出部17を含む総合品質推定部16、及びVR映像パラメータ抽出部18を備える。なお、VR映像品質推定部15と総合品質推定部16とをまとめて品質推定部と称してもよい。第2の実施形態でも同様である。
As shown in FIG. 1, the VR video encoding
また、図1には、符号化条件設定部11、配信設定入力部12、目標品質入力部13、及びパラメータ設定値候補群入力部14が示されている。図示されるように、符号化条件設定部11から、VR映像品質推定部15、総合品質推定部16、及びVR映像パラメータ抽出部18に対して符号化パラメータが設定される。
FIG. 1 also shows an encoding
配信設定入力部12から、総合品質推定部16、及びVR映像パラメータ抽出部18に対して配信設定が入力される。目標品質入力部13からVR映像パラメータ抽出部18に対して目標品質が入力される。パラメータ設定値候補群入力部14から、VR映像品質推定部15、総合品質推定部16、及びVR映像パラメータ抽出部18に対して、符号化パラメータの候補群が入力される。以下、各部の動作をより具体的に説明する。
Distribution settings are input from the distribution
符号化条件設定部11は、VR映像配信のために必要な映像エンコードの設定(映像符号化設定)をVR映像符号化パラメータ算出装置10に入力する。ここで映像符号化設定とは、例えば、タイルベースVR映像の高画質タイル及び低画質タイルそれぞれのフレームレート、解像度、コーデック、ビットレート、量子化パラメータ(Quantization Parameter、以下QP)などを表す。なお、高画質タイル、低画質タイルをそれぞれ高画質領域、低画質領域と称してもよい。
The encoding
配信設定入力部12は、VR映像配信における配信設定をVR映像符号化パラメータ算出装置10に入力する。ここで配信設定とは、VR映像配信における切り替え遅延などを表す。目標品質入力部13は、配信されるVR映像の目標となる映像品質をVR映像符号化パラメータ算出装置10に入力する。
The distribution
パラメータ設定値候補群入力部14は、符号化条件設定部11及び配信設定入力部12で入力されていない符号化パラメータに対して、その符号化パラメータの設定値の候補を一つ以上、VR映像符号化パラメータ算出装置10に入力する。
The parameter setting value candidate
図2は、VR映像符号化パラメータ算出装置10における入力情報のイメージを示す図である。図2(a)に例示するビットレート以外の値が符号化条件設定部11及び配信設定入力部12及び目標品質入力部13により入力される。
FIG. 2 is a diagram showing an image of input information in the VR video encoding
また、図2(b)に示すように、パラメータ設定値候補群入力部14により、符号化条件設定部11及び配信設定入力部12及び目標品質入力部13で入力されていない符号化パラメータであるビットレートが入力される。
In addition, as shown in FIG. 2(b), the parameter setting value candidate
図2(b)は、パラメータ設定値(ビットレート)候補群として、低画質タイルについては5Mbps(固定)、高画質タイルについては、10~20Mbpsで1Mbpsごとの値が入力される場合を示している。 FIG. 2(b) shows a case where 5 Mbps (fixed) is input for low-quality tiles and values of 10 to 20 Mbps in 1-Mbps increments are input as parameter setting value (bit rate) candidate groups for high-quality tiles. There is.
パラメータ設定値候補群入力部14は、予め自身が有するデータベース等にパラメータ設定値候補を保持しておき、VR映像品質推定部15が、符号化条件設定部11及び配信設定入力部12及び目標品質入力部13からの入力で不足している符号化パラメータの候補を参照する形態でもよい。
The parameter setting value candidate
VR映像品質推定部15は、符号化条件設定部11及びパラメータ設定値候補群入力部14から入力された符号化パラメータに基づいて、VR映像の高画質タイル及び低画質タイルのそれぞれの品質推定値を算出し、パラメータ設定値候補群入力部14から入力された符号化パラメータの組の数に応じた品質推定を出力する。
The VR video
総合品質推定部16は、VR映像品質推定部15により出力された高画質タイルの品質及び低画質タイルの品質、パラメータ設定値候補群入力部14から入力された符号化パラメータ、及び配信設定を利用して、VR映像の総合品質を算出し、出力する。寄与度算出部17は、高画質タイルの品質及び低画質タイルの品質の総合品質に対する寄与度を算出する。
The overall
VR映像パラメータ抽出部18は、総合品質推定部16から出力された総合品質のうち、目標品質に対して近い品質となる符号化パラメータを抽出することで、高画質タイルと低画質タイルそれぞれの符号化パラメータを算出する。
The VR video
VR映像パラメータ抽出部18が出力する高画質タイル・低画質タイルの符号化パラメータの組は一つでもよいし、目標品質に対して近い(例えば、目標品質との差が0.1以内)品質となる複数の組あるいは目標品質を満たす品質となる全ての符号化パラメータの組を出力パラメータとしてもよい。なお、本明細書及び請求の範囲において、品質が目標品質以上である場合に加えて、品質が目標品質に近い(例えば、目標品質との差が0.1以内)場合についても「目標品質を満たす」と表現してもよい。また、目標品質に近くなる(例えば、目標品質との差が0.1以内)符号化パラメータのみを出力する場合において、品質が目標品質に近くなる場合を「目標品質を満たす」と表現してもよい。
The VR video
VR映像符号化パラメータ算出装置10における入力、算出される総合品質、出力の例を図3~図5に示す。
Examples of input, calculated overall quality, and output in the VR video encoding
この例においては、図3に示すように符号化条件設定部11、配信設定入力部12、及び目標設定入力部13から、高画質タイルの解像度(3840x1920)及び低画質タイルの解像度(1920x960)、フレームレート(30fps)、低画質タイル表示状態から高画質タイル表示状態への切り替え遅延(2秒)、目標品質(4.0)、コーデック(H.264)が与えられ、これら符号化条件、配信条件で目標品質と近くなるビットレートを算出する場合を示す。 In this example, as shown in FIG. 3, the resolution of high-quality tiles (3840x1920), the resolution of low-quality tiles (1920x960), The frame rate (30 fps), delay in switching from low-quality tile display state to high-quality tile display state (2 seconds), target quality (4.0), and codec (H.264) are given, and these encoding conditions and distribution A case is shown in which a bit rate close to the target quality is calculated based on the conditions.
また、図3に示すように、パラメータ設定値候補群については、低画質タイルが5Mbpsと固定され、高画質タイルのビットレートが20~10Mbpsで1Mbpsごとに入力として与えられる。 Further, as shown in FIG. 3, for the parameter setting value candidate group, the bit rate of the low image quality tile is fixed at 5 Mbps, and the bit rate of the high image quality tile is 20 to 10 Mbps, which is input every 1 Mbps.
VR映像品質推定部15及び総合品質推定部16によって、パラメータ設定値候補群のビットレートの組ごとに映像品質が推定され、総合品質が総合品質推定部16から出力される。図4に示すように、パラメータ設定値候補群入力部14から与えられたビットレートの候補(1)~(11)それぞれに対して総合品質が算出される。
The VR video
VR映像パラメータ抽出部18は、総合品質、配信設定、符号化パラメータ及び目標品質を入力とし、総合品質が目標品質と近いもの(例えば、目標品質との差の絶対値が0.1以内)を抽出し、それに対応する符号化パラメータ、配信設定、総合品質を、高画質タイル及び低画質タイルそれぞれの抽出後符号化パラメータ及び推定品質として出力する。
The VR video
図5に示す例では、候補(5)(高画質タイル15Mbps、低画質タイル5Mbps)及び候補(6)(高画質タイル14Mbps、低画質タイル5Mbps)が目標品質と総合品質との差の絶対値が0.1以内であるため抽出され、それらの候補に対応する抽出後の符号化パラメータが図5に示すとおりに出力される。
In the example shown in FIG. 5, candidate (5) (high
図3~図5の例では総合品質が目標品質と近くなる符号化パラメータを出力としているが、目標品質を満たす全ての符号化パラメータを出力してもよい。その場合は、総合品質が4.0以上である候補(1)~(6)に対応する符号化パラメータが出力される。 In the examples of FIGS. 3 to 5, the encoding parameters whose overall quality is close to the target quality are output, but all encoding parameters that satisfy the target quality may be output. In that case, encoding parameters corresponding to candidates (1) to (6) whose overall quality is 4.0 or higher are output.
上記の例では、目標品質と近くなる又は満たす符号化パラメータとして、遅延、解像度、フレームレート、コーデック及びビットレートを出力したが、ビットレートの代わりに、量子化パラメータ(QP)を出力することとしてもよい。その場合の例を図6~図8に示す。 In the above example, the delay, resolution, frame rate, codec, and bit rate are output as encoding parameters that are close to or meet the target quality, but instead of the bit rate, the quantization parameter (QP) may be output. Good too. Examples of such cases are shown in FIGS. 6 to 8.
図6~図8の例では、符号化条件設定部11、配信設定入力部12及び目標設定入力部13の入力は図3~図5で説明した例と同じである。図6~図8の例では、ビットレートの代わりにQPが用いられる。
In the examples shown in FIGS. 6 to 8, the inputs of the encoding
図6~図8の例において、パラメータ設定値候補群として、低画質タイルのQPは40と固定され、高画質タイルのQPは10から40まで1刻みで与えられている。 In the examples shown in FIGS. 6 to 8, as the parameter setting value candidate group, the QP of the low image quality tile is fixed at 40, and the QP of the high image quality tile is given from 10 to 40 in 1 increments.
図3~図5の例と同様にして、各QPの候補に対して品質が算出され、候補(14)(高画質タイルQP24、低画質タイルQP40)及び候補(15)(高画質タイルQP25、低画質タイルQP40)が目標品質と総合品質との差の絶対値が0.1以内であるため抽出され、それらの候補に対応する符号化パラメータが図8に示すように出力される。 Similar to the examples in FIGS. 3 to 5, the quality is calculated for each QP candidate, and candidate (14) (high-quality tile QP24, low-quality tile QP40) and candidate (15) (high-quality tile QP25, The low-quality tiles QP40) are extracted because the absolute value of the difference between the target quality and the overall quality is within 0.1, and the encoding parameters corresponding to these candidates are output as shown in FIG.
図3~図6、及び図7~図9の例では、VR映像符号化パラメータ算出装置10に、符号化条件設定部11及び配信設定入力部12からはビットレート、QP以外の符号化パラメータを入力し、パラメータ設定値候補群入力部14からはビットレートもしくはQPを入力としたが、これは一例であり、符号化条件設定部11及び配信設定入力部12では各符号化パラメータについて入力の有無を自由に変更でき、パラメータ設定値候補群入力部14では不足している符号化パラメータについて入力を行う。また、入力から明らかなものは出力を省略してもよく、抽出後の推定品質についても目標品質を満たす又は近いことが明らかであるため、出力を省略することとしてもよい。例えば、図3~図6、及び図7~図9の例において、抽出後のビットレートもしくはQPのみを出力してもよい。
In the examples shown in FIGS. 3 to 6 and 7 to 9, encoding parameters other than the bit rate and QP are input to the VR video encoding
<総合品質の推定手法>
以下、VR映像品質推定部15及び総合品質推定部16において算出される総合品質の推定手法について詳細に説明する。<Overall quality estimation method>
Hereinafter, a method for estimating the total quality calculated by the VR video
VR映像を視聴した際に体感される総合品質値(映像品質値)をVQとする。高画質タイルによる品質と、低画質タイルによる品質を定式化してVQを求めるために、VR映像品質推定部15は、高画質タイルの品質を表すパラメータ、低画質タイルの品質を表すパラメータ、タイル切り替わりの遅延を表すパラメータを利用して、高画質タイル及び低画質タイルそれぞれにおける品質劣化及び品質を推定する。
Let VQ be the overall quality value (video quality value) experienced when viewing a VR video. In order to formulate the quality of high-quality tiles and the quality of low-quality tiles and obtain VQ, the VR video
例えば、VR映像品質推定部15は、高画質タイルの、解像度、フレームレート、ビットレートを用いて以下の数式で高画質タイルによる品質推定値VQHを算出できる。For example, the VR video
VQH=MOSqH
MOSqH=q1+q2・exp(q3・quantH)
quantH=a1+a2・ln(a3+ln(brH)+ln(brH・bppH))VQ H = MOS qH
MOS qH = q 1 + q 2・exp (q 3・quant H )
quant H =a 1 +a 2・ln(a 3 +ln(br H )+ln(br H・bpp H ))
なお、本明細書において示される「予め定められた定数」あるいは「予め定められた係数」については、例えば、実験により最適な値を求めておくこととしてもよいし、ITU-T勧告P.1203において規定されている値を適用できる場合にはその値を用いてもよい。 Note that the "predetermined constant" or "predetermined coefficient" shown in this specification may be determined by experiment, for example, or may be determined in accordance with ITU-T Recommendation P. If the value specified in 1203 is applicable, that value may be used.
VR映像品質推定部15は、高画質タイルの品質推定値VQHを上記のMOSqHを利用して、以下のようにして算出してもよい。The VR video
VQH=MOSfromR(100-DH)
DH=max(min(DqH+DuH+Dt,100),0)
DuH=max(min(u1・log10(u2・scaleFactorH-1)+1),100),0)
DqH=max(min(100-RfromMOS(MOSqH),100),0)VQ H = MOS from R (100-D H )
D H =max(min(D qH +D uH +D t ,100),0)
D uH = max(min(u 1・log 10 (u 2・scaleFactor H −1)+1), 100), 0)
D qH = max(min(100-RfromMOS(MOS qH ), 100), 0)
また、RfromMOS、MOSfromRはユーザ体感品質MOSと心理値Rを変換する関数を表している。また、上記の数式では、q1~q3、u1~u3、t1~t3は予め定めた係数である。Furthermore, RfromMOS and MOSfromR represent functions for converting the user experience quality MOS and the psychological value R. Furthermore, in the above formula, q 1 to q 3 , u 1 to u 3 , and t 1 to t 3 are predetermined coefficients.
また、VR映像品質推定部15は、高画質タイルの品質推定値VQHを以下のように算出してもよい。Further, the VR video
同様にして、VR映像品質推定部15は、低画質タイルのパラメータを用いて、低画質タイルの品質VQL、品質劣化DLを算出することができる。なお、低画質タイルの品質を算出する場合、係数は高画質タイルと同じものを用いてもよいし、異なる値を用いてもよい。Similarly, the VR video
総合品質推定部16は、上記の高画質タイル及び低画質タイルそれぞれの品質と、低画質タイルの表示状態から高画質タイルの表示状態への切り替えにかかる時間である切り替え遅延とを利用して高画質タイル・低画質タイルそれぞれの品質寄与度ωを算出することによって、VR映像の総合品質値VQを推定する。
The overall
例えば、寄与度算出部17は、品質寄与度ωを以下の数式で算出することができる。
For example, the
VQ=ω・VQH+(1-ω)・VQL
また、総合品質推定部16は、以下の数式でVQを算出してもよい。VQ=ω・VQ H +(1−ω)・VQ L
Further, the total
DHL=ω・DH+(1-ω)・DL
VQ=MOSfromR(100-max(min(DHL,100),0))
また、総合品質推定部16は、DHLを以下のように算出してもよい。D HL =ω・D H +(1-ω)・D L
VQ=MOSfromR(100-max(min(D HL , 100), 0))
Further, the total
上記の例では、VR映像として高画質タイル及び低画質タイル両方の映像を配信しているが、低画質タイルを配信しない場合においては、VR映像の低画質タイルの抽出後符号化パラメータは全て0と出力してもよいし、出力しなくてもよい。この場合、高画質タイルがVR映像を360°カバーしない場合は、視線移動により映像が表示されない可能性がある。 In the above example, videos of both high-quality tiles and low-quality tiles are distributed as VR video, but if low-quality tiles are not distributed, the encoding parameters after extraction of the low-quality tiles of the VR video are all 0. may or may not be output. In this case, if the high-quality tiles do not cover the VR video 360°, the video may not be displayed due to eye movement.
この場合、品質寄与度ωは上記と同じ数式を用いてもよいし、例えば、タイルが配信されないことによる影響を加味した係数d5を加えて下記のように計算してもよい。In this case, the quality contribution degree ω may be calculated using the same formula as above, or may be calculated as follows by adding a coefficient d5 that takes into account the influence of not delivering the tile.
VQ=VQH
とすることで符号化パラメータを算出できる。
By doing so, the encoding parameters can be calculated.
上記の数式において利用された係数は、予め定めた固定的な係数であるものの他、コーデックや、プロファイル設定等によって変化する係数としてもよい。 The coefficients used in the above formula may be predetermined fixed coefficients, or may be coefficients that change depending on the codec, profile settings, etc.
また、本明細書で用いた数式はあくまでも一例であり、本明細書で用いた数式以外の数式で品質を推定してもよい。 Furthermore, the mathematical formulas used in this specification are merely examples, and the quality may be estimated using a mathematical formula other than the mathematical formulas used in this specification.
<処理手順>
以下、VR映像符号化パラメータ算出装置10が実行する処理手順について説明する。図9は、第1の実施形態におけるVR映像符号化パラメータ算出方法のフローチャートである。<Processing procedure>
The processing procedure executed by the VR video encoding
S101において、VR映像品質推定部15は、入力された符号化パラメータに基づいて高画質タイル及び低画質タイルの品質を算出し、算出された高画質タイル及び低画質タイルの品質を総合品質推定部16に出力する。
In S101, the VR video
S102において、寄与度算出部17は、入力された配信設定に基づき、品質寄与度を算出する。
In S102, the
S103において、総合品質推定部16は、入力された符号化パラメータ、高画質タイル及び低画質タイルの品質、算出された品質寄与度に基づき、VR映像の総合品質を算出する。算出された総合品質をVR映像パラメータ抽出部18に出力する。
In S103, the total
S104において、VR映像パラメータ抽出部18は、入力された目標品質及び総合品質に基づき、目標品質に近い高画質タイル及び低画質タイルの符号化パラメータを抽出し、出力する。
In S104, the VR video
(第2の実施形態)
次に、本発明の第2の実施形態を説明する。第2の実施形態では、符号化条件設定部11から映像符号化の設定情報を入力することに代えて、VR映像入力部20から、配信されるVR映像をVR映像符号化パラメータ算出装置10に入力することとしている。(Second embodiment)
Next, a second embodiment of the present invention will be described. In the second embodiment, instead of inputting video encoding setting information from the encoding
図10は、本発明における第2の実施形態におけるVR映像符号化パラメータ算出装置10の構成図である。第1の実施形態と異なり、VR映像の符号化パラメータではなく、配信されるVR映像がVR映像符号化パラメータ算出装置10に入力される。
FIG. 10 is a configuration diagram of a VR video encoding
入力されたVR映像は、VR映像品質推定部15内のVR映像符号化部19において、複数(例えば3以上)の品質段階で符号化される。VR映像符号化部19は、複数段階の符号化の符号化毎の量子化パラメータ、及びビットレートを抽出する。
The input VR video is encoded in a VR
第1の実施形態のquantHを算出する数式においてa1~a3は予め定められた係数であったが、第2の実施形態においては、VR映像符号化部19は、上記の複数段階の符号化により抽出された映像の量子化パラメータQPH、及びビットレートbrHを利用して、最小二乗法を用いて、quantHが、上記符号化でのQPHに近づくように下式の係数a1~a3の最適化を入力されたVR映像に対して行い、a1~a3を決定する。In the formula for calculating quant H in the first embodiment, a 1 to a 3 are predetermined coefficients, but in the second embodiment, the VR
quantH=a1+a2・ln(a3+ln(brH)+ln(brH・bppH))
また、VR映像符号化部19は、下式を用いて最適化を行ってもよい。quant H =a 1 +a 2・ln(a 3 +ln(br H )+ln(br H・bpp H ))
Further, the VR
上記の計算により、映像毎の数式の係数を決定することができる。したがって、コンテンツ毎の符号化の行いやすさなどの特徴を上記計算で考慮することができ、コンテンツの特徴を踏まえた総合品質の算出が可能である。 Through the above calculation, it is possible to determine the coefficients of the mathematical formula for each video. Therefore, characteristics such as ease of encoding for each content can be taken into consideration in the above calculation, and the overall quality can be calculated based on the characteristics of the content.
上記以外のVR映像品質推定部15における品質推定は、第1の実施形態と同様の計算で行うことができる。
Quality estimation in the VR video
また、総合品質推定部16及び寄与度算出部17及びVR映像パラメータ抽出部18に関しては、第1の実施形態と同様の処理を行うため、その説明を省略する。
Furthermore, since the overall
以下、本発明における第2の実施形態にかかるVR映像符号化パラメータ算出装置10が実行する処理手順について説明する。図11は、本発明の第2の実施形態におけるVR映像符号化パラメータ算出方法のフローチャートである。
The processing procedure executed by the VR video encoding
S201において、VR映像品質推定部15は、入力された符号化パラメータ及びVR映像に基づいて、上述したように係数を決定するとともに、高画質タイル及び低画質タイルの品質を算出する。VR映像品質推定部15は、算出された高画質タイル及び低画質タイルの品質を総合品質推定部16に出力する。
In S201, the VR video
S202において、寄与度算出部17は入力された配信設定に基づき、品質寄与度を算出する。
In S202, the
S203において、総合品質推定部16は入力された符号化パラメータ、高画質タイル及び低画質タイルの品質、算出された品質寄与度に基づき、VR映像の総合品質を算出する。算出された総合品質をVR映像パラメータ抽出部18に出力する。
In S203, the total
S204において、VR映像パラメータ抽出部18は、入力された目標品質及び総合品質に基づき、目標品質に近い高画質タイル及び低画質タイルの符号化パラメータを抽出する。
In S204, the VR video
(ハードウェア構成例)
VR映像符号化パラメータ算出装置10は、例えば、図1、図10に示す各部の機能を実現する論理回路を用いてハードウェアで実現してもよいし、汎用のコンピュータに、第1、第2の実施形態で説明する処理内容を記述したプログラムを実行させることにより実現することとしてもよい。なお、この「コンピュータ」は、仮想マシンであってもよい。仮想マシンを使用する場合、ここで説明する「ハードウェア」は仮想的なハードウェアである。(Hardware configuration example)
The VR video encoding
コンピュータを用いる場合、VR映像符号化パラメータ算出装置10は、当該コンピュータに内蔵されるCPUやメモリ等のハードウェア資源を用いて、VR映像符号化パラメータ算出装置10で実施される処理に対応するプログラムを実行することによって実現することが可能である。上記プログラムは、コンピュータが読み取り可能な記録媒体(可搬メモリ等)に記録して、保存したり、配布したりすることが可能である。また、上記プログラムをインターネットや電子メール等、ネットワークを通して提供することも可能である。
When using a computer, the VR video encoding
図2は、上記コンピュータのハードウェア構成例を示す図である。図12のコンピュータは、それぞれバスBで相互に接続されているドライブ装置1000、補助記憶装置1002、メモリ装置1003、CPU1004、インタフェース装置1005、表示装置1006、及び入力装置1007等を有する。
FIG. 2 is a diagram showing an example of the hardware configuration of the computer. The computer in FIG. 12 includes a
当該コンピュータでの処理を実現するプログラムは、例えば、CD-ROM又はメモリカード等の記録媒体1001によって提供される。プログラムを記憶した記録媒体1001がドライブ装置1000にセットされると、プログラムが記録媒体1001からドライブ装置1000を介して補助記憶装置1002にインストールされる。但し、プログラムのインストールは必ずしも記録媒体1001より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置1002は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
A program for realizing processing by the computer is provided, for example, by a
メモリ装置1003は、プログラムの起動指示があった場合に、補助記憶装置1002からプログラムを読み出して格納する。CPU1004は、メモリ装置1003に格納されたプログラムに従って、VR映像符号化パラメータ算出装置10に係る機能を実現する。インタフェース装置1005は、ネットワークに接続するためのインタフェースとして用いられる。表示装置1006はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置1007はキーボード及びマウス、ボタン、又はタッチパネル等で構成され、様々な操作指示を入力させるために用いられる。
The
(実施形態の効果等)
以上説明したとおり、本実施形態により、VR映像もしくはVR映像の符号化設定、配信設定、及びVR映像の目標品質を入力として、VR映像の総合品質を導出することで、目標とするVR映像の品質に対して最適なタイルベースVR映像の符号化パラメータ(ビットレート、解像度、フレームレート、切り替え遅延、量子化パラメータ等)を算出することができる。(Effects of embodiments, etc.)
As explained above, according to the present embodiment, the overall quality of the VR video is derived by inputting the VR video or the encoding settings of the VR video, the distribution settings, and the target quality of the VR video. It is possible to calculate encoding parameters (bit rate, resolution, frame rate, switching delay, quantization parameter, etc.) for tile-based VR video that are optimal for quality.
(実施の形態のまとめ)
本明細書には、少なくとも下記の各項に記載したVR映像符号化パラメータ算出装置、VR映像符号化パラメータ算出方法、プログラムが記載されている。
(第1項)
複数の符号化パラメータのそれぞれに対するVR映像の総合品質推定値を算出する品質推定部と、
与えられた目標品質を満たす総合品質推定値に対応する符号化パラメータを前記複数の符号化パラメータの中から抽出するVR映像パラメータ抽出部と
を備えるVR映像符号化パラメータ算出装置。
(第2項)
前記品質推定部は、映像符号化設定の情報、又は、VR映像に基づいて、前記総合品質推定値を算出する
第1項に記載のVR映像符号化パラメータ算出装置。
(第3項)
前記品質推定部は、
前記VR映像における高画質領域の品質推定値と前記VR映像における低画質領域の品質推定値とを算出するVR映像品質推定部と、
前記高画質領域の品質推定値と、前記低画質領域の品質推定値とに基づいて、前記総合品質推定値を算出する総合品質推定部と
を備える第1項又は第2項に記載のVR映像符号化パラメータ算出装置。
(第4項)
前記総合品質推定部は、
低画質領域表示状態から高画質領域表示状態に切り替わるまでの時間に関するパラメータと低画質領域の占める面積に関する情報のうちの少なくともいずれか1つに基づいて、高画質領域の品質と低画質領域の品質の総合品質に対する寄与度を算出し、
前記寄与度と、前記高画質領域の品質推定値と、前記低画質領域の品質推定値とに基づいて、前記総合品質推定値を算出する
第3項に記載のVR映像符号化パラメータ算出装置。
(第5項)
VR映像符号化パラメータ算出装置が実行するVR映像符号化パラメータ算出方法であって、
複数の符号化パラメータのそれぞれに対するVR映像の総合品質推定値を算出する品質推定ステップと、
与えられた目標品質を満たす総合品質推定値に対応する符号化パラメータを前記複数の符号化パラメータの中から抽出するVR映像パラメータ抽出ステップと
を備えるVR映像符号化パラメータ算出方法。
(第6項)
コンピュータを、第1項ないし第4項のうちいずれか1項に記載のVR映像符号化パラメータ算出装置の各部として機能させるためのプログラム。(Summary of embodiments)
This specification describes at least a VR video encoding parameter calculation device, a VR video encoding parameter calculation method, and a program described in each section below.
(Section 1)
a quality estimator that calculates an overall quality estimate of the VR video for each of the plurality of encoding parameters;
A VR video encoding parameter calculation device, comprising: a VR video parameter extraction unit that extracts an encoding parameter corresponding to an overall quality estimate that satisfies a given target quality from among the plurality of encoding parameters.
(Section 2)
The VR video encoding parameter calculation device according to
(Section 3)
The quality estimator includes:
a VR video quality estimator that calculates a quality estimate of a high-quality area in the VR video and a quality estimate of a low-quality area in the VR video;
The VR video according to
(Section 4)
The overall quality estimating unit is
The quality of the high image quality area and the quality of the low image quality area based on at least one of the parameters related to the time taken to switch from the low image quality area display state to the high image quality area display state and information regarding the area occupied by the low image quality area. Calculate the contribution of
The VR video encoding parameter calculation device according to claim 3, wherein the overall quality estimate is calculated based on the contribution degree, the quality estimate of the high image quality area, and the quality estimate of the low image quality area.
(Section 5)
A VR video encoding parameter calculation method executed by a VR video encoding parameter calculation device, comprising:
a quality estimation step of calculating an overall quality estimate of the VR video for each of the plurality of encoding parameters;
A VR video encoding parameter calculation method, comprising: a VR video parameter extraction step of extracting an encoding parameter corresponding to an overall quality estimate that satisfies a given target quality from among the plurality of encoding parameters.
(Section 6)
A program for causing a computer to function as each part of the VR video encoding parameter calculation device according to any one of
以上、本実施の形態について説明したが、本発明はかかる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。 Although the present embodiment has been described above, the present invention is not limited to such specific embodiment, and various modifications and changes can be made within the scope of the gist of the present invention as described in the claims. It is possible.
10 VR映像符号化パラメータ算出装置
11 符号化条件設定部
12 配信設定入力部
13 目標品質入力部
14 パラメータ設定値候補群入力部
15 VR映像品質推定部
16 総合品質推定部
17 寄与度算出部
18 VR映像パラメータ抽出部
19 VR映像符号化部
20 VR映像入力部
1000 ドライブ装置
1001 記録媒体
1002 補助記憶装置
1003 メモリ装置
1004 CPU
1005 インターフェース装置
1006 表示装置
1007 入力装置10 VR video encoding
1005
Claims (4)
与えられた目標品質を満たす総合品質推定値に対応する符号化パラメータを前記複数の符号化パラメータの中から抽出するVR映像パラメータ抽出部と、を備えるVR映像符号化パラメータ算出装置であって、
前記品質推定部は、
前記VR映像における高画質領域の品質推定値と前記VR映像における低画質領域の品質推定値とを算出するVR映像品質推定部と、
前記高画質領域の品質推定値と、前記低画質領域の品質推定値とに基づいて、前記総合品質推定値を算出する総合品質推定部と、を備え、
前記総合品質推定部は、
低画質領域表示状態から高画質領域表示状態に切り替わるまでの時間に関するパラメータと低画質領域の占める面積に関する情報のうちの少なくともいずれか1つに基づいて、高画質領域の品質と低画質領域の品質の総合品質に対する寄与度を算出し、
前記寄与度と、前記高画質領域の品質推定値と、前記低画質領域の品質推定値とに基づいて、前記総合品質推定値を算出する
VR映像符号化パラメータ算出装置。 a quality estimator that calculates an overall quality estimate of the VR video for each of the plurality of encoding parameters;
A VR video encoding parameter calculation device comprising: a VR video parameter extraction unit that extracts an encoding parameter corresponding to an overall quality estimate that satisfies a given target quality from among the plurality of encoding parameters,
The quality estimator includes:
a VR video quality estimator that calculates a quality estimate of a high-quality area in the VR video and a quality estimate of a low-quality area in the VR video;
an overall quality estimation unit that calculates the overall quality estimate based on the quality estimate of the high image quality area and the quality estimate of the low image quality area,
The overall quality estimating unit is
The quality of the high image quality area and the quality of the low image quality area based on at least one of the parameters related to the time taken to switch from the low image quality area display state to the high image quality area display state and information regarding the area occupied by the low image quality area. Calculate the contribution of
The overall quality estimate is calculated based on the contribution, the quality estimate of the high image quality area, and the quality estimate of the low image quality area.
VR video encoding parameter calculation device .
請求項1に記載のVR映像符号化パラメータ算出装置。 The VR video encoding parameter calculation device according to claim 1, wherein the quality estimator calculates the overall quality estimate based on information on video encoding settings or the VR video.
複数の符号化パラメータのそれぞれに対するVR映像の総合品質推定値を算出する品質推定ステップと、
与えられた目標品質を満たす総合品質推定値に対応する符号化パラメータを前記複数の符号化パラメータの中から抽出するVR映像パラメータ抽出ステップと、を備え、
前記品質推定ステップは、
前記VR映像における高画質領域の品質推定値と前記VR映像における低画質領域の品質推定値とを算出するVR映像品質推定ステップと、
前記高画質領域の品質推定値と、前記低画質領域の品質推定値とに基づいて、前記総合品質推定値を算出する総合品質推定ステップと、を備え、
前記総合品質推定ステップにおいて、前記VR映像符号化パラメータ算出装置は、
低画質領域表示状態から高画質領域表示状態に切り替わるまでの時間に関するパラメータと低画質領域の占める面積に関する情報のうちの少なくともいずれか1つに基づいて、高画質領域の品質と低画質領域の品質の総合品質に対する寄与度を算出し、
前記寄与度と、前記高画質領域の品質推定値と、前記低画質領域の品質推定値とに基づいて、前記総合品質推定値を算出する
VR映像符号化パラメータ算出方法。 A VR video encoding parameter calculation method executed by a VR video encoding parameter calculation device, comprising:
a quality estimation step of calculating an overall quality estimate of the VR video for each of the plurality of encoding parameters;
a VR video parameter extraction step of extracting a coding parameter corresponding to an overall quality estimate that satisfies a given target quality from among the plurality of coding parameters;
The quality estimation step includes:
a VR video quality estimation step of calculating a quality estimated value of a high quality area in the VR video and a quality estimated value of a low quality area in the VR video;
a total quality estimation step of calculating the total quality estimate based on the quality estimate of the high image quality area and the quality estimate of the low image quality area,
In the overall quality estimation step, the VR video encoding parameter calculation device:
The quality of the high image quality area and the quality of the low image quality area based on at least one of the parameters related to the time taken to switch from the low image quality area display state to the high image quality area display state and information regarding the area occupied by the low image quality area. Calculate the contribution of
The overall quality estimate is calculated based on the contribution, the quality estimate of the high image quality area, and the quality estimate of the low image quality area.
VR video encoding parameter calculation method.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/007457 WO2021171362A1 (en) | 2020-02-25 | 2020-02-25 | Vr video encoding parameter calculation device, vr video encoding parameter calculation method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021171362A1 JPWO2021171362A1 (en) | 2021-09-02 |
JP7351398B2 true JP7351398B2 (en) | 2023-09-27 |
Family
ID=77490803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022502365A Active JP7351398B2 (en) | 2020-02-25 | 2020-02-25 | VR video encoding parameter calculation device, VR video encoding parameter calculation method, and program |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230078062A1 (en) |
JP (1) | JP7351398B2 (en) |
WO (1) | WO2021171362A1 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018025660A1 (en) | 2016-08-05 | 2018-02-08 | ソニー株式会社 | Image processing device and image processing method |
-
2020
- 2020-02-25 WO PCT/JP2020/007457 patent/WO2021171362A1/en active Application Filing
- 2020-02-25 US US17/801,888 patent/US20230078062A1/en active Pending
- 2020-02-25 JP JP2022502365A patent/JP7351398B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018025660A1 (en) | 2016-08-05 | 2018-02-08 | ソニー株式会社 | Image processing device and image processing method |
Non-Patent Citations (3)
Title |
---|
Cagri Ozcinar et al.,Visual Attention-Aware Omnidirectional Video Streaming Using Optimal Tiles for Virtual Reality,[online],2019年03月,pp.217-230,https://ieeexplore.ieee.org/document/8626197,[検索日:2020.06.18] |
小池正憲, 外2名,タイルベースVR映像配信サービスの客観品質推定モデルに関する検討 [online],CQ2018-102 (2019-03),2019年03月07日,pp.55-59,https://www.ieice.org/ken/paper/2019031431kK/,[検索日: 2020.06.18] |
浦田勇一朗, 外2名,ITU-T勧告P.1203 技術のVR映像配信への適用可能性,[online],2019年07月11日,pp.79-83,https://www.ieice.org/ken/paper/20190719N1oL/,[検索日:2020.06.18] |
Also Published As
Publication number | Publication date |
---|---|
WO2021171362A1 (en) | 2021-09-02 |
JPWO2021171362A1 (en) | 2021-09-02 |
US20230078062A1 (en) | 2023-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10812831B2 (en) | Video stream delivery via adaptive quality enhancement using error correction models | |
CN107211193B (en) | Intelligent adaptive video streaming method and system driven by perception experience quality estimation | |
TWI325697B (en) | Multi-pass video encoding | |
CN104096362B (en) | The Rate Control bit distribution of video flowing is improved based on player's region-of-interest | |
US20160219286A1 (en) | Parallel video transcoding | |
EP2297963B1 (en) | Video compression under multiple distortion constraints | |
CN108574874B (en) | Video playing speed adjusting method and device | |
EP3993413A1 (en) | Method and device for determining video bitrate, computer apparatus, and storage medium | |
CN115037962B (en) | Video self-adaptive transmission method, device, terminal equipment and storage medium | |
US10284857B2 (en) | Method and apparatus for evaluating video quality | |
Sun et al. | Video rate control strategies for cloud gaming | |
Nguyen et al. | A client-based adaptation framework for 360-degree video streaming | |
EP4173291A1 (en) | Reinforcement learning based rate control | |
WO2020179563A1 (en) | Video quality estimation device, video quality estimation method and program | |
KR100674557B1 (en) | Method and apparatus for calculating moving-image correction-coefficient, moving-image correcting apparatus, and computer product | |
JP7351398B2 (en) | VR video encoding parameter calculation device, VR video encoding parameter calculation method, and program | |
JP7362903B2 (en) | Image data transfer device, image display system, and image data transfer method | |
WO2009157340A1 (en) | High-quality content generating system, method therefor, and program | |
EP3264709B1 (en) | A method for computing, at a client for receiving multimedia content from a server using adaptive streaming, the perceived quality of a complete media session, and client | |
JP6402088B2 (en) | Video quality estimation apparatus, video quality estimation method, and program | |
JP7400936B2 (en) | Video quality estimation device, video quality estimation method, and program | |
Wilk et al. | The content-aware video adaptation service for mobile devices | |
WO2022044252A1 (en) | Image quality estimation device, image quality estimation method, and program | |
JP7347527B2 (en) | Video quality estimation device, video quality estimation method, and program | |
Takagi et al. | Subjective video quality estimation to determine optimal spatio-temporal resolution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220610 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A801 Effective date: 20220620 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20220620 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230728 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230815 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230828 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7351398 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |