JP5956316B2 - 主観画質推定装置、主観画質推定方法及びプログラム - Google Patents

主観画質推定装置、主観画質推定方法及びプログラム Download PDF

Info

Publication number
JP5956316B2
JP5956316B2 JP2012257925A JP2012257925A JP5956316B2 JP 5956316 B2 JP5956316 B2 JP 5956316B2 JP 2012257925 A JP2012257925 A JP 2012257925A JP 2012257925 A JP2012257925 A JP 2012257925A JP 5956316 B2 JP5956316 B2 JP 5956316B2
Authority
JP
Japan
Prior art keywords
image quality
quality estimation
subjective image
formula
subjective
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012257925A
Other languages
English (en)
Other versions
JP2014107645A (ja
Inventor
基宏 高木
基宏 高木
藤井 寛
寛 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012257925A priority Critical patent/JP5956316B2/ja
Publication of JP2014107645A publication Critical patent/JP2014107645A/ja
Application granted granted Critical
Publication of JP5956316B2 publication Critical patent/JP5956316B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

本発明は、動画像の主観画質の推定技術に関する。
動画像の主観画質の推定には、以下のようなものがある。
主観画質の定義通りに推定する方法は、ACR−HRR法、一対比較法といった主観評価実験によって推定するものである(例えば非特許文献1参照)。これらの方法では、複数人の被験者を用意し、被験者が評価対象となる動画像を繰り返し見て、その動画像の主観画質を評価する。ACR−HRR法では、被験者は、Excellent、Good、Fair、Poor、Badの5段階で主観画質の評価を実施する。評価値の被験者平均値は、動画像の主観画質評価値として用いられ、MOS(Mean Opinion Score)と呼ばれる。ところが、ACR−HRR法では、被験者を複数人集めなければならない。さらに、被験者に動画像を何度も繰り返し見てもらって評価を行うため、時間がかかる。そのため、個別の動画像の主観画質評価の推定に用いることは、事実上困難である。
上記手法の代替方法として、客観画質評価値を主観画質として算出する手法がある。PSNR(Peak Signal-to-Noise Ratio)や、SSIM(Structural SIMilarity:例えば非特許文献2参照)などは、客観画質評価値で主観画質を代替する手法である。客観画質評価値は、符号化前の動画像(原画像)と復号後の動画像(復号画像)の画素値や特徴、例えば原画像と復号画像の輝度値の二乗誤差の平均、輝度分散などを利用して求められる。
図13は、従来技術によるPSNRやSSIMといった原画像と復号画像とを参照して客観画質評価値を算出する手順を示すフローチャートである。図13において、原画像Iがエンコーダに入力される(ステップS10)。エンコーダは、原画像Iを符号化し、符号化データIeを得る(ステップS11)。デコーダは、符号化データIeを復号し、復号画像Idを得る(ステップS12)。そして、復号画像Idと符号化データIeとを比較し、客観評価値sを出力する(ステップS13)。
PSNRには、客観画質の良否と主観画質の良否とが必ずしも対応しないという問題がある(例えば非特許文献3参照)。さらに、原画像のフレームレートと解像度を変化させた場合には、PSNRに加えてSSIMにも存在する、フレームレート、解像度が異なる動画像間における客観画質の比較が難しいという問題がある。例えば、フレームレートが30fpsと60fpsの動画像では、PSNR、SSIMが同等でも、60fpsの動画像の方が、動きがなめらかになるので主観画質は良くなる。しかしながら、PSNR、SSIMでは、その変化の影響を表現できない。
主観評価実験のコスト削減と、解像度、フレームレートの変化の影響の両方に対応する形で、事前の主観評価実験によって得た主観画質評価値を用いて主観画質推定式を構築する技術が提案されている(例えば非特許文献4〜9参照)。
主観画質推定式を構築して主観画質を推定する方法は、主観評価実験のコストをあらかじめ、事前の主観評価実験によって得た主観評価値を用いて主観画質推定式を構築していることで削減しており、解像度、フレームレートの変化の影響を動画像の特徴を用いることで表現している。主観画質推定式は、PSNRや動きベクトルの大きさ、エッジ強度といった特徴に関する。
具体的な例について説明する。非特許文献8では、下記の数式(1)を用いて主観画質を推定する。
Figure 0005956316
ここで、SVはMPEG−7のSpatial Activity、TVはTemporal Activityである。FRはフレームレート、xは解像度(横幅)を表す。この主観画質推定式は、PSNRといった従来の客観画質評価値に加え、解像度、フレームレートの変化の影響をSV、TVによって表現している。そのため、PSNRで比較ができなかった異なる解像度、フレームレートに対しても比較することができる。
図14は、従来技術による主観画質推定式の構築までの処理を一般化したフローチャートである。主観画質推定式では、原画像I(0<i<N:Nは1以上の整数)、テスト動画像Dを用意し、主観評価実験を行うことで、主観評価値sを取得する(ステップS20)。次に、原画像I、テスト動画像Dから特徴f1、…、fを取り出し、主観画質推定式S(f、…、f|D、I)を、N個の組み合わせに対して構築する(ステップS21)。次に、主観評価値sとS(f1、…、f|Di、)との組み合わせでS(f1、…、f|Di、)のパラメータを最適化し、任意の動画像に対する主観画質推定式S(f1、…、f)を得る(ステップS22)。そして、任意の原画像Iと復号画像Dから取り出した特徴f1、…、fによって主観画質推定式S(f1、…、f)により主観画質推定を行う(ステップS23)。
図14に示すように、非特許文献8のような主観画質推定式によって主観画質を推定する場合には、原画像Iと復号画像Dとが必要となる。
また、他の主観画質推定式としては、原画像を用いずに、動画像の劣化するパターン(符号化歪み、パケットロスなど)を想定して、その劣化画像の特徴から主観画質を推定する方法も提案されている(例えば非特許文献10参照)。この方法では、復号画像があれば、主観画質推定値を算出することができる。よって、動画像を圧縮し、伝送した後の画質評価に有効である。
さらに、他の主観画質推定式としては、フレームあたりの平均符号量から予測したPSNRを用いて、符号化前に主観画質を推定する方法も提案されている(例えば非特許文献9参照)。ビットレート、フレームレートが変化した際の主観画質評価値を、次式(2)により推定する。
Figure 0005956316
ここで、sはフレームあたりの平均符号量、tはフレームレートである。空間画質EMOS(s)は、予測PSNR、ソーベルフィルタの出力値の対数を取った値、動きベクトルの最大値の対数を取った値を用いて3次式で表現している。そして、時間画質EMOS(t)は、動画像のあるシーンの平均フレームレートを用いた一次式によって表現されている。
ITU-T Recommendation P.910 "Subjective video quality assessment methods for multimedia applications," 1999. Z.Wang, A.C.Bovic, H.R.Sheikh and E.P.Simoncelli "Image Quality Assessment: From Error Visibility to Structure Similarity" IEEE Trans.Image Processing., vol 13,no.4,Apr 2004,pp.600-612. Z.Wang,A.C.Bovik and L.Liu "Why is image quality assessment so difficult?" ICASSP.,vol4, May 2002,pp.3313-3316. M.Chien,R.Wang,C.Chiu,and P.Chang.,"Quality Driven Frame Rate Optimization for Rate constrained Video Encoding," IEEE Trans on. Broadcast.Vol.58,pp.200-208,June.2012. R.Feghali,F.Speranza,D.Wang,and A.Vincent.,"Video Quality Metric for Bit Rate Control Via Joint Adjustment of Quantization and Frame Rate , " IEEE Trans.Broadcast.,vol.53,no.1,Mar.2007,pp.441-46. Y.-F.Ou,Z.Ma,T.Liu,and Y.Wang., " Perceptual Quality Assessment of Video Considering Both Frame Rate and Quantization Artifacts," IEEE Trans.Circuits Syst.VideoTech.,vol.21,no.3,Mar.2011,pp.286-98. C.S.Kim S.H.Jin,D.J.Seo,and Y.M.Ro.,"Measuring Video Quality on Full Scalability of H. 264 / AVC Scalable Video Coding," IEICE Trans .Commun.,vol.E91-B,no.5,May 2008 pp.1269-78. H.Sohn,H.Yoo,W.D.Neve,C.S.Kim,and Y.M.Ro., "Full Reference Video Quality Metric for Fully Scalable and Mobile SVC Content ," IEEE Trans.Broadcast.,vol.56,no.3,Sept 2010,pp.269-80. Y.Yamasaki,and T.Yoshida,"MOS-Based Bit Allocation in SNR-Temporal Scalable Coding," Proc.PCS,Dec.2010.pp.242-245. K. Seshadrinathan and A.C. Bovik "Motion-tuned spatio-temporal quality assessment of natural videos," IEEE Trans. Image Processing.,vol 19,no.2,Feb 2010,pp.335-350. ISO/IEC DIS 23009-1.2, "Information technology - Dynamic adaptive streaming over HTTP (DASH) - Part 1: Media presentation description and segment formats"
従来の主観画質推定式を構築して主観画質を推定する方法には、復号画像を必要とする動画像の特徴を用いて主観画質推定値を算出する方法と符号化前に主観画質を推定するが、解像度の変化に対応していない方法とがある。前者は、符号化、復号が必要となり、計算コストがかかる。後者は、解像度の変化に対応していないため、異なる解像度の動画像に対して主観画質推定値の大小と主観画質の良否に関係がない。
具体的には、非特許文献7、8は、主観画質の推定にPSNRを用いているため、複数のビットレートの主観画質を推定する際には、それぞれのビットレートに対して符号化し、PSNRを取得しなければ主観画質を推定できず、符号化、復号の計算コストがかかるといった問題がある。
非特許文献9は、符号化前に主観画質を推定できるものの、空間画質に解像度の変化の影響を表すパラメータが存在しないため、解像度の変化に対応できないといった問題がある。
一方、インターネット上で動画像を配信する際に、ネットワークの状況に応じて適応的に動画像を切り替えて配信するHttp Adaptive Streaming(以下、HASという)といった技術があり、MPEG−DASHとして標準化が進んでいる(例えば非特許文献11参照)。
図15は、HASによる動画像の切り替え配信を説明するための概念図である。図15に示すように、HASでは、配信する動画像を切り替えるために、エンコーダ2は、オリジナル映像1を、複数のビットレートで符号化した符号化データ3−1、3−2、…、3−n(nは1以上の整数)を用意する必要がある。各ビットレートに対して、解像度とフレームレート、量子化パラメータ(以下、QPという)は、任意である。解像度、フレームレート、QPの組み合わせに対して主観画質を推定したい場合には、組み合わせの数に応じて主観画質を推定する。
図16は、上記HASによる主観画質推定方法の手順を説明するためのフローチャートである。HASでは、候補の解像度、フレームレート、ビットレート(もしくは、量子化パラメータ)で符号化する(ステップS30)。次に、得られた符号化データを復号し、主観画質推定値を算出する(ステップS31)。次に、全ての解像度、フレームレート、ビットレートの候補に対して主観画質を推定したか否かを判別する(ステップS32)。そして、全ての解像度、フレームレート、ビットレートの候補に対して主観画質を推定していない場合には(ステップS32のNO)、ステップS30に戻り、符号化と復号化とを繰り返す。一方、全ての解像度、フレームレート、ビットレートの候補に対して主観画質を推定した場合には(ステップS32のYES)、候補の組み合わせから、主観画質推定値が最大となる解像度、フレームレートを出力する(ステップS33)。このように、図16に示す、従来の主観画質推定式を構築して主観画質を推定する方法では、何度も符号化、復号しなければならないといった問題がある。
上述したように、図15に示す状況の場合、従来の主観画質推定式を構築して主観画質を推定する方法では、何度も符号化、復号が必要となるため、解像度、フレームレートの異なる動画像間の主観画質を複数のビットレートに対して簡便に推定することが困難であるという問題がある。
上記事情に鑑み、本発明は、動画像をあるビットレートに符号化する際に、所望する解像度、フレームレートでの主観画質を符号化前に推定することを可能とする技術の提供を目的としている。
本発明の一態様は、動画像の1画素あたりの平均符号量から量子化パラメータを予測するためのQP予測式を生成するQP予測式生成部と、前記QP予測式を用いて、1画素あたりの平均符号量から予測QPを算出するQP予測部と、符号化パラメータに対する主観画質推定式を出力する主観画質推定式管理部と、前記予測QP及び前記主観画質推定式に基づいて、主観画質推定値を算出する主観画質推定部と、備える主観画質推定装置である。
本発明の一態様は、上記の主観画質推定装置であって、前記QP予測式生成部は、動画像をエンコードして平均QPと1画素あたりの平均符号量とを出力するエンコーダと、前記エンコーダによって出力された前記平均QP及び前記平均符号量を格納するパラメータ記憶部と、前記パラメータ記憶部に格納された前記平均QP及び前記平均符号量に基づいて前記QP予測式を算出するQP予測式算出部と、を備える。
本発明の一態様は、上記の主観画質推定装置であって、前記QP予測式生成部は、符号化データを解析して平均QPと1画素あたりの平均符号量とを出力するパーサーと、前記パーサーによって出力された前記平均QP及び前記平均符号量を格納するパラメータ記憶部と、前記パラメータ記憶部に格納された前記平均QP及び前記平均符号量に基づいて前記QP予測式を算出するQP予測式算出部と、を備える。
本発明の一態様は、上記の主観画質推定装置であって、前記QP予測式算出部は、前記パラメータ記憶部に格納された前記平均QP及び前記平均符号量の組み合わせを複数取得し、取得された前記組み合わせに基づいて、N次式(Nは1以上の整数)で表現した1画素あたりの前記平均QP及び前記平均符号量の関係を最小二乗法によって表すことによって前記QP予測式を算出する。
本発明の一態様は、上記の主観画質推定装置であって、前記QP予測式算出部は、前記パラメータ記憶部に格納された前記平均QP及び前記平均符号量の組み合わせを2組取得し、前記2組が表す2点を含む直線によって表される式を前記QP予測式として算出する。
本発明の一態様は、上記の主観画質推定装置であって、前記主観画質推定式管理部は、前記主観画質推定式を格納しており、前記主観画質推定部によって要求された主観画質推定式を格納している場合は、当該主観画質推定式を前記主観画質推定部に出力し、前記主観画質推定部によって要求された主観画質推定式を格納していない場合は、既に格納されている前記主観画質推定式に基づいて、要求された主観画質推定式を生成し前記主観画質推定部に出力する。
本発明の一態様は、上記の主観画質推定装置であって、前記主観画質推定式管理部は、初期値として事前の主観評価実験によって得られた主観画質推定式を格納しており、格納された前記主観画質推定式の係数及び符号化パラメータの組み合わせに基づいて前記係数及び前記符号化パラメータの関係を近似するN次式(Nは1以上の整数)を生成し、近似したN次式に基づいて前記主観画質推定式を生成する。
本発明の一態様は、動画像の1画素あたりの平均符号量から量子化パラメータを予測するためのQP予測式を生成するQP予測式生成ステップと、前記QP予測式を用いて、1画素あたりの平均符号量から予測QPを算出するQP予測ステップと、符号化パラメータに対する主観画質推定式を出力する主観画質推定式管理ステップと、前記予測QP及び前記主観画質推定式に基づいて、主観画質推定値を算出する主観画質推定ステップと、を有する主観画質推定方法である。
本発明の一態様は、上記いずれかの主観画質推定装置が行う処理をコンピュータに実行させるためのプログラムである。
本発明により、動画像をあるビットレートに符号化する際に、所望する解像度、フレームレートでの主観画質を符号化前に推定することが可能となる。
本実施形態の主観評価値算出方法を実現する機器(CBR符号化)の構成を示すブロック図である。 本実施形態の主観評価値算出方法の基本動作を説明するためのフローチャートである。 本実施形態による主観画質推定方法の全体動作を説明するためのフローチャートである。 本実施形態によるパラメータDB12のデータ構成の一例を示す概念図である。 本実施形態によるQP予測部14のQP予測動作を説明するためのフローチャートである。 本実施形態による主観画質推定式管理部15の主観画質推定生成動作を説明するためのフローチャートである。 本実施形態による主観画質推定部18の主観画質推定動作を説明するためのフローチャートである。 本実施形態による、QPを取り出す第2の方法を適用した主観評価値算出方法を実現する機器(CBR符号化)の構成を示すブロック図である。 本実施形態によるQP予測式算出部13の動作(M=2の場合)を説明するためのフローチャートである。 本実施形態による主観画質推定式DB16の構成例を示す概念図である。 本実施形態による主観画質推定式生成部17の動作を説明するためのフローチャートである。 本実施形態による主観画質推定式生成部17での加重平均による係数の算出方法を示す概念図である。 従来技術によるPSNRやSSIMといった原画像と復号画像とを参照して客観画質評価値を算出する手順を示すフローチャートである。 従来技術による主観画質推定式の構築までの処理を一般化したフローチャートである。 HASによる動画像の切り替え配信を説明するための概念図である。 HASによる主観画質推定方法の手順を説明するためのフローチャートである。
[概略]
まず、本発明の一実施形態の概略について説明する。
図1は、本実施形態の主観評価値算出方法を実現する機器(CBR符号化)の構成を示すブロック図である。図1において、QP予測式生成部10は、動画像の1画素あたりの平均符号量bとQP間の関係式(QP予測式)を生成する。すなわち、QP予測式生成部10は、標本となる複数のビットレートBでエンコーダ11が動画像を符号化して生成された、または既にある符号化データの1画素あたりの平均符号量とQPとの組み合わせによって、1画素あたりの平均符号量とQPとの関係式(QP予測式)を生成する。
QP予測部14は、1画素あたりの平均符号量から予測QPを求める。すなわち、QP予測部14は、生成されたQP予測式に1画素あたりの平均符号量を代入し、予測QPを求める。
主観画質推定式管理部15は、主観画質推定部18から問い合わされた解像度rとフレームレートfに対応するQPと主観評価値との関係式(主観画質推定式S(q))を主観画質推定部18に出力する。すなわち、主観画質推定式管理部15において、主観画質推定式DB16は、主観画質推定式管理部15が予め行っていた主観評価実験から得た、特定の解像度とフレームレートに対するQPと主観評価値との関係式(主観画質推定式S(q))を、初期値として格納している。
このように、主観画質推定式管理部15は、主観画質推定部18からの問い合わせに対して、主観画質推定式DB16に格納されている主観画質推定式S(q)を送出する。主観画質推定部18からの問い合わせに対応する主観画質推定式S(q)が主観画質推定式DB16になかった場合、主観画質推定式生成部17は、主観画質推定式DB16に格納されている主観画質推定式S(q)から、任意の解像度rとフレームレートfに対するQPと主観評価値との関係式(主観画質推定式S(q))を補間によって生成する。主観画質推定式管理部15は、主観画質推定式生成部17によって生成された主観画質推定式S(q)を、主観画質推定式DB16に格納した後、主観画質推定部18に出力する。
主観画質推定部18は、主観画質推定式管理部15によって生成された、QPと主観評価値の関係式(主観画質推定式S(q))から、任意の解像度r、フレームレートf、QPの組み合わせに対する主観画質を推定する。
従って、QP予測式生成部10は、動画像の1画素あたりの平均符号量とQP間の関係式(QP予測式)を生成する。QP予測部14は、QP予測式を用いて、ビットレートからQPを予測する。主観画質推定式生成部17は、任意の解像度r、フレームレートfに対するQPと主観画質評価値との関係を表す主観画質推定式S(q)を生成する。主観画質推定部18は、QP予測部14で予測した予測QPと主観画質推定式管理部15からの主観画質推定式S(q)とから主観画質を推定する。
本発明では、主観画質推定部18が、QP予測式生成部10によって生成されたQP予測式と主観画質推定式管理部15によって保持されている主観画質推定式S(q)とによって、1画素あたりの平均符号量だけから、主観画質を推定することができる。よって、本発明は、QP予測式生成部10がQP予測式を生成するのに必要なエンコード、デコードと、主観画質推定式DB16に格納されている初期の主観画質推定式S(q)を得る以外、エンコード、デコード、主観評価実験を必要としない。
図2は、本実施形態の主観評価値算出方法の基本動作を説明するためのフローチャートである。図2において、エンコーダ11は、任意のM個の候補を解像度r、フレームレートf、ビットレートBで符号化する(ステップ100)。次に、QP予測式算出部13は、量子化パラメータ−1画素あたりの平均符号量の関係式(QP予測式)を生成する(ステップ101)。また、QP予測部14は、候補の解像度r、フレームレートf、ビットレートBの量子化パラメータ(QP)を推定し、予測QPとして出力する(ステップ102)。
主観画質推定部18は、主観画質推定式管理部15から受け取った主観画質推定式S(q)にQP予測部14から入力した予測QPを代入し、主観画質推定値sを算出する(ステップ103)。次に、主観画質推定部18は、全ての解像度r、フレームレートf、ビットレートBの組み合わせの候補に対して主観画質を推定したか否かを判定し(ステップS104)、推定が終わっていない場合には(ステップS104のNO)、ステップS102に戻り、次の候補に対して上述した処理を繰り返す。そして、全ての組み合わせの候補に対して主観画質を推定し終わると(ステップS104のYES)、主観画質推定部18は、主観画質推定値sを出力する(ステップS105)。
本発明の一実施形態によれば、QP予測式によって予測されたQPを用いて、主観画質を推定するため、QP予測式の生成後はエンコードせずに、ターゲットとするビットレートBの主観画質を任意の解像度、フレームレートfの組み合わせに対して推定することができる。また、予めQPが分かっているのならば、QP予測式生成部10とQP予測部14を用いずに、QPを用いて主観画質を推定することができる。
また、主観画質推定式S(q)は、事前の主観評価実験によって一部の解像度r、フレームレートf毎に予め生成しておく。生成された主観画質推定式S(q)は、動画像に依存しない主観画質推定式であるため、主観評価実験に用いた動画像とは異なる動画像に対しても適用できる。よって、本発明では、主観画質を推定する度に、その動画像に対して主観評価実験を行う必要がない。また、主観画質推定式S(q)が生成されていない解像度r、フレームレートfに対しては、主観画質推定式生成部17が主観画質推定式S(q)を生成するため、事前の主観評価実験による推定式の生成を簡略化することができる。
以上により、ほとんどのビットレートB、解像度r、フレームレートfに対して、主観評価実験、符号化、符号化後の特徴抽出を行わずに、主観画質を推定することができる。よって、計算コストを従来方法より大幅に削減することができる。
[実施形態]
次に、本発明の一実施形態の詳細について説明する。
図1において、QP予測式生成部10は、ビットレートB、解像度r、フレームレートf、オリジナル動画像Iを外部から入力して生成したQP予測式をQP予測部14に出力する。QP予測部14は、QP予測式生成部10から入力したQP予測式と外部から入力したビットレートB、解像度r、フレームレートfとに基づき、算出した予測QPを主観画質推定部18に出力する。主観画質推定部18は、外部から入力した解像度r、フレームレートfに対応する主観画質推定式S(q)を、主観画質推定式管理部15に問い合わせて受け取る。主観画質推定部18は、受け取った主観画質推定式S(q)にQP予測部14から入力した予測QPを代入し、主観画質推定値sを算出して出力する。
QP予測式生成部10は、エンコーダ11、パラメータDB12、QP予測式算出部13を備えている。エンコーダ11には、ビットレートB、解像度r、フレームレートf、オリジナル動画像Iが外部から入力される。エンコーダ11は、オリジナル動画像Iを符号化して、符号化の過程で得られた1画素あたりの平均符号量とQPとを、パラメータDB12へ出力する。あるいは、エンコーダ11は、符号化されたデータから1画素あたりの平均符号量とQPとを取り出してもよい。パラメータDB12は、1画素あたりの平均符号量とQPとを、1レコードとして格納する。QP予測式算出部13は、パラメータDB12に格納された1画素あたりの平均符号量とQPとからQP予測式を生成し、QP予測式をQP予測式生成部14に出力する。
主観画質推定式管理部15は、主観画質推定式DB16と主観画質推定式生成部17とを備えている。主観画質推定式DB16は、主観画質推定部18からの問い合わせに対して主観画質推定式S(q)を送出する。主観画質推定式生成部17は、問い合わせに対応する主観画質推定式S(q)が主観画質推定式DB16に存在しなかった場合には、既知の主観画質推定式S(q)を主観画質推定式DB16から取り出し、問い合わせに対応する主観画質推定式S(q)を生成し、主観画質推定式DB16に格納する。主観画質推定式DB16は、格納された主観画質推定式S(q)を主観画質推定部18に送出する。
図3は、本実施形態による主観画質推定方法の全体動作を説明するためのフローチャートである。全体の処理は、QP予測式の生成、QPの予測、主観画質推定式S(q)の管理及び主観画質推定に分けることができる。それぞれのフローを順に説明する。
[QP予測式生成フロー]
まず、QP予測式生成部10は、オリジナル動画像I、次式(3)に示す解像度r、フレームレートf、ビットレートBを入力する(ステップS200)。このとき、変数jを1とする。次に、変数jがMより大となったか否かを判定する(ステップS201)。そして、変数jがMより大でなければ(ステップS201のYES)、ステップS202へ進む。
Figure 0005956316
QP予測式生成部10は、まず、解像度r、フレームレートf、ビットレートBのオリジナル動画像Iをエンコーダ11に送り、オリジナル動画像Iを解像度r、フレームレートf、ビットレートBの組み合わせに対して符号化する(ステップS202)。次に、QP予測式生成部10は、1画素あたりの平均符号量b、量子化パラメータq(b、qはj番目の解像度とフレームレートとの組み合わせに対する値)を得て、パラメータDB12に格納する(S203)。これをM回繰り返す(ステップS201〜S203)。
図4は、本実施形態によるパラメータDB12のデータ構成の一例を示す概念図である。図4において、パラメータDB12には、量子化パラメータ(QP)と1画素あたりの平均符号量(bits/pixel)とが対応付けて記憶されている。図示の例では、量子化パラメータ「22」に対して1画素あたりの平均符号量「4.5」、量子化パラメータ「27」に対して1画素あたりの平均符号量「2.44」、量子化パラメータ「32」に対して1画素あたりの平均符号量「1.82」が記憶されている。
1画素あたりの平均符号量bは、次式(4)で求める。
Figure 0005956316
上述したステップS201〜S203の繰り返し処理において、変数jがMより大となると(ステップS201のYES)、QP予測式算出部13は、パラメータDB12に格納した1画素あたりの平均符号量b、b、…、bと量子化パラメータ(QP)q、q、…、qMとを用いて1画素あたりの平均符号量bと量子化パラメータ(QP)との関係式であるQP予測式Q(b)を生成する(ステップS204)。
[QP予測フロー]
次に、QP予測部14は、QP予測式算出部13で生成したQP予測式Q(b)とビットレートB、候補の解像度r及びフレームレートfとを入力とし(ステップS205)、そのビットレートB、候補解像度r、フレームレートfにおける1画素あたりの平均符号量bを算出する。その1画素あたりの平均符号量bを用いてQP予測式Q(b)から予測QPを算出し、主観画質推定部18に出力する(ステップS206)。
図5は、本実施形態によるQP予測部14のQP予測動作を説明するためのフローチャートである。QP予測部14は、候補解像度r、候補フレームレートf、ターゲットビットレートBを入力し(ステップS230)、候補解像度r、候補フレームレートf、ターゲットビットレートBから1画素あたりの平均符号量bを求める(ステップS231)。次に、QP予測部14は、その1画素あたりの平均符号量bをQP予測式Q(b)に代入して予測QPを算出し(ステップS232)、該予測QPを出力する(ステップS233)。
[主観画質推定生成フロー]
次に、主観画質推定式管理部15は、主観画質推定部18からの問い合わせに対して処理を行う。主観画質推定式管理部15は、主観画質を推定したい解像度r、フレームレートfを入力し、解像度r、フレームレートfに対応する主観画質推定式S(q)が主観画質推定式DB16に存在するかを確認する(ステップS207)。主観画質推定式S(q)が存在しない場合には(ステップS207のNO)、その解像度r、フレームレートfに対応するS(q)を主観画質推定式生成部17によって生成し、主観画質推定式DB16に格納する(ステップS208)。
図6は、本実施形態による主観画質推定式管理部15の主観画質推定生成動作を説明するためのフローチャートである。主観画質推定式管理部15は、主観画質推定部18から主観画質を推定したい解像度r、フレームレートfを入力する(ステップS250)。次に、主観画質推定式管理部15は、解像度r、フレームレートfに対応する主観画質推定式S(q)が主観画質推定式DB16に存在するか否かを判定する(ステップS251)。
そして、主観画質推定式S(q)が存在しない場合には(ステップS251のNO)、主観画質推定式管理部15は、その解像度r、フレームレートfを主観画質推定式生成部17に出力する(ステップS252)。次に、主観画質推定式生成部17は、主観画質推定式DB16から主観画質推定式S(q)を取り出し(ステップS253)、取り出した主観画質推定式S(q)を用いて、解像度r、フレームレートfに対応する主観画質推定式S(q)を生成し、主観画質推定式DB16に格納する(ステップS254)。
一方、主観画質推定式S(q)が存在する場合(ステップS251のYES)、あるいは上記ステップS254が終了した場合には、主観画質推定式管理部15は、解像度r、フレームレートfに対応する主観画質推定式S(q)を主観画質推定式DB16から取り出す(ステップS255)。そして、主観画質推定式管理部15は、主観画質推定式S(q)を主観画質推定部18に出力する(ステップS256)。
[主観画質推定フロー]
最後に、主観画質推定部18は、予測QPを主観画質推定式S(q)に代入し、主観画質推定値sを求めて出力する(ステップS209、S210)。
図7は、本実施形態による主観画質推定部18の主観画質推定動作を説明するためのフローチャートである。主観画質推定部18は、解像度r、フレームレートf、予測QPを入力し(ステップS270)、解像度r、フレームレートfに対応する主観画質推定式S(q)を、主観画質推定式管理部15に問い合わせて受け取る(ステップS271)。そして、主観画質推定部18は、主観画質推定式S(q)に予測QPを代入し、主観画質評価値sを出力する(ステップS272)。
上述したステップS200〜S204のQP予測式生成フロー後は、評価要求プロセスが、主観画質を推定したい解像度、フレームレート、ビットレートを、ステップS205、S206のQP予測フローへと送る(ステップS220)。そして、評価要求プロセスが主観画質を推定したい解像度、フレームレート、ビットレートの組み合わせ全てに対して主観画質推定値sを受け取ったら終了する(ステップS221)。
次に、各部の内部処理フローについて詳細に説明する。
QP予測式生成部10は、QP予測式の生成のためにエンコーダ11から取り出したQPからQP予測式を算出する内部処理を有する。以下、該QP予測式を算出する内部処理について説明する。主観画質推定式管理部15は、主観画質推定式DB16と主観画質推定式生成部17とを備えている。主観画質推定式DBの構造と主観画質推定式生成B17の算出処理フローについても説明する。
[QP予測式生成部10の内部処理:エンコーダ11からQPを取り出す方法]
まず、QP予測式生成部10がエンコーダ11から量子化パラメータ(QP)の取り出す方法について具体的に説明する。QP予測式生成部10は、動画像を符号化する際のQPの平均値(平均QP)を後述するように求め、その動画像のQPとして取り出す。
固定ビットレート(以下、CBRという)で符号化する場合について説明する。H.264や、HEVCなどでは、エンコーダ11は、あるビットレートで符号化するために、その内部でQPの値を調整している。
QPを取り出す具体的な方法には2つある。第1の方法は、エンコーダ11のレートコントロール機能111から取り出す方法である。QPの値は、エンコーダ11のレートコントロール機能111によって決定される。そこで、その決定されたQPを出力する機能をレートコントロール機能111に備え付けることでQPを取り出す。この方法を用いると、復号前にQPを得ることができる。
具体的には、通常のレートコントロール機能111に以下の機能を追加する。レートコントロール機能111は、マクロブロックでQPを決定する。そこで、レートコントロール機能111でマクロブロック数をカウントし、同時に各マクロブロックのQPの総和を保持しておくことで、全マクロブロック(HEVCでは、全コーディングユニット)の平均QPを算出して出力する。また、レートコントロール機能111において、ピクチャタイプ毎にマクロブロックのカウントとQPの総和とを行うことで、ピクチャタイプで加重平均した平均QPを算出することができる。
第2の方法は、エンコーダ11から出力された符号化された符号化データからデコーダ(パーサー)によって取り出す方法である。例えば、H.264では、あるピクチャのQPの初期値は、符号化データ内のピクチャ・パラメータ・セットとして含まれている。この方法では、エンコーダ11に依存せず、符号化データさえあれば、QPを取り出すことができる。各フレームの初期の平均がピクチャ・パラメータ・セットに含まれているので、符号化データから各フレームの初期を取り出す際に、全フレームの平均QPを算出して出力する。
図8は、本実施形態による、QPを取り出す第2の方法を適用した主観評価値算出方法を実現する機器(CBR符号化)の構成を示すブロック図である。なお、図1に対応する部分には同一の符号を付けて説明を省略する。図8において、QP予測式生成部10は、エンコーダ11に替えて、パーサー19を備えている。図8において、QPを取り出す方法は、デコーダを用いずとも、QPを取り出すことができるのに十分なデコーダの一部機能を実装したパーサー19で構わない。該パーサー19を用いることで、デコード11の一部過程を省略できるので、より高速にQPを取り出すことができる。
[QP予測式生成部10の内部処理:QP予測式算出部13の具体的方法]
QP予測式算出部13は、1画素あたりの平均符号量b、b、…、bとQPq、q、…、qを入力として、QP予測式Q(b)を生成し、QP予測部14に出力する。
QP予測式Q(b)の生成方法について具体的に説明する。動画像の1画素あたりの平均符号量bと量子化パラメータqとの関係を、次式(5)で近似する。
Figure 0005956316
αとβとを求めることで、QPが未知のビットレートに対しても、1画素あたりの平均符号量bからQPを、QP予測式Q(b)から予測することができる。1画素あたりの平均符号量bは、次式(6)で求めることができる。
Figure 0005956316
ここで、pは解像度rのときの1フレームあたりの画素数であり、fはフレームレート、Bはビットレートである。
図9は、本実施形態によるQP予測式算出部13の動作(M=2の場合)を説明するためのフローチャートである。まず、エンコーダ11は、2つのビットレートB、Bでエンコードを行い、QPq、qを取り出し、パラメータDB12に格納する。QP予測式算出部13は、パラメータDB12から取り出した、1画素あたりの平均符号量b1、b2とQPq1、QPq2とを入力する(ステップS280)。次に、QP予測式算出部13は、ビットレートB、Bのそれぞれで1画素あたりの平均符号量b、bを算出し、その1画素あたりの平均符号量b、bとQPq、QPqを数式(5)に代入することでαとβを求める(ステップS281)。Mが3以上の場合には最小二乗法によって求める。なお、Mが大きいほど近似精度は高くなる。また、少ない点で精度を高めるとしたら、なるべく距離の離れた2点を取るとよい。そして、QP予測式算出部13は、QP予測式Q(b)をQP予測部14に送出する(ステップS282)。
CBRで符号化する場合には、動画像の1画素あたりの平均符号量bとQPの関係は、QP予測式Q(b)でなくても、エンコーダ11に依存するレートコントロールアルゴリズムに基づいて決定してもよい。レートコントロールアルゴリズムが既知であれば、レートコントロールアルゴリズムに基づく、qとbの関係式を求めることもできる。その関係式を任意のビットレートに対して適用することで、bからqを求めることができる。例えば、特定のシーンに対して適用することを想定したエンコーダ11で、高速化のために、このような関係式を予めテーブルとして持っているようなエンコーダ11などが対象となる。
ここで、QP予測式Q(b)は、動画像単位ではなく、動画像の各GOP(Group Of Picture)でのQPを、そのGOPでのビットレートから予測してもよい。具体的には、GOP毎にGOP内の全フレームの平均bと平均qを求め、それらに基づいてQP予測式Q(b)を算出する。
平均の求め方は、次のものなどが考えられる。
(1)各フレームの初期qの平均
(2)全マクロブロック(HEVCでは全コーディングユニット)の平均
CBRの場合では、平均bではなく、ターゲットとするビットレートから算出できるbを用いてもよい。高速に数式(5)を算出したい場合には、全フレームの平均ではなく、GOP内でサンプルしたフレームの平均bと平均qから求めてもよい。各フレームでbとqからQP予測式Q(b)を算出し、そのα、βの平均を用いてもよい。
[主観画質推定式管理部15の内部処理:主観画質推定式DB16の構造]
図10は、本実施形態による主観画質推定式DB16の構成例を示す概念図である。主観画質推定式は、一次式(S(q)=γq+δ)で表される。主観画質推定式DB16は、解像度とフレームレートに対する主観画質推定式S(q)のγ、δの値を格納している係数テーブルの形で実現される。図10に示す例では、解像度「1920×1080」に対しては、フレームレート=30、γ=−0.15、δ=7.9、また、フレームレート=15、γ=−0.10、δ=5.94、また、フレームレート=7.5、γ=−0.04、δ=2.00が紐付けられて格納されている。同様に、解像度「960×540」及び解像度「480×270」に対してもフレームレート、γ、δがそれぞれ紐付けられて格納されている。
主観画質推定式DB16は、主観画質推定部18に要求された主観画質推定式を、格納されている主観画質推定式から主観画質推定部18に出力する。主観画質推定式DB16は、格納されていない主観画質推定式に対する要求が来たときに、その主観画質推定式を主観画質推定式生成部17に要求する機能を持つ。そして、主観画質推定式DB16は、主観画質推定式生成部17から返された主観画質推定式を格納し、主観画質推定部18に出力する。
[主観画質推定式管理部15の内部処理:主観画質推定式生成部17]
図11は、本実施形態による主観画質推定式生成部17の動作を説明するためのフローチャートである。主観画質推定式生成部17は、候補解像度r、フレームレートfを入力とし(ステップS290)、その候補解像度r、フレームレートfに対応する主観画質推定式(γ、δ)を、既知の解像度とフレームレートの主観画質推定式(γ、δ)を用いて推定する(ステップS291)。そして主観画質推定式生成部17は、、その生成した主観画質推定式を主観画質推定式DB16に格納する(ステップS292)。
具体的な、主観画質推定式の生成方法について説明する。
主観画質推定式S(q)は、次式(7)で表す。
Figure 0005956316
γ、δは、解像度、フレームレートに依存する値で、動画像の種類には依存しない。また、本実施例では1次式の場合について述べるが、主観画質推定式は2次式、3次式、対数線形モデルで表してもよい。主観画質推定式DB16に格納されている初期のγ、δは、事前の主観評価実験等によって決定する。主観画質推定式DB16は、γ、δを係数テーブルの形で格納している。この主観画質推定式S(q)の生成方法について、以下の5つの場合に分けて説明する。
(1)解像度rが主観画質推定式DB16に存在しない場合の主観画質推定
主観画質推定式生成部17は、主観画質推定式DB16に解像度rの動画像に対する主観画質推定式が存在しない場合に、主観画質推定式DB16にある主観画質推定式のγ、δから主観画質を推定したい解像度rの主観画質推定式のγ、δを補間する。
その補間方法の具体例を説明する。ある解像度r、フレームレートfで符号化したときの主観画質推定値sが知りたいが、主観画質推定式DB16には、解像度rに対応するγ、δは存在しないとする。しかし、主観画質推定式DB16には、解像度rとは異なる解像度のフレームレートfに対するγ、δが存在する。この場合、主観画質推定式生成部17は、主観画質推定式DB16に存在しないγ、δを、主観画質推定式DB16に存在するγ、δから生成する。例えば、図10に示す例では、解像度1280×720のフレームレート30fpsの場合におけるγ、δを生成することを想定する。つまり、図10では、主観画質推定式DB16には、1280×720で30fpsの係数γ、δは存在しないが、1920×1080、960×540で30fpsの係数γ、δは存在する。
このような状況における、γの推定方法について説明する。まず、γと解像度rのときの画素数pの関係を線形近似し、次式(8)で表す。
Figure 0005956316
ε、θは、主観画質推定式DB16に存在するγと解像度の画素数pとから、以下のように算出する。
主観画質推定式生成部17は、主観画質推定式DB16に存在する2つの解像度r、rとフレームレートfの組み合わせ(f、r)、(f、r)に対する各γの値γ、γを、主観画質推定式DB16から求め、γ、γと解像度から求めたp、pとを、上記ε、θを用いたγの近似式に当てはめ、ε、θを算出する。
主観画質推定式生成部17は、上記算出したε、θを用いたpに対するγの近似式によって、主観画質推定式DB16にない解像度rに対応するγの値を推定する。主観画質推定式DB16に3つ以上の解像度のγがあるようであれば、最小二乗法によってε、θを算出してもよい。これにより、主観画質推定式DB16に存在しない解像度rのγを推定することができる。
ここで、近似式は、解像度の画素数pを用いたが、画素数でなくとも、解像度間の関係を表せるような値(例えば、最大解像度の画素数で正規化した値、解像度そのもの)でもよい。さらに、主観画質推定式DB16に十分な解像度のγが標本として格納可能であれば、近似式は、1次式でなくても、2次式、3次式、対数線形モデルなどで近似してもよい。これらの近似方法の1つは、最小二乗法である。δもγと同様の方法にて求める。
(2)フレームレートfが主観画質推定式DB16に存在しない場合の主観画質推定
主観画質推定式生成部17は、主観画質推定式DB16にフレームレートfの動画像に対する主観画質推定式が存在しない場合に、主観画質推定式DB16にある主観画質推定式のγ、δから主観画質を推定したいフレームレートfの主観画質推定式のγ、δを補間する。
その補間方法の具体例を説明する。ある解像度r、フレームレートfで符号化したときの主観画質推定値sが知りたいが、主観画質推定式DB16には、フレームレートfに対応するγ、δは存在しないとする。しかし、主観画質推定式DB16には、フレームレートfとは異なるフレームレートの解像度rに対するγ、δが存在する。この場合、主観画質推定式生成部17は、主観画質推定式DB16にないγ、δを、主観画質推定式DB16に存在するγ、δから生成する。例えば、図10に示す例では、解像度1920×1080のフレームレート20fpsの場合におけるγ、δを生成することを想定する。つまり、図10では、主観画質推定式DB16には、20fpsで1920×1080の係数は存在しないが、30fps、15fpsで1920×1080の係数は存在する。
このような状況における、γの推定方法について説明する。まず、γとフレームレートfの関係を線形近似し、次式(9)で表す。
Figure 0005956316
ε、θは、主観画質推定式DB16に存在するγとフレームレートfから、以下のように算出する。
主観画質推定式生成部17は、主観画質推定式DB16に存在する2つのフレームレートf、fと解像度rの組み合わせ(f、r)、(f、r)に対する各γの値γ、γを、主観画質推定式DB16から求め、γ、γとフレームレートf、fを、上記のε、θを用いたγの近似式に当てはめ、ε、θを算出する。
主観画質推定式生成部17は、上記算出したε、θを用いたfに対するγの近似式によって、主観画質推定式DB16にないフレームレートfに対応するγの値を推定する。主観画質推定式DB16に3つ以上のフレームレートのγがあるようであれば、最小二乗法によってε、θを算出してもよい。これにより、主観画質推定式DB16に存在しないフレームレートfのγを推定することができる。
ここで、近似式は、フレームレートfを用いたが、フレームレートでなくとも、フレームレート間の関係を表せるような値(例えば、最大フレームレートで正規化した値)でもよい。さらに、主観画質推定式DB16に十分なフレームレートのγが標本として格納可能であれば、近似式は、1次式でなくても、2次式、3次式、対数線形モデルなどで近似してもよい。δもγと同様の方法にて求める。
(3)解像度r、フレームレートfが主観画質推定式DB16に存在しない場合の主観画質推定
主観画質推定式生成部17は、主観画質推定式DB16に解像度rとフレームレートfの動画像に対する主観画質推定式が存在しない場合に、主観画質推定式DB16にある主観画質推定式のγ、δから主観画質を推定したい解像度r、フレームレートfの主観画質推定式のγ、δを補間する。
その補間方法の具体例を説明する。ある解像度r、フレームレートfで符号化したときの主観画質推定値sが知りたいが、主観画質推定式DB16には、解像度r、フレームレートfに対応するγ、δは存在しないとする。この場合、主観画質推定式生成部17は、主観画質推定式DB16に存在しないγ、δを主観画質推定式DB16に存在するγ、δから生成する。例えば、図10に示す例では、解像度1280×720のフレームレート20fpsの場合におけるγ、δを生成することを想定する。つまり、図10では、20fps、1280×720の係数は存在しないが、30fps、15fps、1920×1080、960×540の係数は全ての組み合わせに対して存在する。
このような状況における、γの推定方法について説明する。
図12は、本実施形態による主観画質推定式生成部17での加重平均による係数の算出方法を示す概念図である。主観画質推定式生成部17は、主観画質推定式DB16にある4つの主観画質推定式のγ、δの値の加重平均によって推定する。図12に示すように、4つの解像度と4つのフレームレートとの組み合わせ(r、f)、(r、f)、(r、f)、(r、f)に対して、4つのγが与えられたとし、それをγ、γ、γ、γとする。ここで、図12に示す位置(r、f)でのγを求めたいとし、それをγとする。γは、図12におけるγ23、γ45の解像度の比による加重平均で求められる。γ23は、次式(10)で求められる。
Figure 0005956316
同様にして、γ45を算出し、その解像度、γ23、γ45を解像度の比によってフレームレートと同様に加重平均することでγとする。γは、次式(11)となる。
Figure 0005956316
(4)上記では、解像度、フレームレートそれぞれで近似式を生成する方法について説明した。これに対して、係数γ、δが主観画質推定式DB16に存在する解像度、フレームレートの組み合わせに対して3点以上あれば、以下のようにして求めることができる。すなわち、解像度−フレームレート−係数(γ、もしくはδ)の3次元空間を想定することで、解像度及びフレームレートと、それに対応する係数γまたはδの値とで表現される平面によってγ、δを近似することができる。例えば、γを解像度とフレームレートから推定する場合、次式(12)のように近似することができる。
Figure 0005956316
近似する平面の大きさ、つまり、解像度とフレームレートとの範囲は、推定精度を損なわない範囲で設定してあればよい。一般には、平面で近似することによって、γ、δを既知とする解像度、フレームレートが2つではなく、3つ必要となるが、γ、δが解像度、フレームレートともに未知の場合、改めて近似式を推定しなくてもよくなる。平面を求める1つの具体的な方法は、最小二乗近似する方法である。
(5)上記(4)では、平面でγ、δを近似したが、曲面で近似してもよい。例えば、N次の多項式曲面を用いる方法である(Nは1以上の整数)。
なお、上述した実施形態において、上記のような形態で実施されるプログラムは、単一の装置に依存するものではなく、プログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませて実行することによって主観画質推定を行い、解像度、フレームレートを決定してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに、「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行っても良い。
10…QP予測式生成部, 11…エンコーダ, 111…レートコントロール機能, 12…パラメータDB, 13…QP予測式算出部, 14…QP予測部, 15…主観画質推定式管理部, 16…主観画質推定式DB, 17…主観画質推定式生成部, 18…主観画質推定部, 19…パーサー

Claims (9)

  1. 動画像の1画素あたりの平均符号量から量子化パラメータを予測するためのQP予測式を生成するQP予測式生成部と、
    前記QP予測式を用いて、1画素あたりの平均符号量から予測QPを算出するQP予測部と、
    符号化パラメータに対する主観画質推定式を出力する主観画質推定式管理部と、
    前記予測QP及び前記主観画質推定式に基づいて、主観画質推定値を算出する主観画質推定部と、
    を備える主観画質推定装置。
  2. 前記QP予測式生成部は、
    動画像をエンコードして平均QPと1画素あたりの平均符号量とを出力するエンコーダと、
    前記エンコーダによって出力された前記平均QP及び前記平均符号量を格納するパラメータ記憶部と、
    前記パラメータ記憶部に格納された前記平均QP及び前記平均符号量に基づいて前記QP予測式を算出するQP予測式算出部と、
    を備える請求項1に記載の主観画質推定装置。
  3. 前記QP予測式生成部は、
    符号化データを解析して平均QPと1画素あたりの平均符号量とを出力するパーサーと、
    前記パーサーによって出力された前記平均QP及び前記平均符号量を格納するパラメータ記憶部と、
    前記パラメータ記憶部に格納された前記平均QP及び前記平均符号量に基づいて前記QP予測式を算出するQP予測式算出部と、
    を備える請求項1に記載の主観画質推定装置。
  4. 前記QP予測式算出部は、前記パラメータ記憶部に格納された前記平均QP及び前記平均符号量の組み合わせを複数取得し、取得された前記組み合わせに基づいて、N次式(Nは1以上の整数)で表現した1画素あたりの前記平均QP及び前記平均符号量の関係を最小二乗法によって表すことによって前記QP予測式を算出する、請求項2又は3に記載の主観画質推定装置。
  5. 前記QP予測式算出部は、前記パラメータ記憶部に格納された前記平均QP及び前記平均符号量の組み合わせを2組取得し、前記2組が表す2点を含む直線によって表される式を前記QP予測式として算出する、請求項2又は3に記載の主観画質推定装置。
  6. 前記主観画質推定式管理部は、前記主観画質推定式を格納しており、前記主観画質推定部によって要求された主観画質推定式を格納している場合は、当該主観画質推定式を前記主観画質推定部に出力し、前記主観画質推定部によって要求された主観画質推定式を格納していない場合は、既に格納されている前記主観画質推定式に基づいて、要求された主観画質推定式を生成し前記主観画質推定部に出力する、請求項1から5のいずれか1項に記載の主観画質推定装置。
  7. 前記主観画質推定式管理部は、初期値として事前の主観評価実験によって得られた主観画質推定式を格納しており、格納された前記主観画質推定式の係数及び符号化パラメータの組み合わせに基づいて前記係数及び前記符号化パラメータの関係を近似するN次式(Nは1以上の整数)を生成し、近似したN次式に基づいて前記主観画質推定式を生成する、請求項6に記載の主観画質推定装置。
  8. 動画像の1画素あたりの平均符号量から量子化パラメータを予測するためのQP予測式を生成するQP予測式生成ステップと、
    前記QP予測式を用いて、1画素あたりの平均符号量から予測QPを算出するQP予測ステップと、
    符号化パラメータに対する主観画質推定式を出力する主観画質推定式管理ステップと、
    前記予測QP及び前記主観画質推定式に基づいて、主観画質推定値を算出する主観画質推定ステップと、
    を有する主観画質推定方法。
  9. 請求項1から7のいずれか1項に記載の主観画質推定装置が行う処理をコンピュータに実行させるためのプログラム。
JP2012257925A 2012-11-26 2012-11-26 主観画質推定装置、主観画質推定方法及びプログラム Expired - Fee Related JP5956316B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012257925A JP5956316B2 (ja) 2012-11-26 2012-11-26 主観画質推定装置、主観画質推定方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012257925A JP5956316B2 (ja) 2012-11-26 2012-11-26 主観画質推定装置、主観画質推定方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014107645A JP2014107645A (ja) 2014-06-09
JP5956316B2 true JP5956316B2 (ja) 2016-07-27

Family

ID=51028795

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012257925A Expired - Fee Related JP5956316B2 (ja) 2012-11-26 2012-11-26 主観画質推定装置、主観画質推定方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5956316B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5756154B2 (ja) * 2013-09-24 2015-07-29 日本電信電話株式会社 映像符号化パラメータ算出装置、映像符号化パラメータ算出方法及びプログラム
US10154266B2 (en) 2014-11-17 2018-12-11 Nippon Telegraph And Telephone Corporation Video quality estimation device, video quality estimation method, and video quality estimation program
WO2021181681A1 (ja) * 2020-03-13 2021-09-16 日本電信電話株式会社 数理モデル導出装置、数理モデル導出方法及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3297471B2 (ja) * 1992-07-29 2002-07-02 沖電気工業株式会社 画像符号化装置
JP2009260940A (ja) * 2008-03-21 2009-11-05 Nippon Telegr & Teleph Corp <Ntt> 映像品質客観評価方法、映像品質客観評価装置、およびプログラム
JP5484140B2 (ja) * 2010-03-17 2014-05-07 Kddi株式会社 映像品質の客観画質評価装置
JP5306282B2 (ja) * 2010-05-20 2013-10-02 日本電信電話株式会社 動画像符号化装置、動画像符号化方法及びプログラム

Also Published As

Publication number Publication date
JP2014107645A (ja) 2014-06-09

Similar Documents

Publication Publication Date Title
US11818389B2 (en) Method and device for encoding/decoding motion vector
JP6054552B2 (ja) 縮小された記憶域を伴うイントラ予測モード決定
JP2019505144A (ja) ビデオコーディングのためのフィルタのための幾何学的変換
US10404982B2 (en) Per-sample prediction encoding apparatus and method
US10531082B2 (en) Predictive light-field compression
JP2018509067A (ja) ほぼ視覚的無損失なビデオ再圧縮
CN110324623A (zh) 一种双向帧间预测方法及装置
KR102313136B1 (ko) 실시간 비디오 스트리밍에서의 초해상화 가속을 위한 장치 및 방법
CN114845106A (zh) 视频编码方法、装置和存储介质及电子设备
KR20130103140A (ko) 영상압축 전에 행해지는 전처리 방법, 영상 압축률 개선을 위한 적응성 움직임 추정방법 및 영상 타입별 영상 데이터 제공방법
US10356430B2 (en) Interlayer video decoding method and apparatus using view synthesis prediction and interlayer video encoding method and apparatus using view synthesis prediction
JP5956316B2 (ja) 主観画質推定装置、主観画質推定方法及びプログラム
JP6145069B2 (ja) 主観画質推定装置及び主観画質推定プログラム
TW201921938A (zh) 具有在用於視訊寫碼之隨機存取組態中之未來參考訊框之可調適圖像群組結構
WO2018109455A1 (en) Motion compensation techniques for video
JPWO2012121211A1 (ja) 量子化制御装置及び方法、及び量子化制御プログラム
Kumar et al. Double sarsa based machine learning to improve quality of video streaming over HTTP through wireless networks
JP5676717B2 (ja) 画像の復号化装置及び画像の復号化方法
JP6311085B1 (ja) 画像の復号化装置および画像の復号化方法
JP5547171B2 (ja) 画像の復号化装置及び画像の復号化方法
JP5992866B2 (ja) 主観画質推定装置、及び、主観画質推定プログラム
KR20180113868A (ko) 카메라 영상의 복호화 정보 기반 영상 재 부호화 방법 및 이를 이용한 영상 재부호화 시스템
JP6311086B1 (ja) 画像の復号化装置および画像の復号化方法
JP6357523B2 (ja) 画像の復号化装置および画像の復号化方法
JP6348562B2 (ja) 復号化装置および復号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160614

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160616

R150 Certificate of patent or registration of utility model

Ref document number: 5956316

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees