JP6466963B2 - 映像品質推定装置、映像品質推定方法、および映像品質推定プログラム - Google Patents

映像品質推定装置、映像品質推定方法、および映像品質推定プログラム Download PDF

Info

Publication number
JP6466963B2
JP6466963B2 JP2016560213A JP2016560213A JP6466963B2 JP 6466963 B2 JP6466963 B2 JP 6466963B2 JP 2016560213 A JP2016560213 A JP 2016560213A JP 2016560213 A JP2016560213 A JP 2016560213A JP 6466963 B2 JP6466963 B2 JP 6466963B2
Authority
JP
Japan
Prior art keywords
video quality
value
video
resolution
frame rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016560213A
Other languages
English (en)
Other versions
JPWO2016080354A1 (ja
Inventor
太一 河野
太一 河野
山本 浩司
浩司 山本
恵 竹下
恵 竹下
一道 佐藤
一道 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2016080354A1 publication Critical patent/JPWO2016080354A1/ja
Application granted granted Critical
Publication of JP6466963B2 publication Critical patent/JP6466963B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/198Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including smoothing of a sequence of encoding parameters, e.g. by averaging, by choice of the maximum, minimum or median value
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/004Diagnosis, testing or measuring for television systems or their details for digital television systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

この発明は、符号化された映像を視聴するサービスにおいて、ユーザが映像を視聴した際に体感する映像の品質(以下、「映像品質」と称する)を推定するための装置、方法、およびプログラムに関する。
近年、ネットワークを介した映像配信サービスが普及している。映像配信サービス事業者は、収益を向上させるために、ユーザが満足する映像品質でサービスを提供することが重要である。そのため、映像品質に基づいて、サービスを設計・管理することが重要であり、映像品質を定量化する技術が求められる。
一般に、映像は、データ量を圧縮するために符号化処理が行われる。符号化ビットレートを下げると、ブロック状の歪みやぼけなどが発生し、映像品質が低下する。また、映像品質は、映像の解像度やフレームレートにも依存する。
映像配信サービスの設計・管理を行うためには、上記のような映像品質の性質を考慮して、符号化ビットレート、解像度、およびフレームレートから映像品質を精度良く推定することが必要である。
浦田勇一朗、山岸和久、"映像解像度に対し拡張したITU-T勧告P.1 201.1モデルの有効性検証"、信学技報、CQ2012-94, pp.59-63、Mar. 2013.
この発明は上記事情に着目してなされたもので、その目的とするところは、符号化ビットレート、解像度、およびフレームレートから映像品質を精度良く推定することを可能とする技術を提供することにある。
また、本発明の実施形態によれば、符号化された映像の視聴において、前記映像をユーザが視聴した際に体感する前記映像の品質である映像品質を定量化した値である映像品質値を推定する映像品質推定装置であって、
前記映像の1フレームの画素数である解像度、及び、前記映像の単位時間あたりのフレーム数であるフレームレートに基づいて、前記映像品質値の最大値を算出する最大値算出手段と、
入力値が増加もしくは減少するとある値に収束するS字曲線の性質を有するシグモイド関数が描く曲線上における曲がる方向が変わる点である変曲点を、前記解像度及び前記フレームレートに基づいて算出する変曲点算出手段と、
前記映像の単位時間あたりの平均データ量である符号化ビットレートと、前記最大値算出手段によって算出された前記映像品質値の最大値と、前記変曲点算出手段によって算出された前記変曲点とを前記シグモイド関数に入力することにより、推定映像品質値を算出する映像品質算出手段と、
を備える映像品質推定装置が提供される。
また、本発明の実施形態によれば、符号化された映像の視聴において、前記映像をユーザが視聴した際に体感する前記映像の品質である映像品質を定量化した値である映像品質値を推定する映像品質推定装置が実行する映像品質推定方法であって、
前記映像の1フレームの画素数である解像度、及び、前記映像の単位時間あたりのフレーム数であるフレームレートに基づいて、前記映像品質値の最大値を算出し、
入力値が増加もしくは減少するとある値に収束するS字曲線の性質を有するシグモイド関数が描く曲線上における曲がる方向が変わる点である変曲点を、前記解像度及び前記フレームレートに基づいて算出し、
前記映像の単位時間あたりの平均データ量である符号化ビットレートと、前記最大値と、前記変曲点とを前記シグモイド関数に入力することにより、推定映像品質値を算出する、
映像品質推定方法が提供される。
本発明の実施形態によれば、符号化ビットレート、解像度、およびフレームレートから映像品質値を精度良く推定することを可能とする技術が提供される。
図1は、主観評価実験の結果例を示す符号化ビットレートと映像品質値との関係(解像度を変えた場合)である。 図2は、主観評価実験の結果例を示す符号化ビットレートと映像品質値との関係(フレームレートを変えた場合)である。 図3は、本実施形態に係る映像品質推定方法が適用された映像品質推定装置の構成例を示す機能ブロック図である。 図4は、本実施形態に係る映像品質推定のための式に基づく符号化ビットレートと映像品質値との関係を示す図である。 図5は、本実施形態に係る映像品質推定のための式に基づく符号化ビットレートと映像品質値との関係を示す図である。 図6は、本実施形態に係る映像品質推定方法が適用された映像品質推定装置の動作例を示すフローチャートである。
以下に、本発明の実施形態を、図面を参照して説明する。なお、以下で説明する実施形態は一例に過ぎず、本発明が適用される実施形態は、以下の実施の形態に限られるわけではない。
(映像品質の性質について)
本実施形態に係る映像品質推定方法を説明する前に、本実施形態において前提としている映像品質の性質の例について説明する。
図1及び図2は、複数の評価者に映像を観視及び評価をさせる実験(以下、「主観評価実験」と称する)の結果を示している。図1及び図2において、縦軸は、視聴した映像に対して複数の評価者が評価した評点の平均値(以下、「映像品質値」と称する)、横軸は、符号化ビットレートを示している。
図1及び図2のプロット点の違いは、図1においては映像の解像度の違い、図2においてはフレームレートの違いを示している。すなわち、図1は、フレームレートを15に一定にした状態で、解像度を変えた曲線a(解像度480×270),b(解像度640×360),c(解像度960×540),d(解像度1280×720)を示している。また、図2は、解像度を640×360に一定にした状態で、フレームレートを変えた曲線e(フレームレート10),f(フレームレート15),g(フレームレート30)を示している。
これら主観評価実験では、同じ解像度又は同じフレームレートにおいて、符号化ビットレートと映像品質値はS字曲線の関係があり(性質1)、符号化ビットレートが小さくなると最小品質値(図1及び図2では映像品質値が1)に収束し(性質2)、符号化ビットレートが大きくなるとある映像品質値に収束するが、解像度が高いほど、または、フレームレートが高いほど、映像品質値が大きくなる(性質3)という結果が得られた。また、図1及び図2の各プロットにおけるS字曲線の変曲点は、図1では解像度が大きいほど、また、図2ではフレームレートが高いほど、高い符号化ビットレートに位置する(性質4)という結果が得られた。映像品質の性質の例として、このような性質1〜性質4がある。
(装置構成)
図3は、本実施形態に係る映像品質推定方法が適用された映像品質推定装置10の構成例を示す機能ブロック図である。
本実施形態では、主観評価実験によって得られた評点の平均値である映像品質値を基に、符号化ビットレートBR、解像度RS、フレームレートFRと映像品質値の関係をモデル化し、構築したモデル式を用いて、符号化ビットレートBR、解像度RS、フレームレートFRから推定映像品質値VQを算出する。
これを実現するために、映像品質推定装置10は、最大値算出部12と、変曲点算出部14と、映像品質算出部16とを備えている。このような映像品質推定装置10は、例えば磁気ディスク等の記録媒体に記録されたプログラムや、インターネット等の通信ネットワークを介してダウンロードしたプログラムを読み込み、このプログラムによって動作が制御されるコンピュータによって実現されてもよい。つまり、上記プログラムが実行されるコンピュータのプロセッサにより、最大値算出部12と、変曲点算出部14と、映像品質算出部16とが実現される。
また、最大値算出部12と、変曲点算出部14と、映像品質算出部16はそれぞれ、ハードウェアの回路として実現してもよい。
最大値算出部12は、映像の1フレームの画素数である解像度RS、及び、映像の単位時間あたりのフレーム数であるフレームレートFRを入力とし、解像度RS及びフレームレートFR毎に定まる映像品質値の最大値MAXを算出する。映像品質値の最大値MAXは次式(式1)によって算出される。式1は、解像度RS及びフレームレートFRの増加に伴い、増加する2変数増加関数で表現される。前述したとおり、映像品質値は、符号化ビットレートが大きくなると、ある収束値に収束する。ここでの最大値MAXは、与えられた解像度RS及びフレームレートFRでの当該収束値に相当する。
Figure 0006466963
ここで、c,cは係数であり、VQmaxは推定映像品質値VQが取りうる最大値、VQminは推定映像品質値VQが取りうる最小値である。例えば、ITU−T勧告P.910で定義されている主観評価法のACR法では、VQmaxは5、VQminは1になる。
なお、最大値算出部12は式1に相当する処理ロジックを備えることで最大値MAXの算出を行ってもよいし、式1を示す関数データを映像品質推定装置10が備える記憶装置から読み出すことにより式1の計算を行うこととしてもよい。また、式1に示す関係に従って、解像度RS、フレームレートFR、及び最大値MAXを対応付けたテーブルを上記記憶装置に格納しておき、入力値に対応する最大値MAXを読み出すことで算出を行うこととしてもよい。
なお、式1は、映像品質値の最大値MAXを算出する式の一例に過ぎない。解像度RS及びフレームレートFR毎に実験等により得られた映像品質値の最大値MAXを適切に表す他の式を用いることとしてもよい。
変曲点算出部14は、解像度RS及びフレームレートFRを用いて、変曲点IPを算出する。変曲点IPは、映像品質算出部16において用いられるシグモイド関数が描く曲線上の曲がる方向が変わる点である。シグモイド関数は、入力値が増加もしくは減少するとある値に収束するS字曲線の性質を有する。変曲点IPは次式(式2)によって算出される。式2は、解像度RS及びフレームレートFRの増加に伴い、増加する2変数増加関数で表現される。
Figure 0006466963
ここで、c,c,c,cは係数である。なお、変曲点IPの単位は符号化ビットレートの単位と同じである。
なお、変曲点算出部14は式2に相当する処理ロジックを備えることで変曲点IPの算出を行ってもよいし、式2を示す関数データを映像品質推定装置10が備える記憶装置から読み出すことにより式2の計算を行うこととしてもよい。また、式2に示す関係に従って、解像度RS、フレームレートFR、及び変曲点IPを対応付けたテーブルを上記記憶装置に格納しておき、入力値に対応する変曲点IPを読み出すことで算出を行うこととしてもよい。
なお、式2は、変曲点IPを算出する式の一例に過ぎない。解像度RS及びフレームレートFR毎に実験等により得られた変曲点IPの値を適切に表す他の式を用いることとしてもよい。
映像品質算出部16は、符号化ビットレートBRを入力値とし、映像品質値の最大値MAXと、変曲点IPとが適用されているシグモイド関数で表現される推定映像品質値VQを算出する。以下の式3として、このようなシグモイド関数の例を示す。
Figure 0006466963
ここで、(BR/IP)の指数として示されているcは係数である。このように、推定映像品質値VQは、符号化ビットレートBRを入力としたシグモイド関数で表現される。係数cは、符号化ビットレートBRの高い方の収束値が映像品質値の最大値MAXになり、符号化ビットレートBRの低い方の収束値が推定映像品質値の最小値VQminになるように決定される。また、変曲点IPは、シグモイド関数の変曲点のX軸座標に相当する。
なお、c,c,c,c,c,c,cは最小二乗法などにより、主観評価実験で得られる映像品質値と推定映像品質値VQの差が最小になるように最適化することにより決定するようにしても良い。
なお、映像品質算出部16は式3に相当する処理ロジックを備えることで推定映像品質値VQの算出を行ってもよいし、式3を示す関数データを映像品質推定装置10が備える記憶装置から読み出すことにより式3の計算を行うこととしてもよい。また、式3に示す関係に従って、最大値MAX、変曲点IP、符号化ビットレートBR、及び推定映像品質値VQを対応付けたテーブルを上記記憶装置に格納しておき、入力値(最大値MAX、変曲点IP、符号化ビットレートBR)に対応する推定映像品質値VQを読み出すことで算出を行うこととしてもよい。
また、映像品質値の最大値MAXと、変曲点IPと、符号化ビットレートBRとから推定映像品質値VQを算出する式は式3に限られず、変曲点IPを変曲点とするS字カーブを描く他の式(シグモイド関数に限られない)を用いてもよい。
最大値MAXと変曲点IPはそれぞれ解像度RS及びフレームレートFRから得られるから、式3は、解像度RS、フレームレートFR、および符号化ビットレートBRから推定映像品質値VQを算出する式の例である。
図4は、ある解像度RS及びフレームレートFRを与えたときに、式3により符号化ビットレートBR毎に得られる映像品質値を模式的に表したグラフである。図4において、「IP」として、当該解像度RS及びフレームレートFRにおける変曲点IPの値が示されている。また、図4の場合、当該解像度RS及びフレームレートFRにおける最大値MAXは5である。
本実施形態において、解像度RS、フレームレートFR、および符号化ビットレートBRから推定映像品質値VQを算出する式は、式3及び図4に示したように変曲点を有するものに限られず、例えば、以下の式4を用いてもよい。
VQ=MAX‐MAX・exp(‐BR/a) ・・・ 式4
式4において、aは固定の係数であり、例えば実験等により適切な値が決定される。MAXは既に説明した最大値MAXであり、本実施形態では式1により算出される。BRは符号化ビットレートである。
図5は、ある解像度RS及びフレームレートFRを与えたときに、式4により符号化ビットレートBR毎に得られる映像品質値を模式的に表したグラフである。図5に示すように、変曲点を持たず、最大値MAX(図5の場合には5)から、符号化ビットレートの低下とともに映像品質値が低下する。
この場合、映像品質算出部16は式4に相当する処理ロジックを備えることで推定映像品質値VQの算出を行ってもよいし、式4を示す関数データを映像品質推定装置10が備える記憶装置から読み出すことにより式4の計算を行うこととしてもよい。また、式4に示す関係に従って、最大値MAX、符号化ビットレートBR、及び推定映像品質値VQを対応付けたテーブルを上記記憶装置に格納しておき、入力値(最大値MAX、符号化ビットレートBR)に対応する推定映像品質値VQを読み出すことで算出を行うこととしてもよい。
なお、図1、図2において、映像品質の性質として変曲点を持つことを説明したが、これは映像品質の性質の例である。映像によっては、図5に示すように、符号化ビットレートの増加につれて映像品質値が増加し、変曲点を持たずに、最大値MAXに収束する場合がある。このような映像に対して、式4のように変曲点を有しない式を用いることで、精度良く映像品質を推定できる。また、式4を用いる場合には、映像品質推定装置10において、変曲点算出部14を備えないこととしてもよい。
本実施形態の映像品質推定装置10への入力値として用いる解像度、フレームレート、および符号化ビットレートを取得あるいは決定する方法については、特定の方法に限定されないが、例として以下のような方法がある。
例えば、映像配信サービスの提供者が映像品質推定装置10を用いて映像品質を推定する場合、提供者が映像配信サービスに使用している解像度、フレームレート、および符号化ビットレートを入力値として用いることができる。
また、例えば、映像配信サービスで使用されている解像度、フレームレート、および符号化ビットレートを知らないネットワーク事業者もしくは映像配信サービスのユーザが、映像品質推定装置10を用いて当該映像配信サービスの映像品質を推定する場合においては、サーバから配信されるメタ情報(例:MPEG−DASHでのMPD(Media Presentation Description))を取得することで、メタ情報に記述されている解像度、フレームレート、および符号化ビットレートを取得し、映像品質推定装置10への入力値として使用することができる。
なお、メタ情報に記述されている符号化ビットレートは、ターゲットビットレート(符号化時の目標とする設定値)である。実際の符号化ビットレートがターゲットビットレートに対して大きく変動するケースでは、実際の符号化ビットレートを測定して入力値とすることが望ましい。測定した符号化ビットレートの方がターゲットビットレートよりも映像品質と良く対応するためである。従って、符号化ビットレートに関しては、映像配信サービスにより送信される映像のIPパケットのペイロードを測定し、測定で得られたビットレートを入力値として使用することが望ましい。
ここで、映像及び音響のメディアが暗号化されているために、メディアを識別できず、トータルのビットレートしか測定できない場合には、メタ情報から音響ビットレートを取得し、IPパケットから測定したトータルビットレートから音響ビットレートを減算し、それを映像の符号化ビットレートとすることができる。なお、音響ビットレートについてはターゲットビットレートから変動することがほぼないため、上記のようにメタ情報から取得した値を使用できる。
また、IPパケットのビットストリーム(H.264やH.265で符号化されたデータそのもの)にアクセスできる場合には、当該データのビットレートを測定することで、映像品質推定装置10への入力値として使用することができる。
上述したようにして解像度、フレームレート、および符号化ビットレートを取得する機能は、映像品質推定装置10が備えてもよいし、別の装置が当該機能を備え、当該装置で得られた値を映像品質推定装置10に入力することとしてもよい。
(動作手順)
次に、以上のように構成された本実施形態に係る映像品質推定方法が適用された映像品質推定装置10の動作について、図6のフローチャートを用いて説明する。以下では、一例として、映像品質推定のために変曲点IPを有する式(例:式3)を用いる場合について説明する。なお、式4のように、変曲点IPを有しない式を用いる場合には、下記のS2における変曲点IPの算出を行わなくてよい。
まず、最大値算出部12によって、映像の1フレームの画素数である解像度RS、及び、映像の単位時間あたりのフレーム数であるフレームレートFRに基づいて、解像度RS及びフレームレートFR毎に定まる映像品質値の最大値MAXが算出される(S1)。映像品質値の最大値MAXは前述したように、解像度RS及びフレームレートFRの増加に伴い、増加する2変数増加関数で表現される。S1では、最大値算出部12が、当該2変数増加関数に、ある解像度RSとフレームレートFRを入力することで最大値MAXを算出する。
また、変曲点算出部14によって、解像度RS及びフレームレートFRが用いられることにより、映像品質算出部16において用いられるシグモイド関数が描く曲線上の曲がる方向が変わる点である変曲点IPが算出される(S2)。シグモイド関数は、入力値が増加もしくは減少するとある値に収束するS字曲線の性質を有する。変曲点IPは前述したように、解像度RS及びフレームレートFRの増加に伴い、増加する2変数増加関数で表現される。つまり、S2では、変曲点算出部14が、当該2変数増加関数に、S1で入力に用いた解像度RSとフレームレートFRを入力することで変曲点IPを算出する。
次に、映像品質算出部16によって、符号化ビットレートBRが入力値とされ、ステップS1で算出された映像品質値の最大値MAXと、ステップS2で算出された変曲点IPとが適用されてなるシグモイド関数で表現される推定映像品質値VQが算出される(S3)。つまり、映像品質算出部16は、符号化ビットレートBRと、最大値MAXと、変曲点IPとを変数として有するシグモイド関数(例:式3)に、ある符号化ビットレートBRと、S1で算出した最大値MAXと、S2で算出した変曲点IPとを入力することで、推定映像品質値VQを算出する。
シグモイド関数の係数cは、符号化ビットレートBRの高い方の収束値が映像品質値の最大値MAXになり、符号化ビットレートBRの低い方の収束値が推定映像品質値の最小値VQminになるように決定される。また、変曲点IPは、シグモイド関数の変曲点のX軸座標に相当する。
なお、c,c,c,c,c,c,cは最小二乗法などにより、主観評価実験で得られる映像品質値と推定映像品質値VQの差が最小になるように最適化することにより決定するようにしても良い。
なお、ステップS1及びステップS2は直列処理でも並列処理でも構わない。また、直列処理の場合、ステップS1とステップS2の順番はどちらでもよい。
(実施形態のまとめ)
以上、説明したように、本実施形態の映像品質推定装置10は、符号化された映像の視聴において、映像をユーザが視聴した際に体感する映像の品質である映像品質を定量化した値である映像品質値を推定する。
このために、映像品質推定装置10は、映像の1フレームの画素数である解像度、及び、映像の単位時間あたりのフレーム数であるフレームレート毎に定まる映像品質値の最大値を算出する。また、映像品質推定装置10は、入力値が増加もしくは減少するとある値に収束するS字曲線の性質を有するシグモイド関数が描く曲線上における曲がる方向が変わる点である変曲点を、解像度及び前記フレームレートに基づいて算出する。そして、映像品質推定装置10は、映像の単位時間あたりの平均データ量である符号化ビットレートを入力値とし、算出された映像品質値の最大値と、算出された変曲点とが適用されてなるシグモイド関数で表現される推定映像品質値を算出する。
なお、シグモイド関数の高い方の収束値が、映像品質値の最大値になり、低い方の収束値が、推定映像品質値の最小値になるように、シグモイド関数の係数が決定される。また、映像品質値の最大値は、解像度及びフレームレートの増加に伴い、増加する2変数増加関数で表現され、変曲点は、解像度及びフレームレートの増加に伴い、増加する2変数増加関数で表現される。
また、映像品質推定装置10を、前記映像の解像度、及び、前記映像のフレームレートから、前記映像品質値の最大値を算出する最大値算出手段と、前記映像の符号化ビットレートと映像品質値との間の予め定めた関係に基づいて、入力された符号化ビットレートに対応する推定映像品質値を算出する映像品質算出手段と、を備え、前記予め定めた関係は、符号化ビットレートの増加に伴い、映像品質値が増加して、当該映像品質値が、前記最大値算出手段によって算出された前記最大値に収束するという関係であることを特徴とする映像品質推定装置として構成してもよい。
上述したように、本実施形態に係る映像品質推定方法が適用された映像品質推定装置10においては、映像品質値を推定するためのモデルを、シグモイド関数を用いて構築している。
シグモイド関数は、入力値が増加もしくは減少するとある値に収束していくS字曲線で表わされるため、前述した性質1を考慮することができる。また、シグモイド関数は、収束値を係数で決定することができるため、高い方の収束値が映像品質値の最大値になり、低い方の収束値が推定映像品質値の最小値になるように係数を決定することによって、前述した性質2と性質3をも考慮することができる。
さらに、シグモイド関数ではS字曲線の変曲点のX軸座標を係数で決定することができるため、変曲点IPのX軸座標を決定する係数を、解像度RSとフレームレートFRの増加によって増加するようにモデル化することで、前述した性質4をも考慮することができる。
したがって、本実施形態に係る映像品質推定方法が適用された映像品質推定装置10のように、映像品質値を推定するためのモデルを、シグモイド関数を用いて構築することによって、符号化ビットレートBRに加えて、解像度RSとフレームレートFRとも考慮して推定映像品質値VQを算出することが可能となる。
さらに、このような装置、方法、およびプログラムを用いて推定映像品質値VQを推定することによって、自社及び他社の映像配信サービスの品質を定量的に把握できるようになるのみならず、さらに、この結果を、マーケティングやサービス改善にも活用できるようになる。
また、推定映像品質値VQの結果を活用して、映像品質値を最大化するように配信パラメータを設計、制御することにより、映像品質を向上させることも可能となる。さらにその結果として、映像配信サービスの顧客満足度の向上や、収益の向上に寄与することも期待される。
以上、説明したように、本実施形態では、前述した性質1,2,3,4を考慮したモデルを、シグモイド関数を用いて構築している。シグモイド関数は、入力値が増加もしくは減少するとある値に収束していくS字曲線で表わされるため、性質1をモデル化することできる。また、シグモイド関数は、収束値を係数で決定することができるため、高い方の収束値が映像品質値の最大値になり、低い方の収束値が推定映像品質値の最小値になるように係数を決定することによって、性質2と性質3を考慮することができる。
さらに、シグモイド関数ではS字曲線の変曲点のX軸座標を係数で決定することができるため、変曲点のX軸座標を決定する係数を解像度とフレームレートの増加によって増加するようにモデル化することで性質4を考慮することができる。
したがって、シグモイド関数を用いたモデルを用いることにより、符号化ビットレートに加えて、解像度とフレームレートとも考慮して映像品質値を精度良く推定することが可能な装置、方法、およびプログラムを実現することができる。
なお、入力値が増加もしくは減少すると出力値がある値に収束していくS字曲線を表す関数はシグモイド関数に限られない。このようなS字曲線を表す関数として、シグモイド関数以外の関数を用いてもよい。また、式4のように、変曲点を持たない関数を用いてもよい。このように、変曲点を持たない関数を用いることによっても、符号化ビットレートに加えて、解像度とフレームレートとも考慮して映像品質値を精度良く推定することが可能な装置、方法、およびプログラムを実現することができる。
(第1項)
符号化された映像の視聴において、前記映像をユーザが視聴した際に体感する前記映像の品質である映像品質を定量化した値である映像品質値を推定する映像品質推定装置であって、
前記映像の解像度、及び、前記映像のフレームレートから、前記映像品質値の最大値を算出する最大値算出手段と、
前記映像の符号化ビットレートと映像品質値との間の予め定めた関係に基づいて、入力された符号化ビットレートに対応する推定映像品質値を算出する映像品質算出手段と、を備え、
前記予め定めた関係は、符号化ビットレートの増加に伴い、映像品質値が増加して、当該映像品質値が、前記最大値算出手段によって算出された前記最大値に収束するという関係である
ことを特徴とする映像品質推定装置。
(第2項)
符号化された映像の視聴において、前記映像をユーザが視聴した際に体感する前記映像の品質である映像品質を定量化した値である映像品質値を推定する映像品質推定装置であって、
前記映像の1フレームの画素数である解像度、及び、前記映像の単位時間あたりのフレーム数であるフレームレートに基づいて、前記映像品質値の最大値を算出する最大値算出手段と、
入力値が増加もしくは減少するとある値に収束するS字曲線の性質を有するシグモイド関数が描く曲線上における曲がる方向が変わる点である変曲点を、前記解像度及び前記フレームレートに基づいて算出する変曲点算出手段と、
前記映像の単位時間あたりの平均データ量である符号化ビットレートと、前記最大値算出手段によって算出された前記映像品質値の最大値と、前記変曲点算出手段によって算出された前記変曲点とを前記シグモイド関数に入力することにより、推定映像品質値を算出する映像品質算出手段と、
を備える映像品質推定装置。
(第3項)
前記シグモイド関数の高い方の収束値が、前記映像品質値の最大値になり、低い方の収束値が、前記推定映像品質値の最小値になるように、前記シグモイド関数の係数が決定される、第2項に記載の映像品質推定装置。
(第4項)
前記映像品質値の最大値は、前記解像度及び前記フレームレートの増加に伴い、増加する2変数増加関数で表現され、前記変曲点は、前記解像度及び前記フレームレートの増加に伴い、増加する2変数増加関数で表現される、第2項または第3項に記載の映像品質推定装置。
(第5項)
符号化された映像の視聴において、前記映像をユーザが視聴した際に体感する前記映像の品質である映像品質を定量化した値である映像品質値を推定する映像品質推定装置が実行する映像品質推定方法であって、
前記映像の解像度、及び、前記映像のフレームレートから、前記映像品質値の最大値を算出する最大値算出ステップと、
前記映像の符号化ビットレートと映像品質値との間の予め定めた関係に基づいて、入力された符号化ビットレートに対応する推定映像品質値を算出する映像品質算出ステップと、を備え、
前記予め定めた関係は、符号化ビットレートの増加に伴い、映像品質値が増加して、当該映像品質値が、前記最大値算出ステップによって算出された前記最大値に収束するという関係である
ことを特徴とする映像品質推定方法。
(第6項)
符号化された映像の視聴において、前記映像をユーザが視聴した際に体感する前記映像の品質である映像品質を定量化した値である映像品質値を推定する映像品質推定装置が実行する映像品質推定方法であって、
前記映像の1フレームの画素数である解像度、及び、前記映像の単位時間あたりのフレーム数であるフレームレートに基づいて、前記映像品質値の最大値を算出し、
入力値が増加もしくは減少するとある値に収束するS字曲線の性質を有するシグモイド関数が描く曲線上における曲がる方向が変わる点である変曲点を、前記解像度及び前記フレームレートに基づいて算出し、
前記映像の単位時間あたりの平均データ量である符号化ビットレートと、前記最大値と、前記変曲点とを前記シグモイド関数に入力することにより、推定映像品質値を算出する、
映像品質推定方法。
(第7項)
前記シグモイド関数の高い方の収束値が、前記映像品質値の最大値になり、低い方の収束値が、前記推定映像品質値の最小値になるように、前記シグモイド関数の係数が決定される、第6項に記載の映像品質推定方法。
(第8項)
前記映像品質値の最大値は、前記解像度及び前記フレームレートの増加に伴い、増加する2変数増加関数で表現され、前記変曲点は、前記解像度及び前記フレームレートの増加に伴い、増加する2変数増加関数で表現される、第6項または第7項に記載の映像品質推定方法。
(第9項)
第1項乃至第4項の何れかに記載の映像品質推定装置が備える各手段による処理を、前記映像品質推定装置として用いられるコンピュータに実行させる映像品質推定プログラム。
この発明は上記実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲で種々変形して実施可能である。
要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開
示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
本特許出願は2014年11月17日に出願した日本国特許出願第2014−232691号に基づきその優先権を主張するものであり、日本国特許出願第2014−232691号の全内容を本願に援用する。
10 映像品質推定装置
12 最大値算出部
14 変曲点算出部
16 映像品質算出部

Claims (7)

  1. 符号化された映像の視聴において、前記映像をユーザが視聴した際に体感する前記映像の品質である映像品質を定量化した値である映像品質値を推定する映像品質推定装置であって、
    前記映像の1フレームの画素数である解像度、及び、前記映像の単位時間あたりのフレーム数であるフレームレートに基づいて、前記映像品質値の最大値を算出する最大値算出手段と、
    入力値が増加もしくは減少するとある値に収束するS字曲線の性質を有するシグモイド関数が描く曲線上における曲がる方向が変わる点である変曲点を、前記解像度及び前記フレームレートに基づいて算出する変曲点算出手段と、
    前記映像の単位時間あたりの平均データ量である符号化ビットレートと、前記最大値算出手段によって算出された前記映像品質値の最大値と、前記変曲点算出手段によって算出された前記変曲点とを前記シグモイド関数に入力することにより、推定映像品質値を算出する映像品質算出手段と、
    を備える映像品質推定装置。
  2. 前記シグモイド関数の高い方の収束値が、前記映像品質値の最大値になり、低い方の収束値が、前記推定映像品質値の最小値になるように、前記シグモイド関数の係数が決定される、請求項に記載の映像品質推定装置。
  3. 前記映像品質値の最大値は、前記解像度及び前記フレームレートの増加に伴い、増加する2変数増加関数で表現され、前記変曲点は、前記解像度及び前記フレームレートの増加に伴い、増加する2変数増加関数で表現される、請求項またはに記載の映像品質推定装置。
  4. 符号化された映像の視聴において、前記映像をユーザが視聴した際に体感する前記映像の品質である映像品質を定量化した値である映像品質値を推定する映像品質推定装置が実行する映像品質推定方法であって、
    前記映像の1フレームの画素数である解像度、及び、前記映像の単位時間あたりのフレーム数であるフレームレートに基づいて、前記映像品質値の最大値を算出し、
    入力値が増加もしくは減少するとある値に収束するS字曲線の性質を有するシグモイド関数が描く曲線上における曲がる方向が変わる点である変曲点を、前記解像度及び前記フレームレートに基づいて算出し、
    前記映像の単位時間あたりの平均データ量である符号化ビットレートと、前記最大値と、前記変曲点とを前記シグモイド関数に入力することにより、推定映像品質値を算出する、
    映像品質推定方法。
  5. 前記シグモイド関数の高い方の収束値が、前記映像品質値の最大値になり、低い方の収束値が、前記推定映像品質値の最小値になるように、前記シグモイド関数の係数が決定される、請求項に記載の映像品質推定方法。
  6. 前記映像品質値の最大値は、前記解像度及び前記フレームレートの増加に伴い、増加する2変数増加関数で表現され、前記変曲点は、前記解像度及び前記フレームレートの増加に伴い、増加する2変数増加関数で表現される、請求項またはに記載の映像品質推定方法。
  7. 請求項1乃至の何れかに記載の映像品質推定装置が備える各手段による処理を、前記映像品質推定装置として用いられるコンピュータに実行させる映像品質推定プログラム。
JP2016560213A 2014-11-17 2015-11-16 映像品質推定装置、映像品質推定方法、および映像品質推定プログラム Active JP6466963B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014232691 2014-11-17
JP2014232691 2014-11-17
PCT/JP2015/082136 WO2016080354A1 (ja) 2014-11-17 2015-11-16 映像品質推定装置、映像品質推定方法、および映像品質推定プログラム

Publications (2)

Publication Number Publication Date
JPWO2016080354A1 JPWO2016080354A1 (ja) 2017-08-31
JP6466963B2 true JP6466963B2 (ja) 2019-02-06

Family

ID=56013891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016560213A Active JP6466963B2 (ja) 2014-11-17 2015-11-16 映像品質推定装置、映像品質推定方法、および映像品質推定プログラム

Country Status (3)

Country Link
US (1) US10154266B2 (ja)
JP (1) JP6466963B2 (ja)
WO (1) WO2016080354A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10798387B2 (en) * 2016-12-12 2020-10-06 Netflix, Inc. Source-consistent techniques for predicting absolute perceptual video quality
JP7040232B2 (ja) * 2018-04-03 2022-03-23 日本電信電話株式会社 視聴行動推定装置、視聴行動推定方法及びプログラム
CN110166781B (zh) * 2018-06-22 2022-09-13 腾讯科技(深圳)有限公司 一种视频编码方法、装置、可读介质和电子设备
US11128869B1 (en) * 2018-10-22 2021-09-21 Bitmovin, Inc. Video encoding based on customized bitrate table
JP7168848B2 (ja) * 2018-11-21 2022-11-10 日本電信電話株式会社 評価装置、評価方法、及びプログラム。
JP7033097B2 (ja) * 2019-03-18 2022-03-09 Kddi株式会社 ネットワーク監視システムおよび方法
WO2021181681A1 (ja) * 2020-03-13 2021-09-16 日本電信電話株式会社 数理モデル導出装置、数理モデル導出方法及びプログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001245303A (ja) * 2000-02-29 2001-09-07 Toshiba Corp 動画像符号化装置および動画像符号化方法
US7359004B2 (en) * 2003-05-23 2008-04-15 Microsoft Corporation Bi-level and full-color video combination for video communication
JP4317540B2 (ja) * 2005-08-30 2009-08-19 日本電信電話株式会社 映像品質推定装置、方法およびプログラム
CN101151904B (zh) * 2006-05-09 2010-06-16 日本电信电话株式会社 视频品质评估设备、方法
JP4490483B2 (ja) * 2006-05-09 2010-06-23 日本電信電話株式会社 映像品質推定装置、方法、およびプログラム
US7965203B2 (en) * 2006-05-09 2011-06-21 Nippon Telegraph And Telephone Corporation Video quality estimation apparatus, method, and program
JP4817246B2 (ja) 2006-07-31 2011-11-16 Kddi株式会社 映像品質の客観評価装置
BRPI0906767A2 (pt) * 2008-01-18 2015-07-14 Thomson Licensing Método para a avaliação da qualidade perceptual
US8885050B2 (en) * 2011-02-11 2014-11-11 Dialogic (Us) Inc. Video quality monitoring
JP5956316B2 (ja) * 2012-11-26 2016-07-27 日本電信電話株式会社 主観画質推定装置、主観画質推定方法及びプログラム
US20150181208A1 (en) * 2013-12-20 2015-06-25 Qualcomm Incorporated Thermal and power management with video coding
US9774867B2 (en) * 2014-02-12 2017-09-26 Facebook, Inc. Systems and methods for enhanced video encoding
WO2015148965A2 (en) * 2014-03-28 2015-10-01 Weigel Broadcasting Co. Channel bonding
KR102071581B1 (ko) * 2014-03-31 2020-04-01 삼성전자주식회사 서브블록 기반 예측을 수행하는 인터 레이어 비디오 복호화 방법 및 그 장치 및 서브블록 기반 예측을 수행하는 인터 레이어 비디오 부호화 방법 및 그 장치

Also Published As

Publication number Publication date
US20170359582A1 (en) 2017-12-14
WO2016080354A1 (ja) 2016-05-26
US10154266B2 (en) 2018-12-11
JPWO2016080354A1 (ja) 2017-08-31

Similar Documents

Publication Publication Date Title
JP6466963B2 (ja) 映像品質推定装置、映像品質推定方法、および映像品質推定プログラム
Zaidan et al. Comparative study on the evaluation and benchmarking information hiding approaches based multi-measurement analysis using TOPSIS method with different normalisation, separation and context techniques
US7965203B2 (en) Video quality estimation apparatus, method, and program
JP4913893B2 (ja) 映像品質推定装置、方法、およびプログラム
Zaidan et al. A new digital watermarking evaluation and benchmarking methodology using an external group of evaluators and multi‐criteria analysis based on ‘large‐scale data’
US8154602B2 (en) Video quality estimation apparatus, method, and program
JP6010685B2 (ja) マルチメディア品質を評価する方法及び装置
JP4490374B2 (ja) 映像品質評価装置および方法
JP2018142272A (ja) コンテンツ評価予測システム及びコンテンツ評価予測方法
JP6402088B2 (ja) 映像品質推定装置、映像品質推定方法、及びプログラム
Eswara et al. Modeling continuous video QoE evolution: A state space approach
US11823359B2 (en) Systems and methods for leveling images
JP2019197996A (ja) エンゲージメント推定装置、エンゲージメント推定方法及びプログラム
JPWO2016006372A1 (ja) 集荷量調整支援装置、集荷量調整支援方法、及びプログラム
JP7040232B2 (ja) 視聴行動推定装置、視聴行動推定方法及びプログラム
JP6228906B2 (ja) 映像品質推定装置、方法およびプログラム
JP6158752B2 (ja) ネットワーク要件導出装置及び方法
EP2312516A1 (en) Denoising explicit feedback for recommender systems
JP2007306109A (ja) 映像品質パラメータ推定装置、方法、およびプログラム
JP6114702B2 (ja) ユーザ体感品質推定装置、ユーザ体感品質推定方法及びプログラム
KR20160106651A (ko) 특허 자산들을 이용한 기술 분야 사이즈들에 대한 보고
JP7400936B2 (ja) 映像品質推定装置、映像品質推定方法、及びプログラム
JP7255704B2 (ja) エンゲージメント推定装置、エンゲージメント推定方法及びプログラム
WO2023209802A1 (ja) ユーザ体感品質推定装置、ユーザ体感品質推定方法及びプログラム
JP6660357B2 (ja) 品質推定装置、品質推定方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180710

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190110

R150 Certificate of patent or registration of utility model

Ref document number: 6466963

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150