JP4451857B2 - 映像品質パラメータ推定装置、方法、およびプログラム - Google Patents

映像品質パラメータ推定装置、方法、およびプログラム Download PDF

Info

Publication number
JP4451857B2
JP4451857B2 JP2006130104A JP2006130104A JP4451857B2 JP 4451857 B2 JP4451857 B2 JP 4451857B2 JP 2006130104 A JP2006130104 A JP 2006130104A JP 2006130104 A JP2006130104 A JP 2006130104A JP 4451857 B2 JP4451857 B2 JP 4451857B2
Authority
JP
Japan
Prior art keywords
video quality
bit rate
video
parameter
estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006130104A
Other languages
English (en)
Other versions
JP2007306109A (ja
Inventor
和久 山岸
孝典 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006130104A priority Critical patent/JP4451857B2/ja
Publication of JP2007306109A publication Critical patent/JP2007306109A/ja
Application granted granted Critical
Publication of JP4451857B2 publication Critical patent/JP4451857B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、映像通信技術に関し、特に複数のフレームに符号化した映像メディアを端末で受信再生した際に視聴者が実感する主観映像品質として所望の映像品質が得られる映像品質パラメータを推定する映像品質パラメータ推定技術に関する。
インターネットアクセス回線の高速・広帯域化に伴い、インターネットを介して映像さらには音声を含む映像メディアを端末間あるいはサーバ−端末間で転送する映像通信サービスの普及が期待されている。
この種の映像通信サービスでは、映像メディアの転送効率を改善するため、映像メディアが持つ画素間あるいは画像間の自己相関性や人間の視覚特性を利用して、映像メディアを複数のフレームに符号化して転送するという符号化通信方式が用いられる。
一方、映像通信サービスに利用されるインターネットなどのベスト・エフォート型ネットワークでは、必ずしも通信品質が保証されているわけではない。このため、インターネットを介して映像メディアなどの時間的連続性を有するストリーミング系コンテンツを転送する際、通信回線の帯域が狭い場合や通信回線が輻輳した場合には、通信回線を介して受信再生した映像メディアに対して視聴者が実感する品質、すなわち主観映像品質の劣化として知覚されやすい。具体的には、映像メディアに品質劣化が加わると、映像のぼけ、にじみ、モザイク状の歪み、ぎくしゃく感として知覚される。
このように、映像メディアを転送する映像通信サービスでは、品質劣化が知覚されやすく、映像通信サービスを良好な品質で提供するためには、サービス提供に先立ったネットワークの品質設計やサービス開始後の品質管理が重要となる。したがって、視聴者が享受する映像品質を適切に表現でき、しかも簡便かつ効率的な映像品質評価技術が必要とされる。
従来、このようなストリーミング系コンテンツの1つである音声メディアの品質を推定する技術として、ITU−T勧告P.862(International Telecommunication Union-Telecommunication Standardization Sector)において、音声信号を入力とする音声品質客観評価法PESQ(Perceptual Evaluation of Speech Quality)が規定されている。また、ITU−T勧告G.107において、音声品質パラメータを入力とする音声品質推定法が記載されており、VoIP(Voice over IP)での品質設計に利用されている。
一方、映像メディアの品質を推定する技術としては、映像信号を入力とする映像品質客観評価法が勧告として提案されている(例えば、非特許文献1参照)。また、映像品質パラメータを入力とする映像品質推定を行うものも提案されている(例えば、非特許文献2参照)。これによれば、映像品質と各映像品質パラメータの関係から映像品質を定式化し、これら積の線形和により映像品質を定式化している。また、符号化パラメータとパケット損失を考慮した品質推定モデルも提案されている(例えば、非特許文献3参照)。
ITU−T勧告J.144 山岸,林、「映像コミュニケーションサービスに対する表示サイズ・解像度を考慮した映像品質推定モデル」、社団法人電子情報通信学会、信学技法CQ2005-60、2005/09、pp.61-64 荒山,北脇,山田、「符号化パラメータとパケット損失を考慮したAV通信品質の推定モデル」、社団法人電子情報通信学会、信学技法CQ2005-77、2005/11、pp.57-60
ネットワークの品質設計や品質管理では、映像通信サービスに関する各種条件に対応する、具体的で有用な品質設計・管理指針が必要となる。特に、映像通信サービスの映像品質を左右する多くの要因すなわち映像品質パラメータが存在するため、視聴者の端末において提供すべき所望の主観映像品質が特定された場合、所望の主観映像品質を得るために、映像メディアを符号化する際に用いる映像品質パラメータ、すなわち符号化ビットレートやフレームレートを、どの程度にすればよいのかという品質設計・管理指針を得ることが重要となる。
映像品質に大きな影響を与える要因として、映像メディアに対する符号化処理の内容を示す符号化ビットレートとフレームレートがある。符号化ビットレートは、映像メディアに関する単位時間当たりの符号化ビット数を示す値であり、フレームレートは、映像メディアに関する単位時間当たりのフレーム数を示す値である。
ある符号化ビットレートで映像を符号化して提供する際、高いフレームレートで映像を符号化すると映像が滑らかになって時間的な映像品質を向上できるが、単位フレーム当たりの符号量が低減して空間的な映像劣化が顕著となり、結果として映像品質が低下する場合がある。また、単位フレーム当たりの符号量を高くして符号化すると空間的な映像劣化が改善されて映像品質は向上するが、単位時間当たりのフレーム数が低減して時間的にぎくしゃくしコマ飛び状態となり、結果として映像品質が劣化する場合がある。
したがって、これら単位フレーム当たりの符号量とフレームレートの、映像品質に対するトレードオフを考慮して、所望の主観映像品質を得るために、どの程度の符号化ビットレートやフレームレートを用いる必要があるか、という具体的で有用な品質設計・管理指針が、サービス提供に先立ったネットワークの品質設計やサービス開始後の品質管理において重要となる。
しかしながら、前述の非特許文献1に記載されている、映像信号を入力とする客観品質評価法では、映像の特徴量すなわち空間的および時間的歪みから算出される特徴量を考慮して映像品質を推定している。このため、映像通信サービスの映像品質を左右する多くの要因すなわち各映像品質パラメータが、映像品質に対してどのような影響を与えているか不明確であるため、どの映像品質パラメータを改善すれば映像品質がどの程度よくなるか、という品質設計・管理指針を得ることができない。
また、前述の非特許文献2および非特許文献3には、映像品質パラメータを入力とする映像品質推定法が記載されているが、単位フレーム当たりの符号量とフレームレートの映像品質に対するトレードオフが考慮されておらず、ネットワークの品質設計や品質管理において具体的で有用な品質設計・管理指針を得ることができない、という問題点がある。
また、非特許文献2は、映像品質と各映像品質パラメータの関係から映像品質を定式化しているが、各符号化ビットレートに対する最適フレームレートを適切に算出することができず、映像品質を適切に推定できないという問題点がある。
また、非特許文献3は、符号化ビットレートとパケット損失の関係から映像品質を定式化した映像品質推定法であり、時間的劣化の一要因であるフレームレートが考慮されていないといった問題点がある。さらに、映像品質は符号化ビットレートの増加に伴い、任意の最大値に収束する特性を有しているのに対して、非特許文献3では、映像品質を二次関数で推定しているため、ある符号化ビットレート以上になると映像品質の低下を招く推定モデルとなり、上記特性と反する結果を示している。
本発明はこのような課題を解決するためのものであり、単位フレーム当たりの符号量とフレームレートの、映像品質に対するトレードオフが考慮された、具体的で有用な品質設計・管理指針を得ることができる映像品質パラメータ推定装置、方法、およびプログラムを提供することを目的としている。
このような目的を達成するために、本発明にかかる映像品質パラメータ推定装置は、複数のフレームに符号化した映像メディアを任意の端末へ通信網を介して送信する映像通信について、端末で再生された当該映像メディアから視聴者が実感する主観映像品質として所望の映像品質が得られる映像品質パラメータの推定値を所定の推定モデルに基づき算出する映像品質パラメータ推定装置であって、映像通信の種別を示す通信種別パラメータ、端末における映像メディアの再生性能を示す再生性能パラメータ、または端末で映像メディアを再生する際の周囲環境を示す再生環境パラメータのうちの1つ以上からなる副パラメータについて、推定モデルの特定に用いる特性係数との対応関係を記憶する記憶部と、推定条件として所望の映像品質を示す入力映像品質と映像通信または端末に関する副パラメータを取得するパラメータ取得部と、パラメータ取得部で取得された副パラメータに対応する特性係数を記憶部から取得する係数取得部と、係数取得部で取得された特性係数により特定される、映像メディアに関する最良映像品質と単位時間当たりの符号化ビット数を示す符号化ビットレートとの関係を示す最良映像品質−符号化ビットレート特性に基づいて、入力映像品質に対応する符号化ビットレートを算出し推定値として出力する符号化ビットレート推定部と、前記係数取得部で取得された特性係数により特定される、前記映像メディアに関する符号化ビットレートと当該符号化ビットレートのときに最良映像品質が得られる単位時間当たりのフレーム数を示す最適フレームレートとの関係を示す符号化ビットレート−最適フレームレート特性に基づいて、前記符号化ビットレート推定部で得られた符号化ビットレートに対応する最適フレームレートを算出し前記推定値として出力する最適フレームレート推定部とを備えている。
また、符号化ビットレート推定部で、最良映像品質の増加に応じて符号化ビットレートが単調増加する最良映像品質−符号化ビットレート特性に基づいて、入力映像品質に対応する符号化ビットレートを算出するようにしてもよい。
また、最適フレームレート推定部で、符号化ビットレートの増加に応じて最適フレームレートが単調増加した後に所定の最大フレームレートに収束する符号化ビットレート−最適フレームレート特性に基づいて、符号化ビットレートに対応する最適フレームレートを算出するようにしてもよい。
また、本発明にかかる映像品質パラメータ推定方法は、複数のフレームに符号化した映像メディアを任意の端末へ通信網を介して送信する映像通信について、端末で再生された当該映像メディアから視聴者が実感する主観映像品質として所望の映像品質が得られる映像品質パラメータの推定値を所定の推定モデルに基づき算出する映像品質パラメータ推定装置で用いられる映像品質パラメータ推定方法であって、前述した映像品質パラメータ推定装置で実現される各処理動作に対応するステップをそれぞれ備えている。
また、本発明にかかるプログラムは、複数のフレームに符号化した映像メディアを任意の端末へ通信網を介して送信する映像通信について、端末で再生された当該映像メディアから視聴者が実感する主観映像品質として所望の映像品質が得られる映像品質パラメータの推定値を所定の推定モデルに基づき算出する映像品質パラメータ推定装置のコンピュータに、前述した映像品質パラメータ推定装置で実現される各処理動作に対応するステップを実行させるものである。
本発明によれば、パラメータ取得部で取得された、通信種別パラメータ、再生性能パラメータ、および再生環境パラメータのうちの1つ以上からなる副パラメータに対応する特性係数が、記憶部から係数取得部により取得され、符号化ビットレート推定部により、これら特性係数により特定される最良映像品質−符号化ビットレート特性に基づいて、入力映像品質に対応する符号化ビットレート推定値が算出され、さらに最適フレームレート推定部により、これら特性係数により特定される符号化ビットレート−最適フレームレート特性に基づいて、上記符号化ビットレートに対応する最適フレームレート推定値が算出される。
これにより、副パラメータで指定された、評価対象となる映像通信サービスや端末の具体的かつ詳細な性質に基づいて、推定条件で指定された所望の入力映像品質を得るために必要な符号化ビットレート推定値と最適フレームレート推定値を得ることができる。
したがって、視聴者の端末において提供すべき主観映像品質が特定された場合、その主観映像品質を得るために、映像メディアを符号化する際に用いる映像品質パラメータ、ここでは符号化ビットレートを、どの程度にすればよいのかという品質設計・管理指針を、単位フレーム当たりの符号量とフレームレートの、映像品質に対するトレードオフを考慮して得ることができ、サービス提供に先立ったネットワークの品質設計やサービス開始後の品質管理に大いに役立てることができる。
次に、本発明の実施の形態について図面を参照して説明する。
[映像品質パラメータ推定装置]
まず、図1を参照して、本発明の一実施の形態にかかる映像品質パラメータ推定装置について説明する。図1は、本発明の一実施の形態にかかる映像品質パラメータ推定装置の構成を示すブロック図である。
この映像品質パラメータ推定装置1は、入力された情報を演算処理するコンピュータなどの情報処理装置からなり、複数のフレームに符号化した映像メディアを任意の端末へ通信網を介して送信する映像通信について、その映像メディアに関する推定条件を入力として、端末で再生された当該映像メディアから視聴者が実感する主観映像品質として所望の映像品質が得られる映像品質パラメータの推定値を、所定の推定モデルに基づいて算出する。
本実施の形態は、映像通信の種別を示す通信種別パラメータ、端末における映像メディアの再生性能を示す再生性能パラメータ、または端末で映像メディアを再生する際の周囲環境を示す再生環境パラメータのうちの1つ以上からなる副パラメータについて、推定モデルの特定に用いる特性係数との対応関係を記憶しておき、所望の映像品質を示す入力映像品質と映像通信または端末に関する副パラメータを推定条件として、入力映像品質に対する符号化ビットレートを推定する際、上記対応関係を参照して副パラメータに対応する特性係数を取得し、この特性係数により特定される、映像メディアに関する最良映像品質と符号化ビットレートとの関係を示す最良映像品質−符号化ビットレート特性に基づいて、入力映像品質に対応する符号化ビットレートを算出し推定値として出力するようにしたものである。
次に、図1を参照して、本発明の一実施の形態にかかる映像品質パラメータ推定装置の構成について詳細に説明する。
映像品質パラメータ推定装置1には、主な機能部として、パラメータ取得部11、係数取得部12、符号化ビットレート推定部13A、および最適フレームレート推定部13Bが設けられている。
これら機能部は、専用の演算処理回路部で実現してもよいが、CPUなどのマイクロプロセッサとその周辺回路を設け、予め用意されているプログラムを読み込んでマイクロプロセッサで実行することにより、上記ハードウェアとプログラムを協働させることにより上記機能部を実現してもよい。また、これら機能部間でやり取りされる処理情報は、メモリやハードディスクなどの記憶装置からなる記憶部(図示せず)を介してやり取りされる。また、上記プログラムを記憶部に格納しておいてもよい。この他、映像品質パラメータ推定装置1には、一般的な情報処理装置と同様に、記憶装置、操作入力装置、画面表示装置などの各種基本的構成が設けられている。
パラメータ取得部11は、評価対象となる映像通信サービスに関する各種の推定条件10を取得する機能と、推定条件10から映像メディアを視聴者の端末で再生した際の主観映像品質を示す入力映像品質MOS(21A)を抽出し主パラメータ21として出力する機能と、推定条件10から通信種別パラメータ22A、再生性能パラメータ22B、および再生環境パラメータ22Cを抽出し、これらを副パラメータ22として出力する機能とを有している。
推定条件10については、キーボードなどの操作入力装置を用いてオペレータ操作により入力してもよく、データ入出力を行うデータ入出力装置を用いて外部装置、記録媒体、あるいは通信網から取得してもよく、さらには実際の映像通信サービスから計測してもよい。
副パラメータ22には、映像通信サービスの通信種別を示す通信種別パラメータ22A、映像メディアを再生する端末の再生性能を示す再生性能パラメータ22B、あるいは映像メディアを再生する端末の再生環境を示す再生環境パラメータ22Cがある。
通信種別パラメータ22Aの具体例としては、評価対象となる映像通信サービスで行われる通信種別を示す「タスク」がある。
再生性能パラメータ22Bの具体例としては、映像メディアの符号化に関する「符号化方式」、「映像フォーマット」、「キーフレーム」のほか、端末でのメディア再生機能に関する「モニタサイズ」、「モニタ解像度」などがある。
再生環境パラメータ22Cの具体例としては、端末でのメディア再生の際の「室内照度」などがある。
副パラメータ22は、これらパラメータ例に限定されるものではなく、評価対象となる映像通信サービスや映像メディアの内容に応じて任意に取捨選択すればよく、少なくともこれら通信種別パラメータ22A、再生性能パラメータ22B、および再生環境パラメータ22Cのうちの1つ以上から構成されていればよい。
係数取得部12は、記憶部(図示せず)の係数DB23を参照して、パラメータ取得部11により推定条件10から取得された副パラメータ22に対応する特性係数24を取得する機能を有している。
図2は、係数DBの構成例を示す説明図である。係数DB23は、各種副パラメータ22とこれに対応する各特性係数a,b,…,e(24)との組を示すデータベースである。
特性係数24は、符号化ビットレート推定値26Aさらには最適フレームレート推定値26Bからなる映像品質パラメータ26の推定に用いる推定モデル25の関数形状を特定するための係数である。
符号化ビットレート推定部13Aは、係数取得部12で取得された特性係数24(a,b,c)により特定される推定モデル25の最良映像品質−符号化ビットレート特性25Aを参照して、パラメータ取得部11から出力された主パラメータ21の入力映像品質21Aに対応する符号化ビットレートを算出し符号化ビットレート推定値26Aとして出力する機能を有している。
最適フレームレート推定部13Bは、係数取得部12で取得された特性係数24(d,e)により特定される推定モデル25の符号化ビットレート−最適フレームレート特性25Bを参照して、符号化ビットレート推定部13Aから出力された符号化ビットレート推定値26Aに対応する最適フレームレートを算出し最適フレームレート推定値26Bとして出力する機能とを有している。
[主観映像品質特性]
次に、図3を参照して、映像通信サービスにおける映像メディアの主観映像品質特性について説明する。図3は、映像通信サービスにおける映像メディアのフレームレート−主観映像品質特性を示すグラフである。図3において、横軸はフレームレートfr(fps)、縦軸は主観映像品質値MOS(fr,br)(MOS値)を示し、符号化ビットレートbrごとの特性が示されている。
映像メディアの主観映像品質に対して、単位フレーム当たりの符号量とフレームレートはトレードオフの関係にある。
具体的には、ある符号化ビットレートで映像を符号化して提供する際、高いフレームレートで映像を符号化すると映像が滑らかになって時間的な映像品質を向上できるが、単位フレーム当たりの符号量が低減して空間的な映像劣化が顕著となり、結果として映像品質が低下する場合がある。また、単位フレーム当たりの符号量を高くして符号化すると空間的な映像劣化が改善されて映像品質は向上するが、単位時間当たりのフレーム数が低減して時間的にぎくしゃくしコマ飛び状態となり、結果として映像品質が劣化する場合がある。
したがって、図3に示すように、各符号化ビットレートに対して、映像品質が最大すなわち最良映像品質となる最適なフレームレートすなわち最適フレームレートが存在し、最適フレームレートを超えてフレームレートを増加させても映像品質が改善されない特性を持つことがわかる。例えば、符号化ビットレートbr=256[kbbs]の場合、主観映像品質特性は、フレームレートfr=10[fps]のときの最良映像品質=3[MOS]を頂点として凸型をなす特性となる。
これら主観映像品質特性は、符号化ビットレートが異なっても同様の凸型の形状となり、その頂点が最良映像品質に相当するとともに、そのときの符号化ビットレートと最適フレームレートが当該最良映像品質を得るために必要な映像品質パラメータに相当していることがわかる。
ここで、図3に示された各特性のうち、符号化ビットレートと最良映像品質の関係は、符号化ビットレートの増加とともに映像品質が増加し、ある最大値(最大主観映像品質値)に収束するとともに、符号化ビットレートの低下とともに映像品質も低下し、ある最小値に収束する、という傾向が見られる。
図4は、このような符号化ビットレート−最良映像品質特性を示すグラフである。図4において、横軸は符号化ビットレートbr(kbps)、縦軸は最良映像品質β(br)を示している。
この符号化ビットレート−最良映像品質特性によれば、高い符号化ビットレートを設定しても、ある符号化ビットレートにおいて映像品質が飽和しており、符号化ビットレートを必要以上に高くしても視聴者が視覚的に映像品質の向上を検知することができない、という人間の視覚特性と一致する。
また、符号化ビットレートを下げすぎると映像品質の劣化が顕著となり、結果として最低映像品質に収束している。これは、例えば人物の顔が画面内で移動しているような映像では、目や鼻の輪郭がぼけて平坦になり、顔自体を認識できなくなる、という実際の現象と一致している。
このような、符号化ビットレート−最良映像品質特性は、例えば一般的なロジスティック(Logistic)関数でモデル化することができる。
図5は、ロジスティック関数を示す説明図である。ロジスティック関数は、係数p>1のとき変数xの増加に応じて関数yの値が単調増加する関数であり、変数xの減少に応じて関数値yが最小値へ収束し、変数xの増大に応じて関数値yが最大値へ収束する。最小値をA1、最大値をA2、係数をp,x0とした場合、任意の変数xに対する関数yの値は、最大値A2の項と最大値A2からの減少分を示す分数項からなる、次の式(1)で求められる。
Figure 0004451857
したがって、変数xを符号化ビットレートbrとし、これに対応する関数値yを最良映像品質β(br)とし、最大値A2を特性係数a、最小値A1を「0ゼロ」、係数x0を特性係数b、係数pを特性係数cとした場合、符号化ビットレート−最良映像品質は、次の式(2)で表すことができる。なお、式(1)のロジスティック関数の基準値であるA1を「0ゼロ」としたが、映像品質(MOS値)の基準値は「1」であることから、式(2)は式(1)に「1」を加えた関数で表される。図6は、ロジスティック関数でモデル化された符号化ビットレート−最良映像品質特性を示す説明図である。
Figure 0004451857
ここで、上記図6は符号化ビットレート−最良映像品質特性に関するモデルであるが、この符号化ビットレート−最良映像品質特性について、入出力関係を逆転させれば、すなわち出力変数である最良映像品質β(br)を入力とし、入力変数である符号化ビットレートbrを出力する関数を求めれば、図7に示すような、所望の最良映像品質−符号化ビットレート特性25Aを得ることができる。例えば、入力映像品質をβとし、これに対応する符号化ビットレートをbr(β)とし、特性係数をa,b,cとした場合、最良映像品質−符号化ビットレート特性25Aは、次の式(3)で表すことができる。図7は、逆ロジスティック関数でモデル化された最良映像品質−符号化ビットレート特性を示す説明図である。
Figure 0004451857
また、図3に示された各特性のうち、映像メディアが最良映像品質で再生されている場合の符号化ビットレートとそのときのフレームレートすなわち最適フレームレートの関係は、符号化ビットレートの増加とともに最適フレームレートが単調増加し、その後ある最大フレームレートに収束する。
図8は、このような符号化ビットレート−最適フレームレート特性を示すグラフである。図8において、横軸は符号化ビットレートbr(kbps)、縦軸は最適フレームレートofr(br)(fps)を示している。
このような、推定モデル25の符号化ビットレート−最適フレームレート特性25Bは、例えば一般的な線形関数でモデル化することができる。したがって、符号化ビットレートをbr(β)とし、これに対応する最適フレームレートをofr(br(β))とし、特性係数をd,eとした場合、符号化ビットレート−最適フレームレート特性25Bは、次の式(4)で表すことができる。
Figure 0004451857
これら最良映像品質−符号化ビットレート特性25Aや符号化ビットレート−最適フレームレート特性25Bは、副パラメータ22で特定される、映像通信サービスの通信種別、映像メディアを再生する端末の再生性能、あるいは映像メディアを再生する端末の再生環境が異なれば、ある程度、関数の形状も異なる。
本実施の形態では、このような主観映像品質特性の性質に着目して、副パラメータ22ごとに、最良映像品質と符号化ビットレートの関係を得ることにより、推定モデル25として最良映像品質−符号化ビットレート特性25Aを導出し、この最良映像品質−符号化ビットレート特性25Aに基づき所望の映像品質パラメータ26として符号化ビットレート推定値26Aを算出している。
また、副パラメータ22ごとに、符号化ビットレートと最適フレームレート特性の関係を得ることにより、推定モデル25として符号化ビットレート−最適フレームレート特性25Bを導出し、この符号化ビットレート−最適フレームレート特性25Bに基づき所望の映像品質パラメータ26として最適フレームレート推定値26Bを算出している。
[映像品質パラメータ推定装置の動作]
次に、図9を参照して、本発明の一実施の形態にかかる映像品質パラメータ推定装置の動作について説明する。図9は、本発明の一実施の形態にかかる映像品質パラメータ推定装置の映像品質パラメータ推定処理を示すフローチャートである。
映像品質パラメータ推定装置1は、オペレータからの指示操作や推定条件10の入力に応じて、図9の映像品質パラメータ推定処理を開始する。なお、ここでは、副パラメータ22として通信種別パラメータ22A、再生性能パラメータ22B、および再生環境パラメータ22Cを用いるものとし、係数DB23には、副パラメータ22と特性係数24との組が予め格納されているものとする。
まず、パラメータ取得部11は、評価対象となる映像通信サービスに関する各種の推定条件10を取得し、推定条件10から映像メディアを端末で再生した際に得たい所望の主観映像品質を示す入力映像品質(21A)を主パラメータ21として出力する(ステップ100)。また、パラメータ取得部11は、推定条件10から通信種別パラメータ22A、再生性能パラメータ22B、および再生環境パラメータ22Cを抽出し、これらを副パラメータ22として出力する(ステップ101)。
次に、係数取得部12は、係数DB23を参照して、副パラメータ22の値に対応する特性係数a,b,…,e(24)を取得して出力する(ステップ102)。
これに応じて符号化ビットレート推定部13Aは、特性係数24のうち係数a,b,cにより特定される最良映像品質−符号化ビットレート特性25Aを参照し、前述した式(3)に入力映像品質β(21A)を代入することにより、入力映像品質β(21A)に対応する符号化ビットレート推定値br(β)(26A)を算出して出力する(ステップ103)。
続いて、最適フレームレート推定部13Bは、特性係数24のうち係数d,eにより特定される符号化ビットレート−最適フレームレート特性25Bを参照し、前述した式(4)に符号化ビットレート推定値br(β)(26A)を代入することにより、入力映像品質β(21A)に対応する最適フレームレート推定値ofr(br(β))(26B)を算出して出力する(ステップ104)。これにより、一連の映像品質パラメータ推定処理を終了する。
このように、本実施の形態は、パラメータ取得部11で取得された、通信種別パラメータ22A、再生性能パラメータ22B、および再生環境パラメータ22Cのうちの1つ以上からなる副パラメータ22に対応する特性係数24を、係数DB23から係数取得部12により取得し、符号化ビットレート推定部13Aにより、これら特性係数24で特定される最良映像品質−符号化ビットレート特性25Aに基づいて、入力映像品質21Aに対応する符号化ビットレート推定値26Aを算出するようにしたので、副パラメータ22で指定された、評価対象となる映像通信サービスや端末の具体的かつ詳細な性質に基づいて、推定条件10で指定された所望の入力映像品質21Aを得るために必要な具体的映像品質パラメータ26として符号化ビットレート推定値26Aを得ることができる。
したがって、視聴者の端末において提供すべき主観映像品質が特定された場合、その所望の主観映像品質を得るために、映像メディアを符号化する際に用いる映像品質パラメータここでは符号化ビットレートを、どの程度にすればよいのかという品質設計・管理指針を、単位フレーム当たりの符号量とフレームレートの、映像品質に対するトレードオフを考慮して得ることができ、サービス提供に先立ったネットワークの品質設計やサービス開始後の品質管理に大いに役立てることができる。
例えば、所望の映像品質で映像メディアを配信したい場合、本実施の形態にかかる映像品質パラメータ推定装置1を用いれば、端末で所望の主観映像品質を得るには、カメラで撮影した映像をどの程度の符号化ビットレートで符号化して送信すればよいかを具体的に把握することができる。
また、従来技術では、映像品質パラメータを推定する場合、評価対象となる映像通信サービスで用いる符号化方式や端末ごとに、推定モデルを用意しなければならなかった。しかしながら、本実施の形態によれば、係数取得部12を設け、副パラメータ22に対応する特性係数24を係数DB23から取得するようにしたので、推定モデルが符号化方式や端末に依存せず、推定モデルに用いる係数を符号化方式や端末に応じて参照するだけで、同じ推定モデルを利用できる。したがって、異なる環境の映像通信サービスに対して柔軟に対応することができる。
また、本実施の形態では、さらに最適フレームレート推定部13Bを設け、特性係数24により特定される符号化ビットレート−最適フレームレート特性25Bに基づいて、入力映像品質21Aに対応する最適フレームレート推定値26Bを算出するようにしたので、副パラメータ22で指定された、評価対象となる映像通信サービスや端末の具体的な性質に基づいて、推定条件10で指定された所望の入力映像品質21Aを得るために必要な具体的な映像品質パラメータ26として、符号化ビットレート推定値26Aと最適フレームレート推定値26Bを得ることができる。
したがって、視聴者の端末において提供すべき主観映像品質が特定された場合、その所望の主観映像品質を得るために、映像メディアを符号化する際に用いる映像品質パラメータここでは符号化ビットレートやフレームレートを、どの程度にすればよいのかという品質設計・管理指針を、単位フレーム当たりの符号量とフレームレートの、映像品質に対するトレードオフを考慮して得ることができ、サービス提供に先立ったネットワークの品質設計やサービス開始後の品質管理に大いに役立てることができる。
例えば、所望の映像品質で映像メディアを配信したい場合、本実施の形態にかかる映像品質パラメータ推定装置1を用いれば、端末で所望の主観映像品質を得るには、カメラで撮影した映像をどの程度の符号化ビットレートおよびフレームレートで符号化して送信すればよいかを具体的に把握することができる。
[各実施の形態の拡張]
以上の実施の形態では、逆ロジステック関数を用いて推定モデル25の最良映像品質−符号化ビットレート特性25Aをモデル化した場合を例として説明したが、これに限定されるものではなく、他の関数を用いてもよい。例えば、評価対象となる映像通信サービスや映像メディアの内容、ネットワーク性能、あるいは推定条件10の内容によっては、ある程度限定された範囲の入力映像品質での映像品質パラメータ推定処理で十分なため、このような局所的な見方が可能な場合には、前述したように、最良映像品質−符号化ビットレート特性25Aを線形関数等の単純な関数でモデル化することができる。
一方、入力映像品質に対して符号化ビットレートや最適フレームレートの変化が大きい場合には、例えば二次関数や高次関数などの他の関数を用いて推定モデル25をモデル化してもよい。
また、以上の実施の形態では、推定モデル25が関数でモデル化されている場合を例として説明したが、関数以外の他のモデル、例えばニューラルネットワークや事例ベースなど、入出力特性のみが特定されるようなブラックボックスモデルであってもよい。
また、以上の実施の形態で用いた係数DB23の副パラメータ22と特性係数24の対応関係については、各種副パラメータ22の組合せごとに、それぞれ最良映像品質、符号化ビットレート、および最適フレームレートをそれぞれ実測し、得られた計測データに対して最小二乗による収束演算を行うことにより、各特性係数24を算出してもよく、このような特性係数算出のための構成を映像品質パラメータ推定装置1に実装してもよい。
また、以上の実施の形態では、係数取得部12と係数DB23を設け、推定条件10として入力された副パラメータ22に対応する特性係数24を、係数DB23から係数取得部12により取得し、この特性係数24により推定モデル25を特定する場合について説明したが、この構成に限定されるものではない。
例えば、評価対象となる映像通信サービスや端末の性質が限定される場合、副パラメータ22で、通信種別パラメータ22A、再生性能パラメータ22B、および再生環境パラメータ22Cを指定して、推定モデル25を特定する必要はない。
このような場合には、評価対象に対応する推定モデル25、すなわち最良映像品質−符号化ビットレート特性25Aや符号化ビットレート−最適フレームレート特性25Bを予め用意して記憶部に保存しておけばよい。これにより、係数取得部12および係数DB23を省くことができる。
本発明の一実施の形態にかかる映像品質パラメータ推定装置の構成を示すブロック図である。 係数DBの構成例を示す説明図である。 映像通信サービスにおける映像メディアのフレームレート−主観映像品質特性を示すグラフである。 符号化ビットレート−最良映像品質特性を示すグラフである。 ロジスティック関数を示す説明図である。 ロジスティック関数でモデル化された符号化ビットレート−最良映像品質特性を示す説明図である。 逆ロジスティック関数でモデル化された最良映像品質−符号化ビットレート特性を示す説明図である。 符号化ビットレート−最適フレームレート特性を示すグラフである。 本発明の一実施の形態にかかる映像品質パラメータ推定装置の映像品質パラメータ推定処理を示すフローチャートである。
符号の説明
1…映像品質パラメータ推定装置、10…推定条件、11…パラメータ取得部、12…係数取得部、13A…符号化ビットレート推定部、13B…最適フレームレート推定部、21…主パラメータ、21A…入力映像品質(β)、22…副パラメータ、22A…通信種別パラメータ、22B…再生性能パラメータ、22C…再生環境パラメータ、23…係数DB、24…特性係数、25…推定モデル、25A…最良映像品質−符号化ビットレート特性、25B…符号化ビットレート−最適フレームレート特性、26…映像品質パラメータ、26A…符号化ビットレート推定値(br(β))、26B…最適フレームレート推定値(ofr(br(β)))。

Claims (5)

  1. 複数のフレームに符号化した映像メディアを任意の端末へ通信網を介して送信する映像通信について、前記端末で再生された当該映像メディアから視聴者が実感する主観映像品質として所望の映像品質が得られる映像品質パラメータの推定値を所定の推定モデルに基づき算出する映像品質パラメータ推定装置であって、
    前記映像通信の種別を示す通信種別パラメータ、前記端末における前記映像メディアの再生性能を示す再生性能パラメータ、または前記端末で前記映像メディアを再生する際の周囲環境を示す再生環境パラメータのうちの1つ以上からなる副パラメータについて、前記推定モデルの特定に用いる特性係数との対応関係を記憶する記憶部と、
    推定条件として前記所望の映像品質を示す入力映像品質と前記映像通信または前記端末に関する副パラメータを取得するパラメータ取得部と、
    前記パラメータ取得部で取得された副パラメータに対応する特性係数を前記記憶部から取得する係数取得部と、
    前記係数取得部で取得された特性係数により特定される、前記映像メディアに関する最良映像品質と単位時間当たりの符号化ビット数を示す符号化ビットレートとの関係を示す最良映像品質−符号化ビットレート特性に基づいて、前記入力映像品質に対応する符号化ビットレートを算出し前記推定値として出力する符号化ビットレート推定部と
    前記係数取得部で取得された特性係数により特定される、前記映像メディアに関する符号化ビットレートと当該符号化ビットレートのときに最良映像品質が得られる単位時間当たりのフレーム数を示す最適フレームレートとの関係を示す符号化ビットレート−最適フレームレート特性に基づいて、前記符号化ビットレート推定部で得られた符号化ビットレートに対応する最適フレームレートを算出し前記推定値として出力する最適フレームレート推定部と
    を備えることを特徴とする映像品質パラメータ推定装置。
  2. 請求項1に記載の映像品質パラメータ推定装置において、
    前記符号化ビットレート推定部は、前記最良映像品質の増加に応じて前記符号化ビットレートが単調増加する最良映像品質−符号化ビットレート特性に基づいて、前記入力映像品質に対応する符号化ビットレートを算出することを特徴とする映像品質パラメータ推定装置。
  3. 請求項に記載の映像品質パラメータ推定装置において、
    前記最適フレームレート推定部は、前記符号化ビットレートの増加に応じて前記最適フレームレートが単調増加した後に所定の最大フレームレートに収束する符号化ビットレート−最適フレームレート特性に基づいて、前記符号化ビットレートに対応する最適フレームレートを算出することを特徴とする映像品質パラメータ推定装置。
  4. 複数のフレームに符号化した映像メディアを任意の端末へ通信網を介して送信する映像通信について、前記端末で再生された当該映像メディアから視聴者が実感する主観映像品質として所望の映像品質が得られる映像品質パラメータの推定値を所定の推定モデルに基づき算出する映像品質パラメータ推定装置で用いられる映像品質パラメータ推定方法であって、
    記憶部により、前記映像通信の種別を示す通信種別パラメータ、前記端末における前記映像メディアの再生性能を示す再生性能パラメータ、または前記端末で前記映像メディアを再生する際の周囲環境を示す再生環境パラメータのうちの1つ以上からなる副パラメータについて、前記推定モデルの特定に用いる特性係数との対応関係を記憶する記憶ステップと、
    パラメータ取得部により、推定条件として前記所望の映像品質を示す入力映像品質と前記映像通信または前記端末に関する副パラメータを取得するパラメータ取得ステップと、
    係数取得部より、前記パラメータ取得部で取得された副パラメータに対応する特性係数を前記記憶部から取得する係数取得ステップと、
    符号化ビットレート推定部により、前記係数取得部で取得された特性係数により特定される、前記映像メディアに関する最良映像品質と単位時間当たりの符号化ビット数を示す符号化ビットレートとの関係を示す最良映像品質−符号化ビットレート特性に基づいて、前記入力映像品質に対応する符号化ビットレートを算出し前記推定値として出力する符号化ビットレート推定ステップと
    最適フレームレート推定部により、前記係数取得部で取得された特性係数により特定される、前記映像メディアに関する符号化ビットレートと当該符号化ビットレートのときに最良映像品質が得られる単位時間当たりのフレーム数を示す最適フレームレートとの関係を示す符号化ビットレート−最適フレームレート特性に基づいて、前記符号化ビットレート推定部で得られた符号化ビットレートに対応する最適フレームレートを算出し前記推定値として出力する最適フレームレート推定ステップと
    を備えることを特徴とする映像品質パラメータ推定方法。
  5. 複数のフレームに符号化した映像メディアを任意の端末へ通信網を介して送信する映像通信について、前記端末で再生された当該映像メディアから視聴者が実感する主観映像品質として所望の映像品質が得られる映像品質パラメータの推定値を所定の推定モデルに基づき算出する映像品質パラメータ推定装置のコンピュータに、
    記憶部により、前記映像通信の種別を示す通信種別パラメータ、前記端末における前記映像メディアの再生性能を示す再生性能パラメータ、または前記端末で前記映像メディアを再生する際の周囲環境を示す再生環境パラメータのうちの1つ以上からなる副パラメータについて、前記推定モデルの特定に用いる特性係数との対応関係を記憶する記憶ステップと、
    パラメータ取得部により、推定条件として前記所望の映像品質を示す入力映像品質と前記映像通信または前記端末に関する副パラメータを取得するパラメータ取得ステップと、
    係数取得部より、前記パラメータ取得部で取得された副パラメータに対応する特性係数を前記記憶部から取得する係数取得ステップと、
    符号化ビットレート推定部により、前記係数取得部で取得された特性係数により特定される、前記映像メディアに関する最良映像品質と単位時間当たりの符号化ビット数を示す符号化ビットレートとの関係を示す最良映像品質−符号化ビットレート特性に基づいて、前記入力映像品質に対応する符号化ビットレートを算出し前記推定値として出力する符号化ビットレート推定ステップと
    最適フレームレート推定部により、前記係数取得部で取得された特性係数により特定される、前記映像メディアに関する符号化ビットレートと当該符号化ビットレートのときに最良映像品質が得られる単位時間当たりのフレーム数を示す最適フレームレートとの関係を示す符号化ビットレート−最適フレームレート特性に基づいて、前記符号化ビットレート推定部で得られた符号化ビットレートに対応する最適フレームレートを算出し前記推定値として出力する最適フレームレート推定ステップと
    を実行させるプログラム。
JP2006130104A 2006-05-09 2006-05-09 映像品質パラメータ推定装置、方法、およびプログラム Active JP4451857B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006130104A JP4451857B2 (ja) 2006-05-09 2006-05-09 映像品質パラメータ推定装置、方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006130104A JP4451857B2 (ja) 2006-05-09 2006-05-09 映像品質パラメータ推定装置、方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2007306109A JP2007306109A (ja) 2007-11-22
JP4451857B2 true JP4451857B2 (ja) 2010-04-14

Family

ID=38839705

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006130104A Active JP4451857B2 (ja) 2006-05-09 2006-05-09 映像品質パラメータ推定装置、方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP4451857B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4544435B2 (ja) 2009-02-10 2010-09-15 日本電気株式会社 映像品質推定装置、映像品質推定方法およびプログラム
EP2493205B1 (en) 2009-10-22 2015-05-06 Nippon Telegraph And Telephone Corporation Video quality estimation device, video quality estimation method, and video quality estimation program
JP5756154B2 (ja) * 2013-09-24 2015-07-29 日本電信電話株式会社 映像符号化パラメータ算出装置、映像符号化パラメータ算出方法及びプログラム

Also Published As

Publication number Publication date
JP2007306109A (ja) 2007-11-22

Similar Documents

Publication Publication Date Title
JP4913893B2 (ja) 映像品質推定装置、方法、およびプログラム
JP4490483B2 (ja) 映像品質推定装置、方法、およびプログラム
US7965203B2 (en) Video quality estimation apparatus, method, and program
JP4486130B2 (ja) 映像コミュニケーション品質推定装置、方法、およびプログラム
JP5172440B2 (ja) 映像品質推定装置、方法およびプログラム
JP4796019B2 (ja) 映像品質推定装置、方法、およびプログラム
JP4802209B2 (ja) 映像品質推定方法、装置およびプログラム
JP4490374B2 (ja) 映像品質評価装置および方法
JP4787210B2 (ja) 映像品質推定方法、装置、およびプログラム
JP4451856B2 (ja) 映像品質推定装置、方法、およびプログラム
JP4451857B2 (ja) 映像品質パラメータ推定装置、方法、およびプログラム
WO2021181681A1 (ja) 数理モデル導出装置、数理モデル導出方法及びプログラム
JP2006128972A (ja) 双方向マルチモーダルサービス品質推定装置および方法
JP6162596B2 (ja) 品質推定装置、方法及びプログラム
JP4802200B2 (ja) 映像品質推定装置、方法、およびプログラム
JP4740967B2 (ja) 映像品質推定装置、方法、およびプログラム
JP4408120B2 (ja) 映像品質推定装置、方法、およびプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100126

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100128

R151 Written notification of patent or utility model registration

Ref document number: 4451857

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130205

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350