JP6662905B2 - オーディオビジュアル品質推定装置、オーディオビジュアル品質推定方法、及びプログラム - Google Patents

オーディオビジュアル品質推定装置、オーディオビジュアル品質推定方法、及びプログラム Download PDF

Info

Publication number
JP6662905B2
JP6662905B2 JP2017555964A JP2017555964A JP6662905B2 JP 6662905 B2 JP6662905 B2 JP 6662905B2 JP 2017555964 A JP2017555964 A JP 2017555964A JP 2017555964 A JP2017555964 A JP 2017555964A JP 6662905 B2 JP6662905 B2 JP 6662905B2
Authority
JP
Japan
Prior art keywords
quality
audiovisual
content
estimating
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017555964A
Other languages
English (en)
Other versions
JPWO2017104416A1 (ja
Inventor
和久 山岸
和久 山岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2017104416A1 publication Critical patent/JPWO2017104416A1/ja
Application granted granted Critical
Publication of JP6662905B2 publication Critical patent/JP6662905B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • H04N21/2407Monitoring of transmitted content, e.g. distribution time, number of downloads
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/004Diagnosis, testing or measuring for television systems or their details for digital television systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/02Diagnosis, testing or measuring for television systems or their details for colour television signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44209Monitoring of downstream path of the transmission network originating from a server, e.g. bandwidth variations of a wireless network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/647Control signaling between network components and server or clients; Network processes for video distribution between server and clients, e.g. controlling the quality of the video stream, by dropping packets, protecting content from unauthorised alteration within the network, monitoring of network load, bridging between two different networks, e.g. between IP and wireless
    • H04N21/64723Monitoring of network processes or resources, e.g. monitoring of network load
    • H04N21/64738Monitoring network characteristics, e.g. bandwidth, congestion level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、オーディオビジュアル品質推定装置、オーディオビジュアル品質推定方法、及びプログラムに関する。
インターネットを介して映像や音響(以下、音声も含む)を含む映像メディアを端末間あるいはサーバと端末との間で転送する映像通信サービスが普及している。
インターネットは、必ずしも通信品質が保証されていないネットワークであるため、音声メディアや映像メディアなどを用いて通信を行う場合、視聴者端末とネットワークの回線帯域が狭いことによるビットレートの低下、回線が輻輳することによるパケット損失、パケット転送遅延、パケットの再送が発生し、音声メディアや映像メディアなどに対して視聴者が知覚する品質が劣化してしまう。
具体的には、ネットワークを介して過剰なビットレートで映像を配信することができないために原映像について符号化が行われるが、原映像を符号化する際に、フレーム内の映像信号にブロック単位の処理による劣化が生じたり、映像信号の高周波成分が失われることにより、映像全体の精細感が低くなったりする。また、配信ビットレートを確保できないために、映像の解像度を低下させ、精細感が低くなったり、フレームレートを低下させることで映像の連続性が確保できず、不連続な映像になったりする。また、符号化された映像データをパケットとしてネットワークを介して視聴者端末に送信する際、パケット損失や廃棄が発生すると、フレーム内に劣化が生じたり、スループット等が低下しパケットが再生のタイミングまでに届かず、視聴者端末でのデータバッファ量が不足して映像の再生が停止したりする。
同様に、音響においても、ネットワークを介して過剰なビットレートで音響を配信することができないために原音響について符号化が行われるが、原音響を符号化する際に、音響の高周波成分が失われ、音響の明瞭度が失われる。また、映像同様に、符号化された音響データをパケットとしてネットワークを介して視聴者端末に送信する際、パケット損失や廃棄が発生すると、音響に歪が生じたり、スループット等が低下しパケットが再生のタイミングまでに届かず、視聴者端末でのデータバッファ量が不足して音響の再生が停止したりする。
結果として、視聴者は、映像劣化、音響劣化を知覚し、オーディオビジュアル品質の低下を知覚する。
サービス提供者が、上記のような映像通信サービスを良好な品質で提供していることを確認するためには、サービス提供中に、視聴者が体感するオーディオビジュアルの品質を測定し、視聴者に対して提供されるオーディオビジュアルの品質が高いことを監視できることが重要となる。
したがって、視聴者が体感するオーディオビジュアル品質を適切に表現することができるオーディオビジュアル品質推定技術が必要とされている。
従来、オーディオビジュアル品質を評価する手法として、主観品質評価法(例えば、非特許文献1参照)や、客観品質評価法(例えば、非特許文献2参照)がある。
主観品質評価法では、複数の視聴者が実際に映像を視聴し、体感した品質を、5段階(9段階や11段階の場合もある)の品質尺度(非常に良い、良い、ふつう、悪い、非常に悪い)や妨害尺度(劣化が全く認められない、劣化が認められるが気にならない、劣化がわずかに気になる、劣化が気になる、劣化が非常に気になる)などにより評価し、全視聴者数で各映像(例えば、パケット損失率0%でビットレートが2Mbpsの映像)の品質評価値を平均し、その値をMOS(Mean Opinion Score)値やDMOS(Degradation Mean Opinion Score)値として定義している。
しかしながら、主観品質評価は、特別な専用機材(モニタなど)や評価環境(室内照度や室内騒音など)を必要とするだけではなく、多数の視聴者が実際に映像や音響を評価する必要がある。そのため、視聴者が実際に評価を完了するまでに時間がかかってしまい、品質をリアルタイムに評価したい場合には不向きである。
そこで、映像品質や音響品質に影響を与える特徴量(例えば、ビットレート、パケット損失情報など)を利用し、オーディオビジュアル品質評価値を出力する客観品質評価法の開発が望まれている。
従来の客観品質評価法の1つに、送信されたパケットとサービス提供者などから得た設定値を入力とし、パケット損失により発生した映像フレームの損失により、どの程度、劣化が伝搬するかを考慮し、実コンテンツの尺長(例えば、30分、1時間、2時間など)に対し、短時間(例えば、10秒程度)のオーディオビジュアル品質評価値を導出する技術がある(例えば、非特許文献2参照)。
従来の客観品質評価法は、上記のように、パケットを用いて短時間におけるオーディオビジュアル品質評価値を推定するものであった。
Subjective video quality assessment methods for multimedia applications,ITU-T P.910 Parametric non-intrusive assessment of audiovisual media streaming quality,ITU-T P.1201
しかしながら、非特許文献2の技術は、例えば、10秒程度のオーディオビジュアルの品質の推定を前提としており、一定のビットレートで配信される映像通信サービスを対象としているため、ビットレートが時間的に変動し、オーディオビジュアル品質が時間的に変動するようなサービス(例えば、HLS(HTTP Live Streaming)やMPEG−DASH)の品質推定には適用が困難である。具体的には、非特許文献2では、短時間のオーディオビジュアル品質を推定することから、図1に示すように、時間的に品質が大きく変動することが想定されていないため、このような状況のオーディオビジュアル品質を推定するのが困難である(課題1)。
また、非特許文献2は、短時間のオーディオビジュアル品質の推定を目的としているため、最終的に視聴者が視聴し終わった時点の長時間のコンテンツ(例えば、数分尺の映像、30分尺のアニメ、2時間尺の映画など)のオーディオビジュアル品質の推定には適用が困難である。具体的には、視聴者が長時間のコンテンツを視聴した際は、コンテンツの最初の方の印象が薄れ、逆に、最後の方の印象が残る傾向がある(忘却効果/親近効果)。しかし、非特許文献2では、品質に対する時間的な重みが時間の経過とともに大きくなる点が考慮されていない(課題2)。
また、非特許文献2では、オーディオビジュアル品質が低い状態は、オーディオビジュアル品質が高い状態より、最終的なオーディオビジュアル品質に与える影響が強いことが考慮されていない(課題3)。
また、非特許文献2では、オーディオビジュアルコンテンツの符号化劣化、オーディオビジュアルコンテンツの再生停止回数、再生停止時間、再生停止間隔を考慮して、オーディオビジュアル品質を推定しているが、短時間の時間変動を前提としているため、オーディオビジュアルコンテンツの時間長と再生停止時間の関係を考慮できていない。例えば、再生停止時間が10秒であっても、10秒のオーディオビジュアルコンテンツと、1時間のオーディオビジュアルコンテンツとでは、オーディオビジュアル品質に与える影響(前者はコンテンツ長が10秒尺のものに10秒の再生停止が発生しているためオーディオビジュアル品質は非常に低い。一方で、後者は1時間尺のオーディオビジュアルコンテンツに10秒の再生停止が発生しているため、オーディオビジュアル品質は高い品質を維持している。)は大きく異なるが、このような影響を加味できていない。再生停止回数や再生停止間隔についても同様に、コンテンツ長を加味できていない(課題4)。
本発明は、上記の点に鑑みてなされたものであって、オーディオビジュアルの品質が時間的に変化する場合であっても品質評価を可能とすることを目的とする。
そこで上記課題を解決するため、オーディオビジュアル品質推定装置は、オーディオビジュアルのコンテンツに関するパラメータのうち、音響品質に影響を与えるパラメータに基づいて、前記コンテンツの再生開始時から単位時間ごとの音響品質を推定する音響品質推定部と、前記コンテンツに関するパラメータのうち、映像品質に影響を与えるパラメータに基づいて、前記単位時間ごとの映像品質を推定する映像品質推定部と、前記音響品質及び前記映像品質を前記単位時間ごとに統合して、前記単位時間ごとのオーディオビジュアル品質を推定する単位時間品質推定部と、前記単位時間ごとのオーディオビジュアル品質を一つに統合して、時間的な品質変動を加味した、符号化劣化に対するオーディオビジュアル符号化品質を推定する符号化品質推定部と、前記オーディオビジュアル符号化品質と、前記コンテンツの再生停止に関するパラメータとに基づいて、前記コンテンツの終了後に視聴者が体感するオーディオビジュアル品質を推定するオーディオビジュアル品質推定部と、を有し、前記オーディオビジュアル品質推定部は、前記オーディオビジュアル品質に対する前記再生停止に関するパラメータの影響の度合いを、前記コンテンツの時間長に基づいて変化させて、前記再生停止に関するパラメータが、前記コンテンツの時間長に対して相対的に増加すると、前記オーディオビジュアル品質を低下させる

オーディオビジュアルの品質が時間的に変化する場合であっても品質評価を可能とすることができる。
オーディオビジュアル品質の時間的な変動を説明する図である。 本発明の実施の形態におけるオーディオビジュアル品質推定装置のハードウェア構成例を示す図である。 本発明の実施の形態におけるオーディオビジュアル品質推定装置の機能構成例を示す図である。 入力パラメータがコンテンツのパケット等から抽出される場合の機能構成例を示す図である。 MPDから単位時間ごとのメディアパラメータを抽出する方法を説明するための図である。 バッファリングパラメータを説明するための図である。 オーディオビジュアル品質推定装置が実行する処理手順の一例を説明するためのフローチャートである。
以下、図面に基づいて本発明の実施の形態を説明する。図2は、本発明の実施の形態におけるオーディオビジュアル品質推定装置のハードウェア構成例を示す図である。図2のオーディオビジュアル品質推定装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、及びインタフェース装置105等を有する。
オーディオビジュアル品質推定装置10での処理を実現するプログラムは、フレキシブルディスク又はCD−ROM等の記録媒体101によって提供される。プログラムを記憶した記録媒体101がドライブ装置100にセットされると、プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。また、当該プログラムは、他のプログラムの一部としてインストールされるようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従ってオーディオビジュアル品質推定装置10に係る機能を実行する。インタフェース装置105は、ネットワークに接続するためのインタフェースとして用いられる。
図3は、本発明の実施の形態におけるオーディオビジュアル品質推定装置の機能構成例を示す図である。図3において、オーディオビジュアル品質推定装置10は、オーディオビジュアルコンテンツ(以下、単に「コンテンツ」という。)について、視聴者が最終的に感じたオーディオビジュアル品質を推定するために、音響品質推定部11、映像品質推定部12、単位時間品質推定部13、符号化品質推定部14、及びオーディオビジュアル品質推定部15等を有する。これら各部は、オーディオビジュアル品質推定装置10にインストールされた1以上のプログラムが、CPU104に実行させる処理により実現される。すなわち、これら各部は、オーディオビジュアル品質推定装置10のハードウェア資源と、オーディオビジュアル品質推定装置10にインストールされたプログラム(ソフトウェア)との協働によって実現される。
音響品質推定部11は、コンテンツに関するパラメータのうち、コンテンツの音響品質に影響を与える音響パラメータ(例えば、音響ビットレート、サンプリングレート等)に基づいて、コンテンツについて、単位時間ごとの音響品質の推定値(以下、単に「音響品質」という。)を算出する。単位時間は、例えば、1秒、5秒、又は10秒等、コンテンツ長(コンテンツの時間長)に対して相対的に短い時間である。
映像品質推定部12は、コンテンツに関するパラメータのうち、コンテンツの映像品質に影響を与える映像パラメータ(例えば、映像ビットレート、解像度、フレームレート等)に基づいて、コンテンツについて、単位時間ごとの映像品質の推定値(以下、単に「映像品質」という。)を算出する。
単位時間品質推定部13は、音響品質推定部11から出力される単位時間ごとの音響品質と、映像品質推定部12から出力される単位時間ごとの映像品質とに基づいて、コンテンツについて、単位時間ごとのオーディオビジュアル品質の推定値を算出する。
符号化品質推定部14は、単位時間品質推定部13から出力される単位時間ごとのオーディオビジュアル品質に基づいて、コンテンツについて、時間的な品質変動を加味した符号化劣化に対するオーディオビジュアル符号化品質の推定値(以下、単に「オーディオビジュアル符号化品質」という。)を算出する。
オーディオビジュアル品質推定部15は、符号化品質推定部14から出力されるオーディオビジュアル符号化品質と、オーディオビジュアルの再生停止に関するバッファリングパラメータ(例えば、再生停止時間の総時間、再生停止回数、再生停止間隔の平均値)とに基づいて、視聴者が最終的に(コンテンツの視聴終了後に)感じるオーディオビジュアル品質の推定値(以下、単に「オーディオビジュアル品質」という。)を算出する。なお、再生停止とは、視聴者による意図的な再生の停止ではなく、コンテンツの品質の劣化に基づいて発生する再生の停止をいう。なお、オーディオビジュアル品質推定部15は、更に、オーディオビジュアルコンテンツの時間長(但し、停止時間を含まない純粋なコンテンツ長)に基づいてオーディオビジュアル品質を算出してもよい。
なお、図3に示される音響パラメータ、映像パラメータ、及びバッファリングパラメータ等の入力パラメータは、例えば、コンテンツがネットワーク転送される際のパケットや視聴者端末(コンテンツの閲覧に利用される端末)から自動的に抽出されてもよいし、パケット以外の情報から抽出されてもよい。
図4は、入力パラメータがコンテンツのパケット等から抽出される場合の機能構成例を示す図である。図4中、図3と同一部分には同一符号を付し、その説明は省略する。
図4では、図3に対して、パラメータ抽出部20が追加されている。パラメータ抽出部20は、オーディオビジュアル品質推定装置10によって実現されてもよいし、オーディオビジュアル品質推定装置10以外の装置(コンピュータ)によって実現されてもよい。いずれの場合であっても、パラメータ抽出部20は、コンピュータ(オーディオビジュアル品質推定装置10又は他の装置)にインストールされたプログラムが、インストール先の装置のCPUに実行させる処理により実現される。
パラメータ抽出部20は、映像通信サービスを提供するサービス提供者が有する情報、コンテンツを転送するパケット、視聴者端末のいずれかから抽出できるパラメータを用いてメディアパラメータ(音響パラメータ及び映像パラメータ)及びバッファリングパラメータを抽出する。図4において、パラメータ抽出部20は、メディアパラメータ抽出部21及びバッファリングパラメータ抽出部22を含む。
メディアパラメータ抽出部21は、音響パラメータとして音響ビットレートを抽出し、映像パラメータとして映像ビットレート、解像度、及びフレームレートを抽出する。
ネットワーク内で(ネットワークを流れるパケットから)メディアパラメータを抽出する方法としては、Segmentation formatsやMPD(Media presentation description)からメディアパラメータを抽出する方法が挙げられる。視聴者端末でメディアパラメータを抽出する方法としては、視聴者端末が受信したSegmentation formatsやMPDからメディアパラメータが抽出されても良いし、符号化情報が記載されたビットストリームからメディアパラメータが抽出されてもよい。
図5は、MPDから単位時間ごとのメディアパラメータを抽出する方法を説明するための図である。
図5の(1)は、コンテンツのチャンク(Chunk)の長さが5秒であり、各チャンクに付随しているMPDから、当該チャンクに関する音響ビットレートabr、映像ビットレートvbr、解像度rs、及びフレームレートfr等を抽出可能であることを示す。
(2)では、(1)に示されるような状況において、単位時間が1秒である場合、5秒目までの各秒には、1番目のチャンク(Chunk1)のメディアパラメータを割り当てることができ、6〜10秒目までの各秒には、2番目のチャンク(Chunk2)のメディアパラメータを割り当てることができることを示す。以降の各秒についても、同様に、各秒に対応するチャンクについて抽出されたメディアパラメータを割り当てることができる。
なお、例えば、音響品質及び映像品質に影響を与えるメディアパラメータとして、音響ビットレート、映像ビットレート、解像度、フレームレートが考えられるが、サービス提供者は、これらの値を設定してコンテンツを符号化しているため、オーディオビジュアル品質推定装置10は、これらの設定値を直接利用しても良い。
バッファリングパラメータ抽出部22は、コンテンツの再生停止の総時間、再生停止回数、及び再生停止時間間隔の平均値を、バッファリングパラメータとして抽出する。
図6は、バッファリングパラメータを説明するための図である。図6の上段には、コンテンツAのコンテンツ長(T=60秒)を示す矩形が示されている。図6の下段には、コンテンツAの再生に要した時間を示す矩形が示されている。下段の矩形によれば、再生開始から10秒が経過した時点(コンテンツAの10秒目の再生時)において、5秒間の再生停止(b1)が発生し、再生開始から25秒が経過した時点(コンテンツAの20秒目の再生時)において、10秒間の再生停止(b2)が発生し、再生開始から65秒が経過した時点(コンテンツAの50秒目の再生時)において、5秒間の再生停止(b3)が発生したことが示されている。この場合、コンテンツの再生停止の総時間は、5+10+5=20秒(b1+b2+b3)であり、再生停止回数は、3回である。また、最初の再生停止の開始時と、2番目の再生停止の開始時との間隔は、10秒であり、2番目の再生停止の開始時と、3番目の再生停止の開始時との間隔は、30秒である。したがって、この場合、再生停止時間間隔の平均値は、(10+30)÷2=20秒である。すなわち、再生停止時間間隔とは、或る再生停止について、その開始時から次の再生停止の開始時までの時間をいう。但し、再生停止回数が0もしくは1回の場合は、再生停止時間間隔の平均値は0とする。
このようなバッファリングパラメータ(再生停止時間の総時間、再生停止回数、再生停止間隔の平均値)を、ネットワーク内で抽出する際には、視聴者端末のバッファ量が一定であることを仮定し、視聴者端末の受信バッファ量から算出することができる。具体的には、受信バッファでデータが枯渇した際に再生停止が発生するため、データの枯渇した回数を再生停止回数として推定することができ、ビットレートと受信バッファ量からコンテンツの停止開始時期と停止時間長とを推定することができる。視聴者端末内でバッファリングパラメータを抽出する際には、実際にコンテンツが停止している時間をプレイヤーで検知してバッファリングパラメータを算出しても良い。プレイヤーで再生時間を把握しながら再生をしているため、例えば、PTS(Presentation time stamp)の情報を取得し、現在時刻と突合することで、再生停止開始時期と再生停止時間長とを把握できる。
以下、オーディオビジュアル品質推定装置10が実行する処理手順について説明する。図7は、オーディオビジュアル品質推定装置が実行する処理手順の一例を説明するためのフローチャートである。
品質の評価対象のコンテンツ(以下、「対象コンテンツ」という。)に関するパケット等の情報(例えば、対象コンテンツの転送に利用された全てのパケット)がパラメータ抽出部20に入力されると、メディアパラメータ抽出部21が、音響品質に影響を与える音響パラメータ(音響ビットレート)と、映像品質に影響を与える映像パラメータ(映像ビットレート、解像度、フレームレート)とを単位時間ごとに算出し、バッファリングパラメータ抽出部22が、バッファリングに関するバッファリングパラメータ(再生停止回数、再生停止の総時間、再生停止間隔の平均値)を算出する(S101)。音響パラメータは、音響品質推定部11へ出力され、映像パラメータは、映像品質推定部12へ出力され、バッファリングパラメータは、オーディオビジュアル品質推定部15へ出力される。
続いて、音響品質推定部11は、入力された音響パラメータに基づいて、対象コンテンツについて、単位時間ごとの音響品質を算出し、算出された音響品質を、単位時間品質推定部13に出力する(S102)。
音響品質推定部11は、対象コンテンツの単位時間ごとの音響ビットレートabr(t)から、単位時間ごとの音響品質AQ(t)を算出する。具体的には、音響ビットレートabr(t)の低下に対し音響品質AQ(t)が低下する特性を考慮し、以下の数式(1)を利用して算出する。
Figure 0006662905
ただし、abr(t)は、コンテンツの再生開始時からt秒後の音響ビットレートとしてメディアパラメータ抽出部21によって算出された値、係数a,a,aは、予め設定された定数とする。本実施の形態では、単位時間は、1秒であるとする。すなわち、コンテンツについて、1秒ごとの音響品質AQ(t)が推定されるため、t=1,2,3,…秒である。なお、tは、バッファリングによる再生停止時間を除いたコンテンツの再生開始時からの経過時間である。つまり、60秒のコンテンツの場合、途中に再生停止が10秒入っても、t=1,2,…,60となる。但し、音響品質推定部11は、数式(1)とは異なる数式を用いて音響品質AQ(t)を算出してもよい。
続いて、映像品質推定部12は、入力された映像パラメータに基づいて、対象コンテンツについて、単位時間ごとの映像品質を算出し、算出された映像品質を、単位時間品質推定部13に出力する(S103)。
映像品質推定部12は、対象コンテンツの単位時間ごとの映像ビットレートvbr(t)、解像度rs(t)、及びフレームレートfr(t)から、単位時間ごとの映像品質VQ(t)を算出する。具体的には、解像度とフレームレートの組ごとに決まる理論上の最高/最大映像品質X(t)を考慮すること、また、最高/最大映像品質X(t)は、解像度rs(t)やフレームレートfr(t)の低下とともに低下する特性を考慮すること、上記最高/最大映像品質X(t)に対し、映像ビットレートvbr(t)の低下とともに映像品質VQ(t)が低下する特性を考慮し、以下の数式(2)及び(3)を用いて算出される。
Figure 0006662905
ただし、vbr(t)は、コンテンツの再生開始時からt秒後の映像ビットレート、rs(t)は、コンテンツの再生開始時からt秒後の垂直・水平方向のライン数及び画素数から求められた解像度(例えば、1920×1080などの総画素数)又は垂直方向のライン数若しくは水平方向の画素数のみを把握可能な場合には、当該ライン数若しくは当該画素数から公知の方法で算出された解像度、fr(t)は、コンテンツの再生開始時からt秒後のフレームレートであり、メディアパラメータ抽出部21によって算出された値、係数v,v,…,vは、予め設定された定数とする。本実施の形態では、1秒ごとの映像品質VQ(t)が推定されるため、t=1,2,3,…秒である。但し、映像品質推定部12は、数式(2)及び(3)とは異なる数式を用いて映像品質VQ(t)を算出してもよい。
続いて、単位時間品質推定部13は、入力された音響品質AQ(t)及び映像品質VQ(t)を単位時間ごとに統合して、単位時間ごとのオーディオビジュアル品質を算出し、算出された単位時間ごとのオーディオビジュアル品質を、符号化品質推定部14へ出力する(S104)。
具体的には、単位時間品質推定部13は、単位時間ごとのオーディオビジュアル品質TAVQ(t)を、単位時間ごとの音響品質AQ(t)及び映像品質VQ(t)の影響の重みを付けて、以下の数式(4)を用いて算出する。
Figure 0006662905
ただし、av,av,av,avは、予め設定された定数とする。tは、コンテンツの再生開始時からバッファリングによる再生停止を除いた経過時間(t=1,2,3,…秒)である。
続いて、符号化品質推定部14は、入力された単位時間ごとのオーディオビジュアル品質TAVQ(t)を一つに統合して、符号化劣化のみを加味したオーディオビジュアル符号化品質を算出し、算出されたオーディオビジュアル符号化品質をオーディオビジュアル品質推定部15へ出力する(S105)。
課題2で示したように、忘却効果/親近効果の影響があるため、品質に対する時間的な重みは時間の経過とともに大きくなる(w(u))。また、課題3で示したように低い品質が最終的な品質に与える影響(重み)は大きくなる(w(TAVQ(t)))。そこで、符号化品質推定部14は、オーディオビジュアル符号化品質CAVQを、以下の数式(5)を用いて算出する。
Figure 0006662905
ただし、durationは、オーディオビジュアルコンテンツの時間長(秒)(ただし、再生停止時間を含まない純粋なコンテンツ長)であり、例えば、予め設定されていてもよい。tは、再生開始時からの経過時間(t=1,2,3,…秒)、t,t,t,t,tは予め設定された定数とする。
すなわち、数式(5)によれば、コンテンツの開始から終了にかけての単位時間ごとのオーディオビジュアル品質TAVQ(t)について、コンテンツの終了に向かって重みを大きくして(コンテンツの終了に相対的に近い単位時間に係るオーディオビジュアル品質TAVQほど重みを大きくして)加重平均が算出されることで、オーディオビジュアル符号化品質CAVQが導出される。加えて、単位時間ごとのオーディオビジュアル品質TAVQ(t)が小さい場合(つまり、品質が低い場合)の影響を重みとして大きくして加重平均が算出されることで、オーディオビジュアル符号化品質CAVQが導出される。
本実施の形態ではw(u)は指数関数で表現されているが、w(u)は、一次関数や二次関数等、コンテンツの終了に相対的に近い単位時間に係るオーディオビジュアル品質TAVQほど重みが大きくなる関数で定式化されていればよい。したがって、w(u)は、指数関数に限られない。また、w(TAVQ(t))は一次関数で表現されているが、w(TAVQ(t))は、指数関数等、品質が低い場合に重みが大きくなる関数で定式化されていればよい。したがって、w(TAVQ(t))は、一次関数に限られない。
なお、w(u)=1またはw(TAVQ(t))=1とすると、それぞれの重みのみを考慮した推定式となる。また、品質が低い期間に対して重みを大きくするw(TAVQ(T))を推定式に導入することに代えて、品質の低下回数が大きいほどCAVQが小さくなる推定式としてもよい。品質の向上回数と低下回数の和をもって変動回数として、変動回数が多いほどCAVQが小さくなる推定式としてもよい。これらをw(TAVQ(T))と併用してもよい。
続いて、オーディオビジュアル品質推定部15は、入力されたバッファリングパラメータ及びオーディオビジュアル符号化品質CAVQに基づいて、オーディオビジュアル品質を算出する(S106)。
具体的には、オーディオビジュアル品質推定部15は、オーディオビジュアル符号化品質CAVQと、バッファリングパラメータである再生停止時間の総長、再生停止回数、及び再生停止時間の間隔の平均値、オーディオビジュアルコンテンツの時間長(ただし、停止時間を含まない純粋なコンテンツ長)とに基づいて、最終的に視聴者が体感するオーディオビジュアル品質AVQを、以下の数式(6)を用いて算出する。
Figure 0006662905
ただし、durationはオーディオビジュアルコンテンツの時間長(ただし、停止時間を含まない純粋なコンテンツ長)、numofBuffは、再生停止回数、totalBuffLenは、再生停止時間の総長、avgBuffIntervalは、再生停止時間の間隔の平均値、係数s,s,sは予め設定された定数とする。
課題4に示したように、コンテンツ時間長と再生停止とが、最終的なオーディオビジュアル品質に与える影響を加味するため、再生停止に関するパラメータが、コンテンツの時間長によって除算されている。本実施の形態では、バッファリングパラメータに指数関数を適用し、その影響度合いを定式化している。但し、数式(6)は、べき乗、対数などを用いて、再生停止回数(numofBuff)、再生停止時間の総長(totalBuffLen)、再生停止時間の間隔の平均値(avgBuffInterval)がコンテンツの時間長との関係で、相対的に増加すると最終的に視聴者が体感するオーディオビジュアル品質AVQが低下する関数で定式化されていればよい。また、本実施の形態では、再生停止回数(numofBuff)、再生停止時間の総長(totalBuffLen)、再生停止時間の間隔の平均値(avgBuffInterval)のすべてを用いて定式化しているが、いずれか一つを用いて定式化してもよい。さらに、本実施の形態では、バッファリングパラメータとして、再生停止回数(numofBuff)、再生停止時間の総長(totalBuffLen)、再生停止時間の間隔の平均値(avgBuffInterval)を用いているが、例えば、再生停止時間の総長(totalBuffLen)を再生停止回数(numofBuff)で除算した再生停止平均時間(avgBuffLen)、再生停止時間の分散(varBuffLen)、再生停止時間の最大値/最小値(maxBuffLen/minBuffLen)、再生停止時間の間隔の最大値/最小値/分散(maxBuffInterval/minBuffInterval/varBuffInterval)等を計算し、最終的に視聴者が体感するオーディオビジュアル品質AVQを算出してもよい。
上述したように、本実施の形態によれば、パケット等の情報から得られるメディアパラメータ及びバッファリングパラメータに基づいて、オーディオビジュアルの品質が時間的に変化する場合であっても品質評価を可能とする、又は当該評価の精度を向上させることができる。
なお、数1−5に記載される各係数(a,a,a,v,…,v,av,…,av,t,…,t,s,s,s)は、例えば、主観品質評価実験を実施し、得られた品質評価値を用い、最小二乗法等の最適化手法を用いて導出することができる。
従来、オーディオビジュアル品質を推定する際、短時間のオーディオビジュアル品質を推定することが前提となっており、オーディオビジュアル品質が時間的に変動する際の品質推定ができない(課題1)、視聴完了時のオーディオビジュアル品質は、視聴開始時の印象が薄く、視聴完了時の印象が強く残る傾向を考慮できていない(課題2)、オーディオビジュアル品質が変動する際、最終的なオーディオビジュアル品質は、低い品質に強く影響を受ける点を考慮できていない(課題3)、オーディオビジュアル品質は再生停止のみならずオーディオビジュアルコンテンツの尺長にも依存することが考慮できていない(課題4)、といった課題が有った。
これに対し、本実施の形態は、単位時間(例えば、1秒、5秒、10秒などの短時間)ごとの音響品質及び映像品質から単位時間ごとのオーディオビジュアル品質値を推定し、単位時間ごとのオーディオビジュアル品質値に重みづけをして統合し、長時間(例えば、数分〜数時間)のオーディオビジュアル品質を推定する。ここで、視聴者の忘却効果/親近効果を考慮するために、コンテンツの再生開始時の品質と比較して再生終了時の品質の重みが高くなるようにされる。また、オーディオビジュアル品質が時間的に変動する際に、低品質が最終的な品質に強く影響を与える点を考慮できるように重みづけがされる。また、オーディオビジュアルコンテンツの時間長が再生停止に与える影響を加味すると共に、オーディオビジュアルコンテンツの時間長が再生停止時間に与える影響を加味し、オーディオビジュアル品質を推定することができる。
したがって、本実施の形態によれば、視聴者が実際に視聴する映像通信サービスのオーディオビジュアル品質値(すなわち、オーディオビジュアル品質推定装置10から出力されるオーディオビジュアル品質AVQ)を監視することで、提供中のサービスが視聴者に対してある一定以上の品質を保っているか否かを容易に判断することができ、提供中のサービスの品質実態をリアルタイムで把握・管理することが可能となる。
このため、提供中のサービスの品質実態を従来技術でオーディオビジュアル品質評価をできなかった点を改善することが可能となる。
以上、本発明の実施例について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
本出願は、2015年12月16日に出願された日本国特許出願第2015−244983号と、2016年8月17日に出願された日本国特許出願第2016−160182号とに基づきその優先権を主張するものであり、同日本国特許出願の全内容を参照することにより本願に援用する。
10 オーディオビジュアル品質推定装置
11 音響品質推定部
12 映像品質推定部
13 単位時間品質推定部
14 符号化品質推定部
15 オーディオビジュアル品質推定部
20 パラメータ抽出部
21 メディアパラメータ抽出部
22 バッファリングパラメータ抽出部
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタフェース装置
B バス

Claims (9)

  1. オーディオビジュアルのコンテンツに関するパラメータのうち、音響品質に影響を与えるパラメータに基づいて、前記コンテンツの再生開始時から単位時間ごとの音響品質を推定する音響品質推定部と、
    前記コンテンツに関するパラメータのうち、映像品質に影響を与えるパラメータに基づいて、前記単位時間ごとの映像品質を推定する映像品質推定部と、
    前記音響品質及び前記映像品質を前記単位時間ごとに統合して、前記単位時間ごとのオーディオビジュアル品質を推定する単位時間品質推定部と、
    前記単位時間ごとのオーディオビジュアル品質を一つに統合して、時間的な品質変動を加味した、符号化劣化に対するオーディオビジュアル符号化品質を推定する符号化品質推定部と、
    前記オーディオビジュアル符号化品質と、前記コンテンツの再生停止に関するパラメータとに基づいて、前記コンテンツの終了後に視聴者が体感するオーディオビジュアル品質を推定するオーディオビジュアル品質推定部と、
    を有し、
    前記オーディオビジュアル品質推定部は、
    前記オーディオビジュアル品質に対する前記再生停止に関するパラメータの影響の度合いを、前記コンテンツの時間長に基づいて変化させて、前記再生停止に関するパラメータが、前記コンテンツの時間長に対して相対的に増加すると、前記オーディオビジュアル品質を低下させる
    ことを特徴とするオーディオビジュアル品質推定装置。
  2. 前記符号化品質推定部は、前記単位時間ごとのオーディオビジュアル品質について、前記コンテンツの終了に相対的に近い単位時間に係る前記オーディオビジュアル品質ほど重みを大きくして加重平均を算出することで、前記オーディオビジュアル符号化品質を推定する、
    ことを特徴とする請求項1記載のオーディオビジュアル品質推定装置。
  3. 前記符号化品質推定部は、前記単位時間ごとのオーディオビジュアル品質について、低いオーディオビジュアル品質ほど重みを大きくして加重平均を算出することで、前記オーディオビジュアル符号化品質を推定する、
    ことを特徴とする請求項1又は2記載のオーディオビジュアル品質推定装置。
  4. オーディオビジュアルのコンテンツに関するパラメータのうち、音響品質に影響を与えるパラメータに基づいて、音響品質を推定する音響品質推定部と、
    前記コンテンツに関するパラメータのうち、映像品質に影響を与えるパラメータに基づいて、映像品質を推定する映像品質推定部と、
    前記音響品質及び前記映像品質を統合したオーディオビジュアル品質と、前記コンテンツの再生停止に関するパラメータとに基づいて、前記コンテンツの終了後に視聴者が体感するオーディオビジュアル品質を推定するオーディオビジュアル品質推定部と、
    を備えるオーディオビジュアル品質推定装置であって、
    前記オーディオビジュアル品質推定部は、
    前記オーディオビジュアル品質に対する前記再生停止に関するパラメータの影響の度合いを、前記コンテンツの時間長に基づいて変化させて、前記再生停止に関するパラメータが、前記コンテンツの時間長に対して相対的に増加すると、前記オーディオビジュアル品質を低下させる
    ことを特徴とするオーディオビジュアル品質推定装置。
  5. オーディオビジュアルのコンテンツに関するパラメータのうち、音響品質に影響を与えるパラメータに基づいて、前記コンテンツの再生開始時から単位時間ごとの音響品質を推定する音響品質推定手順と、
    前記コンテンツに関するパラメータのうち、映像品質に影響を与えるパラメータに基づいて、前記単位時間ごとの映像品質を推定する映像品質推定手順と、
    前記音響品質及び前記映像品質を前記単位時間ごとに統合して、前記単位時間ごとのオーディオビジュアル品質を推定する単位時間品質推定手順と、
    前記単位時間ごとのオーディオビジュアル品質を一つに統合して、時間的な品質変動を加味した、符号化劣化に対するオーディオビジュアル符号化品質を推定する符号化品質推定手順と、
    前記オーディオビジュアル符号化品質と、前記コンテンツの再生停止に関するパラメータとに基づいて、前記コンテンツの終了後に視聴者が体感するオーディオビジュアル品質を推定するオーディオビジュアル品質推定手順と、
    をコンピュータが実行し、
    前記オーディオビジュアル品質推定手順は、
    前記オーディオビジュアル品質に対する前記再生停止に関するパラメータの影響の度合いを、前記コンテンツの時間長に基づいて変化させて、前記再生停止に関するパラメータが、前記コンテンツの時間長に対して相対的に増加すると、前記オーディオビジュアル品質を低下させる
    ことを特徴とするオーディオビジュアル品質推定方法。
  6. 前記符号化品質推定手順は、前記単位時間ごとのオーディオビジュアル品質について、前記コンテンツの終了に相対的に近い単位時間に係る前記オーディオビジュアル品質ほど重みを大きくして加重平均を算出することで、前記オーディオビジュアル符号化品質を推定する、
    ことを特徴とする請求項5記載のオーディオビジュアル品質推定方法。
  7. 前記符号化品質推定手順は、前記単位時間ごとのオーディオビジュアル品質について、低いオーディオビジュアル品質ほど重みを大きくして加重平均を算出することで、前記オーディオビジュアル符号化品質を推定する、
    ことを特徴とする請求項5又は6記載のオーディオビジュアル品質推定方法。
  8. オーディオビジュアルのコンテンツに関するパラメータのうち、音響品質に影響を与えるパラメータに基づいて、音響品質を推定する音響品質推定手順と、
    前記コンテンツに関するパラメータのうち、映像品質に影響を与えるパラメータに基づいて、映像品質を推定する映像品質推定手順と、
    前記音響品質及び前記映像品質を統合したオーディオビジュアル品質と、前記コンテンツの再生停止に関するパラメータとに基づいて、前記コンテンツの終了後に視聴者が体感するオーディオビジュアル品質を推定するオーディオビジュアル品質推定手順と、
    をコンピュータが実行し、
    前記オーディオビジュアル品質推定手順は、
    前記オーディオビジュアル品質に対する前記再生停止に関するパラメータの影響の度合いを、前記コンテンツの時間長に基づいて変化させて、前記再生停止に関するパラメータが、前記コンテンツの時間長に対して相対的に増加すると、前記オーディオビジュアル品質を低下させる
    ことを特徴とするオーディオビジュアル品質推定方法。
  9. 請求項1乃至4いずれか一項記載の各部としてコンピュータを機能させることを特徴とするプログラム。
JP2017555964A 2015-12-16 2016-11-30 オーディオビジュアル品質推定装置、オーディオビジュアル品質推定方法、及びプログラム Active JP6662905B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2015244983 2015-12-16
JP2015244983 2015-12-16
JP2016160182 2016-08-17
JP2016160182 2016-08-17
PCT/JP2016/085553 WO2017104416A1 (ja) 2015-12-16 2016-11-30 オーディオビジュアル品質推定装置、オーディオビジュアル品質推定方法、及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2017104416A1 JPWO2017104416A1 (ja) 2018-08-30
JP6662905B2 true JP6662905B2 (ja) 2020-03-11

Family

ID=59056339

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017555964A Active JP6662905B2 (ja) 2015-12-16 2016-11-30 オーディオビジュアル品質推定装置、オーディオビジュアル品質推定方法、及びプログラム

Country Status (7)

Country Link
US (1) US10869072B2 (ja)
EP (1) EP3393125B1 (ja)
JP (1) JP6662905B2 (ja)
KR (1) KR102000590B1 (ja)
CN (1) CN108476317B (ja)
RU (1) RU2693027C1 (ja)
WO (1) WO2017104416A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2903550T3 (es) 2016-06-29 2022-04-04 Ericsson Telefon Ab L M Estimación de la calidad de una transmisión continua multimedia adaptativa
JP7073894B2 (ja) * 2018-05-09 2022-05-24 日本電信電話株式会社 エンゲージメント推定装置、エンゲージメント推定方法及びプログラム
WO2021064913A1 (ja) * 2019-10-02 2021-04-08 日本電信電話株式会社 映像品質推定装置、映像品質推定方法、及びプログラム
US11277461B2 (en) 2019-12-18 2022-03-15 The Nielsen Company (Us), Llc Methods and apparatus to monitor streaming media
US20230262277A1 (en) * 2020-07-02 2023-08-17 Nippon Telegraph And Telephone Corporation Viewing completion rate estimation apparatus, viewing completion rate estimation method and program
CN114342335B (zh) * 2020-07-22 2024-02-13 北京小米移动软件有限公司 信息传输方法、装置及通信设备
US11570228B2 (en) 2020-10-15 2023-01-31 Sandvine Corporation System and method for managing video streaming quality of experience
US11558668B2 (en) 2021-06-03 2023-01-17 Microsoft Technology Licensing, Llc Measuring video quality of experience based on decoded frame rate
WO2023233631A1 (ja) * 2022-06-02 2023-12-07 日本電信電話株式会社 映像品質推定装置、映像品質推定方法及びプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004172753A (ja) * 2002-11-18 2004-06-17 Nippon Telegr & Teleph Corp <Ntt> 映像・音声品質客観評価方法及び装置
EP1924101B1 (en) * 2005-09-06 2013-04-03 Nippon Telegraph And Telephone Corporation Video communication quality estimation device, method, and program
JP4490374B2 (ja) * 2006-01-19 2010-06-23 日本電信電話株式会社 映像品質評価装置および方法
RU2420022C2 (ru) * 2006-10-19 2011-05-27 Телефонактиеболагет Лм Эрикссон (Пабл) Способ определения качества видео
EP2106154A1 (en) * 2008-03-28 2009-09-30 Deutsche Telekom AG Audio-visual quality estimation
US9191284B2 (en) * 2010-10-28 2015-11-17 Avvasi Inc. Methods and apparatus for providing a media stream quality signal
CN103379358B (zh) * 2012-04-23 2015-03-18 华为技术有限公司 评估多媒体质量的方法和装置
GB2533878B (en) * 2013-10-16 2020-11-11 Intel Corp Method, apparatus and system to select audio-video data for streaming
JP6162596B2 (ja) * 2013-12-24 2017-07-12 日本電信電話株式会社 品質推定装置、方法及びプログラム
JP6114702B2 (ja) * 2014-02-14 2017-04-12 日本電信電話株式会社 ユーザ体感品質推定装置、ユーザ体感品質推定方法及びプログラム

Also Published As

Publication number Publication date
KR102000590B1 (ko) 2019-07-16
KR20180059890A (ko) 2018-06-05
CN108476317A (zh) 2018-08-31
US20180332326A1 (en) 2018-11-15
CN108476317B (zh) 2021-07-09
EP3393125A4 (en) 2019-08-21
EP3393125A1 (en) 2018-10-24
RU2693027C1 (ru) 2019-07-01
US10869072B2 (en) 2020-12-15
WO2017104416A1 (ja) 2017-06-22
JPWO2017104416A1 (ja) 2018-08-30
EP3393125B1 (en) 2021-03-03

Similar Documents

Publication Publication Date Title
JP6662905B2 (ja) オーディオビジュアル品質推定装置、オーディオビジュアル品質推定方法、及びプログラム
CN109618565B (zh) 流式视频用户体验质量的自动测量方法和系统
CA2982846A1 (en) System and method for determining quality of a media stream
CN102118270A (zh) 一种度量用户体验质量QoE的方法及装置
JP4490374B2 (ja) 映像品質評価装置および方法
JP7380832B2 (ja) 数理モデル導出装置、数理モデル導出方法及びプログラム
US11425457B2 (en) Engagement estimation apparatus, engagement estimation method and program
JP6162596B2 (ja) 品質推定装置、方法及びプログラム
US20230048428A1 (en) A method for estimating bandwidth between a video server and a video client
JP5335867B2 (ja) 基本GoP長を用いた映像品質推定装置及び方法及びプログラム
US11889148B2 (en) Engagement estimation apparatus, engagement estimation method and program
JP2010081157A (ja) 映像品質推定装置、方法、およびプログラム
JP5405915B2 (ja) 映像品質推定装置、映像品質推定方法および映像品質推定装置の制御プログラム
JP7215209B2 (ja) エンゲージメント推定装置、エンゲージメント推定方法及びプログラム
JP4740967B2 (ja) 映像品質推定装置、方法、およびプログラム
JP7405256B2 (ja) 視聴完了率推定装置、視聴完了率推定方法及びプログラム
JP7255704B2 (ja) エンゲージメント推定装置、エンゲージメント推定方法及びプログラム
JP6700242B2 (ja) 品質推定装置、品質推定方法及びプログラム
JP6660357B2 (ja) 品質推定装置、品質推定方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190625

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190903

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190927

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200213

R150 Certificate of patent or registration of utility model

Ref document number: 6662905

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150