JP2015528247A - ビットストリームレベルにおけるビデオ品質評価 - Google Patents

ビットストリームレベルにおけるビデオ品質評価 Download PDF

Info

Publication number
JP2015528247A
JP2015528247A JP2015521927A JP2015521927A JP2015528247A JP 2015528247 A JP2015528247 A JP 2015528247A JP 2015521927 A JP2015521927 A JP 2015521927A JP 2015521927 A JP2015521927 A JP 2015521927A JP 2015528247 A JP2015528247 A JP 2015528247A
Authority
JP
Japan
Prior art keywords
artifact level
block
function
level
visual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2015521927A
Other languages
English (en)
Inventor
ニン リアオ
ニン リアオ
ジーボー チェン
ジーボー チェン
カイ シエ
カイ シエ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2015528247A publication Critical patent/JP2015528247A/ja
Ceased legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/004Diagnosis, testing or measuring for television systems or their details for digital television systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

ビデオシーケンス内のマクロブロックは、対応する圧縮データが失われているか、または構文が一致していないために、復号不可能となりうる。復号不可能なマクロブロックは、誤り隠蔽技法を使用して隠蔽されてもよい。復号不可能なマクロブロックによって生じた初期可視アーティファクトのレベルは、動き大きさ、誤り隠蔽距離、および/または残余エネルギーの関数として推定されてもよい。初期可視アーティファクトは、予測を通じてその他のマクロブロックに空間的または時間的に伝搬することがある。初期可視アーティファクトおよび伝搬済みアーティファクトを共に考慮することで、全体的なアーティファクトが個々のマクロブロックについて推定されてもよい。次いで、ビデオシーケンスのビジュアル品質は、マクロブロックレベルのアーティファクトレベルをプールすることによって推定されてもよい。

Description

本発明は、ビデオ品質測定に関し、さらに詳細には、客観的なビデオ品質メトリックを決定するための方法および装置に関する。
IPネットワークの開発に伴って、有線および無線IPネットワークを介するビデオ通信(たとえば、IPTVサービス)が普及してきた。ケーブルネットワークを介する従来のビデオ送信とは異なり、IPネットワークを介するビデオ搬送は、信頼性があまり高くはない。その結果、ビデオ圧縮による品質損失に加えて、ビデオ品質は、ビデオがIPネットワークを通じて送信される場合に、さらに低下する。成功に至るビデオ品質モデリングツールは、ビデオ圧縮により生じる品質低下に加えて、(たとえば、パケット損失、送信遅延、および送信ジッターのような)ネットワーク送信の障害により生じる品質低下を評価する必要がある。
国際公開第2013/075335号 国際公開第2013/159275号
本発明の原理は、ビットストリームにより表されるビデオシーケンスのビジュアル品質を推定するための方法であって、スライシングモード誤り隠蔽が、前記ビデオシーケンスの復号不可能ブロックを隠蔽するために使用される方法を提供し、前記方法は、復号不可能である、前記ビデオシーケンスのフレーム内のブロックの動き大きさを推定するステップと、前記フレームと前記ブロックを隠蔽するために使用される別のフレームとの間の距離を決定するステップと、後段において説明されるように前記動き大きさおよび前記距離に応じて前記ビデオシーケンスの前記ビジュアル品質を推定するステップとを備える。本発明の原理はまた、上記のステップを実行するための装置を提供する。
本発明の原理はまた、ビットストリームにより表されるビデオシーケンスのビジュアル品質を推定するための方法であって、スライシングモード誤り隠蔽が、前記ビデオシーケンスの復号不可能ブロックを隠蔽するために使用される方法を提供し、前記方法は、復号不可能である、前記ビデオシーケンスのフレーム内のブロックの動き大きさを推定するステップと、前記フレームと前記ブロックを隠蔽するために使用される別のフレームとの間の距離を決定するステップと、前記動き大きさおよび前記距離に応じて初期可視アーティファクトを決定するステップと、前記ブロックの参照ブロックとして使用される別のブロック内のピクセルのアーティファクトレベルに応じて、前記ブロック内のピクセルの伝搬済み可視アーティファクトを決定するステップと、前記ブロックの前記初期可視アーティファクトレベルおよび前記ブロック内の前記ピクセルの前記伝搬済み可視アーティファクトレベルに応じて前記ブロック内の前記ピクセルのアーティファクトレベルを決定するステップと、前記ブロック内の前記ピクセルの前記アーティファクトレベルに応じて前記ブロックの全体的可視アーティファクトレベルを推定するステップであって、前記ビデオシーケンスの前記ビジュアル品質は、後段において説明される前記ブロックの前記全体的可視アーティファクトレベルに応じて推定されるステップとを備える。本発明の原理はまた、上記のステップを実行するための装置を提供する。
本発明の原理はまた、上記で説明される方法に従って、ビットストリームにより表されるビデオシーケンスのビジュアル品質を推定するための命令を格納したコンピュータ可読記憶媒体であって、スライシングモード誤り隠蔽が前記ビデオシーケンスの復号不可能ブロックを隠蔽するために使用される、前記記憶媒体を提供する。
本発明の原理の実施形態による、ビデオ品質モデリングの例を示す流れ図である。 本発明の原理の実施形態による、初期可視アーティファクトレベルを推定するステップの例を示す流れ図である。 フレームn−1におけるマクロブロック(MB)の例を示す図である。 フレームnにおけるマクロブロック(MB)の例を示す図である。 フレームn+1におけるマクロブロック(MB)の例を示す図である。 本発明の原理の実施形態による、ビデオ品質モニターの例を示すブロック図である。 1または複数の実装形態と共に使用されうるビデオ処理システムの例を示すブロック図である。
ビデオ品質測定ツールは、さまざまなレベルにおいて動作することができる。たとえば、ツールは、受信したビットストリームを取り込んで、ビデオを再構築することなくビデオ品質を測定することができる。そのような方法は通常、ビットストリームレベルビデオ品質測定と称される。余分な計算の複雑さが許容される場合、ビデオ品質測定は、ビットストリームから一部または全部の画像を再構築し、再構築された画像を使用してビデオ品質をより正確に推定することができる。
本発明の原理は、ビデオを再構築することなく、ビデオ品質をビットストリームレベルで評価する客観的なビデオ品質モデルに関する。
たとえば、H.264およびMPEG−2のような、多くの既存のビデオ圧縮規格は、マクロブロックを基本符号化単位として使用する。したがって、以下の実施形態では、マクロブロックを基本処理単位として使用する。しかし、本原理は、たとえば、8×8ブロック、16×8ブロック、32×32ブロック、または64×64ブロックのような、さまざまなサイズにおいてブロックを使用するように適合されうる。
ビデオの一部分が適切に復号されない場合、誤り隠蔽技法、たとえば、スライシングモード誤り隠蔽およびフリージングモード誤り隠蔽が、復号済みビデオを隠蔽するために使用されてもよい。
スライシングモード誤り隠蔽技法において、フレームに対応する一部のデータが失われた場合、復号器は、すでに再構築されているピクセルを使用して失われたマクロブロックを修復しようと試みる。可視アーティファクトは、修復後にピクチャ内に残存することがあり、隠蔽済みマクロブロックを参照として使用する後続のピクチャに伝搬することもある。
フリージングモード誤り隠蔽技法において、参照フレーム、たとえば、I、P、または参照Bフレームに対応する一部のデータが失われた場合、復号器は、復号をフリーズして、失われたフレームを(直接または間接的に)参照することなく、フレームが正しく受信されるまで、以前正しく復号されたフレームを繰り返す。非参照フレーム、たとえば、非参照Bフレームがデータを損失した場合、後続のフレームが非参照フレームを参照することなく復号されうるので、復号器は、損失したフレームの復号のみをフリーズする。フリージングモード誤り隠蔽は、任意の誤り隠蔽方策によって得られる最悪の知覚的品質を反映することがある。
符号化ビデオビットストリームの一部分がネットワーク送信中に失われた場合、失われた部分に対応するマクロブロックが失われたマクロブロックと示され、これらは復号不可能である。一部のマクロブロックはまた、たとえ正しく受信されたとしても、たとえばマクロブロックの構文が一致していないために、復号不可能となることがある。対応する圧縮データが失われているか、または構文が一致していないために、復号不可能なマクロブロックは、EC MBと示される。復号可能なマクロブロックは、非EC MBと示される。
スライシングモード誤り隠蔽技法において、非EC MBが復号されてもよく、EC MBは、たとえば、以前復号済みのフレームからの連結されたマクロブロックのピクセルを使用して、隠蔽されてもよい。EDと示される、誤り隠蔽距離は、将来隠蔽されるフレームと隠蔽中のフレーム(つまり、誤り隠蔽に使用されるフレーム)との間の、表示順序の、距離として定義される。2つのフレーム間の距離が、2つのフレーム間の時間間隔もしくは時間差、または2つのフレーム間のフレームの数として計算されうることに留意されたい。誤り隠蔽距離パラメータは、いずれの誤り隠蔽技法が使用されるかによって異なる。誤り隠蔽技法が不明である場合、誤り隠蔽距離は、将来隠蔽されるフレームと直前の復号済みフレームとの間の距離として設定されてもよい。
一般に、誤り隠蔽の目標は、知覚的品質の低下を最小化するために、EC MBを推定することである。送信誤りによって生成されるアーティファクトの知覚される強度は、採用される誤り隠蔽技法に大きく依存する。たとえば、現在のフレームから遠く離れたフレームが現在のマクロブロックを隠蔽するために使用される場合、隠蔽されたマクロブロックは、可視のアーティファクトを有する可能性がさらに高くなる。加えて、アーティファクト強度はまた、ビデオコンテンツにも関連する。たとえば、動きの遅いビデオの方が、容易に隠蔽される。したがって、動きベクトルおよび誤り隠蔽距離などのパラメータは、誤り隠蔽の有効性および隠蔽されたビデオの品質をビットストリームレベルで評価するために使用されてもよい。
所与の動きベクトル(MVx,MVy)について、その動き大きさ(MV)は、動きがどの程度大きいかを測定するために使用される。1つの例において、これは以下のように計算されうる。
これはまた、たとえば以下のように、他の形式で計算されてもよい。
MV=|MVx|+|MVy| (2)
残余情報は、動き補償済み予測からもたらされる。マクロブロックの残余情報のエネルギー(残余エネルギー、RSDとも称される)が、マクロブロックのテクスチャー複雑性および動き複雑性を反映することが観察される。
たとえば、通常は容易に隠蔽される空および草地における、一部のビデオシーケンスの平滑な領域では、たとえピクチャ間の動きが小さくても、推定される動きベクトルは大きくなりうる。その結果、動きベクトルに基づくビデオ品質測定は、たとえ隠蔽された領域が良好なビジュアル品質を有していても、強い可視アーティファクトを誤って推定することがある。対照的に、平滑な領域の残余エネルギーは、比較的小さくなり、知覚されるビジュアル品質に関するより良好な指示をもたらすことができる。したがって、残余エネルギーは、アーティファクトレベルを推定する際にもう1つのパラメータとして使用されうる。
1つの実施形態において、非EC MBの残余エネルギーは、逆量子化変換係数のエネルギーの和、または逆量子化AC変換係数のエネルギーの和として計算されうる。EC MBの残余エネルギーは、以前の参照フレーム内の連結されたマクロブロックの残余エネルギーに設定されてもよい。
残余エネルギー、ならびに動き大きさおよび誤り隠蔽距離が、ビデオを再構築することなく導き出されることに留意されたい。つまり、ここでパラメータはビットストリームレベルで導き出されうる。
上記で説明されるように、ビジュアルアーティファクトは、誤り隠蔽後も引き続き知覚されることがある。ビジュアルアーティファクトは、誤り隠蔽がそこで効果的ではないために、EC MBにおいて生じる場合がある。復号不可能マクロブロックによって生じるそのようなビジュアルアーティファクトは、初期可視アーティファクトと示される。たとえば、イントラ予測またはインター予測のために、初期可視アーティファクトを有するブロックが参照として使用される場合、初期可視アーティファクトは、予測を通じて同一または別のフレーム内で他のマクロブロックに空間的または時間的に伝搬することがある。そのような伝搬されたアーティファクトは、伝搬可視アーティファクトと示される。初期および/または伝搬可視アーティファクトによって生じた、全体的なアーティファクトは、全体的可視アーティファクトと示される。
本発明の原理は、スライシングモード誤り隠蔽が使用される場合のビジュアル品質測定を対象とする。スライシングモードによって生じるアーティファクトは、フリージングモード誤り隠蔽またはその他の誤り隠蔽技法によって生じるアーティファクトと合わせて考慮されてもよい。
例示的なビデオ品質モデリングの方法100は、図1に示される。方法100において、ビデオビットストリームは、ステップ110で入力され、ビットストリームに対応するビデオシーケンスの客観的品質が推定される。ステップ120において、初期可視アーティファクトレベルは、個々のマクロブロックについて推定される。初期可視アーティファクトのレベルは、アーティファクトタイプ、フレームタイプ、およびビットストリームから得られるその他のフレームレベルまたはマクロブロックレベルの特徴から推定されてもよい。ステップ130において、初期および伝搬可視アーティファクトは共に、個々のマクロブロックに対する全体的可視アーティファクトレベルを推定するために考慮される。ステップ140において、空間−時間アーティファクトプーリングアルゴリズムは、アーティファクトをマクロブロックレベルで1つの客観的MOS(Mean Opinion Score:平均オピニオン評点)に変換するために使用されてもよく、これは入力されたビットストリームに対応するビデオシーケンスの全体的ビジュアル品質を推定する。空間−時間プーリング中、その他のアーティファクトタイプが考慮されてもよく、MOS評点をさらに正確に推定するために人間の視覚系の特性が考慮されてもよい。ステップ150において、推定されたMOSが出力される。
初期可視アーティファクトレベル推定(120)は、図2に示される例示の方法を使用して実行されてもよい。初期可視アーティファクトレベルを推定するため、方法はステップ121において、マクロブロックがEC MBであるかどうかを検査する。マクロブロックがEC MBではない場合、初期可視アーティファクトレベルは、たとえば、0の定数値に設定されて、初期可視アーティファクトが存在しないことを指示する。それ以外の場合、ステップ122、123、および124において、たとえば、動き大きさ(MV)、残余エネルギー(RSD)、および誤り隠蔽距離(ED)のような、EC MBのパラメータが推定される。パラメータは、図2に示される順序とは異なる順序で推定されていてもよい。たとえば高ビットレートアプリケーションのような、一部のアプリケーションにおいて、パラメータのサブセットのみが推定される必要がある。推定されたパラメータを使用し、ステップ125において、EC MBについて初期可視アーティファクトレベルが推定される。
アプリケーションが高ビットレートアプリケーションまたは低ビットレートアプリケーションのいずれとして考慮されるかは、ビデオ解像度、使用されるビデオ圧縮規格、およびターゲットアプリケーションに依存する。たとえば、ITU−T P.NBAMS(ビデオストリーミングのパフォーマンスの評価のための非侵入型ビットストリームモデル)テストプランで定義されているように、ビットレートは、以下のようにモバイルアプリケーションおよびIPTVアプリケーションについて選択される。
モバイルアプリケーション向けMPEG4およびH.264:
QCIF:32〜256kbps(非常に高いビットレート:1.5Mbps)
QVGA:100〜768kbps(非常に高いビットレート:3.5Mbps)
HVGA:150〜2000kbps(非常に高いビットレート:6Mbps)
IPTVアプリケーション向けMPEG2:
SD(PAL(576i)およびNTSC(480i)):2〜16Mbps
IPTVアプリケーション向けH.264:
1080i/p:1〜15Mbps(非常に高いビットレート:30Mbps)
720p:0.5〜15Mbps(非常に高いビットレート:30Mbps)
SD(PALおよびNTSC):0.5〜9Mbps(非常に高いビットレート:9Mbps)
特に、ITU−T P.NBAMSの場合、SDまたはHD(720pおよび1080i/p)解像度を使用するIPTVアプリケーションは、高ビットレートアプリケーションと見なされ、HVGAまたはより低い(たとえば、QVGA、QCIF)解像度を使用するモバイルアプリケーションは、低ビットレートアプリケーションと見なされる。
後段において、マクロブロックについて動き大きさを決定するステップ(122)、初期可視アーティファクトレベルを推定するステップ(125)、および全体的可視アーティファクトレベルを推定するステップ(130)がさらに詳細に説明される。
動き大きさ(MV)
EC MBは復号不可能であるので、EC MBの動きベクトルおよび残余情報は直接ビットストリームからは使用可能ではなく、したがって、動き大きさおよび残余エネルギーは推定される必要がある。
図3Bは、MB(n,i,j)およびその8つの近傍マクロブロックを伴う現在のビデオフレームnの部分を示す。図3Aは、以前のビデオフレームn−1の同じ部分を示し、図3Cは、後続のビデオフレームn+1の一部を示す。
マクロブロックの動き大きさの推定は、マクロブロックが属するフレームのフレームタイプによって異なる。EC MBがイントラフレームである場合、EC MBの動き大きさは、最も近い復号済み参照フレームの連結されたマクロブロックの動き大きさに設定されてもよい。つまり、フレームnがイントラフレームである場合、EC MB(n,i,j)の動きベクトルは、以下のように推定される。
MV(n,i,j)=MV(n−k,i,j) (3)
ただし、フレームn−kは最も近い参照フレームである。
EC MBが非イントラフレーム(たとえば、BまたはPフレーム)である場合、その4つの直近隣接近傍の使用可能な動きベクトルの中央値が、EC MBの動きベクトルを推定するため、および動き大きさを計算するために使用されてもよい。「使用可能な動きベクトル」という用語は、対応するマクロブロックが、正しく復号されており、インター予測されたマクロブロックであることを意味する。したがって、フレームnが非イントラフレームであり、すべての4つの直近近傍マクロブロックの動きベクトルが使用可能である場合、EC MB(n,i,j)の動きベクトルは、以下のように推定されうる。
MV(n,i,j)=median(MV(n,i,j−1),MV(n,i,j+1),MV(n,i−1,j),MV(n,i+1,j)) (4)
非イントラフレームのマクロブロックが使用可能な近傍動きベクトルを有していない場合、式(4)で説明される上記の動き大きさを使用することができないので、動き大きさは異なる方法で推定される必要がある。1つの例示的な実施形態において、マクロブロックが正しく復号されており、イントラマクロブロックである場合、その動きベクトルはゼロに設定される。それ以外の場合、スライス境界におけるマクロブロックの動きベクトルは、空間的に最も近いマクロブロックの動きベクトルに設定され、スライス内の内部マクロブロックの動きベクトルは、以前の参照フレームの動きベクトルに設定される。たとえば、フレームがスライスあたり1つのMB行で符号化されている場合、マクロブロックの動きベクトルは、空間的に最も近い上位マクロブロックの動きベクトルに設定される。フレームがスライスあたり1つのフレームで符号化されている場合、マクロブロックの動きベクトルは、以前の参照フレームの連結されたマクロブロックの動きベクトルに設定され、以前の参照フレームは表示順で最も近い以前復号された参照フレームとして定義される。
表1において、例示の擬似コードは、非イントラフレームのEC MBの動きベクトルがどのように導き出されうるかを示すために提供される。
非ECマクロブロックの場合、動きベクトルが使用可能である。しかし、異常な動きベクトルを回避するため、その4つの直近隣接マクロブロックおよびそれ自身の使用可能な動きベクトルの中央値は、マクロブロックの詳細化された動きベクトルとして計算されてもよく、これは後のフレームの連結されたEC MBによって使用されうる。したがって、フレームnが非イントラフレームであり、4つの直近近傍マクロブロックの動きベクトルが使用可能である場合、非EC MB(n,i,j)の詳細化された動きベクトルは、以下のように推定されうる。
MV(n,i,j)=median(MV(n,i,j−1),MV(n,i,j+1),MV(n,i,j),MV(n,i−1,j),MV(n,i+1,j)) (5)
1つの実装形態において、非EC MBの実際の動きベクトルを使用して高ビットレートアプリケーションの動き大きさを計算し、低ビットレートアプリケーションには詳細化された動きベクトルを使用する。
圧縮されたビットストリームから復号された動きベクトルは常に真の動きを反映するとは限らないので、動きベクトルを推定または詳細化する際の中央値演算は、異常な動きベクトルを回避すること、および概ね真の動きを取得することが意図される。
上記で説明される動きベクトルの推定の場合、マクロブロックあたり1つの動きベクトルがあると仮定する。方法は、マクロブロックに対して複数の動きベクトルがある場合に容易に拡張されうる。たとえば、H.264/AVCにおいて、マクロブロックはさらにブロックまたはサブブロックに分割されてもよく、インター予測フレームにはさまざまなマクロブロック分割モードがあってもよい。1つの実施形態において、インター予測マクロブロックの16の4×4ブロックに対応する16の動きベクトルが、中央値を計算するために使用される。
Bフレームのインター予測マクロブロックの場合、さまざまな予測方向を有するか、またはさまざまな予測リストを参照することができる。たとえば、Bフレームのマクロブロックは、順方向予測のみ、逆方向予測のみ、または双方向予測を使用することができる。1つのフレーム内のマクロブロックはまた、複数の参照フレームを使用するので、さまざまな参照フレームを有することができる。したがって、BフレームおよびPフレーム内の動きベクトルの意味を統一するため、動きベクトルを、参照方向および現在のフレームと参照フレームとの間の距離で正規化する。参照フレームが完全に失われた場合、距離は、失われた参照フレームの表示順序、またはPOC(Picture Order Count:ピクチャオーダーカウント)値を推論することによって計算される。たとえば、インター予測マクロブロックのブロックの場合、その復号されたMVは、以下のように正規化されうる。
ただし、MV0およびMV1はそれぞれ、順方向予測および逆方向予測の動きベクトルであり、dist0およびdist1はそれぞれ、現在のフレームとその順方向参照フレームと逆方向参照フレームの間の距離である。
初期可視アーティファクトレベル推定
上記で説明されるように、フレームnの非EC MBの場合、初期アーティファクト可視性レベルLoVAinitは、たとえば0のような、定数に設定される。
部分的に受信されたフレームのEC MBの場合、動き大きさおよび誤り隠蔽距離が通常、可視アーティファクトレベルに緊密に関連することが観察される。MVとEDの積、MV×EDが、多くの場合、隠蔽フレームから現在のフレームまでのオブジェクトの変位を反映することを、我々は観察している。一般に、値が大きくなれば、それに応じて、マクロブロックにおいて可視アーティファクトがある可能性も高くなる。
したがって、初期アーティファクト可視レベルは、動き大きさおよび誤り隠蔽距離の関数として計算されてもよい。1つの例において、LoVAinitは以下のように計算されてもよい。
ただし、
式(7)のMVが、ピクセルの単位となるように正規化されてもよいが、ビットストリームから解析された動きベクトルが、たとえばH.264/AVC準拠ビットストリームの場合の4分の1ピクセルの単位のように、分数ピクセルの単位となりうることに留意されたい。
もう1つの例示的な実施形態において、我々は、初期アーティファクトレベルの推定が、ビットレートまたはアプリケーションに適応できることに気付いた。たとえば、高ビットレートアプリケーションにおいて、
を使用することだけで、すでに正確な推定をもたらすことができる。しかし、低ビットレートアプリケーションにおいて、動き推定はあまり正確ではなく、
のみでは常に正確な推定をもたらすわけではない。低ビットレートアプリケーションの場合の正確性を高めるために、残余エネルギーが使用されてもよい。たとえば、EC MBについて、LoVAinitは以下のように計算されてもよい。
ただし、
あるいは、式(9)のmin(.)関数は、たとえば
のような他の関数で置き換えられてもよい、ただし、a、b、およびcは定数である。
1(x)について、定数は、0〜255のアーティファクトスケールで、v1=0、v2=100、S1=1ピクセル、およびS2=8ピクセルとして設定されてもよい。f2(x)について、定数は、0〜255のアーティファクトスケールで、u1=0、u2=100、T1=1ピクセル、およびT2=64として設定されてもよい。定数は、たとえば、さまざまなアプリケーションおよびアーティファクトスケールのその他の範囲をサポートするように、調整されてもよい。
参照フレームが失われた場合、マクロブロック(n,i,j)のすべての動きベクトルのスケーラ平均が計算され、MVmgntと示される。もう1つの実施形態において、失われた参照フレームを指し示す動きベクトルのスケーラ平均は、MVmgntを計算するために使用される。マクロブロックに対応する動きベクトルがない場合は、MVmgntが0に設定される。MVmgntを使用して、初期アーティファクトレベルは以下のように計算されてもよい。
もう1つの実施形態において、以下のように計算されうるspatialuniformMVが、MVmgntの代わりに使用される。
spatialuniformMVx(n,i,j)=standardvariance{mvx(n,i−1,j−1),mvx(n,i,j−1),mvx(n,i+1,j−1),mvx(n,i−1,j),mvx(n,i+1,j),mvx(n,i−1,j+1),mvx(n,i,j+1),mvx(n,i+1,j+1)}、
spatialuniformMVy(n,i,j)=standardvariance{mvy(n,i−1,j−1),mvy(n,i,j−1),mvy(n,i+1,j−1),mvy(n,i−1,j),mvy(n,i+1,j),mvy(n,i−1,j+1),mvy(n,i,j+1),mvy(n,i+1,j+1)}、
spatialuniformMV(n,i,j)=max(spatialuniformMVx(n,i,j),spatialuniformMVy(n,i,j)) (12)
さらなるもう1つの実施形態において、低ビットレートアプリケーションにMVmgntを使用し、高ビットレートアプリケーションにspatialuniformMVを使用する。
参照フレームが失われない場合、
は0に設定される。参照フレームが失われるかどうかは、ビットストリームで受信された構文要素を解析することによって決定されうる。
現在のフレームの失われたマクロブロックおよび参照フレームの損失を共に考慮して、初期可視アーティファクトレベルは以下のように計算されてもよい。
たとえば、順方向予測および逆方向予測という2つの参照ピクチャリストがある場合、マクロブロックの初期可視アーティファクトレベルは以下のように拡張されてもよい。
ただし、
および
は異なる参照ピクチャリストに対応する。式(13)および式(14)のmax(.)関数は、たとえば加重和のような他の関数で置き換えられてもよい。
上記で説明されているように、動きフィールドおよび予測残余が時間的に首尾一貫していると仮定して、以前の参照フレームからのEC MBの動きベクトルおよび残余エネルギーを推定することができる。しかし、この仮定は、EC MBがシーンカットフレームで生じる場合には、適用することができない。事実、パケット損失がシーンカットフレームで生じる場合、時間的誤り隠蔽の方法は適正に機能しなくなり、強い可視アーティファクトを生成することもある。シーンカットフレームでパケット損失が生じる場合にビジュアル品質を評価する方法は、所有者共通のPCT出願、N.Liao、Z.Chen、F.Zhang、およびK.Xieの特許文献1、名称「Video Quality Assessment Considering Scene Cut Artifacts」において開示されており、その教示は参照により本明細書に明確に組み入れられる。
全体的可視アーティファクトレベル推定
ビデオ圧縮に使用されるイントラまたはインター予測により、EC MBの初期可視アーティファクトは、その他のマクロブロックまたはその他のフレームに空間的および時間的に伝搬することができる。マクロブロックの個々のピクセルについて、マクロブロックが復号不可能であるため、および/または誤り伝搬により、可視アーティファクトが導入されうる。H.264/AVCを一例として使用して、初期アーティファクトおよび伝搬されたアーティファクトを共に考慮して全体的可視アーティファクトレベルを推定する方法を説明する。
ピクセルのアーティファクトレベルをdn,x,yと示す、ただしnはフレームインデックスであり、(x,y)はピクセルのフレーム内の座標である。dn,x,yは、最初に0に設定されてもよい。1つの実施形態において、dn,x,yは以下のように計算されてもよい。
n,x,y=min(255,max(dn-k,x’,y’,LoVAinit(n,x/16,y/16))) (15)
ただし、dn-k,x’,y’はピクセル(n,x,y)の伝搬された可視アーティファクトであり、現在のピクセルの参照ピクセル(n−k,x’,y’)におけるアーティファクトレベルとして推定されうる。つまり、アーティファクトレベルがどのように伝搬するかは、動きベクトルを通じて追跡されてもよい。計算を簡単にするため、分数ピクセル精度ではなく整数ピクセル精度で参照ピクセルにおけるアーティファクトレベルを使用することができる。式(15)で使用される定数(つまり、255および16)は、その他のアーティファクトスケールまたはブロックサイズが使用される場合に適応されてもよい。min(.)またはmax(.)関数はまた、たとえばdn-k,x’,y’およびLoVAinit(n,x/16,y/16)の積または加重和のような他の関数で置き換えられてもよい。
式(15)において、参照フレーム内のピクセル(dn-k,x’,y’)のアーティファクトレベルは、現在のフレーム内のピクセルのアーティファクトレベルを推定するために使用される。参照フレーム(たとえば、I、P、または参照Bフレーム)が完全に失われる場合、参照フレーム内のピクセルのアーティファクトレベルは使用可能ではないことがあり、推定のために隣接する使用可能な参照フレームを使用することができる。
ピクセルのアーティファクトレベルが推定された後、フレーム内の個々のマクロブロックの全体的可視アーティファクトレベルは、マクロブロック内のピクセルのアーティファクトレベルを平均化することによって推定されてもよい。
このプロセスにおいて、ピクセルアーティファクトレベルを平均化すること、および演算を切り取ることは、ある程度空間的クラスタリングの役割を果たす。
アーティファクトの知覚される強度はまた、人間の視覚系の特性に依存する。教示は参照により本明細書に明確に組み入れられる所有者共通のPCT出願、X.Gu、D.Liu、およびZ.Chenの特許文献2、名称「Perceived Video Quality Estimation Considering Visual Attention」において開示されるように、マクロブロックのアーティファクトレベルは、知覚されるアーティファクト強度をより正確に推定するために視覚感度因数で重み付けされてもよい。
マクロブロックレベルで推定されたアーティファクトレベルを所与として、空間−時間プーリングは、対数関数を使用して操作され、以下のようにビデオシーケンスのスライシングアーティファクトレベルを生成することができる。
LoVAseq=log10((ΣnLoVA(n))/Ffps+1) (17)
ただし、Ffpsはフレームレートである。次いで、式(17)から計算されるアーティファクトレベルは、たとえば、以下のような、スライシングアーティファクトに対応する品質メトリックにマップされてもよい。
ただし、C1、C2、およびC3は定数であり、これらはスライシングアーティファクトのみを有するサンプルでトレーニングされてもよい、つまり知覚的品質への符号化アーティファクトの影響がほぼゼロと等しくなる。これは、Qc(圧縮アーティファクトに対応する推定される品質)が、たとえば1つの例示的な実装形態において3.5のようなしきい値よりも大きいサンプルを選択することにより行われてもよい。
スライシングアーティファクトに対応する推定された品質Qsに基づいて、入力ビットストリームに対応するビデオシーケンスの全体的ビジュアル品質メトリックが推定されうる。たとえばフリージングアーティファクトおよび圧縮アーティファクトのような、その他のタイプのアーティファクトは、ビデオシーケンスの全体的ビジュアル品質メトリックを生成する場合に考慮されてもよい。
本発明の原理は、ビデオ品質を測定するためにビデオ品質モニターにおいて使用されてもよい。図4は、例示のビデオ品質モニター400を示すブロック図である。装置400の入力は、ビットストリームを含むトランスポートストリームを含むことができる。入力は、ビットストリームを含むその他のフォーマットであってもよい。
デマルチプレクサ410は、たとえばパケットの数、バイトの数、およびフレームサイズのような、パケットレイヤ情報をビットストリームから取得する。復号器420は、入力ストリームを解析して、たとえば、フレームタイプ、予測残余、および動きベクトルのような、さらに多くの情報を取得する。復号器420は、ピクチャを再構築することも、再構築しないこともある。その他の実施形態において、復号器は、デマルチプレクサの機能を実行することができる。
復号された情報を使用して、たとえば、動き大きさ、残余エネルギー、および誤り隠蔽距離のような、アーティファクトレベル推定に必要とされるパラメータが、パラメータ推定器430において推定される。推定されたパラメータに基づいて、個々のマクロブロックに対する初期可視アーティファクトレベルが、たとえば方法120を使用して、初期可視アーティファクトレベル推定器440において推定される。初期アーティファクトおよび誤り伝搬を考慮して、個々のマクロブロックに対する全体的アーティファクトレベルが、全体的アーティファクトレベル推定器450において推定される。次いで、品質予測器460は、マクロブロックレベルのアーティファクトレベルを品質評点にプールする。品質予測器460は、アーティファクトのその他のタイプおよび人間の視覚特性を考慮することができる。
ビデオ品質モニター400は、たとえばITU−T P.NBAMS規格において使用されてもよく、この規格は、2つのアプリケーションシナリオ、つまりそれぞれHBRシナリオおよびLBRシナリオとも称される、IPTVおよびモバイルビデオストリーミングにおいてビデオ品質評価モデルに取り組むものである。2つのシナリオの相違は、ビデオコンテンツの空間−時間解像度および符号化構成からトランスポートプロトコルおよび表示条件まで多岐にわたる。
P.NBAMS VQM(ビデオ品質モデル)への入力は、すべての送信パケットヘッダ(UDP/IP/RTPまたはUDP/IP/RTP/TS)を伴う符号化ビデオビットストリームである。出力は、客観的なMOS評点である。ビデオ品質をモニターするためにセットトップボックス(STB)またはゲートウェイに組み込まれることは、P.NBAMS機能の主要なターゲットアプリケーションである。P.NBAMSモード1モデルでは、H.264構文を解析することによってビットストリーム情報を使用するのみであり、モード2モデルでは、ビデオシーケンスの一部または全部を復号することができ、ピクセル情報は、予測精度を高めるためにビットストリーム情報を解析することに加えてビジュアル品質予測のために使用される。
図5を参照すると、上記で説明される特徴および原理が適用されうるビデオ送信システムまたは装置500が示される。プロセッサ505はビデオを処理し、符号化器510はビデオを符号化する。符号化器から生成されたビットストリームは、分散ネットワーク520を通じて復号器530に送信される。ビデオ品質モニターは、さまざまな段階において使用されてもよい。
1つの実施形態において、ビデオ品質モニター540は、コンテンツクリエイターによって使用されてもよい。たとえば、推定されるビデオ品質は、モード決定またはビットレート割り振りのような符号化パラメータを決定する際に符号化器によって使用されてもよい。もう1つの例において、ビデオが符号化された後、コンテンツクリエイターは、ビデオ品質モニターを使用して、符号化されたビデオの品質をモニターする。品質メトリックが事前定義の品質レベルを満たさない場合、コンテンツクリエイターは、ビデオ品質を高めるためにビデオを再符号化するように選択することができる。コンテンツクリエイターはまた、品質に基づいて符号化されたビデオをランク付けすることもでき、それに応じてコンテンツに課金する。
もう1つの実施形態において、ビデオ品質モニター550は、コンテンツディストリビューターによって使用されてもよい。ビデオ品質モニターは、流通ネットワークに配置されてもよい。ビデオ品質モニターは、品質メトリックを計算し、それらをコンテンツディストリビューターにレポートする。ビデオ品質モニターからのフィードバックに基づいて、コンテンツディストリビューターは、帯域幅割り振りおよびアクセス制御を調整することによってそのサービスを向上させることができる。
コンテンツディストリビューターはまた、符号化を調整するためにフィードバックをコンテンツクリエイターに送信することができる。高品質の符号化ビデオが通常はより多くの帯域幅を必要とし、送信保護に使用できる帯域幅を少なくしてしまうので、符号化器において符号化品質を向上させることが、必ずしも復号器側において品質を向上させることにはならないことに留意されたい。したがって、復号器において最適な品質に達するには、符号化ビットレートとチャネル保護のための帯域幅とのバランスが考慮される必要がある。
もう1つの実施形態において、ビデオ品質モニター560は、ユーザデバイスによって使用されてもよい。たとえば、ユーザデバイスがインターネットでビデオを検索する場合、検索結果は、要求されたビデオコンテンツに対応する多くのビデオまたはビデオへの多くのリンクを返すことができる。検索結果のビデオは、さまざまな品質レベルを有することができる。ビデオ品質モニターは、これらのビデオについて品質メトリックを計算し、どのビデオを格納するかを選択するように決定することができる。もう1つの例において、ユーザデバイスは、複数の誤り隠蔽技法にアクセスすることができる。ビデオ品質モニターは、さまざまな誤り隠蔽技法について品質メトリックを計算し、計算された品質メトリックに基づいてどの隠蔽技法を使用するかを自動的に選択することができる。
本明細書において説明される実装形態は、たとえば、方法、またはプロセス、装置、ソフトウェアプログラム、データストリーム、または信号において実施されてもよい。たとえ、(たとえば、方法として説明されているだけなど)単一の実装形態の形式のコンテキストにおいて説明されているだけであっても、説明される特徴の実装形態はまた、その他の形式(たとえば、装置またはプログラム)において実施されてもよい。装置は、たとえば、適切なハードウェア、ソフトウェア、およびファームウェアにおいて実施されてもよい。たとえば方法は、たとえば一般にコンピュータ、マイクロプロセッサ、集積回路、またはプログラマブル論理デバイスを含む処理デバイスを示す、たとえばプロセッサなどの装置において実施されてもよい。プロセッサはまた、たとえば、コンピュータ、携帯電話、ポータブル/携帯情報端末(「PDA」)、およびエンドユーザ間の情報の通信を容易にするその他のデバイスなどの、通信デバイスを含む。
本発明の原理の「1つの実施形態(one embodiment)」もしくは「実施形態(an embodiment)」または「1つの実装形態(one implementation)」もしくは「実装形態(an implementation)」、ならびにその他のその変形は、実施形態に関連して説明される特定の特徴、構造、特性などが、本発明の原理の少なくとも1つの実施形態に含まれることを意味する。したがって、本明細書全体を通じてさまざまな箇所に出現する、語句「1つの実施態様において」もしくは「実施態様において」または「1つの実装形態において」もしくは「実装形態において」、ならびに任意のその他の変形の出現は、必ずしもすべてが同一の実施形態を示すものではない。
加えて、この出願またはその特許請求の範囲は、さまざまな情報を「決定すること」について言及することがある。情報を決定することは、たとえば、情報を推定すること、情報を計算すること、情報を予測すること、またはメモリから情報を取り出すことのうちの1または複数を含むことができる。
さらに、この出願またはその特許請求の範囲は、さまざまな情報に「アクセスすること」について言及することがある。情報にアクセスすることは、たとえば、情報を受信すること、情報を(たとえばメモリから)取り出すこと、情報を格納すること、情報を処理すること、情報を送信すること、情報を移動すること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を決定すること、情報を予測すること、または情報を推定することのうちの1または複数を含むことができる。
加えて、この出願またはその特許請求の範囲は、さまざまな情報を「受信すること」について言及することがある。受信することは、「アクセスすること」の場合と同様に、広義な用語であることが企図される。情報を受信することは、たとえば、情報にアクセスすること、または情報を(たとえばメモリから)取り出すことのうちの1または複数を含むことができる。さらに、「受信すること」は通常、たとえば、情報を格納する、情報を処理する、情報を送信する、情報を移動する、情報をコピーする、情報を消去する、情報を計算する、情報を決定する、情報を予測する、または情報を推定するなどのような操作中に、さまざまな方法で関与する。
当業者には明らかであろうように、実装形態は、たとえば、格納または送信されうる情報を搬送するためにフォーマットされたさまざまな信号を生成することができる。情報は、たとえば、方法を実行するための命令、または説明される実装形態の1つによって生成されるデータを含むことができる。たとえば、信号は、説明される実施形態のビットストリームを搬送するためにフォーマットされてもよい。そのような信号は、たとえば、(たとえば、スペクトルの無線周波数部分を使用する)電磁波として、またはベースバンド信号として、フォーマットされてもよい。フォーマットすることは、たとえば、データストリームを符号化すること、および符号化されたデータストリームで搬送波を変調することを含むことができる。信号が搬送する情報は、たとえば、アナログまたはディジタル情報であってもよい。信号は、周知のように、多種多様な有線または無線リンクを介して送信されてもよい。信号は、プロセッサ可読媒体に格納されてもよい。
当業者には明らかであろうように、実装形態は、たとえば、格納または送信されうる情報を搬送するためにフォーマットされたさまざまな信号を生成することができる。情報は、たとえば、方法を実行するための命令、または説明される実装形態の1つによって生成されるデータを含むことができる。たとえば、信号は、説明される実施形態のビットストリームを搬送するためにフォーマットされてもよい。そのような信号は、たとえば、(たとえば、スペクトルの無線周波数部分を使用する)電磁波として、またはベースバンド信号として、フォーマットされてもよい。フォーマットすることは、たとえば、データストリームを符号化すること、および符号化されたデータストリームで搬送波を変調することを含むことができる。信号が搬送する情報は、たとえば、アナログまたはディジタル情報であってもよい。信号は、周知のように、多種多様な有線または無線リンクを介して送信されてもよい。信号は、プロセッサ可読媒体に格納されてもよい。
本発明は以下の態様を含む。
(付記1)
ビットストリームにより表されるビデオシーケンスのビジュアル品質を推定するための方法であって、スライシングモード誤り隠蔽が前記ビデオシーケンスの復号不可能ブロックを隠蔽するために使用される方法において、
復号不可能である、前記ビデオシーケンスのフレーム内のブロックの動き大きさを推定するステップ(122)と、
前記フレームと前記ブロックを隠蔽するために使用される別のフレームとの間の距離を決定するステップ(124)と、
前記動き大きさおよび前記距離に応じて前記ビデオシーケンスの前記ビジュアル品質を推定するステップ(130、140)と、
を含む、前記方法。
(付記2)
前記動き大きさおよび前記距離に応じて初期可視アーティファクトレベルを決定するステップ(125)であって、前記ビデオシーケンスの前記ビジュアル品質は前記初期可視アーティファクトレベルに応じて推定される前記ステップをさらに含む、付記1に記載の方法。
(付記3)
前記初期可視アーティファクトレベルは、前記動き大きさおよび前記距離の積に対応する、付記2に記載の方法。
(付記4)
前記ブロックの残余エネルギーを推定するステップ(123)であって、前記初期可視アーティファクトレベルは前記残余エネルギーにさらに応じて決定される前記ステップをさらに含む、付記2に記載の方法。
(付記5)
前記初期可視アーティファクトレベルは、前記動き大きさおよび前記距離の関数および前記残余エネルギーの別の関数のうちの小さい方に応じて決定される、付記4に記載の方法。
(付記6)
前記決定するステップは、高ビットレートアプリケーションの場合には前記動き大きさおよび前記距離の関数のみに対応し、低ビットレートアプリケーションの場合には前記動き大きさおよび前記距離の前記関数と前記残余エネルギーの別の関数の両方に対応する、付記4に記載の方法。
(付記7)
前記ブロックの参照ブロックとして使用される別のブロック内のピクセルのアーティファクトレベルに応じて、前記ブロック内のピクセルの伝搬済み可視アーティファクトを決定するステップと、
前記ブロック内の前記ピクセルの前記伝搬済み可視アーティファクトレベルに応じて前記ブロック内の前記ピクセルのアーティファクトレベルを決定するステップ(130)と、
前記ブロック内の前記ピクセルの前記アーティファクトレベルに応じて前記ブロックの全体的可視アーティファクトレベルを推定するステップ(130)であって、前記ビデオシーケンスの前記ビジュアル品質は、前記ブロックの前記全体的可視アーティファクトレベルに応じて推定される前記ステップとをさらに含む、付記1に記載の方法。
(付記8)
前記ブロックの前記全体的可視アーティファクトレベルは、前記ブロック内のピクセルのアーティファクトレベルの平均に応じて推定される、付記7に記載の方法。
(付記9)
前記動き大きさおよび前記距離に応じて初期可視アーティファクトレベルを決定するステップ(125)であって、前記ブロック内の前記ピクセルの前記アーティファクトレベルを決定する前記ステップは前記ブロックの前記初期可視アーティファクトレベルにさらに応じる前記ステップをさらに含む、付記7に記載の方法。
(付記10)
前記ブロック内の前記ピクセルの前記アーティファクトレベルは、前記初期可視アーティファクトレベルおよび前記伝搬済み可視アーティファクトレベルのうちの大きい方に応じて決定される、付記9に記載の方法。
(付記11)
前記ビジュアル品質はビットストリームレベルで推定される、付記1に記載の方法。
(付記12)
ビットストリームにより表されるビデオシーケンスのビジュアル品質を推定するための装置であって、スライシングモード誤り隠蔽が前記ビデオシーケンスの復号不可能ブロックを隠蔽するために使用される装置において、
前記ビデオシーケンスのフレーム内の復号不可能ブロックの動き大きさを推定し、前記フレームと前記復号不可能ブロックを隠蔽するために使用される別のフレームとの間の距離を推定するパラメータ推定器(430)と、
前記動き大きさおよび前記距離に応じて前記ビデオシーケンスの前記ビジュアル品質を推定する品質予測器(460)と、
を含む、前記装置。
(付記13)
前記動き大きさおよび前記距離に応じて初期可視アーティファクトレベルを決定する初期可視アーティファクトレベル推定器(440)であって、前記品質予測器(460)は前記初期可視アーティファクトレベルに応じて前記ビデオシーケンスの前記ビジュアル品質を推定する前記推定器をさらに含む、付記12に記載の装置。
(付記14)
前記初期可視アーティファクトレベル推定器(440)は、前記動き大きさおよび前記距離の積に応じて前記初期可視アーティファクトレベルを決定する、付記13に記載の装置。
(付記15)
前記パラメータ推定器(430)は、前記ブロックの残余エネルギーをさらに推定し、前記初期可視アーティファクトレベル推定器(440)は、前記残余エネルギーにさらに応じて前記初期可視アーティファクトレベルを決定する、付記13に記載の装置。
(付記16)
前記初期可視アーティファクトレベル推定器(440)は、前記動き大きさおよび前記距離の関数および前記残余エネルギーの別の関数のうちの小さい方に応じて前記初期可視アーティファクトレベルを決定する、付記15に記載の装置。
(付記17)
前記初期可視アーティファクトレベル推定器(440)は、高ビットレートアプリケーションの場合には前記動き大きさおよび前記距離の関数のみに対応し、低ビットレートアプリケーションの場合には前記動き大きさおよび前記距離の前記関数と前記残余エネルギーの別の関数の両方に対応して前記初期可視アーティファクトレベルを決定する、付記15に記載の装置。
(付記18)
前記ブロックの参照ブロックとして使用される別のブロック内のピクセルのアーティファクトレベルに応じて、前記ブロック内のピクセルの伝搬済み可視アーティファクトレベルを決定し、前記ブロック内のピクセルの前記伝搬済み可視アーティファクトレベルに応じて前記ブロック内の前記ピクセルのアーティファクトレベルを決定し、前記ブロック内の前記ピクセルの前記アーティファクトレベルに応じて前記ブロックの全体的可視アーティファクトレベルを推定する、全体的アーティファクトレベル推定器(450)をさらに含む、付記12に記載の装置。
(付記19)
前記全体的アーティファクトレベル推定器(450)は、前記ブロック内のピクセルのアーティファクトレベルの平均に応じて前記ブロックの前記全体的可視アーティファクトレベルを推定する、付記18に記載の装置。
(付記20)
前記動き大きさおよび前記距離に応じて初期可視アーティファクトレベルを決定する初期可視アーティファクトレベル推定器(440)であって、前記全体的アーティファクトレベル推定器(450)は前記ブロックの前記初期可視アーティファクトレベルにさらに応じて前記ブロック内の前記ピクセルの前記アーティファクトレベルを決定する前記推定器をさらに含む、付記18に記載の装置。
(付記21)
前記全体的アーティファクトレベル推定器(450)は、前記初期可視アーティファクトレベルおよび前記伝搬済み可視アーティファクトレベルのうちの大きい方に応じて前記ブロック内の前記ピクセルの前記アーティファクトレベルを決定する、付記20に記載の装置。
(付記22)
前記ビジュアル品質はビットストリームレベルで推定される、付記12に記載の装置。
(付記23)
付記1乃至11に従って、ビットストリームにより表されるビデオシーケンスのビジュアル品質を推定するための命令を格納したコンピュータ可読記憶媒体であって、スライシングモード誤り隠蔽が前記ビデオシーケンスの復号不可能ブロックを隠蔽するために使用される、前記コンピュータ可読記憶媒体。

Claims (23)

  1. ビットストリームにより表されるビデオシーケンスのビジュアル品質を推定するための方法であって、スライシングモード誤り隠蔽が前記ビデオシーケンスの復号不可能ブロックを隠蔽するために使用される方法において、
    復号不可能である、前記ビデオシーケンスのフレーム内のブロックの動き大きさを推定するステップ(122)と、
    前記フレームと前記ブロックを隠蔽するために使用される別のフレームとの間の距離を決定するステップ(124)と、
    前記動き大きさおよび前記距離に応じて前記ビデオシーケンスの前記ビジュアル品質を推定するステップ(130、140)と、
    を含む、前記方法。
  2. 前記動き大きさおよび前記距離に応じて初期可視アーティファクトレベルを決定するステップ(125)であって、前記ビデオシーケンスの前記ビジュアル品質は前記初期可視アーティファクトレベルに応じて推定される前記ステップをさらに含む、請求項1に記載の方法。
  3. 前記初期可視アーティファクトレベルは、前記動き大きさおよび前記距離の積に対応する、請求項2に記載の方法。
  4. 前記ブロックの残余エネルギーを推定するステップ(123)であって、前記初期可視アーティファクトレベルは前記残余エネルギーにさらに応じて決定される前記ステップをさらに含む、請求項2に記載の方法。
  5. 前記初期可視アーティファクトレベルは、前記動き大きさおよび前記距離の関数および前記残余エネルギーの別の関数のうちの小さい方に応じて決定される、請求項4に記載の方法。
  6. 前記決定するステップは、高ビットレートアプリケーションの場合には前記動き大きさおよび前記距離の関数のみに対応し、低ビットレートアプリケーションの場合には前記動き大きさおよび前記距離の前記関数と前記残余エネルギーの別の関数の両方に対応する、請求項4に記載の方法。
  7. 前記ブロックの参照ブロックとして使用される別のブロック内のピクセルのアーティファクトレベルに応じて、前記ブロック内のピクセルの伝搬済み可視アーティファクトを決定するステップと、
    前記ブロック内の前記ピクセルの前記伝搬済み可視アーティファクトレベルに応じて前記ブロック内の前記ピクセルのアーティファクトレベルを決定するステップ(130)と、
    前記ブロック内の前記ピクセルの前記アーティファクトレベルに応じて前記ブロックの全体的可視アーティファクトレベルを推定するステップ(130)であって、前記ビデオシーケンスの前記ビジュアル品質は、前記ブロックの前記全体的可視アーティファクトレベルに応じて推定される前記ステップとをさらに含む、請求項1に記載の方法。
  8. 前記ブロックの前記全体的可視アーティファクトレベルは、前記ブロック内のピクセルのアーティファクトレベルの平均に応じて推定される、請求項7に記載の方法。
  9. 前記動き大きさおよび前記距離に応じて初期可視アーティファクトレベルを決定するステップ(125)であって、前記ブロック内の前記ピクセルの前記アーティファクトレベルを決定する前記ステップは前記ブロックの前記初期可視アーティファクトレベルにさらに応じる前記ステップをさらに含む、請求項7に記載の方法。
  10. 前記ブロック内の前記ピクセルの前記アーティファクトレベルは、前記初期可視アーティファクトレベルおよび前記伝搬済み可視アーティファクトレベルのうちの大きい方に応じて決定される、請求項9に記載の方法。
  11. 前記ビジュアル品質はビットストリームレベルで推定される、請求項1に記載の方法。
  12. ビットストリームにより表されるビデオシーケンスのビジュアル品質を推定するための装置であって、スライシングモード誤り隠蔽が前記ビデオシーケンスの復号不可能ブロックを隠蔽するために使用される装置において、
    前記ビデオシーケンスのフレーム内の復号不可能ブロックの動き大きさを推定し、前記フレームと前記復号不可能ブロックを隠蔽するために使用される別のフレームとの間の距離を推定するパラメータ推定器(430)と、
    前記動き大きさおよび前記距離に応じて前記ビデオシーケンスの前記ビジュアル品質を推定する品質予測器(460)と、
    を含む、前記装置。
  13. 前記動き大きさおよび前記距離に応じて初期可視アーティファクトレベルを決定する初期可視アーティファクトレベル推定器(440)であって、前記品質予測器(460)は前記初期可視アーティファクトレベルに応じて前記ビデオシーケンスの前記ビジュアル品質を推定する前記推定器をさらに含む、請求項12に記載の装置。
  14. 前記初期可視アーティファクトレベル推定器(440)は、前記動き大きさおよび前記距離の積に応じて前記初期可視アーティファクトレベルを決定する、請求項13に記載の装置。
  15. 前記パラメータ推定器(430)は、前記ブロックの残余エネルギーをさらに推定し、前記初期可視アーティファクトレベル推定器(440)は、前記残余エネルギーにさらに応じて前記初期可視アーティファクトレベルを決定する、請求項13に記載の装置。
  16. 前記初期可視アーティファクトレベル推定器(440)は、前記動き大きさおよび前記距離の関数および前記残余エネルギーの別の関数のうちの小さい方に応じて前記初期可視アーティファクトレベルを決定する、請求項15に記載の装置。
  17. 前記初期可視アーティファクトレベル推定器(440)は、高ビットレートアプリケーションの場合には前記動き大きさおよび前記距離の関数のみに対応し、低ビットレートアプリケーションの場合には前記動き大きさおよび前記距離の前記関数と前記残余エネルギーの別の関数の両方に対応して前記初期可視アーティファクトレベルを決定する、請求項15に記載の装置。
  18. 前記ブロックの参照ブロックとして使用される別のブロック内のピクセルのアーティファクトレベルに応じて、前記ブロック内のピクセルの伝搬済み可視アーティファクトレベルを決定し、前記ブロック内のピクセルの前記伝搬済み可視アーティファクトレベルに応じて前記ブロック内の前記ピクセルのアーティファクトレベルを決定し、前記ブロック内の前記ピクセルの前記アーティファクトレベルに応じて前記ブロックの全体的可視アーティファクトレベルを推定する、全体的アーティファクトレベル推定器(450)をさらに含む、請求項12に記載の装置。
  19. 前記全体的アーティファクトレベル推定器(450)は、前記ブロック内のピクセルのアーティファクトレベルの平均に応じて前記ブロックの前記全体的可視アーティファクトレベルを推定する、請求項18に記載の装置。
  20. 前記動き大きさおよび前記距離に応じて初期可視アーティファクトレベルを決定する初期可視アーティファクトレベル推定器(440)であって、前記全体的アーティファクトレベル推定器(450)は前記ブロックの前記初期可視アーティファクトレベルにさらに応じて前記ブロック内の前記ピクセルの前記アーティファクトレベルを決定する前記推定器をさらに含む、請求項18に記載の装置。
  21. 前記全体的アーティファクトレベル推定器(450)は、前記初期可視アーティファクトレベルおよび前記伝搬済み可視アーティファクトレベルのうちの大きい方に応じて前記ブロック内の前記ピクセルの前記アーティファクトレベルを決定する、請求項20に記載の装置。
  22. 前記ビジュアル品質はビットストリームレベルで推定される、請求項12に記載の装置。
  23. 請求項1乃至11に従って、ビットストリームにより表されるビデオシーケンスのビジュアル品質を推定するための命令を格納したコンピュータ可読記憶媒体であって、スライシングモード誤り隠蔽が前記ビデオシーケンスの復号不可能ブロックを隠蔽するために使用される、前記コンピュータ可読記憶媒体。
JP2015521927A 2012-07-17 2012-07-17 ビットストリームレベルにおけるビデオ品質評価 Ceased JP2015528247A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2012/078766 WO2014012219A1 (en) 2012-07-17 2012-07-17 Video quality assessment at a bitstream level

Publications (1)

Publication Number Publication Date
JP2015528247A true JP2015528247A (ja) 2015-09-24

Family

ID=49948163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015521927A Ceased JP2015528247A (ja) 2012-07-17 2012-07-17 ビットストリームレベルにおけるビデオ品質評価

Country Status (9)

Country Link
US (1) US9769501B2 (ja)
EP (1) EP2875640B1 (ja)
JP (1) JP2015528247A (ja)
KR (1) KR20150034723A (ja)
CN (1) CN104396238B (ja)
AU (1) AU2012385919B2 (ja)
BR (1) BR112014031122A2 (ja)
HK (1) HK1210891A1 (ja)
WO (1) WO2014012219A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2954676A4 (en) 2013-02-07 2016-07-13 Thomson Licensing METHOD AND DEVICE FOR CONTEXT-BASED VIDEO QUALITY ASSIGNMENT
JP2016510567A (ja) 2013-02-07 2016-04-07 トムソン ライセンシングThomson Licensing コンテキスト・ベースのビデオ品質評価のための方法および装置
US10085015B1 (en) * 2017-02-14 2018-09-25 Zpeg, Inc. Method and system for measuring visual quality of a video sequence
CN108629237B (zh) * 2017-03-21 2021-11-05 中山大学 基于h.264/avc加密视频的运动异常检测方法
CN109151612B (zh) 2017-06-27 2020-10-16 华为技术有限公司 一种视频传输方法、设备及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007527664A (ja) * 2004-02-12 2007-09-27 ノキア コーポレイション 分類されたメディア経験の質
JP2008301026A (ja) * 2007-05-30 2008-12-11 Nippon Telegr & Teleph Corp <Ntt> 映像品質推定方法、装置、およびプログラム
WO2012076203A1 (en) * 2010-12-10 2012-06-14 Deutsche Telekom Ag Method and apparatus for objective video quality assessment based on continuous estimates of packet loss visibility

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100587280B1 (ko) * 1999-01-12 2006-06-08 엘지전자 주식회사 오류 은폐방법
US7023471B2 (en) 2001-10-31 2006-04-04 Intel Corporation Video quality assessment with test video sequences
US20060192850A1 (en) * 2004-04-22 2006-08-31 Koninklijke Philips Electronics N.V. Method of and system to set an output quality of a media frame
US7738561B2 (en) * 2004-11-16 2010-06-15 Industrial Technology Research Institute MPEG-4 streaming system with adaptive error concealment
US7660354B2 (en) * 2005-05-11 2010-02-09 Fang Shi Temporal error concealment for bi-directionally predicted frames
KR100646233B1 (ko) * 2005-05-30 2006-11-23 연세대학교 산학협력단 코덱 보조정보를 이용한 동영상 화질 평가 시스템 및 방법
US8879635B2 (en) * 2005-09-27 2014-11-04 Qualcomm Incorporated Methods and device for data alignment with time domain boundary
WO2007040889A2 (en) * 2005-09-29 2007-04-12 Thomson Licensing Method and apparatus for motion projection error concealment in block-based video
US9210447B2 (en) 2005-12-07 2015-12-08 Thomson Licensing Llc Method and apparatus for video error concealment using reference frame selection rules
CN105049894B (zh) * 2005-12-08 2018-03-16 维德约股份有限公司 用于视频通信系统中的差错弹性和随机接入的系统和方法
US8315466B2 (en) * 2006-12-22 2012-11-20 Qualcomm Incorporated Decoder-side region of interest video processing
US8660175B2 (en) * 2007-12-10 2014-02-25 Qualcomm Incorporated Selective display of interpolated or extrapolated video units
US9357233B2 (en) * 2008-02-26 2016-05-31 Qualcomm Incorporated Video decoder error handling
US8902996B2 (en) * 2008-02-26 2014-12-02 Richwave Technology Corp. Adaptive wireless video transmission systems and methods
US20090300692A1 (en) * 2008-06-02 2009-12-03 Mavlankar Aditya A Systems and methods for video streaming and display
EP2286595A1 (en) * 2008-06-16 2011-02-23 Dolby Laboratories Licensing Corporation Rate control model adaptation based on slice dependencies for video coding
WO2010011295A1 (en) 2008-07-22 2010-01-28 Thomson Licensing Methods for error concealment due to enhancement layer packet loss in scalable video coding (svc) decoding
KR100938211B1 (ko) * 2008-08-29 2010-01-22 성균관대학교산학협력단 동영상 화질 평가 시스템 및 방법
US8743970B2 (en) * 2009-04-13 2014-06-03 Freescale Semiconductor, Inc. Video decoding with error detection and concealment
KR101216329B1 (ko) * 2009-12-16 2012-12-27 한국전자통신연구원 복수 계층 영상의 품질 측정 방법 및 시스템
EP2362674A1 (en) * 2010-02-23 2011-08-31 Thomson Licensing Method for evaluating video quality
US20120033741A1 (en) * 2010-08-03 2012-02-09 Canon Kabushiki Kaisha Decoding of a digital signal comprising at least one sample
EP2783512A4 (en) * 2011-11-24 2016-06-15 Thomson Licensing MEASURING VIDEO QUALITY
EP2954676A4 (en) * 2013-02-07 2016-07-13 Thomson Licensing METHOD AND DEVICE FOR CONTEXT-BASED VIDEO QUALITY ASSIGNMENT
JP2016510567A (ja) * 2013-02-07 2016-04-07 トムソン ライセンシングThomson Licensing コンテキスト・ベースのビデオ品質評価のための方法および装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007527664A (ja) * 2004-02-12 2007-09-27 ノキア コーポレイション 分類されたメディア経験の質
JP2008301026A (ja) * 2007-05-30 2008-12-11 Nippon Telegr & Teleph Corp <Ntt> 映像品質推定方法、装置、およびプログラム
WO2012076203A1 (en) * 2010-12-10 2012-06-14 Deutsche Telekom Ag Method and apparatus for objective video quality assessment based on continuous estimates of packet loss visibility

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6016019355; Ting-Lan Lin,et.al.: 'A Versatile Model for Packet Loss Visibility and its Application to Packet Prioritization' IEEE TRANSACTIONS ON IMAGE PROCESSING VOL.19, NO.3, MARCH,2010, 20100301, pp722-735, IEEE *

Also Published As

Publication number Publication date
CN104396238B (zh) 2016-12-28
EP2875640B1 (en) 2017-11-08
US20150222932A1 (en) 2015-08-06
EP2875640A4 (en) 2016-03-02
CN104396238A (zh) 2015-03-04
US9769501B2 (en) 2017-09-19
AU2012385919B2 (en) 2016-10-20
WO2014012219A1 (en) 2014-01-23
AU2012385919A1 (en) 2014-12-04
BR112014031122A2 (pt) 2017-06-27
KR20150034723A (ko) 2015-04-03
EP2875640A1 (en) 2015-05-27
HK1210891A1 (en) 2016-05-06

Similar Documents

Publication Publication Date Title
US10075710B2 (en) Video quality measurement
JP5981561B2 (ja) シーンカットアーチファクトを考慮するビデオ品質評価
WO2014117049A1 (en) Adapting robustness in video coding
EP2875640B1 (en) Video quality assessment at a bitstream level
US9723301B2 (en) Method and apparatus for context-based video quality assessment
JP2015530807A (ja) ビデオ品質評価のためにコンテンツ複雑性を推定する方法および装置
US9716881B2 (en) Method and apparatus for context-based video quality assessment
WO2014198062A1 (en) Method and apparatus for video quality measurement
US20150170350A1 (en) Method And Apparatus For Estimating Motion Homogeneity For Video Quality Assessment

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150717

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150717

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20160114

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20160114

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20160114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160601

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20160603

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20160610

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160824

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170228

A045 Written measure of dismissal of application

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20170627