JP6009578B2 - 映像ビットストリーム内の品質欠陥を検知するための方法及び装置 - Google Patents

映像ビットストリーム内の品質欠陥を検知するための方法及び装置 Download PDF

Info

Publication number
JP6009578B2
JP6009578B2 JP2014545112A JP2014545112A JP6009578B2 JP 6009578 B2 JP6009578 B2 JP 6009578B2 JP 2014545112 A JP2014545112 A JP 2014545112A JP 2014545112 A JP2014545112 A JP 2014545112A JP 6009578 B2 JP6009578 B2 JP 6009578B2
Authority
JP
Japan
Prior art keywords
picture
quality
quantization parameter
video
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014545112A
Other languages
English (en)
Other versions
JP2015503293A5 (ja
JP2015503293A (ja
Inventor
マルティン ペッテション,
マルティン ペッテション,
サヴァス アルギロプーロ,
サヴァス アルギロプーロ,
Original Assignee
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
ドイッチェ テレコム アーゲー
ドイッチェ テレコム アーゲー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エルエム エリクソン(パブル), テレフオンアクチーボラゲット エルエム エリクソン(パブル), ドイッチェ テレコム アーゲー, ドイッチェ テレコム アーゲー filed Critical テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Publication of JP2015503293A publication Critical patent/JP2015503293A/ja
Publication of JP2015503293A5 publication Critical patent/JP2015503293A5/ja
Application granted granted Critical
Publication of JP6009578B2 publication Critical patent/JP6009578B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/04Diagnosis, testing or measuring for television systems or their details for receivers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/004Diagnosis, testing or measuring for television systems or their details for digital television systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

本出願は、映像シーケンス内の品質欠陥を検知するための方法;映像シーケンス内の品質欠陥を検知するための装置;及びコンピュータ可読媒体に関する。
ブロックベースの符号化は、JCT−VCで開発されている、H.263、MPEG−4 Visual、MPEG−4 AVC(H.264として公知である)及び新たに登場したHEVC/H.265規格等のコーデック規格を用いた、支配的な映像符号化技術である。これらのコーデックは、(異なる種類の予測を採用している)異なる種類のピクチャを用いて、可能な限り効率的に映像を圧縮する。イントラ符号化ピクチャ(Iピクチャ)は、ピクチャ内の区分からしか空間的に予測できない。予測ピクチャ(Pピクチャ)は、前に符号化されたIピクチャ又はPピクチャから予測される。双方向予測ピクチャ(Bピクチャ)は、先行するピクチャ及び/又は後続のピクチャから予測される。
他のピクチャから特定のピクチャを予測した結果は、特定のピクチャのオリジナル版とは異なる結果をもたらす傾向にある。ピクチャの予測とオリジナルのピクチャとの間の差異は、ピクチャの残差データと呼ばれる。残差データは、オリジナルピクチャを正確に再構築できるように予測命令と併せて伝達又は記憶される。残差データをより小さくするために、データを周波数領域に変換する。この目的のために、H.264/AVCでは、アダマール変換及び離散コサイン変換等の変換が、4×4又は2×2(クロマ)ブロックに対して用いられる。残差が変換されると、伝達又は記憶するべきデータを制限するために、変換データに対して量子化が実行される。実際の不可逆的圧縮が行われるのは、このステップにおいてである。量子化のレベルは、量子化パラメータ(QP)及び対応するルックアップテーブルによって判定される。QPは、ピクチャレベルで設定されるが、マクロブロック(MB)レベルで設定されてもよい。
より高いQPは、残差データがより粗く量子化されることを意味し、従って、キャプチャされる残差データがより詳細でなくなり、再構築ピクチャとオリジナルピクチャとの一致がより低下する。より低いQPは、比較的詳細な残差データがキャプチャされ、再構築ピクチャはオリジナルピクチャとよく一致することを意味する。
エンコーダがQPをMBレベルで変更するには、かなり多くのビットを消費するため、QPにおける大半の変化はピクチャ間で発生する。量子化を実行する際、量子化された変換後の残差は、エントロピー符号化によって符号化される。H.264/AVCでは、エントロピー符号化アルゴリズムの一つ、即ちCAVLC(コンテキスト適応的可変長符号化)又はCABAC(コンテキスト適応的二値算術符号化)がこれに用いられる。
エラーを引き起こしやすいネットワークにおいてエラー復元力を上昇させるために、Iピクチャは通常、周期的に映像を更新するために挿入される。Iピクチャは、ランダムなアクセス及びチャネル切換えの目的でも周期的に挿入される。強制的なイントラピクチャをどの時点に挿入するべきかは、映像符号化規格では定義されておらず、その判定はエンコーダが担っている。典型的には、映像符号化規格は、映像ビットストリーム構文及び復号化処理を定義するが、符号化処理は定義しない。言い換えると、映像シーケンスを符号化する方法は規格化されていないが、その一方で符号化処理の出力は規格化されているということである。
固定及び移動通信ネットワークを通して、最初から最後までの映像の品質を保証するために、ネットワーク事業者及びブロードキャスト供給業者は、客観的映像品質モデルを利用してよい。客観的映像品質モデルは、主観的な品質評価の結果に近接する数学的モデルであるが、コンピュータプログラムにより客観的に測定及び自動的に評価できる、基準及びメトリクスに基づいている。
客観的映像品質モデルが生成する客観的スコアと主観的テスト結果との間でメトリクスを計算することにより、客観的映像品質モデルの性能を評価する。このメトリクスは例えば、主観的データと客観的データ又は平均二乗誤差との間の相関関係であってよい。主観的テスト結果は、複数のヒトのテスト対象の意見から得られた平均オピニオン評点(MOS)からなるものであってよい。
知覚モデルは、客観的映像品質モデルの部分集合であると考えられる。客観的映像品質モデルは、いずれの自動化された品質評価手段を参照できるが、知覚モデルは、いずれの品質欠陥について視覚者が知覚するのはどの程度までかを判定することを試みている。知覚モデルは、復号化された映像シーケンスのピクセル情報を利用でき、フル参照モデルにおいては、参照信号は、処理後の映像の劣化を予測するために使用できる。知覚モデルの大きな欠点は、これらは通常多くの演算を必要とし、ネットワーク監視目的用の大規模な展開にはあまり適していないことである。
フル参照モデルより処理が軽い知覚品質モデルへの別のアプローチは、ネットワーク層プロトコルヘッダを、伝達された映像の品質推定のための入力として使用することである。このアプローチにより、極めて効率的にモデルを実装及び使用できるが、伝達された映像の品質推定はより粗くなる。従って、映像ビットストリーム品質モデルも実装してよい。このモデルは、符号化された初期ストリームを、ネットワークプロトコルヘッダに加えて入力として用い、極めて処理が軽いという利点を有し、及びネットワーク層プロトコルヘッダのみを用いる場合よりも、映像の品質のよりよい推定を得る可能性を有している。このような映像ビットストリーム品質モデルは、2つのモードで動作する。1つのモードでは、ビットストリームのフル復号化が可能であり、もう一方の複雑さがより低いモードでは、フル復号化ができない(従って、ピクセル情報が使用できない)。
Y−F.Qu、Z.Ma及びY.Wangによる、2010年44回年次会議、2010年3月17〜19日、Information Sciences and Systems(CISS)に公開された非特許文献1は、フレームレート、量子化ステップ幅、並びにフレームレートの一時的な変化の、知覚品質への影響について述べている。
C.Yim及びA.Bovikによる、Signal Processing:Image Communication 26(2011年)に公開された非特許文献2は、映像の一時的な品質における変化が映像品質全体に及ぼす効果について述べている。
従って、符号化された映像ビットストリームを復号化する必要のない、品質欠陥検知が必要とされている。このような品質欠陥検知は、品質モデルと併せて実装するのに適している。
Y−F.Qu、Z.Ma及びY.Wang著:「フレームレート、量子化ステップ幅、及びそれらの一時的な変化の知覚映像品質への影響のモデル化:最近の研究の再考」 C.Yim及びA.Bovik著:「パケット損失ネットワークにおける、映像品質の一時的な変化の評価」
ブロック符号化映像ストリームの量子化パラメータ(QP)における急激な変化は、復号化された映像シーケンスにおいて顕著な品質欠陥を生じ得ることが認識されている。映像ビットストリームから符号化された映像シーケンスを復号化することを要求しない、このような欠陥を検知するための方法及び装置を説明する。QPにおける変化の視覚的な影響の推定は、映像ビットストリームの総合的な品質を推定するために、映像ビットストリーム品質モデルの他のモデルパラメータと一緒に使用できる。本明細書で説明する解決策は従って、推定の精度を改善するものである。これにより、映像ビットストリームから映像シーケンスを復号化するための演算負荷がかからない、改善された映像ビットストリーム品質モデルを提供できる。
従って、映像シーケンスにおける品質欠陥を検知するための方法が提供される。本方法は、映像シーケンスを表す映像ビットストリームを受信することを含む。本方法は、映像シーケンスの各ピクチャについて量子化パラメータの大きさ判定することを更に含む。本方法は、量子化パラメータに急激な変化が起こった時に、品質欠陥を識別することを更に含む。
映像ビットストリームから映像シーケンスを復号化することなく、映像シーケンスを表す映像ビットストリームにおいて、特定の品質欠陥を識別できる。これは、デコーダを用いずにネットワークにおいて、映像ビットストリームの品質欠陥を識別できることを意味し、これにより、配信網を通るノードにおいて、より正確な品質推定が可能となる。
本方法は、映像シーケンスの各ピクチャがイントラ符号化ピクチャであるかどうかを判定すること、及びイントラ符号化ピクチャについて量子化パラメータに急激な変化が起こった時に、イントラピクチャフリッカとして品質欠陥を識別することを更に含む。
イントラピクチャフリッカは、量子化パラメータの急激な変化により引き起こされる品質欠陥の一種である。イントラ符号化ピクチャが量子化パラメータの頂点と一致する時に、イントラピクチャフリッカを識別してよい。イントラ符号化ピクチャとその隣接するインター符号化ピクチャとの間で、量子化パラメータに急激な変化が起こった時に、イントラピクチャフリッカを識別してよい。
本方法を品質推定モデルにおいて使用して、映像ビットストリームに表される映像シーケンスの知覚品質を判定できる。
映像シーケンスにおける品質欠陥を検知するための装置が更に提供され、この装置は、受信器及び欠陥モジュールを備える。受信器は、映像シーケンスを表す映像ビットストリームを受信するために配設される。欠陥モジュールは、映像シーケンスの各ピクチャについて量子化パラメータの大きさ判定するために配設され、かつ、更に、量子化パラメータの大きさに急激な変化が起こった時に、品質欠陥を識別するために配設される。
本装置は、映像シーケンスの各ピクチャがイントラ符号化ピクチャかどうかを判定するために配設される、ピクチャ型判定モジュールを更に含んでよい。フレーム内符号化ピクチャについての量子化パラメータの大きさに急激な変化が起こった時に、品質欠陥をイントラピクチャフリッカとして識別するために、欠陥モジュールを更に配設してよい。
本装置は、映像ビットストリーム及び欠陥モジュールからの欠陥指標を受信するために配設される、品質モジュールを更に含んでよく、この品質モジュールを、映像ビットストリームから再構築された映像の品質を推定するための品質モデルを適用するために、更に配設してよい。
コンピュータ可読媒体が更に提供され、このコンピュータ可読媒体は命令を保持し、コンピュータ論理がこの命令を実行すると、この命令は上記コンピュータ論理に、本明細書で定義される方法のいずれかを実行させる。
映像ビットストリームにおける品質欠陥を検知するための方法及び装置を、添付の図面を参照しながら、単なる例として説明する。
図1aは、映像シーケンス内のあるシーンからの1枚のピクチャのサンプル断片を示す。 図1bは、映像シーケンス内のあるシーンからの1枚のピクチャのサンプル断片を示す。 図1cは、映像シーケンス内のあるシーンからの1枚のピクチャのサンプル断片を示す。 図2は、図1の映像シーケンスについてのピクチャ毎の平均QPのグラフを示す。 図3は、第2の映像シーケンスについてのピクチャ毎の平均QPのグラフを示す。 図4aは、QPにおける急激な変化の1つを示す。 図4bは、QPにおける急激な変化の1つを示す。 図4cは、QPにおける急激な変化の1つを示す。 図4dは、QPにおける急激な変化の1つを示す。 図5は、本明細書で説明する方法を実行するための装置を示す。 図6は、QPにおける急激な変化の検知を品質モデルに組み込む装置を示す。 図7は、本明細書で説明される方法を示す。 図8は、本明細書で説明される別の方法を示す。
知覚可能な品質欠陥を発生させる、量子化パラメータ(QP)の急激な変化が引き起こす品質欠陥の一例は、イントラピクチャフリッカである。イントラピクチャフリッカは、通常、エンコーダのビットレート制御(一定のビットレートで概ね一定の品質を保つという要求を維持できない)によって引き起こされる、符号化アーティファクトである。映像符号化におけるビットレート制御は、複雑なタスクであり、かつ、いずれの規格の一部でもない。知覚される品質を最高のものにするために、シーケンスのピクチャを通して利用可能なビット予算を最適に割り当てるレート制御の生成は、エンコーダの開発業者にゆだねられている。レート制御要求は極めて異なっていることがある。テレビ電話のためのレート制御は、映像の低遅延を維持するには厳密すぎることがある。これは、各ピクチャに対して一定のビット予算を維持することを意味する。携帯TVの放送のような、一方向の映像は、通常、ある一定の時間間隔(例えば1〜2秒)に対してビット予算を有する、より緩和されたビットレート制御要求を有する。統計的多重化を実装し、各シーケンスの符号化需要に対する複数の並行映像シーケンスに渡って固定量のバンド幅を分散させることにより、符号化された映像のレートに、より柔軟性を提供できる。いくつかの符号化構成では、エンコーダは後続のピクチャへのアクセスを有さず、(1パス符号化としても公知の)オンザフライ(on−the−fly)で符号化パラメータを選択しなければならない。これらの及びその他の理由のために、符号化中のビットレートは映像シーケンスのピクチャ間で最適に配分できない。
イントラピクチャフリッカは、シーンを符号化する際に周期的なイントラピクチャが使用される時に発生する。このアーティファクトは、レート制御の要求がより一致し難くなることがある中〜低のビットレートにおいて、主に視覚可能である。しかしながら、アーティファクトは、高いビットレートが使用される場合でも視覚可能である。イントラピクチャフリッカは、静止シーンにおいて、及び中間(P及びB)ピクチャが符号化において消費するビットが比較的少なく(ただし、イントラピクチャは高負荷である)、シーン内の動きによりアーティファクトがマスクされない場合に、現れやすい。
典型的なイントラピクチャフリッカアーティファクトが図1に示されている。図1は、映像シーケンスA内の1つのシーンから3枚のピクチャの拡大した断片を示す。図1aは、シーケンスAのピクチャ199の一部であり、このピクチャは、26の平均QPで符号化されたインター符号化ピクチャである。図1bは、シーケンスAのピクチャ200の一部であり、このピクチャは36の平均QPで符号化されたイントラ符号化ピクチャである。図1cは、シーケンスAのピクチャ201の一部であり、このピクチャは28の平均QPで符号化されたインター符号化ピクチャである。映像シーケンスのピクチャ200において、QPがより高いことは、他の2枚のピクチャと比べてこのピクチャが不明瞭であることから明白である。
映像シーケンスAの内容は、比較的静止している自然であり、放牧されている牛を描画している。このシーケンスは、H.264/AVCの標準エンコーダであるJMを用いて、符号化及び復号化されている。ピクチャ199及び201は、インターピクチャとして比較的低いQPで符号化されている。中央のピクチャ200は、レート制御の制約及びイントラピクチャはインターピクチャよりも符号化するのにさらに多くのビットを消費するという事実により、イントラピクチャとして比較的高いQPで符号化されている。順番に再生されたピクチャを見ると、明白かつ不快なフリッカが見られる。画像内の空間的な詳細はピクチャ200では消えているが、ピクチャ201で再び現れている。
このようなイントラピクチャフリッカは、様々なエンコーダによる映像ビットストリームにおいて見ることができる。これはエンコーダビットレート制御戦略の一部ではなく、このような戦略に従うことに失敗した結果である。映像コーデック規格は、エンコーダの挙動ではなく、むしろデコーダが復号化するビットストリームの構文をカバーするものであるため、符号化による多くの異なる解決策が存在する。このような符号化による解決策の中には、他の解決策よりもイントラピクチャフリッカ問題に良好に対処できるものもある。
統計的多重化が使用され、符号化が容易なチャネルが、周期的なイントラフレームを正しく処理するのに十分なビットを取得していない場合に、このような欠陥の検知は特に重要である。利用可能なビットレートが少なく、かつ符号化のフレーム毎の複雑さに変化が無い場合、より低い解像度(例えば携帯TVの場合)において問題の更なる悪化が予想される。例えば、HDTV用の「中間」ビットレートの0.5秒の周期的なイントラ期間は、通常問題ないが、「中間」ビットレートの0.5秒の周期的なイントラ期間を携帯TV(例えば320×240ピクセル)に使用すると、イントラピクチャフリッカが極めて引き起こされやすくなる。
QP値を監視することにより、出現するこの品質低下を検知する方法及び装置が本明細書で提供される。インターピクチャと後続のイントラピクチャとの間でQP値がある一定量増加すると、及び次にやって来るインターピクチャについてQP値がある一定量減少すると、イントラピクチャフリッカが検知される。好ましい実施形態では、QPは比較される先行する各ピクチャを通して平均化されている。別の実施形態では、QPの差異は、マクロブロック毎に計算され、この差異は全てのマクロブロックを通して平均化される。
図2は、シーケンスAについてのピクチャ毎の平均QPのグラフを示す。イントラピクチャフリッカはピクチャ番号200に存在する。イントラピクチャフリッカを発生させるQPの頂点は、グラフ上に丸でマークされている。シーケンスは、ピクチャ番号130及び250において、(矢印でマークされた)2回のシーンカットを含む。シーンカットが発生する時、QPは大きく増加するにもかかわらず、ユーザには不快感を与えないので、明らかな品質欠陥として解釈されない。これは、シーンが変わり、古いシーンのピクチャと新しいシーンのピクチャとの間の品質の差異が、視覚者には明らかではないからである。それでも、インターピクチャとイントラピクチャとの間でQPが増加した時に、その後減少が無い場合、(シーンカットの後又はシーンの途中に)符号化されたピクチャ品質は唐突に低下することを、検知することにより識別してよい。
図2のグラフもまた、位置〜110、〜155及び〜305において頂点が少し多い場合を示している。QPはここでインターピクチャの数枚を通して増加するので、視覚者が視覚するのは難しい。インターピクチャは先行するピクチャから予測されるので、数枚のピクチャについての残差の適合度の減少は、見た目の品質にそれほど影響しない(空間的な詳細が正確でなくても、適切な量の空間的な詳細がピクチャの参照から導入されることが期待されている)。以下の疑似コードは、イントラピクチャフリッカ及びそれに呼応する符号化品質の急激な低下をどのように検知できるかを示す:
if (pic == inter and picn+1 == intra and QPn+1 − QP> threshold t) {
if (picn+1 == scene_cut)
新しいシーンで符号化品質の低下を検知
else if (QPn+1 - QPn+2 > threshold t) {
イントラピクチャフリッカを検知
} else {
符号化品質の低下を検知

図3は、第2の映像シーケンスBについてのピクチャ毎の平均QPのグラフを示す。このシーケンスは、ニュースの読み手を描画している。ここではほぼ読み手の唇のみが運動している。ピクチャは50枚毎に、イントラ符号化ピクチャとして符号化される。シーンは極めて静的であるため、インター予測は、少量の残差データで比較的正確になり、比較的低いQPをインターピクチャに提供できる。従ってエンコーダは、比較的低いビットレートを用いて、インターピクチャを符号化できる。しかしながら、周期的なイントラピクチャが符号化処理を受ける時、符号化するにはビットを多く消費するので、ビットレート需要において急激な変動を引き起こすことなくそれに対応するために、QPを大幅に上昇させなければならない。更に、周期的なイントラピクチャを挿入すると、レート制御が不均衡に設定され、周期的なイントラピクチャの後に続くインターピクチャのQPの増加をもたらす。このシーケンスでは5個の大きなイントラピクチャフリッカが見られ、これらは、図3のグラフに丸でマークされている。
周期的なイントラピクチャの後続の数枚のピクチャにおける高いQP頂点は、シーケンスAで説明したものと同じ理由で品質に影響しない。インターピクチャは、先行する(良好な品質の)ピクチャから予測され、残差の適合度の減少は、インターピクチャの数枚を通して知覚される品質にはそれほど影響しない。
シーケンスを通したQPの範囲は、シーケンスの品質の分布にも影響する。品質の全範囲は以下のように計算できる。
QPrange=QPmax−QPmin
イントラピクチャフリッカは、符号化された映像シーケンスで品質欠陥を引き起こす、QPにおける急激な変化の単なる一例に過ぎない。図4は、QPにおける急激な変化の4つの種類:図4aでは頂点;図4bでは谷;図4cでは上がり段;図4dでは下り段を示す。頂点は上がり段に等しく、直後に下り段が続き、谷は下り段に等しく、直後に上り段が続く。
上述のイントラピクチャフリッカは、図4aに表される頂点がイントラ符号化ピクチャと一致している場合に発生する。このような頂点は、上で述べた理由からイントラ符号化ピクチャと一致しやすく、その場合、シーンの空間的な詳細における急激な減少は、視覚者にも明白となりやすい。
図4bに表される谷は、シーン内の空間的な詳細の急激な増加として、視覚者に明白となり、イントラピクチャフリッカとして視覚者に不快感を与える。このような谷は、イントラピクチャと一致していても一致していなくても、明白となる。
図4cに示される上がり段でも、シーン内の空間的な詳細の解像度における急激な減少(不明瞭さの急激な増加)は視覚者に明白となる。このようなQPにおける上がり段差は、イントラピクチャと一致する場合に、より顕著になりやすい。
同様に、図4dに示される下り段差は、シーン内の空間的な詳細の解像度の急激な増加(不明瞭さの急激な減少)として、視覚者に明白となる。このようなQPにおける下り段差は、イントラピクチャと一致する場合に、より顕著になりやすい。
映像ビットストリームをフルで復号化すること無く、映像ビットストリームにおいてイントラピクチャフリッカをどのようにして検知するかを示してきた。QPにおける急激な変化を検知する一般的な場合がどのようなものかも示してきた。この情報を用いて、映像ビットストリーム品質モデルによる品質推定の精度を改善できる。
図5は、本明細書で説明される方法を実行するための装置を示す。本装置は、受信器510及び欠陥モジュール520を備える。受信器510は、映像シーケンスを表す映像ビットストリームを受信するために配設される。欠陥モジュール520は、映像シーケンスの各ピクチャについて平均量子化パラメータの大きさ判定するため、及び量子化パラメータの大きさに急激な変化が発生した時に、品質欠陥を識別するために配設される。欠陥モジュール520により品質欠陥が識別されると、モジュールは欠陥検知指標を出力する。
図6は、QPにおける急激な変化の検知を品質モデルに組み込む装置を示す。本装置は、受信器610、欠陥モジュール620、及び品質モジュール630を備える。受信器610は、映像シーケンスを表す映像ビットストリームを受信するために配設される。映像ビットストリームは、映像エンコーダ640でオリジナルの映像シーケンスを符号化することによって生成される。映像ビットストリームはまた、映像ビットストリームが復号化され、再構築された映像シーケンスが生成される、映像デコーダ650に受信される。欠陥モジュール620は、映像シーケンスの各ピクチャについて平均量子化パラメータの大きさ判定するため、及び量子化パラメータの大きさに急激な変化が発生した時に、品質欠陥を識別するために配設される。品質モジュール630は、欠陥モジュール620から映像ビットストリーム及び欠陥指標を受信する。品質モジュール630は、これらの入力を用いて、品質モデルを適用する及び映像ビットストリームから再構築された映像の品質を推定する。
映像ビットストリーム品質モデルは、以下の1つ又は複数を更に考慮してよい:
‐シーン内の空間的な詳細;
‐シーン内の運動量;
‐イントラピクチャフリッカの存在;
‐イントラピクチャフリッカが生じる回数;
‐イントラピクチャフリッカの周波数(ピクチャ毎又は毎秒);
‐イントラピクチャフリッカイベント間の(時間又はピクチャの数に関する)距離;
‐イントラピクチャフリッカについてのQPにおける差異;
‐イントラピクチャから始まる符号化品質の低下についてのQPにおける差異;
‐イントラピクチャから始まる符号化品質における低下の継続時間;
‐イントラピクチャから始まる符号化品質の向上についてのQPにおける差異;
‐インターピクチャ全体を通したQP頂点についてのQPにおける差異;
‐シーケンスについてのQPの範囲。
1つ又は複数のこれらの詳細を、映像ビットストリームの品質推定の計算に含んでよい。全体の品質モデルがどのように構成されるかは、本明細書の範囲ではないが、例えば、加法モデルのような線形モデル又は比例モデルのような非線形モデルであってよい。
例えば、ピクチャ内の空間的な詳細は、フーリエ解析又は離散コサイン変換等の周波数分析を用いて判定できる。高周波数部品の大きさ及び数により、空間的な詳細の大きさが提供される。ブロックベースの映像コーデックにより、画像及び残差データが周波数領域に符号化されるので、映像ビットストリームから、周波数部品に関連する係数を構文解析することにより、ピクチャの空間的な詳細の大きさを得ることができる。このような係数は、AC係数と呼ばれることがある。空間的な詳細の大きさを、品質評点への品質欠陥の影響を判定するために品質モデルが使用できる。空間的な詳細の大きさが高い場合、品質欠陥は、品質評点に対してより大きな影響を及ぼす。
更なる例として、ピクチャ内の運動量の大きさを、ピクチャ内のマクロブロックについてのモーションベクトルの平均規模により判定してよい。運動量の大きさを、品質評点への品質欠陥の影響を判定するために品質モデルが使用できる。運動量の大きさが高い場合、品質欠陥は、品質評点に対してより小さな影響を及ぼす。
図7は、本明細書に記載される方法を示している。710では、映像シーケンスを表す映像ビットストリームを受信する。720では、映像シーケンスの各ピクチャについての平均量子化パラメータの大きさ判定する。730では、量子化パラメータにおける急激な変化が発生した時に、品質欠陥を識別する。この品質欠陥を、映像ビットストリームから再構築された映像の品質を推定するために品質モデルが使用できる。
図8は、本明細書に記載される別の方法を示している。810では、映像シーケンスを表す映像ビットストリームを受信する。820では、映像シーケンスの各ピクチャについての平均量子化パラメータの大きさ判定する。830では、各ピクチャがIピクチャかどうかを判定する。840では、現在のピクチャがIピクチャとして識別され、かつ、現在のピクチャの量子化パラメータが先行するピクチャ及び後続のピクチャの両方の量子化パラメータよりも閾値分大きい時、イントラピクチャフリッカを識別する。このようなイントラピクチャフリッカの識別化を映像ビットストリームから再構築された映像の品質を推定するために、品質モデルが使用できる。
本明細書に記載される本方法及び本装置の利点は、これらにより、ビットストリームを復号化することなく、イントラピクチャフリッカ及び同様の品質欠陥を検知できる。これは、符号化品質において急激な低下が検知されることを意味する。これらの品質欠陥の見た目への影響の推定は、映像ビットストリーム品質モデルにより推定された品質の精度を改善するために使用できる。更に、映像ビットストリーム品質モデルは、品質を判定するためにビットストリームの復号化を必要としないので、リソースの処理、電力消費、物理的な空間等の点で映像ビットストリームの復号化が高負荷になりすぎる、分散ネットワークの一部において、映像品質監視を実行できる。
本明細書で記載した本方法で実行される実際の命令及び動作の内容が、実行パラメータの特定の組み合わせの要求に応じて変更できることは、当事者には明らかである。つまり、動作が記載され及び/又は請求される命令は、動作が実行される命令に対して厳しい制約として解釈されるものではない。
更に、特定の通信規格の文脈において実施例を提供してきたが、これらの実施例は、開示された方法及び装置に適用できる通信規格の制限を意図したものではない。例えば、具体的な実施例を、H.264の文脈で提供してきたが、本明細書に開示される原理は、MPEG−2、H.263、MPEG−4、HEVC/H.265又は他のコーデック、及び実際には、変換係数の量子化を用いたいずれの映像コーデックにも適用できる。

Claims (11)

  1. 映像シーケンス内の品質欠陥を検知するための方法であって
    映像シーケンスを表す映像ビットストリームを受信すること
    前記映像シーケンスの各ピクチャについて量子化パラメータの大きさ判定すること、及
    現在のピクチャの量子化パラメータの大きさが先行するピクチャの量子化パラメータの大きさよりも閾値量分、大きいと検知され、かつ現在のピクチャの量子化パラメータの大きさが後続のピクチャの量子化パラメータの大きさよりも閾値量分、大きいと検知される時に、品質欠陥を識別すること
    を含む、方法。
  2. 前記映像シーケンスの各ピクチャがイントラ符号化ピクチャであるかどうかを判定すること、及
    現在のイントラ符号化ピクチャの量子化パラメータの大きさが先行するピクチャの量子化パラメータの大きさよりも閾値量分、大きいと検知され、かつ現在のイントラ符号化ピクチャの量子化パラメータの大きさが後続のピクチャの量子化パラメータの大きさよりも閾値量分、大きいと検知される時に、イントラピクチャフリッカとして品質欠陥を識別すること
    を更に含む、請求項1に記載の方法。
  3. 前記量子化パラメータの大きさにおける差異
    前記ピクチャ内の空間的な詳細、及
    前記ピクチャ内の運動量
    の少なくとも1つを更に測定することにより、前記品質欠陥の影響を判定することを更に含む、請求項1または2に記載の方法。
  4. ピクチャについての前記量子化パラメータの前記大きさは、そのピクチャに使用される平均量子化パラメータである、請求項1からのいずれか1項に記載の方法。
  5. 前記映像ビットストリームによって表される前記映像シーケンスの知覚品質を判定するために、前記方法が品質推定モデルで使用される、請求項1から4のいずれか1項に記載の方法。
  6. 前記映像ビットストリームは、H.264、MPEG−2、H.263、MPEG−4及びHEVC/H.265のうちの少なくとも1つを使用して符号化される、請求項1からのいずれか1項に記載の方法。
  7. 映像シーケンスの品質欠陥を検知するための装置であって、
    映像シーケンスを表す映像ビットストリームを受信するために適合される受信器、及
    前記映像シーケンスの各ピクチャについて量子化パラメータの大きさ判定するために適合される欠陥モジュールを備え、
    前記欠陥モジュールは、現在のピクチャの量子化パラメータの大きさが先行するピクチャの量子化パラメータの大きさよりも閾値量分、大きいと検知され、かつ現在のピクチャの量子化パラメータの大きさが後続のピクチャの量子化パラメータの大きさよりも閾値量分、大きいと検知される時に、品質欠陥を識別するよう適合されている、
    置。
  8. 前記映像シーケンスの各ピクチャがイントラ符号化ピクチャであるかどうかを判定するために適合される、ピクチャ種別判定モジュールを更に備え、
    前記欠陥モジュールは、現在のイントラ符号化ピクチャの量子化パラメータの大きさが先行するピクチャの量子化パラメータの大きさよりも閾値量分、大きいと検知され、かつ現在のイントラ符号化ピクチャの量子化パラメータの大きさが後続のピクチャの量子化パラメータの大きさよりも閾値量分、大きいと検知される時に、品質欠陥をイントラピクチャフリッカとして識別するように更に適合される、
    請求項に記載の装置。
  9. 前記映像ビットストリーム及び前記欠陥モジュールからの欠陥指標を受信するために適合される品質モジュールを更に備え、
    前記品質モジュールは、前記映像ビットストリームから再構築された映像の品質を推定するための品質モデルを適用するために更に適合される、
    請求項又はに記載の装置。
  10. 前記品質モジュールは
    量子化パラメータの大きさにおける差異
    前記ピクチャ内の空間的詳細、及
    前記ピクチャ内の運動量
    の少なくとも1つを更に測定することって前記品質欠陥の規模を判定するように更に適合される、請求項に記載の装置。
  11. 命令を保持するコンピュータ可読媒体であって、
    前記命令はコンピュータより実行されると、前記コンピュータ請求項1から6のいずれか1項に記載される前記方法実行させる、コンピュータ可読媒体。
JP2014545112A 2011-12-09 2011-12-09 映像ビットストリーム内の品質欠陥を検知するための方法及び装置 Active JP6009578B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2011/072288 WO2013083199A1 (en) 2011-12-09 2011-12-09 Method and apparatus for detecting quality defects in a video bitstream

Publications (3)

Publication Number Publication Date
JP2015503293A JP2015503293A (ja) 2015-01-29
JP2015503293A5 JP2015503293A5 (ja) 2016-05-12
JP6009578B2 true JP6009578B2 (ja) 2016-10-19

Family

ID=45349184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014545112A Active JP6009578B2 (ja) 2011-12-09 2011-12-09 映像ビットストリーム内の品質欠陥を検知するための方法及び装置

Country Status (10)

Country Link
US (2) US9686515B2 (ja)
EP (2) EP2781101B1 (ja)
JP (1) JP6009578B2 (ja)
KR (2) KR20140096340A (ja)
CN (1) CN104145480B (ja)
BR (1) BR112014013252A2 (ja)
MY (1) MY168193A (ja)
PT (1) PT2781101T (ja)
WO (1) WO2013083199A1 (ja)
ZA (1) ZA201403514B (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103945219A (zh) * 2014-04-30 2014-07-23 北京邮电大学 一种网络侧视频质量监测系统
US10742708B2 (en) 2017-02-23 2020-08-11 Netflix, Inc. Iterative techniques for generating multiple encoded versions of a media title
US11166034B2 (en) 2017-02-23 2021-11-02 Netflix, Inc. Comparing video encoders/decoders using shot-based encoding and a perceptual visual quality metric
US10715814B2 (en) 2017-02-23 2020-07-14 Netflix, Inc. Techniques for optimizing encoding parameters for different shot sequences
US11153585B2 (en) 2017-02-23 2021-10-19 Netflix, Inc. Optimizing encoding operations when generating encoded versions of a media title
US10666992B2 (en) 2017-07-18 2020-05-26 Netflix, Inc. Encoding techniques for optimizing distortion and bitrate
WO2019226642A1 (en) 2018-05-24 2019-11-28 Baker Hughes Oilfield Operations Llc Coiled tubing connector to electrical submersible pump
CN108921023A (zh) * 2018-05-31 2018-11-30 上海依图网络科技有限公司 一种确定低质量人像数据的方法及装置
EP4270947A1 (en) * 2022-04-26 2023-11-01 intoPIX s.a. Video encoding applying a refresh scheme
CN117893952A (zh) * 2024-03-15 2024-04-16 视睿(杭州)信息科技有限公司 基于深度学习的视频马赛克缺陷检测方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1352526B1 (en) * 2000-11-23 2006-06-14 Koninklijke Philips Electronics N.V. Video decoding method and corresponding decoder
US6750942B2 (en) * 2001-02-26 2004-06-15 Ando Electric Co., Ltd. Motion picture code evaluation apparatus and system
JP2002325254A (ja) * 2001-02-26 2002-11-08 Ando Electric Co Ltd 動画符号評価装置及びシステム
US7092448B2 (en) * 2002-05-24 2006-08-15 Koninklijke Philips Electronics N.V. Method and system for estimating no-reference objective quality of video data
GB0228556D0 (en) * 2002-12-06 2003-01-15 British Telecomm Video quality measurement
US8081827B2 (en) * 2006-02-28 2011-12-20 Ricoh Co., Ltd. Compressed data image object feature extraction, ordering, and delivery
US8331438B2 (en) * 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
BRPI0907258A2 (pt) * 2008-01-17 2015-07-14 Thomson Licensing Método para medição de oscilação
JP2009260940A (ja) * 2008-03-21 2009-11-05 Nippon Telegr & Teleph Corp <Ntt> 映像品質客観評価方法、映像品質客観評価装置、およびプログラム
JP4861371B2 (ja) * 2008-06-27 2012-01-25 日本電信電話株式会社 映像品質推定装置、方法、およびプログラム
US20100027621A1 (en) * 2008-07-31 2010-02-04 Kabushiki Kaisha Toshiba Apparatus, method and computer program product for moving image generation
WO2010056310A1 (en) * 2008-11-12 2010-05-20 Thomson Licensing I-frame de-flickering for gop-parallel multi-thread video encoding
US8582645B2 (en) * 2009-06-11 2013-11-12 Texas Instruments Incorporated Reducing flicker in the display of video streams
JP5484140B2 (ja) * 2010-03-17 2014-05-07 Kddi株式会社 映像品質の客観画質評価装置
EP2373049A1 (en) 2010-03-31 2011-10-05 British Telecommunications Public Limited Company Video quality measurement

Also Published As

Publication number Publication date
PT2781101T (pt) 2019-01-10
KR20160078525A (ko) 2016-07-04
US9686515B2 (en) 2017-06-20
EP2781101A1 (en) 2014-09-24
WO2013083199A1 (en) 2013-06-13
US20180020242A1 (en) 2018-01-18
ZA201403514B (en) 2015-07-29
KR101742930B1 (ko) 2017-06-01
EP3432577A1 (en) 2019-01-23
KR20140096340A (ko) 2014-08-05
BR112014013252A2 (pt) 2017-06-13
MY168193A (en) 2018-10-15
US10356441B2 (en) 2019-07-16
EP2781101B1 (en) 2018-10-24
CN104145480B (zh) 2017-08-04
JP2015503293A (ja) 2015-01-29
US20140294362A1 (en) 2014-10-02
CN104145480A (zh) 2014-11-12

Similar Documents

Publication Publication Date Title
JP6009578B2 (ja) 映像ビットストリーム内の品質欠陥を検知するための方法及び装置
JP5758405B2 (ja) 映像品質推定技術
US9037743B2 (en) Methods and apparatus for providing a presentation quality signal
CN109510919B (zh) 用于感知质量评估的场景变换检测的方法、设备和介质
US20150341667A1 (en) Video quality model, method for training a video quality model, and method for determining video quality using a video quality model
Keimel et al. No-reference video quality metric for HDTV based on H. 264/AVC bitstream features
US20150296224A1 (en) Perceptually driven error correction for video transmission
JP2015503293A5 (ja)
CN110996102B (zh) 抑制p/b帧中帧内块呼吸效应的视频编码方法及装置
US20150350686A1 (en) Preencoder assisted video encoding
WO2012013777A2 (en) Method and apparatus for assessing the quality of a video signal during encoding or compressing of the video signal
AU2011367779B2 (en) Method and device for estimating video quality on bitstream level
US9432694B2 (en) Signal shaping techniques for video data that is susceptible to banding artifacts
CN108989818B (zh) 一种图像编码参数调整方法及装置
Carreira et al. Dynamic motion vector refreshing for enhanced error resilience in HEVC
Wang et al. Network-based model for video packet importance considering both compression artifacts and packet losses
Garcia et al. Video streaming
Rahman et al. No-reference spatio-temporal activity difference PSNR estimation
Önür et al. A complexity-utility framework for modeling decoding complexity towards optimizing subjective quality of video for mobile devices
Yamada et al. No-reference quality estimation for video-streaming services based on error-concealment effectiveness
Wang et al. Distortion estimation for compressed video transmission over mobile networks
Bivolarski Compression performance comparison in low delay real-time video for mobile applications

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151124

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160224

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20160315

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160914

R150 Certificate of patent or registration of utility model

Ref document number: 6009578

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250