JP2014090456A - Processing method and device of coded bitstream - Google Patents

Processing method and device of coded bitstream Download PDF

Info

Publication number
JP2014090456A
JP2014090456A JP2013253554A JP2013253554A JP2014090456A JP 2014090456 A JP2014090456 A JP 2014090456A JP 2013253554 A JP2013253554 A JP 2013253554A JP 2013253554 A JP2013253554 A JP 2013253554A JP 2014090456 A JP2014090456 A JP 2014090456A
Authority
JP
Japan
Prior art keywords
bit stream
complexity
encoded bit
decoding
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013253554A
Other languages
Japanese (ja)
Other versions
JP2014090456A5 (en
JP5793550B2 (en
Inventor
Rossholm Andreas
アンドレアス ロスホルム,
Pettersson Martin
マルティン ペテルソン,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Priority to JP2013253554A priority Critical patent/JP5793550B2/en
Publication of JP2014090456A publication Critical patent/JP2014090456A/en
Publication of JP2014090456A5 publication Critical patent/JP2014090456A5/ja
Application granted granted Critical
Publication of JP5793550B2 publication Critical patent/JP5793550B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a method for improving bitstream quality evaluation of a multimedia system.SOLUTION: In a method for extracting information from a coded bitstream, extracted information is used for improvement of bitstream quality evaluation or adaptation of a decoding sub-system. From a coded bitstream received from a bitstream source, complexity related information indicating the coded complexity of a bitstream is extracted. On the basis of complexity related information thus extracted, one or more data setting is selected, and then the data setting is used as an input for improving the bitstream quality evaluation in a decoding device or a network node, or for adapting the bitstream decoding sub-system in the decoding device.

Description

本明細書は、先行する符号化処理の複雑度を考慮しつつ、符号化ビット・ストリームを処理する方法及び装置に関する。   The present specification relates to a method and apparatus for processing an encoded bit stream, taking into account the complexity of the preceding encoding process.

固定及び移動ユーザ・デバイス双方を含む種々のタイプのユーザ・デバイスに配信することができる、例えばビデオのようなメディア・コンテンツのサービス範囲及び品質の、新たな通信技術の出現に伴う改善により、例えばマルチメディア・ストリーミングのようなマルチメディア・サービスは、益々大いにポピュラーになりつつある。   With the advent of new communication technologies, for example, the coverage and quality of media content such as video that can be delivered to various types of user devices, including both fixed and mobile user devices, for example Multimedia services such as multimedia streaming are becoming increasingly popular.

そのようなメディア・サービスの良好な経験品質を確保するために、無線及び有線ネットワークの通信システムの運用会社は、通常、既にソースに近いネットワーク又はサービスの問題のある位置を突き止め、回避するツール及び測定法を使用する。   In order to ensure good experience quality of such media services, operators of wireless and wired network communication systems typically have tools and tools to locate and avoid problematic locations in networks or services that are already close to the source. Use the measurement method.

メディア・コンテンツの重要な特性を認識するツールにより、分析結果を使用してネットワークを最適化することができ、それによりサービス・プロバイダが利用可能なネットワーク・リソースにより、より多くのユーザが、提供されるサービスの適切な品質経験を持つことを可能にする。   A tool that recognizes important characteristics of media content can use the results of analysis to optimize the network, thereby providing more users with the network resources available to service providers. It is possible to have appropriate quality experience of service.

幾つかのサービスは、エンド・ユーザに良好な品質推定を与えるために、例えばスループットのような少しのネットワーク・パラメータを測定することを必要とする。例えばビデオ・ストリーミングのようなマルチメディア・サービスの場合、メディア自体を含む品質の劣化に寄与する幾つかの要因があるので、経験品質の測定タスクは、些細な問題ではない。   Some services require measuring a few network parameters, such as throughput, in order to give a good quality estimate to the end user. In the case of multimedia services such as video streaming, the experience quality measurement task is not a trivial problem because there are several factors that contribute to quality degradation including the media itself.

ビデオ品質評価は、ビデオの人の感じ方に関係し、主観的及び客観的方法に区分できる。主観的試験法は、通常、最良の結果を生むが、信頼できる結果を達成するのであれば、平均オピニオンスコア(MOS)の計算前に、多くの試験要員が各ビデオ・シーケンスの格付けを行わなければならないので、主観的試験法は経費が高く、時間も掛る。客観的モデルは、実時間の品質評価に使用することができ、主観的MOSを推定するスコアを出力するように設計されることが多い。   Video quality assessment is related to how people feel the video and can be divided into subjective and objective methods. Subjective test methods usually produce the best results, but if a reliable result is achieved, many test personnel must rate each video sequence before calculating the average opinion score (MOS). Subjective testing is expensive and time consuming. Objective models can be used for real-time quality assessment and are often designed to output a score that estimates the subjective MOS.

客観的モデルは3つのカテゴリ、即ち、知覚モデル、パラメトリック・モデル及びビット・ストリーム・モデルに区分することができる。   Objective models can be divided into three categories: perceptual models, parametric models, and bit stream models.

知覚モデルは、ビデオの人工的産物を強調し、定量化する複数のイメージ分析アルゴリズムに依存することが多い。知覚モデルは、フル参照(FR)モデル、削減参照(RR)モデル及び非参照(NR)モデルに区分されることが多い。知覚NRモデルは、モデルへの入力として復号されたビデオのみを使用するが、FRモデルは関連する、非符号化参照も処理入力として使用する。フル参照を使用する代わりに、RRモデルは、狭いサイド・チャネルを介する入力として参照に関する情報を使用する。   Perceptual models often rely on multiple image analysis algorithms that enhance and quantify video artifacts. Perceptual models are often divided into full reference (FR) models, reduced reference (RR) models, and non-reference (NR) models. The perceptual NR model uses only the decoded video as input to the model, while the FR model also uses the associated uncoded reference as processing input. Instead of using a full reference, the RR model uses information about the reference as input via a narrow side channel.

知覚モデルについて、例えば、特許文献1のような複数の標準が存在し、特許文献1は、種々のFRTVマルチメディア(MM)に関し、特許文献2は、RRMMモデルに関し、特許文献3は、FRMMモデルに関するものである。しかしながら、NR知覚モデルの性能は、そのモデルを標準化するにはなお低すぎる。   Regarding the perceptual model, for example, there are a plurality of standards such as Patent Document 1, Patent Document 1 relates to various FRTV multimedia (MM), Patent Document 2 relates to an RRMM model, and Patent Document 3 describes an FRMM model. It is about. However, the performance of the NR perception model is still too low to standardize the model.

従来技術で既知のパラメトリック・モデルは、ビット・ストリームの品質スコアを推定するための入力として、種々のネットワーク・パラメータ及びコーデック情報を共通して使用する。パラメトリック・モデルの性能は、FR知覚モデルの性能より悪い傾向にあるが、パラメトリック・モデルは、一般に、複雑度が低く、知覚モデルが通常必要とする計算能力を必要としない。パラメトリック・モデルは、それ故、例えばセット・トップ・ボックス(STB)及び移動デバイスのようなネットワーク・ノード及びユーザ装置双方に容易に実装することができる。   Parametric models known in the prior art commonly use various network parameters and codec information as inputs to estimate the bit stream quality score. Although the performance of parametric models tends to be worse than that of FR perceptual models, parametric models are generally less complex and do not require the computational power normally required by perceptual models. Parametric models can therefore be easily implemented in both network nodes and user equipment, such as set top boxes (STBs) and mobile devices.

ビット・ストリームの品質を推定しようとする場合、ビデオ・ビット・ストリーム・モデルは、入力として圧縮ビデオ・ビット・ストリームを使用する。ビット・ストリーム・モデルは、より多くのデータを分析する必要があるので、パラメトリック・モデルより幾分複雑である。しかしながら、符号化に関する情報を得ることができるので、これらのタイプのモデルは、その他のモデルによりも、良好な精度を有するビデオ品質の推定値を提供する能力を有する。   When trying to estimate the quality of the bit stream, the video bit stream model uses the compressed video bit stream as input. The bit stream model is somewhat more complex than the parametric model because more data needs to be analyzed. However, because information about the encoding can be obtained, these types of models have the ability to provide video quality estimates with better accuracy than other models.

例えばハンドブレーク、クイックタイム及びへリックスのような、今日、マーケットで利用可能な多くの新しい符号化器がある。これらの符号化器からのビット・ストリームを分析する場合、同じプロファイル及びレベルを使用しても、符号化器の特徴設定が異なりうることが見られる。可能な符号化器の特徴量は、符号化器に必要な計算能力に影響し、結果として、フレームを符号化するのに要する時間は設定により異なりうる。これはまた復号器側で必要とする計算能力量に影響し、従って、符号化器は、特徴量が既知であれば特徴量の制限を選択することができ、或いは、復号器側に、例えば、計算能力制限又はメモリ制限のような幾つかのタイプのリソース制限を設ける。   There are many new encoders available on the market today, such as hand breaks, quick time and helix. When analyzing the bit streams from these encoders, it can be seen that even if the same profile and level are used, the encoder feature settings can be different. The possible encoder features affect the computational power required for the encoder, and as a result, the time required to encode a frame may vary depending on the setting. This also affects the amount of computational power required on the decoder side, so the encoder can choose to limit the feature if the feature is known, or on the decoder side, eg There are several types of resource limits, such as computing power limits or memory limits.

符号化器における、種々の符号化の特徴設定の使用により、これらの設定は、それぞれ異なる複雑度レベルに対応するものと見ることができ、ここで、マクロ・ブロックのより小さなパーティションへの分割及びモーション推定過程の動きベクトル分解能は、計算能力に影響し得る典型的特徴である。   With the use of various encoding feature settings in the encoder, these settings can be viewed as corresponding to different levels of complexity, where the macroblock is divided into smaller partitions and Motion vector resolution in the motion estimation process is a typical feature that can affect computational power.

このタイプの特徴は、通常、符号化器ループの残存を減じ、符号化ストリームの品質を向上させる機会を生成するのに使用される。   This type of feature is typically used to create an opportunity to reduce the remaining encoder loops and improve the quality of the encoded stream.

特許文献1は、量子化及びDCT係数に関する情報を使用することにより、ビデオ・ビット・ストリームの品質を分析する方法を記載する。   U.S. Patent No. 6,057,034 describes a method for analyzing the quality of a video bit stream by using information about quantization and DCT coefficients.

ビット・ストリーム品質スコアを計算するために、伝送及びビデオ・ストリーム・パラメータを使用することや、ある符号化について、例えば、動きベクトル情報及びイントラ/インター予測フレーム/スライスの割合、つまり、実際のビット・ストリームに関係する情報のようなデータをその計算のベースとすることも広く知られている。   Using transmission and video stream parameters to calculate the bit stream quality score, or for certain encodings, eg, motion vector information and intra / inter prediction frame / slice ratio, ie actual bits It is also widely known that data such as information related to a stream is used as a basis for the calculation.

会議論文である非特許文献4は、ビット・ストリーム品質スコアを計算する場合に、量子化パラメータ(QP)のみに依存するIPTVビット・ストリーム・モデルを提示している。   Non-Patent Document 4, which is a conference paper, presents an IPTV bit stream model that depends only on the quantization parameter (QP) when calculating the bit stream quality score.

従来技術のビット・ストリームの品質モデルの解決策に共通の課題は、符号化手順の複雑度は、場合により異なりうるが、これがビット・ストリーム品質スコアを得るために選択するビット・ストリーム品質モデルの処理に反映しないことである。結果、特定の符号化器の複雑度に最適であるビット・ストリーム品質モデルが、異なる複雑度を使用する符号化器を含む種々のシナリオに対して、同じデータ設定を使用することになる。   A common problem with prior art bit stream quality model solutions is that the complexity of the encoding procedure may vary from case to case, but this depends on which bit stream quality model to choose to obtain the bit stream quality score. It is not reflected in processing. As a result, the bit stream quality model that is optimal for the complexity of a particular encoder will use the same data settings for different scenarios involving encoders that use different complexity.

その結果、使用するビット・ストリーム品質モデルの入力として同じデータ設定を使用しても、結果として得られるビット・ストリーム品質スコアの精度は、測定毎に変動し得る。   As a result, the accuracy of the resulting bit stream quality score may vary from measurement to measurement, even if the same data settings are used as input for the bit stream quality model used.

よって、ビット・ストリーム品質評価の改善を可能にする方法及び装置が必要とされる。   Thus, there is a need for a method and apparatus that enables improved bit stream quality assessment.

米国特許第6011868号明細書US Pat. No. 6,011,868

ITU−T勧告J−144ITU-T recommendation J-144 ITU−T勧告J−246ITU-T recommendation J-246 ITU−T勧告J−247ITU-T recommendation J-247 “Proposal of a new QoE assessment approach for quality management of IPTV services”、ICIP2008“Proposal of a new QOE assessment application for quality management of IPTV services”, ICIP2008

本発明の目的は、方法及び装置の改善により、上記従来技術の少なくとも幾つかの欠点を克服することである。   It is an object of the present invention to overcome at least some of the disadvantages of the prior art by improving the method and apparatus.

一態様によれば、マルチメディア・システムのビット・ストリーム品質評価を改善する方法が提供され、ビット・ストリーム・ソースから受信する典型的にはビデオ・ビット・ストリームである符号化ビット・ストリームから抽出した、ビット・ストリーム・ソースでの先行する符号化の複雑度を示す複雑度関連情報に基づきビット・ストリーム品質スコアを計算する。   According to one aspect, a method is provided for improving bit stream quality assessment of a multimedia system, extracted from an encoded bit stream that is typically a video bit stream received from a bit stream source. The bit stream quality score is calculated based on the complexity related information indicating the complexity of the preceding encoding at the bit stream source.

複雑度関連情報は、1つ以上のデータ設定の選択に使用され、データ設定は、ビット・ストリーム品質スコアを計算するビット・ストリーム品質モデルへの入力として使用される。   The complexity related information is used to select one or more data settings, which are used as input to a bit stream quality model that calculates a bit stream quality score.

符号化の複雑度を示す情報に基づきビット・ストリーム品質スコアを計算することで、結果として得られるビット・ストリーム品質スコアの精度は、ビット・ストリーム品質モデルの効果的な適合化の可能性により、従来技術の解決策と比較して改善される。   By calculating the bit stream quality score based on the information indicating the encoding complexity, the accuracy of the resulting bit stream quality score is due to the possibility of effective adaptation of the bit stream quality model. Improved compared to prior art solutions.

別の代替態様によれば、抽出する複雑度関連情報は、代わりに、復号サブ・システムを適合化するために使用され、性能の改善を得ることができる。そのような適合化は、例えば計算能力の分散又は復号サブ・システム内のメモリ割り当ての適合化を含むことができる。   According to another alternative, the complexity related information to be extracted can be used instead to adapt the decoding subsystem to obtain performance improvements. Such adaptation may include, for example, computing power distribution or memory allocation adaptation within the decoding subsystem.

符号化の複雑度を考慮することにより、この情報は、復号サブ・システムのあるサブモジュールを適合化するのに貴重となり得る。   By considering the encoding complexity, this information can be valuable for adapting certain sub-modules of the decoding subsystem.

提案する方法は、追加の品質に関する情報と組み合わせて、抽出する複雑度関連情報に基づき使用され得る。   The proposed method can be used based on the complexity related information to be extracted in combination with information on additional quality.

複雑度関連情報は、例えば符号化ビット・ストリームの一部のマクロ・ブロック・パーティション・サイズ、動きベクトル分解能、スキップされたマクロ・ブロック又は使用する参照画像数の何れかを示す、複雑度に関するパラメータを含むことができる。   Complexity-related information is a parameter related to complexity indicating, for example, one of the macro block partition size, motion vector resolution, skipped macro block, or number of reference images to be used in the encoded bit stream. Can be included.

抽出する複雑度関連情報は、単独又は他の情報と組み合わせて、直接的又は間接的に適切なデータ設定を選択するために使用され、複雑度レベルがまず選択される。後者の場合、ビット・ストリーム品質スコア又は復号サブ・システムの適合化は、選択した複雑度レベルに基づき実行される。   The complexity related information to be extracted is used to select an appropriate data setting, either directly or indirectly, alone or in combination with other information, and a complexity level is first selected. In the latter case, bit stream quality score or decoding subsystem adaptation is performed based on the selected complexity level.

本発明は、提案する方法の何れかを実行するように構成された各装置にも関係する。   The present invention also relates to each device configured to perform any of the proposed methods.

そのような装置は、例えばセルラ電話機、セット・トップ・ボックス、PC、ラップトップ・コンピュータ又はネットワーク・ノードの何れかとして実装することができる。   Such a device can be implemented, for example, as either a cellular telephone, a set top box, a PC, a laptop computer or a network node.

本発明について、以下では、添付の図面を参照し、例示的実施形態により詳細に説明する。   The present invention will now be described in detail by way of exemplary embodiments with reference to the accompanying drawings.

ビット・ストリーム・ソースから符号化ビット・ストリームを受信する復号デバイスと、ビット・ストリーム・ソースでの方法ステップの2つの個別のフローチャート。2 shows two separate flowcharts of a decoding device receiving an encoded bit stream from a bit stream source and method steps at the bit stream source. 符号化ビット・ストリームが代わりにビット・ストリーム・ソースからネットワーク・ノードへ提供される場合における、各方法ステップの2つのフローチャート。Two flow charts for each method step when the encoded bit stream is instead provided from the bit stream source to the network node. 一実施形態による複雑度関連情報を抽出して使用する方法のフローチャート。5 is a flowchart of a method for extracting and using complexity related information according to an embodiment. 別の実施形態による複雑度関連情報を抽出して使用する方法のフローチャート。6 is a flowchart of a method for extracting and using complexity related information according to another embodiment. 種々のイントラ・パーティションに分割される典型的なイントラ・マクロ・ブロックを示す図。FIG. 2 shows an exemplary intra macro block that is divided into various intra partitions. 種々のインター・パーティションに分割される典型的なインター・マクロ・ブロックを示す図。FIG. 4 shows an exemplary inter macro block that is divided into various inter partitions. 例示的な一実施形態による、ビット・ストリーム品質スコアを導出する複雑度関連情報を抽出して使用するように構成される装置の構成図。FIG. 3 is a block diagram of an apparatus configured to extract and use complexity related information from which a bit stream quality score is derived, according to an illustrative embodiment. 例示的な一実施形態による、どの様に符号化ビット・ストリームからパラメータを抽出し、復号サブ・システムの適合化に使用することができるのかのシナリオを示す図。FIG. 4 illustrates a scenario of how parameters can be extracted from an encoded bit stream and used to adapt a decoding subsystem, according to an example embodiment. 別の実施形態による、どの様に符号化ビット・ストリームからパラメータを抽出し、復号サブ・システムの適合化に使用することができるのかのシナリオを示す図。FIG. 6 illustrates a scenario of how parameters can be extracted from an encoded bit stream and used to adapt a decoding subsystem according to another embodiment. 例示的な一実施形態による、復号サブ・システムの適合化のため、符号化複雑度関連情報を抽出して使用するよう構成された装置の構成図。FIG. 3 is a block diagram of an apparatus configured to extract and use coding complexity related information for decoding subsystem adaptation, according to an exemplary embodiment.

例えばビデオのようなマルチメディア・コンテンツを搬送する符号化マルチメディア・ビット・ストリームのビット・ストリーム品質スコアを予測する場合、ビット・ストリーム品質モデルに提供する入力データの使用は、ビット・ストリーム品質スコアが達成できる良い精度のために必要である。加えて、マルチメディア復号デバイス、特に移動ビデオ復号デバイスにとって、複雑なビット・ストリームを扱うことができる幾つかのコプロセッサ又はアクセラレータ・ブロックが必要となる場合が多い。そのようなコプロセッサ及び/又はアクセラレータ・ブロックは、必要な場合オン・オフするように構成されることも多い。より詳細には、そのようなサブ・システムは多かれ少なかれ電力を消費するので、それが絶対的に必要でなければ、そのようなサブ・システムを動作させ続けるのは望ましくない。その上、復号デバイスにおけるビット・ストリーム復号処理に対するメモリ・リソースの割り当ては、各コーデックが使用する信号プロファイル及びレベルに基づくことが多い。   When predicting the bit stream quality score of an encoded multimedia bit stream carrying multimedia content such as video, the use of input data provided to the bit stream quality model is Is necessary for good accuracy that can be achieved. In addition, multimedia decoding devices, particularly mobile video decoding devices, often require several coprocessors or accelerator blocks that can handle complex bit streams. Such coprocessors and / or accelerator blocks are often configured to turn on and off when needed. More particularly, since such a subsystem consumes more or less power, it is not desirable to keep such subsystem operating unless it is absolutely necessary. In addition, the allocation of memory resources for the bit stream decoding process at the decoding device is often based on the signal profile and level used by each codec.

必要なのは、ビット・ストリーム符号化特性の分析を可能にする改善された方法であり、選択する複雑度レベルについて、ビット・ストリームの符号化をどの様に実行するかの詳細が考慮される。そのような機構を手にすることにより、上記問題の少なくとも幾つかを改善することができ、結果として、ビット・ストリーム品質モデルの予測精度が改善され、或いは、復号デバイスにおける僅かなリソースの使用を最適化する。従って、ビット・ストリーム符号化の複雑度を表す、つまり、抽出ビット・ストリームの符号化の間に適用する符号化器が使用する複雑度の表示を、何らかの方法で使用する方法が提案される。用語“表示”は、ここでは、最も広い意味に解釈すべきであり、抽出する情報が、多かれ少なかれ詳細な情報を含み、処理を行う際に、ビット・ストリームの符号化に符号化器が使用する複雑度の詳細な表示を多かれ少なかれ与えることができる。   What is needed is an improved method that allows analysis of bit stream encoding characteristics, and details of how to perform bit stream encoding for a selected complexity level are considered. Having such a mechanism can improve at least some of the above problems, resulting in improved prediction accuracy of the bit stream quality model, or less resource usage in the decoding device. Optimize. Thus, a method is proposed that uses in some way the indication of the complexity of the bit stream encoding, ie the complexity used by the encoder applied during the encoding of the extracted bit stream. The term “indication” is to be interpreted here in the broadest sense, and the information to be extracted contains more or less detailed information and is used by the encoder to encode the bit stream when processing. You can give more or less detailed indications of complexity.

符号化器での複雑度の程度は、符号化ビット・ストリームから抽出される1つ以上のパラメータと、抽出した情報/パラメータを処理しようとする場合に適用可能な規則に依存し得る。   The degree of complexity at the encoder may depend on one or more parameters extracted from the encoded bit stream and the rules applicable when trying to process the extracted information / parameters.

提案する方法は、典型的には、符号化ビデオ・ビット・ストリームに適用可能であるが、他のタイプの符号化マルチメディア・ビット・ストリームの対応する処理にも使用することができる。   The proposed method is typically applicable to encoded video bitstreams, but can also be used for corresponding processing of other types of encoded multimedia bitstreams.

提案する方法は、復号及び描画デバイス又はネットワーク・ノードで複雑度関連情報を抽出して処理することに基づくものである。   The proposed method is based on extracting and processing complexity related information at a decoding and rendering device or network node.

より良好な精度によりビット・ストリーム品質スコアを取得するために、ビット・ストリーム・ソースで実行する符号化処理の複雑度を示す1つ以上のパラメータに基づくパラメータ抽出法を提案する。   In order to obtain a bit stream quality score with better accuracy, we propose a parameter extraction method based on one or more parameters indicating the complexity of the encoding process performed on the bit stream source.

提案する方法によると、受信ビット・ストリームの分析を必要とする復号デバイス又はネットワーク・ノードでの符号化ビット・ストリームの解析により、典型的には、1つ以上の予め規定されたパラメータを、符号化ビット・ストリームから抽出する。解析は、マルチメディア・コンテンツを搬送するビット・ストリームからの情報を解析する任意の従来の手順により実行することができる。   According to the proposed method, analysis of the encoded bit stream at a decoding device or network node that requires analysis of the received bit stream typically encodes one or more predefined parameters. Extract from the generalized bit stream. The analysis can be performed by any conventional procedure for analyzing information from a bit stream carrying multimedia content.

一度抽出すると、改善された精度を有するビット・ストリーム品質スコアを提供するために、そのようなパラメータは単独で、或いは、任意の従来技術の解決法により読み出された品質に関連するパラメータの様な、他のパラメータとの組み合わせで使用することができる。   Once extracted, such parameters may be used alone or as parameters related to quality read by any prior art solution to provide a bit stream quality score with improved accuracy. It can be used in combination with other parameters.

符号化ビット・ストリームの処理は、典型的には、コプロセッサ及び/又はアクセラレータ・ブロックのような、復号デバイスの復号サブ・システムの種々の部分に対する特定の要求条件を結果として生むことになろう。これらのサブ・システムは多かれ少なかれ電力を消費するので、絶対的に必要でない限り、そのようなサブ・システムを動作させ続けるのは、通常、望ましくない。符号化複雑度の変更により、要求に応じて復号サブ・システムの種々の部分をオン・オフする要求があり得る。抽出する複雑度に関係する情報の使用により、復号サブ・システムのそのような適合化又は最適化を達成することができる。   The processing of the encoded bit stream will typically result in specific requirements for various parts of the decoding subsystem of the decoding device, such as coprocessors and / or accelerator blocks. . Since these subsystems consume more or less power, it is usually undesirable to keep such subsystems running unless absolutely necessary. Due to changes in coding complexity, there may be a need to turn on and off various parts of the decoding subsystem as required. Such adaptation or optimization of the decoding subsystem can be achieved through the use of information related to the complexity extracted.

換言すれば、提案する方法は、復号デバイス又はネットワーク・ノードで適切なデータ設定を選択するための入力として、ビット・ストリーム・ソースで使用する符号化器の複雑度を示す複雑度関連パラメータを使用する。そのようなデータ設定は、良好な精度を有するビット・ストリーム品質スコアを取得するビット・ストリーム品質モデルへの入力又は復号サブ・システムを適合化するための入力として使用することができる。   In other words, the proposed method uses a complexity-related parameter indicating the complexity of the encoder used in the bit stream source as input for selecting the appropriate data settings at the decoding device or network node. To do. Such a data setting can be used as an input to a bit stream quality model that obtains a bit stream quality score with good accuracy or as an input to adapt the decoding subsystem.

提案する方法が基礎とする一般的原理を、図1a及び1bの2つのフローチャートをそれぞれ参照して説明し、ここで、これらのフローチャートは、端末又はサーバのようなビット・ストリーム・ソース100から符号化ビット・ストリームの形式のマルチメディア・コンテンツを受信して処理する復号デバイス101において実行する方法のステップと、対応するビット・ストリーム・ソース100において実行するステップを、一般的な用語で示すものである。   The general principles on which the proposed method is based will be described with reference to the two flowcharts of FIGS. 1a and 1b, respectively, where these flowcharts are encoded from a bit stream source 100 such as a terminal or server. The method steps performed in the decoding device 101 for receiving and processing multimedia content in the form of a compressed bit stream and the steps performed in the corresponding bit stream source 100 are indicated in general terms. is there.

ビット・ストリーム・ソース100で実行する総てのステップは、従来のマルチメディア配信法を実行する従来のステップとして参照できることを理解すべきである。   It should be understood that all steps performed in the bit stream source 100 can be referred to as conventional steps for performing conventional multimedia delivery methods.

ビデオ・ビット・ストリームの場合、そのようなビデオ配信は、ビデオ・ストリーム、ビデオ電話サービス、又は、圧縮ビデオ配信を可能にする任意の他のサービスに関連し得る。そのようなサービスは、例えばMBMS又はDVB−Hの様な移動TV、ビデオ会議、例えばDVB−T、DBV−C又はDVB−Sの様なディジタルで放送されるTVの任意のものに関連し得る。復号デバイスとして使用する端末は、例えば移動装置、ビデオ会議端末、セット・トップ・ボックス(STB)又は圧縮ビデオを復号するように構成された任意の他のタイプの端末であり得る。   In the case of a video bit stream, such video delivery may be related to a video stream, video telephony service, or any other service that enables compressed video delivery. Such services may relate to any mobile TV such as MBMS or DVB-H, video conferencing, eg digitally broadcast TV such as DVB-T, DBV-C or DVB-S. . A terminal used as a decoding device may be, for example, a mobile device, a video conferencing terminal, a set top box (STB) or any other type of terminal configured to decode compressed video.

図1aは、例えば圧縮ビデオのようなマルチメディア・コンテンツが送信され得る通信ネットワーク102を介して接続される2つのエンティティでの方法のステップを示すが、本明細書で提案するパラメータ抽出機構は、ネットワークが全く存在せず、よって、代わりに復号デバイスが、符号化ビット・ストリームを、復号デバイスに統合されているビット・ストリーム・ソース又は復号デバイスと直接接続されているビット・ストリーム・ソースから符号化ビット・ストリームを受信する場合にも適用できることを理解すべきである。   FIG. 1 a shows the method steps at two entities connected via a communication network 102 where multimedia content such as compressed video can be transmitted, but the parameter extraction mechanism proposed here is: There is no network at all, so instead the decoding device encodes the encoded bit stream from a bit stream source integrated in the decoding device or directly connected to the decoding device. It should be understood that the present invention can also be applied when receiving a coded bit stream.

図1aの簡略化したシナリオで、例えば送信端末又はサーバのようなビット・ストリーム・ソース100は、第1のステップ1:1で、ビット・ストリーム・ソースからビデオ又は任意のタイプのマルチメディア・コンテンツを獲得する。マルチメディア・コンテンツは、次のステップ1:2に示すように、従来からの任意のタイプの符号化技術を使用して符号化され、その後符号化ビット・ストリームは、次のステップ1:3に示すように、ネットワーク102を介して復号デバイス100に送信される(通信ネットワークを必要としなければ、復号デバイス100に直接提供される)。   In the simplified scenario of FIG. 1a, a bit stream source 100, such as a sending terminal or server, for example, in a first step 1: 1, video or any type of multimedia content from the bit stream source. To win. The multimedia content is encoded using any conventional type of encoding technique, as shown in the next step 1: 2, and then the encoded bit stream is transferred to the next step 1: 3. As shown, it is transmitted to the decoding device 100 via the network 102 (provided directly to the decoding device 100 if no communication network is required).

別のステップ1:4で示すように、受信端末100で一度受信されると、別のステップ1:5で示すように、1つ以上の予め定めたパラメータの形式で、符号化の複雑度関連情報が、ビデオ・ビット・ストリームから、典型的には、ビデオ・ビット・ストリームの解析により抽出される。   As shown in another step 1: 4, once received at the receiving terminal 100, the coding complexity is related in the form of one or more predetermined parameters as shown in another step 1: 5. Information is extracted from the video bit stream, typically by analysis of the video bit stream.

上述した様に、例えば、他の品質に関するパラメータのような追加パラメータを、複雑度に関するパラメータに加えて抽出することができる。   As described above, additional parameters, such as other quality parameters, can be extracted in addition to the complexity parameters.

次のステップ1:6で、抽出したパラメータを処理し、1つ以上のデータ設定を選択できるようにする。結果として得られるデータ設定は、代替ステップ1:7aとして示す代替パスのように、ビット・ストリームの復号において、或いは、別の代替ステップ1:7cでのビット・ストリーム品質スコアの計算のために、ステップ1:7bで示すように、ビット・ストリーム品質モデルへの入力として使用することができる。   In the next step 1: 6, the extracted parameters are processed so that one or more data settings can be selected. The resulting data settings are either in the decoding of the bit stream, as in the alternative path shown as alternative step 1: 7a, or for the calculation of the bit stream quality score in another alternative step 1: 7c. Step 1: As shown in 7b, can be used as input to the bit stream quality model.

次のステップ1:8で、ビット・ストリームを復号し、パラメータ処理の結果は、以下に詳細を説明する手順の任意のもので使用することができる。しかしながら、パラメータ抽出手順の目的がステップ1:7b及び1:7cで示す、ビット・ストリーム品質スコアを取得することであれば、ステップ1:8の復号ステップは従来方法で実行することができる。最終ステップ1:9で、符号化マルチメディア・コンテンツをエンド・ユーザに表示又は提示することができる。   In the next step 1: 8, the bit stream is decoded and the results of the parameter processing can be used in any of the procedures detailed below. However, if the purpose of the parameter extraction procedure is to obtain a bit stream quality score as indicated by steps 1: 7b and 1: 7c, the decoding step of step 1: 8 can be performed in a conventional manner. In final step 1: 9, the encoded multimedia content can be displayed or presented to the end user.

別の代替シナリオによれば、提案するパラメータ抽出機構は、例えばネットワーク・ノードの試験ユニットにおいて適用することができ、試験ユニットにおいて、受信符号化ビット・ストリームは解析され、1つ以上の必要とする複雑度に関するパラメータが、ビット・ストリームから抽出され、例えばサービス又は保守の目的で使用され得る。   According to another alternative scenario, the proposed parameter extraction mechanism can be applied, for example, in a test unit of a network node, where the received coded bit stream is analyzed and requires one or more Complexity parameters can be extracted from the bit stream and used, for example, for service or maintenance purposes.

図1bは、そのような代替法のステップを示し、代替法において、受信マルチメディア・コンテンツの描画は行われない。そのような実施形態は、例えば、ビット・ストリーム品質スコアを必要とするネットワーク・ノードに適用可能であり得る。そのようなネットワーク・ノードは、典型的に、一度必要な情報を抽出すると、それに応じてネットワーク・ノードへのビット・ストリームの転送を可能にする従来機能も含んでいる。   FIG. 1b shows such an alternative method step, in which no rendering of the received multimedia content takes place. Such an embodiment may be applicable, for example, to network nodes that require a bit stream quality score. Such network nodes typically also include conventional functions that allow the transfer of a bit stream to the network node once it has extracted the required information.

複雑度関連情報の抽出及び抽出手順の結果として読み出した情報の使用の代替法の詳細を以下に説明する。   Details of an alternative method of extracting complexity-related information and using the information read as a result of the extraction procedure are described below.

図2aは、ビット・ストリーム品質モデルのデータ設定を選択するために複雑度関連情報を使用するフローチャートであり、ここでは、良好な精度を有するビデオ・ビット・ストリームの品質を推定するために使用するビデオ・ビット・ストリーム品質モデルで例示し、図2bは、提案するパラメータ抽出機構の結果が、どの様に、より効率的な復号手順を取得するための復号サブ・システムの適合化に使用されるかを示すフローチャートである。   FIG. 2a is a flowchart that uses complexity related information to select a data setting for a bit stream quality model, which is used to estimate the quality of a video bit stream with good accuracy. Illustrated in the video bit stream quality model, FIG. 2b shows how the results of the proposed parameter extraction mechanism are used to adapt the decoding subsystem to obtain a more efficient decoding procedure. It is a flowchart which shows.

符号化ビデオ・ビット・ストリームから抽出する複雑度関連情報の、これら代替の利用法は、マルチメディア・システムのエンド・ユーザに表示するビデオの性能改善を得るのに直接的又は間接的に使用され得る。   These alternative uses of complexity-related information extracted from the encoded video bitstream can be used directly or indirectly to obtain improved video performance for display to the end user of the multimedia system. obtain.

図2aによると、ビデオ・ビット・ストリームは、第1のステップ2:1で、ビット・ストリーム・ソースから受信される。   According to FIG. 2a, a video bit stream is received from a bit stream source in a first step 2: 1.

次のステップ2:2で、典型的には、受信符号化ビット・ストリームの少なくとも一部の解析結果として、符号化器の複雑度を示す1つ以上のパラメータが、ビデオ・ビット・ストリームから抽出される。抽出するパラメータは、別のステップ2:3で示すように、予め定義した規則に従い1つ以上のデータ設定を選択するための入力として使用され得る。   In the next step 2: 2, typically one or more parameters indicating the complexity of the encoder are extracted from the video bitstream as a result of the analysis of at least part of the received encoded bitstream. Is done. The parameters to be extracted can be used as input to select one or more data settings according to predefined rules, as shown in another step 2: 3.

既に述べた様に、例えば量子化パラメータのような追加パラメータも、ステップ2:2でビット・ストリームから抽出することができ、そのような場合、1つ以上のデータ設定は、抽出したパラメータの組み合わせを含むデータ入力に基づき選択される。   As already mentioned, additional parameters, for example quantization parameters, can also be extracted from the bit stream in step 2: 2, in which case one or more data settings are a combination of the extracted parameters. Selected based on data input including

一代替実施形態によれば、抽出ステップ2:2で得たデータ入力を、予め定義した複雑度レベルの設定値と比較することで、ステップ2:3を行うことができ、ここで、パラメータ値のある組み合わせは、低い複雑度の符号化を示すものと解釈され、よって、各ビット・ストリームに関連する低い複雑度レベルに結果としてなり得る、別のパラメータ値の組み合わせの評価は、各ビット・ストリームの符号化に関連する低い複雑度レベルに結果としてなり、別のパラメータ値の組み合わせの評価は、符号化のより高い複雑度を表す複雑度レベルの選択に結果としてなり得る。   According to an alternative embodiment, step 2: 3 can be performed by comparing the data input obtained in extraction step 2: 2 with a preset value of a predefined complexity level, where the parameter value Is interpreted as indicating a low complexity encoding, and thus an evaluation of another parameter value combination that may result in a low complexity level associated with each bit stream is The result may be a lower complexity level associated with the encoding of the stream, and the evaluation of another parameter value combination may result in the selection of a complexity level that represents the higher complexity of the encoding.

最終ステップ2:4aで、あるビデオ品質モデルを使用する場合、データ設定が、ビット・ストリーム品質スコアを計算するための入力として使用される。   In the final step 2: 4a, when using a certain video quality model, the data settings are used as input to calculate the bit stream quality score.

図2bに示す様に、ステップ2:1から2:3は、図2aで実行する第1のステップと同一である。しかしながら、ビデオ・ビット・ストリームのビット・ストリーム品質スコアを計算するために品質モデルを使用する場合、精度改善のために情報抽出結果を使用する代わりに、結果は、復号デバイスの復号サブ・システムにおける限られたリソースの1つ以上の特定カテゴリのより効率的な使用を取得するために使用され得る。   As shown in FIG. 2b, steps 2: 1 to 2: 3 are the same as the first step performed in FIG. 2a. However, when using a quality model to calculate the bit stream quality score of a video bit stream, instead of using the information extraction results for accuracy improvement, the results are stored in the decoding subsystem of the decoding device. It can be used to obtain more efficient use of one or more specific categories of limited resources.

ビデオ・ビット・ストリームの符号化の複雑度関連情報を適合化又は最適化する手順に基づくと、典型的には、復号結果を損じることなく、復号の間、リソースのより効率的な使用を結果として得ることができる。   Based on a procedure that adapts or optimizes the complexity related information of the encoding of the video bitstream, typically results in more efficient use of resources during decoding without compromising the decoding result. Can be obtained as

複雑度関連情報は、例えば、種々のイントラ若しくはインター・マクロ・ブロック・パーティション・サイズ、スキップ・マクロ・ブロック(MB)、動きベクトル分解能又はビデオ・ビット・ストリームの符号化の過程で使用する参照画像量に関する情報の存在及び分布といった、符号化の種々の様相を示す情報を含むことができる。   The complexity-related information is, for example, a reference picture used in the process of encoding various intra or inter macro block partition sizes, skip macro blocks (MB), motion vector resolution or video bit stream. Information indicating various aspects of the encoding can be included, such as the presence and distribution of information about the quantity.

例えば、ビット・ストリームの解析によりビデオ・ビット・ストリームから抽出すべき1つの複雑度に関するパラメータは、例えば、ビデオ・ビット・ストリーム符号化の過程で使用したイントラ又はインター・パーティション・サイズのパーセンテージを示すパラメータであり、他のパラメータは、例えば、受信ビデオ・ビット・ストリーム・シーケンスにおけるスキップMBのパーセンテージを示すものであり得る。   For example, one complexity parameter to be extracted from a video bitstream by analyzing the bitstream indicates, for example, the percentage of intra or inter partition size used during the video bitstream encoding process. Parameters, other parameters may indicate, for example, the percentage of skipped MBs in the received video bit stream sequence.

H.264は、イントラ16x16、イントラ8x8及びイントラ4x4と表記される3つの異なるイントラ・パーティション・サイズをそれぞれ定義する。ビデオ・ビット・ストリームで各MBに使用するパーティションは、例えば、符号化に使用するビット数、現エリアを所要品質で符号化する困難度及び/又は符号化器が利用可能な時間及び処理能力のといった種々の観点に基づき符号化器が決定できる。複雑さが少ないビデオ・シーケンスの場合、符号化器は、典型的には、ビデオのビジュアル品質を損じることなく多量のMBをスキップすることができる。   H. H.264 defines three different intra partition sizes, denoted intra 16x16, intra 8x8, and intra 4x4, respectively. The partition used for each MB in the video bit stream may be, for example, the number of bits used for encoding, the difficulty of encoding the current area with the required quality and / or the time and processing power available to the encoder. The encoder can be determined based on various viewpoints. For video sequences with low complexity, the encoder can typically skip large amounts of MB without compromising the visual quality of the video.

処理の制約に伴い低い複雑度を有する符号化器を表すと考えられる符号化器は、総ての利用可能なイントラ・パーティションを検査することなく選択することができるが、符号化の過程で、使用するパーティションについて、符号化手順に関連する検査を、いくつかの好ましいパーティションに制限することは、より複雑な符号化手順と考えられるものにおける場合より、全体的に低い品質の結果を伴う。   Encoders that are considered to represent encoders with low complexity due to processing constraints can be selected without examining all available intra partitions, but in the course of encoding, For the partitions used, restricting the checks associated with the encoding procedure to some preferred partitions is generally accompanied by lower quality results than in what would be considered a more complex encoding procedure.

図3aは、イントラMB300aの典型的例の例であり、イントラMB300aは、対角に位置する2つのイントラ8x8パーティション301、302と、対角に位置する8つのイントラ4x4パーティション303〜310に分割されている。直近の例の典型的な反映は、MB300aのセクション303から306及び307から310がより多くの変化を含み、よって、セクション301及び302より多くの符号化のための容量を必要とする。   FIG. 3a is an example of a typical example of an intra MB 300a. The intra MB 300a is divided into two intra 8 × 8 partitions 301 and 302 located diagonally and eight intra 4 × 4 partitions 303 to 310 located diagonally. ing. A typical reflection of the most recent example is that sections 303 to 306 and 307 to 310 of MB 300a contain more changes, thus requiring more capacity for encoding than sections 301 and 302.

インターMBに対し、H.264は、7つの異なるパーティション・サイズ、つまり、16x16、16x8、8x16、8x8、8x4、4x8及び4x4を定義している。イントラMBと同様に、符号化器は、これら利用可能なインターMBのどれを、符号化手順で使用するかを決定しなければならない。   H. Inter MB H.264 defines seven different partition sizes: 16x16, 16x8, 8x16, 8x8, 8x4, 4x8 and 4x4. As with intra MBs, the encoder must determine which of these available inter MBs to use in the encoding procedure.

またインターMBの検査についても、総ての可能なパーティションを検査することは、符号化器の処理が大変大きくなり、複雑さの低い符号化器のコストでは、実行可能ですらない。   Also for inter MB checking, checking all possible partitions is not feasible at the cost of a low complexity encoder because the encoder processing is very large.

図3bは、インターMB300bの典型的な例であり、インターMB300bは、符号化の過程で、1つの16x8パーティション311と、2つの8x4パーティション312及び313と、1つの4x8パーティション314と、2つの4x4パーティション315及び316とに分割されている。   FIG. 3b is a typical example of inter MB 300b, which inter 16300 in the process of encoding, one 16x8 partition 311, two 8x4 partitions 312 and 313, one 4x8 partition 314, and two 4x4. It is divided into partitions 315 and 316.

MBが、前の画像の対応するMBに非常に似ているとき、或いは、利用可能なビット数がMBの符号化のためには少なすぎると考えられるとき、符号化器はMBのスキップを選択することができる。   When the MB is very similar to the corresponding MB of the previous image, or when the number of available bits is considered too low for MB encoding, the encoder chooses to skip the MB can do.

動きベクトルの場合、H.264は、3つの分解能、つまり、整数ピクセル、ハーフ・ピクセル及びクオータ・ピクセル分解能を定義する。整数ピクセル分解能は、符号化器/復号器が扱う最も簡単な分解能であり、ハーフ・ピクセル及びクオータ・ピクセル分解能を扱うためには、隣接ピクセル間の補間を、現参照データに対して実行しなければならない。ハーフ・ピクセルの補間の実行には、6タップのFIRフィルタが一般に使用され、クオータ・ピクセルのためには、バイリニア(bilinear)補間がハーフ・ピクセルに対して実行される。   For motion vectors, H. H.264 defines three resolutions: integer pixel, half pixel and quarter pixel resolution. Integer pixel resolution is the simplest resolution that an encoder / decoder can handle, and to handle half-pixel and quarter-pixel resolution, interpolation between adjacent pixels must be performed on the current reference data. I must. A 6-tap FIR filter is commonly used to perform half pixel interpolation, and for linear pixels, bilinear interpolation is performed on the half pixels.

符号化器は、例えば1つ以上の上述したような基準に基づき各インター・ブロックに使用する精度を決定しなければならない。ハーフ又はクオータ・ピクセル分解能の動きベクトルのそれぞれを検査するために、符号化器は、処理能力を消費する補間を実行しなければならず、画像の種々の部分間の大きな変動により種々のパーティション・サイズを有するMBでは特に消費が大きくなる。   The encoder must determine the accuracy to use for each inter block based on, for example, one or more criteria as described above. In order to examine each of the half or quarter pixel resolution motion vectors, the encoder must perform interpolation which consumes processing power, and the various variations of the partition due to large variations between different parts of the image. The consumption is particularly large in the MB having the size.

例えば符号化器で整数ピクセル分解能のみを使用することを選択することにより、計算の複雑度は、符号化器及び復号器側の両方において減少し得る。   For example, by choosing to use only integer pixel resolution at the encoder, the computational complexity may be reduced on both the encoder and decoder side.

ビデオ・ビット・ストリームにおいて幾つかの参照フレームの使用が可能であるので、そのような決定は、符号化及び復号の計算能力にも影響を及ぼし得る。   Such determination can also affect the computational power of encoding and decoding since several reference frames can be used in the video bitstream.

符号化器側では、これは検査しなければならない参照データ量の増加に結果としてなりえ、これは最終的に計算能力の需要増加に結果としてなるであろう。   On the encoder side, this can result in an increase in the amount of reference data that must be examined, which will ultimately result in an increase in demand for computing power.

復号器側では、参照データを、同じフレームにおいて、複数回、メモリの異なる部分から読み出す必要があるため、複数の参照フレームの使用は、復号を実行するために残す計算能力を減少させる。またこの特定の状況において、符号化器は、使用する参照フレーム数について決定しなければならない。また、その決定は、例えば使用ビット数、現エリアの良好な品質での符号化の困難さの度合い及び符号化器が利用可能な時間と処理能力のような、種々の観点に基づき行うことができる。   On the decoder side, reference data needs to be read from different parts of the memory multiple times in the same frame, so the use of multiple reference frames reduces the computational power left to perform decoding. Also in this particular situation, the encoder must decide on the number of reference frames to use. The determination can be made based on various viewpoints such as the number of bits used, the degree of difficulty in encoding with good quality in the current area, and the time and processing capacity available for the encoder. it can.

従って、符号化ステップでの複雑度レベルの表示を取得する複数の方法がある。符号化ビット・ストリームから、ある予め定義したパラメータを抽出し、これらのパラメータをパラメータに応じて処理することにより、典型的には、従来のデータ抽出手段により、符号化の後に、ビット・ストリーム・ソースで符号化器が使用した複雑度関連情報を取得することができる。抽出パラメータの評価の過程で使用する複雑度レベルを定義することにより、必要とする複雑度レベルの測定は、複雑度のより予測可能な表示を与えることができる。   Thus, there are multiple ways to obtain an indication of the complexity level at the encoding step. By extracting certain predefined parameters from the encoded bit stream and processing these parameters according to the parameters, typically by conventional data extraction means, after encoding, the bit stream Complexity related information used by the encoder at the source can be obtained. By defining the complexity level used in the process of evaluating the extraction parameters, the measurement of the required complexity level can give a more predictable indication of the complexity.

例えば、復号デバイスでの符号化ビット・ストリームの復号に関連する符号化ビット・ストリーム、或いは、ネットワーク・ノードでの符号化ビット・ストリームの処理に関連する符号化ビット・ストリームから、以下のパラメータを抽出することができる。
P1=イントラ16x16パーティションの割合
P2=イントラ8x8パーティションの割合
P3=イントラ4x4パーティションの割合
P4=インター16x16パーティションの割合
P5=インター16x8パーティションの割合
P6=インター8x16パーティションの割合
P7=インター8x8パーティションの割合
P8=インター4x8パーティションの割合
P9=インター8x4パーティションの割合
P10=インター4x4パーティションの割合
P11=参照画像数(nbrRef)
P12=動きベクトル分解能表現(MVres)
ここで、例えば、整数ピクセル分解能を使用する場合はMVresを1に、ハーフ・ピクセル分解能を使用する場合はMVresを2に設定することができる。
P13=平均量子化パラメータ(AQP)
P14=平均フレーム速度(AFR)
For example, from the coded bit stream associated with the decoding of the coded bit stream at the decoding device or the coded bit stream associated with processing the coded bit stream at the network node, the following parameters are set: Can be extracted.
P1 = Intra 16 × 16 partition ratio P2 = Intra 8 × 8 partition ratio P3 = Intra 4 × 4 partition ratio P4 = Inter 16 × 16 partition ratio P5 = Inter 16 × 8 partition ratio P6 = Inter 8 × 16 partition ratio P7 = Inter 8 × 8 partition ratio P8 = Inter 4x8 partition ratio P9 = inter 8x4 partition ratio P10 = inter 4x4 partition ratio P11 = number of reference images (nbrRef)
P12 = motion vector resolution expression (MVres)
Here, for example, MVres can be set to 1 when integer pixel resolution is used, and MVres can be set to 2 when half pixel resolution is used.
P13 = Average quantization parameter (AQP)
P14 = Average frame rate (AFR)

上記例示的な抽出パラメータは、例えば、予測品質スコア(PQS)モデルとして参照する以下の品質モデルの様な、線形品質モデルで使用することができる。
PQS=a+a×P+a×P+a×P+a×P+a×P
×P+a×P+a×P+a×P+a10×P10
11×P11+a12×P12+a13×P13+a14×P14 (1)
The exemplary extraction parameters can be used in a linear quality model, for example, the following quality model referenced as a predictive quality score (PQS) model.
PQS = a 0 + a 1 × P 1 + a 2 × P 2 + a 3 × P 3 + a 4 × P 4 + a 5 × P 5 +
a 6 × P 6 + a 7 × P 7 + a 8 × P 8 + a 9 × P 9 + a 10 × P 10 +
a 11 × P 11 + a 12 × P 12 + a 13 × P 13 + a 14 × P 14 (1)

あるいは抽出パラメータは、例えば以下のモデルの様な、非線形PQSモデルを使用することができる。
PQS=a+a×P b1+a×P b2+a×P b3+・・・ (2)
Alternatively, a non-linear PQS model such as the following model can be used as the extraction parameter.
PQS = a 0 + a 1 × P 1 b1 + a 2 × P 2 b2 + a 3 × P 3 b3 + (2)

上式で、a、a・・・及びb、b・・・は、ビット・ストリーム品質モデルの特定の係数であり、係数は、例えば、主観試験データに関するビット・ストリーム品質モデル又はPQSモデルの調整により事前選択することができ、或いは、複雑度レベルに基づき選択することができる。本例では、P13及びP14は、複雑度に関するパラメータP1〜P12に加えて使用する品質パラメータである。線形又は非線形品質モデルの計算に基づき、ビット・ストリーム品質スコアが導出される。 Where a 0 , a 1 ... And b 1 , b 2 ... Are specific coefficients of the bit stream quality model, for example, the bit stream quality model for subjective test data or It can be preselected by adjusting the PQS model, or it can be selected based on the complexity level. In this example, P13 and P14 are quality parameters used in addition to the parameters P1 to P12 related to complexity. Based on the calculation of the linear or non-linear quality model, a bit stream quality score is derived.

代わりに事前に定義した複雑度レベルを適用すれば、抽出したパラメータ・セットの予め定義した組み合わせが、例えば、閾値として定義され得る1つ以上の予め定義された複雑度レベルと、典型的には、比較され得る。   Instead, applying a predefined complexity level, a predefined combination of extracted parameter sets can typically be defined as, for example, one or more predefined complexity levels that can be defined as thresholds, and Can be compared.

符号化過程に1つの特定タイプのパーティションのみが存在することは、ビット・ストリーム・ソースで高い複雑度の符号化が使用されたことの、ビット・ストリーム品質スコアを必要とする復号デバイス又はネットワーク・ノードへの指示であり得る。   The presence of only one specific type of partition in the encoding process means that a decoding device or network that requires a bit stream quality score indicates that a high complexity encoding was used at the bit stream source. It can be an instruction to the node.

例えば、イントラ4x4パーティションをビット・ストリーム・ソースでの符号化で使用したことを復号デバイスが認識すれば、つまり、P3が復号デバイスで抽出され、P3P3が0以外の値を持てば、これは高い複雑度レベル、例えば、1から4のスケールでレベル4の複雑度を選択すべきとの指示であり、P3が0であれば、レベル4より小さな複雑度が代わりに選択されるべきことの指示であり得る。どの様に複雑度レベルを、1つ以上のパラメータに依存させるかの他の規則も、複数の可能な組み合わせにより事前に規定することができる。   For example, if the decoding device recognizes that an intra 4x4 partition was used for encoding at the bit stream source, that is, if P3 is extracted by the decoding device and P3P3 has a non-zero value, this is high An indication that a complexity level, for example, a level 4 complexity should be selected on a scale of 1 to 4, and if P3 is 0, an indication that a complexity less than level 4 should be selected instead It can be. Other rules on how complexity levels depend on one or more parameters can also be pre-defined by multiple possible combinations.

抽出情報を、復号サブ・システムの適合化に使用するのであれば、上述したのと同様の方法で、1つ以上のパラメータのある組み合わせと、予め定義した複雑度レベル・セットとをまず比較することにより間接的に、入力パラメータとして直接的に使用することができる。結果に基づき、復号器のあるアクセラレーション・ブロックは、消費電力を抑えるために動作停止とし、及び/又は、割り当てメモリ空間を節約するために、幾つかのメモリブロックを解放することができる。   If the extracted information is to be used for adaptation of the decoding subsystem, it first compares a certain combination of one or more parameters with a predefined complexity level set in the same way as described above. This can be used indirectly as an input parameter. Based on the results, an acceleration block with a decoder can be deactivated to reduce power consumption and / or some memory blocks can be released to save allocated memory space.

復号器サブ・システムの適合化は、複雑度関連情報によりサブ・システムを準備するステップを含むことができる。例えば、抽出情報からハーフ・ピクセル分解能を使用すると決定した場合、復号器で補間が必要となり、よって、復号器サブ・システムを適合化する場合、この特定タスクのために構成する復号器サブモジュールを動作させることができる。   Decoder sub-system adaptation may include preparing the sub-system with complexity related information. For example, if it is determined from the extracted information that half pixel resolution is to be used, the decoder will require interpolation, so when adapting the decoder sub-system, the decoder sub-module configured for this particular task will be It can be operated.

上記説明では、H.264を、符号化/復号過程で生じる例示的な問題のために使用したが、本明細書で提案する解決策は、H.264のみに限定されず、例えば、H.261、H.263、MPEG−2及びMPEG−4のような、他の類似タイプのビデオ・コーデックにも適用できることを理解すべきである。符号化過程で使用するパーティション・サイズ及び動きベクトル分解能は、他のコーデックと同じではないが、原理は同じである。   In the above description, H.C. H.264 has been used for exemplary problems that arise in the encoding / decoding process, the solution proposed here is the H.264 standard. For example, H.264 is not limited thereto. 261, H.H. It should be understood that it can be applied to other similar types of video codecs, such as H.263, MPEG-2 and MPEG-4. The partition size and motion vector resolution used in the encoding process are not the same as other codecs, but the principle is the same.

上記実施形態のいずれかに従い、上述した複雑度関連情報以外のタイプの複雑度関連情報もビデオ・ビット・ストリーム又は任意の他のマルチメディア・ビット・ストリームから抽出でき処理できることも理解すべきである。   It should also be understood that in accordance with any of the above embodiments, types of complexity related information other than the complexity related information described above can also be extracted and processed from a video bit stream or any other multimedia bit stream. .

図4を参照して、品質モデルへの入力として、ビット・ストリーム品質モデル及び符号化器の複雑度を示す1つ以上のパラメータを使用することにより、ビット・ストリーム品質スコアを提供するように構成された例示的装置について説明する。   Referring to FIG. 4, configured to provide a bit stream quality score by using a bit stream quality model and one or more parameters indicating encoder complexity as input to the quality model. An exemplary apparatus will be described.

図4は、例示的な装置400を示し、装置400は、ここでは、ビット・ストリーム・ソース100から例えばビデオ・ビット・ストリームのような符号化ビット・ストリームを受信する、例えば、メディア品質監視デバイスとして参照される。装置400と共に、ビット・ストリーム・ソース100は、マルチメディア・システム401を形成し、図によると、システムにおいては、2つのユニット間に直接アクセスが提供されている。図1a及び1bで既に述べた様に、ビット・ストリームを、ビット・ストリーム・ソース100から装置400に、図に示すように、直接的に配信することができるが、任意のタイプの従来の通信ネットワークを介して配信することができることも理解すべきである。   FIG. 4 illustrates an example apparatus 400 that receives an encoded bit stream, such as a video bit stream, from a bit stream source 100, eg, a media quality monitoring device. Referred to as Together with the device 400, the bit stream source 100 forms a multimedia system 401, according to the figure, where direct access is provided between two units. As already described in FIGS. 1a and 1b, the bit stream can be delivered directly from the bit stream source 100 to the device 400, as shown, but any type of conventional communication. It should also be understood that it can be distributed over a network.

描画デバイスの一部であり、図ではネットワーク・ノード/復号デバイス402として参照する復号機能を含む装置400又はネットワーク・ノードは、受信ビット・ストリームを表すビット・ストリーム品質スコアを導出するよう構成され、本明細書ではパラメータ抽出ユニット400aと呼ぶユニットを含み、パラメータ抽出ユニット400aは、1つ以上の予め定義したパラメータ形式の情報を抽出するように構成され、抽出情報は、少なくともある程度、ビット・ストリーム・ソース100での符号化において使用した複雑度を示し、言い換えると、抽出情報は、符号化で使用した複雑度レベルの表示を与え、この指示は、符号化ビット・ストリームのその後の復号又は処理において解釈され得る。装置400は、本明細書で制御ユニット400bと呼ぶ別のユニットをも含み、制御ユニット400bは、ビット・ストリーム品質モデルに対し予め定義された複数の可能なデータ設定から、ビット・ストリーム品質モデルのデータ設定を選択するように構成される。受信ビット・ストリームを表すビット・ストリーム品質スコアが、その後、選択したデータ設定に基づき計算される。これは典型的には、制御ユニット400bにより達成され、要求されたビット・ストリーム品質スコアの計算に使用する予め定義された品質モデルに、選択したデータ設定を使用することを保証する。そのような計算手順は、例示的な構成によれば、図4の品質モデル・ユニット400dのような個別ユニットにおいて実行され得る。   An apparatus 400 or network node that is part of a drawing device and includes a decoding function, referred to as network node / decoding device 402 in the figure, is configured to derive a bit stream quality score representing the received bit stream; This specification includes a unit referred to herein as parameter extraction unit 400a, which is configured to extract information in one or more predefined parameter formats, the extraction information comprising at least in part a bit stream, Indicates the complexity used in the encoding at the source 100, in other words, the extracted information gives an indication of the complexity level used in the encoding, and this indication can be used in subsequent decoding or processing of the encoded bit stream. Can be interpreted. The apparatus 400 also includes another unit, referred to herein as a control unit 400b, which is configured to generate a bit stream quality model from a plurality of pre-defined data settings for the bit stream quality model. Configured to select data settings. A bit stream quality score representing the received bit stream is then calculated based on the selected data settings. This is typically accomplished by the control unit 400b and ensures that the selected data settings are used for the predefined quality model used to calculate the requested bit stream quality score. Such a calculation procedure may be performed in an individual unit, such as the quality model unit 400d of FIG. 4, according to an exemplary configuration.

一実施形態によれば、制御ユニット400bは、1つ以上の抽出パラメータをこの決定への直接的な入力として使用して、1つ以上の適切なデータ設定を決定するように構成され得る。あるいは、制御ユニット400bは、抽出情報と予め定義した複雑度レベル・セットとの比較に基づき、そのような決定を行うことができ、予め定義した複雑度レベル・セットは、本明細書で複雑度レベル・データベース400cと呼ぶデータベースから、典型的には取得することができる。   According to one embodiment, control unit 400b may be configured to determine one or more appropriate data settings using one or more extraction parameters as a direct input to this determination. Alternatively, the control unit 400b can make such a determination based on a comparison between the extracted information and a predefined complexity level set, which is defined herein as a complexity level set. It can typically be obtained from a database called level database 400c.

複雑度に関するパラメータのみに基づき決定する代わりに、制御ユニット400bは、受信ビデオ・ビット・ストリームから抽出可能な、例えば量子化パラメータ、フレーム速度、ビット速度及び/又は1つ以上の他の品質に関するパラメータのような、他の情報も考慮するように構成され得る。後者の場合、パラメータ抽出ユニット400aは、この追加タイプのパラメータも抽出するように構成され得る。または、そのようなパラメータは、別の(図示しない)パラメータ抽出ユニットから抽出されるかもしれない。   Instead of determining based solely on the complexity parameters, the control unit 400b may extract from the received video bit stream, eg, quantization parameters, frame rate, bit rate and / or one or more other quality parameters. Other information may also be considered, such as In the latter case, the parameter extraction unit 400a may be configured to also extract this additional type of parameter. Alternatively, such parameters may be extracted from another (not shown) parameter extraction unit.

結果、制御ユニット400bは、1つ以上の抽出パラメータの関数として、1つ以上のデータ設定を選択するように構成され、これらのデータ設定は、品質モデル・ユニット400dで実行するビット・ストリーム品質モデルのデータ入力に使用される。一度導出すると、結果として得られるビット・ストリーム品質スコアは、品質モデル・ユニット400dから転送され、或いは、QoEサーバ又は符号化ビット・ストリームのビット・ストリーム品質スコアを必要とするであろう任意の他のタイプのエンティティによって読み出され得る。   As a result, the control unit 400b is configured to select one or more data settings as a function of one or more extraction parameters, which data settings are executed by the quality model unit 400d. Used for data entry. Once derived, the resulting bit stream quality score is transferred from the quality model unit 400d, or any other that would require the bit stream quality score of the QoE server or encoded bit stream. Can be read by any type of entity.

あるいは、ビット・ストリーム品質スコアは、ネットワーク・ノード/復号デバイスにおいて直接監視され、ネットワーク・ノード/復号デバイスにおいて、ビット・ストリーム品質スコアは、任意のタイプの従来方法で測定される。   Alternatively, the bit stream quality score is monitored directly at the network node / decoding device, where the bit stream quality score is measured by any type of conventional method.

上述した抽出機能と、読み出したビット・ストリーム品質スコアを利用する任意の他の従来機能に加えて、装置400は、例えば復号機能及び/又は例えばビデオの表示若しくはビデオのルーティングを可能にする、受信符号化ビット・ストリームの従来処理を可能にする機能のような、他の従来機能も含むことができる。   In addition to the extraction function described above and any other conventional function that utilizes the read bit stream quality score, the device 400 can receive, for example, a decoding function and / or a video display or video routing, for example. Other conventional functions can also be included, such as functions that allow conventional processing of the encoded bit stream.

このタイプのオプション機能は、提案する抽出機構の理解には必要ではないので、本装置のために、そのような追加機能のさらなる説明は行わない。   Since this type of optional functionality is not necessary for understanding the proposed extraction mechanism, no further description of such additional functionality will be given for this device.

上述した様に、提案するパラメータ抽出法は、代替実施形態によれば、復号サブ・システムのリソース使用について、復号手順の最適化に努めるため、復号デバイスの復号サブ・システム適合化の目的に使用され得る。   As described above, the proposed parameter extraction method, according to an alternative embodiment, is used for the purpose of adaptation of the decoding device to the decoding subsystem, in order to optimize the decoding procedure for the resource usage of the decoding subsystem. Can be done.

そのような適合化又は最適化手順は、種々の代替法で構成され得る。第1の実施形態によれば、復号の開始前に、符号化ビット・ストリームを解析することができる。そのような構成は、しかしながら、ビット・ストリームのバッファリングを必要とし、よって、そのような手順を適用する場合、符号化ビット・ストリームが提供するマルチメディア・コンテンツの最適な表示は遅延するかもしれない。   Such an adaptation or optimization procedure can be configured in various alternative ways. According to the first embodiment, the encoded bit stream can be analyzed before the start of decoding. Such a configuration, however, requires buffering of the bit stream, so when applying such a procedure, the optimal display of multimedia content provided by the encoded bit stream may be delayed. Absent.

これらの個別手順をそれぞれステップ5:1a及び5:1bとしてそれぞれ示す。   These individual procedures are shown as steps 5: 1a and 5: 1b, respectively.

図5は、そのような適合化/最適化機構を示している。図に示す様に、ビット・ストリーム・ソース100から復号サブ・システム500に提供される符号化ビット・ストリームは、バッファ502によりまずバッファリングされ、同時に、1つ以上の符号化の複雑度に関するパラメータが、適合化ユニット501により符号化ビット・ストリームから抽出される。   FIG. 5 shows such an adaptation / optimization mechanism. As shown, the encoded bit stream provided from the bit stream source 100 to the decoding subsystem 500 is first buffered by a buffer 502 and at the same time one or more parameters related to encoding complexity. Are extracted from the encoded bit stream by the adaptation unit 501.

抽出されたパラメータは、別のステップ5:2で示すように、適合化ユニット501により処理される。この処理ステップは、1つ以上の抽出パラメータの関数として直接的又は間接的に、つまり、抽出情報と、予め定義した複雑度レベル・セットとの比較後に、1つ以上のデータ設定を選択するステップを含んでいる。データ設定に基づき、復号サブ・システム500は適合化され、僅かなリソースの1つ以上のカテゴリの使用又は復号サブ・システムの他の選択可能な機能が、適合化され得る。そのような適合化ステップをステップ5:3に示す。一度適合化されると、符号化ビット・ストリームからのコンテンツを、復号処理において復号することができ、復号処理でステップ5:4で示すように、復号サブ・システム500の種々の部分をより効率的な方法で使用する。   The extracted parameters are processed by the adaptation unit 501 as shown in another step 5: 2. This processing step directly or indirectly as a function of one or more extraction parameters, i.e. selecting one or more data settings after comparing the extraction information with a predefined complexity level set. Is included. Based on the data settings, the decoding subsystem 500 can be adapted and the use of one or more categories of few resources or other selectable functions of the decoding subsystem can be adapted. Such an adaptation step is shown in step 5: 3. Once adapted, the content from the encoded bit stream can be decoded in the decoding process, which makes the various parts of the decoding subsystem 500 more efficient as shown in step 5: 4 in the decoding process. Use in a typical way.

図6を参照して次に説明する別の代替実施形態によれば、復号サブ・システム600は、従来手順に従い、つまり、復号手順の適合化を最初に可能としない手順により、受信符号化ビット・ストリームの復号を開始する。   According to another alternative embodiment described next with reference to FIG. 6, the decoding subsystem 600 follows the conventional procedure, ie, the received encoded bits according to a procedure that does not initially allow adaptation of the decoding procedure. Start decoding the stream.

第1のステップ6:1で、符号化ビット・ストリームをビット・ストリーム・ソース100から受信する。復号サブ・システム600により一度受信されと、符号化ビット・ストリームを、処理ステップ6:2aで示すように、任意の従来の復号技術を使用して復号する。同時に、適合化ユニット601は、別のステップ6:2bで示すように、受信ビット・ストリームから1つ以上の予め定義した複雑度に関するパラメータを抽出する。適合化ユニット601は、図5の対応する処理ステップ5:2に従い、抽出パラメータを処理する。これを図6の別の処理ステップ6:3に示す。   In a first step 6: 1, an encoded bit stream is received from the bit stream source 100. Once received by decoding subsystem 600, the encoded bit stream is decoded using any conventional decoding technique, as indicated by processing step 6: 2a. At the same time, the adaptation unit 601 extracts one or more predefined complexity parameters from the received bit stream, as shown in another step 6: 2b. The adaptation unit 601 processes the extraction parameters according to the corresponding processing step 5: 2 in FIG. This is shown in another processing step 6: 3 in FIG.

一度処理すると、適切なデータ設定は、復号サブ・システム600への入力として使用され、その後、復号サブ・システム600が予め定義した規則に従い適合化される。これをステップ6:4に示す。最終ステップ6:5で示すように、ステップ6:4で実行した適合化に従い、復号手順が実行される。   Once processed, the appropriate data settings are used as input to the decryption subsystem 600, after which the decryption subsystem 600 is adapted according to predefined rules. This is shown in step 6: 4. As shown in the final step 6: 5, the decoding procedure is performed according to the adaptation performed in step 6: 4.

上記の提案した何れかの実施形態により説明される適合化は、制限された時間間隔の間に実行され、或いは、連続的に反復され、それにより復号サブ・システムを連続して適合化させることができることを理解すべきである。   The adaptation described by any of the proposed embodiments above can be performed during a limited time interval or iteratively repeated, thereby continuously adapting the decoding subsystem. It should be understood that

図5及び6の実施形態は、単に概要的、単純化したシステムの概略であり、提案する適合化機構の理解に不要な追加のシステム・エンティティ及びステップは省略されていることも理解すべきである。   It should also be understood that the embodiments of FIGS. 5 and 6 are merely schematic and simplified system schematics, omitting additional system entities and steps that are not necessary for understanding the proposed adaptation mechanism. is there.

例えば、符号化ビット・ストリームは、典型的には、通信ネットワークを介して復号サブ・システム及び適合化ユニットに提供される。典型的には、復号サブ・システムは、描画機能、つまり、復号ビデオのエンド・ユーザへの表示を可能にするある種の表示手段にも接続される。   For example, the encoded bit stream is typically provided to the decoding subsystem and adaptation unit via a communication network. Typically, the decoding subsystem is also connected to some kind of display means that allows rendering functions, ie the display of the decoded video to the end user.

図5及び6を参照して、上述した何れかの実施形態による、復号サブ・システムの適合化を実行するように構成された例示的な装置について、図7を参照してさらに詳細に説明する。   With reference to FIGS. 5 and 6, an exemplary apparatus configured to perform decoding subsystem adaptation according to any of the embodiments described above will be described in further detail with reference to FIG. .

図4と同様に、図7は、ビット・ストリーム・ソース100から符号化ビット・ストリームを受信して復号するように構成された装置700を示し、ビット・ストリーム・ソース100は、装置700と共にマルチメディア・システム701を形成し、マルチメディア・システム701において、これら2つのエンティティは、図に示すように直接的に相互接続されるか、ネットワーク経由で相互接続される。   Similar to FIG. 4, FIG. 7 shows an apparatus 700 configured to receive and decode an encoded bit stream from the bit stream source 100, and the bit stream source 100 along with the apparatus 700 Forming a media system 701, where these two entities are interconnected either directly as shown or interconnected via a network.

図4の装置と同様に、各装置の理解に必要なユニットのみを図に示していることも理解すべきである。   It should also be understood that, as with the device of FIG. 4, only the units necessary for understanding each device are shown.

典型的には、復号デバイス702の一部である図7の装置700は、パラメータ抽出ユニット700aを含み、パラメータ抽出ユニット700aは、典型的には、図4のパラメータ抽出ユニット400a、つまり、符号化ビット・ストリームを解析する様に構成されたユニットに対応し、よって、1つ以上の予め定義したパラメータの形式の複雑度関連情報を、符号化ビット・ストリームから抽出することを可能にし、或いは、換言すれば、符号化ビット・ストリームの符号化過程で使用する複雑度を示す情報の抽出を可能にする。よって、この抽出情報をそれに応じて処理することにより、先行する符号化処理で使用した複雑度関連情報を使用することが可能になる。   The apparatus 700 of FIG. 7 that is typically part of the decoding device 702 includes a parameter extraction unit 700a, which is typically the parameter extraction unit 400a of FIG. Corresponding to a unit configured to parse the bit stream, thus allowing complexity related information in the form of one or more predefined parameters to be extracted from the encoded bit stream, or In other words, it is possible to extract information indicating the complexity used in the encoding process of the encoded bit stream. Therefore, by processing this extracted information accordingly, it becomes possible to use the complexity related information used in the preceding encoding process.

装置700は、パラメータ抽出ユニット700aから取得する抽出情報に従い、1つ以上のデータ設定を選択するように構成された制御ユニット700bを備えている。パラメータ抽出ユニット700a及び制御ユニット700bは、共に図5及び6にそれぞれ示す、適合化ユニット501、601を形成する。1つ以上の抽出パラメータに依存する規則に従いデータ設定は選択され、或いは、本明細書で複雑度レベル・データベース700cと呼ぶデータベースから典型的にはアクセス可能である、予め定義した複雑度レベル・セットとの比較結果としてデータ設定は選択され得る。   The apparatus 700 comprises a control unit 700b configured to select one or more data settings according to the extraction information obtained from the parameter extraction unit 700a. The parameter extraction unit 700a and the control unit 700b together form an adaptation unit 501, 601 shown in FIGS. 5 and 6, respectively. A data set is selected according to rules that depend on one or more extraction parameters, or a predefined complexity level set that is typically accessible from a database referred to herein as the complexity level database 700c. The data setting can be selected as a result of the comparison.

装置700が、図5を参照して説明した第1の実施形態による方法を実行するように構成されるのであれば、装置700は、符号化ビット・ストリームから情報を抽出するのと並行して、符号化ビット・ストリームをバッファリングするように構成されるバッファ700eも備えている。   If the device 700 is configured to perform the method according to the first embodiment described with reference to FIG. 5, the device 700 is parallel to extracting information from the encoded bit stream. Also provided is a buffer 700e configured to buffer the encoded bit stream.

装置700が、図6を参照して説明した第2の実施形態による方法に使用されるのであれば、復号サブ・システム700dは、パラメータ抽出ユニット700aにより、ビデオ・ビット・ストリームから抽出された複雑度関連情報を受信して処理するように構成される制御ユニット700bと同時に、ビット・ストリーム・ソース100から提供される符号化ビット・ストリームを受信するであろう。   If the apparatus 700 is used in the method according to the second embodiment described with reference to FIG. 6, the decoding sub-system 700d is a complex extracted from the video bitstream by the parameter extraction unit 700a. At the same time as the control unit 700b configured to receive and process the degree related information, the encoded bit stream provided from the bit stream source 100 will be received.

特定の例示的な実施形態を参照して本発明を説明したが、本説明は広く本発明の概念の説明を目的とし、本発明の範囲を限定するものと解釈すべきではなく、本発明の範囲は添付の特許請求の範囲により規定される。   Although the invention has been described with reference to specific exemplary embodiments, the description is intended to be broadly illustrative of the concepts of the invention and should not be construed as limiting the scope of the invention. The scope is defined by the appended claims.

具体的には、図4で提案する装置や、図7を参照して説明した装置は、符号化ビット・ストリームから、複雑度関連情報を抽出し、記載した実施形態にその情報を使用するために、どの様に装置又はネットワーク・ノードを構成するかについての、簡略化した例を表示するのみであり、このタイプの装置において広く使用される機能エンティティであるが、本明細書の範囲である抽出機構の理解に不要なものについては、簡略化のために各図において省略されていることを理解すべきである。   Specifically, the apparatus proposed in FIG. 4 and the apparatus described with reference to FIG. 7 extract complexity related information from the encoded bit stream and use the information in the described embodiment. Only show a simplified example of how to configure a device or network node, which is a functional entity widely used in this type of device, but is within the scope of this document. It should be understood that parts unnecessary for understanding the extraction mechanism are omitted in each figure for the sake of brevity.

略語リスト
DVB−H ディジタル・ビデオ放送
DVB−T ディジタル・ビデオ地上放送
DVB−C ディジタル・ビデオ放送
DVB−S ディジタル・ビデオ放送
FR フル・リファレンス
MB マクロ・ブロック
MBMS マルチメディア放送マルチキャスト・サービス
MOS 平均オピニオン・スコア
NR ノー・リファレンス
PEVQ ビデオ品質知覚評価
PSNR ピーク信号対雑音比
OoE 経験品質
RR リデュースド・リファレンス
VQEG ビデオ品質エキスパート・グループ
Abbreviation List DVB-H Digital Video Broadcast DVB-T Digital Video Ground Broadcast DVB-C Digital Video Broadcast DVB-S Digital Video Broadcast FR Full Reference MB Macro Block MBMS Multimedia Broadcast Multicast Service MOS Average Opinion Score NR No Reference PEVQ Video Quality Perception Evaluation PSNR Peak Signal-to-Noise Ratio OoE Experience Quality RR Reduced Reference VQEG Video Quality Expert Group

Claims (22)

復号サブ・システム(500,600)を適合化する復号装置(101,700)における方法であって、
ビット・ストリーム・ソース(100)から符号化ビット・ストリームを受信するステップ(1:4,2:1,6:1)と、
前記符号化ビット・ストリームから、前記ビット・ストリーム・ソース(100)での符号化の複雑度を示す複雑度関連情報を抽出するステップ(1:5,2:2,5:1b,6:2b)と、
抽出した前記複雑度関連情報に基づき、前記復号サブ・システムの少なくとも1つのデータ設定を選択するステップ(1:6,2:3,5:2,6:3)と、
前記データ設定に基づき、前記復号サブ・システムを適合化するステップ(1:7a,2:4b,5:3,6:4)と、
を含むことを特徴とする方法。
A method in a decoding device (101,700) for adapting a decoding subsystem (500,600) comprising:
Receiving an encoded bit stream from a bit stream source (100) (1: 4, 2: 1, 6: 1);
Extracting complexity-related information indicating the complexity of encoding at the bit stream source (100) from the encoded bit stream (1: 5, 2: 2, 5: 1b, 6: 2b) )When,
Selecting at least one data setting of the decoding subsystem based on the extracted complexity related information (1: 6, 2: 3, 5: 2, 6: 3);
Adapting the decoding subsystem based on the data settings (1: 7a, 2: 4b, 5: 3, 6: 4);
A method comprising the steps of:
前記抽出するステップは、
前記符号化ビット・ストリームの少なくとも一部分を解析(5:2)することにより実行される、
ことを特徴とする請求項1に記載の方法。
The extracting step includes:
Performed by parsing (5: 2) at least a portion of the encoded bit stream;
The method according to claim 1.
前記符号化ビット・ストリームの前記少なくとも一部分は、前記復号サブ・システムで前記符号化ビット・ストリームの復号を開始する前に解析(5:2)される、
ことを特徴とする請求項2に記載の方法。
The at least a portion of the encoded bit stream is analyzed (5: 2) before the decoding subsystem starts decoding the encoded bit stream;
The method according to claim 2.
前記抽出するステップ(6:2b)は、
前記符号化ビット・ストリームの復号の間に実行される、
ことを特徴とする請求項1又は2に記載の方法。
The extracting step (6: 2b)
Performed during decoding of the encoded bit stream;
The method according to claim 1 or 2, characterized in that
前記適合化するステップ(1:7a,2:4b,5:3,6:4)は、前記復号サブ・システム内の、計算能力の分散、又は、メモリ、コプロセッサ若しくはアクセラレータ・ブロックの割り当ての少なくとも1つを適合化するステップを含む、
ことを特徴とする請求項1から4のいずれか1項に記載の方法。
The step of adapting (1: 7a, 2: 4b, 5: 3, 6: 4) consists of the distribution of computing power or the allocation of memory, coprocessors or accelerator blocks within the decoding subsystem. Adapting at least one,
The method according to any one of claims 1 to 4, characterized in that:
マルチメディア・システム(401)のビット・ストリーム品質評価を改善する方法であって、
ビット・ストリーム・ソース(100)から符号化ビット・ストリームを受信するステップ(1:4,2:1)と、
前記符号化ビット・ストリームから、前記ビット・ストリーム・ソース(100)での符号化の複雑度を示す複雑度関連情報を抽出するステップ(1:5,2:2)と、
抽出した前記複雑度関連情報に基づき、ビット・ストリーム品質モデルのための少なくとも1つのデータ設定を選択するステップ(1:6,2:3)と、
選択した前記データ設定に基づき、前記ビット・ストリーム品質モデルを用いて前記符号化ビット・ストリームのビット・ストリーム品質スコアを計算するステップ(1:7,2:4a)と、
を含むことを特徴とする方法。
A method for improving the bit stream quality assessment of a multimedia system (401) comprising:
Receiving an encoded bit stream from a bit stream source (100) (1: 4, 2: 1);
Extracting from the encoded bit stream complexity related information indicating the complexity of encoding at the bit stream source (100) (1: 5, 2: 2);
Selecting at least one data setting for the bit stream quality model based on the extracted complexity related information (1: 6, 2: 3);
Calculating a bit stream quality score of the encoded bit stream using the bit stream quality model based on the selected data settings (1: 7, 2: 4a);
A method comprising the steps of:
前記抽出するステップ(1:5,2:2)は、さらに、前記符号化ビット・ストリームから、品質に関連する追加情報を抽出するステップを含み、
前記選択するステップは、さらに、抽出した前記複雑度関連情報と、前記品質に関連する追加情報との組み合わせに基づき、少なくとも1つの前記データ設定を選択するステップを含む、
ことを特徴とする請求項1から6のいずれか1項に記載の方法。
The extracting step (1: 5, 2: 2) further includes extracting additional information related to quality from the encoded bit stream;
The selecting step further includes selecting at least one data setting based on a combination of the extracted complexity related information and additional information related to the quality.
A method according to any one of claims 1 to 6, characterized in that
前記抽出するステップ(1:5,2:2)は、さらに、前記符号化ビット・ストリームの少なくとも一部のマクロ・ブロック・パーティション・サイズ、動きベクトル分解能、スキップ・マクロ・ブロック又は使用された参照画像数の何れかを示す、1つ以上の複雑度に関するパラメータを読み出すステップを含む、
ことを特徴とする請求項1から7のいずれか1項に記載の方法。
The extracting step (1: 5, 2: 2) further comprises at least a part of the coded bit stream macroblock partition size, motion vector resolution, skip macroblock or reference used Reading one or more complexity parameters indicating any of the number of images;
A method according to any one of claims 1 to 7, characterized in that
前記1つ以上の複雑度に関するパラメータは、少なくとも、各パラメータによって示される各情報タイプの存在、分布又は相対的な量についての情報を有する、
ことを特徴とする請求項8に記載の方法。
The one or more complexity-related parameters include at least information about the presence, distribution, or relative amount of each information type indicated by each parameter.
The method according to claim 8, wherein:
前記選択するステップ(1:6,2:3)は、さらに、
前記抽出した情報を、予め定義した複雑度レベル・セットと比較するステップと、
前記比較に基づき、少なくとも1つの前記データ設定を選択するステップと、
を含むことを特徴とする請求項1から9のいずれか1項に記載の方法。
The selecting step (1: 6, 2: 3) further comprises:
Comparing the extracted information to a predefined complexity level set;
Selecting at least one of the data settings based on the comparison;
10. The method according to any one of claims 1 to 9, comprising:
前記符号化ビット・ストリームは、ビデオ・ビット・ストリームである、
ことを特徴とする請求項1から10のいずれか1項に記載の方法。
The encoded bit stream is a video bit stream;
11. A method according to any one of claims 1 to 10, characterized in that
マルチメディア・システム(701)において、ビット・ストリームの復号サブ・システム(500,600,700d)を適合化する装置(700)であって、
ビット・ストリーム・ソース(100)より受信する符号化ビット・ストリームから、前記ビット・ストリーム・ソース(100)での符号化の複雑度を示す複雑度関連情報を抽出する様に構成されたパラメータ抽出ユニット(700a)と、
抽出した前記複雑度関連情報に基づき、前記復号サブ・システムの少なくとも1つのデータ設定を選択し、前記データ設定に基づき、前記復号サブ・システムを適合化する様に構成された制御ユニット(700b)と、
を備えていることを特徴とする装置。
An apparatus (700) for adapting a bit stream decoding subsystem (500, 600, 700d) in a multimedia system (701), comprising:
Parameter extraction configured to extract complexity related information indicating the complexity of encoding at the bit stream source (100) from the encoded bit stream received from the bit stream source (100) A unit (700a);
A control unit (700b) configured to select at least one data setting of the decoding subsystem based on the extracted complexity related information and to adapt the decoding subsystem based on the data setting When,
A device characterized by comprising:
前記パラメータ抽出ユニット(700a)は、
前記符号化ビット・ストリームの少なくとも一部分を解析することにより前記複雑度関連情報を抽出する様に構成されている、
ことを特徴とする請求項12に記載の装置。
The parameter extraction unit (700a)
Configured to extract the complexity related information by analyzing at least a portion of the encoded bitstream;
The apparatus according to claim 12.
前記装置(700)は、さらに、バッファ(502,700e)を備えており、
前記バッファ(502,700e)は、前記符号化ビット・ストリームからの前記複雑度関連情報の抽出と並行して、前記符号化ビット・ストリームをバッファリングする様に構成されている、
ことを特徴とする請求項12又は13に記載の装置。
The apparatus (700) further includes a buffer (502, 700e),
The buffer (502, 700e) is configured to buffer the encoded bit stream in parallel with the extraction of the complexity related information from the encoded bit stream.
14. Apparatus according to claim 12 or 13, characterized in that
前記制御ユニット(700b)は、さらに、前記符号化ビット・ストリームの少なくとも一部がバッファリングされているとき、前記復号サブ・システム(700d)で、前記符号化ビット・ストリームの復号を開始する様に構成されている、
ことを特徴とする請求項14に記載の装置。
The control unit (700b) is further configured to start decoding the encoded bit stream in the decoding subsystem (700d) when at least a portion of the encoded bit stream is buffered. Configured to,
The apparatus according to claim 14.
マルチメディア・システムのビット・ストリーム品質評価を改善する装置(400)であって、
ビット・ストリーム・ソース(100)より受信する符号化ビット・ストリームから、前記ビット・ストリーム・ソース(100)での符号化の複雑度を示す複雑度関連情報を抽出する様に構成されたパラメータ抽出ユニット(400a)と、
抽出した前記複雑度関連情報に基づき、少なくとも1つのデータ設定を選択する様に構成された制御ユニット(400b)と、
前記データ設定に基づき、前記符号化ビット・ストリームのビット・ストリーム品質スコアを計算する様に構成された品質モデル・ユニット(400d)と、
を備えていることを特徴とする装置。
An apparatus (400) for improving bit stream quality assessment of a multimedia system comprising:
Parameter extraction configured to extract complexity related information indicating the complexity of encoding at the bit stream source (100) from the encoded bit stream received from the bit stream source (100) A unit (400a);
A control unit (400b) configured to select at least one data setting based on the extracted complexity related information;
A quality model unit (400d) configured to calculate a bit stream quality score of the encoded bit stream based on the data settings;
A device characterized by comprising:
前記パラメータ抽出ユニット(400a,700a)は、さらに、前記符号化ビット・ストリームから、品質に関連する追加情報を抽出する様に構成され、
前記制御ユニット(400b,700b)は、抽出した前記複雑度関連情報と、抽出した前記品質に関連する追加情報の両方に基づき、1つ以上の前記データ設定を選択する様に構成されている、
ことを特徴とする請求項12から16のいずれか1項に記載の装置(400,700)。
The parameter extraction unit (400a, 700a) is further configured to extract additional information related to quality from the encoded bit stream;
The control unit (400b, 700b) is configured to select one or more of the data settings based on both the extracted complexity related information and the extracted additional information related to the quality.
Device (400, 700) according to any one of claims 12 to 16, characterized in that.
前記制御ユニット(400b,700b)は、前記抽出した情報を、予め定義した複雑度レベル・セットと比較し、前記比較に基づき、少なくとも1つの前記データ設定を選択する様に構成されている、
ことを特徴とする請求項12から17のいずれか1項に記載の装置(400,700)。
The control unit (400b, 700b) is configured to compare the extracted information with a predefined complexity level set and to select at least one data setting based on the comparison.
18. The device (400, 700) according to any one of claims 12 to 17, characterized in that
前記予め定義した複雑度レベル・セットを保存する複雑度レベル・データベース(400c,700c)をさらに備えている、
ことを特徴とする請求項18に記載の装置(400,700)。
A complexity level database (400c, 700c) for storing the predefined complexity level set;
The apparatus (400, 700) according to claim 18, characterized in that:
前記装置(400,700)は、セルラ電話機、セット・トップ・ボックス、PC、ラップトップ・コンピュータの何れかに実装されている、
ことを特徴とする請求項12から19のいずれか1項に記載の装置(400,700)。
The device (400, 700) is mounted on any of a cellular phone, a set top box, a PC, or a laptop computer.
20. Apparatus (400, 700) according to any one of claims 12 to 19, characterized in that
前記装置(400)は、ネットワーク・ノード(402)に実装されている、
ことを特徴とする請求項16から19のいずれか1項に記載の装置(400)。
The device (400) is implemented in a network node (402);
20. Apparatus (400) according to any one of claims 16 to 19, characterized in that
前記符号化ビット・ストリームは、ビデオ・ビット・ストリームである、
ことを特徴とする請求項12から21のいずれか1項に記載の装置(400,700)。
The encoded bit stream is a video bit stream;
Device (400, 700) according to any one of claims 12 to 21, characterized in that
JP2013253554A 2013-12-06 2013-12-06 Method and apparatus for processing coded bit stream Expired - Fee Related JP5793550B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013253554A JP5793550B2 (en) 2013-12-06 2013-12-06 Method and apparatus for processing coded bit stream

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013253554A JP5793550B2 (en) 2013-12-06 2013-12-06 Method and apparatus for processing coded bit stream

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2011553978A Division JP5513532B2 (en) 2009-03-13 2009-03-13 Method and apparatus for processing coded bit stream

Publications (3)

Publication Number Publication Date
JP2014090456A true JP2014090456A (en) 2014-05-15
JP2014090456A5 JP2014090456A5 (en) 2014-06-26
JP5793550B2 JP5793550B2 (en) 2015-10-14

Family

ID=50791968

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013253554A Expired - Fee Related JP5793550B2 (en) 2013-12-06 2013-12-06 Method and apparatus for processing coded bit stream

Country Status (1)

Country Link
JP (1) JP5793550B2 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004527960A (en) * 2001-04-18 2004-09-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Dynamic complexity prediction and adjustment of MPEG2 decoding process in media processor

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004527960A (en) * 2001-04-18 2004-09-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Dynamic complexity prediction and adjustment of MPEG2 decoding process in media processor

Also Published As

Publication number Publication date
JP5793550B2 (en) 2015-10-14

Similar Documents

Publication Publication Date Title
JP5513532B2 (en) Method and apparatus for processing coded bit stream
US9037743B2 (en) Methods and apparatus for providing a presentation quality signal
US9071841B2 (en) Video transcoding with dynamically modifiable spatial resolution
US20110255589A1 (en) Methods of compressing data and methods of assessing the same
KR20110106419A (en) Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
KR101742930B1 (en) Method and apparatus for detecting quality defects in a video bitstream
KR20120117384A (en) Adaptive video transcoding method and its system for maximizing transcoding server capacity
US9077972B2 (en) Method and apparatus for assessing the quality of a video signal during encoding or compressing of the video signal
Kumar et al. Quality of experience driven rate adaptation for adaptive HTTP streaming
Xu et al. Consistent visual quality control in video coding
WO2009119721A1 (en) Video transcoder monitoring device, method for monitoring video transcoder, and program for monitoring video transcoder
Barkowsky et al. Hybrid video quality prediction: reviewing video quality measurement for widening application scope
Wang et al. No-reference hybrid video quality assessment based on partial least squares regression
Schroeder et al. Low-complexity no-reference PSNR estimation for H. 264/AVC encoded video
JP5793550B2 (en) Method and apparatus for processing coded bit stream
Liu et al. Real-time video quality monitoring
WO2018041892A1 (en) Method and apparatus for determining the perceptual video quality of a chunk of multimedia content
Garcia et al. Video streaming
Zhang et al. Compressed-domain-based no-reference video quality assessment model considering fast motion and scene change
Karthikeyan et al. Perceptual video quality assessment in H. 264 video coding standard using objective modeling
WO2009119807A1 (en) Image transcoder monitoring apparatus, method and program
EP3800882A1 (en) Information-adaptive mixed deterministic/machine-learning-based bit stream video-quality model
Anegekuh et al. End to end video quality prediction for hevc video streaming over packet networks
KR20120072207A (en) Method for selective sub-layer macro-block decoding
Carter et al. Complexity-driven rate-control for parallel HEVC coding

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140508

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150320

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150608

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150803

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150810

R150 Certificate of patent or registration of utility model

Ref document number: 5793550

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees