JP5553979B2 - 人間の視覚的許容度に基づくビデオ符号化の符号化ツールの選択 - Google Patents

人間の視覚的許容度に基づくビデオ符号化の符号化ツールの選択 Download PDF

Info

Publication number
JP5553979B2
JP5553979B2 JP2008237152A JP2008237152A JP5553979B2 JP 5553979 B2 JP5553979 B2 JP 5553979B2 JP 2008237152 A JP2008237152 A JP 2008237152A JP 2008237152 A JP2008237152 A JP 2008237152A JP 5553979 B2 JP5553979 B2 JP 5553979B2
Authority
JP
Japan
Prior art keywords
image data
adjustment information
human visual
visual
cost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008237152A
Other languages
English (en)
Other versions
JP2009071837A (ja
Inventor
ザン シミン
チャン リウ ミン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JP2009071837A publication Critical patent/JP2009071837A/ja
Application granted granted Critical
Publication of JP5553979B2 publication Critical patent/JP5553979B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

特定的な実施形態は、一般的にビデオ符号化に関する。
H.264/高度ビデオ符号化(AVC)のようなビデオ圧縮においては、他の符号化標準を超える符号化効率が達成される。AVCでは、ビットストリームを別様に符号化することにより圧縮効率を改善するために、複数の符号化ツールが提供される。例えば、各符号化ツールは、圧縮されたビットストリーム内の1つの符号化モードとして表現することができる。符号化モードの選択は、客観的なレート/歪(R/D)性能に着目する。例えば、性能は、同一のビットレートを使用してより良好なピークSN比(PSNR)を得ること、又はより低いビットレートを使用して同一のPSNRを維持することによって評価される。
R/D手法を使用することにより、圧縮効率を有意に改善することができる。しかし、客観的に効率的であることは、人間のユーザが視覚的に満足すると見なされない場合がある。例えば、人間の目は、ビデオが客観R/D手法を使用して圧縮されていたとしても、符号化されたビデオ内の歪に悩まされる場合がある。
一実施形態では、符号化されたビデオシーケンスの視覚的品質を改善する符号化モード選択方法が提供される。符号化モードは、人間の視覚的許容度レベルに基づいて選択される。画像データは、ビデオ符号化処理のために受信することができる。次に、画像データは、人間の視覚的許容度調節情報を判断するために分析される。例えば、コスト方程式のパラメータは、人間の視覚系が許容できる歪限界に基づく許容度とすることができる人間の視覚的許容度レベルに基づいて調節することができる。
画像データは、トレーリング疑惑領域、ストライピング疑惑領域、画像境界領域、及び/又はブロッキング疑惑領域のような視覚的に敏感な領域と考えられる場所で分析することができる。どのような種類の視覚的敏感領域が画像データ中に検出されるかに応じて、コスト方程式内のパラメータは、異なる視覚的許容度閾値に基づいて調節することができる。コスト方程式内のパラメータが調節された状態で、ビデオ符号化処理のコストが計算される。次に、符号化モードは、このコストに基づいて判断される。従って、判断される符号化モードは、人間の視覚的許容度レベルに基づいて調節されたコスト方程式を使用して選択される。
本明細書に開示する特定的な実施形態の特質及び長所の更なる理解は、本明細書の残りの部分及び添付図面を参照することにより達成することができる。
概要
図1は、一実施形態による符号化器100の実施例を示している。符号化器100は、視覚的許容度パラメータ調節器102、コスト推定器104、及び符号化ツール選択器106を含む。
画像データは、符号化器によって受信しかつ符号化することができる。画像データは、あらゆるデータであってよく、またマクロブロックで構成することができる。符号化器100は、ビデオ符号化規格を使用してマクロブロックを符号化することができる。一実施形態では、H.264/AVCが、符号化器100により使用される。H.264/AVCが説明されているが、いずれかの「エムペグ(MPEG)」規格のような他の符号化規格を使用することができることは理解されるであろう。
視覚的許容度パラメータ調節器102は、画像データを分析し、コスト方程式内のパラメータを調節すべきか否かを判断することができる。コスト方程式は、符号化処理中で使用される符号化モードを判断するために使用されるいずれかの基準とすることができる。例えば、使用する値を定量化することができるあらゆる方程式は、どの符号化モードを使用することができるかを判断する。より詳細に以下で説明するように、トレーリング疑惑領域、ストライピング疑惑領域、又は画像境界領域のような視覚的敏感領域が分析され、コスト方程式内のパラメータを調節すべきであるか否かを判断することができる。分析においては、画像データに関する情報は、視覚的許容度閾値と比較することができる。比較結果に応じて、パラメータを調節することができる。
コスト推定器104は、符号化処理の符号化コストを推定する。推定されたコストは、画像データを符号化するために使用される符号化モードを選択するために使用される。異なる符号化モードを使用した画像データの符号化は、異なる視覚的品質に加えて異なる圧縮結果を生じる可能性がある。例えば、アーチファクト(歪画像)が、符号化処理から生じる可能性がある。このアーチファクトは、トレーリィングアーチファクト、ストライピングアーチファクト、又は画像境界アーチファクトを含むことができる。これらのアーチファクトは、人間の視覚系に対して(すなわち、符号化されたデータの復号後の表示画像を見る人間に対して)視覚的に不快である場合がある。使用される符号化モードは、アーチファクトを現出する又は悪化させる場合がある。従って、特定的な実施形態では、使用される符号化モードを人間の視覚的許容度レベルに基づいて判断する。人間の視覚的許容度レベルは、人間の視覚系が許容できると考えられる歪レベルとすることができる。例えば、実験において、ユーザは、許容できる歪レベルを判断することを試される。このレベルは、画像の領域(マクロブロック)に対する歪の限界として使用される。人間の視覚的許容度レベルは、歪限界より大きな歪をもたらす符号化ツールではなく、歪限界より小さい歪をもたらす符号化ツールを選択するために使用される。従って、人間の視覚的許容度レベルより小さい歪をもたらす符号化ツールが選択され、符号化に使用される。この処理は、符号化処理がもたらす視覚的アーチファクトを低減することができる。符号化モードは、符号化処理におけるレート/歪を最適化することはできないが、視覚的な体験は、ユーザに対してより良いものと考えられる。
どのように視覚的アーチファクトが生じる場合があるかの例を最初に説明し、次に、特定的な実施形態が符号化モードを選択して、アーチファクトの存在を最小にする方法のための処理を説明する。一実施例では、各マクロブロックに対して、符号化モードに対する符号化コストは、式1を使用して計算することができる。
Figure 0005553979
式(1)において、QPは、量子化スケールを表し、λは、量子化スケールに依存するパラメータである。レート及び歪も既知であり、符号化処理のビットレート及び歪である。量子化スケールが大きくなると、λの値が大きくなる。可変のλは、歪と使用されるビットレートの均衡を取るために重要な役割を演じることができる。例えば、2つの符号化モードが存在し、符号化モード1が、歪1及びレート1の値を導き、また、符号化モード2が、歪2及びレート2の値をもたらすことを考えた場合、次式を満足することができる。
Figure 0005553979
すなわち、coding_cost1=coding_cost2であり、これは、符号化モード1の符号化コストが、符号化モード2の符号化コストに等しいことを意味する。一実施例では、符号化モード1が、より大きな歪を導き、すなわち、λ(QP)が歪2より大きいとしても、常に選択される。λ(QP)があまりにも大きい場合、視覚的に不快にするアーチファクトが生じる可能性がある。従って、視覚的許容度レベルが、パラメータ(すなわち、λ)を調節すべきであることを示していると判断された場合、パラメータλは、視覚的許容度パラメータ調節器102により調節することができる。これは、歪を低減し、視覚的に不快にするアーチファクトをより少なくもたらすことができる。
AVCにおいては、イントラ符号化は、多数の予測モード(すなわち、予測方向)をサポートする。周囲条件に応じて、1つのモードは、別のモードよりも少ないビットを使用することができる。このモードは、最確モードと呼ばれる。従来のレート/歪符号化モード選択に基づいて、以下の式(2)は、各モードのイントラ符号化コストを計算するために使用することができる。
Figure 0005553979
上述の式において、SADは、絶対差の和を表し、SATDは、絶対変換差の和を表している。式(2)において、バイアス(QP)が大きい場合、視覚的に不快にするアーチファクトが生じる可能性がある。従って、視覚的許容度パラメータ調節器102は、視覚的アーチファクトが視覚的許容度閾値に基づいて生じる可能性があることが判断された時、バイアスパラメータを調節することができる。これは、視覚的に不快にするアーチファクトの存在を低減することができる。
次に、コスト推定器104は、コストを判断する。例えば、式(1)及び/又は式(2)は、コストを推定するために使用することができる。視覚的許容度パラメータ調節器102が、視覚的許容度に基づいてパラメータを調節することができるので、各符号化モードに対するコストは、人間の視覚的許容度レベルに基づいている。すなわち、コストは、人間の視覚的許容度レベルより低い歪レベルを提供することができる符号化ツールが選択されるように調節される。従って、コストは、客観レート/歪法を使用することと異なる可能性がある。
次に、符号化ツール選択器106は、符号化モードを選択する。例えば、異なる符号化モードを、ビデオ符号化処理中に達成することができる。一実施例では、AVCにおいて、異なる符号化ツールは、異なる符号化モードを提供することができる。符号化モードは、マクロブロック内の異なる大きさのサブブロック予測、異なる予測方向、又は他の変形を使用して画像データを符号化することができる。当業者は、異なる符号化モードを使用することができることを認めるであろう。
図2は、一実施形態による符号化器100のより詳細な例を示している。異なる種類の画像データが、受信される可能性がある。一実施形態では、異なる画像データは、別様に処理することができる。例えば、アニメーションビデオシーケンス及び自然なビデオシーケンスは、別様に処理することができる。ビデオ形式判断器202は、画像データを分析して、その形式を判断することができる。一実施形態では、画像データは、アニメーション又は自然ビデオとして分類することができる。アニメーション及び自然動画を説明するが、他のビデオ形式を見分けることもできることが理解されるであろう。ビデオ形式に応じて、許容度レベル選択器204は、視覚的許容度レベルを選択する。異なる視覚的許容度レベルは、異なるビデオ形式に対して判断することができる。一実施例では、アニメーションシーケンスの視覚的許容度レベルは、自然ビデオシーケンスに対する視覚的許容度レベルより低くすることができる。低い視覚許容度レベルは、人間の視覚系が、符号化処理がもたらすあらゆるアーチファクトに対してより敏感である可能性があることを意味する。選択された視覚許容度レベルに基づいて、1組の閾値を判断することができる。これらの閾値は、生じる可能性がある異なる視覚的アーチファクトに対して異なるであろう。
ビデオ形式の判断に加えて、画像形式判断器206は、画像形式を判断するために使用される。一実施例では、画像形式が、イントラ画像又はインター画像であることを判断することができる。現在の画像(例えば、マクロブロック)は、公知のように、イントラ符号化又はインター符号化を使用して符号化することができる。ここで、処理は、マクロブロック処理と呼ぶことができるが、画像データが、あらゆるデータセットである可能性があることは解されるであろう。マクロブロックは、画像データの一部とすることができる。マクロブロックが、イントラマクロブロックとして符号化される場合、視覚的敏感領域に対する異なる分析は、現在画像がインター画像であると判断された場合に使用することができる。
視覚的アーチファクト分析器207は、マクロブロックを分析するように構成され、マクロブロックが、視覚的アーチファクトの1つ又はそれよりも多くに影響を受けるか否かを判断する。イントラ画像に対して、ストライピング分析器208は、マクロブロックが、ストライピングアーチファクトに影響される可能性があるか否かを判断することができる。境界マクロブロック検出器210は、マクロブロックが、画像境界アーチファクトに影響されるか否かを判断することができる。また、画像がインター画像であることが判断された場合、トレーリング分析器212は、マクロブロックが、トレーリングアーチファクトに影響されるか否かを判断するように構成される。また、ストライピング分析器214は、マクロブロックが、ストライピング分析器208と同様にストライピングアーチファクトに影響されるか否かを判断する。
実行された異なる分析に応じて、異なる視覚的許容度パラメータを調節することができる。ストライピングストライピング分析器208は、マクロブロックを分析して、これがストライピングアーチファクトに影響されるか否かを判断する。ストライピングアーチファクトは、人間の視覚系に対して縞のように見える場合がある、ある一定の不自然なパターンが1つの方向に沿って繰り返されている場所である。マクロブロックがストライピングアーチファクトに影響される可能性があることをストライピング分析器208が判断した場合、式(2)における方向バイアス(QP)パラメータは、視覚的許容度閾値に従って調節することができる。例えば、方向バイアス調節器216は、許容度レベル選択器204から視覚的許容度閾値を受信することができる。次に、バイアス(QP)パラメータは、視覚的許容度閾値に基づいて調節することができる。この処理をより詳細に以下で説明する。
境界マクロブロック検出器210は、マクロブロックを分析して、画像境界アーチファクトに影響されるか否かを判断する。これらのアーチファクトは、画像の画像境界に沿って目立つ可能性がある(例えば、表示画面上の上部/下部又は側部上の画像の水平又は垂直の黒いバー)。マクロブロックが画像境界マクロブロックとして検出されることを境界マクロブロック検出器218が判断した場合、量子化パラメータ(QP)調節器218は、視覚的許容度閾値に基づいて量子化スケールを調節することができる。例えば、QP調節器218は、視覚的許容度閾値を許容度レベル選択器204から受信し、この閾値に基づいて量子化スケールを調節することができる。
画像がインター画像である場合、画像内のマクロブロックは、インターマクロブロック又はイントラマクロブロックのいずれとして符号化することができる。インターマクロブロックに対しては、トレーリング分析器212は、マクロブロックがトレーリングアーチファクトに影響されるか否かを判断する。トレーリングアーチファクトは、ビデオシーケンスが表示された時、ある一定の不自然な移動パターンが観測される場所であるとすることができる。トレーリングアーチファクトが発生する可能性がある場合、式(1)内のλパラメータは、視覚的許容度閾値に基づいて調節することができる。例えば、λアダプタ220は、視覚的許容度閾値を許容度レベル選択器204から受信し、これに基づいてλ値を調節する。
イントラマクロブロックに対しては、ストライピング分析器214は、マクロブロックが、ストライピングアーチファクトに影響される可能性があるか否かを判断する。影響される場合、方向バイアス調節器222は、視覚的許容度閾値に基づいてパラメータバイアス(QP)を調節することができる。この場合、視覚的許容度閾値は、許容度レベル選択器204から受信することができ、バイアスが調節される。また、オフセット加算器224は、マクロブロック中にフィルム粒子条件が存在する場合、各方向に対してオフセットを予測コストに加算する。すなわち、使用することができる各モードは、コストがイントラ符号化されたフィルム粒子マクロブロックに対してより高くなるように、オフセットをそれに加えることができる。
次に、コスト推定器226は、マクロブロックを符号化するために使用することができる各符号化モードに対するコストを推定する。例えば、各符号化モードは、コストを計算するために式(1)及び/又は式(2)を使用することができる。パラメータに対する調節は、コスト推定の中で使用することができる。パラメータ値の一部は、コスト計算が実行される以前に調節される。例えば、マクロブロックが、ストライピングアーチファクトに影響されることが判断された場合、バイアスを調節することができる。量子化パラメータ及びλのような他のパラメータは、調節することができない。従って、コスト推定器226は、調節された方向バイアスを使用して各異なるモードに対するコストを推定することができる。次に、コスト推定器226は、符号化モード選択器228にコストを出力する。
次に、符号化モード選択器228は、符号化モードを選択するように構成される。例えば、最低コストを達成する符号化モードを選択することができる。次に、マクロブロックは、選択された符号化モードを使用して符号化することができる。
以下の各節では、異なる視覚的敏感領域の判断について分析し、調節される視覚的許容度パラメータを示している。第1節では、トレーリングアーチファクトを分析し、第2節では、ストライピングアーチファクトを分析し、また第3節では、画像境界検出を分析する。
トレーリングアーチファクト
トレーリングアーチファクトでは、人間の視覚系は、ビデオシーケンスが表示された時、インター画像内のある一定の不自然な動きを認識することができる。例えば、無地の黒い背景のような平坦な背景が示され、かつ場面が動く時、トレーリングアーチファクトが背景中で動いているのを見ることができる。一実施例として、壁の上に点がある場合、画像のシーケンスが動きを示す時、人間は、点が動いているのを見ることができる。
一実施形態では、トレーリングアーチファクトは、通常は、省略モード又は全てゼロ係数のマクロブロックの選択により生じる。省略モードは、複写予測がマクロブロックに対して使用される場合である。すなわち、同一のマクロブロックを別のマクロブロックに対して複写又は使用することができる。平坦な領域は、質感が低いので、省略モード及び/又は全てゼロ係数マクロブロックを選択する可能性が非常に高い。また、非常に弱いエッジを有するマクロブロックも、弱いエッジを含むマクロブロックが省略モードにより符号化することが適切であるので、トレーリングアーチファクトにより影響されやすい。基準マクロブロックと現在のマクロブロックの間の不整合は、トレーリングアーチファクトを生じる可能性がある。一実施例では、量子化スケールを低減することができる。しかし、省略モードが使用され、かつその量が十分に低減されない場合、アーチファクトは除去されない。また、低減される量が大きすぎる場合、そのコストは、あまりに多くのビットが使用されることである。
トレーリングアーチファクトは、非常に小さな残差誤差で伝播する場合がある。インターモードが選択された時、予測誤差は画像毎に独立である。これは、イントラモードが誤差伝播を防止することができることを意味する。更に、インター予測の性質により、復号されたマクロブロックは、均一な分布を有する。従って、小さいトレーリングアーチファクトに似たテクスチャ分布を発生する可能性は、イントラ符号化されたマクロブロックに対しては非常に小さい。従って、イントラモードは、インター画像内のトレーリング疑惑領域中で使用すべきである。すなわち、トレーリング分析器212は、画像がトレーリングアーチファクトを含む可能性があるか否かを判断するために使用することができる。
図3は、一実施形態によるトレーリングアーチファクト検出及び視覚的許容度パラメータ調節の例を示している。段階302において、分散検出が実行される。例えば、8×8分散が抽出される。分散は、画像内のコントラストを反映することができる。
段階304において、最小及び最大分散が、分散検出から抽出される。閾値TH1は、トレーリングアーチファクトの可能性が高いか否かを判断するために使用される。段階306において、最小分散が、第1の閾値(TH1)と比較される。最小分散が第1の閾値より大きい場合、トレーリングアーチファクトの可能性が非常に小さい事が判断される。従って、式(1)を使用して標準の符号化コスト推定を適用することができる。従って、パラメータは、この場合、視覚的許容度レベルに基づいて調節することはできない。
最小分散が第1の閾値に等しいか又は小さい場合、現在のマクロブロックは、トレーリングアーチファクトに影響される可能性がある。次に、段階308において、最大分散が、第2の閾値(TH2)と比較される。最大分散が第2の閾値より大きい場合、段階310において、視覚的許容度閾値が選択される。例えば、視覚的許容度閾値は、図2の許容度レベル選択器204から受信される2つの事前に生成された閾値から選択することができる。一実施例では、マクロブロックが弱いエッジを有する場合、小さい許容度レベルが選択される。現在のマクロブロックが強いエッジを有する場合、大きい許容度レベルが選択される。弱いエッジは、コントラストがエッジに沿って弱い場所であり、また強いエッジは、エッジに沿ってコントラストが明確に異なる場所である。強いエッジを有するマクロブロックに対する動き推定は、弱いエッジを有するマクロブロックより正確である可能性がある。弱いエッジを有するマクロブロックと比較して、強いエッジのマクロブロック内にトレーリングアーチファクトを有する可能性は少ない。従って、異なる許容度レベルが使用されるが、使用しなくてもよい。
次に、段階312において、式(1)内のパラメータλは、選択された視覚的許容度閾値に基づいて調節することができる。例えば、λ(QP)は、選択された視覚的許容度閾値と比較される。λ(QP)が、選択された視覚的許容度閾値より大きい場合、λ(QP)は、選択された視覚的許容度閾値の値でリセットされる。しかし、λ(QP)が、選択された視覚的許容度閾値より大きくない場合、λ(QP)は、変更せず維持することができる。λ(QP)の値は、この値が、トレーリングアーチファクトの存在を低減することができるので、この値が視覚的許容度閾値より大きい場合には視覚的許容度閾値にリセットされる。閾値が歪限界である場合、λ(QP)の値の調節は、歪限界よりも小さい歪になる符号化ツールを選択することができる。
段階308に戻って、最大分散が第2の閾値より大きくない場合、段階314において、周辺の動き検査が実行される。周辺の動き検査は、動きについて周辺のマクロブロックを検査することができる。例えば、マクロブロックは、現在のマクロブロックより前に符号化されるか又は復号されている可能性がある。これらのマクロブロックを分析して、いずれかの周辺のマクロブロックが、第3の閾値(TH3)より大きい動き及び第4の閾値(TH4)より大きい16×16分散を有するか否かを判断することができる。例えば、検査は、いずれかの周辺のマクロブロックが、閾値より大きい動きがある可能性があるか否かを判断することである。これは、背景が平坦ではなく動いている可能性があることを示している。従って、トレーリングアーチファクトの可能性が高い。
この場合、段階316において、周辺のマクロブロックが、閾値TH3より大きな動き及び閾値TH4より大きな分散を有する場合、視覚的許容度レベルが調節される。例えば、次式を許容度閾値を選択するために使用することができる。
Figure 0005553979
V1がV2より少なくない場合、ToleranceINTRA=ToleranceINTER=V2である。V1及びV2は、経験的に視覚的閾値として得られる2つの定数である。
段階318において、予測精度検査が実行される。これは、動き予測が元の許容度閾値に等しいか又は小さいか否かを検査する。元の許容度閾値に等しいか又は小さい場合、λ(QP)は、段階312において変更することができない。予測歪が視覚的許容度レベルより大きい場合、λ(QP)は、視覚的許容度閾値と比較され、大きい場合には、λ(QP)は、視覚的許容度閾値の値としてリセットされる。
段階302に戻って、処理はまた、純粋平坦検査を実行することができる段階320に分岐することができる。純粋平坦検査は、分散がゼロであるか否かを見るために検査する。これは、背景が、真黒である可能性があることを意味する。この場合、人間の視覚系は、歪が非常に小さいことを観察することができるであろう。
この場合、段階316において、許容度レベルをゼロに設定し、すなわち、toleranceintraをゼロに設定することができる。次に、段階318及び312を上述のように実行することができる。しかし、この場合、許容度閾値がゼロである場合があるので、λ(QP)は、常にゼロに設定される。許容度閾値がゼロであるので、λ(QP)は閾値より大きくなり、常にゼロに設定される。この場合、トレーディングアーチファクトを有する可能性が高く、従って、許容度閾値は、トレーリングアーチファクトが存在する可能性を低めるためにゼロに設定される。
λ(QP)が、段階312において調節された後、段階322において、符号化コスト推定が実行される。符号化コスト推定は、調節されたλパラメータを使用して実行される。
ストライピングアーチファクト
図4は、一実施形態によるストライピングアーチファクトを検出する段階及び視覚的許容度パラメータを調節する段階の流れ図の例を示している。ストライピングアーチファクトは、ある方向に繰り返されるある一定の不自然なパターンを人間の視覚系が見る時に発生する場合がある。例えば、縞が、水平及び垂直方向に発生する可能性がある。一実施例では、ストライピングアーチファクトは、I画像中に発生し、次にその後のP及びB画像に伝播する可能性がある。
ストライピングアーチファクトは、通常は、平坦な領域、フィルム粒子領域、又はマクロブロック内の鋭敏なエッジに発生する場合がある。平坦な領域は、黒のような単色である領域であると考えられる。フィルム粒子領域は、粒子が粗く、多数の斑点を含む領域であると考えられる。エッジは、一部が黒であり、他の部分が明るい色のような異なる色であるようなエッジをマクロブロック中に含む場所である。
ストライピングアーチファクトは、不適切な符号化モード選択により生じる場合がある。平坦な領域では、各予測方向(符号化モード)は、類似の予測歪(SAD/SATD)を有する場合がある。従来のR/D型の方法は、最も可能性があるモードに強くバイアスされる。従って、同一の符号化モードは、ある方向に沿って繰り返される場合がある。予測が完全ではなく、量子化が残差を再生することができない場合、同一のパターンは、ある方向に沿って繰り返されることになる。ストライピングアーチファクトはまた、量子化スケールがあまり小さくない場合、フィルム粒子領域又は鋭敏なエッジ領域上に発生する場合がある。例えば、鋭敏なエッジ領域では、マクロブロックの一部が黒一色であり、他の部分がそうでない場合、一部の黒は、エッジを超えて他の領域中に漏れる場合がある。また、フィルム粒子領域では、粒子の粗いパターンは、量子化が十分に小さくない場合に縞になる場合がある。
図4は、一実施形態によるストライピングアーチファクト処理に対する流れ図400を示している。図4では、各マクロブロックは、それが平坦なマクロブロック、フィルム粒子マクロブロック、又はエッジマクロブロックであるか否かを判断するために検査される。マクロブロックが、これらの3つのマクロブロックのいずれかである場合、予測精度を検査することができ、パラメータバイアス(QP)を調節することができる。マクロブロックが、3つのいずれにも属していない場合、パラメータバイアス(QP)は変更されずに維持される。
段階402において、マクロブロック分散検出が実行される。小さい分散がある場合、マクロブロックが平坦であると判断することができる。従って、段階404において、平坦性検査が実行される。マクロブロックが平坦である場合、予測精度が、段階412において検査される。この処理を以下に説明する。
フィルム粒子検査も実行される。段階406において、マクロブロック平均絶対差(MAD)検出が、MADを計算するために実行される。段階408において、フィルム粒子条件検査が実行される。この場合、16×16分散が、第1の閾値(F1)より少なく、かつ第2の閾値(F2)より大きい場合、マクロブロック平均絶対差(MAD)条件検査が実行される。分散が2つの閾値内にない場合、マクロブロックは、フィルム粒子マクロブロックではないと見なされる。
現在のマクロブロックの平均絶対差に対して条件が検査される。一実施例では、マクロブロックがフィルム粒子マクロブロックであるか否かを判断するために、以下の式を使用することができる。
Figure 0005553979
MB_Varは、マクロブロック分散、MB_Madは、マクロブロックに対するMAD、またc1及びc2は、定数である。式の左辺が右辺より大きい場合、現在のマクロブロックは、フィルム粒子マクロブロックとは見なされない。このフィルム粒子マクロブロック検出方法を提供するが、他の検出方法を使用することもできることが理解されるであろう。マクロブロックが、フィルム粒子マクロブロックと見なされる場合、処理は段階412に進み、次に、予測精度検査が実行される。
ここで、エッジ検出を以下に説明する。段階410において、エッジ検出が実行される。この場合、エッジがマクロブロック中に検出された場合、マクロブロックは、エッジマクロブロックであると判断される。従って、段階412に進む。
マクロブロックが、平坦なフィルム粒子又はエッジマクロブロックである場合、段階412において、予測精度検査が実行される。予測歪(SAD/SATD)が視覚的許容度閾値より小さい場合、この検査は、バイアス(QP)を段階414において調節すべきであることを示している。予測歪が視覚閾値より大きい場合、ストライピングアーチファクトが生じる場合がある。段階414において、パラメータバイアス(QP)が、視覚的許容度閾値と比較される。視覚的許容度レベルは、マクロブロックが、平坦なフィルム粒子又はエッジマクロブロックと見なされるか否かに応じて異なる場合がある。視覚的許容度レベルが視覚的許容度閾値より大きい場合、これは、この視覚的許容度閾値にリセットされる。大きくない場合、バイアス(QP)は、そのまま残される。
段階416において、調節されたバイアス(QP)を使用して、符号化コストが推定される。符号化コストは、マクロブロックがどの型と見なされたかに応じて異なるであろう。
画像境界
ここで、画像境界アーチファクト検出を以下に説明する。多くのビデオシーケンス、特に映画シーケンスでは、各画像の側部又は上部/下部に沿って縞状の黒い境界がある。これらは、いかなる情報も含まないが、符号化器100は、これらを符号化し、かつこれらを鋭敏なエッジとして取り扱わざるを得ない。鋭敏なエッジ境界に沿った領域が滑らかである場合、垂直モードは、左側及び右側境界に対する最良のイントラモードであり、また水平モードは、常に上部及び下部境界に対する最良のイントラモードである。低ビットレートでは、下部マクロブロックは、垂直の縞の上部マクロブロックと完全に同一のパターンを複写し、また右側のマクロブロックは、水平に縞内の左側マクロブロックから完全に同一のパターンを複写することができる。この場合、人間の視覚系は、境界マクロブロックとその近くのマクロブロックの間の差を見ることができる。画像境界アーチファクト問題を避けるために、画像境界マクロブロックを検出することができ、量子化スケールを低減することができる。これは、符号化がもたらす場合がある視覚的に不快にするアーチファクトを低減することができる。
画像内の各マクロブロック列に対して、画像の左側から始まる第1のN個の左側マクロブロックが検査される。Nは、4より小さい整数の定数とすることができる。段階503において、各8×8ブロックの8×8分散が計算され、最小及び最大分散が抽出される。
第1の選択されたマクロブロックに対して、最大8×8分散が大きな閾値(B1)よりも大きく、かつ最小8×8分散が小さな閾値(S1)より小さい場合、境界マクロブロックであることが判断される。これは、分散が、マクロブロックの一部が平坦であり、かつ別の部分が高いコントラスト(例えば、黒以外の縞)を有することを示すためである。画像の右側内のマクロブロック、及び検出されたマクロブロックに対して中心対称マクロブロックも検査することができる。これらのマクロブロックがこれらの基準に適合する場合、これらは、境界マクロブロックとして表すことができる。現在の列内の全ての他のマクロブロックは、非境界マクロブロックとして示すことができる。
第1のマクロブロックの最大8×8分散が閾値B1より小さい場合、境界マクロブロックが検出されるか又は現在の列内の全てのマクロブロックが検査されるまで、次のN−1マクロブロックは、上述のように同一の手順を使用して検査される。
全てのN個の左のマクロブロックが境界マクロブロックでない場合、N個の右のマクロブロックが、画像の右側から検査される。各右側マクロブロックに対して、最大8×8分散が大きな閾値B2より大きく、かつ最小8×8分散が小さい閾値S2より小さい場合、それは、境界マクロブロックであると判断される。現在の列内の全ての他のマクロブロックは、非境界マクロブロックとして示される。
第1のマクロブロックの最大8×8分散が閾値B1より小さい場合、境界マクロブロックが検出されるか又は全てのN個の右側マクロブロックが検査されるまで、次のN−1の右側マクロブロックは、段階510において示された手順を使用して検査される。以下の手順は、全ての列が検査されるまで実行することができる。
水平の帯の検出(上部及び下部マクロブロック)は、上記手順を使用して実行することができる。検出された境界マクロブロックに対して、イントラDCモードが選択されず、イントラ予測コスト(SAD/SATD)が閾値より大きい場合、現在の量子化スケールは、量子化パラメータ値のような視覚的許容度閾値と比較される。現在の量子化スケールが量子化パラメータ値より大きい場合、現在のマクロブロックは、量子化スケールとして予め選択された量子化パラメータ値として視覚的許容度閾値を使用する。量子化スケールが、視覚的許容度閾値より大きくない場合、量子化スケールは変更されない。
境界マクロブロックの品質は、量子化スケールが、予め選択された量子化パラメータ値より大きく、予め選択された量子化パラメータであるように変更される場合、いかなるアーチファクトも見ることができないように改善することができる。量子化スケールが、予め選択された量子化パラメータより小さい場合、いかなるアーチファクトも見られないと考えられることが予想される。
結論
従って、特定的な実施形態は、視覚的敏感領域を検出し、人間の視覚的許容度レベルに基づいて符号化モードを調節する。これは、画像シーケンスに含まれる視覚的に不快にするアーチファクトを少なくする。従って、視聴体験は、ユーザにとってより快適であると考えられる。
説明は、特定的な実施形態に関して行ったが、これらの特定的な実施形態は、単に例示であり、制限するものではない。H.264/AVCを説明したが、他の符号化仕様を使用することもできる。
C、C++、Java(登録商標)、アセンブリ言語などを含むあらゆる適切なプログラミング言語を特定的な実施形態のルーチンを実施するために使用することができる。プロシージャ又はオブジェクト指向のような異なるプログラミング技術を用いることもできる。ルーチンは、単一の処理装置又は複数のプロセッサ上で実行することができる。段階、作動、又は計算は、特定の順序で表現しているが、この順序は、異なる特定的な実施形態において変更することができる。一部の特定的な実施形態では、本明細書中では順番に示されている複数の段階を同時に実行することができる。
特定的な実施形態の目的のための「コンピュータ可読媒体」は、命令実行システム、装置、システム、又はデバイスによる又はそれに関連した使用のためのプログラムを収容し、記憶し、通信し、伝播し、又は搬送することができるあらゆる媒体とすることができる。コンピュータ可読媒体は、例示のためのみであり、制限するものではなく、電子的、磁気的、光学的、電磁気的、赤外線、又は半導体システム、装置、システム、デバイス、伝播媒体、又はコンピュータメモリとすることができる。特定的な実施形態は、ソフトウエア、ハードウエア、又は両方の組合せにおける制御論理の形で実施することができる。制御論理は、1つ又はそれよりも多くのプロセッサで実行される時、特定的な実施形態で説明したものを実行するように作動可能とすることができる。
特定的な実施形態は、プログラムされた汎用デジタルコンピュータを使用して実施することができ、特定用途集積回路、プログラマブル論理デバイス、フィールドプログラマブルゲートアレイ、光学的、化学的、生物学的、量子又はナノ加工システム、構成要素、及び機構を使用することができる。一般的に、特定的な実施形態の機能は、当業技術で公知のあらゆる手段によって達成することができる。分散型ネットワーク化システム、構成要素、及び/又は回路を使用することができる。データの通信又は転送は、有線、無線、又はあらゆる他の手段によることができる。
図面/図に示す要素の1つ又はそれよりも多くは、特定の用途に有用であるように、より分離された又は統合された方法で実施するか、又はある一定の場合には除去するか又は作動不能にすることさえもできることも認められるであろう。また、コンピュータに上述の方法のいずれかを実行させるように機械可読媒体に記憶することができるプログラム又はコードを実施することは、本発明の精神及び範囲内である。
本明細書の説明及び特許請求の範囲を通して使用される「a」、[an」、及び「the」は、文脈が明確にそうでないことを示さない限り、複数の参照を含む。また、本明細書の説明及び特許請求の範囲を通して使用される「in」の意味は、文脈が明確にそうでないことを示さない限り、「in」及び「on」を含む。
すなわち、特定的な実施形態を本明細書で説明したが、以上の開示において修正、様々な変更、及び置換の自由が意図されており、一部の場合では、特定的な実施形態の一部の特徴は、説明した本発明の範囲及び精神を逸脱することなく、他の特徴の対応する使用なしに用いられることになることが認められるであろう。従って、特定の状況又は材料を本質的な範囲及び精神に適応させる多くの修正を行うことができる。
一実施形態による符号化器の例を示す図である。 一実施形態によるより詳細な符号化器の例を示す図である。 一実施形態によるトレーリングアーチファクト検出及び視覚的許容度パラメータ調節の例を示す図である。 一実施形態によるストライピングアーチファクトを検出する段階及び視覚的許容度パラメータを調節する段階の流れ図の例を示す図である。
符号の説明
100 符号化器
102 視覚的許容度パラメータ調節器
104 コスト推定器
106 符号化ツール選択器

Claims (24)

  1. ビデオ符号化処理のための符号化ツールを選択する方法であって、
    ビデオ符号化処理のための画像データを受信する段階と、
    前記ビデオ符号化処理で発生する場合がある視覚的アーチファクトに対する人間の視覚的許容度レベルに基づいて判断される人間の視覚的許容度調節情報を判断するために、前記画像データを分析する段階と、
    前記人間の視覚的許容度調節情報に基づいて前記ビデオ符号化処理に対するコストを計算し、該計算されたコストに基づいて符号化ツールを選択する段階と、
    前記コストを判断するのに使用されるコスト推定におけるパラメータを、前記人間の視覚的許容度調節情報に基づいて調節する段階と、
    を含み、前記調節されたパラメータは、次式:
    Figure 0005553979
    中にλ(QP)パラメータを含んでおり、ここで、QPは、量子化スケールを表し、λは、該量子化スケールに依存するパラメータであり、歪は、前記符号化処理の歪であり、レートは、該符号化処理のビットレートであることを特徴とする方法。
  2. 前記パラメータは、視覚的閾値に基づいて調節されることを特徴とする請求項1に記載の方法。
  3. 前記画像データを分析する段階は、視覚的に敏感な領域が該画像データに存在するかを判断する段階を含むことを特徴とする請求項1に記載の方法。
  4. 前記画像データを分析する段階は、ストライピングアーチファクト疑惑領域、トレーリングアーチファクト疑惑、画像境界領域、及び/又はブロッキング疑惑領域が存在するかを判断する分析を実行する段階を含むことを特徴とする請求項3に記載の方法。
  5. 前記符号化処理中に前記画像データで発生する場合がある視覚的アーチファクトが発生した時に検出する段階を更に含み、
    前記人間の視覚的許容度調節情報は、前記検出された視覚的アーチファクトに基づいて判断される、
    ことを特徴とする請求項1に記載の方法。
  6. 異なる人間視覚的許容度調節情報が、歪限界に基づいて判断されることを特徴とする請求項5に記載の方法。
  7. ビデオ符号化処理のための符号化ツールを選択する方法であって、
    ビデオ符号化処理のための画像データを受信する段階と、
    前記ビデオ符号化処理で発生する場合がある視覚的アーチファクトに対する人間の視覚的許容度レベルに基づいて判断される人間の視覚的許容度調節情報を判断するために、前記画像データを分析する段階と、
    前記人間の視覚的許容度調節情報に基づいて前記ビデオ符号化処理に対するコストを計算し、該計算されたコストに基づいて符号化ツールを選択する段階と、
    前記コストを判断するのに使用されるコスト推定におけるパラメータを、前記人間の視覚的許容度調節情報に基づいて調節する段階と、
    を含み、前記調節されたパラメータは、次式:
    Figure 0005553979
    中のバイアス(QP)パラメータであり、ここで、SADは、絶対差の和であり、SATDは、絶対変換差の和であることを特徴とする方法。
  8. 前記パラメータは、視覚的閾値に基づいて調節されることを特徴とする請求項7に記載の方法。
  9. 前記画像データを分析する段階は、視覚的に敏感な領域が該画像データに存在するかを判断する段階を含むことを特徴とする請求項7に記載の方法。
  10. 前記画像データを分析する段階は、ストライピングアーチファクト疑惑領域、トレーリングアーチファクト疑惑、画像境界領域、及び/又はブロッキング疑惑領域が存在するかを判断する分析を実行する段階を含むことを特徴とする請求項9に記載の方法。
  11. 前記符号化処理中に前記画像データで発生する場合がある視覚的アーチファクトが発生した時に検出する段階を更に含み、
    前記人間の視覚的許容度調節情報は、前記検出された視覚的アーチファクトに基づいて判断される、
    ことを特徴とする請求項7に記載の方法。
  12. 異なる人間視覚的許容度調節情報が、歪限界に基づいて判断されることを特徴とする請求項11に記載の方法。
  13. ビデオ符号化処理のための符号化ツールを選択するように構成された装置であって、
    1つ又はそれよりも多くのプロセッサと、
    前記1つ又はそれよりも多くのプロセッサによって実行するための論理が記憶された1つ又はそれよりも多くの有形媒体とを含み、
    前記論理は、実行された時に
    ビデオ符号化処理のための画像データを受信し、
    前記ビデオ符号化処理で発生する場合がある視覚的アーチファクトに対する人間の視覚的許容度レベルに基づいて判断される人間の視覚的許容度調節情報を判断するために前記画像データを分析し、
    前記人間の視覚的許容度調節情報に基づいて符号化ツールを選択する、
    ように作動可能であり、
    前記論理はさらに、実行された時に、前記人間の視覚的許容度調節情報に基づいて前記ビデオ符号化処理のためのコストを計算するように更に作動可能であり、前記符号化ツールを選択する段階は、該計算されたコストに基づくものであり、
    前記論理はさらに、実行された時に、前記人間視覚的許容度調節情報に基づいて前記コストを判断するのに使用されるコスト推定におけるパラメータを調節するように更に作動可能であり、
    前記調節されたパラメータは、次式:
    Figure 0005553979
    中にλ(QP)パラメータを含み、ここで、QPは、量子化スケールを表し、λは、該量子化スケールに依存するパラメータであり、歪は、前記符号化処理の歪であり、レートは、該符号化処理のビットレートであることを特徴とする装置。
  14. 前記パラメータは、視覚的閾値に基づいて調節されることを特徴とする請求項13に記載の装置。
  15. 前記画像データを分析するように作動可能な論理は、実行された時に、視覚的に敏感な領域が該画像データに存在するかを判断するように更に作動可能である論理を含むことを特徴とする請求項13に記載の装置。
  16. 前記画像データを分析するように作動可能な論理は、実行された時に、ストライピングアーチファクト疑惑領域、トレーリングアーチファクト疑惑、画像境界領域、及び/又はブロッキング疑惑領域が存在するかを判断する分析を実行するように更に作動可能である論理を含むことを特徴とする請求項15に記載の装置。
  17. 前記論理は、実行された時に、前記符号化処理中に前記画像データで発生する場合がある視覚的アーチファクトが発生した時に検出するように更に作動可能であり、
    前記人間視覚的許容度調節情報は、前記検出された視覚的アーチファクトに基づいて判断される、
    ことを特徴とする請求項13に記載の装置。
  18. 異なる人間視覚的許容度調節情報が、歪限界に基づいて判断されることを特徴とする請求項17に記載の装置。
  19. ビデオ符号化処理のための符号化ツールを選択するように構成された装置であって、
    1つ又はそれよりも多くのプロセッサと、
    前記1つ又はそれよりも多くのプロセッサによって実行するための論理が記憶された1つ又はそれよりも多くの有形媒体とを含み、
    前記論理は、実行された時に
    ビデオ符号化処理のための画像データを受信し、
    前記ビデオ符号化処理で発生する場合がある視覚的アーチファクトに対する人間の視覚的許容度レベルに基づいて判断される人間の視覚的許容度調節情報を判断するために前記画像データを分析し、
    前記人間の視覚的許容度調節情報に基づいて符号化ツールを選択する、
    ように作動可能であり、
    前記論理はさらに、実行された時に、前記人間の視覚的許容度調節情報に基づいて前記ビデオ符号化処理のためのコストを計算するように更に作動可能であり、前記符号化ツールを選択する段階は、該計算されたコストに基づくものであり、
    前記論理はさらに、実行された時に、前記人間視覚的許容度調節情報に基づいて前記コストを判断するのに使用されるコスト推定におけるパラメータを調節するように更に作動可能であり、
    前記調節されたパラメータは、次式:
    Figure 0005553979
    中のバイアス(QP)パラメータであり、ここで、SADは、絶対差の和であり、SATDは、絶対変換差の和であることを特徴とする装置。
  20. 前記パラメータは、視覚的閾値に基づいて調節されることを特徴とする請求項19に記載の装置。
  21. 前記画像データを分析するように作動可能な論理は、実行された時に、視覚的に敏感な領域が該画像データに存在するかを判断するように更に作動可能である論理を含むことを特徴とする請求項19に記載の装置。
  22. 前記画像データを分析するように作動可能な論理は、実行された時に、ストライピングアーチファクト疑惑領域、トレーリングアーチファクト疑惑、画像境界領域、及び/又はブロッキング疑惑領域が存在するかを判断する分析を実行するように更に作動可能である論理を含むことを特徴とする請求項21に記載の装置。
  23. 前記論理は、実行された時に、前記符号化処理中に前記画像データで発生する場合がある視覚的アーチファクトが発生した時に検出するように更に作動可能であり、
    前記人間視覚的許容度調節情報は、前記検出された視覚的アーチファクトに基づいて判断される、
    ことを特徴とする請求項19に記載の装置。
  24. 異なる人間視覚的許容度調節情報が、歪限界に基づいて判断されることを特徴とする請求項23に記載の装置。
JP2008237152A 2007-09-14 2008-09-16 人間の視覚的許容度に基づくビデオ符号化の符号化ツールの選択 Expired - Fee Related JP5553979B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/855,888 2007-09-14
US11/855,888 US20090074058A1 (en) 2007-09-14 2007-09-14 Coding tool selection in video coding based on human visual tolerance

Publications (2)

Publication Number Publication Date
JP2009071837A JP2009071837A (ja) 2009-04-02
JP5553979B2 true JP5553979B2 (ja) 2014-07-23

Family

ID=40454418

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008237152A Expired - Fee Related JP5553979B2 (ja) 2007-09-14 2008-09-16 人間の視覚的許容度に基づくビデオ符号化の符号化ツールの選択

Country Status (5)

Country Link
US (1) US20090074058A1 (ja)
EP (1) EP2061254A3 (ja)
JP (1) JP5553979B2 (ja)
KR (1) KR20090028441A (ja)
CN (1) CN101534448A (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9223387B2 (en) * 2011-06-02 2015-12-29 Intel Corporation Rescheduling active display tasks to minimize overlapping with active platform tasks
CN103428523B (zh) * 2012-05-22 2015-07-08 华为技术有限公司 评估视频质量的方法和装置
US9277212B2 (en) * 2012-07-09 2016-03-01 Qualcomm Incorporated Intra mode extensions for difference domain intra prediction
US9568985B2 (en) * 2012-11-23 2017-02-14 Mediatek Inc. Data processing apparatus with adaptive compression algorithm selection based on visibility of compression artifacts for data communication over camera interface and related data processing method
EP2944082B1 (en) * 2013-01-11 2019-08-21 Huawei Technologies Co., Ltd. Method and apparatus of depth prediction mode selection
WO2014172387A1 (en) * 2013-04-15 2014-10-23 Huawei Technologies Co., Ltd. Method and apparatus of depth prediction mode selection
US20170272778A9 (en) * 2014-01-06 2017-09-21 Samsung Electronics Co., Ltd. Image encoding and decoding methods for preserving film grain noise, and image encoding and decoding apparatuses for preserving film grain noise
CN106162184B (zh) 2016-07-28 2020-01-10 华为技术有限公司 一种数据块编码方法及装置
US11272192B2 (en) * 2019-03-04 2022-03-08 Comcast Cable Communications, Llc Scene classification and learning for video compression
CN111901594B (zh) * 2020-06-29 2021-07-20 北京大学 面向视觉分析任务的图像编码方法、电子设备及介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6175650B1 (en) * 1998-01-26 2001-01-16 Xerox Corporation Adaptive quantization compatible with the JPEG baseline sequential mode
US6782135B1 (en) * 2000-02-18 2004-08-24 Conexant Systems, Inc. Apparatus and methods for adaptive digital video quantization
US7173971B2 (en) * 2002-11-20 2007-02-06 Ub Video Inc. Trailing artifact avoidance system and method
US20040120398A1 (en) * 2002-12-19 2004-06-24 Ximin Zhang System and method for adaptive field and frame video encoding using rate-distortion characteristics
US7194035B2 (en) * 2003-01-08 2007-03-20 Apple Computer, Inc. Method and apparatus for improved coding mode selection
US7280597B2 (en) * 2003-06-24 2007-10-09 Mitsubishi Electric Research Laboratories, Inc. System and method for determining coding modes, DCT types and quantizers for video coding
JP4130617B2 (ja) * 2003-09-04 2008-08-06 株式会社東芝 動画像符号化方法および動画像符号化装置
US8005139B2 (en) * 2004-06-27 2011-08-23 Apple Inc. Encoding with visual masking
JP4609670B2 (ja) * 2004-12-28 2011-01-12 日本電気株式会社 画像符号化装置、画像符号化方法及びそのプログラム
EP1677252A1 (en) 2005-01-03 2006-07-05 Thomson Licensing Method and apparatus for calculating a lambda value controlling the coding mode in a video encoder.
US20060222074A1 (en) * 2005-04-01 2006-10-05 Bo Zhang Method and system for motion estimation in a video encoder
US20070030894A1 (en) * 2005-08-03 2007-02-08 Nokia Corporation Method, device, and module for improved encoding mode control in video encoding
US20070237237A1 (en) * 2006-04-07 2007-10-11 Microsoft Corporation Gradient slope detection for video compression
US7995649B2 (en) * 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US20070274396A1 (en) * 2006-05-26 2007-11-29 Ximin Zhang Complexity adaptive skip mode estimation for video encoding
US8036270B2 (en) * 2006-07-27 2011-10-11 Sharp Laboratories Of America, Inc. Intra-frame flicker reduction in video coding
US8737485B2 (en) * 2007-01-31 2014-05-27 Sony Corporation Video coding mode selection system
US8259793B2 (en) * 2007-03-19 2012-09-04 Sony Corporation System and method of fast MPEG-4/AVC quantization

Also Published As

Publication number Publication date
JP2009071837A (ja) 2009-04-02
EP2061254A3 (en) 2011-11-02
US20090074058A1 (en) 2009-03-19
CN101534448A (zh) 2009-09-16
EP2061254A2 (en) 2009-05-20
KR20090028441A (ko) 2009-03-18

Similar Documents

Publication Publication Date Title
JP5553979B2 (ja) 人間の視覚的許容度に基づくビデオ符号化の符号化ツールの選択
RU2510944C2 (ru) Способ кодирования/декодирования многоракурсной видео последовательности на основе адаптивной локальной коррекции яркости опорных кадров без передачи дополнительных параметров (варианты)
US11240496B2 (en) Low complexity mixed domain collaborative in-loop filter for lossy video coding
Eden No-reference estimation of the coding PSNR for H. 264-coded sequences
US20170244965A1 (en) Controlling a video content system
JP4246723B2 (ja) フレーム内予測符号化制御方法、フレーム内予測符号化制御装置、フレーム内予測符号化制御プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
US8040948B2 (en) Method and system for coding moving image signals, corresponding computer program product
US20140321552A1 (en) Optimization of Deblocking Filter Parameters
US9838690B1 (en) Selective prediction signal filtering
WO2014139396A1 (en) Video coding method using at least evaluated visual quality and related video coding apparatus
JP2011510591A (ja) 時空間的複雑度を用いた符号化モード決定方法及び装置
US20190320201A1 (en) Moving image encoding device
US20120207212A1 (en) Visually masked metric for pixel block similarity
JP2008219147A (ja) 動画像符号化装置
JP5250638B2 (ja) フリッカー測定方法
RU2533852C2 (ru) Способ кодирования/декодирования многоракурсной видеопоследовательности на основе адаптивной компенсации локальных различий яркости при межкадровом предсказании (варианты)
KR20110046523A (ko) 암 노이즈 아티팩트를 검출하기 위한 방법 및 장치
JP5748225B2 (ja) 動画像符号化方法,動画像符号化装置および動画像符号化プログラム
JP2005057761A (ja) ノイズの画像収集に関する問題を低減するテレビ会議システムのエンコード又はデコードのための方法
JP4216769B2 (ja) 動画像符号化方法、動画像符号化装置、動画像符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2006005466A (ja) 画像符号化方法及び装置
CN105144712B (zh) 用于编码数字图像序列的方法
KR100943068B1 (ko) 곡선 보간을 이용한 에러복원방법
JP4829951B2 (ja) フレーム内予測符号化制御方法、フレーム内予測符号化制御装置、フレーム内予測符号化制御プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
RU2493668C1 (ru) Способ кодирования/декодирования многоракурсной видеопоследовательности на основе локальной коррекции яркости и контрастности опорных кадров без передачи дополнительных служебных данных

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110901

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120625

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120925

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120928

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121024

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121029

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121126

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130729

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140428

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140528

R150 Certificate of patent or registration of utility model

Ref document number: 5553979

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees