JP2004518337A - ビデオエンハンスメントのために符号化情報に基づく有用メトリックを提供するための装置及び方法 - Google Patents
ビデオエンハンスメントのために符号化情報に基づく有用メトリックを提供するための装置及び方法 Download PDFInfo
- Publication number
- JP2004518337A JP2004518337A JP2002557115A JP2002557115A JP2004518337A JP 2004518337 A JP2004518337 A JP 2004518337A JP 2002557115 A JP2002557115 A JP 2002557115A JP 2002557115 A JP2002557115 A JP 2002557115A JP 2004518337 A JP2004518337 A JP 2004518337A
- Authority
- JP
- Japan
- Prior art keywords
- digital video
- pixel
- useful metric
- coding
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/20—Circuitry for controlling amplitude response
- H04N5/205—Circuitry for controlling amplitude response for correcting amplitude versus frequency characteristic
- H04N5/208—Circuitry for controlling amplitude response for correcting amplitude versus frequency characteristic for compensating for attenuation of high frequency components, e.g. crispening, aperture distortion correction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/527—Global motion vector estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Picture Signal Circuits (AREA)
Abstract
符号化情報を用いるデジタルビデオ信号の特性をエンハンスするための装置及び方法が開示されている。前にエンコード化またはトランスコード化されたデジタルビデオ信号のシャープネスは、エンコード化アーチファクトをエンハンスすることなく、エンハンスされる。その装置(135)は、符号化アーチファクトをエンハンスすることなく画像シーケンスを表す予め符号化されたデジタルビデオに適用することが可能である画像のシャープネスエンハンスメントへの制限を確認するところの有用メトリックジェネレータ(215)から構成される。有用メトリックジェネレータは、少なくとも1つのシャープネスエンハンスメントアルゴリズムに有用メトリックを適用する。有用メトリック及びシャープネスエンハンスメントアルゴリズムは分離しているので、種々のビデオエンハンスメントアルゴリズムと共に有用メトリックを用いることが可能である。
Description
【0001】
(技術分野)
本発明は、符号化情報を用いるデジタルビデオ信号の特性をエンハンスさせるための装置及び方法を提供する。本発明の装置及び方法は、エンコード化アーチファクトを向上させることなく、エンコード化またはトランスコード化されたデジタルビデオのシャープネスをエンハンスさせる。本発明はマルチメディア分野の装置に使用される空間ドメインシャープネスエンハンスメントアルゴリズムとの関連において用いることが可能である。
【0002】
(背景技術)
セットトップボックス、ハイエンドテレビ、デジタルテレビ、個人のテレビ、記憶プロダクト、携帯情報端末(PDA)、無線インターネット装置等の高性能マルチメディア装置の開発は、種々のアーキテクチャを牽引し、これらの装置の新しい機能開拓の可能性を更に広げている。何れかのフォーマットでビデオデータを表示するためのこれら新しい製品及びそれらの能力の発達は、ビデオ処理及びビデオエンハンスメントアルゴリズムに関する新しい要求及び機会を結果としてもたらしている。これら装置の殆どは、MPEG−2フォーマットでビデオを受け取り及び/または記憶する。近い将来、これらの装置の多くはまた、MPEG−4フォーマットでビデオを受け取り及び/または記憶することが可能となる。これらMPEGソースの画質は非常によい状態から極端に悪い状態まで様々に変化する。
【0003】
青色レーザベースのデジタルビデオレコーダ等の次世代の記憶装置は、ある程度の高精細度(HD:High Definition)能力を有することになろう。デジタルビデオレコーダ(DVR)は、ビデオ画像エンハンスメントの新しい方法が有利であるタイプの装置についてのよい例である。HDプログラムは、典型的には、20Mb/秒で放送され、MPEG−2ビデオ標準に従って符号化される。デジタルビデオレコーダの記憶容量は約20〜25GBの範囲内である。これは、ビデオディスク当たりのHDビデオの記録時間が約2時間であることを表している。
【0004】
ビデオディスク当たりの記録時間を増加させるために、長時間モードを定義することができる。例えば、長時間(LP)モードにおいて、10Mb/秒の記憶ビットレートで20Mb/秒の放送ビットレートを記録することが可能である。これは、ビデオディスク当たり約4時間の記録時間を提供するであろう。拡大長時間(ELP)モードにおいては、5Mb/秒の記憶ビットレートで20Mb/秒の放送ビットレートを記録することが可能である。これは、ビデオディスク当たり約8時間の記録時間を提供するであろう。
【0005】
高ビットレートのビットストリームをより低いビットレートのビットストリームに変換するプロセスは“ビットレートトランスコーディング(transcoding)”と称せられる。高ビットレートのビットストリームを低ビットレートのビットストリームにトランスコーディングする1つの方法は、MPEG−2復号器を用いて高ビットレートのビットストリームを復号する段階、及び、次いで得られたビットストリームを低ビットレートで符号化する段階を含む。高ビットレートのビットストリームをトランスコーディングするもう1つの方法は、ビデオを十分に復号及び再符号化することなくより低いビットレートにそのビットストリームを直接トランスコーディングする段階を含む。この方法は、直接ビットレートトランスコーディング(DBT:Direct Bitrate Transcoding)として知られている。
【0006】
MPEG−2トランスコーディングのプロセスは、情報の損失により、ビデオシーケンスの画質(例えば、シャープネス)を低下させる可能性がある。しかしながら、画質は過度に折衷されないことが好ましい。このことは、特に長時間(LP)モードに対して重要である。それ故、トランスコーディングされたビデオ信号の後処理は、感知される画質を改善する重要な役割を果たす。
【0007】
シャープネスエンハンスメントアルゴリズムの殆どの技術情勢は、NTSC、PAL及びSECAMのようなアナログビデオ伝送標準について発展され、最適化されてきた。従来、画像エンハンスメントアルゴリズムは、画像内の所定の所望されない様相を減じ(例えば、ノイズ低減)、または、画像の所定の要望される特性を改善する(例えば、シャープネスエンハンスメント)。新たに現れてきたデジタル記憶装置、デジタルテレビ、セットトップボックス、及び他の類似する装置に対して、従来のシャープネスエンハンスメントアルゴリズムは、これらのソースの異なる特性のために符号化またはトランスコーディングされたMPEGに関して最適とはいかない性能を示すことがある。記憶システムのビデオ処理における確定連鎖において、符号化ソースの特性を決定させることを可能にする情報をMPEGストリームから導くことが可能である。この情報はビデオエンハンスメントアルゴリズムの性能を向上させるために用いられ得る可能性がある。
【0008】
画質は依然としてハイエンドビデオプロダクトに対する識別因子であるため、上述のデジタルソースと共に用いるために特に適合される画像エンハンスメントを実行するための新しい方法は有利であろう。論文、C. J. Tsai, P. Karunaratne, N. P. Galatsanos及びA. K. Katsaggelosによる“圧縮されたビデオ・エンハンスメント・アルゴリズム(A Compressed Video Enhancement Algorithm)”Proc.of IEEE, ICIP’99, Kobe, Japan, 1999年10月25〜28日(非特許文献1)、において、著者は低ビットレートで符号化されたビデオシーケンスを向上するために反復アルゴリズムを提案している。MPEGソースについての画質の劣化は、殆どが量子化機能から由来する。それ故、その著者により採用された反復グラディエント予測アルゴリズムは、その費用関数における量子化ステップサイズ、マクロブロックタイプ及び順方向運動ベクトル等の符号化情報を用いている。このアルゴリズムは、低ビットレートのビデオに対して期待できる結果を示している。しかしながら、その主な不利な点は演算が非常に複雑なことである。
【0009】
論文、B. Martins及びS. Forchammerによる“MPEG−2符号化ビデオの改善された復号(Improved Decoding of MPEG−2 Coded Video)”Proc. of IBC 2000, pp.109−115, Amsterdam, The Netherlands, 2000年9月7〜12日(非特許文献2)、において、著者は、MPEG−2符号化ビデオの復号化を改善するための新しい概念を開示している。具体的には、復号化プロセスに融合されたデインターカレース及びフォーマット変換のための統一された方法が提案されている。その技術は、通常の復号化により得られる画像より著しく良好な画質をもたらす。しかしながら、現在までのところ、その計算における複雑さは、それを消費者が適用してそれを実行することを妨げている。
上記した2つの論文は、MPEG符号化情報を用いるビデオエンハンスメントアルゴリズムについて記載している。しかしながら、それら両者のシナリオは、実際的でないことに加えて、エンハンスメントとコスト関数を結び付けている。コスト関数は、どのくらいの量だけ、且つ画像のどの位置に、エンハンスメントを適用することができるかを決定する。このようなコスト関数とエンハンスメント関数の組み合わせがもたらす問題は、コスト関数と共にたった1つのアルゴリズムを用いることである。
【0010】
それ故、符号化及びトランスコード化されたビデオソースを効果的にエンハンスすることが可能であるビデオエンハンスメントのための装置及び方法があることは好ましいことである。
【0011】
本発明は、一般に、符号化情報を用いるデジタルビデオ信号の特性をエンハンスするための装置及び方法から構成される。本発明は、符号化アーチファクトを増加することなく、個々の画素をどれくらいエンハンスすることが可能であるかを計算する有用メトリックから構成される。
【0012】
その装置は、符号化アーチファクトをエンハンスすることなく画像のシーケンスを表す予め符号化されたデジタルビデオに適用することが可能である画像のシャープネスエンハンスメント量に対する制限を決定することが可能である有用メトリックジェネレータから構成される。有用メトリックジェネレータは有用メトリックを少なくとも1つのシャープネスエンハンスメントアルゴリズムに適用する。有用メトリック及びシャープネスエンハンスメントアルゴリズムは分離しているので、種々のビデオエンハンスメントアルゴリズムと共に有用メトリックを用いることが可能である。
【0013】
(非特許文献1)
C.J. Tsai, P. Karunaratne, N. P. Galatsanos及びA. K. Katsaggelos “圧縮されたビデオ・エンハンスメント・アルゴリズム(A Compressed Video Enhancement Algorithm)”Proc. of IEEE, ICIP’99, Kobe, Japan、1999年10月25〜28日
(非特許文献2)
B. Martins及びS. Forchammer “MPEG−2コード化されたビデオの改善されたデコーディング(Improved Decoding of MPEG−2 Coded Video)”Proc. ofIBC 2000, pp.109−115, Amsterdam, The Netherlands, 2000年9月7〜12日
(発明の概要)
本発明の主な目的は、デジタルビデオへのビデオエンハンスメントアルゴリズムの適用を調節するために有用メトリックを用いる装置及び方法を提供することである。
【0014】
本発明の他の目的は、種々の異なるビデオエンハンスメントアルゴリズムを有用メトリックと組み合わせて用いることが可能であるようにビデオエンハンスメントアルゴリズムから分離される有用メトリックを提供することである。
【0015】
本発明の更なる目的は、装置の性能と複雑さの間の最適なトレードオフを確実にするために有用なメトリックを装置の制約に合わせることができる装置及び方法を提供することである。
【0016】
本発明の更なる目的は、エンコード化及びトランスコード化ビデオソースを伴って最適に機能するデジタルビデオエンハンスメントの装置及び方法を提供することである。
【0017】
前述の内容は本発明の特徴及び技術的優位点のかなり大雑把な概要について述べたものであるため、当業者は、以下に述べる“発明の詳細な説明”により更によく理解できるであろう。本発明の主要部である請求項を構成する本発明の付加的な特徴及び優位点については以下で述べる。本発明と同じ目的を実行するために改良したり他の構造をデザインしたりする基礎として、開示された概念及び具体的な実施形態を即座に用いることが可能であることを、当業者はありがたく思う筈である。当業者はまた、そのような等価な構成は、広い形態に及ぶ本発明の概念及び適用範囲から逸脱するものではないことを認識するべきである。
【0018】
本発明の“発明の詳細な説明”に入る前に、本発明の明細書を通して用いる所定の用語(単語及びフレーズ)の定義について述べて、利便を図ることとする。“含む”及び“構成する”及びこれらの派生語は、制限なく包含することを意味する。“または”は包括的であり、及び/または、を意味する。“に関連する”及び“それに関連する”と共にそれらの派生フレーズは、含むこと、を意味し、にまたはと共に連結する、と連絡する、と協力する、相互配置する、並列する、近接する、強いられる、有する、の特性を有する、等を意味する。“コントローラ”、“プロセッサ”または“装置”は、ハードウェア、ファームウェア、またはソフトウェア、またはそれらのうち2つの組み合わせにおいて実行される装置のような、少なくとも1つの走査を制御する何らかの装置、システム、またはそれらの一部を意味する。何らかの特定なコントローラに関連する機能は集中または分散されることが可能であることに注意しなければならない。特に、コントローラは、1つまたはそれ以上のデータプロセッサから構成され、入力/出力装置およびメモリに関連し、1つまたはそれ以上のアプリケーションプログラム及び/または動作するシステムプログラムを実行する。所定の単語またはフレーズの定義は本発明の明細書を通して提供される。当業者は、殆どでないまでも多くにおいて、そのような定義の例が定義された単語及びフレーズの過去における使用と同様に将来の使用に対しても適用できることを理解する筈である。
【0019】
(発明の詳細な説明)
本発明の装置及び方法についての原理を開示するために以下で説明する図1〜5及び種々の実施形態は単に例示であって本発明の権利範囲を制限するものと決して解釈されるべきではない。本発明の装置及び方法はデジタルテレビセットにおけるビデオ信号をエンハンスするための装置及び方法として開示されるであろう。本発明の装置及び方法はデジタルテレビセットに限定されるものではないことを認識することは重要なことである。本発明の原理はまた、テレビレシーバ、セットトップボックス、記憶装置、コンピュータビデオ表示システム及びデジタルビデオ信号を利用または処理するその他のタイプの電子機器を制限することなく含む如何なるタイプのデジタルビデオシステムに成功裏に適用可能であることは、当業者にはすぐに理解されるであろう。
【0020】
図1は、本発明の装置及び方法を利用するデジタルテレビセット100を示すブロック図である。デジタルテレビセット100は、テレビレシーバ110及び表示ユニット115から構成される。表示ユニット115はビデオ画像を表示するためのCRT、フラットパネルディスプレイ、またはその他のタイプの装置である。テレビレシーバ110はテレビ信号を受信するためのアンテナ105から構成される。アンテナ105をチューナ120に連結する。チューナ120を中間周波数(“IF”)プロセッサ125に連結する。IFプロセッサ125をMPEG復号器130に連結する。
【0021】
更に詳しく説明されるように、本発明は、ビデオ信号特性をエンハンスするためにエンハンスのための有用メトリック(UME:Usefulness Metric for Enhancement)を計算する。MPEG復号器130の出力を後処理回路135に結合する。後処理回路135は、本発明の有用メトリック(UME)から構成される適応ピーキングユニット140から構成される。後処理回路135内の適切な位置に適応ピーキングユニット140を設置することが可能である。後処理回路135の出力は表示ユニット115への入力である。
【0022】
適応ピーキングユニット140は、それがMPEG復号器130から受け取るビデオ信号を処理する。適応ピーキングユニット140は、適応ピーキングプロセスで用いるための符号化ゲイン値を生成するために、有用メトリック(UME)を用いる。適応ピーキングプロセスは例証であり、本発明の有用メトリック(UME)をどのように用いることが可能であるかを示す。本発明の装置及び方法は適応ピーキングプロセスに限定されないことは明らかである。有用メトリック(UME)を、1つ以上のタイプのビデオエンハンスメントアルゴリズムと共に用いることが可能である。
【0023】
適応ピーキングユニット140は、ビデオ信号における符号化情報を考慮に入れる方法でビデオ信号を処理する。適応ピーキングユニット140の出力は、適応ピーキングユニット140がMPEG復号器130から受け取るビデオ信号のためのエンハンスされた輝度信号である。適応ピーキングユニット140により決定される輝度信号は、従来技術の適応ピーキングユニットにより提供される輝度信号に比べてより正確且つ視覚的に識別可能なビデオ画像を提供する。適応ピーキングユニット140はエンハンスされた輝度信号を後工程回路135内の他の回路に移す。後工程回路135は、ビデオ信号の特性をエンハンスするためにエンハンスされた輝度信号を利用することが可能である。
【0024】
後工程回路135は、幾つかの異なるタイプのビデオ信号処理を行うことが可能である。例えば、それらのビデオ信号処理を適用することの中には、(a)ノイズ低減アルゴリズムに適応可能なノイズレベル、(b)シャープネスエンハンスメントに適応可能なノイズレベル、(c)輝度とクロミナンスの分離に適応可能なノイズレベル、(d)動き検出に適応可能なノイズレベル、(e)運きの評価及び補償に適応可能なノイズレベル、(f)アップコンバージョンに適応可能なノイズレベル、(g)特長エンハンスメントに適応可能なノイズレベル、及び(h)対象ベースのアルゴリズムに適応可能なノイズレベル、がある。
【0025】
図2は、本発明の1つの好適な実施形態に従った適応ピーキングユニット140についての装置及び方法を示すブロック図である。図2は、どのようにして本発明の有用メトリック(UME)がシャープネスエンハンスメントのために適応ピーキングアルゴリズムに適用されるかについて示している。適応ピーキングアルゴリズムは、入力輝度信号210の過渡振幅の増加で方向付けられる。適応ピーキングアルゴリズムは、“推測的な”符号化/トランスコード化されたビデオソースに対して最適なビデオ特性を常に供給するとは限らない。これは、主に、MPEGソースの性質が考慮に入れられない現実による結果である。
【0026】
本発明において、有用メトリックジェネレータ215は有用メトリック(UME)を生成する。有用メトリック(UME)は参照番号220で表される。UME220はMPEGソースの特性を考慮に入れている。オリジナルのアルゴリズムはUME220を用いることにより拡張され、これにより、アルゴリズムの性能が著しく向上する。
【0027】
適応ピーキングアルゴリズムにより用いられる原理は従来技術において周知である。適応ピーキングアルゴリズムの1例は4つの制御ブロックを利用する。図2に示すように、4つの制御ブロックは、コントラスト制御ブロック225、ダイナミックレンジ制御ブロック230、クリッピング防止ブロック235、及び適応コアリングブロック240である。コントラスト制御ブロック225はゲイン信号“g1”を生成する。ダイナミックレンジ制御ブロック230はゲイン信号“g2”を生成する。クリッピング防止ブロック235はゲイン信号“g3”を生成する。適応コアリングブロック240はゲイン信号“g4”を生成する。
【0028】
これらの4つの画素ベースの制御ブロックは、コントラスト、ダイナミックレンジ及びノイズレベル等のビデオ信号についての特定局所の特性を考慮に入れる。しかしながら、これら4つの制御ブロックは、符号化特性に関する情報については考慮に入れない。
【0029】
本発明の装置は符号化ゲインブロック245を備えている。符号化ゲインブロック245は有用メトリック(UME)を用い、許容されるピーキング量を決定する。符号化ゲインブロック245はゲイン信号“gcoding”を生成する。ダイナミックゲイン制御ブロック250は5つのゲイン信号(g1、g2、g3、g4、gcoding)の最小値を選択し、最終ゲイン信号 “g”を生成する。乗算回路255は、最終ゲイン信号“g”に2Dピーキングフィルタ260でフィルタリングされたハイパス信号を乗じる。加算器265は、乗算回路255からのその積を輝度入力信号210で表される画素のオリジナルの輝度値に加算する。このようにして、エンハンスされた輝度出力信号270が生成する。
【0030】
UME220は、符号化アーチファクトの増加を伴わないで、画素または領域がどれくらいエンハンスされるかを計算する(画素毎または領域毎に)。UME220はビットストリームに存在するMPEG符号化情報から導き出される。ビットストリームに存在する符号化情報を復号化手順の間に取り出すことが可能である。UME220と共に用いられるMPEG情報を選択することは決してありふれたことではない。UME220はビデオの空間と時間上の特性または画質についての指示を提供するに違いない。
【0031】
復号化の間に直接得ることが可能であるMPEG情報の最も細かい粒度は、(1)マクロブロック(MB)量、または、(2)ブロックベースの量、のどちらかに基づくものである。しかしながら、空間(画素)ドメインビデオエンハンスメントのために、最も高品位の画質を確実にするために画像の各画素に対してUMEを計算しなければならない。
【0032】
MPEG情報から簡単に抽出される1つのパラメータは、それが各符号化マクロブロック(MB)に存在するとき、量子化パラメータとなっている。量子化パラメータが大きければ大きい程、量子化は粗くなり、したがって、量子化に伴うエラーが大きくなる。量子化エラーが大きいと、符号化アーチファクト、即ち大きい量子化パラメータをもつマクロブロック(MB)の画素のエンハンスメントが非常に抑えられるに違いない。
【0033】
情報についてのその他の有用な項目は、マクロブロック(MB)又はブロックを符号化するために使用されるビット数である。使用されるビット数を、特定の画像におけるマクロブロック(MB)またはブロックで使用される平均ビット数と比較することが可能である。しかしながら、この量はまた、シーンの内容、ビットレート、画像タイプ(I(内部用)、P(予測)、B(双方向予測)ピクチャタイプ)、動き評価、及び動き補償にもまた非常に依存する。
【0034】
ブロックにおけるDCT係数の分布を検討することもまた可能である。エンハンスされるビデオの時間的特性に関する情報を得るために動きベクトルを用いることもまた可能である。MPEGエンコードのために評価され且つ用いられる動きベクトルは必ずしもビデオにおける真の動きを表さないことは周知のことである。しかしながら、運動ベクトルは静的領域を確認することに役立ち、動きベクトルが信頼できないときでさえ、フレーム毎のエンハンスメントの時間的一貫性を改善するために静的領域を使用することが可能である。
【0035】
量子化パラメータ及び用いられるビット数(マクロブロック(MB)又はブロックを符号化するために)の両者は、MPEGエンコードのレート制御の計算において広く用いられている。量子化パラメータ及び用いられるビット数は符号化の複雑さを計算するために通常用いられる。
【0036】
UMEの例1。“符号化の複雑さ”は量子化パラメータとマクロブロック(MB)またはブロックをエンコード化するために使用されるビット数との積として定義される。符号化の複雑さは、したがって、次式で表される。
【0037】
complMB/block(k,h)=mquant(k,h)*bitsMB/block(k,h) (1)
ここで、“mquant”は量子化パラメータであり、“bitsMB/blo ck”はマクロブロック(k,h)またはブロック(k,h)をエンコード化するために用いられるDCT係数のビット数である。基礎となる前提は、フレームの平均複雑さに関するマクロブロック(MB)又はブロックの複雑さが大きくなればなる程、マクロブロック(MB)又はブロックにおいて符号化アーチファクトを有する確率は大きくなる。それ故、比較的大きい符号化の複雑さをもつブロックの画素に対してはエンハンスメントは抑制されるべきである。
【0038】
したがって、画素(i,j)のUMEは、次式により定義される。
【0039】
UME(i,j)=1−complpixel(i,j)/2*complAVE (2)
ここで、complpixel(i,j)は画素(i,j)の符号化の複雑さであり、complAVEは画像の符号化の複雑さの平均である。complAVEの値は次式により評価することが可能である。
【0040】
【数1】
ここで、NBは画像に存在するブロック数であり、coding_complblockはブロックについての符号化の複雑さである。
【0041】
本発明において、双線形補間によりマクロブロック(MB)またはブロックの複雑さマップからcomplpixel(i,j)を評価する。高次補間等の他の補間方法もまた用いることが可能である。
【0042】
マクロブロック(MB)/ブロックについての複雑さのマップは引き継がれたブロック構造を有する。この複雑さのマップの特性(UMEに対して好ましくない)を低減するために、空間ローパスフィルタをそのマップに適用する。ローパスフィルタに用いられるフィルタカーネルは、次式のようになる。
【0043】
【数2】
他のタイプのローパスフィルタリングもまた可能である。
【0044】
本発明の1つの好適な実施形態において、UME(i,j)は0(“ゼロ”)から1までの範囲の値をとることが可能である。UME(i,j)の値が0であることは、特定の画素に対してシャープネスエンハンスメントが可能とされないことを意味し、一方、UME(i,j)の値が1であることは、如何なる符号化アーチファクトをエンハンスするリスクを伴わないで、画素を自由にエンハンスすることが可能であることを意味している。
【0045】
より強いビットレート依存性を盛り込むために、量子化パラメータに直接関連する項を付加することにより式(2)を拡張することが可能である。これは、低ビットレートで符号化されるビデオに対して特に有利である。
【0046】
UMEの例2。この例においては、量子化パラメータのみをUMEの計算に用いると仮定される。より大きい量子化パラメータ値は、通常、符号化アーチファクトの増大をもたらすため、UMEは量子化パラメータ、即ちmquantに反比例する筈である。MB(k,h)についてのUMEの可能な関数は、次式で与えられる。
【0047】
【数3】
ここで、変数a、b、c及び関数fは実験的に決定される。式(5)で表される関数UMEMB(k,h)を図3にグラフとして示す。1つの量子化パラメータがエンコード化手順において1つのマクロブロック(MB)に割り当てられるため、式(5)における関数UMEMB(k,h)は各マクロブロック(MB)に対して計算される。それ故、マクロブロック(MB)レベルのUMEマップを補間することにより、フレームの各画素に対するUMEMB(k,h)を得ることが可能である。
【0048】
MPEG−2ビデオ圧縮規格は、データの伴わないP(予測)及びB(双方向予測)画像タイプ)ピクチャの所定のマクロブロック(MB)及びブロックの、エンコード化を可能にする。これらのマクロブロックは“スキップされた(skipped)”マクロブロックと呼ばれる。最も新しい符号化及びスキップされないマクロブロック(MB)からの参照ピクチャ及び符号化情報を用いる復号化手順においてスキップされたマクロブロック(MB)を再構成することが可能である。更に、十分に動き補正がなされたマクロブロック(MB)に対しては、符号化されないビットストリームにおけるDCTデータまたはマクロブロックにおける所定のブロックはない。
【0049】
スキップされた又はエンコード化されないマクロブロック(MB)及びブロックに対して、エンコード化されたビットストリームはUMEを計算するために必要な符号化情報を含まない。この不足を改善するために、例えば次の2つの方法のうち1つを用いて、UMEを評価することが可能である。
【0050】
第1の方法は、スキップされた又は符号化されないマクロブロック(MB)またはブロックについてUMEを評価するために隣接するスキップされない又は符号化されたマクロブロック(MB)を用いることである。1つの好適な実施形態において、3×3のウィンドウが用いられる。この評価ウィンドウはスキップされたまたは符号化されないマクロブロック(MB)に中心が置かれる。すべてのマクロブロック(MB)が評価ウィンドウにおいてスキップされまたは符号化されない場合、スキップされまたは符号化されないマクロブロック(MB)の複雑さはフレームの平均の複雑さの半分であるとみなされる。この方法は、ピクチャが比較的少ないスキップされたマクロブロック数を有する場合にうまく使える。ピクチャが低ビットレートのエンコード化を有するか、または静止シーンを有する場合、この評価方法では粗すぎる。
【0051】
第2の方法は、動き補正を用いて、前のフレームの対応するマクロブロック(MB)に割り当てられたように、スキップされたまたは符号化されないマクロブロック(MB)に同じUMEを割り当てることである。
【0052】
UMEは特性を符号化するために計算されるので、UMEはブロッキング及びリンギングなどの符号化アーチファクトのエンハンスメントのみを妨げる。それ故、過度のエンハンスメントの適用に起因する、符号化しない原因をもつアーチファクトの防止または削減は、シャープネスエンハンスメントアルゴリズムの他の部分により対処される。
【0053】
UMEを如何なるピーキングアルゴリズムと組み合わされることが可能である。それに代えて、UMEを如何なる空間ドメインシャープネスエンハンスメントアルゴリズムに適合させることも可能である。また、符号化情報だけを適合可能なピーキングアルゴリズムと組み合わせて利用することも可能である。また、適合するピーキングアルゴリズムと組み合わされる情報に関連するシーン内容を組み込む符号化情報を利用することも可能である。
【0054】
図4はそのような実施形態を示している。図4においては、図1の4つのブロック225、230、235及び240は削除されている。符号化ゲインブロック245のみが残っている。エッジ情報等のシーン内容情報は符号化ゲイン計算に組み込まれる。シーン内容に関連する情報は、UME220の計算においてなされた仮定及び適用された補間から導き出されるUME220の計算についての不確かさを補償する。
【0055】
図4に示す実施形態において、画素(i,j)の符号化ゲインは次式に従って、2つの項の和として決定される。
【0056】
Gcoding(i,j)=UME(i,j)+gedge(i,j) (6)
項UME(i,j)は上述のように定義され、式(2)または式(5)から計算される。項gedge(i,j)はエッジに関連する画素情報であり、エッジ検出出力に基づいて適応するように計算される。gedge(i,j)を計算するための1つの例示的方法は次のような仮定を含む。即ち、(1)p(i,j)は空間配置(i,j)がエッジである画素であり、及び、(2)p(i,j)はエッジの中央に位置し、または、p(i,j)はエッジの中央に最も近い画素である。更に、項gedge(i,j)は次式により計算することが可能である。
【0057】
【数4】
ここで、cの値は実験的に決定される。
【0058】
エッジに関連する項が符号化ゲイン計算において用いられる場合、エッジの検出は、ブロッキングアーチファクトのブロック境界、及び低ビットレートで符号化される画像シーケンスで生じるリンギングの誤ったエッジを除外するべきである。
【0059】
所定の画素に対する符号化ゲインにおける急激なフレームからフレームへの変化は一時的に一貫性のないシャープネスエンハンスメントをもたらし、これは好ましくない。そのような変化はまた、一時的に強度を強め、モスキットノイズのようなアーチファクトの弊害をもたらす。
【0060】
この影響を改善するために、一時的なフィルタリングが前のフレームのゲインを用いて符号化ゲインに適用される。一時的フィルタリングは単純な無限インパルス応答(IIR:Infinite Impulse Response)フィルタまたは動き補償フィルタとすることが可能である。動き補償を用いない1つの可能なIIRフィルタは時式により与えられる。
【0061】
Gaincoding(i,j)=k*gaincoding(i,j,t)+(1−k)*gaincoding(i,j,t−1) (8)
ここで、tは現在のフレームを表し、kはIIRフィルタ係数である。
【0062】
UMEは式(2)の符号化の複雑さに基づいて計算することが可能である。著しい計算における複雑さ及びメモリに対する要求を低減するために、ゲインマップをフィルタリングすることに代えて、マクロブロック(MB)またはブロックベースの複雑さマップを無限インパルス応答(IIR)フィルタを用いて一時的にフィルタリングする。このプロセスは次式により表される。
【0063】
complMB/block(r,s,t)=k*complMB/block(r,s,t)+scal*(1−k)*complMB/block(r,s,t−1)(9)
ここで、(r,s)はマクロブロック(MB)またはブロックの空間座標であり、tは現在のピクチャを表し、kは無限インパルス応答(IIR)フィルタ係数であり、“scal”は異なるピクチャタイプ間の複雑さを考慮に入れるスケーリング項である。スケーリング項“scal”は、フレーム“t”及び“t−1”のMBまたはブロックの複雑さの平均の比として計算される。具体的には、
【0064】
【数5】
空間フィルタの出力は、エンハンスされた輝度出力信号270を生成するためにオリジナルの輝度入力信号210に加算器265により加えられる。
【0065】
本発明はまた、高精細度(HD)を有し長時間(LP)モードを可能にするビデオ記憶アプリケーションに存在するような、高精細度(HD)及び標準精細度(SD)シーケンスとすることが可能である。そのようなビデオシーケンスの大部分は、放送用MPEG−2ビットレートから低い記憶ビットレートにトランスコーディングされる。このアプリケーションの長時間(LP)モードに対して、トランスコーディングの間にフォーマットの変化が生じ得る。標準精細度(SD)または高精細度(HD)のビデオシーケンスは、エンコード化され、復号化され、次いでシャープネスエンハンスメントアルゴリズムを用いて処理され、本発明に従って、符号化情報を用いないアルゴリズムに比較して先験的なエンコード化またはトランスコード化されたビデオシーケンスのためのより優れたビデオ品位を提供する。
【0066】
図5は、本発明の方法の好適な実施形態を示すフロー図である。1つのフレーム(フレーム“t”)を処理するための符号化ゲインを計算するための方法は、一般に、符号500により示される。先ず、符号化情報が得られる(段階505)。次いで、フレーム“t”の複雑さマップが得られる(段階510)。次に、スキップされたまたは符号化されないマクロブロック(MB)(もしあれば)のための複雑さの評価が決定される(段階515)。
【0067】
段階520は、式(4)のフィルタカーネルを用いてローパスフィルタにより複雑さのマップをフィルタリングする段階である。段階525は、式(9)、式(10)及び前のフレーム(フレーム“t−1”)の複雑さのマップを用いて複雑さのマップを一時的にフィルタリングする段階である。段階550は、前のフレーム(フレーム“t−1”)の複雑さマップを得る段階である。フレーム“t−1”の複雑さマップ情報は段階525で用いられる。段階530は、段階525の一時的フィルタリングの後に信号の双線形補間を実行する段階である。画素あたりの符号化ゲインが次いで計算される(段階535)。
【0068】
フレーム“t”からの情報が得られ(段階560)、フレーム“t”の中のピクチャのエッジを検出するために用いられる(段階555)。
【0069】
段階535において画素当たりの符号化ゲインが計算された後、次いで、有用メトリック(UME)は適応ピーキングプロセスで用いられる(段階540)。段階540のUME適応ピーキングプロセスはまた段階560のフレーム“t”から得られた情報を用いる。段階540のUME適応ピーキングプロセスの結果は強調されたフレーム“t”として表示される(段階545)。
【0070】
上述の方法は次のようにまとめることができる。その方法は、マクロブロック(MB)またはブロックレベルの複雑さのマップは時間“t”について利用可能である。スキップされたまたは符号化されないマクロブロック(MB)またはブロックの複雑さの評価を次いで実行する。複雑さのマップのブロッキング構造を減少させるために、式(4)のフィルタカーネルを用いるローパスフィルタリングを適用する。次いで、式(9)、式(10)及び前のフレームの複雑さのマップを用いる複雑さのマップの一時的なフィルタリングを実行する。マクロブロック(MB)またはブロックの複雑さのマップからの双線形補間により、各画素の複雑さの値を評価する。各画素についての複雑さの値及びエッジ検出プロセルの結果を用いて、各画素について符号化ゲインを計算する。強調されたフレーム“t”を生成するために、UMEを用いる適応ピーキングをフレームの各画素に適用する。
【0071】
アルゴリズムをインターレースビデオシーケンスに適用する場合、幾つかの計算をインターレースビデオの特性に適応させることが可能である。複雑さの計算は、インターレースビデオシーケンスに対してMPEGストリームはフィールドまたはフレームの構造化ピクチャの何れかを有することが可能であるという現実により、変化されるであろう。フィールド構造化ピクチャにおいて、ブロックは1つのフィールドのみからのデータを含み、各ブロックはフィールドDCT符号化される。したがって、プログレッシブビデオについての複雑さの計算は、それがフィールド構造化ピクチャについてのものであるように、適用されることが可能である。
【0072】
しかしながら、フレーム構造化ピクチャにおいては、ブロックをフレームDCT符号化またはフィールドDCT符号化することが可能である。それ故、8×8ブロックについて “フィールドの複雑さ”のみを評価することが可能である。ブロックの“フィールドの複雑さ”を計算するために1つのマクロブロック(MB)からの2つのブロックを用いることが可能である。これらの考慮から、インターレースビデオにおいて、マクロブロック(MB)に比べてより単純な場合は、ブロックについての複雑さの計算を用いることが理解される。
【0073】
本発明は、デジタルテレビのセットについて図に例示することにより所定の実施形態に関して詳細に説明したが、本発明は記載した実施形態及びその改良に限定されるものではない。当業者は、広い形態に及ぶ本発明の概念及び適用範囲から逸脱することなく、本発明についての種々の変更、置き換え、修正、変形及び改作が可能であることは明らかである。
【図面の簡単な説明】
【図1】
本発明の装置及び方法から構成される例としてのデジタルテレビセットのブロック図である。
【図2】
本発明の有用メトリックジェネレータ及び符号化ゲインコントロールブロックから構成される好適な実施形態を示すブロック図である。
【図3】
本発明の有用メトリック対量子化パラメータの関係を表す関数について示すグラフである。
【図4】
本発明の有用メトリックジェネレータ及び符号化ゲインコントロールブロックから構成されるもう1つの好適な実施形態を示すブロック図である。
【図5】
本発明の方法及び操作の好適な実施形態を示すフローチャートである。
(技術分野)
本発明は、符号化情報を用いるデジタルビデオ信号の特性をエンハンスさせるための装置及び方法を提供する。本発明の装置及び方法は、エンコード化アーチファクトを向上させることなく、エンコード化またはトランスコード化されたデジタルビデオのシャープネスをエンハンスさせる。本発明はマルチメディア分野の装置に使用される空間ドメインシャープネスエンハンスメントアルゴリズムとの関連において用いることが可能である。
【0002】
(背景技術)
セットトップボックス、ハイエンドテレビ、デジタルテレビ、個人のテレビ、記憶プロダクト、携帯情報端末(PDA)、無線インターネット装置等の高性能マルチメディア装置の開発は、種々のアーキテクチャを牽引し、これらの装置の新しい機能開拓の可能性を更に広げている。何れかのフォーマットでビデオデータを表示するためのこれら新しい製品及びそれらの能力の発達は、ビデオ処理及びビデオエンハンスメントアルゴリズムに関する新しい要求及び機会を結果としてもたらしている。これら装置の殆どは、MPEG−2フォーマットでビデオを受け取り及び/または記憶する。近い将来、これらの装置の多くはまた、MPEG−4フォーマットでビデオを受け取り及び/または記憶することが可能となる。これらMPEGソースの画質は非常によい状態から極端に悪い状態まで様々に変化する。
【0003】
青色レーザベースのデジタルビデオレコーダ等の次世代の記憶装置は、ある程度の高精細度(HD:High Definition)能力を有することになろう。デジタルビデオレコーダ(DVR)は、ビデオ画像エンハンスメントの新しい方法が有利であるタイプの装置についてのよい例である。HDプログラムは、典型的には、20Mb/秒で放送され、MPEG−2ビデオ標準に従って符号化される。デジタルビデオレコーダの記憶容量は約20〜25GBの範囲内である。これは、ビデオディスク当たりのHDビデオの記録時間が約2時間であることを表している。
【0004】
ビデオディスク当たりの記録時間を増加させるために、長時間モードを定義することができる。例えば、長時間(LP)モードにおいて、10Mb/秒の記憶ビットレートで20Mb/秒の放送ビットレートを記録することが可能である。これは、ビデオディスク当たり約4時間の記録時間を提供するであろう。拡大長時間(ELP)モードにおいては、5Mb/秒の記憶ビットレートで20Mb/秒の放送ビットレートを記録することが可能である。これは、ビデオディスク当たり約8時間の記録時間を提供するであろう。
【0005】
高ビットレートのビットストリームをより低いビットレートのビットストリームに変換するプロセスは“ビットレートトランスコーディング(transcoding)”と称せられる。高ビットレートのビットストリームを低ビットレートのビットストリームにトランスコーディングする1つの方法は、MPEG−2復号器を用いて高ビットレートのビットストリームを復号する段階、及び、次いで得られたビットストリームを低ビットレートで符号化する段階を含む。高ビットレートのビットストリームをトランスコーディングするもう1つの方法は、ビデオを十分に復号及び再符号化することなくより低いビットレートにそのビットストリームを直接トランスコーディングする段階を含む。この方法は、直接ビットレートトランスコーディング(DBT:Direct Bitrate Transcoding)として知られている。
【0006】
MPEG−2トランスコーディングのプロセスは、情報の損失により、ビデオシーケンスの画質(例えば、シャープネス)を低下させる可能性がある。しかしながら、画質は過度に折衷されないことが好ましい。このことは、特に長時間(LP)モードに対して重要である。それ故、トランスコーディングされたビデオ信号の後処理は、感知される画質を改善する重要な役割を果たす。
【0007】
シャープネスエンハンスメントアルゴリズムの殆どの技術情勢は、NTSC、PAL及びSECAMのようなアナログビデオ伝送標準について発展され、最適化されてきた。従来、画像エンハンスメントアルゴリズムは、画像内の所定の所望されない様相を減じ(例えば、ノイズ低減)、または、画像の所定の要望される特性を改善する(例えば、シャープネスエンハンスメント)。新たに現れてきたデジタル記憶装置、デジタルテレビ、セットトップボックス、及び他の類似する装置に対して、従来のシャープネスエンハンスメントアルゴリズムは、これらのソースの異なる特性のために符号化またはトランスコーディングされたMPEGに関して最適とはいかない性能を示すことがある。記憶システムのビデオ処理における確定連鎖において、符号化ソースの特性を決定させることを可能にする情報をMPEGストリームから導くことが可能である。この情報はビデオエンハンスメントアルゴリズムの性能を向上させるために用いられ得る可能性がある。
【0008】
画質は依然としてハイエンドビデオプロダクトに対する識別因子であるため、上述のデジタルソースと共に用いるために特に適合される画像エンハンスメントを実行するための新しい方法は有利であろう。論文、C. J. Tsai, P. Karunaratne, N. P. Galatsanos及びA. K. Katsaggelosによる“圧縮されたビデオ・エンハンスメント・アルゴリズム(A Compressed Video Enhancement Algorithm)”Proc.of IEEE, ICIP’99, Kobe, Japan, 1999年10月25〜28日(非特許文献1)、において、著者は低ビットレートで符号化されたビデオシーケンスを向上するために反復アルゴリズムを提案している。MPEGソースについての画質の劣化は、殆どが量子化機能から由来する。それ故、その著者により採用された反復グラディエント予測アルゴリズムは、その費用関数における量子化ステップサイズ、マクロブロックタイプ及び順方向運動ベクトル等の符号化情報を用いている。このアルゴリズムは、低ビットレートのビデオに対して期待できる結果を示している。しかしながら、その主な不利な点は演算が非常に複雑なことである。
【0009】
論文、B. Martins及びS. Forchammerによる“MPEG−2符号化ビデオの改善された復号(Improved Decoding of MPEG−2 Coded Video)”Proc. of IBC 2000, pp.109−115, Amsterdam, The Netherlands, 2000年9月7〜12日(非特許文献2)、において、著者は、MPEG−2符号化ビデオの復号化を改善するための新しい概念を開示している。具体的には、復号化プロセスに融合されたデインターカレース及びフォーマット変換のための統一された方法が提案されている。その技術は、通常の復号化により得られる画像より著しく良好な画質をもたらす。しかしながら、現在までのところ、その計算における複雑さは、それを消費者が適用してそれを実行することを妨げている。
上記した2つの論文は、MPEG符号化情報を用いるビデオエンハンスメントアルゴリズムについて記載している。しかしながら、それら両者のシナリオは、実際的でないことに加えて、エンハンスメントとコスト関数を結び付けている。コスト関数は、どのくらいの量だけ、且つ画像のどの位置に、エンハンスメントを適用することができるかを決定する。このようなコスト関数とエンハンスメント関数の組み合わせがもたらす問題は、コスト関数と共にたった1つのアルゴリズムを用いることである。
【0010】
それ故、符号化及びトランスコード化されたビデオソースを効果的にエンハンスすることが可能であるビデオエンハンスメントのための装置及び方法があることは好ましいことである。
【0011】
本発明は、一般に、符号化情報を用いるデジタルビデオ信号の特性をエンハンスするための装置及び方法から構成される。本発明は、符号化アーチファクトを増加することなく、個々の画素をどれくらいエンハンスすることが可能であるかを計算する有用メトリックから構成される。
【0012】
その装置は、符号化アーチファクトをエンハンスすることなく画像のシーケンスを表す予め符号化されたデジタルビデオに適用することが可能である画像のシャープネスエンハンスメント量に対する制限を決定することが可能である有用メトリックジェネレータから構成される。有用メトリックジェネレータは有用メトリックを少なくとも1つのシャープネスエンハンスメントアルゴリズムに適用する。有用メトリック及びシャープネスエンハンスメントアルゴリズムは分離しているので、種々のビデオエンハンスメントアルゴリズムと共に有用メトリックを用いることが可能である。
【0013】
(非特許文献1)
C.J. Tsai, P. Karunaratne, N. P. Galatsanos及びA. K. Katsaggelos “圧縮されたビデオ・エンハンスメント・アルゴリズム(A Compressed Video Enhancement Algorithm)”Proc. of IEEE, ICIP’99, Kobe, Japan、1999年10月25〜28日
(非特許文献2)
B. Martins及びS. Forchammer “MPEG−2コード化されたビデオの改善されたデコーディング(Improved Decoding of MPEG−2 Coded Video)”Proc. ofIBC 2000, pp.109−115, Amsterdam, The Netherlands, 2000年9月7〜12日
(発明の概要)
本発明の主な目的は、デジタルビデオへのビデオエンハンスメントアルゴリズムの適用を調節するために有用メトリックを用いる装置及び方法を提供することである。
【0014】
本発明の他の目的は、種々の異なるビデオエンハンスメントアルゴリズムを有用メトリックと組み合わせて用いることが可能であるようにビデオエンハンスメントアルゴリズムから分離される有用メトリックを提供することである。
【0015】
本発明の更なる目的は、装置の性能と複雑さの間の最適なトレードオフを確実にするために有用なメトリックを装置の制約に合わせることができる装置及び方法を提供することである。
【0016】
本発明の更なる目的は、エンコード化及びトランスコード化ビデオソースを伴って最適に機能するデジタルビデオエンハンスメントの装置及び方法を提供することである。
【0017】
前述の内容は本発明の特徴及び技術的優位点のかなり大雑把な概要について述べたものであるため、当業者は、以下に述べる“発明の詳細な説明”により更によく理解できるであろう。本発明の主要部である請求項を構成する本発明の付加的な特徴及び優位点については以下で述べる。本発明と同じ目的を実行するために改良したり他の構造をデザインしたりする基礎として、開示された概念及び具体的な実施形態を即座に用いることが可能であることを、当業者はありがたく思う筈である。当業者はまた、そのような等価な構成は、広い形態に及ぶ本発明の概念及び適用範囲から逸脱するものではないことを認識するべきである。
【0018】
本発明の“発明の詳細な説明”に入る前に、本発明の明細書を通して用いる所定の用語(単語及びフレーズ)の定義について述べて、利便を図ることとする。“含む”及び“構成する”及びこれらの派生語は、制限なく包含することを意味する。“または”は包括的であり、及び/または、を意味する。“に関連する”及び“それに関連する”と共にそれらの派生フレーズは、含むこと、を意味し、にまたはと共に連結する、と連絡する、と協力する、相互配置する、並列する、近接する、強いられる、有する、の特性を有する、等を意味する。“コントローラ”、“プロセッサ”または“装置”は、ハードウェア、ファームウェア、またはソフトウェア、またはそれらのうち2つの組み合わせにおいて実行される装置のような、少なくとも1つの走査を制御する何らかの装置、システム、またはそれらの一部を意味する。何らかの特定なコントローラに関連する機能は集中または分散されることが可能であることに注意しなければならない。特に、コントローラは、1つまたはそれ以上のデータプロセッサから構成され、入力/出力装置およびメモリに関連し、1つまたはそれ以上のアプリケーションプログラム及び/または動作するシステムプログラムを実行する。所定の単語またはフレーズの定義は本発明の明細書を通して提供される。当業者は、殆どでないまでも多くにおいて、そのような定義の例が定義された単語及びフレーズの過去における使用と同様に将来の使用に対しても適用できることを理解する筈である。
【0019】
(発明の詳細な説明)
本発明の装置及び方法についての原理を開示するために以下で説明する図1〜5及び種々の実施形態は単に例示であって本発明の権利範囲を制限するものと決して解釈されるべきではない。本発明の装置及び方法はデジタルテレビセットにおけるビデオ信号をエンハンスするための装置及び方法として開示されるであろう。本発明の装置及び方法はデジタルテレビセットに限定されるものではないことを認識することは重要なことである。本発明の原理はまた、テレビレシーバ、セットトップボックス、記憶装置、コンピュータビデオ表示システム及びデジタルビデオ信号を利用または処理するその他のタイプの電子機器を制限することなく含む如何なるタイプのデジタルビデオシステムに成功裏に適用可能であることは、当業者にはすぐに理解されるであろう。
【0020】
図1は、本発明の装置及び方法を利用するデジタルテレビセット100を示すブロック図である。デジタルテレビセット100は、テレビレシーバ110及び表示ユニット115から構成される。表示ユニット115はビデオ画像を表示するためのCRT、フラットパネルディスプレイ、またはその他のタイプの装置である。テレビレシーバ110はテレビ信号を受信するためのアンテナ105から構成される。アンテナ105をチューナ120に連結する。チューナ120を中間周波数(“IF”)プロセッサ125に連結する。IFプロセッサ125をMPEG復号器130に連結する。
【0021】
更に詳しく説明されるように、本発明は、ビデオ信号特性をエンハンスするためにエンハンスのための有用メトリック(UME:Usefulness Metric for Enhancement)を計算する。MPEG復号器130の出力を後処理回路135に結合する。後処理回路135は、本発明の有用メトリック(UME)から構成される適応ピーキングユニット140から構成される。後処理回路135内の適切な位置に適応ピーキングユニット140を設置することが可能である。後処理回路135の出力は表示ユニット115への入力である。
【0022】
適応ピーキングユニット140は、それがMPEG復号器130から受け取るビデオ信号を処理する。適応ピーキングユニット140は、適応ピーキングプロセスで用いるための符号化ゲイン値を生成するために、有用メトリック(UME)を用いる。適応ピーキングプロセスは例証であり、本発明の有用メトリック(UME)をどのように用いることが可能であるかを示す。本発明の装置及び方法は適応ピーキングプロセスに限定されないことは明らかである。有用メトリック(UME)を、1つ以上のタイプのビデオエンハンスメントアルゴリズムと共に用いることが可能である。
【0023】
適応ピーキングユニット140は、ビデオ信号における符号化情報を考慮に入れる方法でビデオ信号を処理する。適応ピーキングユニット140の出力は、適応ピーキングユニット140がMPEG復号器130から受け取るビデオ信号のためのエンハンスされた輝度信号である。適応ピーキングユニット140により決定される輝度信号は、従来技術の適応ピーキングユニットにより提供される輝度信号に比べてより正確且つ視覚的に識別可能なビデオ画像を提供する。適応ピーキングユニット140はエンハンスされた輝度信号を後工程回路135内の他の回路に移す。後工程回路135は、ビデオ信号の特性をエンハンスするためにエンハンスされた輝度信号を利用することが可能である。
【0024】
後工程回路135は、幾つかの異なるタイプのビデオ信号処理を行うことが可能である。例えば、それらのビデオ信号処理を適用することの中には、(a)ノイズ低減アルゴリズムに適応可能なノイズレベル、(b)シャープネスエンハンスメントに適応可能なノイズレベル、(c)輝度とクロミナンスの分離に適応可能なノイズレベル、(d)動き検出に適応可能なノイズレベル、(e)運きの評価及び補償に適応可能なノイズレベル、(f)アップコンバージョンに適応可能なノイズレベル、(g)特長エンハンスメントに適応可能なノイズレベル、及び(h)対象ベースのアルゴリズムに適応可能なノイズレベル、がある。
【0025】
図2は、本発明の1つの好適な実施形態に従った適応ピーキングユニット140についての装置及び方法を示すブロック図である。図2は、どのようにして本発明の有用メトリック(UME)がシャープネスエンハンスメントのために適応ピーキングアルゴリズムに適用されるかについて示している。適応ピーキングアルゴリズムは、入力輝度信号210の過渡振幅の増加で方向付けられる。適応ピーキングアルゴリズムは、“推測的な”符号化/トランスコード化されたビデオソースに対して最適なビデオ特性を常に供給するとは限らない。これは、主に、MPEGソースの性質が考慮に入れられない現実による結果である。
【0026】
本発明において、有用メトリックジェネレータ215は有用メトリック(UME)を生成する。有用メトリック(UME)は参照番号220で表される。UME220はMPEGソースの特性を考慮に入れている。オリジナルのアルゴリズムはUME220を用いることにより拡張され、これにより、アルゴリズムの性能が著しく向上する。
【0027】
適応ピーキングアルゴリズムにより用いられる原理は従来技術において周知である。適応ピーキングアルゴリズムの1例は4つの制御ブロックを利用する。図2に示すように、4つの制御ブロックは、コントラスト制御ブロック225、ダイナミックレンジ制御ブロック230、クリッピング防止ブロック235、及び適応コアリングブロック240である。コントラスト制御ブロック225はゲイン信号“g1”を生成する。ダイナミックレンジ制御ブロック230はゲイン信号“g2”を生成する。クリッピング防止ブロック235はゲイン信号“g3”を生成する。適応コアリングブロック240はゲイン信号“g4”を生成する。
【0028】
これらの4つの画素ベースの制御ブロックは、コントラスト、ダイナミックレンジ及びノイズレベル等のビデオ信号についての特定局所の特性を考慮に入れる。しかしながら、これら4つの制御ブロックは、符号化特性に関する情報については考慮に入れない。
【0029】
本発明の装置は符号化ゲインブロック245を備えている。符号化ゲインブロック245は有用メトリック(UME)を用い、許容されるピーキング量を決定する。符号化ゲインブロック245はゲイン信号“gcoding”を生成する。ダイナミックゲイン制御ブロック250は5つのゲイン信号(g1、g2、g3、g4、gcoding)の最小値を選択し、最終ゲイン信号 “g”を生成する。乗算回路255は、最終ゲイン信号“g”に2Dピーキングフィルタ260でフィルタリングされたハイパス信号を乗じる。加算器265は、乗算回路255からのその積を輝度入力信号210で表される画素のオリジナルの輝度値に加算する。このようにして、エンハンスされた輝度出力信号270が生成する。
【0030】
UME220は、符号化アーチファクトの増加を伴わないで、画素または領域がどれくらいエンハンスされるかを計算する(画素毎または領域毎に)。UME220はビットストリームに存在するMPEG符号化情報から導き出される。ビットストリームに存在する符号化情報を復号化手順の間に取り出すことが可能である。UME220と共に用いられるMPEG情報を選択することは決してありふれたことではない。UME220はビデオの空間と時間上の特性または画質についての指示を提供するに違いない。
【0031】
復号化の間に直接得ることが可能であるMPEG情報の最も細かい粒度は、(1)マクロブロック(MB)量、または、(2)ブロックベースの量、のどちらかに基づくものである。しかしながら、空間(画素)ドメインビデオエンハンスメントのために、最も高品位の画質を確実にするために画像の各画素に対してUMEを計算しなければならない。
【0032】
MPEG情報から簡単に抽出される1つのパラメータは、それが各符号化マクロブロック(MB)に存在するとき、量子化パラメータとなっている。量子化パラメータが大きければ大きい程、量子化は粗くなり、したがって、量子化に伴うエラーが大きくなる。量子化エラーが大きいと、符号化アーチファクト、即ち大きい量子化パラメータをもつマクロブロック(MB)の画素のエンハンスメントが非常に抑えられるに違いない。
【0033】
情報についてのその他の有用な項目は、マクロブロック(MB)又はブロックを符号化するために使用されるビット数である。使用されるビット数を、特定の画像におけるマクロブロック(MB)またはブロックで使用される平均ビット数と比較することが可能である。しかしながら、この量はまた、シーンの内容、ビットレート、画像タイプ(I(内部用)、P(予測)、B(双方向予測)ピクチャタイプ)、動き評価、及び動き補償にもまた非常に依存する。
【0034】
ブロックにおけるDCT係数の分布を検討することもまた可能である。エンハンスされるビデオの時間的特性に関する情報を得るために動きベクトルを用いることもまた可能である。MPEGエンコードのために評価され且つ用いられる動きベクトルは必ずしもビデオにおける真の動きを表さないことは周知のことである。しかしながら、運動ベクトルは静的領域を確認することに役立ち、動きベクトルが信頼できないときでさえ、フレーム毎のエンハンスメントの時間的一貫性を改善するために静的領域を使用することが可能である。
【0035】
量子化パラメータ及び用いられるビット数(マクロブロック(MB)又はブロックを符号化するために)の両者は、MPEGエンコードのレート制御の計算において広く用いられている。量子化パラメータ及び用いられるビット数は符号化の複雑さを計算するために通常用いられる。
【0036】
UMEの例1。“符号化の複雑さ”は量子化パラメータとマクロブロック(MB)またはブロックをエンコード化するために使用されるビット数との積として定義される。符号化の複雑さは、したがって、次式で表される。
【0037】
complMB/block(k,h)=mquant(k,h)*bitsMB/block(k,h) (1)
ここで、“mquant”は量子化パラメータであり、“bitsMB/blo ck”はマクロブロック(k,h)またはブロック(k,h)をエンコード化するために用いられるDCT係数のビット数である。基礎となる前提は、フレームの平均複雑さに関するマクロブロック(MB)又はブロックの複雑さが大きくなればなる程、マクロブロック(MB)又はブロックにおいて符号化アーチファクトを有する確率は大きくなる。それ故、比較的大きい符号化の複雑さをもつブロックの画素に対してはエンハンスメントは抑制されるべきである。
【0038】
したがって、画素(i,j)のUMEは、次式により定義される。
【0039】
UME(i,j)=1−complpixel(i,j)/2*complAVE (2)
ここで、complpixel(i,j)は画素(i,j)の符号化の複雑さであり、complAVEは画像の符号化の複雑さの平均である。complAVEの値は次式により評価することが可能である。
【0040】
【数1】
ここで、NBは画像に存在するブロック数であり、coding_complblockはブロックについての符号化の複雑さである。
【0041】
本発明において、双線形補間によりマクロブロック(MB)またはブロックの複雑さマップからcomplpixel(i,j)を評価する。高次補間等の他の補間方法もまた用いることが可能である。
【0042】
マクロブロック(MB)/ブロックについての複雑さのマップは引き継がれたブロック構造を有する。この複雑さのマップの特性(UMEに対して好ましくない)を低減するために、空間ローパスフィルタをそのマップに適用する。ローパスフィルタに用いられるフィルタカーネルは、次式のようになる。
【0043】
【数2】
他のタイプのローパスフィルタリングもまた可能である。
【0044】
本発明の1つの好適な実施形態において、UME(i,j)は0(“ゼロ”)から1までの範囲の値をとることが可能である。UME(i,j)の値が0であることは、特定の画素に対してシャープネスエンハンスメントが可能とされないことを意味し、一方、UME(i,j)の値が1であることは、如何なる符号化アーチファクトをエンハンスするリスクを伴わないで、画素を自由にエンハンスすることが可能であることを意味している。
【0045】
より強いビットレート依存性を盛り込むために、量子化パラメータに直接関連する項を付加することにより式(2)を拡張することが可能である。これは、低ビットレートで符号化されるビデオに対して特に有利である。
【0046】
UMEの例2。この例においては、量子化パラメータのみをUMEの計算に用いると仮定される。より大きい量子化パラメータ値は、通常、符号化アーチファクトの増大をもたらすため、UMEは量子化パラメータ、即ちmquantに反比例する筈である。MB(k,h)についてのUMEの可能な関数は、次式で与えられる。
【0047】
【数3】
ここで、変数a、b、c及び関数fは実験的に決定される。式(5)で表される関数UMEMB(k,h)を図3にグラフとして示す。1つの量子化パラメータがエンコード化手順において1つのマクロブロック(MB)に割り当てられるため、式(5)における関数UMEMB(k,h)は各マクロブロック(MB)に対して計算される。それ故、マクロブロック(MB)レベルのUMEマップを補間することにより、フレームの各画素に対するUMEMB(k,h)を得ることが可能である。
【0048】
MPEG−2ビデオ圧縮規格は、データの伴わないP(予測)及びB(双方向予測)画像タイプ)ピクチャの所定のマクロブロック(MB)及びブロックの、エンコード化を可能にする。これらのマクロブロックは“スキップされた(skipped)”マクロブロックと呼ばれる。最も新しい符号化及びスキップされないマクロブロック(MB)からの参照ピクチャ及び符号化情報を用いる復号化手順においてスキップされたマクロブロック(MB)を再構成することが可能である。更に、十分に動き補正がなされたマクロブロック(MB)に対しては、符号化されないビットストリームにおけるDCTデータまたはマクロブロックにおける所定のブロックはない。
【0049】
スキップされた又はエンコード化されないマクロブロック(MB)及びブロックに対して、エンコード化されたビットストリームはUMEを計算するために必要な符号化情報を含まない。この不足を改善するために、例えば次の2つの方法のうち1つを用いて、UMEを評価することが可能である。
【0050】
第1の方法は、スキップされた又は符号化されないマクロブロック(MB)またはブロックについてUMEを評価するために隣接するスキップされない又は符号化されたマクロブロック(MB)を用いることである。1つの好適な実施形態において、3×3のウィンドウが用いられる。この評価ウィンドウはスキップされたまたは符号化されないマクロブロック(MB)に中心が置かれる。すべてのマクロブロック(MB)が評価ウィンドウにおいてスキップされまたは符号化されない場合、スキップされまたは符号化されないマクロブロック(MB)の複雑さはフレームの平均の複雑さの半分であるとみなされる。この方法は、ピクチャが比較的少ないスキップされたマクロブロック数を有する場合にうまく使える。ピクチャが低ビットレートのエンコード化を有するか、または静止シーンを有する場合、この評価方法では粗すぎる。
【0051】
第2の方法は、動き補正を用いて、前のフレームの対応するマクロブロック(MB)に割り当てられたように、スキップされたまたは符号化されないマクロブロック(MB)に同じUMEを割り当てることである。
【0052】
UMEは特性を符号化するために計算されるので、UMEはブロッキング及びリンギングなどの符号化アーチファクトのエンハンスメントのみを妨げる。それ故、過度のエンハンスメントの適用に起因する、符号化しない原因をもつアーチファクトの防止または削減は、シャープネスエンハンスメントアルゴリズムの他の部分により対処される。
【0053】
UMEを如何なるピーキングアルゴリズムと組み合わされることが可能である。それに代えて、UMEを如何なる空間ドメインシャープネスエンハンスメントアルゴリズムに適合させることも可能である。また、符号化情報だけを適合可能なピーキングアルゴリズムと組み合わせて利用することも可能である。また、適合するピーキングアルゴリズムと組み合わされる情報に関連するシーン内容を組み込む符号化情報を利用することも可能である。
【0054】
図4はそのような実施形態を示している。図4においては、図1の4つのブロック225、230、235及び240は削除されている。符号化ゲインブロック245のみが残っている。エッジ情報等のシーン内容情報は符号化ゲイン計算に組み込まれる。シーン内容に関連する情報は、UME220の計算においてなされた仮定及び適用された補間から導き出されるUME220の計算についての不確かさを補償する。
【0055】
図4に示す実施形態において、画素(i,j)の符号化ゲインは次式に従って、2つの項の和として決定される。
【0056】
Gcoding(i,j)=UME(i,j)+gedge(i,j) (6)
項UME(i,j)は上述のように定義され、式(2)または式(5)から計算される。項gedge(i,j)はエッジに関連する画素情報であり、エッジ検出出力に基づいて適応するように計算される。gedge(i,j)を計算するための1つの例示的方法は次のような仮定を含む。即ち、(1)p(i,j)は空間配置(i,j)がエッジである画素であり、及び、(2)p(i,j)はエッジの中央に位置し、または、p(i,j)はエッジの中央に最も近い画素である。更に、項gedge(i,j)は次式により計算することが可能である。
【0057】
【数4】
ここで、cの値は実験的に決定される。
【0058】
エッジに関連する項が符号化ゲイン計算において用いられる場合、エッジの検出は、ブロッキングアーチファクトのブロック境界、及び低ビットレートで符号化される画像シーケンスで生じるリンギングの誤ったエッジを除外するべきである。
【0059】
所定の画素に対する符号化ゲインにおける急激なフレームからフレームへの変化は一時的に一貫性のないシャープネスエンハンスメントをもたらし、これは好ましくない。そのような変化はまた、一時的に強度を強め、モスキットノイズのようなアーチファクトの弊害をもたらす。
【0060】
この影響を改善するために、一時的なフィルタリングが前のフレームのゲインを用いて符号化ゲインに適用される。一時的フィルタリングは単純な無限インパルス応答(IIR:Infinite Impulse Response)フィルタまたは動き補償フィルタとすることが可能である。動き補償を用いない1つの可能なIIRフィルタは時式により与えられる。
【0061】
Gaincoding(i,j)=k*gaincoding(i,j,t)+(1−k)*gaincoding(i,j,t−1) (8)
ここで、tは現在のフレームを表し、kはIIRフィルタ係数である。
【0062】
UMEは式(2)の符号化の複雑さに基づいて計算することが可能である。著しい計算における複雑さ及びメモリに対する要求を低減するために、ゲインマップをフィルタリングすることに代えて、マクロブロック(MB)またはブロックベースの複雑さマップを無限インパルス応答(IIR)フィルタを用いて一時的にフィルタリングする。このプロセスは次式により表される。
【0063】
complMB/block(r,s,t)=k*complMB/block(r,s,t)+scal*(1−k)*complMB/block(r,s,t−1)(9)
ここで、(r,s)はマクロブロック(MB)またはブロックの空間座標であり、tは現在のピクチャを表し、kは無限インパルス応答(IIR)フィルタ係数であり、“scal”は異なるピクチャタイプ間の複雑さを考慮に入れるスケーリング項である。スケーリング項“scal”は、フレーム“t”及び“t−1”のMBまたはブロックの複雑さの平均の比として計算される。具体的には、
【0064】
【数5】
空間フィルタの出力は、エンハンスされた輝度出力信号270を生成するためにオリジナルの輝度入力信号210に加算器265により加えられる。
【0065】
本発明はまた、高精細度(HD)を有し長時間(LP)モードを可能にするビデオ記憶アプリケーションに存在するような、高精細度(HD)及び標準精細度(SD)シーケンスとすることが可能である。そのようなビデオシーケンスの大部分は、放送用MPEG−2ビットレートから低い記憶ビットレートにトランスコーディングされる。このアプリケーションの長時間(LP)モードに対して、トランスコーディングの間にフォーマットの変化が生じ得る。標準精細度(SD)または高精細度(HD)のビデオシーケンスは、エンコード化され、復号化され、次いでシャープネスエンハンスメントアルゴリズムを用いて処理され、本発明に従って、符号化情報を用いないアルゴリズムに比較して先験的なエンコード化またはトランスコード化されたビデオシーケンスのためのより優れたビデオ品位を提供する。
【0066】
図5は、本発明の方法の好適な実施形態を示すフロー図である。1つのフレーム(フレーム“t”)を処理するための符号化ゲインを計算するための方法は、一般に、符号500により示される。先ず、符号化情報が得られる(段階505)。次いで、フレーム“t”の複雑さマップが得られる(段階510)。次に、スキップされたまたは符号化されないマクロブロック(MB)(もしあれば)のための複雑さの評価が決定される(段階515)。
【0067】
段階520は、式(4)のフィルタカーネルを用いてローパスフィルタにより複雑さのマップをフィルタリングする段階である。段階525は、式(9)、式(10)及び前のフレーム(フレーム“t−1”)の複雑さのマップを用いて複雑さのマップを一時的にフィルタリングする段階である。段階550は、前のフレーム(フレーム“t−1”)の複雑さマップを得る段階である。フレーム“t−1”の複雑さマップ情報は段階525で用いられる。段階530は、段階525の一時的フィルタリングの後に信号の双線形補間を実行する段階である。画素あたりの符号化ゲインが次いで計算される(段階535)。
【0068】
フレーム“t”からの情報が得られ(段階560)、フレーム“t”の中のピクチャのエッジを検出するために用いられる(段階555)。
【0069】
段階535において画素当たりの符号化ゲインが計算された後、次いで、有用メトリック(UME)は適応ピーキングプロセスで用いられる(段階540)。段階540のUME適応ピーキングプロセスはまた段階560のフレーム“t”から得られた情報を用いる。段階540のUME適応ピーキングプロセスの結果は強調されたフレーム“t”として表示される(段階545)。
【0070】
上述の方法は次のようにまとめることができる。その方法は、マクロブロック(MB)またはブロックレベルの複雑さのマップは時間“t”について利用可能である。スキップされたまたは符号化されないマクロブロック(MB)またはブロックの複雑さの評価を次いで実行する。複雑さのマップのブロッキング構造を減少させるために、式(4)のフィルタカーネルを用いるローパスフィルタリングを適用する。次いで、式(9)、式(10)及び前のフレームの複雑さのマップを用いる複雑さのマップの一時的なフィルタリングを実行する。マクロブロック(MB)またはブロックの複雑さのマップからの双線形補間により、各画素の複雑さの値を評価する。各画素についての複雑さの値及びエッジ検出プロセルの結果を用いて、各画素について符号化ゲインを計算する。強調されたフレーム“t”を生成するために、UMEを用いる適応ピーキングをフレームの各画素に適用する。
【0071】
アルゴリズムをインターレースビデオシーケンスに適用する場合、幾つかの計算をインターレースビデオの特性に適応させることが可能である。複雑さの計算は、インターレースビデオシーケンスに対してMPEGストリームはフィールドまたはフレームの構造化ピクチャの何れかを有することが可能であるという現実により、変化されるであろう。フィールド構造化ピクチャにおいて、ブロックは1つのフィールドのみからのデータを含み、各ブロックはフィールドDCT符号化される。したがって、プログレッシブビデオについての複雑さの計算は、それがフィールド構造化ピクチャについてのものであるように、適用されることが可能である。
【0072】
しかしながら、フレーム構造化ピクチャにおいては、ブロックをフレームDCT符号化またはフィールドDCT符号化することが可能である。それ故、8×8ブロックについて “フィールドの複雑さ”のみを評価することが可能である。ブロックの“フィールドの複雑さ”を計算するために1つのマクロブロック(MB)からの2つのブロックを用いることが可能である。これらの考慮から、インターレースビデオにおいて、マクロブロック(MB)に比べてより単純な場合は、ブロックについての複雑さの計算を用いることが理解される。
【0073】
本発明は、デジタルテレビのセットについて図に例示することにより所定の実施形態に関して詳細に説明したが、本発明は記載した実施形態及びその改良に限定されるものではない。当業者は、広い形態に及ぶ本発明の概念及び適用範囲から逸脱することなく、本発明についての種々の変更、置き換え、修正、変形及び改作が可能であることは明らかである。
【図面の簡単な説明】
【図1】
本発明の装置及び方法から構成される例としてのデジタルテレビセットのブロック図である。
【図2】
本発明の有用メトリックジェネレータ及び符号化ゲインコントロールブロックから構成される好適な実施形態を示すブロック図である。
【図3】
本発明の有用メトリック対量子化パラメータの関係を表す関数について示すグラフである。
【図4】
本発明の有用メトリックジェネレータ及び符号化ゲインコントロールブロックから構成されるもう1つの好適な実施形態を示すブロック図である。
【図5】
本発明の方法及び操作の好適な実施形態を示すフローチャートである。
Claims (10)
- デジタルビデオストリームにおいて予め符号化されたデジタルビデオ信号の画質をエンハンスするための装置であって:
符号化アーチファクトをエンハンスすることなく前記予め符号化されたデジタルビデオ信号に適用されることが可能であるビデオエンハンスメント量を決定するために有用メトリックを生成することが可能である前記デジタルビデオシステムにおける有用メトリックジェネレータ;
から構成される装置。 - 請求項1に記載の装置であって、前記デジタルビデオシステムは、前記予め符号化されたデジタルビデオ信号にシャープネスエンハンスメントアルゴリズムを適用することが可能である少なくとも1つのシャープネスエンハンスメントユニットから構成され、そして前記装置は前記少なくとも1つのシャープネスエンハンスメントユニットにより前記予め符号化されたデジタルビデオ信号に適用される許容シャープネスエンハンスメント量を決定するために前記有用メトリックを用いることが可能である符号化ゲインコントロールブロックから更に構成される、装置。
- 請求項2に記載の装置であって、前記少なくとも1つのシャープネスエンハンスメントユニットは適応ピーキングユニットである、装置。
- 請求項3に記載の装置であって、前記有用メトリックは符号化アーチファクトなしに画素はどの程度エンハンスされることが可能であるかを画素毎に計算する、装置。
- 請求項4に記載の装置であって、画素の符号化ゲインは
gcoding(i,j)=UME(i,j)+gedge(i,j)
の式により決定され、ここで、i及びjは画素の座標であり、gcodingは画素の符号化ゲインであり、UMEは有用メトリックであり、そしてgedgeは画素から導かれるエッジ関連の情報に基づいている。 - 請求項5に記載の装置であって、gedge(i,j)の値は、(1)空間位置(i,j)のエッジ画素p(i,j)については実験的に決定される値c、(2)空間位置(i−1,j)の画素p(i−1,j)及び空間位置(i+1,j)の画素p(i+1,j)についてはcの半分の値、(3)空間位置(i−2,j)の画素p(i−2,j)及び空間位置(i+2,j)の画素p(i+2,j)についてはcの四分の一の値、及び(4)他のすべての画素については0に等しくgedge(i,j)の値を設定することにより計算される、装置。
- 請求項1に記載の装置であって、前記有用メトリックジェネレータは前記有用メトリックを生成するために符号化情報を利用する、装置。
- 請求項1に記載の装置であって、前記有用メトリックジェネレータは前記有用メトリックを生成するために符号化情報及びシーン内容に関連する情報を利用する、装置。
- デジタルビデオシステムであって:
前記デジタルビデオシステムにおいて予め符号化されたデジタルビデオ信号の画質をエンハンスするための装置であって、前記装置は符号化アーチファクトをエンハンスすることなく前記前の符号化デジタルビデオ信号に適用されることが可能であるビデオ画像エンハンスメント量を決定するために有用メトリックを生成することが可能である前記デジタルビデオシステムの有用メトリックジェネレータから構成される装置;
から構成される、デジタルビデオシステム。 - デジタルビデオシステムにおいて予め符号化されたデジタルビデオ信号の画質をエンハンスするための方法であって:
前記デジタルビデオシステムの有用メトリックジェネレータに有用メトリックを生成する段階;及び
アーチファクトをエンハンスすることなく前記予め符号化されたデジタルビデオ信号に適用することが可能であるビデオ画像エンハンスメント量を決定するために前記有用メトリックを利用する段階;
から構成される方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US26084301P | 2001-01-10 | 2001-01-10 | |
US09/976,329 US7161633B2 (en) | 2001-01-10 | 2001-10-12 | Apparatus and method for providing a usefulness metric based on coding information for video enhancement |
PCT/IB2001/002481 WO2002056582A1 (en) | 2001-01-10 | 2001-12-13 | Apparatus and method for providing a usefulness metric based on coding information for video enhancement |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004518337A true JP2004518337A (ja) | 2004-06-17 |
Family
ID=26948212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002557115A Withdrawn JP2004518337A (ja) | 2001-01-10 | 2001-12-13 | ビデオエンハンスメントのために符号化情報に基づく有用メトリックを提供するための装置及び方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7161633B2 (ja) |
EP (1) | EP1352515B1 (ja) |
JP (1) | JP2004518337A (ja) |
KR (1) | KR20030005219A (ja) |
CN (1) | CN1248487C (ja) |
AT (1) | ATE336859T1 (ja) |
DE (1) | DE60122382T2 (ja) |
WO (1) | WO2002056582A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040156559A1 (en) * | 2002-11-25 | 2004-08-12 | Sarnoff Corporation | Method and apparatus for measuring quality of compressed video sequences without references |
AU2003282296A1 (en) * | 2002-12-10 | 2004-06-30 | Koninklijke Philips Electronics N.V. | Joint resolution or sharpness enhancement and artifact reduction for coded digital video |
US20070139564A1 (en) * | 2004-02-27 | 2007-06-21 | Koninklijke Philips Electronics N.V. | System and method for global indication of mpeg impairments in compressed digital video |
US20070159556A1 (en) * | 2004-03-25 | 2007-07-12 | Koninklijke Philips Electronics N.V. | Luminance transient improvemet using video encoding metric for digital video processing |
JP2007531450A (ja) * | 2004-03-29 | 2007-11-01 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | デジタルビデオ信号処理方法、デジタルビデオ信号処理システム |
US20050273657A1 (en) * | 2004-04-01 | 2005-12-08 | Hiroshi Ichiki | Information processing apparatus and method, and recording medium and program for controlling the same |
KR20070029176A (ko) * | 2004-05-25 | 2007-03-13 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 비디오 신호의 선명도를 향상하는 방법 및 시스템 |
CN1293745C (zh) * | 2004-09-13 | 2007-01-03 | 西安交通大学 | 数字化电视后处理技术的视频图像自适应细节增强方法 |
US7653257B2 (en) * | 2005-07-19 | 2010-01-26 | Intel Corporation | Enhancing video sequence sharpness by adaptive peaking |
TWI401943B (zh) * | 2007-05-14 | 2013-07-11 | Novatek Microelectronics Corp | 用於一影像處理系統之影像處理方法及其相關影像處理裝置 |
EP2301251A4 (en) * | 2008-06-25 | 2012-12-26 | Ericsson Telefon Ab L M | LINES EVALUATION-RATE CONTROL |
US9113164B1 (en) * | 2012-05-15 | 2015-08-18 | Google Inc. | Constant bit rate control using implicit quantization values |
TW201438458A (zh) * | 2013-03-22 | 2014-10-01 | Novatek Microelectronics Corp | 影像處理電路及其環狀假影消除方法 |
US11019349B2 (en) * | 2017-01-20 | 2021-05-25 | Snap Inc. | Content-based client side video transcoding |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5031042A (en) * | 1990-07-09 | 1991-07-09 | Zenith Electronics Corporation | Noise coring and peaking circuit |
US5161015A (en) * | 1990-12-31 | 1992-11-03 | Zenith Electronics Corporation | System for peaking a video signal with a control signal representative of the perceptual nature of blocks of video pixels |
US5491514A (en) * | 1993-01-28 | 1996-02-13 | Matsushita Electric Industrial Co., Ltd. | Coding apparatus, decoding apparatus, coding-decoding apparatus for video signals, and optical disks conforming thereto |
PT932398E (pt) * | 1996-06-28 | 2006-09-29 | Ortho Mcneil Pharm Inc | Utilizacao do topiramento ou dos seus derivados para a producao de um medicamento para o tratamento de disturbios bipolares maniaco- depressivos |
DE19626985C1 (de) * | 1996-07-04 | 1998-01-02 | Siemens Ag | Verfahren und Anordnung zur Reduktion von Codierungsartefakten von blockbasierten Bildcodierungsverfahren und objektbasierten Bildcodierungsverfahren |
US6037986A (en) * | 1996-07-16 | 2000-03-14 | Divicom Inc. | Video preprocessing method and apparatus with selective filtering based on motion detection |
US6038256A (en) * | 1996-12-31 | 2000-03-14 | C-Cube Microsystems Inc. | Statistical multiplexed video encoding using pre-encoding a priori statistics and a priori and a posteriori statistics |
US6137904A (en) * | 1997-04-04 | 2000-10-24 | Sarnoff Corporation | Method and apparatus for assessing the visibility of differences between two signal sequences |
JP4186242B2 (ja) * | 1997-12-26 | 2008-11-26 | ソニー株式会社 | 画像信号処理装置及び画像信号処理方法 |
US6285801B1 (en) * | 1998-05-29 | 2001-09-04 | Stmicroelectronics, Inc. | Non-linear adaptive image filter for filtering noise such as blocking artifacts |
US6466624B1 (en) * | 1998-10-28 | 2002-10-15 | Pixonics, Llc | Video decoder with bit stream based enhancements |
JP2002535896A (ja) * | 1999-01-15 | 2002-10-22 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 鮮明度を向上させる方法および装置 |
CN1197383C (zh) * | 1999-09-14 | 2005-04-13 | 皇家菲利浦电子有限公司 | 用于识别数字视频图像中像块伪痕的方法和装置 |
WO2001045389A1 (en) | 1999-12-17 | 2001-06-21 | Koninklijke Philips Electronics N.V. | Signal peaking |
US6810082B1 (en) * | 1999-12-17 | 2004-10-26 | Koninklijke Philips Electronics N.V. | Chroma based adaptive signal peaking |
US6636645B1 (en) * | 2000-06-29 | 2003-10-21 | Eastman Kodak Company | Image processing method for reducing noise and blocking artifact in a digital image |
US6950561B2 (en) * | 2001-01-10 | 2005-09-27 | Koninklijke Philips Electronics N.V. | Method and system for sharpness enhancement for coded video |
-
2001
- 2001-10-12 US US09/976,329 patent/US7161633B2/en not_active Expired - Fee Related
- 2001-12-13 CN CNB018062849A patent/CN1248487C/zh not_active Expired - Fee Related
- 2001-12-13 DE DE60122382T patent/DE60122382T2/de not_active Expired - Lifetime
- 2001-12-13 JP JP2002557115A patent/JP2004518337A/ja not_active Withdrawn
- 2001-12-13 WO PCT/IB2001/002481 patent/WO2002056582A1/en active IP Right Grant
- 2001-12-13 AT AT01273139T patent/ATE336859T1/de not_active IP Right Cessation
- 2001-12-13 KR KR1020027011859A patent/KR20030005219A/ko not_active Application Discontinuation
- 2001-12-13 EP EP01273139A patent/EP1352515B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US7161633B2 (en) | 2007-01-09 |
CN1416640A (zh) | 2003-05-07 |
DE60122382T2 (de) | 2007-08-02 |
CN1248487C (zh) | 2006-03-29 |
KR20030005219A (ko) | 2003-01-17 |
US20020131512A1 (en) | 2002-09-19 |
EP1352515B1 (en) | 2006-08-16 |
DE60122382D1 (de) | 2006-09-28 |
ATE336859T1 (de) | 2006-09-15 |
WO2002056582A1 (en) | 2002-07-18 |
EP1352515A1 (en) | 2003-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6862372B2 (en) | System for and method of sharpness enhancement using coding information and local spatial features | |
JP4334768B2 (ja) | 圧縮映像のブリージングアーチファクトを低減する方法および装置 | |
US7031388B2 (en) | System for and method of sharpness enhancement for coded digital video | |
US20060110062A1 (en) | Edge adaptive filtering system for reducing artifacts and method | |
US6873657B2 (en) | Method of and system for improving temporal consistency in sharpness enhancement for a video signal | |
US6950561B2 (en) | Method and system for sharpness enhancement for coded video | |
US20060093232A1 (en) | Unified metric for digital video processing (umdvp) | |
Yuen | Coding artifacts and visual distortions | |
JP2005159419A (ja) | 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体 | |
EP1352515B1 (en) | Apparatus and method for providing a usefulness metric based on coding information for video enhancement | |
JP2007525902A (ja) | 圧縮デジタルビデオにおけるmpeg損傷のグローバル指示に関するシステム及び方法 | |
JP2004512784A (ja) | エンベッドフィルタによるトランスコーディング方法及びトランスコーディング装置 | |
US8848793B2 (en) | Method and system for video compression with integrated picture rate up-conversion | |
JP4185413B2 (ja) | フリッカ低減量子化器、フリッカ低減量子化方法、及びそのプログラム | |
Boroczyky et al. | Sharpness enhancement for MPEG-2 encoded/transcoded video sources | |
JP3478414B2 (ja) | 画像情報圧縮装置 | |
JP2008301366A (ja) | 画像復号化装置、及び画像復号化方法 | |
JPH09163374A (ja) | 雑音低減装置 | |
KR20050079690A (ko) | 필터링 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041209 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20070510 |