JP4908522B2 - 誤り隠蔽に関連する歪み値に基づいてエンコード方法を決定する方法および装置 - Google Patents

誤り隠蔽に関連する歪み値に基づいてエンコード方法を決定する方法および装置 Download PDF

Info

Publication number
JP4908522B2
JP4908522B2 JP2008551554A JP2008551554A JP4908522B2 JP 4908522 B2 JP4908522 B2 JP 4908522B2 JP 2008551554 A JP2008551554 A JP 2008551554A JP 2008551554 A JP2008551554 A JP 2008551554A JP 4908522 B2 JP4908522 B2 JP 4908522B2
Authority
JP
Japan
Prior art keywords
distortion
frame
portions
frame including
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008551554A
Other languages
English (en)
Other versions
JP2009524364A (ja
Inventor
サブラマニア、シタラマン・ガナパシー
ウォーカー、ゴードン・ケント
ラビーンドラン、ビジャヤラクシュミ・アール.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2009524364A publication Critical patent/JP2009524364A/ja
Application granted granted Critical
Publication of JP4908522B2 publication Critical patent/JP4908522B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • H04N19/166Feedback from the receiver or from the transmission channel concerning the amount of transmission errors, e.g. bit error rate [BER]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

本願は、マルチメディア信号処理に関し、更に詳しくは、ビデオ・エンコードに関する。
例えば、ビデオ・エンコーダのようなマルチメディア処理システムは、例えば、MPEG−1規格、MPEG−2規格、およびMPEG−4規格、ITU−T H.263規格およびITU−T H.264規格、およびその類似規格であるISO/IEC MPEG−4 パート10、すなわちアドバンスト・ビデオ・コーディング(AVC)のような国際規格に基づくエンコード方法を用いてマルチメディア・データをエンコードする。そのようなエンコード方法は、一般に、送信および/または記憶のために、マルチメディア・データを圧縮することに導かれる。圧縮は、広く言えば、データから冗長を取り除く処理である。
ビデオ信号は、フレーム(ピクチャ全体)またはフィールドを含むピクチャ・シーケンスの観点から記述されることができる(例えば、インタレースされたビデオ・ストリームは、ピクチャの奇数ラインまたは偶数ラインを交互するフィールドを備える)。本明細書で使用されるように、用語「フレーム」は、ピクチャあるいはフィールドを指す。ビデオ・エンコード方法は、各フレームを圧縮するために、損失がないアルゴリズムあるいは損失のあるアルゴリズムを使用することにより、ビデオ信号を圧縮する。(本明細書でイントラ・コーディングと称される)イントラ・フレーム・コーディングは、そのフレームだけを使用して、フレームをエンコードすることを指す。(本明細書でインター・コーディングと称される)インター・フレーム・コーディングは、その他の「基準」フレームに基づいてフレームをエンコードすることを指す。例えば、ビデオ信号はしばしば、フレームの時間シーケンス内で互いに近接しているフレームが、互いに一致するか、あるいは少なくとも部分的にしか一致しない部分を少なくとも有する時間的冗長を示す。
ビデオ・エンコーダのようなマルチメディア・プロセッサは、例えば16x16ピクセルのブロックまたは「マクロブロック」へフレームを区分することにより、フレームをエンコードすることができる。エンコーダは、更に、各マクロブロックをサブブロックへ区分することができる。各サブブロックは更に、追加のサブブロックを含みうる。例えば、マクロブロックのサブブロックは、16x8のサブブロック、および8x16のサブブロックを含みうる。8x16サブブロックのサブブロックは、8x8サブブロック等を含みうる。本明細書で使用されるように、用語「ブロック」は、マクロブロックかサブブロックかの何れかを指す。
エンコーダは、インター・コーディング動作補償ベースのアルゴリズムを使用して、この時間的冗長を利用する。動作補償アルゴリズムは、ブロックに少なくとも部分的に一致する基準フレームの部分を識別する。ブロックは、基準フレームの一致部分に対して、フレーム内でシフトされうる。このシフトは、動作ベクトルによって特徴付けられる。基準フレームの部分一致する部分と、ブロックとの間の差分は、残差の点から特徴付けられうる。エンコーダは、フレームを、フレームの特定の区分のための残差と動作ベクトルとのうちの1または複数を備えたデータとしてエンコードすることができる。フレームをエンコードするためのブロックの具体的な区分は、例えば、エンコードに起因するコンテンツの歪みとエンコード・サイズとを比較検討する費用関数をほぼ最小化することにより選択されうる。
インター・コーディングは、イントラ・コーディングよりもより高い圧縮効率を可能にする。しかしながら、基準データ(例えば、基準フレームまたは基準フィールド)が、チャネル誤り等により失われる場合、インター・コーディングは問題を引き起こす場合がある。これらの場合、インター・コードされたデータのデコードは可能ではないかもしれないし、あるいは、望まれない誤りおよび望まれない誤り伝播となるかもしれない。デコーダは、近隣ブロックから、または、他のフレーム内のデータから導かれたデータを用いて、誤りのあるデータの隠蔽またはカバーアップを試みる隠蔽スキームを利用することができる。隠蔽アルゴリズムの改善によって、誤りのあるビデオ・データの隠蔽部分の品質が改善される。しかしながら、空間−時間情報に対する隠蔽アルゴリズムの高い依存度によって、隠蔽された画像が示す品質がどれだけ高いかには限界がある。隠蔽されたデータは、高品質ではないかもしれないし、視覚内容が低下するかもしれない。更に、信号のデコードが不可能になり、再同期が必要になるかもしれない。誤り伝播は制限することができる。また、再同期(あるいは初期獲得)は、ビデオをリフレッシュするエンコード方法によって可能になりうる。リフレッシュされたビデオ信号は、他のフレームを参照しなくても、または、他のフレームを知らなくてもデコードされる。
独立してデコードすることが可能なイントラ・コード化フレームは、ビデオ信号のリフレッシュを可能にする最も一般的な形式のフレームである。MPEG−x規格およびH.26x規格は、(Iフレームとも呼ばれる)イントラ・コード化フレーム、時間的に予測されるPフレーム、またはニ方向的に予測されるBフレームを備え、グループ・オブ・ピクチャ(GOP)として知られているものを用い、GOP内のIフレームおよび/またはその他のPフレームおよび/またはBフレームを参照する。より長いGOPは、増加された圧縮に望ましく、より短いGOPは、より迅速な獲得および再同期を可能にする。Iフレームの数を増加させることは、ビデオ信号をより頻繁にリフレッシュすることになり、もって、誤り伝播を更に制限し、より迅速な獲得および再同期を提供するが、代わりに圧縮率が低くなる。必要なものは、圧縮効率を維持しながら、デコーダにおけるビデオ・ストリームの誤り伝播を制限するビデオ・データ・エンコード方法である。
(35U.S.C.§119の下の優先権主張)
本特許出願は、本願の譲受人に譲渡され、全ての目的のために参照によって本願に完全に組み込まれている2006年1月20日出願の"Method and Apparatus for Adaptive Intra Refresh Based on Prediction Hierarchy for Wireless Video Communications"と題された米国仮出願60/760,678号の優先権を主張する。
発明の概要
本願のシステム、方法、およびデバイスはそれぞれ、幾つかの局面を持っており、何れも単一のみでは、望ましい特性は得られない。特許請求の範囲によって表現されるような本願のスコープを限定することなく、より顕著な特徴が手短に説明されよう。この説明を考慮した後、特に、「詳細な説明」と題されたセクションを読んだ後、本願の例となる機能が、例えば、改善されたデコード・ビデオ品質、改善された誤り復元、および/または改善された効率を含む幾つかの改善点をどのようにして提供するかが理解されるだろう。
マルチメディア・データをエンコードする方法が提供される。この方法は、マルチメディア・データの1または複数の部分が誤って受け取られたのであれば、1または複数の部分を隠蔽することに関連する1または複数の隠蔽方法に少なくとも部分的に基づいて1または複数の部分の1または複数の歪み値を推定することと、推定された1または複数の歪み値に少なくとも部分的に基づいて第1の部分のための少なくとも1つのエンコード方法を決定することとを含む。
マルチメディア・データ・プロセッサが提供される。このプロセッサは、マルチメディア・データの1または複数の部分が誤って受け取られたのであれば、1または複数の部分を隠蔽することに関連する1または複数の隠蔽方法に少なくとも部分的に基づいて1または複数の部分の1または複数の歪み値を推定し、推定された1または複数の歪み値に少なくとも部分的に基づいて1または複数の部分のための少なくとも1つのエンコード方法を決定するように構成される。
マルチメディア・データをエンコードする装置が提供される。この装置は、マルチメディア・データの1または複数の部分が誤って受け取られたのであれば、1または複数の部分を隠蔽することに関連する1または複数の隠蔽方法に少なくとも部分的に基づいて1または複数の部分の1または複数の歪み値を推定する推定器と、推定された歪み値に少なくとも部分的に基づいて1または複数の部分のための少なくとも1つのエンコード方法を決定する決定部とを含む。
実行されると、機械に対して、マルチメディア・データをエンコードさせる命令を備える機械読取可能媒体が提供される。これら命令は、機械に対して、マルチメディア・データの1または複数の部分が誤って受け取られたのであれば、1または複数の部分を隠蔽することに関連する1または複数の隠蔽方法に少なくとも部分的に基づいて1または複数の部分の1または複数の歪み値を推定させ、推定された歪み値に少なくとも部分的に基づいて第1の部分のための少なくとも1つのエンコード方法を決定させる。
詳細な説明
以下の詳細説明は、本願のある例となる実施形態に関する。しかしながら、本願は、特許請求の範囲で定義されカバーされるような多くの異なる方法で具体化することができる。本記載では、全体を通じて同一部分が同一符号を用いて明示される図面が参照される。
ビデオ信号は、一連のピクチャ、フレーム、フィールド、あるいはスライスの点から特徴付けられうる。本明細書で使用されるように、用語「フレーム」は、プログレッシブ・ビデオ信号のフレーム、インタレースされたビデオ信号のフィールド、あるいはこれらのうち何れか一方のスライスを含む広義な用語である。
実施形態は、マルチメディア送信システムにおけるエンコーダにおける処理を改善するシステムおよび方法を含む。マルチメディア・データは、動作ビデオ、オーディオ、静止画像、あるいはその他任意のタイプの適切なオーディオ−ビジュアル・データのうちの1または複数を含むことができる。実施形態は、ビデオ・データをエンコードする装置および方法を含む。例えば、1つの局面は、誤り伝播の影響を制限し、デコード中の誤り隠蔽の性能を改善するビデオ・データ・エンコード方法を含む。特に、マルチメディア・データの部分が誤って受け取られたのであれば、その部分を隠蔽するために使用される1または複数の隠蔽方法に少なくとも部分的に基づいてその部分の歪み値を推定し、推定された歪み値に基づいてその部分のためのエンコード方法を決定することによって、デコードされたビデオ品質、誤り復元能力、および/またはデコード効率が改善されることが明らかになった。
図1は、1つの局面に従ったマルチメディア通信システム100を例示するブロック図である。システム100は、ネットワーク140を経由してデコーダ・デバイス150と通信するエンコーダ・デバイス110を含んでいる。一例において、エンコーダ・デバイスは、外部ソース102からマルチメディア信号を受け取り、その信号を、ネットワーク140上で送信するためにエンコードする。
この例において、エンコーダ・デバイス110は、メモリ114およびトランシーバ116に接続されたプロセッサ112を含む。プロセッサ112は、汎用プロセッサおよび/またはデジタル信号プロセッサのうちの1または複数を含みうる。メモリ114は、ソリッド・ステートおよび/またはディスク・ベースの記憶装置のうちの1または複数を含みうる。プロセッサ112は、マルチメディア・データソースからのデータをエンコードし、ネットワーク140を介した通信のために、それをトランシーバ116へ供給する。
この例において、デコーダ・デバイス150は、メモリ154およびトランシーバ156に接続されたプロセッサ152を含む。プロセッサ152は、汎用プロセッサおよび/またはデジタル信号プロセッサのうちの1または複数を含みうる。メモリ154は、ソリッド・ステートおよび/またはディスク・ベースの記憶装置のうちの1または複数を含みうる。トランシーバ156は、ネットワーク140を介してマルチメディア・データを受信し、それを、デコードのためにプロセッサ152へ供給するように構成される。一例において、トランシーバ156は、無線トランシーバを含んでいる。ネットワーク140は、イーサネット(登録商標)、電話(例えばPOTS)、ケーブル、送電線、および光ファイバ・システムのうちの1または複数、および/または、符号分割多元接続(CDMAまたはCDMA2000)通信システム、周波数分割多元接続(FDMA)システム、直交周波数分割多元(OFDM)接続システム、例えばGSM/GPRS(汎用パケット無線システム)/EDGE(エンハンスト・データGSM環境)のような時分割多元接続(TDMA)システム、TETRA(Terrestrial Trunked Radio)モバイル電話システム、広帯域符号分割多元接続(WCDMA)システム、高データ・レート(1xEV−DOあるいは1xEV−DO ゴールド・マルチキャスト)システム、IEEE 802.11システム、MediaFLOシステム、DMBシステム、あるいはDVB−Hシステムのうちの1または複数を備える無線システムを含む有線通信システムまたは無線通信システムのうちの1または複数を備えうる。
図2は、例えば図1に例示するシステム100のようなシステムにおいて使用されうるエンコーダ・デバイス110の実施形態を例示するブロック図である。この実施形態では、エンコーダ110は、歪み値推定器202、エンコード方法決定部204、およびマルチメディア・エンコーダ206を含む。歪み値推定器202は、エンコードされているマルチメディア・データの部分に対する歪み値を推定する。この歪み値は、現在の部分が予測されるビデオの他の部分からの誤り伝播と、他の部分が誤って受け取られる可能性とに部分的に基づく。この歪み値はまた、もしもビデオ・データの一部が誤って受け取られたのであれば、その部分を隠蔽しながら、デコーダにおいて導かれた誤りによる歪み成分をも含む。歪み値推定器は、多くのエンコード方法を考慮し、これらエンコード方法の各々についての歪み値を計算することができる。
エンコード方法決定部204は、推定された歪み値に基づいて、ビデオ・データの一部をエンコードするために使用されるエンコード方法を決定する。エンコード方法決定部204および歪み値推定部202は、多くのエンコード方法(例えば、多くのインター・コーディング方法)のための多くの歪み値を計算して、最小歪みとなるエンコード方法を採用するために、ともに動作することができる。エンコード方法決定部は、歪み値をしきい値と比較し、この比較に基づいて、他のエンコード方法が必要とされていることを判定する。他のエンコード方法は、ビデオ・ストリームをリフレッシュすることに関連する、例えばイントラ・コーディングのようなエンコード方法でありうる。他のエンコード方法はまた、歪み値推定器202によって推定されるように、低い歪み値となる別の形式のインター・コーディングでありうる。エンコード方法決定部はまた、許容できる歪みを与え、計算上の複雑さレベルを超えないエンコード方法を決定する際に、歪み値とともに計算上の複雑さをも考慮する。
マルチメディア・エンコーダ206は、歪み値に基づいて決定されたエンコード方法を実行する。マルチメディア・エンコーダ206によって実行されるエンコード方法は、インター・コーディングを含んでいる。ここでは、ビデオの一部が、他の時間フレームに位置するビデオ・データの他の部分を参照して、(例えば、動作補償予測を用いて)時間的に予測される。他のエンコード方法は、イントラ・コーディングを含む。ここでは、ビデオの一部が、他の時間的に位置するビデオ・データを参照することなく、独立してデコードされるようにデコードされる。幾つかの実施形態では、同じ時間フレーム内に位置する他のビデオ・データにおける冗長性を利用するために、イントラ・コーディングは、空間的な予測を用いることができる。
幾つかの実施形態では、図2のエンコーダ110の要素のうちの1または複数は、配置され直したり、組み合わせることができる。これら要素は、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、あるいはこれらの任意の組み合わせによって実現されうる。エンコーダ110の要素によって実行される動作の詳細は、後述する図4で例示される方法と関連付けられて説明される。
図3は、例えば図1に例示されたシステム100のようなシステムで使用されるデコーダ・デバイス150の実施形態を例示するブロック図である。この実施形態では、デコーダ・デバイス150が、マルチメディア・デコーダ要素302および誤り隠蔽要素304を含んでいる。マルチメディア・デコーダ302は、例えば、図2のエンコーダ・デバイス110を用いてエンコードされたようなマルチメディア・ビットストリームをデコードする。マルチメディア・デコーダは、データをエンコードするために使用されるエンコード操作に対応する逆の操作を行なう。エンコードされたデータは、インター・コードされたデータ(例えば、時間的に予測されたデータ)および/またはイントラ・コードされたデータでありうる。
誤り隠蔽要素304は、誤って受け取られたビデオの部分を隠蔽またはカバーアップするために使用されるか、そうでなければ、(例えば、同期性損失により)デコードすることができない様々な形式の誤り隠蔽を実行する。この隠蔽方法は、空間的な誤り隠蔽、時間的な誤り隠蔽、およびその他の方法を含みうる。使用されるこの隠蔽方法は、図2のエンコーダ・デバイス110の歪み値推定器202において歪み値を推定する際にモデル化された誤り隠蔽方法と同一または類似している。この局面は、同一または類似した隠蔽方法を必要としない一方、エンコーダ・デバイスにおいてモデル化されたようなデコーダ・デバイス150におけるものと同一または類似した隠蔽方法を用いることによって、デコードされたビデオ品質を改善することができる。誤り隠蔽を実行することに加えて、誤り隠蔽要素304は、誤り復元機能を実行することができる。誤り復元は、使用可能な(例えば、誤りの無い)部分の解析を試みた場合、誤っていると判定されたデータのセクションについて実行されうる。これら解析された部分もまた、誤り隠蔽要素304による誤り隠蔽に使用されうる。
幾つかの実施形態では、図3のデコーダ150の要素の1または複数は、配置され直したり、組み合わせることができる。これら要素は、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、あるいはそれらの任意の組合せによって実現されうる。デコーダ150の要素によって実行される動作の詳細は、本説明のスコープ外である。
図4Aは、例えば図1に例示するようなシステムにおいてビデオ・ストリームの一部をエンコードする方法の例を図示するフローチャートである。この例において、この方法は、エンコードされているビデオの一部に対する歪み値を推定する。歪み値は、エンコードされた部分の、デコーダにおいて誤って受け取られた確率と、誤った部分を隠蔽するために使用される隠蔽方法によって引き起こされる誤りとに基づく。歪み値を、デコーダ隠蔽方法に基づかせることによって、エンコードされたビデオ・ビットストリームは、デコーダにおける誤り伝搬の効果に対してよりロバストになる。これは、デコードされたビデオ品質を改善することができる。この例において、この方法は、推定された歪み値に基づいて、エンコード方法を決定することもできる。このエンコード方法は、複数のエンコード方法から、歪み値を最小化するように決定される。このエンコード方法は、デコーダにおいて、ビデオの部分の復元力を改善することに基づいて決定されうる。このエンコード方法は、デコーダにおける誤り伝播を制限するようにビデオ部分をリフレッシュするように決定される。
図4Aに示すように、方法はブロック402で始まり、エンコード・デバイスが、マルチメディア・データの一部の歪み値を推定する。マルチメディア・データの一部は、ピクセル(例えば、明度および彩度、または赤、緑、および青等)、ピクセルのブロック、あるいは1または複数のピクセルの任意の形状およびサイズの領域でありうる。歪み値は、ビデオの一部が誤って受け取られた場合に、その部分を隠蔽するために使用されうる誤り隠蔽方法に関連する歪み成分に少なくとも部分的に基づきうる。歪み値は、多くの隠蔽方法からの成分を含みうる。例えば、1つの成分は、エンコードされた部分が誤って受け取られた場合にのみ使用される第1の隠蔽方法によって導かれた歪みを表わすことができる。言い換えれば、隠蔽された部分(予測データと称される)を予測するために、デコーダ・デバイスが使用することができるその他の全てのビデオ・データは、誤りなく受け取られると仮定される。歪み値の他の成分は、第2または第3の隠蔽方法によって導かれた歪みを含みうる。ここでは、1または複数の予測部分が誤って受け取られた場合、これら隠蔽方法がデコーダによって使用されうる。この隠蔽方法は、空間的隠蔽、時間的隠蔽、その他の形式の隠蔽を含みうる。時間的隠蔽を含む歪み値を推定する方法の詳細を、以下に説明する。図2のエンコーダ・デバイス110の歪み値推定器202は、ブロック402における動作を行うことができる。
幾つかの例において、歪み値は、データのフレーム内の各ブロックについて、ブロック402において計算される。ブロックは、マクロブロック(例えば、16x16ピクセル・マクロブロック)、あるいは任意のサイズのサブマクロブロックでありうる。フレーム内の各ブロックに対する歪み値は、歪みマップ内に格納されることができる。図5は、ブロック402において生成されうる歪みマップをグラフ式に図示する。歪みマップ500は、フレーム内の各ブロックについて1つある(dv1−dv16とラベルされた)多くの歪み値変数505を含んでいる。前のフレームの歪みマップ500は、新たなフレーム内の歪み値を計算するのに使用されうる。このようにして、累積歪みが、容易に計算されうる。何れかのブロックがリフレッシュされる、例えばイントラ・コード化されると決定された場合、そのブロックの歪み値がゼロに設定されるか、量子化またはその他幾つかの要因による歪み値に設定される。
ブロック404では、エンコーダ・デバイスが、推定された歪み値に基づいて、マルチメディア・データの一部のために使用されるエンコード方法を決定する。幾つかの例において、ブロック402において、多くのエンコード方法について、どのエンコード方法が使用されるべきかを選択するために使用されるレート歪み計算の一部として、歪み値が計算される。例えば、マルチメディア・データの一部のエンコードに使用されるために、最小の歪み値となるエンコード方法が決定される(ブロック404)。他の例において、歪み値は、第1のエンコード方法(インター・コード化またはイントラ・コード化の何れか)に基づいて計算され、歪み値は、例えばアダプティブ・イントラ・リフレッシュ(AIR)においてなされたようにイントラ・コード化されるべきブロックを決定するために使用される。例えば、マルチメディア・データの一部をエンコードするために、レート歪みベースの決定が、最適な動作ベクトルおよびモードを発見した後に、その部分に対応する歪み値が計算される。このようにして得られた歪み値がしきい値よりも大きい場合、例えば、4x4ピクセル・イントラ・コーディングまたは16x16ピクセル・イントラ・コーディングのようなイントラ・コーディング・モードのうちの1つを用いて、その部分をイントラ・コード化するように決定されうる。このように、マルチメディアの一部がリフレッシュされる。イントラ・コーディング・モードとは別に、幾つかの場合、歪み値に基づいて、あるインター・コーディング・モード(P8x8、P16x16、P16x8、P8x16等)も決定される。しかしながら、これらは、リフレッシュされたビデオにはならないかもしれない。方法400のブロックのうちの幾つかは、結合、省略、配列し直し、あるいはこれらの任意の組み合わせが可能であることが注目されるべきである。ブロック404においてエンコード方法を決定する幾つかの実施形態の詳細を、図4Bを参照して以下に示す。
ブロック402において、歪み値を推定するためのアルゴリズムの例の詳細について説明する。この例における歪み値は、例えば、前のフレームとそれに続くフレームのような2つの別のフレームからの部分を用いて、マルチメディアの誤りのある部分を隠蔽する時間的隠蔽方法に関連している。しかしながら、類似した方法を用いたその他の隠蔽方法も表される。
一例であるアルゴリズムは、ビデオの一方向に予測された(例えば、Pフレーム内の)部分の予測(すなわち、統計予測)歪み値の再帰的な歪み値を計算する。例えばイントラ・コードされた部分および二方向的に予測された部分のような他の部分もまた、類似のアルゴリズムによって表される。このアルゴリズムは、現在のMBが失われている推定確率(確率Pと定義される)と、隠蔽方法によって使用される予測変量が失われる確率(確率Qと定義される)とに部分的に基づく。仮定された確率PおよびQのうちの少なくとも1つが増加すると、このアルゴリズムは、圧縮効率をトレード・オフしながら、良好な誤り回復力/隠蔽をよりもたらす傾向にある。確率PおよびQのうちの少なくとも1つが減少すると、逆のことが起こる。
アルゴリズムは、マルチメディア・データの一部に対する予測された歪み値を計算する。このマルチメディア・データの一部は、任意の数のピクセルおよび任意の形状でありうる。その例は、16x16ピクセル・マクロブロック(MB)である部分に関して議論されるだろう。しかし、他の部分も同様に表わされうることが注目されるべきである。1つの実施形態では、アルゴリズムは、図5に関して上述したような歪みマップを形成するフレームの各MBに対して予測される歪み値を推定するために使用される。この例における予測される歪み値は、再帰的かつ動作適応性のある方式で計算される。この予測される歪みマップは、正確には、MSE測定値でもL1ノルム歪み測定値でもないが、これら測定値と合理的に良く相関すると予測される。
次の表記が、歪み値アルゴリズムの議論に使用される。
Figure 0004908522
=「t」番目のフレーム内の(i、j)番目のマクロブロックの累積歪み値。
P=現在のMBが失われている確率。
Q=関連する隠蔽方法によって使用される予測変量が失われている確率。
これら仮定の下、現在のMBは、(1−P)に等しい確率で、何の誤りもなく受け取られる。一方向予測では、現在のMBは、この例では前のフレームである別のフレームのMBサイズ部分に関してエンコードされる。動作ベクトルMVは、現在のMBおよびMBサイズの基準部分の相対位置またはロケーションを与える。この基準部分は、一般に、MBの境界と揃わないであろうが、4つのMBの4つの領域までオーバラップするだろう。図6は、動作補償予測方法を用いてビデオの一部を推定するために使用される予測領域をグラフィック的に例示している。動作ベクトル605は、a1、a2、a3、およびa4とラベルされた4領域部分から構成されたMBサイズの予測領域610を指している。この領域部分a1−a4は、4つのMB615、620、625、630それぞれの中にある。MB615−630の歪み値は、前のフレームの歪みマップの格納されたバージョンから得られうる。この例において、予測領域610内の4つの領域部分a1−a4の累積歪み値は、現在のMBの歪み値を計算するために(例えば、各領域部分におけるピクセル数に基づいて)重み平均される。したがって、累積的な誤り伝播による現在のマクロブロックの推定された予測歪み値は、
Figure 0004908522
によって得られる。ここで、a1、a2、a3、a4は、図6に例示するような4つの領域部分である。式(1)によって与えられた歪み値は、16x16ピクセル領域の重み平均を、256で除することによって規格化されることに着目されたい。
前のフレームの予測領域からの累積歪みに加えて、現在のMBが誤って受け取られれば、アルゴリズムは、現在のMBの隠蔽による歪み値成分を推定する。上述したように、現在のMBは、確率Pで、誤って受け取られると仮定されている。隠蔽方法により現在のマクロブロックによって導かれる歪みは、隠蔽誤り(この隠蔽方法によって導かれ、項Conceal_Errorによって示される誤り)と、この隠蔽方法によって使用される予測領域からの誤り伝播による効果との総和であると概算される。上述したように、(例えば、現在のフレームからの、および/または過去のフレームからの)予測変量は、確率1−Qで利用可能であると仮定されている。この例において、隠蔽方法は、現在のフレームおよび前のフレーム内のデータの利用可能度に依存すると仮定される。累積歪み項
Figure 0004908522
によって示されるように、予測領域は前のフレームにあると仮定される。しかしながら、これは単なる例であって、予測領域は、現在のフレームであるか、あるいは、利用可能な他のフレーム内にありうる。従って、歪みは、前のフレームからの予測領域を用いた時間的な誤り隠蔽方法によってもたらされる。ここで、隠蔽されている部分は、確率Pで誤っており、歪みは、
Figure 0004908522
のように計算される(ともに確率1−Qで利用可能な)現在のフレームと前のフレームとにおける予測データの利用可能度に依存する。
隠蔽誤り計算は、計算上複雑でありうる。しかしながら、幾つかの合理的な仮定の下では、以下のSAD(ピクセル値における累積差分の合計)値における差分として概算されうる。
SADopt:最適のMVと最適のエンコード・モードが使用された時、オリジナル画像と圧縮画像とから得られたSAD。
SADest:推定されたMVが使用された(時間的な隠蔽アルゴリズムによって推定された)時、オリジナル画像と隠蔽画像とから得られたSAD。
この概算は、以下のように書かれうる。
Figure 0004908522
ここでa1’、a2’、a3’、a4’は、隠蔽部分予測として使用され、累積歪みを重み平均するために使用される(図6に図示するような)前のフレームにおける4つの領域部分である。式(3)によって与えられた歪み値も、16x16ピクセル領域の重み平均を256によって除することによって規格化されることに注目されたい。
式(3)を使用する場合、SADestは、幾つかの場合(例えば、動作補償不正確によって)SADopt未満であることが判明しうるが、この差は無視できるほど小さく、この場合、Conceal_Error成分はゼロであると近似されうることに注目されたい。
式(3)は、現在のフレームと前のフレームとの両方とも利用可能である場合(それぞれが、確率1−Qで生じる場合)に使用される隠蔽方法に相当する歪み値成分を表わす。しかしながら、現在のフレームおよび/または過去のフレームのうちの幾つかまたは全てが誤って受け取られた場合、異なる隠蔽誤りが存在するかもしれない。ここでは、それぞれが確率Qで生じる。4つの異なる隠蔽推定に対応する歪み値成分が考慮されうる。ここでは、4つの隠蔽推定は、1)現在のフレームが利用可能であり、前のフレームが利用可能である場合、2)現在のフレームが利用可能であるが、前のフレームが誤っている場合、3)現在のフレームが誤っているが、前のフレームが利用可能である場合、および4)現在のフレームと前のフレームともに誤っている場合の4つのシナリオに相当する。4つの隠蔽推定値の計算に関する詳細は、歪み値計算についての理解には重要ではないので、本明細書では説明しない。4つの歪み値成分を含む累積歪みは、次のように計算されうる。
Figure 0004908522
ここで、第1の隠蔽推定値は、
Figure 0004908522
からなる歪みとなり、第2の隠蔽推定値は、
Figure 0004908522
からなる歪みとなり、それ以降も同様である。更に、累積歪みは、4つの隠蔽推定のおのおので用いられる予測領域の領域(a'、a''、a'''、a'''')に基づいて重み平均される。隠蔽推定は、例えば空間的な隠蔽、ニ方向隠蔽等のような異なるタイプの隠蔽方法に基づきうる。例えば、隠蔽アルゴリズムは、決定論的/確率論的基準に依存して、ある時は時間的に、またある時には空間的に隠蔽することができる。歪み値計算を行ない、この歪み値に基づいて、どのエンコード方法を使用するかを決定するエンコーダ・デバイスは、デコーダが誤ったデータを受け取った場合に、誤り復元および/または誤り隠蔽性能を改善するために、デコーダ内で使用されるものと同じであるか類似した方法をモデル化することができる。
他の予測領域が利用可能ではない確率に基づいて、他の隠蔽推定も考慮され、式(4)に含まれうることに注目されたい。式(4)は、図5に例示されるような歪みマップを形成するために、フレーム内の各MBについて使用されうる。従って、式(4)を用いて計算された歪み値は、隠蔽の多くのオプションを選択することによって導かれた歪みの重み付けされた総和となる。ここで、重みは、各隠蔽オプションが選択される確率である。
図4Bは、例えば図1に例示するようなシステムにおけるビデオ・ストリームの一部をエンコードする方法の例を詳細に例示するフローチャートである。方法420は、図4Aに関して上述したようなブロック402および404を含んでおり、ブロック402において歪み値を推定する場合に考慮される様々な隠蔽方法と、ブロック404においてエンコード方法を決定する様々な方法とを含んでいる。
ブロック402において、歪み値は、式(4)に関して上述されたものに類似したアルゴリズムを用いて推定されうる。使用される正確な歪み値式は、表わされる隠蔽方法のタイプに依存する。表わされる隠蔽方法は、空間的な隠蔽方法を含みうる。ここでは、同じフレームに位置する予測部分が、誤って受け取られた部分を隠蔽するために使用される。フレーム内の空間的な隠蔽の場合、現在のフレーム内のMBの累積歪み値が、前のフレームからの歪み値の代わりに使用される。時間的な隠蔽方法は、上述しかつ式(4)によって表されるような一方向予測を含み、次に続くフレームの利用可能度も考慮されるニ方向予測をも含む。
時間的な隠蔽方法の1つの例は、動作ベクトル・スケーリングである。動作ベクトル・スケーリングは、現在のフレームにおける誤ったマルチメディア・データの一部のための動作ベクトルを導出するために、他のフレームから動作ベクトルを内挿および/または外挿する方法である。時間的な隠蔽方法の他の例は、フレーム・レート変換である。フレーム・レート変換は、動作ベクトル・スケーリングと類似しているが、一般には2つの周囲のフレームに基づくフレーム全体の構成を含んでいる。時間的な誤り隠蔽方法の他の例は、光学フロー方法に基づきうる。ブロック402において推定される歪み値によって表わされうる他の形式の隠蔽は、空間および周波数領域内挿、最大平滑復元、および凸集合への突起(projection into convex sets)を含む。熟練技術者であれば、方法400のブロック402において歪み値を推定する場合に表されうる他の形式の誤り隠蔽を認識するだろう。
上述したように、エンコーダ・デバイスは、ブロック404において、ブロック402において推定された歪み値に基づいてエンコード方法を決定する。幾つかの実施形態では、推定された歪み値がしきい値と比較され、この比較に基づいてエンコード方法が決定される。しきい値は、マルチメディア・データの全ての部分に対して単一の値でありうる。しかしながら、しきい値はまた、例えば、方法420のブロック404内にリストされたような方法によって変わりうる。これらの方法は、しきい値を越えることに基づいてエンコード方法を決定することに関して説明される。ここでは、しきい値を越えた場合に選択されるエンコード方法は、一般に、その部分をリフレッシュする(または、その部分の推定された歪み値を少なくとも低減する)役割を負う。しかしながら、このエンコード方法はまた、しきい値未満である歪み値に基づいても決定されうることが注目されるべきである。
幾つかの例において、しきい値は、エンコードされているマルチメディア部分が位置する領域のテクスチャの関数として変えられる。テクスチャが大幅に変化する領域(例えば、ピクセルからピクセルへの大幅な変化)は、テクスチャがあまり変化しない領域ほど誤りを示さない。従って、(例えば、イントラ・コーディングを用いて)その部分をリフレッシュするために決定されたエンコード方法によって、より高いしきい値が与えられうる。しかしながら、スムーズに、あるいはわずかしかテクスチャが変化しない領域は、より多くの誤りを示し、もって、より低いしきい値が割り当てられうる。
幾つかの例では、しきい値は、フレーム内でエンコードされている部分の位置あるいは場所の関数として変わりうる。例えば、エッジ上の部分は、中心部分よりも高いしきい値が割り当てられうる。このようにして、視聴者がより頻繁に見る領域(例えば、フレームの中心)は、視聴者がさほど見ないエッジ上の領域よりもより頻繁にリフレッシュされる。
幾つかの例では、しきい値は、GOP(グループ・オブ・ピクチャ)内でエンコードされている現在のフレームの位置、または、多くのフレームからなるスーパフレームの位置の関数でありうる。GOPは、一般に、少なくとも一度イントラ・コード化された(アダプティブ・イントラ・リフレッシュすなわちAIRとしても知られる)フレーム内のMBの実質的に全てを含むフレームのセット、または、イントラ・コード化されたフレームで始まる。ここでは、GOP内の他のフレーム(またはスーパフレーム)は、GOP外部のフレームを参照しない。MBが、GOPの始まりにおいてより高いチャンスでイントラ・コード化されることを保証するために、GOPの始まり近傍のフレームにおけるしきい値は、GOPの終わり近傍のMBよりも低いしきい値を持つ。
幾つかの例では、しきい値は、フレーム内の、例えば歪みマップにおける歪み値の分布の関数でありうる。例えば、しきい値は、フレーム内のMBの部分が、歪み値の分布に基づいてイントラ・コード化されることを保証するように適応して設定されうる。これは、イントラ・コード化されるMBの数を制限し、送信に必要なデータ・レートを制限するために用いられる。たとえ品質が、幾つかフレームに対して(高い歪み値の分布によって)低下しても、データ・レートは、所望のレベルに維持されうる。
幾つかの例では、しきい値は、エンコードされている部分を含むフレームの領域における動作アクティビティの関数でありうる。より高い動作アクティビティによって特徴付けられるビデオの領域で生じる誤りは、小さな動作によって特徴付けられる領域で生じる誤りよりも知覚できない傾向にある。しきい値は、より低い動作アクティビティを経験する領域よりも、より高い動作アクティビティを経験する領域において、より高い値に設定されうる。動作アクティビティは、多くの方法で測定されうる。例えば、動作ベクトル振幅が、動作アクティビティ・インジケータとして使用されうる。ここでは、より高い振幅動作ベクトルが、より高い動作アクティビティを示す。動作ベクトル方向の変化も、動作アクティビティ・インジケータとして使用することができる。領域において、ほとんどの動作ベクトルが、実質的に同じ方向を指しているのであれば、これは低い動作アクティビティを示しうる。領域の近隣ブロックの動作ベクトルが、異なる方向を指しているのであれば、これは高い動作アクティビティを示しうる。類似した動作アクティビティ尺度が、例えば光学フローのようなその他の動作補償技術を用いて得られる。
幾つかの例では、しきい値は、エンコードされているビデオの部分のエンコード・モードの関数でありうる。例えば、ビデオの幾つかの部分は、一般に、ビデオの予測された他の部分のための基準としては使用されない。例えば、Bフレームは、多くのシステムにおいて、基準フレームに使用されない。したがって、このタイプのシステムにおけるBフレームの歪み値は、他のどのビデオも参照しないだろうから、より高くすることが可能である。他のどのビデオもBフレームを参照しないので、誤りは、1フレーム期間(例えば、毎秒30フレームのビデオ・シーケンスにおける1/30秒)のみ続くだろう。したがって、しきい値は、予測された他の部分によって参照されるビデオの部分に対してよりも、参照されていないビデオの部分に対しての方が高いであろう。
ブロック402において推定された歪み値に基づいて、ブロック404においてエンコード方法が決定された後、処理420はブロック406に進み、エンコードされているマルチメディア・データの部分が、決定されたエンコード方法でエンコードされる。ブロック406におけるエンコード方法は、近隣の空間的な予測を持つ、あるいは持たないイントラ・コーディングを含みうる。ブロック402において計算された歪み値を低減するために、近隣のピクセルの空間的な予測を持たないイントラ・コーディングが選択される。ブロック406におけるエンコード方法は、動作補償予測を用いて、一方向予測または二方向予測を含むことができる。ブロック402において推定された歪み値を低減するために、異なる形式の動作補償予測も選択されうる。動作補償予測は、ブロック・マッチング、光学フロー、および、上述したようにして動作ベクトルを計算するその他の方法を含みうる。方法420のブロックのうちの幾つかは、結合、省略、配列し直し、あるいはこれらの任意の組み合わせが可能であることが注目されるべきである。
図7は、例えば図1に例示するようなシステムで使用されるエンコーダ・デバイス110の例を図示する機能ブロック図である。この局面は、マルチメディア・データの第1の部分が誤って受け取られたのであれば、この第1の部分を隠蔽することに関連する1または複数の隠蔽方法に少なくとも部分的に基づいてこの第1の部分の歪み値を推定する手段と、推定された歪み値に少なくとも部分的に基づいて第1の部分のためのエンコード方法を決定する手段とを含む。この局面の幾つかの例は、推定する手段は、歪み値推定器702を備え、決定する手段は、エンコード方法決定部704を備える。
図8は、例えば図1に例示するようなシステムで使用されるエンコーダ・デバイス110の例を示す機能ブロック図である。この局面は、マルチメディア・データの第1の部分が誤って受け取られたのであれば、この第1の部分を隠蔽することに関連する1または複数の隠蔽方法に少なくとも部分的に基づいてこの第1の部分の歪み値を推定する手段と、推定された歪み値に少なくとも部分的に基づいて第1の部分のためのエンコード方法を決定する手段とを含むこの局面の幾つかの例では、推定する手段は、歪み値を推定するモジュール802を備え、決定する手段は、エンコード方法を決定するモジュール804を備える。
当業者であれば、これら情報および信号が、種々異なった技術や技法を用いて表されることを理解するであろう。例えば、上述した記載の全体で引用されているデータ、命令群、コマンド、情報、信号、ビット、シンボル、およびチップは、電圧、電流、電磁波、磁場または磁性粒子、光学場または光学微粒子、あるいはこれら何れかの組み合わせによって表現されうる。
当業者であれば、更に、本明細書で開示された実施形態に関連して記載された様々な例示的な論理ブロック、モジュール、回路、およびアルゴリズム・ステップが、電子工学ハードウェア、コンピュータ・ソフトウェア、あるいはこれらの組み合わせとして実現されることを理解するであろう。ハードウェアとソフトウェアとの相互置換性を明確に説明するために、様々な例示的な部品、ブロック、モジュール、回路、およびステップが、それらの機能に関して一般的に記述された。それら機能がハードウェアとして又はソフトウェアとして実現されるかは、特定のアプリケーション及びシステム全体に課せられている設計制約に依存する。当業者であれば、各特定のアプリケーションに応じて変化する方法で上述した機能を実現することができる。しかしながら、この適用判断は、本発明の範囲からの逸脱をもたらすものと解釈されるべきではない。
本明細書で開示された実施形態に関連して記述された様々な例示的な論理ブロック、モジュール、および回路は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲート・アレイ(FPGA)あるいはその他のプログラマブル論理デバイス、ディスクリート・ゲートあるいはトランジスタ・ロジック、ディスクリート・ハードウェア部品、又は上述された機能を実現するために設計された上記何れかの組み合わせを用いて実現又は実施されうる。汎用プロセッサとしてマイクロプロセッサを用いることが可能であるが、代わりに、従来技術によるプロセッサ、コントローラ、マイクロコントローラ、あるいは状態機器を用いることも可能である。プロセッサは、例えばDSPとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサ、DSPコアに接続された1または複数のマイクロプロセッサ、またはその他任意のこのような構成である計算デバイスの組み合わせとして実現することも可能である。
本明細書で開示された実施形態に関連して記述された方法やアルゴリズムのステップは、ハードウェアによって直接的に、プロセッサによって実行されるソフトウェア・モジュールによって、または、これらの組み合わせによって具体化される。ソフトウェア・モジュールは、RAMメモリ、フラッシュ・メモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブル・ディスク、CD−ROM、あるいは当該技術分野で知られているその他の型式の記憶媒体に収納されうる。典型的な記憶媒体は、プロセッサがそこから情報を読み取り、またそこに情報を書き込むことができるようにプロセッサに結合される。または、記憶媒体はプロセッサに統合されることができる。このプロセッサと記憶媒体とは、ASIC内に存在することができる。ASICは、ユーザ端末内に存在することもできる。あるいはこのプロセッサと記憶媒体とは、ユーザ端末内のディスクリート部品として存在することができる。
開示された実施形態における上述の記載は、当業者をして、本発明の製造または利用を可能とするように提供される。これらの実施形態への様々な変形例もまた、当業者には明らかであって、本明細書で定義された一般的な原理は、本発明の主旨または範囲から逸脱することなく他の実施形態にも適用されうる。
このように、本発明は、本明細書で示された実施形態に限定されるものではなく、本明細書に記載された原理および新規な特徴に一致した最も広い範囲に相当することが意図されている。
図1は、1つの局面に従ったマルチメディア通信システムを例示するブロック図である。 図2は、例えば図1に例示するようなシステムにおいて使用されうるエンコーダ・デバイスの実施形態を例示するブロック図である。 図3は、例えば図1に例示するようなシステムにおいて使用されうるデコーダ・デバイスの実施形態を例示するブロック図である。 図4Aは、例えば図1に例示するようなシステムにおいてビデオ・ストリームの一部をエンコードする方法の例を図示するフローチャートである。 図4Bは、例えば図1に例示するようなシステムにおいてビデオ・ストリームの一部をエンコードする方法の例をより詳細に図示するフローチャートである。 図5は、図4Aおよび図4Bの方法によって生成されうる歪みマップをグラフィック的に図示する。 図6は、例えば動作補償予測方法において使用されるように、ビデオの部分を推定するために使用される予測領域をグラフィック的に図示する。 図7は、例えば図1に例示するようなシステムで使用されうるエンコーダ・デバイスの実施形態を例示する機能ブロック図である。 図8は、例えば図1に例示するようなシステムで使用されうるエンコーダ・デバイスの実施形態を例示する機能ブロック図である。

Claims (65)

  1. マルチメディア・データをエンコードする方法であって、
    マルチメディア・データの第1の部分が誤って受け取られたのであれば、前記第1の部分を隠蔽することに関連する1または複数の隠蔽方法に少なくとも部分的に基づいて前記第1の部分の歪み値を推定することと、ここにおいて、前記1または複数の隠蔽方法は、ビデオの一部が誤って受け取られていることに応じて、ビデオ・デコーダにおいて使用される;
    前記推定された歪み値としきい値とに少なくとも部分的に基づいて、前記第1の部分のためのエンコード方法を決定することと、ここにおいて、前記しきい値は、マルチメディア・データの前記第1の部分の特性に基づいて、変化する;
    を備える方法。
  2. 前記決定したエンコード方法を用いて、前記第1の部分をエンコードすることを更に備える請求項1に記載の方法。
  3. 前記エンコード方法を決定することは更に、前記推定された歪み値と前記しきい値との比較に基づいて前記第1の部分をリフレッシュするように、前記エンコード方法を決定することを備える請求項1に記載の方法。
  4. 前記しきい値は、要因のリストから選択される1または複数の要因の関数として変化し、前記要因のリストは、
    前記第1の部分を含むフレーム内の前記第1の部分の位置と、
    前記第1の部分を含むフレームの領域のテクスチャと、
    前記フレームを含むピクチャのグループ内の前記第1の部分を含むフレームの位置と、 前記第1の部分を含むフレーム内の歪み値の分布と、
    前記第1の部分を含むフレームの領域の動作アクティビティと、
    前記第1の部分を含むフレームのエンコード・モードと
    を含む請求項3に記載の方法。
  5. 前記推定された歪み値と前記しきい値との比較に基づいて前記第1の部分をリフレッシュするように、前記第1の部分をイントラ・コードすることを更に備える請求項1に記載の方法。
  6. 前記1または複数の隠蔽方法によって使用される予測データの誤りの確率に少なくとも部分的に基づいて前記第1の部分に対する歪み値を推定することを更に備える請求項1に記載の方法。
  7. 前記1または複数の隠蔽方法によって構築された前記第1の部分のバージョンと、前記第1の部分のうちの誤りのないバージョンとの間のピクセル値における差分に少なくとも部分的に基づいて、前記第1の部分の歪み値を推定することを更に備える請求項1に記載の方法。
  8. 前記第1の部分の歪み値の推定することは更に、前記1または複数の隠蔽方法の各々に対する歪み値の歪み成分を推定することを備える請求項1に記載の方法。
  9. 前記歪み値を推定することは更に、前記第1の部分が誤って受け取られたのであれば、前記第1の部分を隠蔽することに関連する前記1または複数の隠蔽方法によって使用される多くの予測領域からの累積歪み値を重み平均することを備え、
    前記重み平均することは、前記予測領域のサイズに少なくとも部分的に基づく請求項1に記載の方法。
  10. 前記第1の部分はフレームに含まれ、
    前記方法は、
    前記フレームに含まれるマルチメディア・データの1または複数の第2の部分に対する1または複数の第2の歪み値を推定することと、
    前記フレームに含まれるマルチメディア・データの前記第1および第2の部分に対する推定された歪み値を含む歪みマップを形成することと
    を更に備える請求項1に記載の方法。
  11. 前記エンコード方法を決定することは更に、前記歪みマップに少なくとも部分的に基づいて前記第1および第2の部分に対する1または複数のエンコード方法を決定することを備える請求項10に記載の方法。
  12. 前記1または複数のエンコード方法を決定することは更に、前記歪みマップにおける前記歪み値と、1または複数のしきい値との比較に基づいて、前記第1および第2の部分をリフレッシュするように、前記1または複数のエンコード方法を決定することを備える請求項11に記載の方法。
  13. 前記1または複数のしきい値は、要因のリストから選択される1または複数の要因の関数として変化し、前記要因のリストは、
    前記フレーム内の前記第1および第2の部分の位置と、
    前記第1および第2の部分を含むフレームの領域のテクスチャと、
    前記フレームを含むピクチャのグループ内の前記第1および第2の部分を含むフレームの位置と、
    前記第1および第2の部分を含むフレームに対する歪みマップにおける歪み値の分布と、
    前記第1および第2の部分を含むフレームの領域の動作アクティビティと、
    前記第1および第2の部分を含むフレームのエンコード・モードと
    を含む請求項12に記載の方法。
  14. マルチメディア・デバイスであって、
    メモリと;
    マルチメディア・データの第1の部分が誤って受け取られたのであれば、前記第1の部分を隠蔽することに関連する1または複数の隠蔽方法に少なくとも部分的に基づいて前記第1の部分の歪み値を推定するように、ここにおいて、前記1または複数の隠蔽方法は、ビデオ・デコーダにおいて使用される、
    前記推定された歪み値としきい値とに少なくとも部分的に基づいて、前記第1の部分のためのエンコード方法を決定するように、ここにおいて、前記しきい値は、マルチメディア・データの前記第1の部分の特性に基づいて、変化する、
    ように構成されたプロセッサと;
    を備えるマルチメディア・デバイス
  15. 前記プロセッサは、前記決定したエンコード方法を用いて、前記第1の部分をエンコードするように更に構成される、請求項14に記載のマルチメディア・デバイス
  16. 前記プロセッサは、前記推定された歪み値と前記しきい値との比較に基づいて前記第1の部分をリフレッシュするように、前記エンコード方法を決定するように更に構成された請求項14に記載のマルチメディア・デバイス
  17. 前記しきい値は、要因のリストから選択される1または複数の要因の関数として変化し、前記要因のリストは、
    前記第1の部分を含むフレーム内の前記第1の部分の位置と、
    前記第1の部分を含むフレームの領域のテクスチャと、
    前記フレームを含むピクチャのグループ内の前記第1の部分を含むフレームの位置と、
    前記第1の部分を含むフレーム内の歪み値の分布と、
    前記第1の部分を含むフレームの領域の動作アクティビティと、
    前記第1の部分を含むフレームのエンコード・モードと
    を含む請求項16に記載のマルチメディア・デバイス
  18. 前記プロセッサは、前記推定された歪み値と前記しきい値との比較に基づいて前記第1の部分をリフレッシュするように、前記第1の部分をイントラ・コードするように更に構成される、請求項14に記載のマルチメディア・デバイス
  19. 前記プロセッサは、前記1または複数の隠蔽方法によって使用される予測データの誤りの確率に少なくとも部分的に基づいて前記第1の部分に対する歪み値を推定するように更に構成される、請求項14に記載のマルチメディア・デバイス
  20. 前記プロセッサは、前記1または複数の隠蔽方法によって構築された前記第1の部分のバージョンと、前記第1の部分のうちの誤りのないバージョンとの間のピクセル値における差分に少なくとも部分的に基づいて、前記第1の部分の歪み値を推定するように更に構成される、請求項14に記載のマルチメディア・デバイス
  21. 前記プロセッサは、前記1または複数の隠蔽方法の各々に対する歪み値の歪み成分を推定するように更に構成される、請求項14に記載のマルチメディア・デバイス
  22. 前記ロセッサは、前記第1の部分が誤って受け取られたのであれば、前記第1の部分を隠蔽することに関連する前記1または複数の隠蔽方法によって使用される多くの予測領域からの累積歪み値を重み平均するように更に構成され、
    前記重み平均することは、前記予測領域のサイズに少なくとも部分的に基づく請求項14に記載のマルチメディア・デバイス
  23. 前記第1の部分はフレームに含まれ、
    前記ロセッサは更に、
    前記フレームに含まれるマルチメディア・データの1または複数の第2の部分に対する1または複数の第2の歪み値を推定し、
    前記フレームに含まれるマルチメディア・データの前記第1および第2の部分に対する推定された歪み値を含む歪みマップを形成する
    ように構成された請求項14に記載のマルチメディア・デバイス
  24. 前記マルチメディア・デバイスは、前記歪みマップに少なくとも部分的に基づいて前記第1および第2の部分に対する1または複数のエンコード方法を決定するように更に構成される、請求項23に記載のマルチメディア・デバイス
  25. 前記マルチメディア・デバイスは、前記歪みマップにおける前記歪み値と、1または複数のしきい値との比較に基づいて、前記第1および第2の部分をリフレッシュするように、前記1または複数のエンコード方法を決定するように更に構成された請求項24に記載のマルチメディア・デバイス
  26. 前記1または複数のしきい値は、要因のリストから選択される1または複数の要因の関数として変化し、前記要因のリストは、
    前記フレーム内の前記第1および第2の部分の位置と、
    前記第1および第2の部分を含むフレームの領域のテクスチャと、
    前記フレームを含むピクチャのグループ内の前記第1および第2の部分を含むフレームの位置と、
    前記第1および第2の部分を含むフレームに対する歪みマップにおける歪み値の分布と、
    前記第1および第2の部分を含むフレームの領域の動作アクティビティと、
    前記第1および第2の部分を含むフレームのエンコード・モードと
    を含む請求項25に記載のマルチメディア・デバイス
  27. マルチメディア・データをエンコードする装置であって、
    マルチメディア・データの第1の部分が誤って受け取られたのであれば、前記第1の部分を隠蔽することに関連する1または複数の隠蔽方法に少なくとも部分的に基づいて前記第1の部分の歪み値を推定する推定器と、ここにおいて、前記1または複数の隠蔽方法は、ビデオ・デコーダにおいて使用される;
    前記推定された歪み値としきい値とに少なくとも部分的に基づいて、前記第1の部分のためのエンコード方法を決定する決定部と、ここにおいて、前記しきい値は、マルチメディア・データの前記第1の部分の特性に基づいて、変化する;
    を備える装置。
  28. 前記決定したエンコード方法を用いて、前記第1の部分をエンコードするエンコーダを更に備える請求項27に記載の装置。
  29. 前記決定部は、前記推定された歪み値と前記しきい値との比較に基づいて前記第1の部分をリフレッシュするように、前記エンコード方法を決定する請求項27に記載の装置。
  30. 前記しきい値は、要因のリストから選択される1または複数の要因の関数として変化し、前記要因のリストは、
    前記第1の部分を含むフレーム内の前記第1の部分の位置と、
    前記第1の部分を含むフレームの領域のテクスチャと、
    前記フレームを含むピクチャのグループ内の前記第1の部分を含むフレームの位置と、 前記第1の部分を含むフレーム内の歪み値の分布と、
    前記第1の部分を含むフレームの領域の動作アクティビティと、
    前記第1の部分を含むフレームのエンコード・モードと
    を含む請求項29に記載の装置。
  31. 前記推定された歪み値と前記しきい値との比較に基づいて前記第1の部分をリフレッシュするように、前記第1の部分をイントラ・コードするエンコーダを更に備える請求項27に記載の装置。
  32. 前記推定器は、前記1または複数の隠蔽方法によって使用される予測データの誤りの確率に少なくとも部分的に基づいて前記第1の部分に対する歪み値を推定する請求項27に記載の装置。
  33. 前記推定器は、前記1または複数の隠蔽方法によって構築された前記第1の部分のバージョンと、前記第1の部分のうちの誤りのないバージョンとの間のピクセル値における差分に少なくとも部分的に基づいて、前記第1の部分の歪み値を推定する請求項27に記載の装置。
  34. 前記推定器は、前記1または複数の隠蔽方法の各々に対する歪み値の歪み成分を推定する請求項27に記載の装置。
  35. 前記第1の部分が誤って受け取られたのであれば、前記推定器は、前記第1の部分を隠蔽することに関連する前記1または複数の隠蔽方法によって使用される多くの予測領域からの累積歪み値を重み平均することによって前記歪み値を推定し、
    前記重み平均することは、前記予測領域のサイズに少なくとも部分的に基づく請求項27に記載の装置。
  36. 前記第1の部分はフレームに含まれ、
    前記推定器は、
    前記フレームに含まれるマルチメディア・データの1または複数の第2の部分に対する1または複数の第2の歪み値を推定し、
    前記フレームに含まれるマルチメディア・データの前記第1および第2の部分に対する前記推定された歪み値を含む歪みマップを形成する
    請求項27に記載の装置。
  37. 前記決定部は、前記歪みマップに少なくとも部分的に基づいて前記第1および第2の部分に対する1または複数のエンコード方法を決定する請求項36に記載の装置。
  38. 前記決定部は、前記歪みマップにおける前記歪み値と、1または複数のしきい値との比較に基づいて、前記第1および第2の部分をリフレッシュするように、前記1または複数のエンコード方法を決定する請求項37に記載の装置。
  39. 前記1または複数のしきい値は、要因のリストから選択される1または複数の要因の関数として変化し、前記要因のリストは、
    前記フレーム内の前記第1および第2の部分の位置と、
    前記第1および第2の部分を含むフレームの領域のテクスチャと、
    前記フレームを含むピクチャのグループ内の前記第1および第2の部分を含むフレームの位置と、
    前記第1および第2の部分を含むフレームに対する歪みマップにおける歪み値の分布と、
    前記第1および第2の部分を含むフレームの領域の動作アクティビティと、
    前記第1および第2の部分を含むフレームのエンコード・モードと
    を含む請求項38に記載の装置。
  40. マルチメディア・データをエンコードする装置であって、
    マルチメディア・データの第1の部分が誤って受け取られたのであれば、前記第1の部分を隠蔽することに関連する1または複数の隠蔽方法に少なくとも部分的に基づいて前記第1の部分の歪み値を推定する手段と、ここにおいて、前記1または複数の隠蔽方法は、ビデオ・デコーダにおいて使用される;
    前記推定された歪み値としきい値とに少なくとも部分的に基づいて、前記第1の部分のためのエンコード方法を決定する手段と、ここにおいて、前記しきい値は、マルチメディア・データの前記第1の部分の特性に基づいて、変化する;
    を備える装置。
  41. 前記決定したエンコード方法を用いて、前記第1の部分をエンコードする手段を更に備える請求項40に記載の装置。
  42. 前記決定する手段は、前記推定された歪み値と前記しきい値との比較に基づいて前記第1の部分をリフレッシュするように、前記エンコード方法を決定する請求項40に記載の装置。
  43. 前記しきい値は、要因のリストから選択される1または複数の要因の関数として変化し、前記要因のリストは、
    前記第1の部分を含むフレーム内の前記第1の部分の位置と、
    前記第1の部分を含むフレームの領域のテクスチャと、
    前記フレームを含むピクチャのグループ内の前記第1の部分を含むフレームの位置と、 前記第1の部分を含むフレーム内の歪み値の分布と、
    前記第1の部分を含むフレームの領域の動作アクティビティと、
    前記第1の部分を含むフレームのエンコード・モードと
    を含む請求項42に記載の装置。
  44. 前記推定された歪み値と前記しきい値との比較に基づいて前記第1の部分をリフレッシュするように、前記第1の部分をイントラ・コードする手段を更に備える請求項40に記載の装置。
  45. 前記推定する手段は、前記1または複数の隠蔽方法によって使用される予測データの誤りの確率に少なくとも部分的に基づいて前記第1の部分に対する歪み値を推定する請求項40に記載の装置。
  46. 前記推定する手段は、前記1または複数の隠蔽方法によって構築された前記第1の部分のバージョンと、前記第1の部分のうちの誤りのないバージョンとの間のピクセル値における差分に少なくとも部分的に基づいて、前記第1の部分の歪み値を推定する請求項40に記載の装置。
  47. 前記推定する手段は、前記1または複数の隠蔽方法の各々に対する歪み値の歪み成分を推定することによって、前記第1の部分の歪み値を推定する請求項40に記載の装置。
  48. 前記第1の部分が誤って受け取られたのであれば、前記推定する手段は、前記第1の部分を隠蔽することに関連する前記1または複数の隠蔽方法によって使用される多くの予測領域からの累積歪み値を重み平均することによって前記歪み値を推定し、
    前記重み平均することは、前記予測領域のサイズに少なくとも部分的に基づく請求項40に記載の装置。
  49. 前記第1の部分はフレームに含まれ、
    前記推定する手段は、
    前記フレームに含まれるマルチメディア・データの1または複数の第2の部分に対する1または複数の第2の歪み値を推定し、
    前記フレームに含まれるマルチメディア・データの前記第1および第2の部分に対する前記推定された歪み値を含む歪みマップを形成する
    請求項40に記載の装置。
  50. 前記決定する手段は、前記歪みマップに少なくとも部分的に基づいて前記第1および第2の部分に対する1または複数のエンコード方法を決定する請求項49に記載の装置。
  51. 前記決定する手段は、前記歪みマップにおける前記歪み値と、1または複数のしきい値との比較に基づいて、前記第1および第2の部分をリフレッシュするように、前記1または複数のエンコード方法を決定する請求項50に記載の装置。
  52. 前記1または複数のしきい値は、要因のリストから選択される1または複数の要因の関数として変化し、前記要因のリストは、
    前記フレーム内の前記第1および第2の部分の位置と、
    前記第1および第2の部分を含むフレームの領域のテクスチャと、
    前記フレームを含むピクチャのグループ内の前記第1および第2の部分を含むフレームの位置と、
    前記第1および第2の部分を含むフレームに対する歪みマップにおける歪み値の分布と、
    前記第1および第2の部分を含むフレームの領域の動作アクティビティと、
    前記第1および第2の部分を含むフレームのエンコード・モードと
    を含む請求項51に記載の装置。
  53. 実行されると、機械に対して、
    マルチメディア・データの第1の部分が誤って受け取られたのであれば、前記第1の部分を隠蔽することに関連する1または複数の隠蔽方法に少なくとも部分的に基づいて前記第1の部分の歪み値を推定させ、ここにおいて、前記1または複数の隠蔽方法は、ビデオ・デコーダにおいて使用される;
    前記推定された歪み値としきい値とに少なくとも部分的に基づいて、前記第1の部分のためのエンコード方法を決定させる、ここにおいて、前記しきい値は、マルチメディア・データの前記第1の部分の特性に基づいて、変化する;
    命令群を備える機械読取可能記録媒体。
  54. 実行されると、前記機械に対して、前記決定したエンコード方法を用いて、前記第1の部分をエンコードさせる命令を更に備える請求項53に記載の機械読取可能記録媒体。
  55. 実行されると、前記機械に対して、前記推定された歪み値と前記しきい値との比較に基づいて前記第1の部分をリフレッシュするように、前記エンコード方法を決定させる命令を更に備える請求項53に記載の機械読取可能記録媒体。
  56. 前記しきい値は、要因のリストから選択される1または複数の要因の関数として変化し、前記要因のリストは、
    前記第1の部分を含むフレーム内の前記第1の部分の位置と、
    前記第1の部分を含むフレームの領域のテクスチャと、
    前記フレームを含むピクチャのグループ内の前記第1の部分を含むフレームの位置と、
    前記第1の部分を含むフレーム内の歪み値の分布と、
    前記第1の部分を含むフレームの領域の動作アクティビティと、
    前記第1の部分を含むフレームのエンコード・モードと
    を含む請求項55に記載の機械読取可能記録媒体。
  57. 実行されると、前記機械に対して、前記推定された歪み値と前記しきい値との比較に基づいて前記第1の部分をリフレッシュするように、前記第1の部分をイントラ・コードさせる命令を更に備える請求項53に記載の機械読取可能記録媒体。
  58. 実行されると、前記機械に対して、前記1または複数の隠蔽方法によって使用される予測データの誤りの確率に少なくとも部分的に基づいて前記第1の部分に対する歪み値を推定させる命令を更に備える請求項53に記載の機械読取可能記録媒体。
  59. 実行されると、前記機械に対して、前記1または複数の隠蔽方法によって構築された前記第1の部分のバージョンと、前記第1の部分のうちの誤りのないバージョンとの間のピクセル値における差分に少なくとも部分的に基づいて、前記第1の部分の歪み値を推定させる命令を更に備える請求項53に記載の機械読取可能記録媒体。
  60. 実行されると、前記機械に対して、前記1または複数の隠蔽方法の各々に対する歪み値の歪み成分を推定させる命令を更に備える請求項53に記載の機械読取可能記録媒体。
  61. 実行されると、前記機械に対して、前記第1の部分が誤って受け取られたのであれば、前記第1の部分を隠蔽することに関連する前記1または複数の隠蔽方法によって使用される多くの予測領域からの累積歪み値を重み平均させる命令を更に備え、
    前記重み平均することは、前記予測領域のサイズに少なくとも部分的に基づく請求項53に記載の機械読取可能記録媒体。
  62. 前記第1の部分はフレームに含まれ、
    前記機械読取可能媒体は更に、実行されると、前記機械に対して、
    前記フレームに含まれるマルチメディア・データの1または複数の第2の部分に対する1または複数の第2の歪み値を推定させ、
    前記フレームに含まれるマルチメディア・データの前記第1および第2の部分に対する前記推定された歪み値を含む歪みマップを形成させる
    命令を更に備える請求項53に記載の機械読取可能記録媒体。
  63. 実行されると、前記機械に対して、前記歪みマップに少なくとも部分的に基づいて前記第1および第2の部分に対する1または複数のエンコード方法を決定させる命令を更に備える請求項62に記載の機械読取可能記録媒体。
  64. 実行されると、前記機械に対して、前記歪みマップにおける前記歪み値と、1または複数のしきい値との比較に基づいて、前記第1および第2の部分をリフレッシュするように、前記1または複数のエンコード方法を決定させる命令を更に備える請求項63に記載の機械読取可能記録媒体。
  65. 前記1または複数のしきい値は、要因のリストから選択される1または複数の要因の関数として変化し、前記要因のリストは、
    前記フレーム内の前記第1および第2の部分の位置と、
    前記第1および第2の部分を含むフレームの領域のテクスチャと、
    前記フレームを含むピクチャのグループ内の前記第1および第2の部分を含むフレームの位置と、
    前記第1および第2の部分を含むフレームに対する歪みマップにおける歪み値の分布と、
    前記第1および第2の部分を含むフレームの領域の動作アクティビティと、
    前記第1および第2の部分を含むフレームのエンコード・モードと
    を含む請求項64に記載の機械読取可能記録媒体。
JP2008551554A 2006-01-20 2007-01-19 誤り隠蔽に関連する歪み値に基づいてエンコード方法を決定する方法および装置 Active JP4908522B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US76067806P 2006-01-20 2006-01-20
US60/760,678 2006-01-20
PCT/US2007/060786 WO2007084994A2 (en) 2006-01-20 2007-01-19 Method and apparatus for determining an encoding method based on a distortion value related to error concealment

Publications (2)

Publication Number Publication Date
JP2009524364A JP2009524364A (ja) 2009-06-25
JP4908522B2 true JP4908522B2 (ja) 2012-04-04

Family

ID=38169856

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008551554A Active JP4908522B2 (ja) 2006-01-20 2007-01-19 誤り隠蔽に関連する歪み値に基づいてエンコード方法を決定する方法および装置

Country Status (11)

Country Link
US (1) US8325822B2 (ja)
EP (1) EP1980115B1 (ja)
JP (1) JP4908522B2 (ja)
KR (1) KR20080098042A (ja)
CN (1) CN101375602B (ja)
AR (1) AR059105A1 (ja)
AT (1) ATE450118T1 (ja)
DE (1) DE602007003441D1 (ja)
ES (1) ES2336039T3 (ja)
TW (1) TW200737995A (ja)
WO (1) WO2007084994A2 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8861585B2 (en) 2006-01-20 2014-10-14 Qualcomm Incorporated Method and apparatus for error resilience algorithms in wireless video communication
US8325822B2 (en) 2006-01-20 2012-12-04 Qualcomm Incorporated Method and apparatus for determining an encoding method based on a distortion value related to error concealment
US8121189B2 (en) * 2007-09-20 2012-02-21 Microsoft Corporation Video decoding using created reference pictures
EP2051525A1 (en) * 2007-10-15 2009-04-22 Mitsubishi Electric Information Technology Centre Europe B.V. Bandwidth and content dependent transmission of scalable video layers
US9848209B2 (en) * 2008-04-02 2017-12-19 Microsoft Technology Licensing, Llc Adaptive error detection for MPEG-2 error concealment
US9788018B2 (en) * 2008-06-30 2017-10-10 Microsoft Technology Licensing, Llc Error concealment techniques in video decoding
US9924184B2 (en) * 2008-06-30 2018-03-20 Microsoft Technology Licensing, Llc Error detection, protection and recovery for video decoding
US9131241B2 (en) 2008-11-25 2015-09-08 Microsoft Technology Licensing, Llc Adjusting hardware acceleration for video playback based on error detection
WO2010126437A1 (en) * 2009-04-28 2010-11-04 Telefonaktiebolaget Lm Ericsson (Publ) Distortion weighing
US8340510B2 (en) * 2009-07-17 2012-12-25 Microsoft Corporation Implementing channel start and file seek for decoder
TWI412282B (zh) * 2009-11-17 2013-10-11 Univ Nat Cheng Kung 可隱藏傳輸錯誤之視訊解碼裝置與相關方法
US9219925B2 (en) 2010-01-14 2015-12-22 Sumitomo Electric Industries, Ltd. Video image coded data display method, device, and communications system
US20110249127A1 (en) * 2010-04-07 2011-10-13 Cisco Technology, Inc. Estimating Video Quality Corruption in Lossy Networks
WO2012021173A2 (en) 2010-08-12 2012-02-16 Net Power And Light Inc. System architecture and methods for experiential computing
US9172979B2 (en) * 2010-08-12 2015-10-27 Net Power And Light, Inc. Experience or “sentio” codecs, and methods and systems for improving QoE and encoding based on QoE experiences
WO2012021902A2 (en) 2010-08-13 2012-02-16 Net Power And Light Inc. Methods and systems for interaction through gestures
EP2630630A2 (en) 2010-10-21 2013-08-28 Net Power And Light, Inc. System architecture and method for composing and directing participant experiences
GB2487200A (en) 2011-01-12 2012-07-18 Canon Kk Video encoding and decoding with improved error resilience
GB2491589B (en) 2011-06-06 2015-12-16 Canon Kk Method and device for encoding a sequence of images and method and device for decoding a sequence of image
US9667942B2 (en) * 2012-11-20 2017-05-30 Qualcomm Incorporated Adaptive luminance compensation in three dimensional video coding
FR3000350A1 (fr) * 2012-12-21 2014-06-27 France Telecom Procede et dispositif de transmission d'une sequence d'images, procede et dispositif de reception, programme d'ordinateur et support d'enregistrement correspondants.
US9756356B2 (en) * 2013-06-24 2017-09-05 Dialogic Corporation Application-assisted spatio-temporal error concealment for RTP video
KR102608008B1 (ko) * 2017-05-19 2023-11-30 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
KR102574175B1 (ko) * 2017-06-05 2023-09-04 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
CN109816615B (zh) * 2019-03-06 2022-12-16 腾讯科技(深圳)有限公司 图像修复方法、装置、设备以及存储介质
EP3829169B1 (en) * 2019-11-29 2021-10-13 Axis AB Method for intra refresh encoding of a plurality of image frames using convex and concave distribution functions
CN111935545B (zh) * 2020-08-03 2023-03-24 腾讯音乐娱乐科技(深圳)有限公司 转码视频数据的方法、装置、设备及存储介质
CN114630122B (zh) * 2021-03-19 2023-04-28 杭州海康威视数字技术股份有限公司 基于自适应帧内刷新机制的解码、编码方法及相关设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11331839A (ja) * 1998-05-13 1999-11-30 Matsushita Electric Ind Co Ltd 映像伝送再送の装置及び方法
JP2002537736A (ja) * 1999-02-18 2002-11-05 ノキア モービル フォーンズ リミテッド 映像コーディング
JP2003032689A (ja) * 2001-07-18 2003-01-31 Sharp Corp 画像符号化装置、画像復号化装置及び動画像伝送システム

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5613015A (en) 1992-11-12 1997-03-18 Fuji Xerox Co., Ltd. Image signal analyzing system and coding system
US5627935A (en) 1994-11-11 1997-05-06 Samsung Electronics Co., Ltd. Error-correction-code coding & decoding procedures for the recording & reproduction of digital video data
US5793895A (en) 1996-08-28 1998-08-11 International Business Machines Corporation Intelligent error resilient video encoder
US6037985A (en) 1996-10-31 2000-03-14 Texas Instruments Incorporated Video compression
JP3223962B2 (ja) 1997-01-24 2001-10-29 松下電器産業株式会社 画像復号化方法
RU2217882C2 (ru) 1997-08-12 2003-11-27 Томсон Конзьюмер Электроникс, Инк. Устройство для сжатия блоков пикселов в системе обработки изображений
US6025888A (en) 1997-11-03 2000-02-15 Lucent Technologies Inc. Method and apparatus for improved error recovery in video transmission over wireless channels
JP3748717B2 (ja) 1998-08-31 2006-02-22 シャープ株式会社 動画像符号化装置
US6466624B1 (en) 1998-10-28 2002-10-15 Pixonics, Llc Video decoder with bit stream based enhancements
JP3166736B2 (ja) 1998-11-25 2001-05-14 日本電気株式会社 動画像符号化装置および動画像符号化方法
JP2002016913A (ja) 2000-06-28 2002-01-18 Yamaha Corp トランスコーディング方法およびトランスコーディング装置
JP4644939B2 (ja) * 2001-01-17 2011-03-09 日本電気株式会社 動画像符号化装置および動画像符号化方法
US20030053454A1 (en) * 2001-03-05 2003-03-20 Ioannis Katsavounidis Systems and methods for generating error correction information for a media stream
US6795076B2 (en) 2001-06-28 2004-09-21 Sun Microsystems, Inc. Graphics system with real-time convolved pixel readback
US20030235249A1 (en) 2002-06-25 2003-12-25 Chengji Zhao Video encoder and method for encoding video frames
US7034888B2 (en) 2003-03-26 2006-04-25 Silicon Integrated Systems Corp. Method for motion pixel detection
GB0314161D0 (en) 2003-06-18 2003-07-23 British Telecomm Edge analysis in video quality assessment
EP1667464B1 (en) 2003-12-22 2013-03-06 NEC Corporation Method and apparatus for encoding moving pictures
US7738561B2 (en) * 2004-11-16 2010-06-15 Industrial Technology Research Institute MPEG-4 streaming system with adaptive error concealment
US20070030894A1 (en) * 2005-08-03 2007-02-08 Nokia Corporation Method, device, and module for improved encoding mode control in video encoding
US8229983B2 (en) 2005-09-27 2012-07-24 Qualcomm Incorporated Channel switch frame
US8670437B2 (en) 2005-09-27 2014-03-11 Qualcomm Incorporated Methods and apparatus for service acquisition
US20070086971A1 (en) * 2005-10-19 2007-04-19 Patrick Diet Acidic Cleaning Compositions
US8861585B2 (en) 2006-01-20 2014-10-14 Qualcomm Incorporated Method and apparatus for error resilience algorithms in wireless video communication
US8325822B2 (en) 2006-01-20 2012-12-04 Qualcomm Incorporated Method and apparatus for determining an encoding method based on a distortion value related to error concealment

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11331839A (ja) * 1998-05-13 1999-11-30 Matsushita Electric Ind Co Ltd 映像伝送再送の装置及び方法
JP2002537736A (ja) * 1999-02-18 2002-11-05 ノキア モービル フォーンズ リミテッド 映像コーディング
JP2003032689A (ja) * 2001-07-18 2003-01-31 Sharp Corp 画像符号化装置、画像復号化装置及び動画像伝送システム

Also Published As

Publication number Publication date
CN101375602A (zh) 2009-02-25
CN101375602B (zh) 2012-03-21
EP1980115B1 (en) 2009-11-25
WO2007084994A3 (en) 2007-10-04
DE602007003441D1 (de) 2010-01-07
KR20080098042A (ko) 2008-11-06
EP1980115A2 (en) 2008-10-15
JP2009524364A (ja) 2009-06-25
ES2336039T3 (es) 2010-04-07
AR059105A1 (es) 2008-03-12
US20070177678A1 (en) 2007-08-02
ATE450118T1 (de) 2009-12-15
US8325822B2 (en) 2012-12-04
TW200737995A (en) 2007-10-01
WO2007084994A2 (en) 2007-07-26

Similar Documents

Publication Publication Date Title
JP4908522B2 (ja) 誤り隠蔽に関連する歪み値に基づいてエンコード方法を決定する方法および装置
KR101032017B1 (ko) 무선 비디오 통신에서 에러 리질리언스 알고리즘의 방법 및장치
US8509313B2 (en) Video error concealment
KR100587280B1 (ko) 오류 은폐방법
US20050265447A1 (en) Prediction encoder/decoder, prediction encoding/decoding method, and computer readable recording medium having recorded thereon program for implementing the prediction encoding/decoding method
US20060002466A1 (en) Prediction encoder/decoder and prediction encoding/decoding method
US8743970B2 (en) Video decoding with error detection and concealment
US20120281762A1 (en) System and method to process motion vectors of video data
KR101127432B1 (ko) 전처리기 방법 및 장치
WO2007084475A2 (en) Methods and apparatus for low complexity error resilient motion estimation and coding mode selection
Patel et al. Hybrid spatio-temporal error concealment technique for image/video transmission
Tsai et al. Video error concealment techniques using progressive interpolation and boundary matching algorithm
KR20030065694A (ko) 시공간적 정보를 이용한 인트라 프레임의 에러 은닉방법
JP4485409B2 (ja) 動画像復号装置
Kale et al. Real time error concealment in H. 264 video decoder for embedded devices
KR20080070242A (ko) 에러 은닉 장치 및 방법
Li et al. Adaptive partition size temporal error concealment for H. 264 using weighted double-sided EBME minimization
KR100689216B1 (ko) 서브블록을 이용한 인트라 프레임의 시간적인 오류은닉방법
Shin et al. An improved error concealment for mobile IPTV
Andrews et al. Test model 11 Purpose: Information
Andrews et al. Test model 12/Appendix II of H. 263 Version 3 Purpose: Information
MX2008009312A (en) Method and apparatus for error resilience algorithms in wireless video communication
KR20050099079A (ko) 동영상 복호화 시 에러 은닉 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111012

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111213

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120112

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150120

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4908522

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250