JP2009535881A - エンコード/トランスコード及びデコードのための方法及び装置 - Google Patents
エンコード/トランスコード及びデコードのための方法及び装置 Download PDFInfo
- Publication number
- JP2009535881A JP2009535881A JP2009507215A JP2009507215A JP2009535881A JP 2009535881 A JP2009535881 A JP 2009535881A JP 2009507215 A JP2009507215 A JP 2009507215A JP 2009507215 A JP2009507215 A JP 2009507215A JP 2009535881 A JP2009535881 A JP 2009535881A
- Authority
- JP
- Japan
- Prior art keywords
- information
- encoding
- image
- video
- video stream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 239000013598 vector Substances 0.000 claims description 39
- 238000001514 detection method Methods 0.000 claims description 27
- 230000006835 compression Effects 0.000 claims description 24
- 238000007906 compression Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 13
- 238000011084 recovery Methods 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000013139 quantization Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本発明は、エンコード/トランスコード及びデコードのための方法及び装置を提供し、エンコードのための方法は、ビデオ情報の複雑度が所定の閾値よりも小さい前記ビデオ情報の位置を識別するために利用される位置情報を取得するステップと、前記位置情報に基づいて、エンコードされたビデオストリームに所定のエラー情報を書き込み、前記ビデオ情報のエンコードを置換するステップと、を有する。本発明によれば、所定のエラー情報がエンコード/トランスコード側で書き込まれることができ、コードレートが効果的に減少させられる。一方で、該所定のエラー情報は、デコード側で容易に検出されることができ、エラーが隠蔽されることができる。このことは、ユーザがモバイル装置によってビデオファイルを再生する場合に帰着する画像の品質を保証する。
Description
本発明は、エンコード/トランスコード及びデコードのための方法及び装置に関し、特に、低減されたコードレートによるエンコード/トランスコード及びデコードのための方法及び装置に関する。
ディジタルテレビジョン(SDTV/HDTV)及びマルチメディアアプリケーションの一態様においては、種々の要件を満たすために、MPEG(Motion Picture Experts Group)、H.263及びQuicktime等のような、多くのビデオ圧縮規格が出現している。これらの規格の主な目的は、圧縮されたビデオストリームが、より低いビットレート及びより優れた画質を持つようにすることである。
高詳細度を持つビデオ情報を家庭でBlu-Rayディスクを用いて再生される場合のような幾つかの場合の用途においては、より優れた画質を得ることが重要となる。
しかしながら、例えばビデオ及びオーディオファイルがモバイル装置(モバイル電話のような)において再生される場合のような他の場合の用途においては、優れた画質を得ることよりも、ビットレートを低減させることのほうが重要である。通常、モバイル装置の記憶容量は非常に限られており、ビットレートが高過ぎると、ビデオ圧縮ファイルが大きくなり過ぎることとなり、ユーザのために再生されるために、モバイル装置内に十分なビデオ圧縮ファイルを記憶することが不可能となる。コードレートは画像フレーム複製により低減させられることができるが、コードレートの低減の割合は非常に限られており、画質も影響を受けることとなる。
それ故、より効果的にコードレートを低減させるためのエンコード/トランスコードの方法及び装置、並びにデコードの際に効果的に画像を復元するためのデコードの方法及び装置を提供するニーズがある。
本発明は、より効果的にコードレートを低減させるためのエンコード/トランスコード方法及び装置、並びにデコードの際に効果的に画像を復元するためのデコードの方法及び装置を提供する。
本発明の一実施例によれば、エンコードのための方法であって、ビデオ情報の複雑度が所定の閾値よりも小さい前記ビデオ情報の位置を識別するために利用される位置情報を取得するステップと、前記位置情報に基づいて、エンコードされたビデオストリームに所定のエラー情報を書き込み、前記ビデオ情報のエンコードを置換するステップと、
を有する方法が提供される。
を有する方法が提供される。
本発明の一実施例によれば、エンコードのための装置であって、ビデオ情報の位置を識別するために利用される位置情報を取得するための取得装置と、前記位置情報に基づいて、エンコードされたビデオストリームに所定のエラー情報を書き込み、前記ビデオ情報のエンコードを置換するための書き込み装置と、を有する装置が提供される。
本発明の一実施例によれば、デコードのための方法であって、圧縮されたビデオストリームにおける、エンコードのときに書き込まれるエラー情報に基づいて、置換ビデオ情報を決定するステップと、所定のエラー情報を前記置換ビデオ情報によって置換するステップと、を有する方法が提供される。
本発明の一実施例によれば、デコードのための装置であって、圧縮されたビデオストリームにおける、エンコードのときに書き込まれるエラー情報に基づいて、置換ビデオ情報を決定するための決定装置と、所定のエラー情報を前記置換ビデオ情報によって置換するための置換装置と、を有する装置が提供される。
本発明の一実施例によれば、第1の圧縮率でエンコードされたビデオストリームを、第2の圧縮率でエンコードされたビデオストリームへと変換するための、トランスコードのための方法であって、前記第1の圧縮率でエンコードされたビデオストリームを部分的にデコードするステップと、前記部分的にデコードされたビデオストリームに基づいて、ビデオ情報の複雑度が所定の閾値よりも小さい前記ビデオ情報の位置を識別するために利用される位置情報を取得するステップと、前記位置情報に基づいて、第2の圧縮率でエンコードされたビデオストリームに所定のエラー情報を書き込み、前記ビデオ情報のエンコードを置換するステップと、を有する方法が提供される。
本発明の一実施例によれば、第1の圧縮率でエンコードされたビデオストリームを、第2の圧縮率でエンコードされたビデオストリームへと変換するための、トランスコードのための装置であって、前記装置は、前記第1の圧縮率でエンコードされたビデオストリームを部分的にデコードするための部分デコード装置と、前記部分的にデコードされたビデオストリームを第2の圧縮率でエンコードして、部分的にエンコードされたビデオストリームを得るための部分エンコード装置と、を有し、前記部分エンコード装置は、ビデオ情報の位置を識別するために利用される位置情報を取得するための取得装置と、前記位置情報に基づいて、エンコードされたビデオストリームに所定のエラー情報を書き込み、前記ビデオ情報のエンコードを置換するための書き込み装置と、を有する装置が提供される。
本発明の一実施例によれば、エンコードのためのコンピュータプログラムであって、ビデオ情報の複雑度が所定の閾値よりも小さい前記ビデオ情報の位置を識別するために利用される位置情報を取得するためのコードと、前記位置情報に基づいて、エンコードされたビデオストリームに所定のエラー情報を書き込み、前記ビデオ情報のエンコードを置換するためのコードと、を有するコンピュータプログラムが提供される。
要約すると、本発明は、エンコード/トランスコード及びデコードのための方法及び装置を提供し、所定のエラー情報がエンコード/トランスコード側で書き込まれることができ、コードレートが効果的に減少させられる。一方で、該所定のエラー情報は、デコード側で容易に検出されることができ、エラーが隠蔽されることができる。このことは、ユーザがモバイル装置によってビデオファイルを再生する場合に帰着する画像の品質を保証する。
以下において、図面を参照しながら、本発明の説明及び請求の範囲を通して、本発明の他の目的及び効果が明らかとなり、本発明が完全に理解されるであろう。
全ての図面において、同一の参照は同一の、類似する又は対応する特徴又は機能を示す。
以下において、本発明の好適な実施例が、添付図面を参照しながら詳細に説明される。
本発明の一実施例によれば、本発明は、MPEG2規格によるエンコード/トランスコード及びデコードのための方法及び装置に関して詳細に説明される。本発明は、本発明の内容の範囲に基づいて、本発明の内容の範囲を逸脱することなく、H.263又はQuicktime規格のような他のタイプのエンコード/デコード規格に変更され適用され得ることは、当業者により理解されるであろう。
本発明の一実施例によれば、エンコードのための方法であって、ビデオ情報の複雑度が所定の閾値よりも小さい前記ビデオ情報の位置を識別するために利用される位置情報を取得するステップと、前記位置情報に基づいて、エンコードされたビデオストリームに所定のエラー情報を書き込み、前記ビデオ情報のエンコードを置換するステップと、を有する方法が提供される。
ここで、前記所定のエラー情報は、画像クラスエラー情報、スライスクラスエラー情報及びマクロブロッククラスエラー情報の、3つのタイプを有しても良い。該所定のエラー情報を書き込む前に、書き込みエラーの位置情報を取得することが必要とされ、該位置情報は特定の画像、スライス又はマクロブロックを識別するID情報であっても良い。
ここで、前記ビデオ情報の複雑度は、画像情報の動きベクトル複雑度、スライス及びマクロブロックの平滑度、並びにマクロブロックの動きベクトル複雑度を有しても良い。詳細な説明は以下のとおりである。
次いで、図1乃至3を参照しながら、3つのエンコード方法、即ち画像クラスエラー情報、スライスクラスエラー情報及びマクロブロッククラスエラー情報を書き込む方法のフロー図が、それぞれ説明される。
図1は、本発明の一実施例による、画像エラーを書き込む方法のフロー図である。
最初に、(MPEG2のような)所定の規格に従って、ビデオデータがエンコードされる。圧縮及びエンコードされる前に、生のビデオデータが処理され、Iフレーム、Pフレーム及びBフレームを形成し、更にパラメータ設定に基づいて特定のシーケンスを形成する。次いで、DCT変換、量子化、VCL及び動き予測、動き補償等のような幾つかの演算がこれらに対して実行され、詳細な説明は省略される。
ここでIフレームは、画像自体のフレームの情報のみに基づいてエンコードされ、Pフレームは、先行する隣接したIフレーム又はPフレームに基づいて予測エンコードされる。即ち、基準フレーム(Iフレーム又はPフレームのような)が最初に取得され、次いで該基準フレームに基づいて現在のフレーム(Pフレームのような)に対して動き推定が実行され、次いで現在のフレームの基準動きベクトルが算出される。Bフレームは、自身に基づいて、又は先行する又は後続するフレームに基づいて、予測エンコードされる。
ステップS120において、現在の画像がIフレームであるか否かが決定され、Iフレームである場合には、画像クラスエラーは現在の画像には書き込まれず、フローのA部(図2において詳細に示される)へと直接進む。
IフレームではなくPフレーム又はBフレームであると決定した後は、ステップS130において、現在の画像の動きベクトル複雑度が閾値を超えているか否かが決定される。該画像の動きベクトル複雑度は、平均二乗誤差により算出される。画像の現在のk番目のフレームの動きベクトル複雑度は、画像の現在のk番目のフレームの前方動きベクトル及び後方動きベクトルの平均二乗誤差σforward(Picture..[k])、σbackward(Picture..[k])を算出することにより決定される。
ここで、Mは、画像のk番目のフレームの幅方向に含まれるマクロブロックの数を示し、Nは、画像のk番目のフレームの高さ方向に含まれるマクロブロックの数を示し、画像のk番目のフレームの平均前方動きベクトル
及び平均後方動きベクトル
は、
となる。
ここで、MVforward(i,j)及びMVbackward(i,j)はそれぞれ、(i,j)番目のマクロブロックの前方動きベクトル及び後方動きベクトルである。
現在の画像の動きベクトルの複雑度は、所定の2つの閾値σlow及びσhighにより決定され、σforward(Picture..[k])<σlow且つσbackward(Picture..[k])<σlowである場合には、現在の画像の動きベクトルの複雑度が低いと決定され得る。σforward(Picture..[k])>σhigh且つσbackward(Picture..[k])>σhighである場合には、現在の画像が、高い複雑度を持つ動きベクトルとなる。これら2つの場合が共に満たされない場合には、現在の画像は、中間の複雑度を持つ動きベクトルとなる。
本発明の一実施例によれば、低い複雑度の動きベクトルを持つ画像にのみ、画像クラスエラーが書き込まれることが想定される。即ち、現在のフレームの画像ヘッダを書き込むことのみが必要とされ、対応するフレームの特定のビデオデータは確保されず、中間の及び高い複雑度の動きベクトルを持つ画像に画像クラスエラーを書き込むことは想定されず、それにより画像再生の品質に大きく影響を与えることを避ける。
本発明の一実施例によれば、閾値σlowの設定は、低減されたコードレートの割り当て量に基づいても良い。例えば、閾値σlowの大きさは、低減されたコードレートの割り当て量に正比例しても良い。
ステップS140において、動きベクトルの複雑度が低いと決定された画像に、画像クラスエラーが書き込まれる。該書き込まれるフレームエラーは、デコード側でエラー検出メカニズムによって検出され、次いでフレーム復元の方法により復元される。
ステップS150において、画像の次のフレームが処理されるか否かが決定される。画像の次のフレームが処理される場合にはステップS110へと進み、否であれば該フローは終了する。
図2は、本発明の一実施例による、スライスエラーを書き込む方法のフロー図である。
最初にステップS220において、現在のスライスが平滑なスライスであるか否かが決定され、平滑なスライスではない場合には、現在のスライスにはスライスクラスエラーが書き込まれないこととなり、フローのB部(図3において詳細に説明される)へと直接進む。
現在のスライスが平滑なスライスであるか否かは、現在のスライスに含まれる平滑なマクロブロックの数を算出することにより決定される。現在のスライスに含まれる平滑なマクロブロックの数が閾値を超える場合には、現在のスライスが平滑なスライスであるとみなされる。そうでなければ、現在のスライスは平滑なスライスとしてみなされない。
本発明の一実施例によれば、マクロブロックが平滑なマクロブロックであるか否かは、勾配を算出することにより決定される。エッジ検出が、画像における有意な局所的変化を検出する最も主要な演算である。1次元の場合には、ステップ状のエッジが、画像の1次導関数の局所的ピークに関連する。勾配は関数の変化の尺度であり、画像は画像強度連続関数のサンプリングスポットのアレイとみなされ得る。それ故、1次元の場合と同様に、画像のグレイスケール値の有意な変化は、離散的な勾配の近似関数によって検出され得る。
ここで角度θは、x軸に対する角度である。
本発明の一実施例によれば、画素スポットを中心とした円周を均等に分割することにより形成される16個の方向における勾配が算出され、ここで最大の勾配値Countermax及び最小の勾配値Counterminがとられる。
|Countermax−Countermin|>T1である場合、マクロブロックはエッジのマクロブロックであり、
T2<|Countermax−Countermin|<T1である場合、マクロブロックはテクスチャのマクロブロックであり、
|Countermax−Countermin|<T2である場合、マクロブロックは平滑なマクロブロックである。ここで、T1及びT2はそれぞれ、2つの所定の上限及び下限閾値である。
|Countermax−Countermin|>T1である場合、マクロブロックはエッジのマクロブロックであり、
T2<|Countermax−Countermin|<T1である場合、マクロブロックはテクスチャのマクロブロックであり、
|Countermax−Countermin|<T2である場合、マクロブロックは平滑なマクロブロックである。ここで、T1及びT2はそれぞれ、2つの所定の上限及び下限閾値である。
現在のスライスが平滑なスライスであると決定された場合には、ステップS240に進み、スライスクラスエラーが該現在のスライスに書き込まれる。即ち、スライスヘッダのみが確保され、関連するスライスデータは完全に若しくは部分的に破棄され、又は対応するスライスにおける特定のパラメータが不正な値に設定され、コードレートを低減させる。
スライスヘッダのみを確保する方式に対応して、デコーダは、既存のエラー検出モジュールを利用して、当該タイプのエラーを検出する。不正な値に設定される対応するパラメータに関しては、これらパラメータは特別なエラー処理メカニズムにより検出され得る。表1は、幾つかのパラメータの対応する正当な値を示す。例えば、エンコードの時点において、該表におけるSlice_star_codeは、0x00000101と0x000001AFとの間には設定されておらず、従ってデコード時に誤りが生じる。特定のエラーに従ってスライスデータが失われていることがデコード装置に既知となり、データ復元は必要とされない。
最後に、ステップS260において、次のスライスが処理されるか否かが決定される。次のスライスが処理される場合には、ステップS220にジャンプし、次のスライスが平滑なスライスである否かが決定される。そうでなければ、全体のフローが終了する。
図3は、本発明の一実施例による、マクロブロックエラーを書き込む方法のフロー図である。
ステップS320において、現在のマクロブロックのタイプが平滑なマクロブロックであるか否かが決定され、平滑なマクロブロックでない場合には、ステップS380へと直接ジャンプし、次のマクロブロックが処理されるか否かが決定される。現在のマクロブロックのタイプが平滑なマクロブロックである場合には、ステップS340へと進み、現在のマクロブロックの動きベクトル複雑度が閾値を超えているか否かが決定される。現在のマクロブロックの動きベクトル複雑度を決定する方法は、図1におけるステップS130におけるものと同様であり、同じ説明は不要である。
現在のマクロブロックの動きベクトル複雑度が閾値を超えていると決定された場合、ステップS380へと直接ジャンプし、次のマクロブロックが処理されるか否かが決定される。
現在のマクロブロックの動きベクトル複雑度が閾値以下であると決定された場合、フローはステップS360に進み、マクロブロッククラスエラーが現在のマクロブロックに書き込まれる。例えば、動きベクトル圧縮規格の可変長コードテーブルにおいて定義された、不正な短い可変長コードが、正当な長い可変長コードを置換するために利用され(例えば「0b0000111」を「0b111」で置換する)、それによりコードレートを低減させる。
本発明の一実施例によれば、書き込まれた画像クラスエラーは、主に2つの種類に分類される。一方は、現在の画像の画像ヘッダのみを保持し、対応する画像データの全て又は一部を破棄するものである。この種類のエラーは、特殊なエラー検出メカニズムなしでデコーダ側で容易に検出され得るものであり、次いで対応するフレーム回復方法を用いてエラー隠蔽が実行される。他方は、MPEG規格における幾つかの関連するパラメータを不正な値に設定することであり、この種類のエラーは、特殊なエラー処理メカニズムを追加した後に検出される。例えば、picture_start_codeは「0x00000100」であり、「0x000001FF」に設定され、次いで書き込み画像エラーとみなされる。picture_coding_typeは「0b001」であり、このことは該画像がIフレームであることを示し、該値が「0b101」に設定される場合には、同様に書き込み画像エラーとみなされる。
実際的な状況を考えると、画像ヘッダ中のパラメータは、デコーダ側のエラー検出メカニズムの能力に依存して、それぞれ不正な値か又は他の値に変換される。例えば、画像におけるパラメータpicture_coding_typeに関しては、特別なエラー検出メカニズムがない場合には、該パラメータは正確に検出されず、最終的な画像の影響は悪化する。特別なエラー検出メカニズムがある場合には、該パラメータは正確に検出され、最終的な画像の影響は良くなる。
最後に、ステップS380において、次のマクロブロックが処理されるか否かが決定される。次のマクロブロックが処理される場合には、ステップS320にジャンプし、次のマクロブロックが平滑なマクロブロックであるか否かが決定される。そうでなければ、全体のフローが終了する。
図4は、本発明の一実施例による、エンコードのための装置の模式的な構造図である。
エンコードのための装置400は、取得装置410及び書き込み装置420を含む。取得装置410は、位置情報を取得するために利用される。該位置情報は、ビデオ情報の位置を特定するために利用される。書き込み装置420は、前記位置情報に基づいて、所定のエラー情報を、エンコードされたストリームに書き込み、前記ビデオ情報のエンコードを置換するために利用される。
本発明の一実施例によれば、取得装置410は、コードレートを低減させるため、画像クラスエラー情報が、画像のフレームに書き込まれるのに適切なものであるか否かを検出するための、画像検出装置412を有する。
本発明の一実施例によれば、画像検出装置412は最初に、画像の現在のフレームがIフレームであるか否かを検出し、Iフレーム画像については、画像クラスエラー情報を書き込むことは想定されず、Pフレーム及びBフレームについてのみ、画像クラスエラー情報を書き込むことが想定される。
Pフレーム及びBフレームについては、画像検出装置412は次いで、画像のフレームの動きベクトル複雑度を検出し、該画像のフレームの動きベクトル複雑度が所定の閾値を超えている場合には、画像クラスエラー情報を書き込むことは想定されず、スライスエラー又はマクロブロッククラスエラーを書き込むことのみが想定される。該画像のフレームの動きベクトル複雑度が所定の閾値以下である場合には、画像クラスエラー情報を書き込むことが想定される。
取得装置410は更に、コードレートを低減させるために、スライスクラスエラー情報がスライスに書き込まれるのに適切なものであるか否かを検出するための、スライス検出装置416を有する。
所定の閾値を超える動きベクトル複雑度を持つPフレーム及びBフレームの画像については、スライス検出装置416は、スライスクラスエラー情報が該画像の各スライスに書き込まれるか否かを検出する。現在のスライスが平滑なスライスであるか否かが、現在のスライスに含まれる平滑なマクロブロックの数を算出することにより決定される。現在のスライスに含まれる平滑なマクロブロックの数が閾値を超える場合には、現在のスライスは平滑なスライスであるとみなされる。
取得装置410は更に、マクロブロッククラスエラーがマクロブロックに書き込まれるのに適切なものであるか否かを検出するための、マクロブロック検出装置418を有し、マクロブロックに対応する可変長符号化が、コードレートを低減させるため、より短い不正な符号化により置換される。
マクロブロック検出装置418は最初に、現在のマクロブロックのタイプが平滑なマクロブロックであるか否かを決定し、平滑なマクロブロックではない場合には、マクロブロック検出装置418は、現在のマクロブロックの動きベクトル複雑度が閾値を超えているか否かを決定する。現在のマクロブロックの動きベクトル複雑度を決定する方法は、図1におけるステップS130におけるものと同様であり、同じ説明は不要である。
要約すると、画像検出装置412/スライス検出装置416/マクロブロック検出装置418により検出された後、画像/スライス/マクロブロックの対応する位置情報が取得され得、該位置情報に対応する画像/スライス/マクロブロックが、コードレートを低減させるために、所定のエラーに書き込まれるのに適したものとなる。
その後、本発明の一実施例によれば、上述した取得装置410により取得された位置情報に基づいて、書き込み装置420は所定のエラー情報を書き込み(例えば、より短い可変長コードをビデオストリームにエンコードする)、該位置情報に対応するビデオ情報を置換するか、又は2つのヘッダデータ間のビデオデータを直接に破棄して、それによりデコードのための装置が、当該位置におけるデータが特定のエラーに基づいて失われたこと及びデータ回復が必要であることを知ることができる。ここで、書き込み装置420は、前記所定のエラー情報を、圧縮されたビデオストリームに書き込む。書き込み装置420が可変長符号化装置470に含まれても良いことは、当業者に理解されるであろう。
エンコードのための装置400はまた、離散コサイン変換装置(本図におけるDCT)450、量子化器(本図におけるQ)、可変長符号化装置(本図におけるVLC)470、動き推定装置(本図におけるME)480、及び動き補償装置(本図におけるMC)490を含む。
ここで、離散コサイン変換装置450は、生のビデオ画像シーケンスを受信するために利用され、離散コサイン変換を実行し、その結果のDCT係数に対して、量子化器460が、要求に応じて種々の量子化レベルを設定するために利用され、これによりコードレートを低減させる。量子化の後にのみ、特に人間の目の物理的な特性に従って、低周波成分と高周波成分とで異なる量子化を設定することによって、高周波成分の殆どの係数がゼロとなる。一般に、人間の目は低周波成分に敏感であり、高周波成分にはそれ程敏感ではない。それ故、低周波成分は細かく量子化され、高周波成分は粗く量子化されることとなる。
可変長符号化装置470は、量子化器460により供給された量子化の大きさに従って、ハフマン(Huffman)符号のような可変長コードへと量子化係数を変換する。
動き推定装置480は、フレーム記憶部(図には示されていない)から(Iフレーム又はPフレームのような)基準フレームを取得し、該基準フレームに基づいて(Pフレームのような)現在のフレームに対して動き推定を実行し、それによって計算により現在のフレームの基準動きベクトルを取得するために利用される。動き補償装置490は、予測モード及び基準動きベクトルに従って、基準フレームを変位させ、それにより現在のフレームを予測するために利用される。予測の動きの当該処理は先行技術におけるものと同様であり、詳細な説明は省かれる。
本発明の一実施例によれば、図4に示されたエンコードための装置400の機能の全て又は一部は、適切にプログラムされたコンピュータによって実現されることもでき、該コンピュータにはエンコードのためのコンピュータプログラムがロードされる。該コンピュータプログラムは、ビデオ情報の複雑度が所定の閾値よりも小さい前記ビデオ情報の位置を識別するために利用される位置情報を取得するためのコードと、前記位置情報に基づいて、エンコードされたビデオストリームに所定のエラー情報を書き込み、前記ビデオ情報のエンコードを置換するためのコードと、を含む。
上述したコンピュータプログラムは、記憶媒体に保存されても良い。
上述したコンピュータプログラムのコードのこれら部分は、機械を形成するプロセッサへと供給されても良く、これにより該プロセッサに実装されるコードが、上述した機能を実現する装置を形成する。
本発明の一実施例によるエンコードのための装置は、第1の圧縮率でエンコードされたビデオストリームを第2の圧縮率でエンコードされたビデオストリームへと変換するための、トランスコードのための装置において適用されても良いことは、当業者には理解されるであろう。例えば、所定のエラー情報が書き込まれていない圧縮されたビデオストリームが部分的にデコードされ、次いで、所定のエラー情報に書き込むために、本発明の一実施例による部分エンコード装置により再エンコードされても良い。
図5は、本発明の一実施例による、トランスコードのための装置の模式的な構造図である。
トランスコードのための装置500は、取得装置510及び書き込み装置520を含む。取得装置510は、画像検出装置512、スライス検出装置516及びマクロブロック検出装置518を有する。上述したそれぞれの手段の機能は、図4に示された取得装置410、書き込み装置420、画像検出装置412、スライス検出装置416及びマクロブロック検出装置418の機能と同様であり、同じ説明は不要である。
トランスコードのための装置500は更に、可変長デコード装置(本図におけるVLD)530及び逆量子化器(本図におけるIQ)540を含む。対応するデコードの機能は、図4におけるエンコードのための装置400の可変長エンコード装置470及び量子化器460に対応し、同じ説明は不要である。
スライス及びマクロブロックの検出においてはエンコードのための装置400とは異なり、エンコードのための装置400は、スライス及びマクロブロックの検出を画像の空間ドメインで実行しているが、トランスコードのための装置500は、逆量子化された後に、主にDCTドメイン(即ち周波数ドメイン)においてDC係数及びAC係数に対して検出を実行する。画像検出は、可変長デコードされた後に、動きベクトルに対して解析及び検出することである。
ここで、可変長デコード装置530及び逆量子化器540は合わせて、第1の圧縮率でエンコードされたビデオストリームを部分的にデコードするための、トランスコードのための装置500における部分デコード装置(本図においては点線のブロックにおいて示される)を形成する。
トランスコードのための装置500は更に、取得装置510及び書き込み装置520と共に、量子化器(本図におけるQ1)550及び可変長エンコード装置(本図におけるVLC)560を含み、所定のエラーを含むビデオストリームを得るために、部分的にデコードされたビデオストリームを第2の圧縮率で再エンコードするための、トランスコードのための装置500における部分エンコード装置(本図において点線のブロックにおいて示される)を形成する。
図6は、本発明の一実施例による、デコードのための装置の模式的な構造図である。
デコードのための装置600は、フレーム間の相関を利用して時間冗長性を低減させるための、動き補償装置610を含む。動き補償は本発明の重要点ではないため、動き補償の技術の関連する詳細は詳細には説明されない。
動き補償装置610は、エラー回復装置620を含み、エラー回復装置620は、エンコードのための装置400又はトランスコードのための装置500により書き込まれた所定のエラー情報を置換するための置換ビデオ情報を決定する。エラー回復装置620は、所定のエラー情報を取得するための取得装置622を含み、該所定のエラー情報は、ビデオストリームがエンコードのための装置400又はトランスコードのための装置500によりエンコードされるときに、ビデオストリームに書き込まれる。ここで、取得装置622が、エラー検出装置であっても良い。
エラー回復装置620は更に、置換ビデオ情報を決定するための決定装置624を含んでも良く、決定のための方法が、基準フレームにおける特定の位置におけるビデオ情報を該置換ビデオ情報として利用しても良い。
エラー回復装置620は更に、所定のエラー情報の位置を、決定された置換ビデオ情報で充填するための充填装置626を含んでも良い。換言すれば、決定装置624と充填装置626とが、エラー隠蔽として定義される装置へと併合されても良く、該装置が関連するエラーを解析し、エラー隠蔽の方式を決定し、エラー隠蔽の動作を実行する。
デコードのための装置600は更に、可変長デコード装置(本図におけるVLD)660、逆量子化器(本図におけるIQ)670及び逆離散コサイン変換装置(本図におけるIDCT)680を含んでも良い。対応するデコードの機能は、図4におけるエンコードのための装置400の可変長エンコード装置470、量子化器460及び離散コサイン変換装置450に対応し、同じ説明は不要である。
圧縮ビデオストリームが可変長デコード装置660によりデコードされた後、取得装置522は所定のエラー情報を取得し、決定装置624は、該所定のエラー情報に基づいて、対応する方法によって該所定のエラー情報の復元を決定する。
次いで、充填装置626が、失われたマクロブロックの位置を、決定された置換マクロブロックによって充填する。最後に、エラー回復の後のビデオ画像シーケンスが出力され、表示装置(図には示されていない)によりユーザに提示される。
本発明において開示されたエンコード/トランスコード及びデコードのための方法及び装置は、本発明の内容から逸脱することなく変更され得ることは、当業者には理解されるべきである。それ故、本発明の保護範囲は、添付される請求項の内容によって限定されるべきである。
Claims (15)
- エンコードのための方法であって、
(a)ビデオ情報の複雑度が所定の閾値よりも小さい前記ビデオ情報の位置を識別するために利用される位置情報を取得するステップと、
(b)前記位置情報に基づいて、エンコードされたビデオストリームに所定のエラー情報を書き込み、前記ビデオ情報のエンコードを置換するステップと、
を有する方法。 - 前記ステップ(a)は、画像の複雑度の特性を検出して前記画像の位置情報を取得するステップを含み、前記ステップ(b)は、前記画像の位置情報に基づいて、エンコードされたビデオストリームに所定のエラー情報を書き込み、前記画像のエンコードを置換するステップを含む、請求項1に記載の方法。
- 前記画像の複雑度の特性は、前記画像の動きベクトル複雑度である、請求項2に記載の方法。
- 前記ステップ(a)は、マクロブロックの複雑度の特性を検出して前記マクロブロックの位置情報を取得するステップを含み、前記ステップ(b)は、前記マクロブロックの位置情報に基づいて、エンコードされたビデオストリームに所定のエラー情報を書き込み、前記マクロブロックのエンコードを置換するステップを含む、請求項1に記載の方法。
- 前記マクロブロックの複雑度の特性は、前記マクロブロックの平滑度情報である、請求項4に記載の方法。
- エンコードのための装置であって、
ビデオ情報の位置を識別するために利用される位置情報を取得するための取得装置と、
前記位置情報に基づいて、エンコードされたビデオストリームに所定のエラー情報を書き込み、前記ビデオ情報のエンコードを置換するための書き込み装置と、
を有する装置。 - 前記取得装置は、画像の複雑度の特性を検出して前記画像の位置情報を取得するための画像検出装置を含み、
前記書き込み装置は、前記画像の位置情報に基づいて、エンコードされたビデオストリームに所定のエラー情報を書き込み、前記画像のエンコードを置換するために利用される、
請求項6に記載の装置。 - 前記画像の複雑度の特性は、前記画像の動きベクトル複雑度である、請求項7に記載の装置。
- 前記取得装置は、マクロブロックの複雑度の特性を検出して前記マクロブロックの位置情報を取得するためのマクロブロック検出装置を含み、
前記書き込み装置は、前記マクロブロックの位置情報に基づいて、エンコードされたビデオストリームに所定のエラー情報を書き込み、前記マクロブロックのエンコードを置換するために利用される、
請求項6に記載の装置。 - 前記マクロブロックの複雑度の特性は、前記マクロブロックの平滑度情報である、請求項9に記載の装置。
- デコードのための方法であって、
圧縮されたビデオストリームにおける、エンコードのときに書き込まれるエラー情報に基づいて、置換ビデオ情報を決定するステップと、
所定のエラー情報を前記置換ビデオ情報によって置換するステップと、
を有する方法。 - デコードのための装置であって、
圧縮されたビデオストリームにおける、エンコードのときに書き込まれるエラー情報に基づいて、置換ビデオ情報を決定するための決定装置と、
所定のエラー情報を前記置換ビデオ情報によって置換するための置換装置と、
を有する装置。 - 第1の圧縮率でエンコードされたビデオストリームを、第2の圧縮率でエンコードされたビデオストリームへと変換するための、トランスコードのための方法であって、
前記第1の圧縮率でエンコードされたビデオストリームを部分的にデコードするステップと、
前記部分的にデコードされたビデオストリームに基づいて、ビデオ情報の複雑度が所定の閾値よりも小さい前記ビデオ情報の位置を識別するために利用される位置情報を取得するステップと、
前記位置情報に基づいて、第2の圧縮率でエンコードされたビデオストリームに所定のエラー情報を書き込み、前記ビデオ情報のエンコードを置換するステップと、
を有する方法。 - 第1の圧縮率でエンコードされたビデオストリームを、第2の圧縮率でエンコードされたビデオストリームへと変換するための、トランスコードのための装置であって、前記装置は、
前記第1の圧縮率でエンコードされたビデオストリームを部分的にデコードするための部分デコード装置と、
前記部分的にデコードされたビデオストリームを第2の圧縮率でエンコードして、部分的にエンコードされたビデオストリームを得るための部分エンコード装置と、
を有し、前記部分エンコード装置は、
前記部分的にデコードされたビデオストリームに基づいて、ビデオ情報の複雑度が所定の閾値よりも小さい前記ビデオ情報の位置を識別するために利用される位置情報を取得するための取得装置と、
前記位置情報に基づいて、エンコードされたビデオストリームに所定のエラー情報を書き込み、前記ビデオ情報のエンコードを置換するための書き込み装置と、
を有する装置。 - エンコードのためのコンピュータプログラムであって、
ビデオ情報の複雑度が所定の閾値よりも小さい前記ビデオ情報の位置を識別するために利用される位置情報を取得するためのコードと、
前記位置情報に基づいて、エンコードされたビデオストリームに所定のエラー情報を書き込み、前記ビデオ情報のエンコードを置換するためのコードと、
を有するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200610077155 | 2006-04-27 | ||
PCT/IB2007/051405 WO2007125458A2 (en) | 2006-04-27 | 2007-04-19 | Method and apparatus for encoding/transcoding and decoding |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009535881A true JP2009535881A (ja) | 2009-10-01 |
Family
ID=38610679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009507215A Withdrawn JP2009535881A (ja) | 2006-04-27 | 2007-04-19 | エンコード/トランスコード及びデコードのための方法及び装置 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP2014099A2 (ja) |
JP (1) | JP2009535881A (ja) |
TW (1) | TW200743386A (ja) |
WO (1) | WO2007125458A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102595123A (zh) * | 2011-01-14 | 2012-07-18 | 华为技术有限公司 | 条带编码方法及装置、条带解码方法及装置 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009164880A (ja) * | 2008-01-07 | 2009-07-23 | Mitsubishi Electric Corp | トランスコーダ及び受信機 |
US8230744B2 (en) | 2009-05-06 | 2012-07-31 | Cequr Sa | Low-dead volume microfluidic circuit and methods |
CN101951504B (zh) | 2010-09-07 | 2012-07-25 | 中国科学院深圳先进技术研究院 | 基于重叠边界的多媒体切片转码方法和系统 |
CN110753240B (zh) * | 2018-07-24 | 2022-04-05 | 视联动力信息技术股份有限公司 | 一种基于视联网的转码控制方法及装置 |
CN111010575B (zh) * | 2019-12-17 | 2022-08-02 | 北京数码视讯科技股份有限公司 | 一种码流容错的方法及装置、可读存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030012287A1 (en) * | 2001-03-05 | 2003-01-16 | Ioannis Katsavounidis | Systems and methods for decoding of systematic forward error correction (FEC) codes of selected data in a video bitstream |
JP4193406B2 (ja) * | 2002-04-16 | 2008-12-10 | 三菱電機株式会社 | 映像データ変換装置および映像データ変換方法 |
US7391809B2 (en) * | 2003-12-30 | 2008-06-24 | Microsoft Corporation | Scalable video transcoding |
WO2005065030A2 (en) * | 2004-01-08 | 2005-07-21 | Videocodes, Inc. | Video compression device and a method for compressing video |
JP2005348093A (ja) * | 2004-06-03 | 2005-12-15 | Sony Corp | 画像処理装置、そのプログラムおよびその方法 |
RU2377737C2 (ru) * | 2004-07-20 | 2009-12-27 | Квэлкомм Инкорпорейтед | Способ и устройство для преобразования с повышением частоты кадров с помощью кодера (ea-fruc) для сжатия видеоизображения |
-
2006
- 2006-05-12 TW TW095116907A patent/TW200743386A/zh unknown
-
2007
- 2007-04-19 EP EP07735542A patent/EP2014099A2/en not_active Withdrawn
- 2007-04-19 WO PCT/IB2007/051405 patent/WO2007125458A2/en active Application Filing
- 2007-04-19 JP JP2009507215A patent/JP2009535881A/ja not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102595123A (zh) * | 2011-01-14 | 2012-07-18 | 华为技术有限公司 | 条带编码方法及装置、条带解码方法及装置 |
CN102595123B (zh) * | 2011-01-14 | 2014-06-04 | 华为技术有限公司 | 条带编码方法及装置、条带解码方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
TW200743386A (en) | 2007-11-16 |
WO2007125458A3 (en) | 2008-01-10 |
EP2014099A2 (en) | 2009-01-14 |
WO2007125458A2 (en) | 2007-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8649431B2 (en) | Method and apparatus for encoding and decoding image by using filtered prediction block | |
EP1021042B1 (en) | Methods of scene change detection and fade detection for indexing of video sequences | |
JP4565010B2 (ja) | 画像復号装置および画像復号方法 | |
JP5508534B2 (ja) | シーン切替検出 | |
KR100989296B1 (ko) | 아티팩트 평가를 통한 향상된 이미지/비디오 품질 | |
US8718138B2 (en) | Image encoding apparatus and image encoding method that determine an encoding method, to be used for a block to be encoded, on the basis of an intra-frame-prediction evaluation value calculated using prediction errors between selected reference pixels and an input image | |
US6327390B1 (en) | Methods of scene fade detection for indexing of video sequences | |
US9270993B2 (en) | Video deblocking filter strength derivation | |
US20100027905A1 (en) | System and method for image and video encoding artifacts reduction and quality improvement | |
US20150312575A1 (en) | Advanced video coding method, system, apparatus, and storage medium | |
US20090097546A1 (en) | System and method for enhanced video communication using real-time scene-change detection for control of moving-picture encoding data rate | |
JP2009535881A (ja) | エンコード/トランスコード及びデコードのための方法及び装置 | |
JP2005510149A (ja) | イントラコード化ピクチャを検出し、圧縮されていないデジタルビデオからイントラdc制度及びマクロブロックコーディングパラメタを抽出する方法及びシステム | |
US20150249829A1 (en) | Method, Apparatus and Computer Program Product for Video Compression | |
JP2007336468A (ja) | 再符号化装置、再符号化方法およびプログラム | |
US20120207212A1 (en) | Visually masked metric for pixel block similarity | |
JP5748225B2 (ja) | 動画像符号化方法,動画像符号化装置および動画像符号化プログラム | |
US20150195524A1 (en) | Video encoder with weighted prediction and methods for use therewith | |
US9055292B2 (en) | Moving image encoding apparatus, method of controlling the same, and computer readable storage medium | |
US20070025438A1 (en) | Elastic storage | |
US20120281761A1 (en) | System and Method for Macroblock Transcoding | |
US8126277B2 (en) | Image processing method, image processing apparatus and image pickup apparatus using the same | |
CN114760467A (zh) | 编码模式的确定方法及装置 | |
US20120133836A1 (en) | Frame level quantization estimation | |
JP6313614B2 (ja) | 動画像符号化装置及びその制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20100706 |