JP2014509481A - シーケンス内の画像の圧縮 - Google Patents

シーケンス内の画像の圧縮 Download PDF

Info

Publication number
JP2014509481A
JP2014509481A JP2013552229A JP2013552229A JP2014509481A JP 2014509481 A JP2014509481 A JP 2014509481A JP 2013552229 A JP2013552229 A JP 2013552229A JP 2013552229 A JP2013552229 A JP 2013552229A JP 2014509481 A JP2014509481 A JP 2014509481A
Authority
JP
Japan
Prior art keywords
image
images
uncompressed
sequence
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013552229A
Other languages
English (en)
Inventor
フラミング,ルート
Original Assignee
アルファリス・ソシエテ・ア・レスポンサビリテ・リミテ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アルファリス・ソシエテ・ア・レスポンサビリテ・リミテ filed Critical アルファリス・ソシエテ・ア・レスポンサビリテ・リミテ
Publication of JP2014509481A publication Critical patent/JP2014509481A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/507Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction using conditional replenishment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明は、シーケンスで動画を構成するようにシーンを描写する画像のシーケンスを処理する方法及びシステムに関する。この方法は、後続の画像を個々に前処理して、前処理された画像のシーケンスを得るステップと、個々の画像が符号化されることなく通過することを定期的に可能にし、シーケンスにおける未圧縮の画像間の中間画像を、これらの中間画像を差分と置き換えることによって符号化することによって、前処理された画像の圧縮のために符号化するステップとを含む。この方法は、中間画像の符号化の前に、中間画像のうちの少なくとも1つにおいて、中間画像が変化していないか又は少なくとも大幅に変化していないエリアを識別するステップと、識別されたエリアを、最も近時に通過した未圧縮の画像からの対応するエリアに置き換えるステップとを更に含む。
【選択図】図9および図10

Description

本発明は、それぞれ請求項1及び15のプリアンブルに記載の画像のシーケンスを処理して送信する方法、及び/又は、画像のシーケンスを記録する方法及びデータを圧縮する方法、並びに画像のシーケンスを処理して送信するシステムに関する。
そのような方法及びシステムは、一般に知られている。例えば、標準規格MPEG2、MPEG4、mjpeg、H.26X、並びに以下の特定の非限定的な例としてH.264及びX.264、並びに他の多くのアルゴリズム及び標準規格も、シーケンス内の後続の画像における情報の冗長性に基づく、記録又は送信のためのビットストリームの圧縮に依拠している。ほとんどの場合、そのような標準規格及びアルゴリズムによれば、そのような冗長性は、現在の画像内の情報の量を差分情報のみに削減することによって利用される。この差分情報は、その現在の画像内のピクセルとシーケンス内の先行する画像又は今後の画像内の対応するピクセルとの間の差分にのみ関する情報を提供するものである。そのような標準規格及びアルゴリズムによれば、未圧縮画像が記録又は送信される。この画像は、幾つかの刊行物ではIフレームと呼ばれる場合がある一方、中間の圧縮画像は、多くの場合、Pフレーム又はBフレームと呼ばれる。ただし、本発明は、そのような表現にも特徴にも限定されるものではない。
従来技術の方法及びシステムは、依然として、いずれの送信又は記録の方法及び/又はシステムについてもかなりの負荷を呈する。なぜならば、既知の方法に起因する情報の量及び既知のシステムに由来する情報の量は、依然としてかなりのものであり、特に帯域幅が乏しく、場合によっては、例えば、監視によって取得された画像を記録又はより好ましくは制御室等に直ちに送信する必要がある監視カメラの場合のようにリモートでありうる使用分野では、依然として少なくともネットワーク、レコーダ及び送信機の過負荷の一因となる場合がある。一方、本発明は、そのようないずれの適用分野にも特に制限されない。なぜならば、好ましくは画質の劣化が全くないか又は少なくとも更なる画質の劣化若しくは追加の画質の劣化がないデータ圧縮又は少なくとも削減が、デジタル化された画像の処理及び記録又は送信のいずれの使用分野においても常に目的であるからである。
本発明は、従来技術の方法及びシステムの不都合を改善又は少なくとも軽減するとともに、データ圧縮及び/又は削減を更に(一層)改良することを目的として開発された。そのため、本発明は、それぞれ請求項1及び15の特徴部の顕著な特徴を有する方法及びシステムに関する。
本発明は、カメラ、若しくはカメラに接続されたコンピュータ等の画像処理構成物、又は画像を記録するためのカメラ以外の任意のデバイスに具現化することができることに留意されたい。得られた画像のストリームは、(ハード)ディスク又は他の記録担体に記録することもできるし、ネットワークを介して送信することもできる。このネットワークは、無線とすることができる。
本発明は、従来技術による差分画像処理が送信又は記録のための最大のデータ圧縮及び/又は削減を実用的に既に提供していると広く支持された確信に反するものである。
しかしながら、それにもかかわらず、本発明によれば、特に、画像のシーケンスが、当該画像のシーケンスによる描写シーンにおいて変化をほとんど含まない場合、かなりの利得が達成可能である。
本発明による方法及びシステムは、多くの好ましい実施の形態を有することができ、これらの実施の形態のうちの選択したもののみが、従属請求項に規定されている。
加えて、本発明による方法及びシステムは、例えば、中間画像内のエリア及び未圧縮の画像内のエリアが、サイズが一致しているという特徴を示すことができる。これによって、未圧縮の画像の画像エリアと中間(以下では、現在と呼ばれる場合がある)画像の画像エリアとの比較が容易になる。
加えて及び/又は一代替形態として、本発明による方法及びシステムは、例えば、未圧縮の画像及び中間画像が整数個のエリアを含むという特徴を示すことができる。
加えて及び/又は一代替形態として、本発明による方法及びシステムは、例えば、エリアが、20×15ピクセル、24×18ピクセル、及び32×32ピクセルを含む群からのサイズのうちの1つであるサイズを有するという特徴を示すことができる。以下に説明する用途では、32×32のエリアサイズが好ましいが、他の用途では、代替的なサイズが好ましい場合がある。
加えて及び/又は一代替形態として、本発明による方法及びシステムは、例えば、エリアを、可能なサイズを有する長方形にグループ化することができるという特徴を示すことができる。この可能なサイズは、20×15ブロック又は24×18ブロックのうちの一方であるが、これらの値に限定されるものではない。
加えて及び/又は一代替形態として、本発明による方法及びシステムは、例えば、中間画像が最も近時に通過した未圧縮の画像に対して変化していないか又は少なくとも大幅に変化していないエリアを識別することは、中間画像と、元の画像の形態の未圧縮の画像とを比較することを含むという特徴を示すことができる。
加えて及び/又は一代替形態として、本発明による方法及びシステムは、例えば、中間画像が最も近時に通過した未圧縮の画像に対して変化していないか又は少なくとも大幅に変化していないエリアを識別することは、中間画像と、輝度チャネルの未圧縮の画像とを比較することを含むという特徴を示すことができる。
加えて及び/又は一代替形態として、本発明による方法及びシステムは、例えば、中間画像が最も近時に通過した未圧縮の画像に対して変化していないか又は少なくとも大幅に変化していないエリアを識別することは、中間画像と、彩度チャネルのうちの少なくとも1つの未圧縮の画像とを比較することを含むという特徴を示すことができる。
加えて及び/又は一代替形態として、本発明による方法及びシステムは、例えば、中間画像が最も近時に通過した未圧縮の画像に対して変化していないか又は少なくとも大幅に変化していないエリアを識別することは、中間画像と、未圧縮の画像とをエリアごとに比較することを含むという特徴を示すことができる。
加えて及び/又は一代替形態として、本発明による方法及びシステムは、例えば、中間画像が最も近時に通過した未圧縮の画像に対して変化していないか又は少なくとも大幅に変化していないエリアを識別することは、中間画像と未圧縮の画像とを統計的解析方法を用いて比較することを含むという特徴を示すことができる。
加えて及び/又は一代替形態として、本発明による方法及びシステムは、例えば、中間画像が最も近時に通過した未圧縮の画像に対して変化していないか又は少なくとも大幅に変化していないエリアを識別することは、中間画像及び未圧縮の画像の少なくとも関連のあるエリア間の差分を規定することと、差分を所定の閾値と比較することと、差分が閾値未満である場合に、エリアが置き換えられるべきであると判定することとを含むという特徴を示すことができる。
差分と、その差分を閾値と比較することとを伴うそのような好ましい実施の形態では、本発明による方法及びシステムは、例えば、差分が、輝度チャネル及び彩度チャネルのうちの少なくとも一方における1つのエリア内でのピクセルごとの比較に基づく関数を含むという特徴を示すことができる。
差分を規定する関数を伴うそのような好ましい実施の形態では、本発明による方法及びシステムは、例えば、この関数において光沢(sparkles)又は反射の影響を抑制するという特徴を示すことができ、ここで、この関数は、光沢補償係数を含む。
差分を規定する関数を伴うそのような好ましい実施の形態では、本発明による方法及びシステムは、例えば、この関数において照明の変化又はカメラが誘発したホワイトバランスの変化の影響を抑制するという特徴を示すことができ、ここで、この関数は、照明及びホワイトバランスの正規化係数を含む。
差分を規定する関数を伴うそのような好ましい実施の形態では、本発明による方法及びシステムは、例えば、この関数においてカメラが誘発したカラーバランスの変化の影響を抑制するという特徴を示すことができ、ここで、この関数は、カラーバランスの正規化係数を含む。
本発明は、図面に示されるとともに図面及び特定のアルゴリズム又は標準規格を参照することによって説明されるような本発明の特定の実施形態を参照して以下に明らかにされる。しかしながら、その図面も説明も、本発明の保護の範囲に対する限定として解釈されるべきではなく、本発明は、結局のところ、添付の特許請求の範囲において排他的に規定される。
符号化及びその結果得られるデータ削減圧縮(data compression of reduction)が実行される際に従うレベル及びプロファイルへの、本発明を用いることができる一例示のプロトコルの分割を示す図である。 シーンを描写する画像の分割と、輝度(Y)平面と2つの色差平面(彩度Cr及び彩度Cb)とに画像を分割する方法とを示す図である。 幾つかの従来のマクロブロックを含むエリア(本明細書において「スーパブロック」と呼ばれる場合がある)への画像の、本発明による分割と、それらのエリアへの彩度ブロックのオプションの追加とを示す図である。 8×8ピクセルブロックからのjpegビットストリームの従来の生成方法を一般的に示す図である。 フレームのシーケンス内に配列されている未圧縮のIフレーム画像並びに圧縮されたPフレーム画像及びBフレーム画像の構成を示す図である。 Iフレーム、Pフレーム及びBフレームの間の相互関係を示す図である。 従来のデータ圧縮におけるシーン(の一部分)の移動を補償する従来のベクトル適応を示す図である。 輝度平面における現在の画像(処理及び圧縮される)と直前の先行するフル(Iフレーム)画像との間の比較(差分ビュー(differential view))を示す図である。 大きな変化が2つの比較される画像間、すなわち、図8に示すような輝度平面に発生したエリアの現在のフル(Iフレーム)画像及び最も近時に通過したフル(Iフレーム)画像の双方におけるエリアの識別を示す図である。 最も近時に通過したフル(Iフレーム)画像のどの部分が、処理及びデータ圧縮のために、最も近時に通過したフル(Iフレーム)画像から現在の画像にコピーされるのかを示す図である。
本発明のより詳細な説明の前に、限定ではなく一例として、X.264/H.264プロトコルの枠組みを、本発明を実施することができる枠組みの範囲内の1つの枠組みとして説明する。その結果として、本発明は、他のアルゴリズム及びプロトコルにおいても少なくとも等しく適用可能である。
X.264プロトコル
X.264/H.264ライブラリは、様々な新しい符号化プロトコルと、既にH.263又はMPEG4の一部分であった旧式のプロトコルとを実施する。20を超えるいわゆる拡張部分を有する完全なMPEG4仕様は、膨大であり、その全内容をここで議論することはできないことに留意されたい。しかしながら、本発明について、プロトコルの定義の基本的な理解だけは、本発明の適切な理解のために必要である。この例示のプロトコル/標準規格が以下のものに基づいていることを確認することは重要である。
−マクロブロックの修正DCT空間変換、
−DCマクロブロック係数の第2段階アダマール変換(以下ではこれ以上議論しない)、
−マクロブロックの長方形分割、
−色差符号化定義(4:2:0、4:2:2又は4:4:4)、
−拡張された基準フレーム定義を有するIフレームタイプ、Pフレームタイプ及びBフレームタイプ、
−オプションとしての可変ブロックサイズ動き補償、並びに、
−エントロピー符号化システムCABAC及びCAVLC(以下ではこれ以上議論しない)。
H.264仕様に存在するこれらの特徴よりもはるかに多くの特徴が存在するが、これらの特徴は、本発明に関係するものではない。技法/特徴のうちの幾つかのより詳細な議論は、本発明を説明及び明確化するのに役立つと考えられる限りにおいて、以下で与えられる。
言及すべき重要なH.264仕様の1つの態様は、図1に概略的に示すように、プロトコル1が、当業者によく知られた方法で、レベル及びプロファイルに分割されるということである。符号化及び結果として生じるデータ削減は、これらのレベル及びプロファイルに従って実行される。サポートされるプロファイルは、どの圧縮技法が用いられるのかを示し、サポートされるレベルは、復号器が何をどのような速度で処理できなければならないのかを示す。この場合も、詳細は、ここではそれほど重要ではなく、重要なことは、種々の圧縮方法又は他の圧縮方法について本発明を用いた任意の代替的なプロトコルと本発明を用いない任意の代替的なプロトコルとの間の比較がこれを考慮に入れなければならず、そうでなければ、公平な比較を行うことができないということを認識することである。
問題を幾分、より深く掘り下げると、用いられる圧縮機能だけが重要であるわけではなく、それらを調整する方法も重要である。中でも、画像の質及びビットストリームの量に関して最終結果に膨大な差を生み出すパラメータが符号化において設定される。カメラでは、これらのパラメータは、通例、固定値に設定されるが、これらの固定値は、問題になっている任意の特定の用途に適切である場合もあるし、適切でない場合もある。
この問題について本発明に関する手法は、非依存型の(agnostic)ものである。本発明による方法及びシステムは、H.264を強化し、内部パラメータの更なる微調整に応じて、全体的な利得をより小さくもより大きくもすることができる。
詳細な内容に入る前に、ここで、以下の議論は、H.264プロトコルの定義全体の完全な概略を提供することではなく、本発明による方法及びシステムを明らかにすることのみを意図していることに留意されたい。また、本発明は、このプロトコルにも他のいずれのプロトコルにも制限も限定もされない。簡潔にするために、ここでは、H.264プロトコルが参照され、その結果、このプロトコルは、引用することによって本明細書の一部をなすものとする。
色差符号化定義(4:2:0、4:2:2又は4:4:4)
図2に概略的に示されている赤、緑及び青の色からなるフルカラー画像2が、Y「平面」と呼ばれる1つの輝度平面3(黒/白画像を担持する)並びに彩度「Cr」平面及び彩度「Cb」平面と呼ばれる2つの色差平面4の3つの新たな「平面」に変換される。
この変換プロセスは、データ削減をもたらさないが、眼は、色情報よりも輝度に対する知覚がはるかに鋭敏であるので、この分離によって、各平面を異なるように圧縮することが可能になる。上述した平面に符号化するための3つの異なる符号化方式4:2:0、4:2:2又は4:4:4が用いられる。最後のものは、全ての情報が圧縮に用いられることを示すのに対して、4:2:2及び4:2:0は、ピクセルを単に除去することによって又は或る種の補間方式を用いることによって2分の1又は4分の1にピクセル数を削減する。その結果、ピクセルバッファもサイズが異なる。これは、本発明に関して重要である。なぜならば、上記平面は、本発明による方法及びシステムでは、別々に取り扱わなければならないからである。これは、以下の説明からより明らかになる。
マクロブロック
全体画像2は、図3に概略的に示すように、マクロブロック5に分解される。これらのマクロブロックは、正方形又は長方形を形成する近接ピクセルのグループである。これは、平面ごとに行われる。マクロブロックは、タイプに応じて、サイズが16×16ピクセル、16×8ピクセル、8×16ピクセル、8×8ピクセルである。正方形マクロブロックは、修正DCT変換の基本として用いられる。マクロブロックは、サイズ8×8、8×4、4×8、4×4のサブマクロブロックに分割することができる。全てのタイプを動き補償に用いることができる。
図3には、160×112ピクセル画像及び色分離のプロセスが示されている。このピクセル画像は、マクロブロック5へと分解される。ここで、色符号化は4:2:0であり、輝度(Y)平面における16×16輝度ブロック6と、Cr及びCbの彩度平面における4×4彩度ブロック7、8が得られる。
ここで、図3の実施形態では、最大のエンティティが16×16ピクセルのマクロブロックエンティティであることに気付くことは重要である。しかしながら、本発明によれば、スーパブロックと呼ばれる上部構造が定義され、このスーパブロック内に、全てのマクロブロック及びサブマクロブロックが包含される。例えば、寸法32×32のピクセルを有するスーパブロックを選ぶ。このスーパブロックは、図3における白の正方形9によって示されている。しかしながら、この数字は、原理的には自由に選択可能であり、本発明によるスーパブロックは、マクロブロックと同じサイズを有することもできるし、それよりも小さくすることさえもできる。スーパブロックのサイズは、自由に選択可能である。なぜならば、このような方法で、スーパブロックのエッジにわたる境界効果を少なくとも或る程度は防止することができるからである。スーパブロックのサイズの選択は、そのような境界効果を最小にするためのツールとして用いることができる。
DCマクロブロック係数のDCT変換
図4に示すようなH.264において用いられるDCT(「離散コサイン変換」)10は、離散コサイン変換の完全形の概数バージョンであり、この概数バージョンは、整数を用いて動作するように作成されている。
整数を用いた計算は、特に、本来一般に知られているARMプロセッサのようなRISCプロセッサ上では、通例、はるかに高速である。図4の左側には、マクロブロック用の修正DCT10の2次元基底関数が表示され、右側には、8×8マクロブロックの簡略化された変換のプロセスが表示されている。DCT変換10は、本来、基底関数上への画像の投影であり、係数行列を生成する。平滑な画像部分しか含まないマクロブロックの場合、ほとんどの係数はゼロであるか、又はゼロに近い。
量子化11を用いて、これらの係数は符号化され、既に小さいそれらの係数はゼロに設定される。ここで、圧縮の大部分が行われる。その後、係数は、ジグザグ形式12で読み取られ、効率的なランレングス符号化のために、ゼロが最後にあることが確認される。当業者によく知られたステップを幾つか更に行った後、送信及び/又は記録のための0及び1の系列からなるデータストリーム13が生成される。このプロセスステップの一般表現が図4に示されている。
拡張された基準フレーム定義を有するIフレームタイプ、Pフレームタイプ及びBフレームタイプ
画像が色平面に分割され、その後、マクロブロックに分割され、DCT変換され、そして圧縮された後、個々に符号化された画像のストリームが得られる。
しかしながら、ストリーム内の画像は、通例、相互間に多くの相関を有する。このことは、3つのよく知られたタイプのフレーム、すなわち、図5においてそれぞれ14、15及び16として示されたいわゆるIフレーム、Pフレーム及びBフレームを定義することによって、送信及び/又は記録のための圧縮又はデータ削減に利用することができる。これらのIフレーム14、Pフレーム15及びBフレーム16は、通例、図5及び図6に示すように、順序I,B,B,P,B,B,P,...,I等に配列される。シーケンス内のIフレーム、Pフレーム及びBフレームを決定するための可能なアルゴリズムが、特に図6に示されている。
特に図6に概略的に表されているように、Iフレーム14は、完全な画像を含み、Pフレーム15は、前のIフレーム14と符号化された画像との間の差分を含み、Bフレーム16は、2つのPフレーム15又は1つのPフレーム15とIフレーム14との間の差分を含む。
差分のみを続けて送信することが過度に長い間持続すると、ストリームは連続的に劣化するので、時々、新しいIフレームが送信される。
可変ブロックサイズ動き補償
場合によっては、画像上でブロックをシフトさせて、或るシーンについて2つの後続の画像内で同じである対応するブロックを見つけることを通じて等しい部分を探索することによって、フレーム間の冗長性が更に利用される。ブロックのDCT係数を2倍含めるよりも、変換ベクトル17を既に知られているデータのブロックに格納する方が、はるかに効率的である。ここで、画像のこれらの類似の部分をどのようにして見つけるのかは、実際には重要ではなく、図7に示すように、そのことのみが起こることが重要である。現在のフレームからの部分Bは、基準フレームからの部分Aと一致し、したがって、変換ベクトル17を符号化するだけでよい。
したがって、基準フレームにおけるシーンと現在のフレームにおけるシーンとの間の類似点をデータ削減又は圧縮に利用するいずれの方法も、画像ストリームの効率的な符号化をもたらすことになる。
例示のH.264プロトコルの態様に関する上述の議論の後、本発明の一実施形態を用いることができる可能な環境をより良く理解するために、次に、本発明自体を以下でより詳細に説明する。
本発明による方法は、本明細書では、DSBM(差分スーパブロックマスキング)とも呼ばれる。図3を説明するときに上記に示したように、本発明によるスーパブロックは、そのサイズ及びロケーションを従来のマクロブロックのサイズ及びロケーションと同じに選ぶことができたとしても、従来のH.264方法のマクロブロックとは異なるものである。この方法及びシステムがどのように機能するのかについての詳細は、以下で議論される。
ここで、本発明による方法がH.264の仕様内に留まるようにX.264プロトコル上の追加モジュール(アドオン)としてこの方法を実装することができることに留意することは重要である。これは、受信機側において、又はデータストリームが送信されるのではなく記録された場合にはプレイヤの側において、伸長/復号化及び再構成された画像のその後の提示に特別な措置を取る必要がないという結果を有する。
画像解析
上記で議論したように、シーケンス又はストリーム内の画像は、或る程度の冗長性を示す。すなわち、ほとんどの場合、シーケンスでは、近接画像は、少数の相違を除いてほとんど等しい。これは、特に監視カメラからの画像シーケンスに当てはまる。Iフレーム14、Pフレーム15及びBフレーム16のシステムは、この現象を既に或る程度利用しており、そのため、このシステムに改良の余地はないように見え得る。これが、これまで当業者が認識していたものであり、偏見でもあった。
しかしながら、例えば、一方で動画(movie)の激しく変化する画像のシーケンスと、動画の及び監視カメラからのゆっくりと変化するか又はほとんど変化しない画像のシーケンスとの間には、重要な相違がある。その相違は、それらの画像の用いられ方にある。ユーザは、通常のビデオを鑑賞している間、流れるようなクリアな画像を期待し、画像のあらゆる細部が重要となる。もちろん、監視カメラの場合も、細部は重要であり、ぼやけた画像は、確かに望まれないが、これらの画像のシーケンスの実質的に静止した部分については、画像が近時のものであるか又は多少以前のものである場合、細部は実際に重要であるとは限らない。これらのより近時の画像とそれよりも以前の画像との間の差分は、通例、雑音及びシーンの照明でしかない。これらは、ユーザにとっては重要ではないが、送信及び/又は記録にとっては、意外にも情報の大部分をデータストリームに与えることが分かっている。
本発明によれば、カメラからのストリーム内の2つの連続した又は接近した実質的に同一の映像が減算される場合、雑音及び照明変化を除いて、情報をあまり含まないか又は全く含まない差分映像が得られる。
したがって、データストリームのサイズを更に削減するための重要なアイデアは、どの部分が十分に不変であるのかを識別することである。これらの部分については、Iフレーム14等の以前の画像からのマクロブロックを単位とした一部分又は一部分片が単に用いられ、その結果、現在の画像のその部分又は部分片に関して情報は全く送信されない。現在の画像の一部分は、雑音、照明の相違しかないとき又は他の無関係な変化が起こった場合に、十分に不変であると識別される。
例えば図8等の差分表現では、輝度平面内の2つの画像、すなわち、座っている主体の人物を有する1つの画像と、その主体の人物が立ち上がって腕を広げている後続の画像との比較に基づいて、立ち上がったことの効果が明らかに認識可能である。座っている人物と腕を広げて立ち上がっている人物との双方が、この図において識別可能であり、その全体的なエリアが18として示されている。
その結果、この画像変化は、関連部分が大幅に異なるので、マクロブロックごとに又は画像全体について自動的に検出可能でもある。このことが利用され、そのため、本発明によれば、スーパブロックは、マクロブロックに対して、必ずしもそうではないが場合によっては異なるエンティティとして定義される。
スーパブロック分解
したがって、関連のある変化を探索することが、本発明の1つの可能な実施形態では、画像をスーパブロックに分割することによって行われる。これらのブロックは、必ずしもそうではないが好ましくは、H.264、又は本発明が利用される際に用いられる他のアルゴリズム若しくはプロトコルによって用いられる任意のブロックアルゴリズムを包含するほど十分大きい。そのようなスーパブロックのサイズの1つの可能な選択肢は、32×32ピクセルであるが、それ以外のものに決定する理由が存在する場合もある。ほとんどの画像は、640×480、768×576又はそれよりも大きいので、スーパブロック20×15、24×18又はそれよりも大きなものが整数個だけ常に存在する。
しかしながら、本発明によれば、スーパブロックが互いに排他的である要件は存在せず、特定のピクセルは、2つ以上のスーパブロックにも存在することができ、また、1つの画像に整数個のスーパブロックを有する要件も存在しない。結局のところ、スーパブロックは、主として(本質的にはそうではない)、画像のどの部分を以前のフル画像、例えばI画像の一部分と置き換えることができるのかの検出にのみ用いられて、送信される情報の容量を削減し、したがって、その結果得られるビットストリームを圧縮する。計算及び処理を簡単にするために、フレーム又は画像ごとに整数個のスーパブロックを有するとともに、どの1つのピクセルも1つのスーパブロックにしか存在することができないという意味でのスーパブロックの相互排他性を有することが好ましい場合があることに留意されたい。
ここで、4:2:0サンプリングの場合、スーパブロックは、輝度平面では32×32ピクセルであり、彩度平面では16×16ピクセルであることに留意されたい。これらについては、特別な注意を払わなければならない。
輝度チャネル及び彩度チャネルにおける比較
ストリームからの任意の現在のフレームCについて、最も近時に通過したフル画像又はフレーム(あるいは、H.264若しくはX.264又はMPEG2若しくはMPEG4等の従来の意味でのIフレーム)が、基準画像として選ばれる。現在のC画像及び基準I画像の双方が、スーパブロックに分割され、それらのスーパブロックは、現在のフレーム又は画像内の各スーパブロックと最も近時に通過した未圧縮のフレーム又は画像内の対応するスーパブロックとについて、スーパブロック単位で比較される。「対応する」という表現は、最も近時のIフレーム又はI画像内のスーパブロックと現在のCフレーム又はC画像内のスーパブロックとが、これらの最も近時に通過したフルフレーム及び現在のフレームに従って描写されるシーン内のロケーションに関して対応していることを示すように意図されている。
スーパブロックが僅かにしか異なっていないことが判明した場合、現在のフレームC内のスーパブロックは、元の、すなわち通過したフルフレーム又はフル画像の対応するスーパブロックに置き換えられる。このサブプロセスは、あらゆるDCT圧縮又は動き補償の前に実行される。1つの同一のスーパブロックは、結果として、4つの同一のマクロブロックになり、H.264の動き補償は、最も近時のIフレームのマクロブロックと現在の(後続の)フレームCのマクロブロックとの間に大きな類似点を認識することになり、その結果、符号化が非常に効率的になり、したがって、最終的に生成されるデータストリームのデータの量が削減される。
この手法に起因して、データストリームが増加する可能性はないことに留意されたい。最悪の場合、生成されたデータストリームは、本発明による方法及びシステムを組み込まずに行ったのと同じ容量を有することになる。
図8と類似している図9のビューには、重要な移動が発生し、以下に説明するアルゴリズムを用いて検出されたスーパブロックが、これらのスーパブロックが輝度平面において差分に基づいて十分に「異なる」と認識されたので、組み合わせて輪郭で描かれている。このスーパブロック19のセットは、図8の概略的な輪郭よりも詳細である。なぜならば、図8の表現は、図9のスーパブロック後の検出された輪郭19ではなく、概略的で直観的な輪郭18を示しているからである。これらは、現在の画像Cに保持されている、組み合わせたスーパブロック19であり、他の全て(顕著な変化を有しない)は、最も近時の完全に通過したフレーム、特にIフレームからのスーパブロックに置き換えられる。このIフレーム20が図10に示されているか、又は少なくとも、関連のある現在のフレームCにコピーされるIフレームの一部分が図10に示されている。図10のこの画像における「ホール」21は、図8及び図9に関して説明したように、関連のある移動が検出された、図9の差分画像におけるスーパブロック19の輪郭と一致する。これらのスーパブロックは、画像内の人物が(非常に)素早く立ち上がったので異なるものと認識された。そのような非常に素早い変化は、画像シーケンス内の連続画像又は互いに接近した画像において発生する可能性は低いが、本発明を明らかにするために、この誇張は正当なものとみなされる。
上記に示したように、画像間の差分の検出は、この実施形態では、輝度平面における画像を比較することによって行われる。ここで、代替的に又は加えて、差分検出は、彩度平面に基づいて行うこともできるし、更には画像(の一部分)の一般的な統計的特性に基づいて行うこともできることに留意されたい。
1つの平面(輝度又は彩度)において画像の特定の箇所で比較を実行するとき、この比較が輝度の比較のみ又は彩度の比較のみに基づいて行われる場合、変化が直接隣接した画像間で発生したのか又はそれよりも遠隔の画像間で発生したのかを判定するのに、差分の対比が不十分な場合があることが指摘されてきた。したがって、本発明は、所望されかつ有用である場合には、これらの比較及び/又は他の任意の比較の双方を行う可能性も包含している。他の任意の比較は、統計的特性(ただし、これに限定されるものではない)等である。
次に、残りの課題は、現在のフレームからのスーパブロックが最後のIフレームのスーパブロックと異なるか否かをどのように判断するのかである。
そのために、現在のフレームCの(i,j)スーパブロックSをCi,jと定義し、最も近時のIフレームのスーパブロックSをIi,jと定義することにする。さらに、尺度d(S,S)を、スーパブロックのベクトル空間におけるスーパブロックSとSとの間の距離(差分)と定義することにする。スーパブロックは、以下の式が成立する場合に、同一であると定義される。
Figure 2014509481
スーパブロックCi,j及びIi,jが、この意味において同一である場合、フレームC内のスーパブロック(i,j)は、フレームI内のスーパブロック(i,j)に置き換えられることになる。
したがって、焦点は、閾値d(S,S)の定義にある。この閾値を定義するのに、多くの種類(shapes)及び形態を用いることができ、全てが本発明の範囲内にある。以下では、可能な実施形態を説明する。この実施形態は、決して本発明の限定として提示されるものではない。スーパブロックSの輝度ピクセルをS[L] n,mと定義するものと仮定し、ここで、本ケースでは、32×32のスーパブロックサイズの場合、0≦n<32及び0≦m<32である。彩度ピクセルをS[Cr] n,m及びS[Cb] n,mと定義し、ここで、4:2:0サンプリング方法の場合、0≦n<16及び0≦m<16である。各ピクセルSn,mの(整数)値は、範囲0≦Sn,m<Vmax内にあり、ここで、Vmax=256である。この場合、最適な関数(d[2])の更に緻密な近似における閾値dは、以下のように定義することができる。
Figure 2014509481
式中、
x≦−1の場合 U(x)=−1
1<x<−1の場合 U(x)=0
x≧1の場合 U(x)=1
であり、スーパブロックSP,[x]及びSQ,[x]は、同じ(輝度又は彩度)平面xから選ばれる。これは常に当てはまり、そのため、以下では、平面を繰り返し識別しないことにする。
閾値を定義する最初の試験的試みにおいて、閾値尺度を輝度平面にのみ適用し、試験した後に値dmax=2に設定した。この値は、最適な結果をもたらすものとみなされた。
この閾値は、受信機/プレイヤへのデータストリームのかなりの削減を試験することに既に提供されたが、受信機/プレイヤ側で再生された画像のシーケンスの著しい劣化はほとんどなかった。しかしながら、閾値に対するこの差分関数は、幾つかの不都合も示している。先ず最初に、高いコントラスト、例えば窓を通る日光を有する画像によって、多くのスーパブロックは、閾値を超え、送信される可能性がある。しかし、これらのスーパブロックは、実際には特別に問題となるものではない。これは、例えば、画像によるシーン内の反射面からの(ランダムな)光沢に起因している場合がある。さらに、この近似された閾値レベルにおいては、画像内の微妙で小さなコントラスト差は、真の差分と認識されなかった。
この閾値は、実際に用いられるカメラ及び他の状況にパラメータを調整することができるように、パラメータを有するより複雑な関数として規定することもできる。すなわち、ホワイトバランス及び雑音レベルが、差分関数及び/又は閾値の適切な選択に異なる効果を有することが分かった。本発明の更に洗練された可能な実施形態として、以下の差分関数を提案する。
Figure 2014509481
式中、B及びBは、光沢の効果を補償するパラメータである。したがって、この閾値関数は、光沢補償を含む。
この関数の試験から、実際に用いられるカメラ等の特定の状況についてであるが、照明状況等からの効果についても、妥当な値は、B=16及びB=32(他のカメラ、特にそれらのカメラのホワイトバランス及びそれらのカメラによって生成される雑音レベルに対して変化し得る)であることが判明した。この補正された差分関数は、線形関数であるが、カメラ及び/又は他の状況に応じて、二次補正を行うことが必要な場合もある。
上記に提供して説明した例におけるスーパブロックに関する計算は、輝度平面においてのみ行った。しかしながら、移動物体が色のみ異なる状況、又は主として色が異なる状況がある。したがって、本発明によれば、代替的に又は加えて、差分関数を計算し、それを彩度平面(複数の場合もある)の閾値と比較することも可能である。そのために、尺度d[1](特定の固定値)を用いることができる。このとき、チャネルのうちの1つが閾値dmaxを超えている場合、そのスーパブロックのみをそのままにしておき、その関連のあるスーパブロックを、以前の通過したフル画像(最も近時のIフレーム)からの対応するスーパブロックと置き換えてはならない。
補正技法
一方、上記で説明したような光沢補正された差分関数は、シーンの照明のみが変化した場合に、ほとんど全てのスーパブロックが変化したように見えるが、現在の画像Cと先行する画像Iとの間には、実際に対象となることは何も起こっていないという性質を示す。同じことは、色バランスに当てはまる。カメラは、照明が変化すると、ホワイトバランスを自動的に変化させる傾向を有し、これは、更に、色バランスのシフトをもたらす場合がある。これは、例えば、天候が曇っているときに、非常に頻繁に起こる可能性がある。
そのような規則的な出来事が、画像を送信するビットレートの達成される削減又は所望の削減に影響を与えることを防止する対抗措置として、照明及び色バランスの正規化をここに提案する。この正規化は、スーパブロックごとに実行される。
最初に、以下のように、平均化された照明が計算される。
Figure 2014509481
そのため、置き換えスーパブロックSは、次のものとなる。
Figure 2014509481
これによって、この式が、更に変更された閾値関数d[3]において適用されると、以下の式が得られる。
Figure 2014509481
そして、この式は、現在の画像内のスーパブロックを、最も近時のI画像からの対応するスーパブロックに置き換えることができるか否かを判定するのに用いることができる。このアルゴリズムは、輝度L平面及び彩度Cr平面、Cb平面に等しく用いることができる。
画像アーティファクト
画質について言えることは何か? 画像自体は、H.264以外の方法では処理されないので、H.264ビデオストリームに通常存在する全てのアーティファクトを予想することができる。しかしながら、画像の一部分をそれよりも以前の部分に置き換えることは、画像の歪として目に見える多くの効果をもたらす場合がある。これらは以下のものである。
−タイリング:スーパブロック境界上のエッジ効果、
−強いタイリング:隣接したスーパブロック間の色差分及び/又は輝度差分、
−ゴースト:欠陥のあるスーパブロックの置き換え。
実際に最初に関係するものは効果である。以前の画像からのスーパブロックが用いられ、現在のスーパブロックの全体的な輝度及び平均の色値にのみ補正され、それによって、基礎となるマクロブロックのDCTに1つの係数しか導入されないようにする。通例、これで十分なはずであるが、特に近接したスーパブロックのエッジでは、照明状況におけるより高次の変動が可視的になる場合がある。これらの効果は、或る役割を常に果たすことになるが、パラメータの最適化及び調整によって削減することができる。また、I画像をリフレッシュするための短い周期を選択することが役立つ。
対照的に、そのような不都合は、必ずしも問題を提起するわけではないことに留意されたい。特に、本発明が、例えば監視カメラの状況で用いられる場合に、これらの効果は、画像の内容に何の影響もなく、概ね審美的であり、実際に真の不都合を形成しない。
しかしながら、上述した3つの効果のうちの最後のものは、より重大な問題であり、現在の画像C内のスーパブロックを、この置き換えが行われるべきでないIフレームのスーパブロックに置き換えるアルゴリズムに起因している。
この場合、画像の一部分が欠落しているか又は正しくないように見える。これは、これらがユーザに関心のあるものであるときに特に痛手である。これは、ほとんどの場合、パラメータの正しくない調整の結果である。妥当な値を超えてビットストリームを圧縮するために、これらのパラメータが過度に厳密に設定される場合、現在の画像からの重要なスーパブロックが、それほど重要でないスーパブロックとともに、最も近時のI画像からの対応するスーパブロックに置き換えられる。閾値関数のパラメータのそのような調整は、ほとんどの場合、カメラのタイプに依存しているので、パラメータの調整は、注意して行わなければならない。慎重かつ適切に行うと、欠陥のあるスーパブロック置き換えをほとんど回避することが可能になるはずである。
例えば、画像のシーケンスの再生の際、パラメータが誤って設定されている場合、この効果が発生する場合がある。再生された画像には、正しくない(spurious)ブロックが存在する場合もあるし、他の映像には、物体の一部分、例えば、人物の腕(の一部分)、欠落が存在する場合さえある。これは、物体のそのような一部分がその周囲との高いコントラストを示していなかったときに発生する場合があり、色差検出はオフに切り替えられる。
発明の効果
測定結果及びストリームサイズ
先ず、Axis2100ネットワークカメラを用いた測定結果を示す。これらの測定は、通常の日光の条件下及び少ない日光の条件下で行った。少ない日光の状況では、より多くの雑音が発生し、そのため、その結果得られる画像は、通例、圧縮するのがより困難である。これに対処するために、カメラのフレームレートは、周辺光の量に依存するようにされている。少ない光の条件の場合、ほぼ10フレーム/秒(fps)のフレームレートを選択することができ、通常の光の条件の場合、約15fpsを選択することができる。変更される他の唯一のパラメータは、Bフレームの数である。画像のデジタル化のための量子化閾値等の他のパラメータは、デフォルト又は「工場出荷時の設定値(factory values)」に設定され、不変のままである。一般的な用途では、各P部分画像サイクル(後続のPフレーム間のフレーム数に換算した周期)におけるBフレームの数は、概ね2である。本発明の有用性を判断するために、極端な値、すなわち0及び4においても試験を行った。測定は約1分間行った。
実験結果I
第1のタイプのカメラ(Axis2100ネットワークカメラ)について、少ない日光の状況下、すなわち、10fpsのフレームレートにおいて、先ず本発明を適用せずに基準用に性能を測定し、以下の結果を得た。
標準規格X.264、#Bフレーム=0の場合、165KB/s
標準規格X.264、#Bフレーム=4の場合、116KB/s
その後、本発明について同じ実験及び測定を行い、以下の結果を得た。
本発明を用いたX.264、#Bフレーム=0の場合、55KB/s
本発明を用いたX.264、#Bフレーム=4の場合、45KB/s
そこで、少ない光の条件場合、Bフレームが存在しないときは、165KB/sから55KB/sへのビットストリームサイズの削減(削減66%又は3.0倍の利得)があることが分かり、1つのPフレーム当たり4つのBフレームがあるときは、116KB/sから45KB/sへのビットストリームサイズの削減(削減61%又は2.6倍の利得)があることが分かる。
この同じ第1のタイプのカメラ(Axis2100ネットワークカメラ)について、通常の日光の状況下での15fpsにおける測定結果は、以下のとおりである。
標準規格X.264、#Bフレーム=0の場合、118KB/s
標準規格X.264、#Bフレーム=4の場合、75KB/s
一方、本発明を用いると、得られた結果は、以下のとおりである。
本発明を用いたX.264、#Bフレーム=0の場合、51KB/s
本発明を用いたX.264、#Bフレーム=4の場合、35KB/s
通常の照明条件では、Bフレームが存在しないとき(#Bフレーム=0)、118KB/sから51KB/sへのビットストリームサイズの削減が達成され、これは、57%の削減又は2.3倍の利得を構成し、1つのPフレーム当たり4つのBフレームを有する場合には、75KB/sから35KB/sへのビットストリームサイズの削減(削減53%又は2.1倍の利得)が達成される。
本発明の更なる調整が可能であると考えられるが、所望の用途、並びに上述したアルゴリズムに基づいて送信されたビットストリームの再生時における、結果の画質及び信頼性に大きく依存する。それにもかかわらず、本発明を用いると、1つのPフレーム当たり4つのBフレームを有する場合には、ビットレートを23.5KB/sもの低いビットレートに削減すること(削減69%又は3.2倍の利得)が可能であるように思われたことは注目に値する。しかしながら、これらの設定については、画質が依然としてその用途について当面許容可能であるか否かを判断することが必要である。
実験結果II
同様の結果が、第2のタイプのカメラ(Axis213ネットワークカメラ)を用いた測定から得られる。この測定は、通常の日光の状況下で行った。この第2のタイプのカメラの画像サイズは、第1のタイプのカメラ(Axis2100)の画像サイズよりも大きいので、記録するPCが動作し続けることができるように、フレームレートを最初に強制的に低くした。しかしながら、ここに示す測定結果は、全て相対的な特性を有するので、このことは、これらの結果の解釈を実際に変更するものではない。
Axis213、通常の日光の状況、5fps:
標準規格X.264、#Bフレーム=0の場合、97KB/s
標準規格X.264、#Bフレーム=4の場合、78KB/s
しかし、本発明を適用すると:
本発明を用いたX.264、#Bフレーム=0の場合、44KB/s
本発明を用いたX.264、#Bフレーム=4の場合、22KB/s
Bフレームが存在しないとき、97KB/sから44KB/sへのビットストリームサイズの削減(削減55%又は2.2倍の利得)が達成され、1つのPフレーム当たり4つのBフレームがあるとき、78KB/sから22KB/sへのビットストリームサイズの削減(削減72%又は3.5倍の利得)が達成される。これらの数字を、Axis2100を用いて得られた数字と比較した場合、Bフレーム(B>0)を利用するとき、利得がより大きくなることが分かる。この理由は、送信に必要とされるビットレートの削減は、シーン及び存在する雑音に大きく依存するからである。Axis213は、より優れたカメラであり、雑音がより少なく、ホワイトバランスがより安定しており、画像におけるシーンは、Axis2100ネットワークカメラを用いて本発明を試験するために用いられるシーンと比較して、より簡単に比較されていた可能性がある。
また、DSBMの更なる調整がこの状況において可能であり、1つのPフレーム当たり4つのBフレームを有する場合に、ビットレートを13.8KB/sもの低いビットレートに削減すること(削減82%又は5.6倍の利得)が可能であることが判明した。しかしながら、これらの設定については、画質が依然としてその用途について当面許容可能であるか否かを判断することが必要である。
更なる比較のために、ここで、Axis213ネットワークカメラは、AVCプロトコルなしではあるが、MPEG4ストリームを生成する可能性も提供することに留意されたい。5fpsの現在の設定及び上記で用いたものと同じ解像度を用いると、このストリームは、46KB/sで進み続ける。しかしながら、これが最良の直接的な結果であると仮定すると、本発明が適用されたH.264の最良の結果は、依然としてMPEG4ストリームよりも3.3倍優れている。
画質の感動を与えるために、より極端な状況についての測定結果が取得されており、したがって、それらの測定結果は比較することができる。
実装
本発明による方法及びシステムは、幾つかの方法で実装することができる。上記で議論したように、プレイヤ/受信機も備えるシステムの画像記録側、厳密に言えば送信機のみが、変更を受ける必要がある。H.264を処理することが可能ないずれのプレイヤ(受信機)も、本発明に従って構築されると、受信した画像ストリームを復号化することができることになる。記録側すなわち送信機側には、この新しい技法を実装する幾つかの選択肢がある。
最も単純な方法は、H.264を用いて画像ストリームを符号化するのに用いられるソフトウェアを適合させることである。自由にプログラム可能であり、H.264について符号化することができるいずれのデバイスも、本発明に必要な追加の命令を実行することが可能である。もちろん、そのモジュール自体が、ソフトウェアを幾分より大きくし、それ自体の一部のRAMを消費することになるが、H.264自体の実装と比較すると、そのようないずれの増加も軽微であることが分かる。例えば、H.264が実装されたARM9(MCUである)は、本発明も同様に実行することができる。
H.264がFPGA内に実装されるとともに、ユーザがVHDL又はVerilogのソースにアクセスすることができる限りにおいて、本発明を組み込むようにこれらを変更することができる。幾つかの余分のメモリが、画像処理に必要とされる場合があるが、必要量は多くなく、カメラのハードウェア又は接続されたプロセッサに既に存在する可能性がある。
最後に、幾つかの状況では、H.264符号化を実行する専用のクローズドチップ(closed chip)のみが利用可能である。そのようなチップは、ベア(bare)画像信号を必要とし、「他方の側」でH.264符号化ストリームを生成する。この場合、その専用チップと次のような前処理を行うプリプロセッサとの間でIフレーム、Pフレーム及びBフレームの選択を同期させることが可能である場合には、この専用チップに送信される画像のシーケンスを前処理することによって、依然として、本発明を実施することができる。
本発明は、現在のH.264技術又は他の任意の差分ベースの従来技術と比較して、より効率的な圧縮を可能にする。現在、主要な適用分野は監視カメラである。この分野(ただし、事実上、可能であれば他の使用分野(本発明はH.264に限定されるものではない)でも同様である)では、本発明(上記の本明細書では、差分スーパブロックマスキングDSBMと呼ばれることもある)は、特に良好な結果を与え、標準規格H.264圧縮アルゴリズムに「アドオン」として実装することができる。
本発明は、本明細書において、H.264プロトコル仕様とともに一実施形態で開示されている。なお、本発明は、このH.264プロトコル仕様にも同様に限定されるものではない。したがって、標準規格H.264の画像ストリーム(又は同等のプロトコル若しくは仕様に従った同様の画像ストリーム)を表示することが可能ないずれの復号器も、本発明による変更されたストリームを表示することが可能になる。したがって、受信側において適合を行う必要はない。
例示のコード
上記の方法は、VLCコード(ビデオLAN VLCメディアプレイヤ)で実装されている。以下に、試験、補正及びスーパブロックの置き換えを行うルーチンを列挙している。このコードは、生成コードではなく、単に一例としての役割を果たしているにすぎない。このコードを、VLCコード自体によって用いられるX.264ライブラリに統合することは、本発明のこの開示内容には提供されていない。なぜならば、これは、多くの要素に依存する場合があり、これらの要素は、そのような関連のある要素の範囲内で目的を達成するために、当業者の十分手の届く範囲内にあるからである。
Figure 2014509481
Figure 2014509481
Figure 2014509481

Claims (15)

  1. 画像のシーケンスを処理して送信する方法及び/又は記録する方法であり、各画像は前記シーケンスで動画を構成するようにシーンを描写しており、該方法は、
    量子化、マクロブロック分割、及び変換、例えば離散コサイン変換のうちの少なくとも1つのように、後続の画像を個々に前処理するステップであって、前処理された画像のシーケンスを得るものである、前処理するステップと、
    送信又は記録の前に、
    個々の画像が符号化されることなく送信又は記録に移ることを定期的に可能にし、
    前記シーケンスにおける未圧縮の画像間の中間画像を、これらの中間画像を最も近時に通過した未圧縮の画像に対する差分と置き換えることによって符号化する、
    ことによって、前記前処理された画像の圧縮のために符号化するステップであって、前記前処理された画像のシーケンスの送信又は記録に必要とされる送信容量又は記録容量を減少させる、符号化するステップと
    を含む方法であって、
    前記中間画像の符号化の前に、
    前記中間画像のうちの少なくとも1つにおいて、前記中間画像が、前記最も近時に通過した未圧縮の画像に対して変化していないか又は少なくとも大幅に変化していないエリアを識別するステップと、
    前記中間画像内の前記識別されたエリアを、前記最も近時に通過した未圧縮の画像からの対応するエリアに置き換えるステップであって、これらのエリアは、前記未圧縮の画像及び前記中間画像のうちの少なくとも一方による前記シーン内のロケーションが一致している、置き換えるステップと
    を含むことを特徴とする、画像のシーケンスを処理して送信する方法及び/又は記録する方法。
  2. 前記中間画像内の前記エリア及び前記未圧縮の画像内の前記エリアは、サイズが一致している、請求項1に記載の方法。
  3. 前記未圧縮の画像及び前記中間画像は、整数個のエリアを含む、請求項1又は2に記載の方法。
  4. 前記エリアは、20×15ピクセル、24×18ピクセル、及び32×32ピクセルを含む群からのサイズのうちの1つのサイズを有する、請求項1〜3のいずれか1項に記載の方法。
  5. 前記中間画像が前記最も近時に通過した未圧縮の画像に対して変化していないか又は少なくとも大幅に変化していない前記エリアを識別するステップは、前記中間画像と、元の画像の形態の前記未圧縮の画像とを比較することを含む、請求項1〜4のいずれか1項に記載の方法。
  6. 前記中間画像が前記最も近時に通過した未圧縮の画像に対して変化していないか又は少なくとも大幅に変化していない前記エリアを識別するステップは、前記中間画像と、輝度チャネルの前記未圧縮の画像とを比較することを含む、請求項1〜5のいずれか1項に記載の方法。
  7. 前記中間画像が前記最も近時に通過した未圧縮の画像に対して変化していないか又は少なくとも大幅に変化していない前記エリアを識別するステップは、前記中間画像と、彩度チャネルのうちの少なくとも1つの前記未圧縮の画像とを比較することを含む、請求項1〜6のいずれか1項に記載の方法。
  8. 前記中間画像が前記最も近時に通過した未圧縮の画像に対して変化していないか又は少なくとも大幅に変化していない前記エリアを識別するステップは、前記中間画像と前記未圧縮の画像とをエリアごとに比較することを含む、請求項1〜7のいずれか1項に記載の方法。
  9. 前記中間画像が前記最も近時に通過した未圧縮の画像に対して変化していないか又は少なくとも大幅に変化していない前記エリアを識別するステップは、前記中間画像及び前記未圧縮の画像の少なくとも関連のあるエリア間の差分を規定することと、前記差分を所定の閾値と比較することと、前記差分が前記閾値未満である場合に、1つのエリアが置き換えられるべきであると判定することとを含む、請求項1〜8のいずれか1項に記載の方法。
  10. 前記差分は、輝度チャネル及び彩度チャネルのうちの少なくとも一方における1つのエリア内でのピクセルごとの比較に基づく関数を含む、請求項9に記載の方法。
  11. 前記差分は、1つのエリア内又は複数のエリア間の統計的解析に基づく関数を含む、請求項9又は10に記載の方法。
  12. 前記関数において光沢又は反射の影響を抑制するステップを含み、前記関数は光沢補償係数を含む、請求項10又は11に記載の方法。
  13. 前記関数において照明の変化又はカメラが誘発したホワイトバランスの変化の影響を抑制するステップを含み、前記関数は照明及びホワイトバランスの正規化係数を含む、請求項10〜12のいずれか1項に記載の方法。
  14. 前記関数においてカメラが誘発したカラーバランスの変化の影響を抑制するステップを含み、前記関数はカラーバランスの正規化係数を含む、請求項10〜13のいずれか1項に記載の方法。
  15. 画像のシーケンスを送信及び/又は記録するためのシステムであり、各画像は前記シーケンスで動画を構成するようにシーンを描写しており、該システムは、
    量子化、マクロブロック分割、及び変換、例えば離散コサイン変換のうちの少なくとも1つのように、後続の画像を個々に前処理して、前処理された画像のシーケンスを得るように構成されたプリプロセッサと、
    送信及び/又は記録の前に、
    個々の画像が符号化されることなく送信又は記録に移ることを定期的に可能にし、
    前記シーケンスにおける未圧縮の画像間の中間画像を、これらの中間画像を最も近時に通過した未圧縮の画像に対する差分と置き換えることによって符号化する、
    ことによって、前記前処理された画像を圧縮して、前記前処理された画像のシーケンスの送信又は記録に必要とされる送信容量又は記録容量を減少させるように構成された符号器と
    を備えるシステムであって、
    前記中間画像の符号化の前に、前記中間画像のうちの少なくとも1つにおいて、前記中間画像が、前記最も近時に通過した未圧縮の画像に対して変化していないか又は少なくとも大幅に変化していないエリアを識別するように構成された識別器と、
    前記中間画像内の前記識別されたエリアを、前記最も近時に通過した未圧縮の画像からの対応するエリアに置き換えるように構成されたレプリケータであって、これらのエリアは、前記未圧縮の画像及び前記中間画像のうちの少なくとも一方による前記シーン内のロケーションが一致している、レプリケータと
    を備えることを特徴とする、画像のシーケンスを送信及び/又は記録するためのシステム。
JP2013552229A 2011-02-04 2012-02-06 シーケンス内の画像の圧縮 Pending JP2014509481A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP11153367.5 2011-02-04
EP11153367A EP2485487A1 (en) 2011-02-04 2011-02-04 Compression of images in a sequence
PCT/EP2012/051951 WO2012104435A1 (en) 2011-02-04 2012-02-06 Compression of images in a sequence

Publications (1)

Publication Number Publication Date
JP2014509481A true JP2014509481A (ja) 2014-04-17

Family

ID=43877024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013552229A Pending JP2014509481A (ja) 2011-02-04 2012-02-06 シーケンス内の画像の圧縮

Country Status (6)

Country Link
US (1) US20140086339A1 (ja)
EP (2) EP2485487A1 (ja)
JP (1) JP2014509481A (ja)
KR (1) KR20140042790A (ja)
EA (1) EA201300889A1 (ja)
WO (1) WO2012104435A1 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6459459B1 (en) * 1998-01-07 2002-10-01 Sharp Laboratories Of America, Inc. Method for detecting transitions in sampled digital video sequences
JP5160451B2 (ja) * 2006-01-31 2013-03-13 トムソン ライセンシング エッジ・ベースの空間‐時間的フィルタリングの方法および装置
JP2007318596A (ja) * 2006-05-29 2007-12-06 Opt Kk 広角レンズによる撮像データの圧縮方法、伸長表示方法、圧縮装置、広角カメラ装置およびモニタシステム
CN102144237B (zh) * 2008-07-03 2014-10-22 美国唯美安视国际有限公司 压缩媒体的有效水印方法
US8488055B2 (en) * 2010-09-30 2013-07-16 Apple Inc. Flash synchronization using image sensor interface timing signal

Also Published As

Publication number Publication date
US20140086339A1 (en) 2014-03-27
EA201300889A1 (ru) 2014-01-30
WO2012104435A1 (en) 2012-08-09
EP2671381A1 (en) 2013-12-11
KR20140042790A (ko) 2014-04-07
EP2485487A1 (en) 2012-08-08

Similar Documents

Publication Publication Date Title
US7920628B2 (en) Noise filter for video compression
US8576908B2 (en) Regions of interest for quality adjustments
EP1797722B1 (en) Adaptive overlapped block matching for accurate motion compensation
JP4271027B2 (ja) 動画データストリームで漫画を検出するための方法及びシステム
US7974340B2 (en) Adaptive B-picture quantization control
US6058210A (en) Using encoding cost data for segmentation of compressed image sequences
US8064516B2 (en) Text recognition during video compression
US20150010085A1 (en) Method for encoding/decoding high-resolution image and device for performing same
US20130089265A1 (en) Method for encoding/decoding high-resolution image and device for performing same
US20070248163A1 (en) Quantization adjustments for DC shift artifacts
US11743475B2 (en) Advanced video coding method, system, apparatus, and storage medium
US10735724B2 (en) Method and device for compressing image on basis of photography information
JP2010500818A (ja) 漫画アニメーション圧縮のためのシステムおよび方法
KR20040069210A (ko) 코딩 정보 및 로컬 공간 특징을 이용한 디지털 비디오신호들의 후처리에서의 선명도 향상
JP2005525014A (ja) 符号化されたデジタルビデオのためのシャープネスエンハンスメントのシステムおよび方法
US20150249829A1 (en) Method, Apparatus and Computer Program Product for Video Compression
US20030012431A1 (en) Hybrid lossy and lossless compression method and apparatus
JP2007134755A (ja) 動画像符号化装置及び画像記録再生装置
JP2002064823A (ja) 圧縮動画像のシーンチェンジ検出装置、圧縮動画像のシーンチェンジ検出方法及びそのプログラムを記録した記録媒体
JP2014509481A (ja) シーケンス内の画像の圧縮
US8422561B2 (en) Method and system for low-subband content discrimination
Argyropoulos et al. Coding of two-dimensional and three-dimensional color image sequences
CN118020298A (zh) 基于后期分析和重构要求的自适应视频精简
JP2018050150A (ja) 画像符号化装置、画像符号化方法及びコンピュータプログラム
CA2885198A1 (en) Method, apparatus and computer program product for video compression