JP2002519915A - 領域を基礎とする画像処理方法および装置 - Google Patents

領域を基礎とする画像処理方法および装置

Info

Publication number
JP2002519915A
JP2002519915A JP2000557433A JP2000557433A JP2002519915A JP 2002519915 A JP2002519915 A JP 2002519915A JP 2000557433 A JP2000557433 A JP 2000557433A JP 2000557433 A JP2000557433 A JP 2000557433A JP 2002519915 A JP2002519915 A JP 2002519915A
Authority
JP
Japan
Prior art keywords
block
interest
image
region
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000557433A
Other languages
English (en)
Inventor
ラヴィ クリシュナムルシー,
スリラム セテューラマン,
ヤ−チン ツァン,
Original Assignee
サーノフ コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by サーノフ コーポレイション filed Critical サーノフ コーポレイション
Publication of JP2002519915A publication Critical patent/JP2002519915A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/55Motion estimation with spatial constraints, e.g. at image or region borders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 様々な領域の相対的「重要性」に基づき画像領域を分類し、その重要性情報を適宜使用して処理リソースを割り当て、画像情報を入力するための装置および方法。

Description

【発明の詳細な説明】
【0001】 (技術分野) 本出願は、1998年6月26日に提出の米国仮出願第60/090,813
号の利益を主張する。なおその内容は本明細書に援用されている。
【0002】 本発明は概して、画像処理システム、さらに詳しく言えば、ズーミング、合成
、選択的入力画像形成、処理リソースの適応割当て、例えばビット割当てなどの
機能性を提供するために、関心領域を識別し、使用するための装置および付随方
法に関する。
【0003】 (背景技術) 画像シーケンス、例えばビデオ画像シーケンスは、一般的に画像フレームまた
はピクチャのシーケンスを含む。移動オブジェクトを含むビデオの再生は一般的
に、毎秒30の画像フレームを必要とし、各フレームには1メガバイトを越える
情報を入れることができる。したがって、前記画像シーケンスを伝送または保存
するには、多くの伝送帯域幅または保存容量が必要となる。必要な帯域幅または
保存容量を減らすには、シーケンス内の冗長情報が保存または伝送されないよう
、フレームシーケンスに、例えば圧縮などの画像処理を施す。適用例としては、
テレビジョン、テレビ会議、およびCD−ROM保管があり、これらは効率の良
いビデオシーケンス符号化の恩恵を受けることができる。
【0004】 さらに、処理リソースが制限されているか、または特定アプリケーションに関
する要求によって処理リソースに制約がある画像処理環境では、利用可能なリソ
ースを慎重に割り当てる必要がある。すなわち、利用可能な強力な画像処理方法
はたくさんあるが、アプリケーションによっては処理リソースがなかったり、も
っと強力な画像処理方法も役立たないか、またはアプリケーションの要求を満た
すため画像処理方法を控えめに、選択的に使用しなければならないような短い待
ち時間での厳しい要求が存在することがある。
【0005】 例えば、テレビ電話やテレビ会議のようなリアルタイムアプリケーションでは
、一般的には画像シーケンスの中で話者の顔が最も重要な部分の一つとなる。こ
のような重要部分を検出して活用できれば、符号化システムの能力は大幅に高ま
る。
【0006】 例えば、ビットレートの低いアプリケーション(例、リアルタイムアプリケー
ション)の符号化システムは、限られたビットを様々な要求を処理できるよう有
効に割り当てなければならない。すなわち、ビットを動き情報のコード化、テク
スチャ情報のコード化、形状情報のコード化、ヘッダ情報のコード化などに割り
当てなければならない。そのとき、利用可能なビットを、一つのパラメータが別
のパラメータを犠牲にして多く使用する、すなわち、正確な動き情報を提供する
ため、テクスチャ情報提供にわずかなビットしか費やさず、テクスチャ情報を犠
牲にしてモーション情報に多くのビットを費やす。現フレームにおいてどの領域
が特に重要であるかという情報なしに、すなわち、限られたビットプールからよ
り多くのビットが与えられて当然の状態では、エンコーダは利用可能なビットを
最も効率的な方法で割り当てることができない。
【0007】 さらに、エンコーダは識別済みの重要領域に供するための追加リソースを持っ
ていることがあるが、それでもなお既存の入力画像シーケンスの品質を超えてこ
れら領域を改善することはできないことが多い。すなわち、エンコーダの符号化
パラメータを変更しても、エンコーダへ提示される品質以上に重要性の品質を向
上させることはできない。
【0008】 したがって、様々な領域の相対的「重要性」に基づき、画像の中の重要領域を
分類し、その重要性情報を適宜使用して処理リソースを割り当て、符号化の前に
入力画像シーケンスの操作を制御するための装置および付随方法に関する技術の
必要性が生じる。
【0009】 (発明の開示) 本発明の一つの実施形態は、画像の領域を重要領域または関心領域に分類する
ための装置および方法である。このような分類に役立つパラメータを最初に、顔
面ブロック、エッジブロック、および動きブロックの存在を検出するブロック分
類器から引き出すことができる。このように検出されたブロックは重要ブロック
と見なすことができ、その後集められて「重要性マップ」または「クラスマップ
」に表示される。
【0010】 さらに、重要性マップの生成または改良に他のパラメータを使うことができる
。すなわち、音声検出器を採用して、画像シーケンス内で音声を検出し、話者と
対応付け、それによって、識別された話者を重要または関心領域として包含する
画像内でその領域を識別できる。さらに、補足的な重要性情報をユーザ定義の重
要性情報、例えば、複合化された画像を見ているユーザからの対話式入力に含め
ることができる。
【0011】 重要性情報が利用できるようになれば、本発明は、処理リソースを重要性情報
にしたがって割り当てる。例えば、余り「重要」でない領域に比べて、より「重
要」な領域により多くのビットが割り当てられ、「重要な」領域ではコード化モ
ードが変更され、および/または「重要」領域の場合さらに分割処理が改善され
る。
【0012】 別の実施形態では、入力画像シーケンスの形成も重要性情報にしたがって遂行
される。すなわち、符号化の前に入力画像シーケンスを作るために、関心領域と
識別された領域の高い解像度は、高品質ソース、例えば直接NTSC信号から獲
得される。このような入力画像シーケンスが作られることにより、ズーミングお
よび合成などの機能が可能となる。このように、フレームの様々な領域の相対的
「重要性」は、迅速に分類され、リソース割り当ておよび入力画像形成に使われ
る。
【0013】 (発明を実施するための最良の形態) 図1は、様々な領域の相対的な「重要性」に基づいて画像の領域を分類し、そ
の重要性情報を適宜使用して処理リソースを割り当て、符号化の前に入力画像シ
ーケンスの操作を制御する本発明の装置100のブロック線図を描いている。本
発明の好ましい実施形態は、下記でエンコーダを使って説明されているが、本発
明をたいていの画像処理システムに採用できると解釈できる。さらに、本発明を
様々なコード化規格に準拠しているエンコーダに採用できる。これら規格には、
動画専門家グループ標準(例、MPEG−1(11172−*)、MPEG−2
(13818−*)およびMPEG−4)、H.261およびH.263が含ま
れるが、これらに限定されるものではない。
【0014】 装置100はエンコーダ、またはより複雑なブロックベースの動き補償コード
化システムの一部である。装置100は、予備処理モジュール120、入力画像
処理モジュール110、動き推定モジュール(ME)140、動き補償モジュー
ル150、モード決定モジュール157、レート制御モジュール130、転送モ
ジュール(例えば、DCTモジュール)160、量子化モジュール170、コー
ダ、(例えば、可変長コーディングモジュール)180、バッファ190、逆量
子化モジュール175、逆転送モジュール(例えば、逆DCTモジュール)16
5、減算器115、および加算器155から成る。エンコーダ100は、複数の
モジュールから成るが、当業者たちは、それぞれのモジュールにより実行される
機能を図1に示されている通り別々のモジュールに分離する必要はないことを十
分に理解している。たとえば、動き補償モジュール150、逆量子化モジュール
175および逆DCTモジュール165から成るモジュールセットは一般的に、
「埋込み型デコーダ」として知られている。
【0015】 図1は、パス106から高解像度画像信号、例えばNTSC信号を獲得するた
めの画像取込みデバイス108、例えばビデオカメラを図示している。この高解
像度画像信号は一般的に、入力画像処理モジュール110が受け取り、サブサン
プルが採取され、パス112でエンコーダへの画像シーケンスを生成する。すな
わち、多くの状況において、獲得された画像解像度はエンコーダに伝送された解
像度よりも高い。このように、結果としてパス112で得られる入力画像(画像
シーケンス)はデジタル化され、MPEG標準にしたがって輝度および2つの色
差信号(Y、Cr、Cb)として表される。これら信号はさらに、各ピクチャ(フ
レーム)が複数のマクロブロックによって表されるよう、複数の層に分割される
。各マクロブロックは、4つの輝度ブロック、一つのCrブロックおよび一つの
bブロックから成り、ここで、ブロックは、8×8のサンプルアレイとして定
義される。
【0016】 下記開示ではMPEG標準用語を使用しているが、マクロブロックまたはブロ
ックという用語は、符号化の基礎として使われる任意のサイズのピクセルブロッ
クまたは形状を説明するための用語であると解釈すること。大まかに言えば、「
マクロブロック」または「ブロック」を、単一のピクセルまで小さくしたり、ビ
デオフレーム全体まで大きくしたりできる。
【0017】 本発明の一つの実施形態では、関心領域は、パス106の高解像度画像信号の
中のこれら関心領域の対応部分が維持されるよう識別され、それにより選択的入
力画像形成が実行される。例えば、人間の話者を定義する関心領域を、入力画像
処理モジュール110が利用できるようにする場合、サブサンプルの採取なしで
話者の高解像度が維持され、パス112のエンコーダへ送られる。この方法では
、画像シーケンス内の各フレームまたはピクチャは、サブサンプルとして採取さ
れた領域と高解像度領域を含むことができる。高解像度領域を活用して、以下で
論じるズーミングや合成が可能になる。
【0018】 高解像度領域が識別され、エンコーダがそれを利用できるようになると、エン
コーダは固有のアプリケーションの要求に応じていくつかの異なる手法で画質を
高めたり、画像を符号化したりできる。例えば、画像の特定の領域の画質を高め
ることができると考えられる4つの方法を、空間解像度を変更することにより、
および/または画質を変更することにより実現できる。
【0019】 第1の実施形態では、画像解像度は一定に維持されている一方、画質が変更さ
れる。すなわち、関心領域(ROI)の画質は改善される、例えば量子化器の縮
尺が縮小される。一方、非関心領域の画質は低下する、例えば量子化器の縮尺が
拡大される。すなわち、量子化器の縮尺を大きくしても、他のすべての領域につ
いて現フレームの画質を、少なくとも非常に低い品質に維持できるだけである。
現フレームの低画質バージョンを維持することにより、現フレームで関心領域が
別の領域に変更されたとき、システム全体が迅速に反応できる、すなわち関心領
域の変化において短い待ち時間応答が可能になる。実際に、極端な状況では、エ
ンコーダは変換係数の、例えば余り重要でないまたは重要でない領域(すなわち
非ROI)のためだけのDCコンポーネントのサブセットを送るだけでもよい。
画質に影響するほかのパラメータもまた、要求に応じて変更することができる。
現フレームの非常に低い画質のバージョンは、識別された高解像度領域と組み合
わせて符号化することができる。すなわち、利用可能なコード化ビットの大部分
が、フレームの他の部分を犠牲にして、関心領域の識別に使われる。エンコーダ
は特定のフレームにおいて何が重要であるかを知っているため、必要に応じてコ
ード化リソースを効率的に割り当てることができる。
【0020】 現フレームに高解像度領域を実際に合成することは、システム全体の考えで実
行されることに留意すること。すなわち、エンコーダとデコーダの両方に合成機
能を使って仕事を割り当てることができる。ただし、合成機能がデコーダに任さ
れている場合、柔軟性がより大きくなることが認められている。下の表1は、2
つの異なる実施形態を図示している。ここで、1)識別されたROIは、より重
要性の低い領域と組み合わせた合成ストリームとして符号化される、または2)
識別されたROIとより重要性の低い領域が、2つの別々のストリームに符号化
され、合成機能はデコーダに任される。
【0021】 第2の実施形態では、画質は一定に維持される一方、ROIの解像度が変更さ
れる。例えば、「ズーミングされた」バージョンのROIだけが符号化されるの
に対し、画像の残り部分は符号化されない。
【0022】 第3の実施形態では、低画質および低解像度の非重要領域が、高画質および高
解像度ROIとともに符号化される。例えば、ROIを視野全体の低アクティビ
ティ領域で合成することができ、この合成画像が符号化される。別の方法として
、低画質および/または解像度の視野全体を、関心ウインドウの高解像度領域内
に沿って合成できる。
【0023】 第4の実施形態では、識別されたROIおよび余り重要でない領域が2つの別
のストリームに符号化され、この場合、合成機能はデコーダに任される。このよ
うに、4つの実施形態を説明したが、表1は特定のインプリメンテーションの要
求に応じて多くの変形が可能であることを示している。
【0024】
【表1】
【0025】 図1に戻ると、好ましい実施形態では、デジタル化された入力画像信号は、予
備処理モジュール120の中で一つ以上の処理ステップを経る。もっと詳しく言
えば、予備処理モジュール120は、ブロック分類器121、分割モジュール1
51、音声検出器125、ユーザ選択モジュール126、および重要性マップ生
成器または弁別器127から成る。簡単に言えば、予備処理モジュール120は
入力画像シーケンスを解析し、特定のアプリケーションにしたがって各フレーム
の関心領域または重要領域に関してフレーム単位で表示される重要性マップを生
成する。重要性マップはその後、様々な符号化機能、例えば動き推定、コード化
モード決定、レート制御および入力画像形成などを制御するのに採用される。重
要性マップの生成およびその後の使用に関する詳細説明を下に示す。
【0026】 図1へ戻ると、動きベクトル推定のため、パス112の入力画像も動き推定モ
ジュール(ME)140で受信される。動きベクトルは、動き補正が現在のピク
チャにあるブロックの座標位置から基準フレームにあるブロックの座標までのオ
フセットを提供するために使用する二次元ベクトルである。動きベクトルの使用
は、現在のフレーム内の変更箇所のみをコード化して転送するため、チャネルを
通して伝送される情報の量を減らすことにより、画像圧縮率を大幅に高める。本
発明の実施様態の一つでは、動き推定モジュール140がまた、処理モジュール
120からの重要性情報を受け取り、動き推定処理の性能を高める。例えば、重
要であると分類されたブロックは、補足的な動き推定処理、例えばハーフ−ぺル
動き推定を受け取ってもよい。
【0027】 動き推定モジュール140からの動きベクトルを、動き補正モジュール150
が受信して、サンプル値の予測の有効性を改善する。すなわち、動き補正モジュ
ール150は、先に復号化されたフレームと動きベクトルを使って、パス152
の現在のフレームの推定(動き補正された予想または予想された画像)を構築す
る。誤り信号またはパス153の予測剰余を作るため、現在のマイクロブロック
の中のパス112の入力画像から、減算器115を介して、この動き補正された
予想を減算する。
【0028】 次に、モード決定モジュール157は予測剰余を使って、各マクロブロックご
とのコード化モードの選択を決定する。モード決定は、様々なコード化モードの
中から、各ビデオエンコーダの構文の制約の範囲内で利用可能なモードを決定す
るプロセスである。概して、これらコード化モードは、インターモードコード化
とイントラモードコード化の2つの広範な区分にグループ分けされる。例えば、
MPEG−2は、イントラモード、動き補正なしモード(No MC)、スキッ
ピング、フレーム/フィールド/デュアルプライム動き補正インターモード、フ
ォワード/バックワード/平均インターモード、およびフィールド/フレームD
CTモードを含むマクロブロックコード化モードを提供する。現譲受人が共同所
有し、参照してここに組み込まれる、1997年12月31日に提出された、シ
リアル番号09/001,703の「コード化システムのレートおよび歪みを基
礎とするコード化モード選択のための装置と方法」と題された米国特許でコード
化モードを選択する方法が開示されている。一つの実施形態では、コード化モー
ドが、識別された関心領域にしたがって選択される。
【0029】 予測剰余信号は、例えばDCTモジュール160または離散コサイン変換(D
WT)などの変換モジュールへ引き渡される。DCTモジュールはその後、予測
剰余信号の各ブロックでフォワード離散コサイン変換プロセスを実施し、1セッ
トの8×8ブロックDCT係数を生成する。
【0030】 結果として選られたDCT係数の8×8ブロックを、量子化(Q)モジュール
170が受け取り、ここでDCT係数が量子化される。量子化のプロセスは、D
CT係数を整数値にするため適切な丸めが行われた1セットの量子化値または量
子化スケールで割って表される正確さを低くする。この値を用いてDCT係数を
量子化することにより、DCT係数の多くはゼロに変換され、それによって画像
圧縮効率が改善される。
【0031】 次に、結果として選られた、量子化されたDCT係数の8×8ブロックを、例
えば可変長コード化モジュール180などのコーダが、信号接続171を介して
受け取る。このとき、量子化された係数の二次元ブロックは、「ジグザグ」順に
走査され、量子化されたDCT係数の一次元ストリングに変換される。可変長コ
ード化(VLC)モジュール180は次に、量子化DCT係数のストリングを符
号化し、例えばマクロブロックタイプや動きベクトルなどのマクロブロックに関
するあらゆる付帯情報を有効なデータストリームに変換する。
【0032】 データストリームは、例えば「先入れ先出し」(FIFO)バッファ190な
どのバッファに入り、エンコーダ出力をビットレートを平滑化するためのチャネ
ルに合わせる。FIFOバッファ190からのパス195の出力信号は、入力画
像110が圧縮されたものであり、ここで前記出力信号は保存媒体または遠距離
通信チャネルへ送られる。
【0033】 レート制御モジュール130は、データストリームの伝送後、デコーダ側(受
信機やターゲット保存装置、(図示せず))でのオーバーフローおよびアンダー
フローを防止するため、FIFOバッファ190へ入るデータストリームを監視
し、調整する役割を果す。本発明の一つの実施形態では、量子化のプロセスは、
ビット割当てを実施するため重要性マップ生成器127から受け取った重要性情
報にしたがって調整される。すなわち、量子化は、エンコーダを制御して、その
出力を所与のビットレートに合わせる(ビット制御)有効なツールである。すな
わち、量子化スケールが大きければ、コード化ビット数は少なくなる一方、量子
化スケールが小さければコード化ビット数は多くなる。各マクロブロックごと、
各サブブロックごと、または個々のDCT係数ごとに別々の量子化値を選択でき
るため、量子化スケールを適正に選定することによりコード化ビットの数を厳密
に制御できる。
【0034】 すなわち、共通画像コード化標準では、量子化パラメータまたはスケール、Q
を変更することにより画像の様々な部分の画質を制御する。このように、ビュー
アに対する様々な領域の重要性の違いを反映するため、フレームの異なる領域を
異なるQを用いてコード化することができる。本発明では、フレームに割り当て
られるビットの厳密な管理が維持されるよう、またQがブロックの相対的重要性
を反映するよう、Qをフレームにわたって変化させる方法が提示されている。さ
らに詳しく言えば、関心領域には小さい量子化スケールが適用されるのに対し、
非関心領域には、大きい量子化スケールが適用される。本質において、現在のフ
レームへのビット割当てを維持しながら、関心領域に高画質または高解像度を提
供する交換条件として非関心領域のテクスチャ情報は犠牲にされる。
【0035】 図1へ戻ると、量子化モジュール170から結果として得られた、量子化済み
のDCT係数の8×8ブロックを、例えば逆DCTモジュールなどの逆量子化モ
ジュール175と逆変換モジュール165が、信号接続172を介して受け取る
。簡単に言えば、この段階では、エンコーダが、IフレームやPフレームが後に
続く符号化の参照フレームとして使われるよう、データを復号することにより画
像シーケンスのIフレームとPフレームを再生成する。
【0036】 ブロック分類器121は、例えばスキン−トーン検出器122、エッジ検出器
123、および動き検出器124などの複数の検出器を使って一つのフレーム内
のブロックの相対的重要性を分類する。このようなブロック分類器の例が、本書
と同時に提出され、参照して本明細書に組み込まれる、代理人認可証番号SAR
12802の「ブロック分類と適応ビット割当てのための方法と装置」と題さ
れた米国特許出願で開示されている。ブロック分類器121を使って領域(例え
ばブロック)を重要領域または関心領域として迅速に分類することができる。
【0037】 次に、検出されたブロックには、「重要性マップ」または「クラスマップ」を
生成するための重要性マップ生成器127が適用される。「重要性マップ」は、
特定のアプリケーションにしたがって、各フレームにおける関心領域をフレーム
ごとに表示したものである。そして次に、重要性マップを使って、様々な画像処
理機能を改善し、上に論じた通り入力画像形成を実施できる。
【0038】 一つの実施形態では、重要性マップ生成器127は音声検出器125から入力
を受け取る。音声検出器125は、音響信号を検出するため一つ以上のマイクロ
ホン104に連結されている。画像内の話者を特定のマイクロホンで検出される
話者の音響信号にしたがって識別できるよう、マイクロホンを間隔をおいて配置
することができる。例としてテレビ電話を用いると、重要性マップ生成器127
は、電話会議開始の前に最初にすべての人の顔を関心領域として識別することが
できる。電話会議が始まると、画像シーケンスの中の話者を音声検出器125が
検出する。この情報は重要性マップ生成器127に与えられ、重要性マップ生成
器は検出された音声信号と、スキン−トーン検出器122が検出した人の顔を関
連付ける。その後、重要性マップは適宜洗練され、例えば現在の話者は関心領域
として分類される一方、他の非話者はもはや関心領域としては分類されなくなる
。別の方法として、特定の領域の関心度を表す、重要性の範囲または有意値を、
適宜割り当てることができる。
【0039】 別の実施形態では、重要性マップ127は、ユーザが予め重要であると定義し
たブロックを識別するための、ユーザ選択モジュール126からの入力を受け取
る。例えば、ユーザは、画像シーケンスのいくつかの領域を重要であると予め定
めることができるような画像シーケンスの内容に関する知識を事前に持っている
ことがある。例えば、テレビ電話会議でチャートを使って説明することが予定さ
れている場合、エンコーダにチャートを含むオブジェクトを重要なものとして処
理し、適宜処理リソースを割り当てるよう知らせることができる。
【0040】 別の方法として、ユーザ選択モジュール126はデコーダからパス104の入
力を受け取ることができる。この実施形態では、デコーダのビューアは会話方式
で関心領域を定義できる。例えば、デコーダ側のビューアは、非話者を現在の話
者よりもっと鮮明に見たいと希望したり、画像の特定の領域をズームインするズ
ーム機能を要求することができる。この会話方式の機能により、デコーダは適宜
ズーミングを行ったり、画像を合成したりできる。この機能なしでは、デコーダ
は符号化されたデータにしかアクセスできないため、デコーダのズーミングおよ
び合成能力は制限され、符号化されるデータはデコーダからの入力なしに生成さ
れる。デコーダに重要性マップ生成器へのアクセスを許可することにより、デコ
ーダ側のビューアは、符号化されるデータの内容をビューアの必要性に合うよう
、ここでいくらか制御することができる。
【0041】 予備処理モジュール120の中には、各フレーム内のオブジェクトを分割また
は弁別するための分割モジュール151も用意されている。動作中、セグメンテ
ーションモジュール151は、そのセグメンテーション方法を実施または洗練す
るため「重要性マップ」を随意に適用できる。すなわち、「重要性マップ」は顔
情報の場所、オブジェクトのエッジ、および動き情報を含んでいることがあり、
セグメンテーションモジュールが一つのフレームを一つ以上の論理オブジェクト
に分割する際にセグメンテーションモジュールを助ける情報を明らかにすること
によって、セグメンテーション方法による計算の過熱を大幅に減らすことができ
る。例えば、特定のサイズの顔情報などを持つフレーム内の各オブジェクトを分
割する場合である。別の方法として、オブジェクトをユーザからの対話方式入力
に基づいて分割することができる。例えば、チャートをもっと大きなオブジェク
ト、例えば背景、から分離したオブジェクトとして分割する場合である。
【0042】 最後に、予備処理セクション120も、重要性マップを生成するためのマップ
生成器または弁別器127含んでいる。マップ生成器127はブロック分類器1
21、音声検出器125、およびユーザ選択モジュール126から、ブロック分
類に関する情報を受け取り、全体的な重要性マップを生成する。一つの実施形態
では、検出器からの様々な入力が表2に示す通り重み付けされる。
【0043】
【表2】
【0044】 特定のアプリケーションに応じて、上の検出器のいずれかの組み合わせを採用
できることに留意のこと。このように、上で論じた通りの有意値割当てスキーム
が例として提供される。
【0045】 図2は、入力画像形成を実施するために重要性情報を適用する方法200のフ
ローチャートを示している。方法200はステップ205から始まり、ステップ
210まで進み、ここで関心領域情報を生成する、すなわち、重要性マップ生成
器127が下の図3に図示されている通りに生成する。
【0046】 ステップ220で、方法200は識別された関心領域について高い解像度を獲
得する、例えば、サブサンプリングなしに画像取込みデバイスから直接獲得する
。識別された関心領域に関しては、特定のアプリケーションの要求に応じて、例
えば合成などの機能を実施するため、高解像度および低解像度の両方を獲得でき
ることに留意のこと。
【0047】 ステップ230では、入力画像形成が一旦実施されると、方法200は新たに
作られた入力画像にしたがって、随時ビット割当てを変更することができる。例
えば、高解像度の関心領域には、非関心領域を犠牲にして、必要に応じてコード
化ビットが追加される。
【0048】 ステップ240では、入力画像形成が一旦実施されると、方法200は新たに
作られた入力画像を用いて随時ズーミングを適用できる。例えば、高解像度の関
心領域を使って、その領域のズーミングを行うことができる。
【0049】 ステップ250では、入力画像形成が一旦実施されると、方法200は新たに
作られた入力画像を用いて随時合成を適用できる。例えば、高解像度の関心領域
を低解像度領域と組み合わせて、例えばピクチャ内ピクチャ機能として表示でき
る。その後、方法200はステップ255で終了する。
【0050】 図3は、重要性マップを決定するための方法300のフローチャートである。
方法300はステップ305から始まりステップ310へ進み、ここで方法30
0は、ブロック分類器121が提供する入力にしたがって関心領域情報を生成す
る。
【0051】 ステップ320では、方法300は、例えば音声検出器125によって、音声
が検出されたかどうかを問い合わせる。問合わせに対し否定的な回答が返された
場合、方法300はステップ340へ進む。問合わせに対し肯定的な回答が返さ
れた場合、方法300はステップ330へ進み、そこで関心領域は検出された音
声にしたがって修正される。
【0052】 ステップ340では、方法300は、例えばユーザ選択モジュール126を使
って、ユーザ選択情報が検出されたかどうかを問い合わせる。問合わせに対し否
定的な回答が返された場合、方法300はステップ360へ進み、そこで重要性
マップが生成される。問合わせに対し肯定的な回答が返された場合、方法300
はステップ350へ進み、そこで関心領域はユーザ選択情報にしたがって修正さ
れる。方法300はステップ365で終了する。
【0053】 図4は、本発明の復号化システム400のブロック線図である。復号化システ
ム400は、バッファ410、ビデオデコーダ420、関心領域識別器430、
ユーザ選択モジュール440、およびディスプレイバッファ450から成る。
【0054】 動作中、符号化されたビットストリームは通信チャネルからバッファ410へ
入る。符号化されたビットストリームは、符号化された画像を復号するためのビ
デオデコーダ420と、復号された画像シーケンス内の各フレームの関心領域を
識別するための関心領域識別器430の両方へ送られる。識別された関心領域に
より、ビデオデコーダ420は、先に論じたズーミングや合成などのいくつかの
機能を実施することができる。
【0055】 ビデオデコーダ420は、アルファ平面クリエータ422と合成モジュール4
24を持つ物として図示されている。すなわち、アルファ平面クリエータ422
は形状符号化に関連する情報、例えばバイナリ形状符号化情報を活用して、様々
なオブジェクトの場所を迅速に作り出すことができる。次に、合成モジュール4
24が一つ以上の異なる解像度の領域を一つの画像フレームに、例えばピクチャ
内ピクチャに、合成する。
【0056】 ユーザ選択モジュール440は、パス444からユーザ入力を受け取り、エン
コーダでの重要性マップの生成を通信パス104を介して会話方式で制御できる
。例えば、デコーダのビューアは画像内のあるオブジェクトを高解像度にするこ
とを要求できる。この要求はパス104を介してエンコーダへ送られ、その後パ
ス402から高解像度の前記オブジェクトを受け取る。ビデオデコーダ420は
その後、ズーミングまたは合成機能を実施することができる。最後に、復号化さ
れた画像がディスプレイバッファ450へ送られ、表示される。
【0057】 図5は、本発明の符号化システム500と復号化システム505を図示してい
る。符号化システムは、汎用コンピュータ510と、様々な入出力デバイス52
0から成る。汎用コンピュータは、一連の画像を受信し、符号化する中央処理装
置(CPU)512、メモリ514、およびエンコーダ516から成る。
【0058】 好ましい実施形態では、エンコーダ516は上で論じた通りの単なるエンコー
ダ100である。エンコーダ516は、通信チャネルを使ってCPU512と連
結される物理デバイスであっても良い。別の方法として、記憶デバイス、例えば
磁気ディスクまたは光りディスクからロードされ、コンピュータのメモリ514
に常駐するソフトウェアアプリケーションがエンコーダ516の代わりになるこ
とができる。このように、本発明のエンコーダ100を、コンピュータ読出し可
能媒体に格納できる。
【0059】 コンピュータ510を、例えばキーボード、マウス、カメラ、カムコーダ、ビ
デオモニタ、またはテープドライブ、フロッピードライブ、ハードディスクドラ
イブまたはコンパクトディスクドライブを含むがこれらに限定されない、任意の
数のイメージングデバイスや保存デバイスなどの、複数の入出力デバイス520
と連結できる。入力デバイスは、複合化されたビデオビットストリームを生成す
るため、または保存デバイスから複合化されたビデオ画像のシーケンスを表示す
るため、コンピュータへ入力を提供する役割を果たす。最後に、符号化システム
からの符号化済み信号を復号化システム505へ送る通信チャネル530が示さ
れている。
【0060】 復号化システム505は、汎用コンピュータ540および種々の入力/出力デ
バイス550から成る。汎用コンピュータは、中央演算装置(CPU)542、
メモリ544、および一連の画像を受け取って復号化するデコーダ546から成
る。
【0061】 好ましい実施態様では、デコーダ546は、上で論じた通りの単なるデコーダ
400となっている。デコーダ546は、通信チャネルを介してCPUと連結さ
れた物理デバイスであっても良い。別の方法として、デコーダ546を、記憶デ
バイス、例えば磁気ディスクや光ディスクなどの記憶デバイスからロードされ、
コンピュータのメモリ544に常駐するソフトウェアアプリケーションに代える
ことができる。このように、本発明のデコーダ400を、コンピュータ読出し可
能媒体に格納できる。
【0062】 コンピュータ540を、例えばキーボード、マウス、カメラ、カムコーダ、ビ
デオモニタ、またはテープドライブ、フロッピードライブ、ハードディスクドラ
イブまたはコンパクトディスクドライブを含むがこれらに限定されない、任意の
数のイメージングデバイスや保存デバイスなどの、複数の入出力デバイス550
と連結できる。入力デバイスは、復号化されたビデオビットストリームを生成す
るため、または保存デバイスから復号化されたビデオ画像のシーケンスを表示す
るため、コンピュータへ入力を提供する役割を果たす。
【0063】 本書では、本発明の示すところを組み込んだ様々な実施形態を示し、詳細に説
明しているが、当業者たちは、これら教示事項を組み込んだ様々なその他実施形
態を容易に導き出すことができる。
【図面の簡単な説明】
本発明が教示するところのものは、添付の図面と組み合わせて下記の詳細説明
を見れば容易に理解される。
【図1】 図1は、様々な領域の相対的「重要性」基づいて画像の領域を分類し、重要性
情報を適宜使用して処理リソースを割り当てるための本発明のエンコーダのブロ
ック線図である。
【図2】 図2は、重要性情報を入力画像形成実施に適用する方法のフローチャートであ
る。
【図3】 図3は、重要性マップを決定する方法のフローチャートである。
【図4】 図4は、本発明のデコーダのブロック線図である。
【図5】 図5は、本発明の符号化システムと復号化システムを図示している。 理解しやすくするため、可能な場合には、図に共通の同一エレメントを指すの
に同じ参照番号が使われている。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),CN,IN,J P,KR (72)発明者 セテューラマン, スリラム アメリカ合衆国, ニュー ジャージー 州, ハイツタウン, ケンジントン ア ームズ アパートメンツ ナンバー28−ビ ー (72)発明者 ツァン, ヤ−チン アメリカ合衆国, ニュー ジャージー 州, クランベリー, サラトガ ドライ ヴ ノース 73 Fターム(参考) 5C059 KK37 KK38 MA05 MA23 MB02 MB03 MB04 MB12 MB21 MC11 MC38 ME01 NN01 NN47 PP16 PP22 PP26 PP28 RC32 SS07 SS30 TA17 TA46 TA60 TB04 TB08 TB18 TC15 TC34 TC47 TD13 UA02 UA32

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 入力画像シーケンスを作成するための方法であって、 (a) 関心領域を定義するステップと、 (b) 入力画像シーケンスのコンポーネントを作成するために高解像度の前
    記定義済み関心領域を獲得するステップと、 (c) 前記入力画像シーケンスをエンコーダへ適用するステップとを含む方
    法。
  2. 【請求項2】 (d) ズーミング機能を実施するのに前記定義済み関心領
    域の前記高解像度を適用するステップをさらに含む、請求項1記載の方法。
  3. 【請求項3】 (d) 合成機能を実施するのに前記定義済み関心領域の前
    記高解像度を適用するステップをさらに含む、請求項1記載の方法。
  4. 【請求項4】 (d) 非関心領域を定義するステップと、 (e) 前記非関心領域を低画質で符号化するステップとをさらに含む、請求
    項1記載の方法。
  5. 【請求項5】 現在の画像内のブロックを分類するための方法であって、 (a) 音声信号を検出するステップと、 (b) 前記音声信号と現在の画像内のブロックとを対応付けるステップと、 (c) 前記ブロックを重要ブロックとして分類するステップとを含む方法。
  6. 【請求項6】 前記検出ステップ(a)が複数の間隔をおいて配置されたマ
    イクロホンを使って前記音声信号を検出する、請求項5記載の方法。
  7. 【請求項7】 現在の画像内のブロックを分類する方法であって、 (a) 画像内のあるブロックをスキン−トーンブロック、エッジブロック、
    または動きブロックとして分類するためのブロック分類器を使って、現在の画像
    内のあるブロックをそのブロックの重要性に関して分類するステップと、 (b) ユーザの選択に従い、前記ブロック分類を対話形式で修正するステッ
    プとを含む方法。
  8. 【請求項8】 (c) 前記ブロック分類を検出された可聴音信号にしたが
    って修正するステップをさらに含む、請求項7記載の方法。
  9. 【請求項9】 画像内のあるブロックへ符号化リソースを割り当てる方法で
    あって、 (a) 画像内の前記ブロックの重要性情報を獲得するステップと、 (b) 符号化リソースを前記の重要性情報にしたがって前記ブロックへ割り
    当てるステップとを含む方法。
  10. 【請求項10】 前記獲得ステップ(a)が (a1) スキン−トーンブロック、エッジブロック、または動きブロックとし
    て分類するためのブロック分類器から重要性情報を獲得するステップをさらに含
    む、請求項9記載の方法。
JP2000557433A 1998-06-26 1999-06-28 領域を基礎とする画像処理方法および装置 Pending JP2002519915A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US9081398P 1998-06-26 1998-06-26
US60/090,813 1998-06-26
US09/295,526 US6496607B1 (en) 1998-06-26 1999-04-21 Method and apparatus for region-based allocation of processing resources and control of input image formation
US09/295,526 1999-04-21
PCT/US1999/014543 WO2000000933A1 (en) 1998-06-26 1999-06-28 Region-based image processing method and apparatus

Publications (1)

Publication Number Publication Date
JP2002519915A true JP2002519915A (ja) 2002-07-02

Family

ID=26782659

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000557433A Pending JP2002519915A (ja) 1998-06-26 1999-06-28 領域を基礎とする画像処理方法および装置

Country Status (4)

Country Link
US (2) US6496607B1 (ja)
EP (1) EP1090375A1 (ja)
JP (1) JP2002519915A (ja)
WO (1) WO2000000933A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007295370A (ja) * 2006-04-26 2007-11-08 Sony Corp 符号化装置および方法、並びにプログラム
JP2008517540A (ja) * 2004-10-15 2008-05-22 シードラゴン ソフトウェア インコーポレイテッド イメージ・データの通信および/または格納を管理するシステムおよび方法
JP2008147910A (ja) * 2006-12-08 2008-06-26 Yamaha Corp テレビ会議装置
JP2010278797A (ja) * 2009-05-29 2010-12-09 Canon Inc 画像符号化装置
JP2017536713A (ja) * 2014-10-02 2017-12-07 インテル・コーポレーション 対話型ビデオ会議
US10021346B2 (en) 2014-12-05 2018-07-10 Intel IP Corporation Interactive video conferencing
US10165226B2 (en) 2014-01-06 2018-12-25 Intel IP Corporation Interactive video conferencing
JP2019134323A (ja) * 2018-01-31 2019-08-08 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
KR20220146801A (ko) * 2021-04-26 2022-11-02 네이버 주식회사 싱글 스트림을 이용하여 관심 영역 고화질 영상을 제공하는 방법, 컴퓨터 장치, 및 컴퓨터 프로그램

Families Citing this family (136)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU6206898A (en) * 1998-01-02 1999-07-26 Nokia Networks Oy A method for synchronization adaptation of asynchronous digital data streams
SE513353C2 (sv) * 1998-10-21 2000-08-28 Ericsson Telefon Ab L M Partiell hämtning av bilder i den komprimerade domänen
JP2000358183A (ja) * 1999-06-14 2000-12-26 Canon Inc 画像処理装置及びその方法
US6937773B1 (en) * 1999-10-20 2005-08-30 Canon Kabushiki Kaisha Image encoding method and apparatus
US6639942B1 (en) * 1999-10-21 2003-10-28 Toshiba America Electronic Components, Inc. Method and apparatus for estimating and controlling the number of bits
JP4219532B2 (ja) * 2000-06-09 2009-02-04 三菱電機株式会社 画像符号化装置
FR2812226B1 (fr) * 2000-07-25 2002-12-13 Mannesmann Dematic Postal Automation Sa Procede de traitement d'objets postaux de grande taille dans une installation de tri
WO2002013535A2 (en) * 2000-08-08 2002-02-14 Koninklijke Philips Electronics N.V. Video encoder using image from a secondary image sensor
US8290062B1 (en) 2000-09-27 2012-10-16 Intel Corporation Method and apparatus for manipulating MPEG video
US7158571B2 (en) * 2000-12-11 2007-01-02 Sony Corporation System and method for balancing video encoding tasks between multiple processors
EP1374559B1 (de) * 2001-03-21 2006-05-24 T-Mobile Deutschland GmbH Verfahren zur komprimierung und dekomprimierung von bilddaten
WO2002078351A1 (de) * 2001-03-27 2002-10-03 Voxar Ag Verfahren und vorrichtung zur übertragung von video- und/oder audiodaten
US7068813B2 (en) * 2001-03-28 2006-06-27 Koninklijke Philips Electronics N.V. Method and apparatus for eye gazing smart display
US7502414B2 (en) * 2001-03-28 2009-03-10 Sony Corporation Image processing device, image processing method, image processing program and recording medium
US7027655B2 (en) * 2001-03-29 2006-04-11 Electronics For Imaging, Inc. Digital image compression with spatially varying quality levels determined by identifying areas of interest
JP5388393B2 (ja) * 2001-04-27 2014-01-15 キヤノン株式会社 画像処理装置および画像処理方法、制御プログラム
JP2002330440A (ja) * 2001-05-01 2002-11-15 Sony Corp 画像伝送方法、画像伝送方法のプログラム、画像伝送方法のプログラムを記録した記録媒体及び画像伝送装置
US7773670B1 (en) 2001-06-05 2010-08-10 At+T Intellectual Property Ii, L.P. Method of content adaptive video encoding
US6970513B1 (en) 2001-06-05 2005-11-29 At&T Corp. System for content adaptive video decoding
US6909745B1 (en) * 2001-06-05 2005-06-21 At&T Corp. Content adaptive video encoder
US6968006B1 (en) 2001-06-05 2005-11-22 At&T Corp. Method of content adaptive video decoding
US6810086B1 (en) * 2001-06-05 2004-10-26 At&T Corp. System and method of filtering noise
US7583293B2 (en) * 2001-12-06 2009-09-01 Aptina Imaging Corporation Apparatus and method for generating multi-image scenes with a camera
KR100451584B1 (ko) * 2001-12-20 2004-10-08 엘지전자 주식회사 웨이블릿 변환과 움직임 추정을 이용한 동영상 부호화 및복호화 장치
US7489916B1 (en) 2002-06-04 2009-02-10 Sequoia Communications Direct down-conversion mixer architecture
WO2003107677A1 (en) * 2002-06-12 2003-12-24 British Telecommunications Public Limited Company Video pre-processing
WO2004004354A1 (en) * 2002-06-28 2004-01-08 Koninklijke Philips Electronics N.V. Spatial scalable compression
KR20040022697A (ko) * 2002-09-09 2004-03-16 한국전자통신연구원 영상 데이터 압축을 위한 움직임 추정 장치
JP4208533B2 (ja) * 2002-09-19 2009-01-14 キヤノン株式会社 画像処理装置及び画像処理方法
US7336720B2 (en) * 2002-09-27 2008-02-26 Vanguard Software Solutions, Inc. Real-time video coding/decoding
KR100539923B1 (ko) * 2003-02-10 2005-12-28 삼성전자주식회사 화상통화시 화자의 영상을 구분하여 차등적 부호화할 수있는 비디오 엔코더 및 이를 이용한 비디오신호의 압축방법
JP4155118B2 (ja) * 2003-06-13 2008-09-24 カシオ計算機株式会社 静止画合成装置、及び動画像からの静止画合成方法
WO2007142621A1 (en) * 2006-06-02 2007-12-13 Fotonation Vision Limited Modification of post-viewing parameters for digital images using image region or feature information
US7565030B2 (en) 2003-06-26 2009-07-21 Fotonation Vision Limited Detecting orientation of digital images using face detection information
US7620218B2 (en) 2006-08-11 2009-11-17 Fotonation Ireland Limited Real-time face tracking with reference images
US7844076B2 (en) 2003-06-26 2010-11-30 Fotonation Vision Limited Digital image processing using face detection and skin tone information
US8155397B2 (en) 2007-09-26 2012-04-10 DigitalOptics Corporation Europe Limited Face tracking in a camera processor
US8593542B2 (en) 2005-12-27 2013-11-26 DigitalOptics Corporation Europe Limited Foreground/background separation using reference images
US7362368B2 (en) * 2003-06-26 2008-04-22 Fotonation Vision Limited Perfecting the optics within a digital image acquisition device using face detection
US7471846B2 (en) * 2003-06-26 2008-12-30 Fotonation Vision Limited Perfecting the effect of flash within an image acquisition devices using face detection
US7574016B2 (en) 2003-06-26 2009-08-11 Fotonation Vision Limited Digital image processing using face detection information
US8989453B2 (en) 2003-06-26 2015-03-24 Fotonation Limited Digital image processing using face detection information
US9129381B2 (en) 2003-06-26 2015-09-08 Fotonation Limited Modification of post-viewing parameters for digital images using image region or feature information
US9692964B2 (en) 2003-06-26 2017-06-27 Fotonation Limited Modification of post-viewing parameters for digital images using image region or feature information
US8948468B2 (en) * 2003-06-26 2015-02-03 Fotonation Limited Modification of viewing parameters for digital images using face detection information
US7440593B1 (en) 2003-06-26 2008-10-21 Fotonation Vision Limited Method of improving orientation and color balance of digital images using face detection information
US8498452B2 (en) 2003-06-26 2013-07-30 DigitalOptics Corporation Europe Limited Digital image processing using face detection information
US8330831B2 (en) 2003-08-05 2012-12-11 DigitalOptics Corporation Europe Limited Method of gathering visual meta data using a reference image
US8896725B2 (en) 2007-06-21 2014-11-25 Fotonation Limited Image capture device with contemporaneous reference image capture mechanism
US8682097B2 (en) 2006-02-14 2014-03-25 DigitalOptics Corporation Europe Limited Digital image enhancement with reference images
US8494286B2 (en) 2008-02-05 2013-07-23 DigitalOptics Corporation Europe Limited Face detection in mid-shot digital images
US7792970B2 (en) 2005-06-17 2010-09-07 Fotonation Vision Limited Method for establishing a paired connection between media devices
US7315630B2 (en) * 2003-06-26 2008-01-01 Fotonation Vision Limited Perfecting of digital image rendering parameters within rendering devices using face detection
US7269292B2 (en) 2003-06-26 2007-09-11 Fotonation Vision Limited Digital image adjustable compression and resolution using face detection information
GB2404105A (en) * 2003-07-03 2005-01-19 Braddahead Ltd Compressing digital images
JP4100317B2 (ja) * 2003-09-30 2008-06-11 日本電気株式会社 画像符号化装置およびその量子化制御方法
US20050078186A1 (en) * 2003-09-30 2005-04-14 Kreiner Barrett Morris Video recorder
US7667731B2 (en) 2003-09-30 2010-02-23 At&T Intellectual Property I, L.P. Video recorder
US7505673B2 (en) * 2003-09-30 2009-03-17 At&T Intellectual Property I, L.P. Video recorder for detection of occurrences
US7609118B1 (en) 2003-12-29 2009-10-27 Sequoia Communications Phase-locked loop calibration system
US7496338B1 (en) 2003-12-29 2009-02-24 Sequoia Communications Multi-segment gain control system
US20060062478A1 (en) * 2004-08-16 2006-03-23 Grandeye, Ltd., Region-sensitive compression of digital video
WO2006036026A1 (ja) * 2004-09-30 2006-04-06 Fujifilm Corporation 画像補正装置および方法、ならびに画像補正プログラム
US8320641B2 (en) 2004-10-28 2012-11-27 DigitalOptics Corporation Europe Limited Method and apparatus for red-eye detection using preview or other reference images
US20060117268A1 (en) * 2004-11-30 2006-06-01 Micheal Talley System and method for graphical element selection for region of interest compression
US7315631B1 (en) 2006-08-11 2008-01-01 Fotonation Vision Limited Real-time face tracking in a digital image acquisition device
US8503800B2 (en) 2007-03-05 2013-08-06 DigitalOptics Corporation Europe Limited Illumination detection using classifier chains
US9667980B2 (en) * 2005-03-01 2017-05-30 Qualcomm Incorporated Content-adaptive background skipping for region-of-interest video coding
US7675379B1 (en) 2005-03-05 2010-03-09 Quintics Holdings Linear wideband phase modulation system
JP4822396B2 (ja) * 2005-03-29 2011-11-24 株式会社メガチップス 画像強調装置
US7595626B1 (en) 2005-05-05 2009-09-29 Sequoia Communications System for matched and isolated references
US11632498B1 (en) * 2005-06-03 2023-04-18 Craig P. Mowry Multi-dimensional imaging system and method
US10341558B2 (en) * 2005-06-03 2019-07-02 Craig P. Mowry System and apparatus for increasing quality and efficiency of film capture and methods of use thereof
JP4618430B2 (ja) * 2005-09-02 2011-01-26 富士ゼロックス株式会社 画像処理装置、画像処理方法及びそのプログラム
US20070106797A1 (en) * 2005-09-29 2007-05-10 Nortel Networks Limited Mission goal statement to policy statement translation
EP1984893B8 (en) * 2006-02-13 2018-05-16 Snell Advanced Media Limited Method and apparatus for modifying a moving image sequence
GB2435140B (en) * 2006-02-13 2011-04-06 Snell & Wilcox Ltd Sport action coding
US20070205200A1 (en) * 2006-03-02 2007-09-06 Brain Box Concepts Soap bar holder and method of supporting a soap bar
JP4671354B2 (ja) * 2006-03-15 2011-04-13 株式会社リコー 画像圧縮装置および画像圧縮方法
US20070291104A1 (en) * 2006-06-07 2007-12-20 Wavetronex, Inc. Systems and methods of capturing high-resolution images of objects
EP2033142B1 (en) 2006-06-12 2011-01-26 Tessera Technologies Ireland Limited Advances in extending the aam techniques from grayscale to color images
US7916897B2 (en) 2006-08-11 2011-03-29 Tessera Technologies Ireland Limited Face tracking for controlling imaging parameters
US7403643B2 (en) 2006-08-11 2008-07-22 Fotonation Vision Limited Real-time face tracking in a digital image acquisition device
US7894545B1 (en) 2006-08-14 2011-02-22 Quintic Holdings Time alignment of polar transmitter
US8055067B2 (en) 2007-01-18 2011-11-08 DigitalOptics Corporation Europe Limited Color segmentation
EP2115662B1 (en) 2007-02-28 2010-06-23 Fotonation Vision Limited Separating directional lighting variability in statistical face modelling based on texture space decomposition
KR101247147B1 (ko) 2007-03-05 2013-03-29 디지털옵틱스 코포레이션 유럽 리미티드 디지털 영상 획득 장치에서의 얼굴 탐색 및 검출
US8340512B2 (en) * 2007-03-15 2012-12-25 Nvidia Corporation Auto focus technique in an image capture device
US8290357B2 (en) * 2007-03-15 2012-10-16 Nvidia Corporation Auto-exposure technique in a camera
US8787445B2 (en) * 2007-03-15 2014-07-22 Nvidia Corporation Allocation of available bits to represent different portions of video frames captured in a sequence
KR20080102668A (ko) * 2007-05-21 2008-11-26 삼성전자주식회사 화상 통화 송수신 방법 및 이를 이용하는 화상 통화 장치
US7916971B2 (en) 2007-05-24 2011-03-29 Tessera Technologies Ireland Limited Image processing method and apparatus
US8023562B2 (en) 2007-09-07 2011-09-20 Vanguard Software Solutions, Inc. Real-time video coding/decoding
US7952596B2 (en) 2008-02-11 2011-05-31 Sony Ericsson Mobile Communications Ab Electronic devices that pan/zoom displayed sub-area within video frames in response to movement therein
JP5116513B2 (ja) * 2008-03-10 2013-01-09 キヤノン株式会社 画像表示装置及びその制御方法
US7855737B2 (en) 2008-03-26 2010-12-21 Fotonation Ireland Limited Method of making a digital camera image of a scene including the camera user
JP5456022B2 (ja) 2008-04-14 2014-03-26 ジーブイビービー ホールディングス エス.エイ.アール.エル. オブジェクトを自動的に追跡する技術
US8830341B2 (en) * 2008-05-22 2014-09-09 Nvidia Corporation Selection of an optimum image in burst mode in a digital camera
US8520089B2 (en) * 2008-07-30 2013-08-27 DigitalOptics Corporation Europe Limited Eye beautification
EP2277141A2 (en) 2008-07-30 2011-01-26 Tessera Technologies Ireland Limited Automatic face and skin beautification using face detection
US8570359B2 (en) * 2008-08-04 2013-10-29 Microsoft Corporation Video region of interest features
KR20100095833A (ko) * 2009-02-23 2010-09-01 주식회사 몬도시스템즈 Roi 의존형 압축 파라미터를 이용하여 영상을 압축하는 장치 및 방법
US8379917B2 (en) 2009-10-02 2013-02-19 DigitalOptics Corporation Europe Limited Face recognition performance using additional image features
US20110141224A1 (en) * 2009-12-11 2011-06-16 Fotonation Ireland Limited Panorama Imaging Using Lo-Res Images
US8294748B2 (en) * 2009-12-11 2012-10-23 DigitalOptics Corporation Europe Limited Panorama imaging using a blending map
US20110141225A1 (en) * 2009-12-11 2011-06-16 Fotonation Ireland Limited Panorama Imaging Based on Low-Res Images
US10080006B2 (en) * 2009-12-11 2018-09-18 Fotonation Limited Stereoscopic (3D) panorama creation on handheld device
US20110141229A1 (en) * 2009-12-11 2011-06-16 Fotonation Ireland Limited Panorama imaging using super-resolution
US20110141226A1 (en) * 2009-12-11 2011-06-16 Fotonation Ireland Limited Panorama imaging based on a lo-res map
US8526488B2 (en) 2010-02-09 2013-09-03 Vanguard Software Solutions, Inc. Video sequence encoding system and algorithms
US8588309B2 (en) * 2010-04-07 2013-11-19 Apple Inc. Skin tone and feature detection for video conferencing compression
US8356114B2 (en) 2010-04-15 2013-01-15 Canon Kabushiki Kaisha Region of interest-based image transfer
US8755441B2 (en) 2010-05-10 2014-06-17 Canon Kabushiki Kaisha Region of interest-based video transfer
US8248448B2 (en) * 2010-05-18 2012-08-21 Polycom, Inc. Automatic camera framing for videoconferencing
US9723260B2 (en) 2010-05-18 2017-08-01 Polycom, Inc. Voice tracking camera with speaker identification
US8842161B2 (en) 2010-05-18 2014-09-23 Polycom, Inc. Videoconferencing system having adjunct camera for auto-framing and tracking
US8395653B2 (en) 2010-05-18 2013-03-12 Polycom, Inc. Videoconferencing endpoint having multiple voice-tracking cameras
CN103081455B (zh) 2010-11-29 2017-03-08 快图有限公司 从手持设备所捕获的多个图像进行肖像图像合成
IT1403450B1 (it) * 2011-01-19 2013-10-17 Sisvel S P A Flusso video costituito da frame video combinati, e procedimento e dispositivi per la sua generazione, trasmissione, ricezione e riproduzione
US8693551B2 (en) 2011-11-16 2014-04-08 Vanguard Software Solutions, Inc. Optimal angular intra prediction for block-based video coding
WO2013147756A1 (en) * 2012-03-28 2013-10-03 Intel Corporation Content aware selective adjusting of motion estimation
US9621780B2 (en) 2012-10-04 2017-04-11 Nvidia Corporation Method and system of curve fitting for common focus measures
US9392158B2 (en) 2012-10-04 2016-07-12 Nvidia Corporation Method and system for intelligent dynamic autofocus search
JP5693550B2 (ja) * 2012-11-30 2015-04-01 キヤノン株式会社 診断支援装置およびその制御方法、診断支援システム、プログラム
EP2936802A4 (en) * 2012-12-18 2016-08-17 Intel Corp MULTI REGIONAL VIDEO CONFERENCE CODING
US9106922B2 (en) 2012-12-19 2015-08-11 Vanguard Software Solutions, Inc. Motion estimation engine for video encoding
US9031393B2 (en) 2013-06-12 2015-05-12 Nvidia Corporation Methods for enhancing camera focusing performance using camera orientation
JP2016066922A (ja) * 2014-09-25 2016-04-28 ソニー株式会社 信号処理装置、撮像装置、および、それらにおける信号処理方法。
US9684841B2 (en) * 2015-02-24 2017-06-20 Hanwha Techwin Co., Ltd. Method of transmitting moving image and surveillance system using the method
US9646410B2 (en) 2015-06-30 2017-05-09 Microsoft Technology Licensing, Llc Mixed three dimensional scene reconstruction from plural surface models
US10163247B2 (en) 2015-07-14 2018-12-25 Microsoft Technology Licensing, Llc Context-adaptive allocation of render model resources
US9665978B2 (en) 2015-07-20 2017-05-30 Microsoft Technology Licensing, Llc Consistent tessellation via topology-aware surface tracking
US10178414B2 (en) * 2015-10-14 2019-01-08 International Business Machines Corporation Aggregated region-based reduced bandwidth video streaming
JP6403728B2 (ja) * 2016-08-09 2018-10-10 キヤノン株式会社 画像処理方法および装置、画像処理システム
US10609398B2 (en) * 2017-07-28 2020-03-31 Black Sesame International Holding Limited Ultra-low bitrate coding based on 3D map reconstruction and decimated sub-pictures
US11240570B1 (en) * 2020-10-08 2022-02-01 International Business Machines Corporation Object-based video loading

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0615387B1 (en) * 1992-08-27 1999-10-13 Kabushiki Kaisha Toshiba Moving picture encoder
US5432871A (en) * 1993-08-04 1995-07-11 Universal Systems & Technology, Inc. Systems and methods for interactive image data acquisition and compression
US5689641A (en) * 1993-10-01 1997-11-18 Vicor, Inc. Multimedia collaboration system arrangement for routing compressed AV signal through a participant site without decompressing the AV signal
JPH07154763A (ja) * 1993-11-26 1995-06-16 Fujitsu Ltd 在席テレビ会議装置
US5512939A (en) * 1994-04-06 1996-04-30 At&T Corp. Low bit rate audio-visual communication system having integrated perceptual speech and video coding
CA2148631C (en) * 1994-06-20 2000-06-13 John J. Hildin Voice-following video system
US5737011A (en) * 1995-05-03 1998-04-07 Bell Communications Research, Inc. Infinitely expandable real-time video conferencing system
US5724475A (en) * 1995-05-18 1998-03-03 Kirsten; Jeff P. Compressed digital video reload and playback system
JPH08336505A (ja) * 1995-06-12 1996-12-24 Hitachi Medical Corp 磁気共鳴イメージング装置
US5886741A (en) * 1995-08-18 1999-03-23 Texas Instruments Incorporated Method and apparatus for improved video coding using a zero block predictor module
US5909513A (en) * 1995-11-09 1999-06-01 Utah State University Bit allocation for sequence image compression
US5880788A (en) * 1996-03-25 1999-03-09 Interval Research Corporation Automated synchronization of video image sequences to new soundtracks
JPH10174103A (ja) * 1996-12-13 1998-06-26 Matsushita Electric Ind Co Ltd 画像符号化装置、符号化画像記録媒体、画像復号化装置、画像符号化方法、および符号化画像伝送方法
US6023296A (en) * 1997-07-10 2000-02-08 Sarnoff Corporation Apparatus and method for object based rate control in a coding system

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008517540A (ja) * 2004-10-15 2008-05-22 シードラゴン ソフトウェア インコーポレイテッド イメージ・データの通信および/または格納を管理するシステムおよび方法
JP2007295370A (ja) * 2006-04-26 2007-11-08 Sony Corp 符号化装置および方法、並びにプログラム
JP2008147910A (ja) * 2006-12-08 2008-06-26 Yamaha Corp テレビ会議装置
JP2010278797A (ja) * 2009-05-29 2010-12-09 Canon Inc 画像符号化装置
US10165226B2 (en) 2014-01-06 2018-12-25 Intel IP Corporation Interactive video conferencing
US10148868B2 (en) 2014-10-02 2018-12-04 Intel Corporation Interactive video conferencing
JP2017536713A (ja) * 2014-10-02 2017-12-07 インテル・コーポレーション 対話型ビデオ会議
US10791261B2 (en) 2014-10-02 2020-09-29 Apple Inc. Interactive video conferencing
US10021346B2 (en) 2014-12-05 2018-07-10 Intel IP Corporation Interactive video conferencing
US10491861B2 (en) 2014-12-05 2019-11-26 Intel IP Corporation Interactive video conferencing
JP2019134323A (ja) * 2018-01-31 2019-08-08 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP7050509B2 (ja) 2018-01-31 2022-04-08 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
KR20220146801A (ko) * 2021-04-26 2022-11-02 네이버 주식회사 싱글 스트림을 이용하여 관심 영역 고화질 영상을 제공하는 방법, 컴퓨터 장치, 및 컴퓨터 프로그램
KR102516831B1 (ko) 2021-04-26 2023-03-31 네이버 주식회사 싱글 스트림을 이용하여 관심 영역 고화질 영상을 제공하는 방법, 컴퓨터 장치, 및 컴퓨터 프로그램

Also Published As

Publication number Publication date
US6917719B2 (en) 2005-07-12
US20030123751A1 (en) 2003-07-03
EP1090375A1 (en) 2001-04-11
WO2000000933A1 (en) 2000-01-06
US6496607B1 (en) 2002-12-17

Similar Documents

Publication Publication Date Title
US6917719B2 (en) Method and apparatus for region-based allocation of processing resources and control of input image formation
KR100298416B1 (ko) 구획 분류 및 적응 비트 할당을 위한 방법 및 장치
Sikora Trends and perspectives in image and video coding
Cote et al. H. 263+: Video coding at low bit rates
US5731850A (en) Hybrid hierarchial/full-search MPEG encoder motion estimation
US6055330A (en) Methods and apparatus for performing digital image and video segmentation and compression using 3-D depth information
JP4187405B2 (ja) 符号化方式におけるオブジェクトベースのレート制御装置及びその方法
US7848425B2 (en) Method and apparatus for encoding and decoding stereoscopic video
JP3788823B2 (ja) 動画像符号化装置および動画像復号化装置
US6148027A (en) Method and apparatus for performing hierarchical motion estimation using nonlinear pyramid
JP3529624B2 (ja) ピクチャの符号化方法および符号化装置
JPH09247679A (ja) スケーラブルmpeg2適合ビデオ・エンコーダ
KR20010092797A (ko) 하이브리드 일시-snr 파인 비례 축소성 비디오 코딩
WO1998015915A9 (en) Methods and apparatus for performing digital image and video segmentation and compression using 3-d depth information
EP1042734A1 (en) Apparatus and method for performing scalable hierarchical motion estimation
JP2002514866A (ja) ビデオ・フレーム・レートを増加させる方法および装置
JPH08181992A (ja) 動画像符号化装置および領域抽出装置
Zhang et al. Compression of lumigraph with multiple reference frame (MRF) prediction and just-in-time rendering
JP3703299B2 (ja) ピクチャ中央の画質を最適化するためのビデオ符号化方法、システムおよびコンピュータ・プログラム製品
JP4755093B2 (ja) 画像符号化方法および画像符号化装置
KR20020066498A (ko) 동영상 부호화 장치 및 방법
JPH09214965A (ja) 動画像符号化方法および装置
JPH10126794A (ja) 動き予測フレーム間画像信号圧縮装置
KR100203695B1 (ko) 물체 기반 부호화에 있어서의 텍스쳐 분류를 위한 전처리 장치
EP0762773B1 (en) Hierarchial video encoder and decoder