JP2007520973A - 携帯ネットワークを通した送信のための画像圧縮 - Google Patents

携帯ネットワークを通した送信のための画像圧縮 Download PDF

Info

Publication number
JP2007520973A
JP2007520973A JP2006552101A JP2006552101A JP2007520973A JP 2007520973 A JP2007520973 A JP 2007520973A JP 2006552101 A JP2006552101 A JP 2006552101A JP 2006552101 A JP2006552101 A JP 2006552101A JP 2007520973 A JP2007520973 A JP 2007520973A
Authority
JP
Japan
Prior art keywords
image frame
original image
data
frame
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006552101A
Other languages
English (en)
Inventor
カーマン、シェリフ
Original Assignee
ソニー エリクソン モバイル コミュニケーションズ, エービー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー エリクソン モバイル コミュニケーションズ, エービー filed Critical ソニー エリクソン モバイル コミュニケーションズ, エービー
Publication of JP2007520973A publication Critical patent/JP2007520973A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

携帯電話が送信する画像のビットレートを携帯電話が低減できるようにする方法およびその方法を実行するための装置である。この方法は、まず元の画像フレームの一部を除去し、画像フレーム内にデッドクラスターを発生する。次にこれらデッドクラスターをデータで満たし、元の画像フレームよりも少ないビットレートを有する新しい画像フレームを作成する。次に、新しい画像フレームが元の画像フレームを送信するのに必要であったよりも、送信中により狭いバンド幅ですむように、新しいバンド幅を狭くする。

Description

(背景)
現在の携帯無線システムは、マルチメディアサービスをよりサポートできるように変化している。特にほとんどの携帯デバイスには埋め込まれたカメラまたはカメラアクセサリーをプラグインし、これを使用できる能力がある。これによってビデオクリップおよび画像の交換、並びにリアルタイムのビデオ会議セッションを含む個人間のビデオ通信が可能となっている。しかしながら、現在の状態のセルラーネットワークは比較的高いデータレートを利用していないので、画質、機能およびその双方がかなり限られている。次世代ネットワークでも、より高いバンド幅は重要な資源に留まっており、この、より高いバンド幅を効率的に使用する技術が有効である。
(概要)
本発明は共通する、例えばかなり静止している背景を有する主題の画像またはビデオクリップのケースを解決するものである。かかるデータはマルチメディアメッセージ(MMS)として送られる前に、またはビデオフォンセッション中はリアルタイムで通常(画像のためのJPEG、すなわちH.263またはビデオクリップまたはビデオフォンビットストリームのためのMPEG−4となるように)符号化される。本発明は画像データのための、結果として生じるビットストリームのビットレートを下げるために、現在のアルゴリズムのユニークで、かつ新規な組み合わせがどのように使用され得るかを示すものである。
この目的を達成するために、携帯電話は、プロセッサと、プロセッサで読み取り可能な記憶媒体と、プロセッサで読み取り可能な記憶媒体に記憶される符号とを含む。プロセッサで読み取り可能な記憶媒体に記憶される符号は、元の画像フレームの一部を除いて、画像フレーム内にデッドクラスターを作成するための符号を含む。次にこれらデッドクラスターは元の画像フレームよりも低いビットレートを有する新しい画像フレームを作成するためのデータで満たされる。次に、元の画像フレームが必要とするよりも、送信中のバンド幅が狭くてすむように、新しい画像フレームが符号化される。デッドクラスターを満たすのに使用されるデータは白色データでもよいし、黒色データでもよい。
受信機が送信された画像を再構成するのをアシストするために、送信側携帯電話は新しい画像フレームと共に元の画像フレームの除去された部分の表示をオプションとして含むことができる。
本方法は画像フレーム内の中心にある主要主題を含む画像に対して最良に機能する。したがって、本発明は元の画像フレームに対し、ビットレート低減ソフトウェアアプリケーションを実行する前に、元の画像内の中心に主題があるかどうかを自動的に検出するためのステップまたはプロセスを含む。中心に主題がある場合、携帯電話はビットレート低減ソフトウェアアプリケーションを自動的に実行する。元の画像フレーム内の中心に主題があるかどうかを自動的に判断するために、画像フレーム内のデータに対し、輪郭検出技術が使用される。
(詳細な説明)
図1は、代表的な携帯電話110の正面図である。この携帯電話110は本明細書では本発明の説明を助けるように示されている。図2は埋め込みカメラ210を備えるように示された代表的な携帯電話110の背面図である。カメラ210は静止画像を撮影することができ、ビデオクリップを記録することも可能である。次に、これら画像および/またはビデオクリップは他の携帯電話またはコンピュータ装置に送信できる。
ユーザーに対し、満足できる結果を提供することに対する主な技術的な障害は、画像が過度に乱れないよう、またはユーザーにとって過度に長い時間がかからないよう、ビデオ画像を送受信するために必要となるバンド幅にある。携帯電話ネットワーク、すなわち無線ネットワークはデータを交換する際にバンド幅が制限される。したがって、画像送信に関して改良することは多いに価値がある。バンド幅を最大にする共通する方法は、画質を過度に低下することなく、画像またはビデオをできるだけ圧縮することである。しかしながら、データ圧縮は識別できるようにしなければならない、そうしないと、ユーザーは、楽しむことができない程度までのデータの劣化を経験することになる。
図3は本発明の機能を示すブロック図である。埋め込まれたカメラ(またはカメラアタッチメント)210は、画像(静止画像またはビデオ画像)350を発生し、携帯電話110に常駐するビットレート低減ソフトウェアアプリケーション340へ画像を転送する。このビットレート低減ソフトウェアアプリケーションは3つのフェーズに分割される。最初の2つのフェーズは捕捉した画像の符号化および送信を扱い、第3のフェーズは前のフェーズにしたがって符号化された受信画像データのプレゼンテーションを扱う。このソフトウェアアプリケーションは記憶媒体320およびRF部品310にアクセスし、これらを制御するプロセッサ330によって実行される。
フェーズ1(350)は対応しないエリアを除去するために符号化前に画像または捕捉したビデオストリームのフレームを予備的に処理することに関係する。このフェーズ1は背景を除去すること、および除去されたエリア(デッドクラスター)を適当なデータで満たすことを含む。デッドクラスターを適当なデータで満たすことにより、アップカミング符号化フェーズ中のバンド幅の効率化が可能となる。フェーズ2(360)は従来の技術を使ってデータを符号化することに関係し、これによって前のフェーズでデッドクラスター満たされたと仮定した場合、より効率的となることを証明できる。フェーズ3(390)は、除去されたエリアの影響を最小にする方法で送信データのプレゼンテーションをする。
埋め込みカメラ(または取り付け可能なカメラアクセサリー)を使って1つのフレームが捕捉されると、フレーム内の画像データに対して背景除去アルゴリズムが適用される。この背景除去アルゴリズムは当技術分野で周知のものであり、例えば1999年、イタリア、ユディンにおける、画像分析および処理に関する第10回国際会議の論文“Background Removal in Image Indexing and Retrieval”に記載されている。このアルゴリズムの結果、画像の背景に対応する、本明細書でCL−リストと記載する一組のクラスターが得られる。画像のこの部分は別の携帯電話に送信するのに特に適したものではない。
一般に、画像符号化方式はブロックをベースとする。画像の符号化がブロック(例えばJPEGまたはMPEG−4では8×8ブロック)をベースとする場合、CL−リストのクラスター内に含まれる8×8ブロックの最大の組が推定され、クラスターの新しいリスト(CL−リスト−B)が発生される。このことは、背景エリアのエッジにある部分的ブロックを検討しなくてもよいことを保証するものである。その理由は、これら部分ブロックは符号化アルゴリズムでは無視されるからである。この段階では、符号化アルゴリズムが使用するブロック形状に形状が適合する四角形のクラスターのリストが存在する。ここで、符号化アルゴリズムがブロックをベースとしない場合、CL−リストはそのままに維持される。
次のステップは、CL−リスト−Bに含まれるすべてのブロック(または元のCL−リストのすべてのクラスター)を純白色のピクセルで満たすことである。フェーズ2で示されるように、これらすべて白色のエリアを最適に符号化する。このステップを「デッドクラスターの充満:dead cluster filling」と称す。現在では、すべての背景データを純白色データで置換した画像フレームの新しいバージョンが存在する。
JPEG、MPEG−1、MPEG−2、MPEG−4およびH.263のようなDCTに基づく符号化アルゴリズムのケースでは、すべて黒色で満たされた部分が過度に作動することに留意すべきである。次のステップで分かるように、発生されたビットストリームが最適なエントロピーまたは演算符号化、すなわち連続的な冗長ビットをシュリンクする任意のビットをベースとする無損失符号化を可能にすることが最も重要である。
(静止画像に対し)JPEGを使用し、または(クリップに対し)MPEG−またはH.263を使用して符号化を実行するとき、符号化のうちの離散的コサイン変換(DCT)は、黒色、すなわち0にセットされたカラー成分しか含まないブロックとしてCL−リスト−Bのすべての背景ブロックに遭遇する。従って、このブロックは変更されない。シリアル化すると、このブロックは圧縮アルゴリズムの最後の処理ステップとして、Lempel Ziv Welch(LZW)、ハフマンまたは算術的符号化方式を使用して最適に符号化される連続ゼロビットストリームを発生する。これによって0でないカラー成分を含むだけでなく、不連続的となりやすい(すなわち極めて少数の、接続されたカラーが一様な領域を含む、実際の背景と比較してかなりのビットストリームの低減を達成できる)。
符号化アルゴリズムの将来の展開を検討すると、すべてのリニア変換(例えばフーリエ変換)は0ベクトルに変換し、変換が非縮退的であるとき、それらの核は専ら0ベクトルに縮小される。このことは、通常高速フーリエ変換(FFT)から推定されるDCTのような離散的形態のケースである。従って、本発明の技術を使用し、任意の種類のリニアデジタルブロック変換により同じバンド幅の改良を得ることが可能である。
このアルゴリズムはフラクタル圧縮のようにブロックに基づかない非DCTをベースとする技術にも適用できる。フラクタル圧縮は、選択された基本形状(通常三角形)から構成されたメッシュとなるように画像をセグメント化する。この場合、フェーズ1はブロックではなく、これら形状を使って元のCL−リストからCL−リスト−Bを推定する。その後の符号化も最適な結果を生じさせる。その理由は、背景に含まれるすべての基本形状は自らアフィン変換に類似し、フラクタル圧縮原理で高度の圧縮を達成できるからである。
MPEG−4符号化または非四角形対象を使用する同様な技術の高度プロフィルを使用するときに、ブロックをベースとするケースの改良点を追加できる。かかるケースでは、画像内のクラスターを補足する非四角形対象(すなわちしゃべっている人の実際の輪郭)を自ら非四角形対象として視覚化し、符号化されたビットストリームから背景全体を剥離する(すなわちこのケースではデッドクラスターを満たすことは不要である)。
符号化を行うと、画像をすぐに送信できる状態となる。非四角形対象(不要の場合)を有する改善されたMPEG−4のケースを除き、符号化されたデータと共にクラスターリストCL−リスト−Bを送り、受信されたデータのより良好なプレゼンテーションが可能となるが、技術を使用するにはこのことは不要である。
この時点でデータはすぐに送信できる状態にある。送信技術は本明細書に説明する発明には適当ではなく、ビットサイズ、ビットレートを低減することによって(MMSのような)非同期送信モードおよび(ビデオフォンセッションのような)同期送信モードは利益を享受できる。この技術はビデオ電話または(ニュースキャスト、スピーチ、サンプル物品の広告などのような)前景の中心にあるオブジェクトクリップに対してより適すように見えるが、MMSの現在のバージョンのように送信されるデータサイズの上限の境界が定められている場合、(例えばMMSによる)静止画像の送信も、サイズの低減から利益を享受できる。
送信の他方の端部で画像データが受信されると、復号されたときの各フレーム(または静止画像である場合には単一フレーム)は、純白色に設定された除去された背景を有する対応するデータしか含んでいない(または高度MPEG−4プロフィルのケースでは、背景を全く含まない)。この時点で各画像に対応するCL−リスト−Bを送ることもできるし、送らなくてもよい。CL−リスト−Bは比較的小さく、大きな四角形のエリアのリストしか記述しないので、送信バンド幅に極めて低いオーバーヘッドしかもたらさない。特にこのオーバーヘッドは背景を除去することによって得られるゲインと比較して極めて小さい。
携帯ユーザーに受信された画像のプレゼンテーションをするためのオプションは多数存在する。本明細書では数種のオプションについて説明する。最初の最も簡単なオプションは、まさに受信した画像フレームを提供すること、すなわち純白色背景を有する画像フレームを提供するか、または携帯電話により適した無地色(または無地のテクスチャー)となるように背景を置換することである。この背景は受信携帯電話デバイスに記憶された所定の組となるように背景に置き換えてもよい。ユーザーはテーマが定められた背景のリストから選択するオプションを有することができる。別のオプションは、純白色の背景を透明なカラーと見なし、受信したフレームと現在の携帯電話の背景とをアルファブレンドすることである。または背景がビューエリアのノイズレベルに適合するように、背景に人工的なノイズパターンを追加してもよい。例えば可視エリアの信号対ノイズ比(SNR)を選択し、その特定のSNRに適合するよう、(ぼかしアルゴリズムのような)人工ノイズパターンを適用できる。更に別のオプションは、背景を除くことにより、画像の対応する部分のエッジで生じるブロッキング効果を防止するために、フレーム前景のエッジをスムーズにするか、またはぼかすことである。別の可能性は、前景上で輪郭検出を行うことである。しゃべっている人物の輪郭を越えるエリアを除くか、またはスムーズ化するか、ぼかすか、または背景と融合することができる。スムーズ化はメジアンフィルタを使って実行できる。輪郭検出は、古典的なカニアルゴリズムまたはシェン−キャスタン(Shen−Castan)を使って実行できる。ぼかしは小さいパッチにゼロ平均ガウスノイズを使用することにより達成でき、このガウスノイズのレベルは予め決定した値に容易に設定でき(SNRはガウス偏差に関連する)、すべてのパッチでこのプロセスを繰り返す。
上記オプションでは、ユーザーが良好な視界を経験できるようにするために、これら技術のうちの1つ以上を組み合わせることができる。すべてのオプションは複雑さが異なり、異なるレベルの視覚上の画質を発生する。関連する妥協は、製品の設計上の事項である。
比較的静止した背景に対してメインオブジェクトが中心のフレームとなっている場合、本発明の効果が高くなる。ソフトウェアアプリケーション内のマン/マシンインターフェース(MMI)機能は、この設定時に限り効率的な圧縮を起動することをユーザーに明らかに求めることができる。この技術の改善はフェーズワンに先立つフェーズ0を含み、このことは、このユーザーのケースのオプションを自動的に検出し、従って必要なときにアルゴリズムを自動的に起動する手段を記述する。
本発明は無線ネットワークを通して送信するために、携帯電話ユーザーに対して作成されたニュースキャストで使用できることにも留意されたい。この場合、ニュースキャストの編集者はニュースアンカーが視聴者に話しかけるときに、明らかにこの機能を起動し、その他の場面が含まれるときにはこの機能を不能にできる。このケースでは、フェーズ0は不要である。
フェーズ0の目的は、画像を補足したカメラの中心に前景オブジェクトが存在するような低速移動クリップのケースを自動的に判断することである。このことは主にビデオフォンセッションのケースまたはニュースキャストスピーチのケースに対応する。比較的静止している背景および当該中心にあるオブジェクト(例えば比較的静止した自動車)がある他のケースも、この技術から利点を享受できる。
フレーム内の中心に主題が存在するかどうかを検出するために、本発明は輪郭検出アルゴリズムを使用する。画像内の中心にある最もマッシブな形状(例えば最大の慣性を有する形状)が存在し、背景の近くの形状の慣性が小さい場合、画像フレーム内の中心にオブジェクトが存在する。例えばカニアンドドレッチェ演算子またはシェンアンドキャスタン演算子のような技術を使用して輪郭検出を行うことができる。当技術分野で周知のその他の輪郭検出技術も同じように使用できる。
フェーズ0の改善は携帯電話のより低い処理パワーに適合できる。これまで説明した検出アルゴリズムは、各フレームに対してではなく、必要なときに間欠的に起動される。携帯電話はユーザーがセッションをオープンした時に、最初のフレームで検出を起動する。第1結果に応じて、背景の除去を行う状態(ステートA)となったり、または除去を行わない状態(ステートB)となったりする。
その後のフレームに対して同じステートを維持するが、各フレームに対して前のフレームとの差を計算する。この差がソフトウェアアプリケーションを構築したときにエンジアリングテストによって設定した所定のスレッショルドを下回る場合、同じステートを示す同様な動きレベルを処理するものとしてこれらフレームをみなす。従って、初期ステートAまたはBを維持する。
このスレッショルドが動き内のギャップを示す所定の値よりも上であると、ユーザーは(景色を記録するような)別の記録モードに切り替えることができたはずである。従って、別のステートへの切り換えが必要であるかどうかを判断するために再び検出アルゴリズムを作動させる。この結果、ケースに応じて背景除去モードを起動したり、または除勢することになる。
フェーズ0へのこのような改善状態の元で動きレベルギャップが認識されたときに限り、検出アルゴリズムを起動する。画像間の動きレベルを検出する他の技術も同じように使用できることに留意されたい。本発明で使用する技術(フレーム差スレッショルド)は実現の可能性を実証するだけである。本発明はこのような技術だけに限定されるものではない。
これまでの説明は、圧縮し、符号化し、送信すべき画像は埋め込みカメラまたは取り付けカメラから携帯電話に取得したものと見なしている。最も共通する状況が生じる間、本発明は携帯電話に関連するカメラによって捕捉された画像に対する操作だけに限定されるものではない。携帯電話において、作成された、または他のソースから取得された画像および/またはビデオクリップは、本発明の技術を容易に活用できる。RF接続、例えばブルートゥース(商標)または赤外線接続を使ってパソコンと直接データを交換することは、多くの携帯電話で可能なことである。これら機構によって携帯電話のユーザーは携帯電話ネットワークを使うことなく、別の計算デバイスと、テキスト、ビデオ、画像および/またはオーディオを交換することができる。
携帯電話ユーザーが上記機構のうちの1つを使って自分のパソコンから自分の携帯電話に画像を送ったり、MMSメッセージ内の画像が別の携帯電話に含まれるようにすることは一般的なことである。このシナリオでは、画像のMMS送信をするのに、本発明の技術を容易に使用し、MMS送信のバンド幅条件を狭くすることができる。
本発明のコンピュータプログラム要素がハードウェアおよび/または(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)ソフトウェアで具現化できる。本発明はコンピュータプログラム製品の形態をとることができ、このコンピュータプログラム製品は、命令実行システムにより使用するよう、またはこの命令実行システムに関連し、メディア内で具現化される、コンピュータで使用可能な、またはコンピュータによって読み取り可能なプログラム命令、「符号」または「コンピュータプログラム」を有するコンピュータで使用可能な、またはコンピュータで読み取り可能な記憶媒体によって具現化できる。本明細書に関連し、コンピュータで使用可能な媒体またはコンピュータで読み取り可能な媒体は、命令実行システム、装置またはデバイスによって使用するための、またはこれらシステム、装置またはデバイスに関連して使用するためのプログラムを含み、記憶し、伝送し、伝搬させ、またはトランスポートすることができる任意の媒体でよい。コンピュータで使用可能な媒体またはコンピュータで読み取り可能な媒体とは、例えば電子、磁気、光、電磁気、赤外線または半導体システム、装置、デバイスまたはインターネットのような伝搬媒体でよいが、これらだけに限定されるものではない。コンピュータで使用可能な媒体またはコンピュータで読み取り可能な媒体は、紙またはその他の媒体を光学的に操作することにより、プログラムを電子的に捕捉し、編集し、解読し、またはその他の方法で適当な態様で処理できれば、プログラムがプリントされた紙またはその他の適当な媒体でもよいことに留意されたい。本明細書に説明したコンピュータプログラム製品およびソフトウェア並びにハードウェアは、実施例において本発明の機能を実行するための種々の手段を形成する。
本明細書に、本発明の特定の実施例について開示したが、当業者であれば本発明は他の環境でも別の用途を有し得ることが容易に認識できよう。実際に多くの実施例および実現例が可能である。特許請求の範囲は本発明の範囲を、これまで説明した特定の実施例だけに限定するものではなく、実際に「〜をするための手段」なる記載は、要素および請求項の手段プラス機能(means-plus-function)を記述するものであるが、特に「〜をするための手段」なる記載を特に使用しない要素は、別段請求の範囲が「手段」なる用語を含んでも手段プラス機能要素として解釈すべきではない。
代表的な携帯電話の正面図である。 埋め込みカメラを有するように示された代表的な携帯電話の背面図である。 本発明の部品および機能を示すブロック図である。

Claims (12)

  1. 携帯電話が送信すべき画像のビットフレームを携帯電話が低減できるようにする方法において、
    元の画像フレームの一部を除去し(360)、画像フレーム内にデッドクラスターを作成するステップと、
    前記画像フレームの前記除去された部分の前記デッドクラスターをデータで満たし(360)、元の画像フレームよりも少ないビットレートを有する新しい画像フレームを作成するステップと、
    新しい画像フレームが、元の画像フレームが必要としたよりも送信中に少ないバンド幅ですむように、新しい画像フレームを符号化する(370)ステップとを備えた方法。
  2. 前記デッドクラスターを満たすのに使用されるデータが白色データである、請求項1記載の方法。
  3. 前記デッドクラスターを満たすのに使用されるデータが黒色データである、請求項1記載の方法。
  4. 前記元の画像フレームの前記除去された部分を前記新しい画像フレームの送信中に前記新しい画像フレームと共にプレセンテーションし、受信した画像フレーム内に新しい画像フレームフレームを一体化することにより新しい画像フレームフレームを受信機で利用し受信した画像フレームのプレゼンテーションを改善するためのステップを更に含む、請求項1記載の方法。
  5. 前記元の画像フレームに対するビットレート低減ソフトウェアアプリケーションを実行する(340)前に元の画像フレーム内の中心に主題があるかどうか自動的に判断するステップと、
    前記画像フレーム内の中心に主要オブジェクトがあると前記元の画像が判断された場合にビットレート低減ソフトウェアアプリケーションを実行する(340)ステップとを更に備えた、請求項7記載の方法。
  6. 前記画像フレーム内のデータに対して使用される輪郭検出技術を使用して前記元の画像フレーム内の中心に主題があるかどうかを自動的に判断する前記ステップを実行する、請求項5記載の方法。
  7. 携帯電話が送信すべき画像のビットフレームを携帯電話が低減できるようにする装置において、
    元の画像フレームの一部を除去し(360)、画像フレーム内にデッドクラスターを作成するため手段と、
    前記画像フレームの前記除去された部分の前記デッドクラスターをデータで満たし(360)、元の画像フレームよりも少ないビットレートを有する新しい画像フレームを作成するため手段と、
    新しい画像フレームが、元の画像フレームが必要としたよりも送信中に少ないバンド幅ですむように、新しい画像フレームを符号化する(370)ための手段とを備えた装置。
  8. 前記デッドクラスターを満たすのに使用されるデータが白色データである、請求項7記載の装置。
  9. 前記デッドクラスターを満たすのに使用されるデータが黒色データである、請求項7記載の装置。
  10. 前記元の画像フレームの前記除去された部分を前記新しい画像フレームの送信中に前記新しい画像フレームと共にプレセンテーションし、受信した画像フレーム内に新しい画像フレームフレームを一体化することにより新しい画像フレームフレームを受信機で利用し、受信した画像フレームのプレゼンテーションを改善するための手段を更に含む、請求項7記載の装置。
  11. 前記元の画像フレームに対するビットレート低減ソフトウェアアプリケーションを実行する(340)前に元の画像フレーム内の中心に主題があるかどうか自動的に判断する手段と、
    前記画像フレーム内の中心に主要オブジェクトがあると前記元の画像が判断された場合にビットレート低減ソフトウェアアプリケーションを実行する(340)ための手段を更に備えた、請求項7記載の装置。
  12. 前記画像フレーム内のデータに対して使用される輪郭検出技術を使用して前記元の画像フレーム内の中心に主題があるかどうかを自動的に判断することを実行する、請求項11記載の装置。
JP2006552101A 2004-02-03 2004-10-05 携帯ネットワークを通した送信のための画像圧縮 Pending JP2007520973A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/708,018 US20050169537A1 (en) 2004-02-03 2004-02-03 System and method for image background removal in mobile multi-media communications
PCT/US2004/032657 WO2005084034A1 (en) 2004-02-03 2004-10-05 Image compression for transmission over mobile networks

Publications (1)

Publication Number Publication Date
JP2007520973A true JP2007520973A (ja) 2007-07-26

Family

ID=34807373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006552101A Pending JP2007520973A (ja) 2004-02-03 2004-10-05 携帯ネットワークを通した送信のための画像圧縮

Country Status (5)

Country Link
US (1) US20050169537A1 (ja)
EP (1) EP1747674A1 (ja)
JP (1) JP2007520973A (ja)
CN (1) CN1914925B (ja)
WO (1) WO2005084034A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8904458B2 (en) * 2004-07-29 2014-12-02 At&T Intellectual Property I, L.P. System and method for pre-caching a first portion of a video file on a set-top box
KR100836616B1 (ko) * 2006-11-14 2008-06-10 (주)케이티에프테크놀로지스 영상 합성 기능을 가지는 휴대용 단말기 및 휴대용단말기의 영상 합성 방법
US8548251B2 (en) * 2008-05-28 2013-10-01 Apple Inc. Defining a border for an image
TWI364220B (en) * 2008-08-15 2012-05-11 Acer Inc A video processing method and a video system
CN101686382B (zh) * 2008-09-24 2012-05-30 宏碁股份有限公司 视讯处理方法及视讯系统
US9153031B2 (en) 2011-06-22 2015-10-06 Microsoft Technology Licensing, Llc Modifying video regions using mobile device input
US8917764B2 (en) 2011-08-08 2014-12-23 Ittiam Systems (P) Ltd System and method for virtualization of ambient environments in live video streaming
US20140003662A1 (en) * 2011-12-16 2014-01-02 Peng Wang Reduced image quality for video data background regions
CN103036978B (zh) * 2012-12-13 2017-07-04 北京奇虎科技有限公司 数据传输设备及方法
CN103019641B (zh) * 2012-12-13 2016-07-06 北京奇虎科技有限公司 在远程控制过程中传输数据的设备及方法
CN103067449B (zh) * 2012-12-13 2016-09-28 北京奇虎科技有限公司 远程服务中的数据传输设备及方法
CN103036980B (zh) * 2012-12-13 2016-09-28 北京奇虎科技有限公司 用于远程服务的数据传输设备及方法
CN103067451B (zh) * 2012-12-13 2016-09-28 北京奇虎科技有限公司 远程服务中用于进行数据传输的设备及方法
JP6465569B2 (ja) * 2014-06-11 2019-02-06 キヤノン株式会社 画像処理方法、および画像処理装置
CN104639950A (zh) * 2015-02-06 2015-05-20 北京量子伟业信息技术股份有限公司 基于碎片化技术的影像加工系统及方法
US10140557B1 (en) * 2017-05-23 2018-11-27 Banuba Limited Increasing network transmission capacity and data resolution quality and computer systems and computer-implemented methods for implementing thereof
CN109309839B (zh) * 2018-09-30 2021-11-16 Oppo广东移动通信有限公司 数据处理方法及装置、电子设备及存储介质
US11551385B1 (en) * 2021-06-23 2023-01-10 Black Sesame Technologies Inc. Texture replacement system in a multimedia
CN114785988A (zh) * 2022-04-11 2022-07-22 广东思域信息科技有限公司 一种基于云计算服务的高清视频监控系统及监控方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001145101A (ja) * 1999-11-12 2001-05-25 Mega Chips Corp 人物画像圧縮装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6593955B1 (en) * 1998-05-26 2003-07-15 Microsoft Corporation Video telephony system
WO2000021302A1 (en) * 1998-10-02 2000-04-13 General Instrument Corporation Method and apparatus for providing rate control in a video encoder
JP2000253402A (ja) * 1999-03-03 2000-09-14 Nec Corp 映像データ送信装置及びその映像信号符号化方法並びに映像信号符号化プログラムを格納した記憶媒体
US7120297B2 (en) * 2002-04-25 2006-10-10 Microsoft Corporation Segmented layered image system
CA2486164A1 (en) * 2002-06-12 2003-12-24 British Telecommunications Public Limited Company Video pre-processing
JP4178544B2 (ja) * 2002-08-20 2008-11-12 カシオ計算機株式会社 データ通信装置、データ通信システム、動画付き文書表示方法および動画付き文書表示プログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001145101A (ja) * 1999-11-12 2001-05-25 Mega Chips Corp 人物画像圧縮装置

Also Published As

Publication number Publication date
WO2005084034A1 (en) 2005-09-09
CN1914925A (zh) 2007-02-14
CN1914925B (zh) 2010-04-28
EP1747674A1 (en) 2007-01-31
US20050169537A1 (en) 2005-08-04

Similar Documents

Publication Publication Date Title
JP2007520973A (ja) 携帯ネットワークを通した送信のための画像圧縮
US11418809B2 (en) Signaling of state information for a decoded picture buffer and reference picture lists
US10390039B2 (en) Motion estimation for screen remoting scenarios
EP3549345A1 (en) Local hash-based motion estimation for screen remoting scenarios
EP2096873A2 (en) Method and apparatus for encoder assisted-frame rate conversion (EA-FRUC) for video compression
US20120294355A1 (en) Video transcoding with dynamically modifiable spatial resolution
CN107071440B (zh) 使用先前帧残差的运动矢量预测
JP2015501098A5 (ja)
JP2001275110A (ja) 動的なループ及びポストフィルタリングのための方法及び装置
EP2166768A2 (en) Method and system for multiple resolution video delivery
JP2000504911A (ja) ファクシミリ準拠画像圧縮法およびシステム
Li et al. Bi-level video: Video communication at very low bit rates
Xia et al. Visual sensitivity-based low-bit-rate image compression algorithm
CA3039702A1 (en) Systems and methods for compressing video
EP2177034A1 (en) Method and device for reconstructing a picture
Strutz Improved probability modelling for exception handling in lossless screen content coding
Schäfer et al. Improving image compression—Is it worth the effort?
JPH08163561A (ja) 画像データ圧縮装置
WO2000070878A1 (en) A system and method for performing inverse quantization of a video stream
Reusens et al. Very low bitrate coding: which way ahead?"
Feng et al. Adaptive object tracking and video compression with dynamic contours
Chen et al. Hardware-oriented image inpainting for perceptual I-frame error concealment
JPH10304403A (ja) 動画像符号化装置,復号化装置,及び伝送システム
JP5143033B2 (ja) 画像処理装置及びその方法
JP2002516529A (ja) ピクチャシーケンスとして構成された情報ストリームの符号化

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071001

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100810

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101110

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101117

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101210

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101217

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110111

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110531

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111025