JP2003346166A - マスクを利用して文書画像の圧縮を容易にするシステムおよび方法 - Google Patents

マスクを利用して文書画像の圧縮を容易にするシステムおよび方法

Info

Publication number
JP2003346166A
JP2003346166A JP2003083847A JP2003083847A JP2003346166A JP 2003346166 A JP2003346166 A JP 2003346166A JP 2003083847 A JP2003083847 A JP 2003083847A JP 2003083847 A JP2003083847 A JP 2003083847A JP 2003346166 A JP2003346166 A JP 2003346166A
Authority
JP
Japan
Prior art keywords
foreground
background
region
energy
mask
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003083847A
Other languages
English (en)
Other versions
JP4295537B2 (ja
Inventor
Patrice Y Simard
ワイ.シマルド パトリス
Erin L Renshaw
エル.レンショウ エリン
James Russell Rinker
ラッセル リンカー ジェームズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/133,939 external-priority patent/US7392472B2/en
Priority claimed from US10/133,558 external-priority patent/US7164797B2/en
Priority claimed from US10/133,842 external-priority patent/US7263227B2/en
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2003346166A publication Critical patent/JP2003346166A/ja
Application granted granted Critical
Publication of JP4295537B2 publication Critical patent/JP4295537B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文書画像の前景を背景から分割するマスクを
利用して文書画像の圧縮を容易にするシステムおよび方
法を提供すること。 【解決手段】 本発明は、領域を前景と背景とに分割す
るように適合されたピクセルエネルギーアナライザを含
む。本発明はさらに、マージされる領域がしきい値エネ
ルギーを超えない場合に領域をマージしてみるように適
合された領域マージコンポーネントも提供する。マージ
された領域は、新しい前景と新しい背景とに分割され
る。その後、マスク記憶コンポーネントが分割情報をバ
イナリマスクに記憶する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般に文書画像処
理に関し、より詳細には、文書画像の前景を背景から分
割するマスクを利用して文書画像の圧縮を容易にするシ
ステムおよび方法に関する。
【0002】
【従来の技術】コンピュータネットワーク、インターネ
ット、およびディジタル記憶手段が広く普及するなか
で、コンピュータを介して入手可能な情報の量は劇的に
増加してきた。情報量の増加に伴い、情報を迅速に伝送
し効率的に記憶する必要が生じている。データ圧縮は、
文書をより効果的に伝送および/または記憶することの
できる方法の一つである。
【0003】従来のデータ圧縮システムは、例えばシン
ボルマッチングなど様々な圧縮手法を利用してきた。し
かし、画像を有する文書に対して効果的に作用する通常
の圧縮手法は、例えばテキストおよび/または手書きを
有する文書に対してはうまく作用しない。
【0004】データ圧縮は、情報を表すのに必要な空間
を削減する。圧縮はどんなタイプの情報にも用いること
ができる。しかし、画像、テキスト、オーディオ、ビデ
オを含めたディジタル情報の圧縮がより重要になりつつ
ある。通常、データ圧縮は標準的なコンピュータシステ
ムで用いられる。ただし、限定しないが、ディジタルお
よび衛星テレビジョン、ならびにセルラー/ディジタル
ホンなど、他の技術でもデータ圧縮を利用する。
【0005】データ圧縮はいくつかの理由で重要であ
る。データ圧縮により、未圧縮データの場合よりも小さ
い空間に情報を記憶することができる。多量の情報に対
する需要が増大するなかで、多量の情報を供給するため
にデータ圧縮が必要とされることがある。記憶デバイス
のサイズは著しく増大したが、情報に対する需要はこれ
らの増大を追い越している。例えば、未圧縮画像が5メ
ガバイトの空間を占めるのに対して、同じ画像を圧縮す
れば2.5メガバイトの空間しか占めないことがあり得
る。さらに、データ圧縮により、未圧縮情報よりも多量
の圧縮情報を転送することができる。ブロードバンド、
DSL、ケーブルモデムインターネットなど転送レート
は上昇したものの、未圧縮情報では容易に伝送限度に達
してしまう。例えば、DSL回線を介して未圧縮画像を
送信すれば10分かかるとする。しかしデータを圧縮す
れば、同じ画像を約1分で送信することができる。
【0006】一般に、圧縮にはロスレスとロッシーの2
つのタイプがある。ロスレス圧縮では、圧縮後に正確な
元データを復元することができるが、ロッシー圧縮で
は、元データは圧縮解除されたデータと異なる。ロッシ
ー圧縮は、元データからデータを省くことができるの
で、より高い圧縮率が可能である。ロスレス圧縮は、例
えばクリティカルなテキストを圧縮するときに用いるこ
とができる。というのは、データを正確に再構築できな
ければテキストの品質および可読性に重大な影響が及ぶ
可能性があるからである。ロッシー圧縮は、ある程度の
ひずみまたはノイズが許容可能かまたは我々の限られた
感覚で感知できない、画像またはクリティカルでないテ
キストに用いることができる。
【0007】データ圧縮は、ディジタル文書に特に適用
できる。ディジタル文書または文書画像は、文書のディ
ジタル表現である。ディジタル文書は通常、テキスト、
画像、および/または、テキストと画像を含む。現行の
ディジタルデータのために使用される記憶空間がより少
なくなることに加えて、品質を著しく劣化させずにコン
パクトに記憶することは、現行のハードコピーのディジ
タル化を奨励することになり、ペーパーレスオフィスが
より実現可能なものになる。ペーパーレスオフィスは、
情報へのアクセスを容易にすることや、環境コストの削
減、保管コストの削減など多くの利益をもたらすので、
このようなペーパーレスオフィスに向けて努力すること
はビジネスが掲げるべき重要な目標である。さらに、圧
縮によってディジタル文書のファイルサイズを縮小する
ことにより、インターネット帯域幅をより効率的に使用
することができ、したがって、より多くの情報をより速
く伝送し、ネットワーク輻輳を低減することができる。
情報のための所要の記憶装置を縮小すること、効率的な
ペーパーレスオフィスへの動向、およびインターネット
帯域幅効率の向上は圧縮技術の多数の著しい利益のほん
の一部である。
【0008】
【発明が解決しようとする課題】ディジタル文書のデー
タ圧縮は、ディジタル文書の利用をより魅力あるものに
するためのいくつかの目標を有する。第1に、データ圧
縮は、短時間で多量の情報を圧縮および圧縮解除できる
べきである。第2に、データ圧縮はディジタル文書を正
確に再生できるべきである。
【0009】加えて、ディジタル文書のデータ圧縮は、
文書の目的を利用すべきである。ディジタル文書には、
ファイリングやハードコピー提供に使用されるものもあ
り、校訂および/または編集されるものもある。現行の
データ圧縮では、テキストおよび/または画像が閲覧さ
れるときの還流に対処することができず、圧縮技術によ
って文字を認識してそれらをワードプロセッサ、パーソ
ナルディジタルアシスタント(PDA)、セルラーホン
などに還流できるようにするための効率的かつ効果的な
手段を提供することができない。したがって、ハードコ
ピーのオフィス文書をスキャンしてディジタル形式にし
た場合、現行の圧縮技術では、不可能とは言わないまで
も、ディジタル化された文書の更新、修正、またはより
一般的に変更が、困難になる可能性がある。
【0010】
【課題を解決するための手段】以下、本発明のいくつか
の態様に関する基本的な理解を提供するために、本発明
の簡単な概要を提示する。この概要は本発明の広範な概
観ではない。これは、本発明の鍵となる/クリティカル
な要素を識別するものではなく、本発明の範囲を述べる
ものでもない。この概要の唯一の目的は、本発明のいく
つかの概念を、後で提示するより詳細な説明の前置きと
して簡単な形で提示することである。
【0011】本発明は一般に、文書画像の前景を背景か
ら分割するマスクを利用して文書画像の圧縮を容易にす
るシステムおよび方法に関する。本発明の一態様によれ
ば、マスクセパレータコンポーネントが、文書画像(例
えば文書のバイナリ、RGB、および/またはYUV表
現)を入力として受け取る。マスクセパレータコンポー
ネントは、文書画像を処理し、文書画像の各ピクセルが
前景および/または背景に属するかを示すマスク(例え
ばバイナリ)を出力する。前景(例えばテキスト情報)
を背景(例えばグラフィカル情報)と分離することによ
り、前景および/または背景をより効果的に圧縮するこ
とができ、したがってファイルサイズおよび/または送
信時間を縮減することができる。次いで、マスクおよび
/または文書画像は、圧縮システムの他の部分によって
処理することができる(例えば文書画像圧縮の向上を達
成するため)。例えば、本発明のシステムおよび/また
は方法は、テキスト、手書き、ドローイングなどの識別
および/または圧縮を容易にするセグメント化階層画像
システム全体において利用することができる。
【0012】本発明の特定の一態様によれば、マスクセ
パレータコンポーネントは、ピクセルエネルギーコンポ
ーネント、領域マージコンポーネント、およびマスク記
憶コンポーネントを含む。ピクセルエネルギーコンポー
ネントは、前景および/または背景のエネルギー分散を
最小化するように文書画像の領域についてピクセルエネ
ルギー(例えば分散)を計算するように適合される。エ
ネルギー(例えば距離の2乗の和に基づくエネルギー尺
度)を、前景および/または背景について得られるであ
ろう圧縮の推定値として用いる。ただし、計算オーバー
ヘッドを単純化するために、文書画像は領域(例えば2
ピクセル×2ピクセル)に分割することができ、領域ご
とに前景および/または背景を決定する(例えば前景お
よび/または背景中のエネルギー分散の最小化に少なく
とも一部基づいて)。言い換えれば、各領域自体が2つ
のセット、すなわち前景に属するピクセルと背景に属す
るピクセルとに分割される。計算オーバーヘッドをさら
に最小限に抑えるために、ピクセルエネルギーコンポー
ネントは計算情報を、領域マージコンポーネントおよび
/またはマスク記憶コンポーネントによって使用される
ように少なくとも一時的に記憶しておくことができる。
【0013】領域マージコンポーネントは、マージでき
そうな領域の新しい前景および/または新しい背景のエ
ネルギーが第1のしきい値エネルギー未満であるかどう
かの決定に少なくとも部分的に基づいて、文書画像の領
域の対をマージしてみるように適合される。領域マージ
コンポーネントは、ピクセルエネルギーコンポーネント
によって記憶された計算情報を利用することができる。
マージの結果、より広い領域が得られ、この領域はそれ
自体の前景背景の分割を特徴として有することになる。
マージ前に前景だったピクセルが、マージ後の領域の背
景になる可能性があり、その逆の可能性もある。領域マ
ージコンポーネントは、例えば新しい背景および新しい
前景のエネルギーの最小化に、少なくとも部分的に基づ
いて、マージ領域の適した前景および/または背景の分
割を決定することができる。
【0014】領域マージコンポーネントは、しきい値エ
ネルギーを超えることになるまで、かつ/または文書画
像がほぼすべてマージされるまで、連続的により大きい
領域をマージしてみることを継続することができる。例
えば領域マージコンポーネントは、水平方向に隣接する
2×2の領域を2×4の領域にマージすることができ
る。その後、領域マージコンポーネントは、領域を4×
4の領域に垂直方向にマージすることができる。一般
に、第1のしきい値エネルギーの値は、試みられるマー
ジによっていくつかのグレーレベルが前景または背景に
分割されて、テキストなどの重要な詳細が失われる可能
性があるという、潜在的状況を緩和するように選択する
ことができる(例えば3色以上の色が領域中にあると
き)。したがって、文書画像に関連するテキストおよび
/またはグラフィックラインの大部分を取り込むマスク
を捕えることができる。
【0015】ある領域に対するマージが完了すると、こ
の領域についての前景背景の分割がマスクを構成する。
例えば、前景に属するピクセルにはマスク中で「1」を
割り当て、背景に属するピクセルには「0」を割り当て
ることができる。残念ながら、マージ操作中に前景と背
景の分割を追跡することは、計算コストが高くなる可能
性がある。別法(例えばより計算的に効果的な方法)
は、マージ領域のほぼすべてのピクセルの平均値を計算
して、平均値よりも大きいグレーレベル値を有するピク
セルを前景に割り当て、残りのピクセルを背景に割り当
てるものである。あるいは、平均値よりも大きいグレー
レベル値を有するピクセルを背景に割り当て、残りのピ
クセルを前景に割り当てることもできる。この2つの別
法は、視覚識別できないマスクをもたらすことができ
る。
【0016】その後、マスク記憶コンポーネントは、前
景と背景の分割に関連する情報をマスクに記憶するよう
に適合される。したがってマスクは、文書画像の各ピク
セルが前景および/または背景に属するかを示す。
【0017】本発明の別の態様によれば、計算オーバー
ヘッドを最小限に抑えるために、小さい領域(例えば4
ピクセル×4ピクセル)についてのエネルギーをピクセ
ルエネルギーコンポーネントによって計算することがで
きる。エネルギーが第2のしきい値エネルギー未満であ
る場合は、ほぼすべてのピクセルを前景または背景に割
り当て、他方はほぼ空とすることができる。エネルギー
が第2のしきい値以上である場合は、前述のように分割
を進めることができる。比較的クリーンな文書画像(例
えば一定の領域を有するもの)の場合、計算速度の著し
い向上を達成することができる。
【0018】本発明の別の態様によれば、マスクのサイ
ズを最小限に抑えるために、最終的な領域(例えば第1
のしきい値を超えずにマージすることができない領域)
の平均前景と平均背景との間の差が第3のしきい値より
も大きい場合、その領域の大域平均値が中間グレーレベ
ル値(例えばグレーレベル値が0から255までであれ
ば127)よりも高いか低いかに応じて、その領域全体
を前景としてまたは背景として宣言する。わずかなディ
ザリングのあるカラー文書では、これらの領域のための
マスクは、この最適化を行わない場合は霜降り状に見え
ることになり、圧縮コストが高くなる。第3のしきい値
は、重要なテキストを失わず、しかも印刷文書をスキャ
ンする際に見られるわずかなディザリングの多くのケー
スを除去するように選択される(例えば、多くのプリン
タは4色から6色しか有さず、完全なカラーパレットを
生成するにはディザリングを用いなければならない)。
一例では、第3のしきい値には40の値が適切な選択で
ある。
【0019】本発明の別の態様は、ピクセルエネルギー
コンポーネントが多項式回帰を利用して前景および/ま
たは背景を記述することができるようにする。
【0020】本発明の別の態様は、マスクセパレータコ
ンポーネントと前景/背景セグメンタとを有する文書画
像分離システムを提供する。マスクセパレータコンポー
ネントは、文書画像(例えばテキストおよび/または手
書きを含む)を処理し、どのピクセルが前景にありどの
ピクセルが背景にあるかに関する情報をマスクに記憶す
ることができる。その後、前景/背景セグメンタがマス
クおよび文書画像を受け取り、文書画像を前景画像と背
景画像とに分離することができる。
【0021】本発明の別の態様によれば、文書画像変換
コンポーネントと、マスク分離コンポーネントと、前景
/背景分離コンポーネントとを有する文書画像圧縮シス
テムが提供される。任意選択で、文書画像圧縮システム
は、マスクエンコーダ、前景エンコーダ、および/また
は背景エンコーダを含むこともできる。
【0022】本発明の別の態様は、ピクセルエネルギー
コンポーネントとマスク記憶コンポーネントとを有する
セグメント化階層画像システムを提供する。セグメント
化階層画像システムは、多くの文書画像適用例で採用す
ることができ、限定しないがこれらの適用例には、写真
複写機、文書スキャナ、光学文字認識システム、パーソ
ナルディジタルアシスタント、ファクス機、ディジタル
カメラ、ディジタルビデオカメラ、および/またはビデ
オゲームシステムが含まれる。
【0023】本発明の他の態様は、マスクを生成するた
めの方法、方法体系と、マスク分離コンポーネントに対
するコンピュータ使用可能命令を有するコンピュータ可
読媒体と、マスクに関連する情報を含み2つ以上のコン
ピュータプロセス間で伝送されるように適合されたデー
タパケットとを提供する。マスクは、ピクセルを文書画
像の前景と背景のうちの少なくとも一方に割り当てる。
マスクは、文書画像の領域におけるピクセルのエネルギ
ーを最小化する計算に少なくとも部分的に基づく。
【0024】以上および関連の目的を達成するために、
本発明の例示的ないくつかの態様について、後続の説明
および添付の図面との関連で本明細書に述べる。ただし
これらの態様は、本発明の原理を採用することのできる
様々な方法のほんのわずかを示すものに過ぎず、本発明
は、このような態様およびその均等物をすべて含むもの
とする。本発明の他の利点および新規な特徴は、後続の
本発明の詳細な説明を図面と共に考察すれば明らかにな
るであろう。
【0025】
【発明の実施の形態】ここで本発明について図面を参照
しながら述べるが、各図面を通して、同じ要素を指す場
合は同じ参照番号を使用する。以下の記述では、説明の
目的で、本発明の完全な理解を提供するために様々な具
体的詳細について述べる。ただし、本発明はこれらの具
体的詳細がなくても実施できることは明白であろう。そ
の他の場合では、本発明の記述を容易にするために、周
知の構造およびデバイスはブロック図の形で示す。
【0026】本明細書では、「コンポーネント」および
「システム」という語は、コンピュータに関係するエン
ティティを指すものとし、ハードウェア、ハードウェア
とソフトウェアの組合せ、ソフトウェア、または実行中
のソフトウェアとする。例えば、限定しないがコンポー
ネントは、プロセッサ上で稼動するプロセス、プロセッ
サ、オブジェクト、実行プログラム、実行のスレッド、
プログラム、および/またはコンピュータとすることが
できる。例として、サーバ上で稼動するアプリケーショ
ンもサーバも両方ともコンポーネントとすることができ
る。1つまたは複数のコンポーネントが1つのプロセス
および/または実行のスレッドにあるものとすることが
でき、コンポーネントは、1台のコンピュータ上に局所
化してもよく、かつ/または2台以上のコンピュータ間
で分散させてもよい。
【0027】さらに、「文書画像」は、1つまたは複数
の色を含む文書のディジタル表現(例えばバイナリ(例
えば黒/白)、グレースケール、および/またはカラー
文書)を指すものとする。加えて、文書画像は、画像、
テキスト、および/または画像付きテキストを有するこ
とができ、テキストと画像が重なっている可能性もあ
る。文書画像は、文書をバイナリ、RGB、および/ま
たはYUVで表現したものとすることができる。RGB
文書画像は、赤、緑、青の成分で表現される。YUV文
書画像は、Yで示される輝度成分とUおよびVで示され
るクロミナンス成分とを用いて表現される。クロミナン
ス成分UおよびVは、YUV画像の視覚品質を著しく犠
牲にすることなく、より少ないビットを使用して表すこ
とができる。YUV表現は一般に、RGB表現よりもコ
ンパクトかつ使いやすい表現である。文書画像は、「ピ
クセル」と一般に呼ばれるピクチャ要素を備える。文書
画像は、任意の形状またはサイズの、単一ページまたは
複数ページの文書に基づくものとすることができる。
【0028】図1を参照すると、本発明の一態様による
マスクセパレータコンポーネント100が示されてい
る。マスクセパレータコンポーネント100は、文書画
像110(例えばアーカイブおよび/または送信される
ことになる文書に基づくもの)を受け取る。例えば、マ
スクセパレータコンポーネント100は文書圧縮システ
ム(図示せず)の一部とすることができる。文書画像1
10は、バイナリ、RGB、および/またはYUVで表
現された文書とすることができる。マスクセパレータコ
ンポーネント100は、文書画像110を処理し、文書
画像110の各ピクセルが前景および/または背景に属
するかを示すマスク120(例えばバイナリ)を出力す
る。次いで、圧縮システム(図示せず)の他の部分によ
ってマスク120および/または文書画像110を処理
して、文書画像110の圧縮を行うことができる。
【0029】しばし図2を見ると、例示的な文書画像が
示してある。この文書画像は、棒に沿って文字「C」お
よび「O」を含む。図3に、本発明の一態様による、図
2の例示的な文書画像に関連するマスクを示す。図4
に、本発明の一態様による、図2の例示的な文書画像と
図3のマスクとに関連する背景を示す。点線は、背景
「関係あり(care)」ピクセルの境界を表す。点線
を構成するピクセルと、点線内のピクセルは、背景にお
いて「関係なし(don’t care)」ピクセルで
ある。というのは、文書画像が再組立てされたとき、マ
スクに記憶された再構築情報に少なくとも部分的に基づ
いて、前景が背景の上に配置されるからである。文字
「C」「O」および/または棒が一定の色であり、かつ
/あるいは滑らかな色遷移を有する場合、前景の効果的
な圧縮は、様々な平滑化技法および/または圧縮技法の
1つを用いて達成することができる。背景の効果的な圧
縮は、「関係なし」ピクセルをより滑らかな遷移をもた
らすピクセル値で置換することによって達成することが
できる。「関係なし」ピクセルを埋めるための単純なア
ルゴリズムの一例は、背景をローパスフィルタで処理し
てから重要なピクセルを復元するものである。この2つ
のステップを何回か繰り返した後は、「関係なし」ピク
セルは滑らかな遷移をもたらす値になり、これらは小さ
く圧縮される。このアルゴリズムを簡単に改良したもの
は、超低域のローパスフィルタで開始して、繰返しごと
にローパスフィルタのカット周波数を増加させるもので
ある。同様のアルゴリズムを使用して、前景も埋めるこ
とができる。
【0030】図1に戻るが、マスクセパレータコンポー
ネント100は、ピクセルエネルギーコンポーネント1
30、領域マージコンポーネント140、およびマスク
記憶コンポーネント150を含む。
【0031】ピクセルエネルギーコンポーネント130
は、文書画像110の領域についてピクセルエネルギー
(例えば分散)を計算するように適合される。例えば、
文書画像110がYUV表現である場合、ピクセルエネ
ルギーコンポーネント130は、YUV表現のY成分に
基づいて、かつ/またはYUV成分の適した組合せに基
づいて、ピクセルエネルギー分散を計算する。計算で
は、ある領域にわたって前景および背景が一定であると
仮定することができる。これらの定数の周りの分散を最
小化するマスク120を計算することが望ましい。この
分散を、前景および/または背景について得られるであ
ろう圧縮の推定値として使用する。あるいは、領域を圧
縮し、ビット数を量的に測定してもよい。ただし計算オ
ーバーヘッドは非常に高くつくことになる。したがっ
て、分散は距離の2乗の和に基づくエネルギー尺度でも
あるが、これを計算することは、圧縮後の前景および背
景のサイズについての許容可能な推定である。
【0032】ある領域はN個のピクセルの集合Sであ
り、前景Fおよび背景Bは、F∪B=SおよびF∩B=
φとなるようにSの分割であると仮定する。f(x)が
ピクセル位置x(x∈S)における画像の値である場
合、前景および背景の分散はそれぞれ以下のとおりであ
る。
【0033】
【数8】
【0034】上式で、
【0035】
【外1】
【0036】は、それぞれ前景および背景の平均ピクセ
ル値であり、NおよびNは、それぞれ前景および背
景にあるピクセルの数である。これらの分散は以下のよ
うに表現することもできることに留意されたい。
【0037】
【数9】
【0038】次に、前景および/または背景のエネルギ
ー(例えば分散)の最小化に、少なくとも部分的に基づ
いて、Sの適した分割FおよびBを、ピクセルエネルギ
ーコンポーネント130によって決定する(例えば、和
E=ν+νを最小化する)。しかし、可能性あるマ
スクが2個あるので、Sの適した分割FおよびBを見
つけることは計算集約的になる可能性がある。
【0039】計算を単純化するために、文書画像を領
域、例えば2ピクセル×2ピクセルの領域に分けること
ができる。しばし図5を見ると、本発明の一態様によ
る、文書画像の2ピクセル×2ピクセルの領域が示して
ある。4つのピクセルは、値V、V、V、V
有する。2ピクセル×2ピクセルの各領域につき、可能
性あるマスクは2=16個しかない。したがって、こ
れら2ピクセル×2ピクセルの各領域につき、16個の
組合せすべてを計算して最小エネルギーを有するものを
利用することによって、E=V+Vを最小化する最
適なFおよびBを見つけることが可能である。
【0040】しかし、文書画像はスカラー関数なので、
K=2としたK平均クラスタリングアルゴリズムを利用
すると、値f(x)をソートすることができ、効率的に
計算できる解が得られる。ソートされた順番がV
であると仮定すると、K=2としたK平均クラ
スタリングアルゴリズムにより、以下のとおり3つの可
能性ある分解が得られる。 潜在的前景 潜在的背景 V
【0041】他の組合せもほぼすべて、これと等しいか
より高いエネルギーを有することがわかる。隣接しない
値のグループ化よりも低い分散を有する隣接した値のグ
ループ化が常にあるはずなので、このことは直感的にわ
かる。ソートの順番が異なる場合、ピクセルは常に、V
がソートされるように再ラベリングする
ことができる。3つの可能性ある前景背景の分解のうち
どれが最低エネルギーをもたらすかを決定するのは、こ
の場合単純である。重要なことに、ピクセルエネルギー
コンポーネント130は、計算オーバーヘッドを最小限
に抑えるために部分和
【0042】
【外2】
【0043】を記憶することができる。さらにピクセル
エネルギーコンポーネント130は、少なくとも一時的
に、Nおよび/またはNと共に部分和
【0044】
【外3】
【0045】の少なくともいくつかを記憶することもで
きる(例えば領域マージコンポーネント140および/
またはマスク記憶コンポーネント150によって使用さ
れるように)。
【0046】さらに、計算オーバーヘッドを最小限に抑
えるために、小さい領域(例えば4ピクセル×4ピクセ
ル)についてのエネルギーを計算することができる。エ
ネルギーがしきい値量未満である場合は、これらのピク
セルをすべて前景または背景に割り当て、他方は空とす
ることができる。エネルギーがしきい値エネルギー以上
である場合は、前述のように分割を進めることができ
る。この分割は最適とはなり得ないものの、しきい値が
十分に低ければ、悪影響は観測されない。比較的クリー
ンな文書画像(例えば一定の領域を有するもの)の場
合、計算速度の著しい向上を達成することができる。
【0047】さらに、ほぼ一定である領域(例えば純粋
な前景または純粋な背景)は、前景と背景を分離するマ
スクを計算した後で設定してもよい。例えば、平均前景
と平均背景の差が、経験的に決定できる一定のしきい値
(例えば、0から255までにわたるグレーレベルの全
スケールと比較して値40を使用することができる)未
満である場合、領域全体を前景または背景に設定する
(平均が0に近いか255に近いかに応じて)。
【0048】図1に戻るが、文書画像110を2ピクセ
ル×2ピクセルの領域に分割した結果、ピクセルノイズ
を拾う可能性のあるはっきりした前景および背景を有す
る領域が得られる。これによってマスク120は霜降り
状に見えることになる可能性があり、これはテキストお
よび/またはグラフィックラインをマスク120中に取
り込めるようにする目的とは相容れない。したがって、
領域マージコンポーネント140は、マージできそうな
領域の前景および/または背景のエネルギーが第1のし
きい値エネルギー未満であるかどうかの決定に少なくと
も部分的に基づいて、文書画像110の領域の対をマー
ジしてみるように適合される。領域マージコンポーネン
ト140は、ピクセルエネルギーコンポーネント130
によって計算され記憶された部分和
【0049】
【外4】
【0050】をNおよび/またはNと共に利用する
ことができる。
【0051】各マージの後でこれらの量を再計算しなけ
ればならないが、幸いこれもまた、これらの量を前景と
背景の組合せに従って合計するだけで、一定時間で行わ
れる。各分割につき、すべての領域にわたる和
【0052】
【外5】
【0053】は一定であり、最適な分割を選択するため
に計算する必要はないことに留意されたい。ただし、領
域をマージしないときを判断するために、この量はまだ
必要である。
【0054】しばし図6を見ると、前景Fおよび背景
を有する第1の領域と、前景F および背景B
有する第2の領域との潜在的なマージが示してある。マ
ージされる領域のエネルギーが第1のしきい値エネルギ
ー未満であるかどうかを決定する際、領域マージコンポ
ーネント150は、新しい前景および新しい背景のグル
ープ化を計算することができる。2つの領域内のエネル
ギー分散には、以下のように、新しい前景および新しい
背景についての可能性あるグループ化が7つある。
【0055】 潜在マージ領域の新しい前景 潜在マージ領域の新しい背景 F
【0056】可能性あるグループ化の少なくとも1つ
が、第1のしきい値エネルギー未満の背景および/また
は前景エネルギーをもたらす場合、領域マージコンポー
ネント140は、例えば背景および前景のエネルギー
(E=ν+ν)の最小化に、少なくとも部分的に基
づいて、マージ領域の適した前景/背景分割を決定する
ことができる。これらのグループ化のどれも第1のしき
い値エネルギー未満のエネルギーをもたらさない場合
は、マージを行わず、これらの領域はこれ以上マージに
向けて考慮しない。デフォルトで、F1およびF2を使
用して前景ピクセルを計算し、B1およびB2を使用し
て背景ピクセルを計算する。
【0057】領域マージコンポーネント140は、第1
のしきい値エネルギーを超えることになるまで、かつ/
または文書画像110がほぼすべてマージされるまで、
より大きい領域をマージしてみることを継続することが
できる。例えば領域マージコンポーネント140は、水
平方向に隣接する2×2の領域を、図6に示すような2
×4の領域にマージすることができる。その後、領域マ
ージコンポーネント140は領域を、図7に示すような
4×4の領域に垂直方向にマージすることができる。一
般に、第1のしきい値エネルギーの値は、試みられるマ
ージによっていくつかのグレーレベルが前景または背景
に分割されて、テキストなどの重要な詳細が失われる可
能性があるという、潜在的状況を緩和するように選択す
ることができる(例えば3色以上の色が領域中にあると
き)。例えば、第1の領域には白の上にグレーで書かれ
たテキストがあり、第2の領域は大部分が黒である場
合、この2つの領域をマージすると、グレーおよび白は
得られるマージ領域の前景に入り、黒は背景に入り、し
たがってマスク120からテキスト情報がほぼすべて失
われる恐れがある。しかし、2つの色が前景と背景のい
ずれかにマージされるときは、定数はもはやこの領域に
ついての適切なモデルではないので、その領域について
のエネルギーが急増する。
【0058】さらに、得られるエネルギーを7つの組合
せのほぼすべてについて計算することの別法として、前
景および背景の平均値を記憶してもよく、分割は、ソー
トされた平均値に関して考えることができる。値V
のソートの場合のように、これは分割の数を
3に減らす(Fを平均値でソートして、
その順番を考慮した分割を考える)。
【0059】追加で、かつ/または別法として、領域マ
ージコンポーネント120は、2つの領域にわたる近似
値fに基づいて、これら所与の領域の前景と背景の組合
せの限定的な部分集合を評価することもできる。領域マ
ージコンポーネント120は、累積エネルギーの最も小
さい組合せを選択すればよい。
【0060】このようなマージによってエネルギーが第
1のしきい値を超えて増大することになるためにもう領
域をマージできなくなれば、この領域のピクセルを前景
と背景に分割することができる。このような分割はマー
ジごとに行うこともできるが、これは計算コストが高く
つくことになる。別法として、マージ領域コンポーネン
ト140は、マージされた領域のほぼすべてのピクセル
値の平均値を計算し、平均値よりも大きい値を有するピ
クセルを前景に割り当て、残りのピクセルを背景に割り
当てることもできる。あるいは、平均値よりも大きい値
を有するピクセルを背景に割り当て、残りのピクセルを
前景に割り当てることもできる。
【0061】再び図1を参照するが、領域マージコンポ
ーネント140によってマージし尽くされた後、マスク
記憶コンポーネント150は、ピクセルエネルギーコン
ポーネント130および/またはマージ領域コンポーネ
ント140によって行われた前景と背景の分割に関連す
る情報をマスク120に記憶するように適合される。し
たがってマスク120は、文書画像110の各ピクセル
が前景および/または背景に属するかを示す。
【0062】一実施形態では、計算オーバーヘッドを最
小限に抑えるために、小さい領域(例えば4ピクセル×
4ピクセル)についてのエネルギーをピクセルエネルギ
ーコンポーネント130によって計算することができ
る。エネルギーが第2のしきい値未満である場合は、ほ
ぼすべてのピクセルを前景または背景に割り当て、他方
はほぼ空とすることができる。エネルギーが第2のしき
い値以上である場合は、前述のように分割を進めること
ができる。比較的クリーンな文書画像(例えば一定の領
域を有するもの)の場合、計算速度の著しい向上を達成
することができる。
【0063】別の例では、マスクのサイズを最小限に抑
えるために、最終的な領域(例えば第1のしきい値を超
えずにマージすることができない領域)の平均前景と平
均背景との間の差が第3のしきい値よりも大きい場合、
その領域の大域平均値が中間グレーレベル値(例えばグ
レーレベル値が0から255までであれば127)より
も高いか低いかに応じて、その領域全体を前景としてま
たは背景として宣言する。わずかなディザリングのある
カラー文書では、これらの領域のためのマスクは、この
最適化を行わない場合は霜降り状に見えることになり、
圧縮コストが高くなる。第3のしきい値は、重要なテキ
ストを失わず、しかも印刷文書をスキャンする際に見ら
れるわずかなディザリングの多くのケースを除去するよ
うに選択される(例えば、多くのプリンタは4色から6
色しか有さず、完全なカラーパレットを生成するにはデ
ィザリングを用いなければならない)。一例では、第3
のしきい値には40の値が適切な選択である。
【0064】マスクセパレータ100について、前景お
よび背景がそれぞれ概して一定であると仮定して述べ
た。ただし、本発明の一態様によれば、ピクセルエネル
ギーコンポーネント130により、多項式回帰を用いて
前景および/または背景を記述することができる。例え
ば、前景および/または背景の多項式が式αx+βy+
μの平面である場合、エネルギーは以下のように定義さ
れる。
【0065】
【数10】
【0066】上式で、x、yはピクセル位置を示し、α
、β、μはνを最小化するスカラーであり、α
、β、μはνを最小化するスカラーである。α
、β、μは、3つの未知数および3つの方程式の
線形系である量
【0067】
【数11】
【0068】を用いて一定時間で解けることに留意され
たい。同じくα、β、μも同様にして解くことが
できる。概して一定である前景および/または背景に関
して上述したように、ピクセルエネルギーコンポーネン
ト130は、小さい領域をエネルギー最小化に基づいて
前景と背景に分割して、この領域についてのピクセルエ
ネルギーを計算することに進む。その後、これらの小さ
い領域は、試みられるマージごとのエネルギー(E)の
最小化に、少なくとも部分的に基づいて、領域マージコ
ンポーネント140によって連続的にマージが試みられ
る。しかし、前景および背景を平均値でソートすること
はできず、したがって7つの組合せすべてをテストし
て、Eを最小化する組合せを見つけなければならない。
マージを容易にするために、前景および背景について領
域ごとに式
【0069】
【外6】
【0070】を記憶することができる。
【0071】この場合もやはり計算オーバーヘッドを最
小限に抑えるために、小さい領域(例えば4ピクセル×
4ピクセル)についてのエネルギーをピクセルエネルギ
ーコンポーネント130によって計算することができ
る。ただしピクセルエネルギーコンポーネント130
は、この領域にわたる定数に基づくモデルを利用し、か
つ/または多項式回帰を利用することができる。
【0072】追加で、かつ/または別法として、ピクセ
ルエネルギーコンポーネント130は、平面回帰を用い
てエネルギーを計算することもできる。前景νおよび
背景νのエネルギーは以下のように定義される。
【0073】
【数12】
【0074】上式で、Fは前景であり、Bは背景であ
り、f(x,y)は位置x,yにおけるピクセルの値で
ある。さらに、A、B、Cは、前景νのエネル
ギーを最小化するように選択され、A、B、C
は、背景νのエネルギーを最小化するように選択さ
れる。例えば、前景νのエネルギーの最小化は、以下
の方程式系(3つの未知数、3つの方程式)を解くこと
によって得られる。
【0075】
【数13】
【0076】例えば次のようになる。
【0077】
【数14】
【0078】背景νのエネルギーについても同様の計
算を解くことができる。
【0079】図1は、マスクセパレータコンポーネント
100に関するコンポーネントを示す概略図だが、本明
細書にコンポーネントという語を定義してあるとおり、
マスクセパレータコンポーネント100は1つまたは複
数のコンポーネントとして実現できることを理解された
い。したがって、マスクセパレータコンポーネント10
0を実現するように動作可能なコンピュータ実行可能コ
ンポーネントは、本発明により、限定しないがASIC
(特定用途向け集積回路)、CD(コンパクトディス
ク)、DVD(ディジタルビデオディスク)、ROM
(読取り専用メモリ)、フロッピー(登録商標)ディス
ク、ハードディスク、EEPROM(電気的消去可能か
つプログラム可能な読取り専用メモリ)、およびメモリ
スティックを含めた、コンピュータ可読媒体に記憶でき
ることを理解されたい。
【0080】以上に図示および記述した例示的なシステ
ムに鑑みて、本発明により実現することのできる方法体
系が、図8および9のフローチャートを参照することで
よりよく理解できるであろう。説明を簡単にするために
この方法体系を一連のブロックとして図示および記述す
るが、本発明によりいくつかのブロックは、本明細書に
図示および記述するのとは異なる順番で、かつ/または
他のブロックと同時に行うこともできるので、本発明は
ブロックの順番によって限定されないことを理解および
認識されたい。さらに、本発明による方法体系を実施す
るために図示のブロックすべてが必要ではない場合もあ
る。
【0081】本発明は、1つまたは複数のコンポーネン
トによって実行される、プログラムモジュールなどのコ
ンピュータ実行可能命令の一般的なコンテキストで述べ
ることができる。一般にプログラムモジュールは、特定
のタスクを実施するか特定の抽象データ型を実装する、
ルーチン、プログラム、オブジェクト、データ構造など
を含む。通常、プログラムモジュールの機能は、望むな
ら様々な実施形態で結合または分散させることができ
る。
【0082】図8および9を見ると、本発明の一態様に
よるマスク生成の方法体系800が示してある。810
で、文書画像の一領域についてピクセルエネルギー(例
えば分散)を計算する。例えば、計算されるピクセルエ
ネルギー分散は、領域の多項式回帰に少なくとも部分的
に基づくものとすることができる。さらに、計算される
ピクセルエネルギー分散は、領域中のほぼすべてのピク
セルについての距離の2乗の和で利用される、前景につ
いての計算済み平均ピクセル値および背景についての計
算済み平均ピクセル値を利用して計算することもでき
る。あるいは、計算されるピクセルエネルギー分散は、
背景ピクセル値の合計と、前景ピクセル値の計算合計を
利用して計算することもできる。
【0083】次に820で、前景および/または背景の
ピクセルエネルギーを最小化するための、領域について
のピクセル分割を計算する。ステップ830で、文書画
像のほぼすべての領域が分割されたかどうかを判定す
る。830での判定がNOの場合は、処理を810で継
続する。830での判定がYESの場合は、処理を84
0で継続する。
【0084】次に840で、隣接する領域の対をマージ
してみる。850で、試みたマージによって新しい前景
および/または新しい背景中でしきい値エネルギーを超
えることになるかどうかを判定する。850での判定が
YESの場合は、処理を860で継続する。850での
判定がNOの場合は、870でこれらの領域をマージす
る。880で、マージされた領域の新しい前景背景の分
割を計算する。885で、文書画像のほぼすべての領域
のマージが試みられたかどうかを判定する。885での
判定がYESの場合は、これ以上の処理は行わない。8
85での判定がNOの場合は、処理を840で継続す
る。
【0085】860で、文書画像のほぼすべての領域の
マージが試みられたかどうかを判定する。860での判
定がNOの場合は、890で、試みるマージの焦点を、
マージされていない次の領域(例えば2ピクセル×2ピ
クセルの領域)に移す。860での判定がYESの場合
は、これ以上の処理は行わない。
【0086】次に図10を参照すると、本発明の一態様
による文書画像分離のためのシステム1000が示して
ある。システム1000は、マスクセパレータコンポー
ネント100および前景/背景セグメンタ160を含
む。マスクセパレータ100は、ピクセルエネルギーコ
ンポーネント130、領域マージコンポーネント14
0、およびマスク記憶コンポーネント150を含む。
【0087】前述のように、本発明の一態様によれば、
マスクセパレータコンポーネント100は文書画像11
0を入力として受け取る。マスクセパレータコンポーネ
ント100は、文書画像を処理して、マスク120を出
力として生成する。
【0088】前景/背景セグメンタ160は、マスク1
20および文書画像110を入力として受け取る。前景
/背景セグメンタ160は、マスク120に少なくとも
部分的に基づいて、文書画像110を前景画像170と
背景画像180とに分離するように適合される。例えば
マスク120中で「1」で表されるほぼすべてのピクセ
ルは前景画像170に入れ、マスク120中で「0」で
表されるほぼすべてのピクセルは背景画像180に入れ
ることができる。反対に、例えばマスク120中で
「0」で表されるほぼすべてのピクセルは前景画像17
0に入れ、マスク120中で「1」で表されるほぼすべ
てのピクセルは背景画像180に入れることもできる。
【0089】例えばマスクセパレータコンポーネント1
00は、テキストを含む文書画像110を処理する際、
ピクセル(例えばテキストに関連するもの)を前景とし
て分離して、どのピクセルが前景にあるかに関する情報
をマスク120に記憶することにより、文書画像110
を処理することができる。その後、前景/背景セグメン
タ160は、マスク120および文書画像110を受け
取ることができる。前景/背景セグメンタ160は、文
書画像110を前景画像170と背景画像180に分離
することができる。
【0090】図11を見ると、本発明の一態様による文
書画像圧縮のためのシステム1100が示してある。シ
ステム1100は、文書画像変換コンポーネント111
0と、マスク分離コンポーネント100と、前景/背景
セグメンタコンポーネント160を含む。前景/背景セ
グメンタ160は、マスク120および文書画像115
0を入力として受け取る。前景/背景セグメンタ160
は、マスク120に少なくとも部分的に基づいて、文書
画像1150を前景画像170と背景画像180とに分
離するように適合される。
【0091】図12に示すように、システム1100は
任意選択で、マスクエンコーダ1120、前景エンコー
ダ1130、および/または背景エンコーダ1140を
含むこともできる。マスク分離コンポーネント100
は、ピクセルエネルギーコンポーネント130、領域マ
ージコンポーネント140、およびマスク記憶コンポー
ネント150を含む。任意選択で、システム1100
は、前景画像プロセッサ1170および/または背景画
像プロセッサ1180を含むことができる。
【0092】文書画像変換コンポーネント1110は、
文書画像1150を受け取り、文書画像の変換済み表現
1160を出力するように適合される。例えば文書画像
変換コンポーネント1110は、RGB文書画像を受け
取り、RGB文書画像のYUV表現を出力することがで
きる。
【0093】マスクエンコーダ1120は、マスク12
0を符号化するように適合される。例えば、マスク12
0は通常はバイナリなので、マスクエンコーダ1120
は、従来のバイナリ圧縮技法を利用して効果的なマスク
圧縮を達成することができる。マスクエンコーダ112
0はマスクビットストリームを出力する。
【0094】前景エンコーダ1130は、前景画像17
0を符号化するように適合される。前景は、前景ピクセ
ルおよび「関係なし」ピクセル(例えば元は背景に属し
ていたピクセル)からなる画像である。前景画像プロセ
ッサ1170を使用して、圧縮を容易にする値で「関係
なし」ピクセルを埋め、改変済み前景画像を前景エンコ
ーダ1130に提供することができる。例えば、前景画
像170が概して黒色テキスト情報を含む場合は、前景
画像全体が黒になるように、「関係なし」ピクセルもま
た黒で埋めることができる。前景エンコーダ1130
は、JPEG、ウェーブレット、または他の任意の画像
圧縮アルゴリズムなど、画像圧縮に効果的な圧縮技法を
利用することができる。前景エンコーダ1130は前景
ビットストリームを出力する。
【0095】背景エンコーダ1140は、背景画像18
0を符号化するように適合される。背景は、背景ピクセ
ルおよび「関係なし」ピクセル(例えば元は前景に属し
ていたピクセル)からなる画像である。背景画像プロセ
ッサ1180を使用して、圧縮を容易にする値で「関係
なし」ピクセルを埋め、改変済み背景画像を背景エンコ
ーダ1140に提供することができる。例えば、背景画
像180が滑らかな白いページを含む場合は、背景画像
全体が白になるように、テキストのあった位置にある
「関係なし」ピクセルを白で埋めることができる。背景
エンコーダ1140は、JPEG、ウェーブレット、ま
たは他の任意の画像圧縮アルゴリズムなど、画像圧縮に
効果的な圧縮技法を利用することができる。背景エンコ
ーダ1140は背景ビットストリームを出力する。
【0096】例えば、「関係なし」ピクセルを埋めるた
めの単純なアルゴリズムは、画像をローパスフィルタで
処理してから重要なピクセルを復元するものである。こ
の2つのステップを何回か繰り返した後は、「関係な
し」ピクセルは滑らかな遷移をもたらす値になり、これ
らは小さく圧縮される。このアルゴリズムを簡単に改良
したものは、超低域のローパスフィルタで開始して、繰
返しごとにローパスフィルタのカット周波数を増加させ
るものである。
【0097】さらに、前景エンコーダ1130および/
または背景エンコーダ1140は、マスク120を利用
して前景および/または背景の圧縮を改善することがで
きる。本発明に関して前景と背景のうちの少なくとも一
方のピクセルエネルギー分散の最小化に、少なくとも部
分的に基づいて、行われる文書画像の分割に少なくとも
部分的に基づくマスクを利用するエンコーダおよび/ま
たはデコーダとしては、多くのものが企図されることを
理解されたい。このようなエンコーダおよび/またはデ
コーダは、本発明と共に利用するのに適したものならど
れも、頭記の特許請求の範囲内に含まれるものとする。
【0098】マスクビットストリーム、前景ビットスト
リーム、および/または背景ビットストリームは、単一
のビットストリームに結合することができ、かつ/ある
いは復号システム(図示せず)に個別に送信することが
できる。復号システムはマスク120を受け取ることが
できる。あるいは、復号システムは、マスク120を利
用して、前景ビットストリームおよび/または背景ビッ
トストリームを文書画像に再結合することができる。
【0099】本発明のシステムおよび/または方法は、
テキスト、手書き、ドローイングなどの識別および/ま
たは圧縮を容易にするセグメント化階層画像システム全
体において利用できることを理解されたい。さらに、本
発明のシステムおよび/または方法は、多くの文書画像
適用例で採用することができ、限定しないがこれらの適
用例には、写真複写機、文書スキャナ、光学文字認識シ
ステム、PDA、ファクス機、ディジタルカメラ、ディ
ジタルビデオカメラ、および/またはビデオゲームシス
テムが含まれることを、当業者なら理解するであろう。
【0100】図13を見ると、セグメント化階層画像シ
ステム1300が示されている。システム1300は、
ピクセルエネルギーコンポーネント130およびマスク
記憶コンポーネント150を含む。
【0101】ピクセルエネルギーコンポーネント130
は、文書画像の一領域のピクセルエネルギー分散を計算
するように適合される。さらに、ピクセルエネルギーコ
ンポーネント130は、前景と背景のうちの少なくとも
一方のピクセルエネルギー分散の最小化に、少なくとも
部分的に基づいて、領域の分割を計算するようにも適合
される。
【0102】マスク記憶コンポーネント150は、分割
に関連する情報をマスクに記憶するように適合される。
例えばシステム1300は、多くの文書画像適用例で採
用することができ、限定しないがこれらの適用例には、
写真複写機、文書スキャナ、光学文字認識システム、P
DA、ファクス機、ディジタルカメラ、ディジタルビデ
オカメラ、および/またはビデオゲームシステムが含ま
れる。
【0103】本発明の様々な態様に追加のコンテキスト
を提供するために、図14および以下の考察で、本発明
の様々な態様を実施できる適したコンピューティング環
境の一つ1410についての簡単かつ一般的な記述を提
供する。コンピューティング環境1410は、可能なコ
ンピューティング環境の一つに過ぎず、本発明を採用す
る際に用いることのできるコンピューティング環境を限
定するものではないことを理解されたい。本発明を、1
つまたは複数のコンピュータ上で実行できるコンピュー
タ実行可能命令の一般的なコンテキストで上述したが、
本発明は他のプログラムモジュールと共に、かつ/また
はハードウェアとソフトウェアの組合せとして実施する
こともできることを理解されたい。一般にプログラムモ
ジュールは、特定のタスクを実施するか特定の抽象デー
タ型を実装する、ルーチン、プログラム、コンポーネン
ト、データ構造などを含む。さらに、この発明的方法
は、シングルプロセッサまたはマルチプロセッサのコン
ピュータシステム、ミニコンピュータ、メインフレーム
コンピュータ、ならびにパーソナルコンピュータ、ハン
ドヘルドコンピューティングデバイス、マイクロプロセ
ッサベースのまたはプログラム可能な民生用電子機器な
ど、他のコンピュータシステム構成でも実施できること
は理解されるであろう。これらの構成はそれぞれ、1つ
または複数の関連デバイスと動作可能に結合させてもよ
い。例示した本発明の態様は分散コンピューティング環
境で実施することもでき、その場合、いくつかのタスク
は通信ネットワークを介してリンクされたリモート処理
デバイスによって実施される。分散コンピューティング
環境では、プログラムモジュールはローカルとリモート
の両方の記憶デバイスに位置することができる。
【0104】図14に、本明細書に述べたシステムおよ
び方法をサポートする可能なハードウェア構成の一つを
示す。スタンドアロンアーキテクチャを示してあるが、
適したものならどんなコンピューティング環境を本発明
により採用してもよいことを理解されたい。例えば、限
定しないがスタンドアロン、マルチプロセッサ、分散、
クライアント/サーバ、ミニコンピュータ、メインフレ
ーム、スーパーコンピュータ、ディジタル、アナログを
含めたコンピューティングアーキテクチャを、本発明に
より採用することができる。
【0105】図14を参照すると、本発明の様々な態様
を実施するための例示的な環境1410は、コンピュー
タ1412を含む。コンピュータ1412は、プロセッ
シングユニット1414と、システムメモリ1416
と、システムメモリを含めた様々なシステムコンポーネ
ントをプロセッシングユニット1414に結合するシス
テムバス1418とを含む。プロセッシングユニット1
414は、市販の様々なプロセッサのいずれかとするこ
とができる。デュアルマイクロプロセッサおよび他のマ
ルチプロセッサアーキテクチャをプロセッシングユニッ
ト1414として使用することもできる。
【0106】システムバス1418は、市販の様々なバ
スアーキテクチャのいずれかを用いたメモリバスまたは
メモリコントローラ、周辺バス、およびローカルバスを
含めた、いくつかのタイプのバス構造のいずれかとする
ことができる。コンピュータメモリ1416は、読取り
専用メモリ(ROM)1420およびランダムアクセス
メモリ(RAM)1422を含む。ROM1420に
は、起動中などにコンピュータ1412内の要素間で情
報を転送する助けとなる基本ルーチンを含むBIOS
(basic input/output syste
m)が記憶されている。
【0107】コンピュータ1412はさらに、ハードデ
ィスクドライブ1424と、例えば取外し可能ディスク
1428に対する読み書きを行うための磁気ディスクド
ライブ1426と、例えばCD−ROMディスク143
2の読取りや他の光媒体に対する読み書きを行うための
光ディスクドライブ1430も含む。ハードディスクド
ライブ1424、磁気ディスクドライブ1426、およ
び光ディスクドライブ1430は、それぞれハードディ
スクドライブインタフェース1434、磁気ディスクド
ライブインタフェース1436、および光ドライブイン
タフェース1438によってシステムバス1418に接
続される。コンピュータ1412は通常、少なくとも何
らかの形のコンピュータ可読媒体を含む。コンピュータ
可読媒体は、コンピュータ1412からアクセスできる
任意の利用可能な媒体とすることができる。限定ではな
く例として、コンピュータ可読媒体には、コンピュータ
記憶媒体および通信媒体が含まれる。コンピュータ記憶
媒体には、コンピュータ可読命令、データ構造、プログ
ラムモジュール、または他のデータなどの情報を記憶す
るための任意の方法および技術で実現される、揮発性お
よび不揮発性の、かつ取外し可能および取外し不可能な
媒体が含まれる。コンピュータ記憶媒体には、限定しな
いがRAM、ROM、EEPROM、フラッシュメモリ
または他のメモリ技術、CD−ROM、ディジタル多用
途ディスク(DVD)または他の磁気記憶デバイスが含
まれ、あるいは、所望の情報を記憶するのに使用できコ
ンピュータ1412からアクセスできる他の任意の媒体
が含まれる。通信媒体は通常、搬送波や他のトランスポ
ート機構など変調されたデータ信号中に、コンピュータ
可読命令、データ構造、プログラムモジュール、または
他のデータを組み入れたものであり、任意の情報送達媒
体が含まれる。「変調されたデータ信号」という語は、
信号中の情報が符号化される形で1つまたは複数の特性
が設定または変更された信号を意味する。限定ではなく
例として、通信媒体には、配線式ネットワークや直接配
線式接続などの配線式媒体と、音響、RF、赤外線、そ
の他の無線媒体などの無線媒体とが含まれる。以上の任
意の組合せもコンピュータ可読媒体の範囲に含まれるべ
きである。
【0108】各ドライブおよびRAM1422には、オ
ペレーティングシステム1440、1つまたは複数のア
プリケーションプログラム1442、その他のプログラ
ムモジュール1444、およびプログラム非割込みデー
タ1446を含めて、いくつかのプログラムモジュール
を記憶することができる。コンピュータ1412中のオ
ペレーティングシステム1440は、多くの市販オペレ
ーティングシステムのいずれかとすることができる。
【0109】ユーザは、キーボード1448、およびマ
ウス1450などのポインティングデバイスを介して、
コンピュータ1412にコマンドおよび情報を入力する
ことができる。その他の入力デバイス(図示せず)に
は、マイクロホン、IRリモートコントロール、ジョイ
スティック、ゲームパッド、衛生受信アンテナ、スキャ
ナなどを含めることができる。これらおよび他の入力デ
バイスは、システムバス1418に結合されたシリアル
ポートインタフェース1452を介してプロセッシング
ユニット1414に接続されることが多いが、パラレル
ポート、ゲームポート、ユニバーサルシリアルバス
(「USB」)、IRインタフェースなど、他のインタ
フェースで接続されてもよい。モニタ1454または他
のタイプの表示デバイスもまた、ビデオアダプタ145
6などのインタフェースを介してシステムバス1418
に接続される。モニタに加えて、コンピュータは通常、
スピーカやプリンタなど他の周辺出力デバイス(図示せ
ず)も含む。
【0110】コンピュータ1412は、リモートコンピ
ュータ1458など1つまたは複数のリモートコンピュ
ータへの論理接続および/または物理接続を用いて、ネ
ットワーク化された環境で動作することができる。リモ
ートコンピュータ1458は、ワークステーション、サ
ーバコンピュータ、ルータ、パーソナルコンピュータ、
マイクロプロセッサベースの娯楽機器、ピアデバイス、
または他の一般的なネットワークノードとすることがで
きる。簡単にするためにメモリ記憶デバイス1460し
か示していないが、通常はコンピュータ1412に関し
て述べた要素の多くまたはすべてを含む。図示の論理接
続は、ローカルエリアネットワーク(LAN)1462
およびワイドエリアネットワーク(WAN)1464を
含む。このようなネットワーキング環境は、オフィス、
企業全体のコンピュータネットワーク、イントラネッ
ト、およびインターネットでよくみられるものである。
【0111】コンピュータ1412は、LANネットワ
ーキング環境で使用されるときは、ネットワークインタ
フェースまたはアダプタ1466を介してローカルネッ
トワーク1462に接続される。WANネットワーキン
グ環境で使用されるときは通常、コンピュータ1412
はモデム1468を含むか、LAN上の通信サーバに接
続されるか、あるいは、インターネットなどのWAN1
464を介した通信を確立するための他の手段を有す
る。モデム1468は内蔵でも外付けでもよく、シリア
ルポートインタフェース1452を介してシステムバス
1418に接続される。ネットワーク化された環境で
は、コンピュータ1412に関して示したプログラムモ
ジュールまたはその一部を、リモートのメモリ記憶デバ
イス1460に記憶することができる。図示のネットワ
ーク接続は例示的なものであり、コンピュータ間の通信
リンクを確立する他の手段を使用してもよいことは理解
されるであろう。
【0112】図15は、本発明が対話することのできる
コンピューティング環境の実例1500の概略ブロック
図である。システム1500は、1つまたは複数のクラ
イアント1510を含む。クライアント1510は、ハ
ードウェアおよび/またはソフトウェア(例えばスレッ
ド、プロセス、コンピューティングデバイス)とするこ
とができる。システム1500は、1つまたは複数のサ
ーバ1530も含む。サーバ1530もまた、ハードウ
ェアおよび/またはソフトウェア(例えばスレッド、プ
ロセス、コンピューティングデバイス)とすることがで
きる。サーバ1530は、例えば、本発明を利用して変
換を行うためのスレッドを格納することができる。クラ
イアント1510とサーバ1530との間における可能
な通信の一つは、2つ以上のコンピュータプロセス間で
伝送されるように適合されたデータパケットの形とする
ことができる。システム1500は、クライアント15
10とサーバ1530との間の通信を容易にするのに利
用できる通信フレームワーク1550を含む。クライア
ント1510は、クライアント1510にとってローカ
ルの情報を記憶するのに利用できる1つまたは複数のク
ライアントデータ記憶域1560に動作可能に接続され
る。同様に、サーバ1530は、サーバ1530にとっ
てローカルの情報を記憶するのに利用できる1つまたは
複数のサーバデータ記憶域1540に動作可能に接続さ
れる。
【0113】以上の記述は、本発明の実施例を含む。本
発明を記述するためにコンポーネントまたは方法体系の
考えられるあらゆる組合せについて述べることは当然不
可能だが、本発明のさらに多くの組合せおよび置換が可
能であることは、当業者なら理解するであろう。したが
って本発明は、頭記の特許請求の趣旨および範囲に含ま
れるそのような改変、修正、および変形すべてを包含す
るものとする。さらに、「含む」という語が詳細な説明
または特許請求の範囲で使用される限りでは、このよう
な語は、「備える」という語が特許請求の範囲における
移行句として採用されるときに解釈されるように、「備
える」と同様の形で包括的なものとする。
【図面の簡単な説明】
【図1】本発明の一態様によるマスクセパレータコンポ
ーネントのブロック図である。
【図2】本発明の一態様による例示的な文書画像の図で
ある。
【図3】本発明の一態様による、図2の例示的な文書画
像に関連するマスクの図である。
【図4】本発明の一態様による、図2の例示的な文書画
像および図3のマスクに関連する背景の図である。
【図5】本発明の一態様による、例示的な2ピクセル×
2ピクセルの領域の図である。
【図6】本発明の一態様による、例示的な2ピクセル×
4ピクセルの潜在マージ領域の図である。
【図7】本発明の一態様による、例示的な4ピクセル×
4ピクセルの潜在マージ領域の図である。
【図8】本発明の一態様による、マスクを生成する方法
体系を示すフローチャートである。
【図9】図8の方法体系をさらに示すフローチャートで
ある。
【図10】本発明の一態様による文書画像分離システム
のブロック図である。
【図11】本発明の一態様による文書画像圧縮のブロッ
ク図である。
【図12】本発明の一態様による文書画像圧縮のブロッ
ク図である。
【図13】本発明の一態様によるセグメント化階層画像
システムのブロック図である。
【図14】本発明の一態様により構成されたシステムの
ための例示的な動作環境の概略ブロック図である。
【図15】本発明の一態様による例示的な通信環境の概
略ブロック図である。
【符号の説明】
100 マスクセパレータコンポーネント 110、1150、 文書画像 120 マスク 130 ピクセルエネルギーコンポーネント 140 領域マージコンポーネント 150 マスク記憶コンポーネント 160 前景/背景セグメンタコンポーネント 170 前景画像 180 背景画像 1000 文書画像分離のためのシステム 1110 文書画像変換コンポーネント 1120 マスクエンコーダ 1130 前景エンコーダ 1140 背景エンコーダ 1170 前景画像プロセッサ 1180 背景画像プロセッサ 1300 セグメント化階層画像システム 1410 適したコンピューティング環境 1412 コンピュータ 1414 プロセッシングユニット 1416 システムメモリ 1418 システムバス 1420 ROM 1422 RAM 1424 ハードディスクドライブ 1426 磁気ディスクドライブ 1428、1432 ディスク 1430 光ディスクドライブ 1434 ハードディスクドライブインタフェース 1436 磁気ディスクドライブインタフェース 1438 光ドライブインタフェース 1440 オペレーティングシステム 1442 アプリケーションプログラム 1444 プログラムモジュール 1446 データ 1448 キーボード 1450 マウス 1454 モニタ 1456 ビデオアダプタ 1452 シリアルポートインタフェース 1458 リモードコンピュータ 1460 メモリ記憶デバイス 1462 LAN 1464 WAN 1466 ネットワークアダプタ 1468 モデム 1500 本発明が対話することのできるコンピューテ
ィング環境 1510 クライアント 1530 サーバ 1540 サーバデータ記憶域 1550 通信フレームワーク 1560 クライアントデータ記憶域
───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 10/180,771 (32)優先日 平成14年6月26日(2002.6.26) (33)優先権主張国 米国(US) (72)発明者 パトリス ワイ.シマルド アメリカ合衆国 98005 ワシントン州 ベルビュー ノースイースト 31 プレイ ス 13126 (72)発明者 エリン エル.レンショウ アメリカ合衆国 98034 ワシントン州 カークランド ノースイースト 135 ス トリート 13327 (72)発明者 ジェームズ ラッセル リンカー アメリカ合衆国 98034 ワシントン州 カークランド ノースイースト 136 プ レイス 13615 Fターム(参考) 5B057 CA08 CA12 CA16 CB08 CB12 CB18 CG01 DA08 DA17 DB02 DB09 DC16 DC22 5B064 BA01 DC25 5C059 MA31 PP01 PP04 PP15 PP16 SS13 SS28 UA02 5C078 AA04 BA64 CA01 DA01 DB00

Claims (40)

    【特許請求の範囲】
  1. 【請求項1】 文書画像の領域についてのピクセルエネ
    ルギーを計算するように適合され、さらに前景と背景の
    うちの少なくとも一方のピクセルエネルギーの最小化
    に、少なくとも部分的に基づいて、前記領域の分割(p
    artition)を計算するように適合されたピクセ
    ルエネルギーコンポーネントと、 ピクセルエネルギーの最小化に、少なくとも部分的に基
    づいて、前記文書画像の領域の対をマージする領域マー
    ジコンポーネントと、 前記分割に関連する情報をマスクに記憶するように適合
    されたマスク記憶コンポーネントとを備えたことを特徴
    とするセグメント化階層画像システム。
  2. 【請求項2】 前記ピクセルエネルギーコンポーネント
    は、前記領域のピクセルエネルギー分散を計算するため
    に、式 【数1】 を利用してエネルギー分散を計算し、 上式で、Fは前景であり、 Bは背景であり、f(x)はピクセルの値であり、 【数2】 は前記前景の平均ピクセル値であり、
  3. 【数3】 は前記背景の平均ピクセル値であり、Nは前記前景に
    あるピクセルの数であり、 Nは前記背景にあるピクセルの数であることを特徴と
    する請求項1に記載のセグメント化階層画像システム。 【請求項3】 前記ピクセルエネルギーコンポーネント
    は、前記領域のピクセルエネルギーを計算するために、
  4. 【数4】 を利用してエネルギーを計算し、 上式で、Fは前景であり、 Bは背景であり、f(x,y)は位置x,yにおけるピ
    クセルの値であり、 A、B、Cは、前記前景νのエネルギーを最小
    化するように選択され、 A、B、Cは、前記背景νのエネルギーを最小
    化するように選択されることを特徴とする請求項1に記
    載のセグメント化階層画像システム。 【請求項4】 前記領域マージコンポーネントは、2つ
    の領域の前景と背景の組合せを評価し、累積エネルギー
    の最も小さい組合せを選択することを特徴とする請求項
    1に記載のセグメント化階層画像システム。
  5. 【請求項5】 前記領域マージコンポーネントは、2つ
    の領域にわたる近似値fに基づいて、所与の領域の前景
    と背景の組合せの限定的な部分集合を評価し、累積エネ
    ルギーの最も小さい組合せを選択することを特徴とする
    請求項1に記載のセグメント化階層画像システム。
  6. 【請求項6】 請求項1に記載の前記セグメント化階層
    画像システムを利用することを特徴とする写真複写機。
  7. 【請求項7】 請求項1に記載の前記セグメント化階層
    画像システムを利用することを特徴とする文書スキャ
    ナ。
  8. 【請求項8】 請求項1に記載の前記セグメント化階層
    画像システムを利用することを特徴とする光学文字認識
    システム。
  9. 【請求項9】 請求項1に記載の前記セグメント化階層
    画像システムを利用することを特徴とするパーソナルデ
    ィジタルアシスタント。
  10. 【請求項10】 請求項1に記載の前記セグメント化階
    層画像システムを利用することを特徴とするファクス
    機。
  11. 【請求項11】 請求項1に記載の前記セグメント化階
    層画像システムを利用することを特徴とするディジタル
    カメラ。
  12. 【請求項12】 請求項1に記載の前記セグメント化階
    層画像システムを利用することを特徴とするディジタル
    ビデオカメラ。
  13. 【請求項13】 請求項1に記載の前記セグメント化階
    層画像システムを利用することを特徴とするビデオゲー
    ムシステム。
  14. 【請求項14】 セグメント化階層画像システムで利用
    されるマスク生成方法であって、 領域についてのピクセルエネルギーを計算するステップ
    と、 前記領域の前景と背景のうちの少なくとも一方の計算さ
    れたピクセルエネルギーに、少なくとも部分的に基づい
    て、前記領域を分割するステップと、 前記前景と前記背景のうちの少なくとも一方のエネルギ
    ーの最小化に、少なくとも部分的に基づいて、隣接する
    領域の対をマージするステップと、 前記分割の情報をマスクに記憶するステップとを備える
    ことを特徴とする方法。
  15. 【請求項15】 前記領域についてのピクセルエネルギ
    ーを計算するステップはさらに、 前景についてのピクセル値の和を計算するステップと、 背景についてのピクセル値の和を計算するステップと、 前記領域中のほぼすべてのピクセルについて距離の2乗
    の和を計算するステップとを備えることを特徴とする請
    求項14に記載の方法。
  16. 【請求項16】 文書画像の領域についてのピクセルエ
    ネルギーを計算するように適合され、さらに前景と背景
    のうちの少なくとも一方のピクセルエネルギーの最小化
    に、少なくとも部分的に基づいて、前記領域の分割を計
    算するように適合されたピクセルエネルギーコンポーネ
    ントと、 マージされる領域が第1のしきい値エネルギーを超える
    かどうかの決定に、少なくとも部分的に基づいて、前記
    文書画像の領域の対をマージするように適合され、さら
    に当該マージされた領域を新しい前景と新しい背景とに
    分割するように適合された領域マージコンポーネント
    と、 前記分割に関連する情報をマスクに記憶するように適合
    されたマスク記憶コンポーネントとを備えたことを特徴
    とするマスクセパレータコンポーネント。
  17. 【請求項17】 前記文書画像は文書のYUV、RG
    B、およびバイナリ表現のうちの少なくとも1つを備え
    ることを特徴とする請求項16に記載のマスクセパレー
    タコンポーネント。
  18. 【請求項18】 前記マスクは前景と背景との分割に関
    連する情報のバイナリ表現であることを特徴とする請求
    項16に記載のマスクセパレータコンポーネント。
  19. 【請求項19】 前記ピクセルエネルギーコンポーネン
    トは、K=2としたK平均クラスタリングアルゴリズム
    を少なくとも部分的に利用して領域についてのピクセル
    エネルギー分散を計算することを特徴とする請求項16
    に記載のマスクセパレータコンポーネント。
  20. 【請求項20】前記ピクセルエネルギーコンポーネント
    は、前記領域のピクセルエネルギー分散を計算するため
    に、式 【数5】 を利用してエネルギー分散を計算し、 上式で、Fは前景であり、 Bは背景であり、f(x)はピクセルの値であり、 【数6】 は前記前景の平均ピクセル値であり、 【数7】 は前記背景の平均ピクセル値であり、 Nは前記前景にあるピクセルの数であり、 Nは前記背景にあるピクセルの数であることを特徴と
    する請求項16に記載のマスクセパレータコンポーネン
    ト。
  21. 【請求項21】 前記ピクセルエネルギーコンポーネン
    トは、前記ピクセルエネルギーの計算に関連する情報の
    少なくともいくらかを少なくとも一時的に記憶すること
    を特徴とする請求項16に記載のマスクセパレータコン
    ポーネント。
  22. 【請求項22】 前記ピクセルエネルギーコンポーネン
    トは、前記領域の多項式回帰に少なくとも部分的に基づ
    いて前記領域についてのピクセルエネルギーを計算する
    ことを特徴とする請求項16に記載のマスクセパレータ
    コンポーネント。
  23. 【請求項23】 前記領域マージコンポーネントの分割
    は、マージされた前記領域のピクセル値の平均値に少な
    くとも部分的に基づくことを特徴とする請求項16に記
    載のマスクセパレータコンポーネント。
  24. 【請求項24】 前記平均値よりも大きいピクセル値は
    前記前景に割り当てられることを特徴とする請求項23
    に記載のマスクセパレータコンポーネント。
  25. 【請求項25】 前記平均値よりも大きいピクセル値は
    前記背景に割り当てられることを特徴とする請求項23
    に記載のマスクセパレータコンポーネント。
  26. 【請求項26】 前記文書画像はYUV表現であり、前
    記ピクセルエネルギーコンポーネントはピクセルエネル
    ギーの計算において少なくともY成分を利用することを
    特徴とする請求項16に記載のマスクセパレータコンポ
    ーネント。
  27. 【請求項27】 文書画像を背景と前景とに分割するマ
    スクを生成する方法であって、 領域についてのピクセルエネルギーを計算するステップ
    と、 前記領域の前景と背景のうちの少なくとも一方の計算さ
    れた前記ピクセルエネルギーに、少なくとも部分的に基
    づいて、前記領域を分割するステップと、 マージされる領域で新しい前景および新しい背景に関連
    するしきい値エネルギーを超えない場合に、隣接する領
    域の対をマージするステップと、 当該マージされた領域を前記新しい前景と前記新しい背
    景とに分割するステップと、 前記分割の情報をマスクに記憶するステップとを備える
    ことを特徴とする方法。
  28. 【請求項28】 前記領域についてのピクセルエネルギ
    ーを計算するステップはさらに、 前景についてのピクセル値の和を計算するステップと、 背景についてのピクセル値の和を計算するステップと、 前記領域中のほぼすべてのピクセルについて距離の2乗
    の和を計算するステップとを備えることを特徴とする請
    求項27に記載の方法。
  29. 【請求項29】 前記領域についてのピクセルエネルギ
    ーを計算するステップは、前記領域の多項式回帰に少な
    くとも部分的に基づくことを特徴とする請求項27に記
    載の方法。
  30. 【請求項30】 前記領域を分割するステップはさら
    に、前景と背景のうちの少なくとも一方のピクセルエネ
    ルギーを最小化するステップを備えることを特徴とする
    請求項27に記載の方法。
  31. 【請求項31】 前記マージされた領域を分割するステ
    ップでは、さらに、前記マージされた領域のピクセル値
    の平均値を計算することを備えることを特徴とする請求
    項27に記載の方法。
  32. 【請求項32】 前記マージされた領域を分割するステ
    ップはさらに、 前記マージされた領域の前景の平均ピクセル値を計算す
    る動作と、 前記マージされた領域の背景の平均ピクセル値を計算す
    る動作と、 前記前景の平均ピクセル値と前記背景の平均ピクセル値
    との差が第3のしきい値よりも大きい場合に、ピクセル
    を前記前景と前記背景のうちの一方に割り当てる動作と
    を備えることを特徴とする請求項27に記載の方法。
  33. 【請求項33】 前記領域を分割するステップはさら
    に、 前記領域についてのエネルギーを計算する動作と、 前記エネルギーが第2のしきい値未満である場合に、前
    記領域のピクセルを前景と背景のうちの少なくとも一方
    に割り当てる動作とを備えることを特徴とする請求項2
    7に記載の方法。
  34. 【請求項34】 文書画像を受け取って該文書画像の変
    換済み表現を出力するように適合された文書変換コンポ
    ーネントと、 マスクセパレータコンポーネントとを備える文書画像圧
    縮システムであって、前記マスクセパレータコンポーネ
    ントは、前記変換済み表現の領域についてのピクセルエ
    ネルギーを決定するように適合されたピクセルエネルギ
    ーコンポーネントを備え、前記ピクセルエネルギーコン
    ポーネントはさらに、前景と背景のうちの少なくとも一
    方のエネルギーの最小化に、少なくとも部分的に基づい
    て、分割を決定するように適合され、前記マスクセパレ
    ータコンポーネントはさらに、第1のしきい値エネルギ
    ーを超えなかった場合に領域の対をマージするように適
    合された領域マージコンポーネントを備え、前記領域マ
    ージコンポーネントはさらに、新しい前景および新しい
    背景を構成するピクセルのエネルギーの最小化に、少な
    くとも部分的に基づいて、マージされた領域のピクセル
    を新しい前景と新しい背景とに分割するように適合さ
    れ、前記マスクセパレータコンポーネントはさらに、分
    割情報をマスクに記憶するように適合されたマスク記憶
    コンポーネントを備えることを特徴とする文書画像圧縮
    システム。
  35. 【請求項35】 前記マスクに記憶された情報に、少な
    くとも部分的に基づいて前記変換済み表現を前景画像と
    背景画像とに分離するように適合された前景/背景セグ
    メンタコンポーネントをさらに備えることを特徴とする
    請求項34に記載の文書画像圧縮システム。
  36. 【請求項36】 前景エンコーダ、背景エンコーダ、マ
    スクエンコーダのうちの少なくとも1つをさらに備える
    ことを特徴とする請求項34に記載の文書画像圧縮シス
    テム。
  37. 【請求項37】 前記文書変換コンポーネントは、RG
    B文書画像を受け取って、該RGB文書画像のYUV表
    現を出力するように適合されたことを特徴とする請求項
    34に記載の文書画像圧縮システム。
  38. 【請求項38】 2つ以上のコンピュータプロセス間で
    伝送されるように適合されたデータパケットであって、
    該データパケットは、 マスクに関連する情報を備え、前記マスクはピクセルを
    文書画像の前景と背景のうちの少なくとも一方に割り当
    て、前記マスクは前記文書画像の領域におけるピクセル
    のエネルギーを最小化する計算に少なくとも部分的に基
    づくことを特徴とするデータパケット。
  39. 【請求項39】マスク分離コンポーネントのためのコン
    ピュータ使用可能コンポーネントを有するコンピュータ
    可読媒体であって、 文書画像の表現の領域についてのピクセルエネルギーを
    計算するように適合され、さらに前景と背景のうちの少
    なくとも一方のピクセルエネルギーの最小化に、少なく
    とも部分的に基づいて、前記領域の分割を計算するよう
    に適合されたピクセルエネルギーコンポーネントと、 マージされる領域がしきい値エネルギーを超えるかどう
    かの決定に少なくとも部分的に基づいて前記文書画像の
    表現の領域の対をマージするように適合され、さらに、
    前景と背景のうちの少なくとも一方のピクセルのエネル
    ギーの最小化に、少なくとも部分的に基づいて、マージ
    された前記領域を新しい前景と新しい背景とに分割する
    ように適合された領域マージコンポーネントと、 前景と背景との分割に関連する情報をマスクに記憶する
    ように適合されたマスク記憶コンポーネントとを備えこ
    とを特徴とするコンピュータ可読媒体。
  40. 【請求項40】 文書画像の表現の領域についてのピク
    セルエネルギーを計算する手段と、 2つの平面のうちの少なくとも一方のエネルギーの最小
    化に、少なくとも部分的に基づいて、前記領域の分割を
    計算する手段と、 マージされる領域がしきい値エネルギーを超えるかどう
    かの決定に少なくとも部分的に基づいて前記文書画像の
    表現の領域の対をマージする手段と、 前景と背景のうちの少なくとも一方を構成するピクセル
    のエネルギーの最小化に、少なくとも部分的に基づい
    て、前記領域のピクセルを前景と背景とに分割する手段
    と、 前記分割に関連する情報をマスクに記憶する手段とを備
    えたことを特徴とするマスク分離コンポーネント。
JP2003083847A 2002-04-25 2003-03-25 マスクを利用して文書画像の圧縮を容易にするシステムおよび方法 Expired - Lifetime JP4295537B2 (ja)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US10/133,939 US7392472B2 (en) 2002-04-25 2002-04-25 Layout analysis
US10/133,558 US7164797B2 (en) 2002-04-25 2002-04-25 Clustering
US10/133,842 US7263227B2 (en) 2002-04-25 2002-04-25 Activity detector
US10/133,939 2002-06-26
US10/180,771 US7110596B2 (en) 2002-04-25 2002-06-26 System and method facilitating document image compression utilizing a mask
US10/180,771 2002-06-26
US10/133,558 2002-06-26
US10/133,842 2002-06-26

Publications (2)

Publication Number Publication Date
JP2003346166A true JP2003346166A (ja) 2003-12-05
JP4295537B2 JP4295537B2 (ja) 2009-07-15

Family

ID=29554396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003083847A Expired - Lifetime JP4295537B2 (ja) 2002-04-25 2003-03-25 マスクを利用して文書画像の圧縮を容易にするシステムおよび方法

Country Status (7)

Country Link
US (2) US7110596B2 (ja)
EP (1) EP1388816B1 (ja)
JP (1) JP4295537B2 (ja)
KR (1) KR100937543B1 (ja)
CN (1) CN100470593C (ja)
ES (1) ES2600756T3 (ja)
TW (1) TWI244051B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006005923A (ja) * 2004-06-14 2006-01-05 Xerox Corp ディジタル画像のファイルサイズを動的に制御する画像入力システム及び方法

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7110596B2 (en) * 2002-04-25 2006-09-19 Microsoft Corporation System and method facilitating document image compression utilizing a mask
US20040233477A1 (en) * 2003-05-21 2004-11-25 International Business Machines Corporation Digital halftoning
JP3738291B2 (ja) * 2003-06-09 2006-01-25 住友大阪セメント株式会社 三次元形状測定装置
US7202872B2 (en) * 2003-10-29 2007-04-10 Via Technologies, Inc. Apparatus for compressing data in a bit stream or bit pattern
FR2864857B1 (fr) * 2004-01-05 2006-03-03 Canon Kk Procede et dispositif d'optimisation de la taille d'un document numerique
US8442311B1 (en) 2005-06-30 2013-05-14 Teradici Corporation Apparatus and method for encoding an image generated in part by graphical commands
US7782339B1 (en) 2004-06-30 2010-08-24 Teradici Corporation Method and apparatus for generating masks for a multi-layer image decomposition
US7616341B2 (en) * 2004-07-12 2009-11-10 Toshiba Corporation System and method for metadata controlled multi-configured halftone screening
AU2004242419A1 (en) * 2004-12-21 2006-07-06 Canon Kabushiki Kaisha Analysing digital image of a document page
KR100599141B1 (ko) * 2005-05-20 2006-07-12 삼성전자주식회사 문서 압축시스템 및 그 압축방법
US7567254B2 (en) * 2005-06-30 2009-07-28 Microsoft Corporation Parallel texture synthesis having controllable jitter
KR100708180B1 (ko) * 2005-09-22 2007-04-17 삼성전자주식회사 화상 압축 장치 및 방법
DE102006010763A1 (de) * 2006-03-08 2007-09-13 Netviewer Gmbh Hybrides Bildkompressionsverfahren
JP4764231B2 (ja) 2006-03-31 2011-08-31 キヤノン株式会社 画像処理装置、制御方法、コンピュータプログラム
US8004536B2 (en) * 2006-12-01 2011-08-23 Adobe Systems Incorporated Coherent image selection and modification
US8175409B1 (en) 2006-12-01 2012-05-08 Adobe Systems Incorporated Coherent image selection and modification
US7899247B2 (en) * 2007-01-24 2011-03-01 Samsung Electronics Co., Ltd. Apparatus and method of segmenting an image according to a cost function and/or feature vector and/or receiving a signal representing the segmented image in an image coding and/or decoding system
US7929729B2 (en) * 2007-04-02 2011-04-19 Industrial Technology Research Institute Image processing methods
KR101366596B1 (ko) 2007-08-03 2014-03-14 삼성전자주식회사 이차원 정지 화상에 대해 몰입감을 생성하는 방법 및시스템 그리고 상기 몰입감 생성을 위한 팩터 조절 방법,이미지 콘텐트 분석 방법 및 스케일링 파라미터 예측 방법
US7907778B2 (en) * 2007-08-13 2011-03-15 Seiko Epson Corporation Segmentation-based image labeling
US8391638B2 (en) 2008-06-04 2013-03-05 Microsoft Corporation Hybrid image format
US8204964B2 (en) 2008-08-06 2012-06-19 Microsoft Corporation Efficient size optimization of visual information or auditory information
US9355469B2 (en) 2009-01-09 2016-05-31 Adobe Systems Incorporated Mode-based graphical editing
CN101510304B (zh) * 2009-03-30 2014-05-21 北京中星微电子有限公司 一种分割获取前景图像的方法、装置和摄像头
EP2406953B1 (en) * 2009-06-22 2015-06-10 Sony Corporation A method of compression of graphics images and videos
JP2011013898A (ja) * 2009-07-01 2011-01-20 Canon Inc 画像処理装置、画像処理方法、及び、プログラム
KR101289514B1 (ko) * 2009-09-09 2013-07-25 소니 주식회사 인코딩 방법 및 인코더 장치
CN102725773B (zh) * 2009-12-02 2015-12-02 惠普发展公司,有限责任合伙企业 数字化图像的前景背景分割的系统与方法
US8582906B2 (en) * 2010-03-03 2013-11-12 Aod Technology Marketing, Llc Image data compression and decompression
CN102006473B (zh) * 2010-11-18 2013-03-13 无锡中星微电子有限公司 视频编码器和编码方法以及视频解码器和解码方法
US8965140B1 (en) * 2011-01-31 2015-02-24 Teradici Corporation Method and apparatus for encoding mixed content image sequences
US8891894B2 (en) * 2011-09-30 2014-11-18 Apple Inc. Psychovisual image compression
CN102890827B (zh) * 2011-10-09 2015-05-13 北京多看科技有限公司 一种扫描版文档重排版的方法
TWI479448B (zh) * 2012-07-06 2015-04-01 Univ Nat Taiwan 影像前處理方法及系統
US9460365B1 (en) * 2015-03-24 2016-10-04 Intel Corporation Clustered palette compression
US10303498B2 (en) 2015-10-01 2019-05-28 Microsoft Technology Licensing, Llc Performance optimizations for emulators
US10922537B2 (en) * 2018-05-01 2021-02-16 Scribe Fusion, LLC System and method for processing and identifying content in form documents
CN108924557B (zh) * 2018-06-11 2022-02-08 海信视像科技股份有限公司 图像处理方法、装置、电子设备及存储介质
WO2020033967A1 (en) * 2018-08-10 2020-02-13 Buffalo Automation Group Inc. Training a deep learning system for maritime applications
CN111652144B (zh) * 2020-06-03 2023-09-26 广东小天才科技有限公司 基于目标区域融合的题目分割方法、装置、设备和介质
US11042422B1 (en) 2020-08-31 2021-06-22 Microsoft Technology Licensing, Llc Hybrid binaries supporting code stream folding
US11403100B2 (en) 2020-08-31 2022-08-02 Microsoft Technology Licensing, Llc Dual architecture function pointers having consistent reference addresses
US11231918B1 (en) 2020-08-31 2022-01-25 Microsoft Technologly Licensing, LLC Native emulation compatible application binary interface for supporting emulation of foreign code
KR20210152992A (ko) * 2020-12-04 2021-12-16 한국전자통신연구원 이진 마스크를 사용하는 영상 인코딩/디코딩을 위한 방법, 장치 및 기록 매체
KR102595278B1 (ko) 2020-12-29 2023-10-27 부산대학교 산학협력단 표면결함검출 스캐너를 위한 이미지 데이터 저장 장치 및 방법

Family Cites Families (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3606546A (en) * 1969-05-13 1971-09-20 Dennison Mfg Co Photocopier
US3719922A (en) * 1971-06-24 1973-03-06 L Lopes Digital camera
FR2171518A5 (ja) * 1972-02-03 1973-09-21 Labo Electronique Physique
US4606069A (en) * 1983-06-10 1986-08-12 At&T Bell Laboratories Apparatus and method for compression of facsimile information by pattern matching
JPS60254871A (ja) 1984-05-31 1985-12-16 Kokusai Denshin Denwa Co Ltd <Kdd> フアクシミリ画像の符号化方法
US4754492A (en) * 1985-06-03 1988-06-28 Picturetel Corporation Method and system for adapting a digitized signal processing system for block processing with minimal blocking artifacts
US5077807A (en) * 1985-10-10 1991-12-31 Palantir Corp. Preprocessing means for use in a pattern classification system
GB8525509D0 (en) 1985-10-16 1985-11-20 Int Computers Ltd Symbol pattern matching
DE3583040D1 (de) * 1985-12-17 1991-07-04 Ibm Bild-vorverarbeitungsverfahren zur rauschentfernung.
JP2675303B2 (ja) 1987-04-28 1997-11-12 キヤノン株式会社 文字認識方法
JPH0816918B2 (ja) 1989-04-18 1996-02-21 シャープ株式会社 行抽出方法
US4924494A (en) * 1989-05-05 1990-05-08 Copam Electronics Corp. Fax machine equipped for simultaneous transmission and reception via two telephone lines
JPH0318986A (ja) 1989-06-15 1991-01-28 Ricoh Co Ltd 文字認識装置
JPH0832085B2 (ja) * 1989-10-18 1996-03-27 松下電器産業株式会社 表示機能付き選択呼出受信装置
US5129014A (en) * 1989-12-08 1992-07-07 Xerox Corporation Image registration
JP2612383B2 (ja) 1991-02-19 1997-05-21 株式会社ピーエフユー 文字認識処理方式
JPH05189617A (ja) * 1991-04-15 1993-07-30 Microsoft Corp 手書き文字認識に於けるアークのセグメント化の方法と装置
JPH06507743A (ja) * 1991-05-21 1994-09-01 ケンブリッジ アニメーション システムズ リミテッド 画像合成及び処理
US5434953A (en) * 1992-03-20 1995-07-18 Xerox Corporation Use of fast textured reduction for discrimination of document image components
US5680479A (en) 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US5454047A (en) * 1992-05-15 1995-09-26 Hughes Aircraft Company Optical method and system for generating expansion coefficients for an image processing function
US5721788A (en) * 1992-07-31 1998-02-24 Corbis Corporation Method and system for digital image signatures
US5402146A (en) * 1992-10-23 1995-03-28 International Business Machines Corporation System and method for video compression with artifact dispersion control
US5991515A (en) * 1992-11-10 1999-11-23 Adobe Systems Incorporated Method and apparatus for compressing and decompressing data prior to display
JP3422541B2 (ja) 1992-12-17 2003-06-30 ゼロックス・コーポレーション キーワードのモデル化方法及び非キーワードhmmの提供方法
US5384864A (en) 1993-04-19 1995-01-24 Xerox Corporation Method and apparatus for automatic determination of text line, word and character cell spatial features
JP3037432B2 (ja) * 1993-11-01 2000-04-24 カドラックス・インク 光波オーブンによる食物調理方法および調理装置
US5572604A (en) * 1993-11-22 1996-11-05 Lucent Technologies Inc. Method for pattern recognition using prototype transformations and hierarchical filtering
US5640468A (en) * 1994-04-28 1997-06-17 Hsu; Shin-Yi Method for identifying objects and features in an image
US6137908A (en) * 1994-06-29 2000-10-24 Microsoft Corporation Handwriting recognition system simultaneously considering shape and context information
JP2630923B2 (ja) * 1994-12-05 1997-07-16 日本アイ・ビー・エム株式会社 画像認識方法及び装置
US5737455A (en) * 1994-12-12 1998-04-07 Xerox Corporation Antialiasing with grey masking techniques
DE4445386C1 (de) * 1994-12-20 1996-05-02 Ibm Verfahren und Vorrichtung zur Trennung einer Vordergrundinformation von einer Hintergrundinformation in einer Vorlage
US5572565A (en) * 1994-12-30 1996-11-05 Philips Electronics North America Corporation Automatic segmentation, skinline and nipple detection in digital mammograms
JP3640318B2 (ja) * 1995-09-01 2005-04-20 インターナショナル・ビジネス・マシーンズ・コーポレーション ディジタル画像の符号化方法及びシステム
JP2761467B2 (ja) * 1995-03-29 1998-06-04 インターナショナル・ビジネス・マシーンズ・コーポレイション 画像切り出し装置及び文字認識装置
US5689585A (en) 1995-04-28 1997-11-18 Xerox Corporation Method for aligning a text image to a transcription of the image
US5883986A (en) 1995-06-02 1999-03-16 Xerox Corporation Method and system for automatic transcription correction
US5915044A (en) * 1995-09-29 1999-06-22 Intel Corporation Encoding video images using foreground/background segmentation
US5574511A (en) * 1995-10-18 1996-11-12 Polaroid Corporation Background replacement for an image
US6094506A (en) * 1995-10-25 2000-07-25 Microsoft Corporation Automatic generation of probability tables for handwriting recognition systems
US6272253B1 (en) * 1995-10-27 2001-08-07 Texas Instruments Incorporated Content-based video compression
JP3756580B2 (ja) * 1995-11-07 2006-03-15 セイコープレシジョン株式会社 多層基板の製造方法及びその製造装置
US5828771A (en) * 1995-12-15 1998-10-27 Xerox Corporation Method and article of manufacture for determining whether a scanned image is an original image or fax image
JP2958396B2 (ja) * 1995-12-20 1999-10-06 富士ゼロックス株式会社 画像形成装置
US5910805A (en) * 1996-01-11 1999-06-08 Oclc Online Computer Library Center Method for displaying bitmap derived text at a display having limited pixel-to-pixel spacing resolution
US6345119B1 (en) * 1996-02-19 2002-02-05 Fujitsu Limited Handwritten character recognition apparatus and method using a clustering algorithm
US6901153B1 (en) * 1996-03-14 2005-05-31 Ati Technologies Inc. Hybrid software/hardware video decoder for personal computer
US5805739A (en) * 1996-04-02 1998-09-08 Picturetel Corporation Lapped orthogonal vector quantization
DE19615493A1 (de) 1996-04-19 1997-10-23 Philips Patentverwaltung Verfahren zur Bildsegmentierung
US6310972B1 (en) * 1996-06-28 2001-10-30 Competitive Technologies Of Pa, Inc. Shape adaptive technique for image and video compression
US5914748A (en) * 1996-08-30 1999-06-22 Eastman Kodak Company Method and apparatus for generating a composite image using the difference of two images
US5778092A (en) * 1996-12-20 1998-07-07 Xerox Corporation Method and apparatus for compressing color or gray scale documents
US5917964A (en) * 1996-12-23 1999-06-29 Lg Electronics, Inc. Method and apparatus for pre-processing image data of encoders
JP2836681B2 (ja) 1997-01-14 1998-12-14 日本電気株式会社 パタンマッチング符号化方法及び符号化装置
US5960111A (en) * 1997-02-10 1999-09-28 At&T Corp Method and apparatus for segmenting images prior to coding
US6108446A (en) * 1997-02-18 2000-08-22 Hoshen; Joseph Method and apparatus for extracting cluster shape features from digital images
US6321243B1 (en) * 1997-06-27 2001-11-20 Microsoft Corporation Laying out a paragraph by defining all the characters as a single text run by substituting, and then positioning the glyphs
US6108444A (en) 1997-09-29 2000-08-22 Xerox Corporation Method of grouping handwritten word segments in handwritten document images
US5917951A (en) * 1997-10-03 1999-06-29 International Business Machines Corporation Clustered aperiodic mask
US6118890A (en) * 1997-11-12 2000-09-12 International Business Machines Corporation System and method for broad classification of biometric patterns
US6020972A (en) 1997-11-14 2000-02-01 Xerox Corporation System for performing collective symbol-based compression of a corpus of document images
US6144767A (en) * 1998-04-02 2000-11-07 At&T Corp Efficient convolutions using polynomial covers
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6029126A (en) * 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
US6285801B1 (en) * 1998-05-29 2001-09-04 Stmicroelectronics, Inc. Non-linear adaptive image filter for filtering noise such as blocking artifacts
US6154762A (en) * 1998-06-03 2000-11-28 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6073153A (en) * 1998-06-03 2000-06-06 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6072496A (en) * 1998-06-08 2000-06-06 Microsoft Corporation Method and system for capturing and representing 3D geometry, color and shading of facial expressions and other animated objects
JP2000013596A (ja) 1998-06-18 2000-01-14 Minolta Co Ltd 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
US6192360B1 (en) * 1998-06-23 2001-02-20 Microsoft Corporation Methods and apparatus for classifying text and for building a text classifier
US6253165B1 (en) * 1998-06-30 2001-06-26 Microsoft Corporation System and method for modeling probability distribution functions of transform coefficients of encoded signal
US6233364B1 (en) * 1998-09-18 2001-05-15 Dainippon Screen Engineering Of America Incorporated Method and system for detecting and tagging dust and scratches in a digital image
US6326977B1 (en) * 1998-11-03 2001-12-04 Sharp Laboratories Of America, Inc. Rendering of YCBCR images on an RGS display device
EP1006714A3 (en) 1998-12-02 2001-09-19 Xerox Corporation Method of processing mixed raster content planes
US6564263B1 (en) * 1998-12-04 2003-05-13 International Business Machines Corporation Multimedia content description framework
JP2000175053A (ja) * 1998-12-07 2000-06-23 Xerox Corp 文書の圧縮ピクセルマップ表現を表す混合ラスタコンテントプレ―ンの処理方法
US6195024B1 (en) * 1998-12-11 2001-02-27 Realtime Data, Llc Content independent data compression method and system
US6100825A (en) * 1998-12-31 2000-08-08 Microsoft Corporation Cluster-based data compression system and method
US6977664B1 (en) * 1999-09-24 2005-12-20 Nippon Telegraph And Telephone Corporation Method for separating background sprite and foreground object and method for extracting segmentation mask and the apparatus
JP3551908B2 (ja) 1999-09-24 2004-08-11 日本電信電話株式会社 背景スプライトと前景オブジェクトの分離方法、及びその装置
US6826727B1 (en) * 1999-11-24 2004-11-30 Bitstream Inc. Apparatus, methods, programming for automatically laying out documents
ATE509330T1 (de) 1999-12-04 2011-05-15 Luratech Imaging Gmbh Verfahren zur kompression von gescannten farb- und/oder graustufendokumenten
DE19958553A1 (de) * 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
KR100337359B1 (ko) * 1999-12-15 2002-05-21 이계안 차량의 주행단 밀림 방지장치 및 그 제어방법
GB2358098A (en) * 2000-01-06 2001-07-11 Sharp Kk Method of segmenting a pixelled image
JP2001266158A (ja) 2000-01-11 2001-09-28 Canon Inc 画像処理装置、画像処理システム、画像処理方法、及び記憶媒体
US7320104B2 (en) * 2000-02-12 2008-01-15 Adobe Systems Incorporated Text grid creation tools
JP2001256244A (ja) * 2000-03-14 2001-09-21 Fuji Xerox Co Ltd 画像データ分類装置および画像データ分類方法
US6674900B1 (en) 2000-03-29 2004-01-06 Matsushita Electric Industrial Co., Ltd. Method for extracting titles from digital images
US6633670B1 (en) * 2000-03-31 2003-10-14 Sharp Laboratories Of America, Inc. Mask generation for multi-layer image decomposition
US6738079B1 (en) * 2000-06-02 2004-05-18 Sun Microsystems, Inc. Graphical user interface layout customizer
US6975742B2 (en) * 2000-11-29 2005-12-13 Xerox Corporation Rate-distortion optimization system and method for image compression
US6839463B1 (en) * 2000-12-22 2005-01-04 Microsoft Corporation System and method providing subpixel-edge-offset-based determination of opacity
US7027647B2 (en) * 2001-12-31 2006-04-11 Hewlett-Packard Development Company, L.P. Coder matched layer separation for compression of compound documents
US7110596B2 (en) * 2002-04-25 2006-09-19 Microsoft Corporation System and method facilitating document image compression utilizing a mask
US7024039B2 (en) 2002-04-25 2006-04-04 Microsoft Corporation Block retouching

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006005923A (ja) * 2004-06-14 2006-01-05 Xerox Corp ディジタル画像のファイルサイズを動的に制御する画像入力システム及び方法

Also Published As

Publication number Publication date
CN100470593C (zh) 2009-03-18
KR20030084589A (ko) 2003-11-01
JP4295537B2 (ja) 2009-07-15
US7110596B2 (en) 2006-09-19
EP1388816A2 (en) 2004-02-11
KR100937543B1 (ko) 2010-01-19
EP1388816A3 (en) 2005-11-16
ES2600756T3 (es) 2017-02-10
US20030202699A1 (en) 2003-10-30
TWI244051B (en) 2005-11-21
TW200306501A (en) 2003-11-16
US20060274381A1 (en) 2006-12-07
CN1458628A (zh) 2003-11-26
US7764834B2 (en) 2010-07-27
EP1388816B1 (en) 2016-08-03

Similar Documents

Publication Publication Date Title
JP2003346166A (ja) マスクを利用して文書画像の圧縮を容易にするシステムおよび方法
JP4152789B2 (ja) クラスタリングシステムおよびクラスタリング方法
US7120297B2 (en) Segmented layered image system
US7397952B2 (en) “Don&#39;t care” pixel interpolation
US7512274B2 (en) Block retouching
KR101146162B1 (ko) 멀티-레벨 이미지의 적응 압축 용이 방법
EP1388815A2 (en) Segmented layered image system
EP3354030B1 (en) Methods and apparatuses for encoding and decoding digital images through superpixels
EP0755155A2 (en) System and method for lossless image compression
US7386166B2 (en) Systems and methods for connecting regions image data having similar characteristics
JP2001223903A (ja) 走査された色付きおよびグレースケールの文書を圧縮する方法
Haffner et al. Color documents on the Web with DjVu
JP4719924B2 (ja) 画像処理装置および画像処理方法
JP2003204439A (ja) 画像符号化装置及び画像符号化方法
JP4743883B2 (ja) 画像符号化装置およびその制御方法
Malvar et al. Don't care” pixel interpolation
JP2004289602A (ja) 画像符号化装置、画像符号化方法及びプログラム
JPH11298739A (ja) 画像符号化方法
JPH0767112A (ja) 動きベクトル検出方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080908

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081010

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20090114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090209

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090313

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090410

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130417

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130417

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140417

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250