JPH08228282A - 文書画像の処理方法及びバイナリ画像画素処理装置 - Google Patents
文書画像の処理方法及びバイナリ画像画素処理装置Info
- Publication number
- JPH08228282A JPH08228282A JP7292284A JP29228495A JPH08228282A JP H08228282 A JPH08228282 A JP H08228282A JP 7292284 A JP7292284 A JP 7292284A JP 29228495 A JP29228495 A JP 29228495A JP H08228282 A JPH08228282 A JP H08228282A
- Authority
- JP
- Japan
- Prior art keywords
- image
- output
- picture
- signal
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40062—Discrimination between different image types, e.g. two-tone, continuous tone
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
(57)【要約】
【課題】 広範囲のパターンを示す入力文書のタイプに
適応すること。 【解決手段】 ステップ100で入力文書が得られると
目標画素 "X”が識別され、ステップ102で周囲の画
素の1セットがウィンドウとして処理される。ステップ
106で整合テンプレートが見つけられると、ステップ
120で目標画素はテキスト画素として識別されステッ
プ122で変化なしでフィルタを通過することができ
る。整合テンプレートが見つけられない場合は処理が続
き、ステップ108で更なるテンプレートの存在が判断
される。更なるテンプレートがウィンドウとの比較に利
用可能である場合、処理はステップ110へ続く。利用
可能でない場合、ステップ112で画素は入力画像のハ
ーフトーンのセグメントを表すものとして識別され、ス
テップ114で "0”画像信号の出力が生成される。
適応すること。 【解決手段】 ステップ100で入力文書が得られると
目標画素 "X”が識別され、ステップ102で周囲の画
素の1セットがウィンドウとして処理される。ステップ
106で整合テンプレートが見つけられると、ステップ
120で目標画素はテキスト画素として識別されステッ
プ122で変化なしでフィルタを通過することができ
る。整合テンプレートが見つけられない場合は処理が続
き、ステップ108で更なるテンプレートの存在が判断
される。更なるテンプレートがウィンドウとの比較に利
用可能である場合、処理はステップ110へ続く。利用
可能でない場合、ステップ112で画素は入力画像のハ
ーフトーンのセグメントを表すものとして識別され、ス
テップ114で "0”画像信号の出力が生成される。
Description
【0001】
【発明の属する技術分野】本発明は一般に、テンプレー
トマッチング(突き合わせ、照合)フィルタを用いる自
動画像セグメンテーションの方法と装置に関し、より詳
細には、1つ又はそれより多くの他のテクスチャーを取
り除く一方で少なくとも1つのテクスチャーを通過させ
るようにデザインされたテンプレートマッチングフィル
タを用いて、記憶されたバイナリ(二値)画像内の異な
るテクスチャー又は構造の領域をセグメント化する方法
と装置に関する。
トマッチング(突き合わせ、照合)フィルタを用いる自
動画像セグメンテーションの方法と装置に関し、より詳
細には、1つ又はそれより多くの他のテクスチャーを取
り除く一方で少なくとも1つのテクスチャーを通過させ
るようにデザインされたテンプレートマッチングフィル
タを用いて、記憶されたバイナリ(二値)画像内の異な
るテクスチャー又は構造の領域をセグメント化する方法
と装置に関する。
【0002】
【従来の技術及び発明が解決しようとする課題】本発明
は、テンプレートベースのフィルタリング方法を用い
て、複合画像におけるテキスト、ハーフトーン又は他の
画像構造を分離する新規の方法である。本発明の主なア
プリケーションは、ハーフトーン領域からのテキスト領
域のセグメンテーションである。例えば、原稿から電子
ラスタ入力走査によって生成されたビデオ画像データか
ら原稿を複製(複写)する際、複製システムの限られた
分解能能力や、出力デバイスが主にバイナリのままであ
るという事実に直面する。これは、ハーフトーン、ライ
ン及び連続トーン画像を複製しようとする際に明らかで
ある。もちろん画像データ処理システムは、使用される
複製装置の限られた分解能能力を補うように変えられる
ことができるが、これは、遭遇しうるそれぞれ異なる画
像のタイプによって必要とされる処理の要求が分かれる
ため、困難である。この点において、原稿の画像内容
は、高周波数のハーフトーン、低周波数のハーフトー
ン、連続トーン、テキスト又はラインのコピー、又は、
未知の程度で、上記のうちのいくつかあるいは全てを組
み合わせたものから全体が構成され得ることが理解され
るべきである。使用される複製装置の分解能能力の限界
を補おうとして1つの画像のタイプのために画像処理シ
ステムを最適化すると、許容可能な結果を生じない妥協
の選択が必要となるため可能ではないかもしれない。従
って、例えば低周波数のハーフトーンのためにシステム
を最適化すると、高周波数のハーフトーン、テキストあ
るいはラインのコピーの複製の劣化が犠牲になることが
しばしばであり、また逆についても同じである。異なる
画像のタイプのセグメンテーションは、精密な複製の問
題を越えて、認識アルゴリズム(例えば、文字認識や絵
文字認識)をうまく応用し、画像圧縮技術を有効に応用
することへの手がかりである。
は、テンプレートベースのフィルタリング方法を用い
て、複合画像におけるテキスト、ハーフトーン又は他の
画像構造を分離する新規の方法である。本発明の主なア
プリケーションは、ハーフトーン領域からのテキスト領
域のセグメンテーションである。例えば、原稿から電子
ラスタ入力走査によって生成されたビデオ画像データか
ら原稿を複製(複写)する際、複製システムの限られた
分解能能力や、出力デバイスが主にバイナリのままであ
るという事実に直面する。これは、ハーフトーン、ライ
ン及び連続トーン画像を複製しようとする際に明らかで
ある。もちろん画像データ処理システムは、使用される
複製装置の限られた分解能能力を補うように変えられる
ことができるが、これは、遭遇しうるそれぞれ異なる画
像のタイプによって必要とされる処理の要求が分かれる
ため、困難である。この点において、原稿の画像内容
は、高周波数のハーフトーン、低周波数のハーフトー
ン、連続トーン、テキスト又はラインのコピー、又は、
未知の程度で、上記のうちのいくつかあるいは全てを組
み合わせたものから全体が構成され得ることが理解され
るべきである。使用される複製装置の分解能能力の限界
を補おうとして1つの画像のタイプのために画像処理シ
ステムを最適化すると、許容可能な結果を生じない妥協
の選択が必要となるため可能ではないかもしれない。従
って、例えば低周波数のハーフトーンのためにシステム
を最適化すると、高周波数のハーフトーン、テキストあ
るいはラインのコピーの複製の劣化が犠牲になることが
しばしばであり、また逆についても同じである。異なる
画像のタイプのセグメンテーションは、精密な複製の問
題を越えて、認識アルゴリズム(例えば、文字認識や絵
文字認識)をうまく応用し、画像圧縮技術を有効に応用
することへの手がかりである。
【0003】遭遇する問題の1つの例として、スクリー
ニングによってハーフトーンされた画像の複製は、初め
のスクリーン周波数と使用されたスクリーン周波数の相
互作用によって生じるモアレを取り入れる傾向がある。
高周波数のラインスクリーンを用いてこの問題を軽減で
きるが、いくつかの画像においてアーチファクト(生成
物)がなお生じる。特にネットワーク環境においては、
画像処理デバイス(例えば、ラスタ入力スキャナー)が
ハーフトーンを検出し、文書の画像を低域フィルタにか
けて連続トーンにし、続いて、そのネットワークのプリ
ンタによってそれらの特定の能力に従ってハーフトーン
が複製されることが望ましい。
ニングによってハーフトーンされた画像の複製は、初め
のスクリーン周波数と使用されたスクリーン周波数の相
互作用によって生じるモアレを取り入れる傾向がある。
高周波数のラインスクリーンを用いてこの問題を軽減で
きるが、いくつかの画像においてアーチファクト(生成
物)がなお生じる。特にネットワーク環境においては、
画像処理デバイス(例えば、ラスタ入力スキャナー)が
ハーフトーンを検出し、文書の画像を低域フィルタにか
けて連続トーンにし、続いて、そのネットワークのプリ
ンタによってそれらの特定の能力に従ってハーフトーン
が複製されることが望ましい。
【0004】シアウ(Shiau)の米国特許第5,293,
430号は、実際は画像がライン画像として処理される
ことが好ましい時に、画像の一部分をハーフトーンとし
て誤って特性表示する自己相関関数の使用において示さ
れる特定の問題を教示している。
430号は、実際は画像がライン画像として処理される
ことが好ましい時に、画像の一部分をハーフトーンとし
て誤って特性表示する自己相関関数の使用において示さ
れる特定の問題を教示している。
【0005】1980年3月18日発行のストフェル
(Stoffel)の米国特許第4,194,221号は、画像
セグメンテーションの問題を開示している。この問題
は、存在する画像データのタイプによって画像処理シス
テムに命令する識別関数、特に自己相関関数を画素デー
タのストリームに適用するということに向けられた。
(Stoffel)の米国特許第4,194,221号は、画像
セグメンテーションの問題を開示している。この問題
は、存在する画像データのタイプによって画像処理シス
テムに命令する識別関数、特に自己相関関数を画素デー
タのストリームに適用するということに向けられた。
【0006】1989年3月7日発行のリンら( Lin e
t al.)の米国特許第4,811,115号は、前にスレ
ショルディング(しきい値処理)をせずに、画像周波数
特性を示すとされる選択された時間の遅れでハーフトー
ン画像データのストリームのために計算される自己相関
関数を教示している。
t al.)の米国特許第4,811,115号は、前にスレ
ショルディング(しきい値処理)をせずに、画像周波数
特性を示すとされる選択された時間の遅れでハーフトー
ン画像データのストリームのために計算される自己相関
関数を教示している。
【0007】1991年11月12日発行のブルームバ
ーグ(Bloomberg)の米国特許第5,065,437号
は、バイナリ画像において細かくテクスチャーされた領
域とソリッド(べた)領域を分離する方法を開示してい
る。初めに、動作は画像上で実行されて、テキスト及び
ラインは太くされ、テクスチャー領域はソリッド化され
る。
ーグ(Bloomberg)の米国特許第5,065,437号
は、バイナリ画像において細かくテクスチャーされた領
域とソリッド(べた)領域を分離する方法を開示してい
る。初めに、動作は画像上で実行されて、テキスト及び
ラインは太くされ、テクスチャー領域はソリッド化され
る。
【0008】1992年7月14日発行のブルームバー
グの米国特許第5,131,049号は、バイナリ画像
におけるハーフトーン領域を他の領域から分離するマス
クを生成する方法を開示している。
グの米国特許第5,131,049号は、バイナリ画像
におけるハーフトーン領域を他の領域から分離するマス
クを生成する方法を開示している。
【0009】ロバート ピー.ロースら(Robert P. Lo
ce et al.)の「エレメントライブラリ及びデザインの制
約条件の構造化による最適なバイナリ形態学的フィルタ
デザインの簡易化(Facilitation of Optimal Binary M
orphological Filter Designvia Structuring Element
Libraries and Design Constraints)」(光学エンジニ
アリング、第31巻、第5号、1992年5月発行、第
1008−1025頁)では、デジタル形態学的フィル
タデザインに関連する計算の負担を軽減する3つの方法
が述べられている。
ce et al.)の「エレメントライブラリ及びデザインの制
約条件の構造化による最適なバイナリ形態学的フィルタ
デザインの簡易化(Facilitation of Optimal Binary M
orphological Filter Designvia Structuring Element
Libraries and Design Constraints)」(光学エンジニ
アリング、第31巻、第5号、1992年5月発行、第
1008−1025頁)では、デジタル形態学的フィル
タデザインに関連する計算の負担を軽減する3つの方法
が述べられている。
【0010】「画像処理における数学的形態学(Mathem
atical Morphology in Image Processing)」(エドワー
ド アール.ドーアティ(Edward R. Dougherty)監修、
マーセル デッカー(Marcel Dekker)、1992年、第
43−90頁)では、最適なバイナリデジタル形態学フ
ィルタのための有効なデザイン戦略が述べられている。
atical Morphology in Image Processing)」(エドワー
ド アール.ドーアティ(Edward R. Dougherty)監修、
マーセル デッカー(Marcel Dekker)、1992年、第
43−90頁)では、最適なバイナリデジタル形態学フ
ィルタのための有効なデザイン戦略が述べられている。
【0011】ロースは、「形態学的フィルタの平均絶対
誤差の表示定理及び最適な形態学的フィルタデザインへ
のその応用 (Morphological Filter Mean-Absolute-Err
or Representation Theorems and Their Application t
o Optimal Morphological Filter Design)」(博士号の
学位論文、イメージングサイエンスセンター、ロチェス
ター工科大学、1993年5月)において、最適な平均
絶対誤差(MAE)の形態学ベースのフィルタのための
デザイン方法論を述べている。
誤差の表示定理及び最適な形態学的フィルタデザインへ
のその応用 (Morphological Filter Mean-Absolute-Err
or Representation Theorems and Their Application t
o Optimal Morphological Filter Design)」(博士号の
学位論文、イメージングサイエンスセンター、ロチェス
ター工科大学、1993年5月)において、最適な平均
絶対誤差(MAE)の形態学ベースのフィルタのための
デザイン方法論を述べている。
【0012】
【課題を解決するための手段】本発明に従って、デジタ
ルプロセッサにおいて行われる、文書画像に存在する画
像のタイプを決定するために文書画像を処理する方法が
提供されており、各画素が濃度信号によって表される複
数の画素を有する文書画像を画像源から受け取り、前記
文書画像の1つの領域を表示する前記濃度信号の少なく
とも一部分をデータバッファに記憶するステップを含
み、前記データバッファから前記文書画像の濃度信号を
検索するステップを含み、テンプレートマッチングフィ
ルタを用いて、文書画像の前記領域に存在する画像のタ
イプを決定するステップを含む。
ルプロセッサにおいて行われる、文書画像に存在する画
像のタイプを決定するために文書画像を処理する方法が
提供されており、各画素が濃度信号によって表される複
数の画素を有する文書画像を画像源から受け取り、前記
文書画像の1つの領域を表示する前記濃度信号の少なく
とも一部分をデータバッファに記憶するステップを含
み、前記データバッファから前記文書画像の濃度信号を
検索するステップを含み、テンプレートマッチングフィ
ルタを用いて、文書画像の前記領域に存在する画像のタ
イプを決定するステップを含む。
【0013】本発明の別の態様に従って、第1の構造を
有する領域を優先的に通過させて前記第1の構造を示す
領域で主に構成される出力画像を生成するように、複数
の画素のラスタで表される画像のバイナリ画像画素を処
理する装置が提供されており、前記装置は前記バイナリ
画像信号を記憶する画像メモリを含み、複数のラスタか
ら複数の画像信号を記憶するウィンドウバッファを含
み、前記画像信号が目標画素の周囲に集中した画素を表
し、前記ウィンドウバッファに記憶された画像信号の関
数として出力画像信号を生成するテンプレートフィルタ
を含み、前記出力信号は前記目標画素が前記第1の構造
を表すバイナリ画像の領域の画像信号に相当し、前記出
力信号は前記目標画素が他の構造を表すバイナリ画像の
領域に対してゼロであり、複数の目標画素の各々毎に出
力信号を記憶する出力メモリを含み、前記出力メモリの
各位置において記憶された信号は前記テンプレートフィ
ルタによってウィンドウ内の画像信号の関数として生成
され、前記ウィンドウの内容は対応する目標画素の位置
の関数として決定される。
有する領域を優先的に通過させて前記第1の構造を示す
領域で主に構成される出力画像を生成するように、複数
の画素のラスタで表される画像のバイナリ画像画素を処
理する装置が提供されており、前記装置は前記バイナリ
画像信号を記憶する画像メモリを含み、複数のラスタか
ら複数の画像信号を記憶するウィンドウバッファを含
み、前記画像信号が目標画素の周囲に集中した画素を表
し、前記ウィンドウバッファに記憶された画像信号の関
数として出力画像信号を生成するテンプレートフィルタ
を含み、前記出力信号は前記目標画素が前記第1の構造
を表すバイナリ画像の領域の画像信号に相当し、前記出
力信号は前記目標画素が他の構造を表すバイナリ画像の
領域に対してゼロであり、複数の目標画素の各々毎に出
力信号を記憶する出力メモリを含み、前記出力メモリの
各位置において記憶された信号は前記テンプレートフィ
ルタによってウィンドウ内の画像信号の関数として生成
され、前記ウィンドウの内容は対応する目標画素の位置
の関数として決定される。
【0014】本発明の1つの態様は、テンプレートが1
つ又はそれより多くのテクスチャー内の1つのバイナリ
構造を認識するのに用いられることができる、という発
見に基づいている。より特定的には、テンプレートベー
スのフィルタは、テキストやラインアートを含む画像領
域を認識するのに使用されることができる。本発明は、
画像処理システムが一般に遭遇する文書を表す教材(ト
レーニング)文書に応答してここで使用されるテンプレ
ートベースのフィルタの「個別化(customization)」を
更に可能にするため、この発見は広範囲の文書のタイプ
を含むことを試みる技術において生じる問題を更に回避
する。例えばエッシュバッハ(Eschbach) の米国出願番
号08/169,483やロースら(Loce et al.)の米
国出願番号08/169,485号によって更に述べら
れるように、この様態は更に、文書のテキスト領域やハ
ーフトーン領域にみられるパターンの統計的表示を生成
する技術の発見に基づいている。
つ又はそれより多くのテクスチャー内の1つのバイナリ
構造を認識するのに用いられることができる、という発
見に基づいている。より特定的には、テンプレートベー
スのフィルタは、テキストやラインアートを含む画像領
域を認識するのに使用されることができる。本発明は、
画像処理システムが一般に遭遇する文書を表す教材(ト
レーニング)文書に応答してここで使用されるテンプレ
ートベースのフィルタの「個別化(customization)」を
更に可能にするため、この発見は広範囲の文書のタイプ
を含むことを試みる技術において生じる問題を更に回避
する。例えばエッシュバッハ(Eschbach) の米国出願番
号08/169,483やロースら(Loce et al.)の米
国出願番号08/169,485号によって更に述べら
れるように、この様態は更に、文書のテキスト領域やハ
ーフトーン領域にみられるパターンの統計的表示を生成
する技術の発見に基づいている。
【0015】本文中に述べられる技術は、他の方法と比
べて安価であり、かつ広範囲の可能なパターンを示すあ
らゆる数の入力文書のタイプに適応できるという点で柔
軟性があるため、有益である。本発明の結果として、低
コストの画像セグメンテーションシステムが行われるこ
とができる。
べて安価であり、かつ広範囲の可能なパターンを示すあ
らゆる数の入力文書のタイプに適応できるという点で柔
軟性があるため、有益である。本発明の結果として、低
コストの画像セグメンテーションシステムが行われるこ
とができる。
【0016】
【発明の実施の形態】「データ」という用語は、本文中
では、情報を示すあるいは含む物理的信号を指す。デー
タのNビットのアイテムは、可能な2N 値のうち1つを
有する。「データ」という用語は、あらゆる物理的な形
で存在するデータを含み、一時的であるかあるいは記憶
されている又は送られているデータを含む。
では、情報を示すあるいは含む物理的信号を指す。デー
タのNビットのアイテムは、可能な2N 値のうち1つを
有する。「データ」という用語は、あらゆる物理的な形
で存在するデータを含み、一時的であるかあるいは記憶
されている又は送られているデータを含む。
【0017】「回路」とは、別の位置又は時間における
第2の信号を提供することによって1つの位置又は時間
における第1の信号に応答できる物のあらゆる物理的な
構成である。
第2の信号を提供することによって1つの位置又は時間
における第1の信号に応答できる物のあらゆる物理的な
構成である。
【0018】「データ処理システム」とは、データを処
理する物理的なシステムである。「データプロセッサ」
又は「プロセッサ」とは、データを処理できるあらゆる
構成要素又はシステムであり、1つ又はそれより多くの
中央処理ユニット又は他の処理構成要素を含んでもよ
い。
理する物理的なシステムである。「データプロセッサ」
又は「プロセッサ」とは、データを処理できるあらゆる
構成要素又はシステムであり、1つ又はそれより多くの
中央処理ユニット又は他の処理構成要素を含んでもよ
い。
【0019】「画像」とは、一般に物理的な光のパター
ンである。画像は文字、単語、テキストやグラフィック
ス(図形)等の他の特徴を含みうる。テキストは、1つ
又はそれより多くの画像のセットに含まれうる。画像
は、各々自体が画像である「セグメント」又は「領域」
に分割又はセグメント化されることができる。画像のセ
グメント又は領域の「構造」は、例えば、テキスト、ハ
ーフトーン又はグラフィックス構造を含む領域の主な内
容によって一般に決定される。画像のセグメントは画像
全体に到るまであらゆるサイズであることが可能であ
り、画像全体を含むこともできる。画像はまた、物理的
な光のパターンを表す二次元のデータアレイも指す。ハ
ードコピー(書かれた又はプリントされた)又は電気の
(データアレイ)形式のいずれかにおいて存在しうる
「文書」は、1つ又はそれより多くの画像及び/又はテ
キストを表すものである。文書は、複数のページを含ん
でもよい。
ンである。画像は文字、単語、テキストやグラフィック
ス(図形)等の他の特徴を含みうる。テキストは、1つ
又はそれより多くの画像のセットに含まれうる。画像
は、各々自体が画像である「セグメント」又は「領域」
に分割又はセグメント化されることができる。画像のセ
グメント又は領域の「構造」は、例えば、テキスト、ハ
ーフトーン又はグラフィックス構造を含む領域の主な内
容によって一般に決定される。画像のセグメントは画像
全体に到るまであらゆるサイズであることが可能であ
り、画像全体を含むこともできる。画像はまた、物理的
な光のパターンを表す二次元のデータアレイも指す。ハ
ードコピー(書かれた又はプリントされた)又は電気の
(データアレイ)形式のいずれかにおいて存在しうる
「文書」は、1つ又はそれより多くの画像及び/又はテ
キストを表すものである。文書は、複数のページを含ん
でもよい。
【0020】画像内の各位置は、「画素」と呼ばれる。
「画素」は、所定のシステムにおいて画像が分割される
最も小さいセグメントである。データの各アイテムが1
つの値を与える画像を定義するアレイでは、位置の色及
び/又は強度を示す各値は「画素値」と呼ばれる。バイ
ナリ画像の各画素値は「バイナリ形式」の電気信号、グ
レースケール値は画像の「グレースケール形式」の電気
信号、あるいはカラースペースコーディネート(色空間
座標)のセットは画像の「カラーコーディネート(色座
標)形式」の電気信号であり、バイナリ形式、グレース
ケール形式及びカラーコーディネート形式はそれぞれ画
像を定義する二次元アレイである。
「画素」は、所定のシステムにおいて画像が分割される
最も小さいセグメントである。データの各アイテムが1
つの値を与える画像を定義するアレイでは、位置の色及
び/又は強度を示す各値は「画素値」と呼ばれる。バイ
ナリ画像の各画素値は「バイナリ形式」の電気信号、グ
レースケール値は画像の「グレースケール形式」の電気
信号、あるいはカラースペースコーディネート(色空間
座標)のセットは画像の「カラーコーディネート(色座
標)形式」の電気信号であり、バイナリ形式、グレース
ケール形式及びカラーコーディネート形式はそれぞれ画
像を定義する二次元アレイである。
【0021】画素同士の間に他の画素がない場合、又は
画素が、位置づけされた観察ウィンドウ内に存在する等
の隣接のための適切な基準を満たしている場合、画素は
画像内で「隣接している」。画素が矩形でロー(行)及
びコラム(列)になって現れる場合、各画素は使用され
る基準に依存して4つ又は8つの結合した隣接画素を有
する。
画素が、位置づけされた観察ウィンドウ内に存在する等
の隣接のための適切な基準を満たしている場合、画素は
画像内で「隣接している」。画素が矩形でロー(行)及
びコラム(列)になって現れる場合、各画素は使用され
る基準に依存して4つ又は8つの結合した隣接画素を有
する。
【0022】「画像入力デバイス」とは、画像を受け取
りかつ該画像の表示を定義するデータのアイテムを提供
することのできるデバイスである。「スキャナー」と
は、ハードコピー文書を走査すること等の走査動作によ
って画像を受け取る画像入力デバイスである。
りかつ該画像の表示を定義するデータのアイテムを提供
することのできるデバイスである。「スキャナー」と
は、ハードコピー文書を走査すること等の走査動作によ
って画像を受け取る画像入力デバイスである。
【0023】「画像出力デバイス(IOT)」とは、画
像を定義するデータのアイテムを受け取りかつ該画像を
出力として提供することのできるデバイスである。「デ
ィスプレイ」とは、人間の目に可視の形で出力画像を提
供する画像出力デバイスである。ディスプレイによって
示される可視のパターンは、「ディスプレイ画像」又は
簡潔に「ディスプレイ」である。「プリンタ」又は「マ
ーキングエンジン(marking engine)」とは、除去可能な
媒体上に人間が読むことのできる形で出力画像を描画す
ることが可能な画像出力デバイスである。
像を定義するデータのアイテムを受け取りかつ該画像を
出力として提供することのできるデバイスである。「デ
ィスプレイ」とは、人間の目に可視の形で出力画像を提
供する画像出力デバイスである。ディスプレイによって
示される可視のパターンは、「ディスプレイ画像」又は
簡潔に「ディスプレイ」である。「プリンタ」又は「マ
ーキングエンジン(marking engine)」とは、除去可能な
媒体上に人間が読むことのできる形で出力画像を描画す
ることが可能な画像出力デバイスである。
【0024】ここで図1を参照すると、図1は本発明に
よる画像複写環境において用いられる自動画像セグメン
テーション装置を示し、デジタルプリンタ12の一般的
な構成要素が示されている。より特定的には、入力画像
10はデジタルプリンタ12に送られてプリント出力2
0を生成する。デジタルプリンタ12内で、セグメンテ
ーションフィルタ14は本発明に従って入力画像を少な
くとも2つのセグメント化された画像に変換し、簡単な
場合には、そのテキスト領域及びハーフトーン領域をセ
グメント化する。セグメント化された画像のビットマッ
プは画像処理/再結合回路15へ送られる。更に述べら
れるように、画像処理回路はセグメント化された画像を
処理して1つの出力画像16を生成し、出力画像16は
所定のマーキング処理のために最適にされる。あるい
は、形態論的開き又は閉じのような技術を用いて、セグ
メント化された形である間に特定の画像のセグメントが
分離されいくつかの領域にグループ化されてもよい。セ
グメント又は領域が分離されると、画像のタイプ(例え
ばテキスト、ハーフトーン、その他)に従って関連する
タグビットの状態を設定することによって各画素はタグ
が付けられてもよい。タグが付けられた部分は、次にタ
グによって単一のビットマップに再結合されてもよい。
次の操作へ送られる際、領域内の個々の画素は、特定の
領域に対して最適になるように処理される。続いて、出
力画像16はマーキングエンジン18へ送られ、公知の
ように露光され、現像されて出力プリント20を生成す
る。
よる画像複写環境において用いられる自動画像セグメン
テーション装置を示し、デジタルプリンタ12の一般的
な構成要素が示されている。より特定的には、入力画像
10はデジタルプリンタ12に送られてプリント出力2
0を生成する。デジタルプリンタ12内で、セグメンテ
ーションフィルタ14は本発明に従って入力画像を少な
くとも2つのセグメント化された画像に変換し、簡単な
場合には、そのテキスト領域及びハーフトーン領域をセ
グメント化する。セグメント化された画像のビットマッ
プは画像処理/再結合回路15へ送られる。更に述べら
れるように、画像処理回路はセグメント化された画像を
処理して1つの出力画像16を生成し、出力画像16は
所定のマーキング処理のために最適にされる。あるい
は、形態論的開き又は閉じのような技術を用いて、セグ
メント化された形である間に特定の画像のセグメントが
分離されいくつかの領域にグループ化されてもよい。セ
グメント又は領域が分離されると、画像のタイプ(例え
ばテキスト、ハーフトーン、その他)に従って関連する
タグビットの状態を設定することによって各画素はタグ
が付けられてもよい。タグが付けられた部分は、次にタ
グによって単一のビットマップに再結合されてもよい。
次の操作へ送られる際、領域内の個々の画素は、特定の
領域に対して最適になるように処理される。続いて、出
力画像16はマーキングエンジン18へ送られ、公知の
ように露光され、現像されて出力プリント20を生成す
る。
【0025】次に図2を参照すると、データフロー図は
図1のセグメンテーションフィルタ14内で行われる2
段階の画像セグメンテーション処理を示している。2段
階のフィルタが好ましいものとして示されているが、単
一段階の反復が用いられることができ、あるいは、画像
のテキスト領域及びハーフトーン領域の分類におけるエ
ラーを更に減少するために追加の段階又は反復を使用で
きることが理解される。図2において、テキスト24及
びハーフトーン26の双方の領域を含む入力文書10が
第1の反復フィルタ回路30に送られる。入力文書10
は、例えば文書を構成するテキスト、ハーフトーン及び
グラフィックの画像領域を表す複数のバイナリデータ信
号であることが好ましい。入力文書画像は、スキャナー
上で走査されるハードコピー文書のデジタル表示として
生成されることができる。第1のフィルタ回路におい
て、文書画像はそのセグメントを、LUT1 として記憶
され本文中でテンプレートと称される定義済みのパター
ンと比較することによりフィルタリングされる。図3の
フローチャートや、図4(A)及び(B)の関連する実
施の形態において更に示されるように、ステップ100
において入力文書が得られると、目標画素 "X”が識別
され、ステップ102において周囲の画素の1セットが
ウィンドウとして処理される。図4(A)はテキストを
含む上部130aとハーフトーン領域を含む下部130
bを有するデジタル画像130の一部分を示している。
画像130の拡大部分132及び134が、画像を含む
個々の画素が識別可能である図4(B)において示され
る。
図1のセグメンテーションフィルタ14内で行われる2
段階の画像セグメンテーション処理を示している。2段
階のフィルタが好ましいものとして示されているが、単
一段階の反復が用いられることができ、あるいは、画像
のテキスト領域及びハーフトーン領域の分類におけるエ
ラーを更に減少するために追加の段階又は反復を使用で
きることが理解される。図2において、テキスト24及
びハーフトーン26の双方の領域を含む入力文書10が
第1の反復フィルタ回路30に送られる。入力文書10
は、例えば文書を構成するテキスト、ハーフトーン及び
グラフィックの画像領域を表す複数のバイナリデータ信
号であることが好ましい。入力文書画像は、スキャナー
上で走査されるハードコピー文書のデジタル表示として
生成されることができる。第1のフィルタ回路におい
て、文書画像はそのセグメントを、LUT1 として記憶
され本文中でテンプレートと称される定義済みのパター
ンと比較することによりフィルタリングされる。図3の
フローチャートや、図4(A)及び(B)の関連する実
施の形態において更に示されるように、ステップ100
において入力文書が得られると、目標画素 "X”が識別
され、ステップ102において周囲の画素の1セットが
ウィンドウとして処理される。図4(A)はテキストを
含む上部130aとハーフトーン領域を含む下部130
bを有するデジタル画像130の一部分を示している。
画像130の拡大部分132及び134が、画像を含む
個々の画素が識別可能である図4(B)において示され
る。
【0026】ウィンドウ内の画素信号の値は次にメモリ
に記憶されたテンプレート、例えば図4に示されるテン
プレート136a〜136f及び138と比較される。
テンプレートフィルタはルックアップテーブル(LU
T)として実行されることが好ましい。ステップ106
において整合する(マッチングする)テンプレートが見
つけられると、ステップ120において目標画素はテキ
スト画素として識別され、ステップ122において変化
なしでフィルタを通過することができる。整合するテン
プレートが見つけられない場合は処理が続き、ステップ
108において更なるテンプレートの存在が判断され
る。更なるテンプレートがウィンドウとの比較に利用可
能である場合、処理はステップ110へ続く。利用可能
でない場合、ステップ112において画素は入力画像の
ハーフトーンのセグメント又は背景の領域を表すものと
して識別され、ステップ114において "0”あるいは
"オフ(OFF)" 画像信号の出力が生成される。
に記憶されたテンプレート、例えば図4に示されるテン
プレート136a〜136f及び138と比較される。
テンプレートフィルタはルックアップテーブル(LU
T)として実行されることが好ましい。ステップ106
において整合する(マッチングする)テンプレートが見
つけられると、ステップ120において目標画素はテキ
スト画素として識別され、ステップ122において変化
なしでフィルタを通過することができる。整合するテン
プレートが見つけられない場合は処理が続き、ステップ
108において更なるテンプレートの存在が判断され
る。更なるテンプレートがウィンドウとの比較に利用可
能である場合、処理はステップ110へ続く。利用可能
でない場合、ステップ112において画素は入力画像の
ハーフトーンのセグメント又は背景の領域を表すものと
して識別され、ステップ114において "0”あるいは
"オフ(OFF)" 画像信号の出力が生成される。
【0027】好ましい複数反復の実施の形態において、
上述の第1の反復に続き、フィルタはエラー画素を識別
しかつ更にこのエラー画素をテキスト画像などから取り
除こうとする。エラー画素は識別されるテキスト画素よ
りもずっと散在している傾向にあるため、異なるクラス
のフィルタが連続する反復に使用されうる。例えば、所
定より少ない数の画素が近隣のウィンドウ内で活動中で
ある場合に目標画素がエラー画素とされる箇所では、順
序統計的フィルタが使用されうる。あるいは、同様の近
隣検査は形態学的フィルタを用いて行われうる。
上述の第1の反復に続き、フィルタはエラー画素を識別
しかつ更にこのエラー画素をテキスト画像などから取り
除こうとする。エラー画素は識別されるテキスト画素よ
りもずっと散在している傾向にあるため、異なるクラス
のフィルタが連続する反復に使用されうる。例えば、所
定より少ない数の画素が近隣のウィンドウ内で活動中で
ある場合に目標画素がエラー画素とされる箇所では、順
序統計的フィルタが使用されうる。あるいは、同様の近
隣検査は形態学的フィルタを用いて行われうる。
【0028】LUTのソフトウェア実施に適切である、
図3に関連する上述のシリアル方式は、電気回路を用い
ても達成されうることに注目せよ。より高速の性能は、
LUTがアプリケーション指定集積回路(ASIC)又
はプログラマブル・ロジックアレイ(PLA)を用いて
実施されるハードウェアの実施を使用して得られうる。
図3に関連する上述のシリアル方式は、電気回路を用い
ても達成されうることに注目せよ。より高速の性能は、
LUTがアプリケーション指定集積回路(ASIC)又
はプログラマブル・ロジックアレイ(PLA)を用いて
実施されるハードウェアの実施を使用して得られうる。
【0029】このような実施の形態の単純な例として、
図5の電気回路概略図が提供される。フィルタ回路20
0において、文書の画像はそのセグメントをルックアッ
プテーブル(32又は42)として記憶され本文中では
テンプレートと称される定義済みのパターンと比較する
ことによりフィルタリングされる。図5に示されるよう
に、入力文書が得られると目標画素Xが識別され、周囲
の画素の1セットがウィンドウ202として処理され
る。ウィンドウ内の画素信号の値は次にレジスタ20
4、又はウィンドウ202内の画素を表すデータ信号を
保持するのに適切な同様のメモリ位置へ転送される。
図5の電気回路概略図が提供される。フィルタ回路20
0において、文書の画像はそのセグメントをルックアッ
プテーブル(32又は42)として記憶され本文中では
テンプレートと称される定義済みのパターンと比較する
ことによりフィルタリングされる。図5に示されるよう
に、入力文書が得られると目標画素Xが識別され、周囲
の画素の1セットがウィンドウ202として処理され
る。ウィンドウ内の画素信号の値は次にレジスタ20
4、又はウィンドウ202内の画素を表すデータ信号を
保持するのに適切な同様のメモリ位置へ転送される。
【0030】レジスタ204に記憶された信号は、(あ
らゆる特定のテンプレート位置のバイナリ値に依存する
AND又はNORゲートの組み合わせであり得る)複数
の論理ゲート206又は同様の論理動作を用いて、LU
Tメモリに一連の信号として記憶されるテンプレートと
比較される。LUTメモリにおいて、各テンプレート毎
に記憶された信号のセットは、ウィンドウ内に検出され
る固有の画素パターンを表す。例えば、LUT32又は
42は、図4に示される136a〜136fのテンプレ
ートと同様のテンプレートで形成される。当業者には明
白であるように、単一のエレメント206として単純に
示されているが、述べられた並列比較動作の実施には各
テンプレート又はルックアップテーブルのエントリ毎に
複数の論理ゲートを必要とすることが更に注目される。
当業者には更に明白であるように、LUTテンプレート
のレジスタ204に記憶される値との迅速な並列比較を
可能にするために論理最小化技法が用いられうる。
らゆる特定のテンプレート位置のバイナリ値に依存する
AND又はNORゲートの組み合わせであり得る)複数
の論理ゲート206又は同様の論理動作を用いて、LU
Tメモリに一連の信号として記憶されるテンプレートと
比較される。LUTメモリにおいて、各テンプレート毎
に記憶された信号のセットは、ウィンドウ内に検出され
る固有の画素パターンを表す。例えば、LUT32又は
42は、図4に示される136a〜136fのテンプレ
ートと同様のテンプレートで形成される。当業者には明
白であるように、単一のエレメント206として単純に
示されているが、述べられた並列比較動作の実施には各
テンプレート又はルックアップテーブルのエントリ毎に
複数の論理ゲートを必要とすることが更に注目される。
当業者には更に明白であるように、LUTテンプレート
のレジスタ204に記憶される値との迅速な並列比較を
可能にするために論理最小化技法が用いられうる。
【0031】レジスタ204の信号をLUT32、42
の各エントリで関連する信号と比較することによって達
成される並列比較ステップの後、信号のセット同士の間
のあらゆる整合(マッチ)は正の論理信号となり、参照
番号208で表される論理ORアレイへ送られる。テキ
スト構造のテンプレートベースのフィルタに関連して先
に述べられたように、ORゲートアレイの出力によって
目標画素Xがテキスト画素として識別され、変化せずに
通過することが可能である。そうでない場合は、目標画
素は非テキスト領域と識別され、 "0”又は "オフ" 画
素信号の出力を生成するようにフラグが用いられる。
の各エントリで関連する信号と比較することによって達
成される並列比較ステップの後、信号のセット同士の間
のあらゆる整合(マッチ)は正の論理信号となり、参照
番号208で表される論理ORアレイへ送られる。テキ
スト構造のテンプレートベースのフィルタに関連して先
に述べられたように、ORゲートアレイの出力によって
目標画素Xがテキスト画素として識別され、変化せずに
通過することが可能である。そうでない場合は、目標画
素は非テキスト領域と識別され、 "0”又は "オフ" 画
素信号の出力を生成するようにフラグが用いられる。
【0032】図3のステップに従って、あるいは図5の
回路によって処理されると(双方ともルックアップテー
ブル32で実施されることが好ましい)、第1のフィル
タ出力画像34が生成される。続いて、図3、4
(A)、(B)及び5に関連して前述された方法と同様
の方法で、テンプレートベースのフィルタの第2の反復
40が達成される。より特定的には、図2を再び参照す
ると、第1のフィルタ出力が次に入力として使用され、
LUT2 42に記憶されるテンプレートと比較され、エ
ラー画像44が生成される。続いて、エラー画像44は
第1の出力画像とXOR処理46されてテキストのみの
出力画像48が生成される。あるいは、テキストのみの
出力画像48は入力文書と更にXOR処理50されてハ
ーフトーンのみの出力画像52が生成されてもよい。従
って、セグメント化されたバイナリ画像48及び52は
出力され、前記セグメント化された画像はフィルタを通
過した構造のうちの1つを表すマークを主に含む。例え
ば、セグメント化された画像48及び52はそれぞれテ
キスト又はハーフトーンの画像セグメントのみを有する
画像である。
回路によって処理されると(双方ともルックアップテー
ブル32で実施されることが好ましい)、第1のフィル
タ出力画像34が生成される。続いて、図3、4
(A)、(B)及び5に関連して前述された方法と同様
の方法で、テンプレートベースのフィルタの第2の反復
40が達成される。より特定的には、図2を再び参照す
ると、第1のフィルタ出力が次に入力として使用され、
LUT2 42に記憶されるテンプレートと比較され、エ
ラー画像44が生成される。続いて、エラー画像44は
第1の出力画像とXOR処理46されてテキストのみの
出力画像48が生成される。あるいは、テキストのみの
出力画像48は入力文書と更にXOR処理50されてハ
ーフトーンのみの出力画像52が生成されてもよい。従
って、セグメント化されたバイナリ画像48及び52は
出力され、前記セグメント化された画像はフィルタを通
過した構造のうちの1つを表すマークを主に含む。例え
ば、セグメント化された画像48及び52はそれぞれテ
キスト又はハーフトーンの画像セグメントのみを有する
画像である。
【0033】図3、4(A)、(B)及び5に示される
ようなフィルタリング処理の出力はまた、考察される各
特定の目標画素に対して整合が検出されたかどうかを示
す純バイナリ信号であってもよいことが更に理解され
る。このように、テンプレートベースのフィルタの出力
は本来バイナリであり、入力画像に更なる論理動作を実
行せずに画像セグメントの通過又はマスキングを必ずし
も許容するとは限らない。
ようなフィルタリング処理の出力はまた、考察される各
特定の目標画素に対して整合が検出されたかどうかを示
す純バイナリ信号であってもよいことが更に理解され
る。このように、テンプレートベースのフィルタの出力
は本来バイナリであり、入力画像に更なる論理動作を実
行せずに画像セグメントの通過又はマスキングを必ずし
も許容するとは限らない。
【0034】再び図1を参照すると、セグメント化され
た画像がセグメンテーションフィルタ14によって生成
されると、セグメント化画像は次にブロック15で示さ
れる画像処理及び/又は再結合動作によって処理され
る。特に、画像処理動作はフィルタやセグメンテーショ
ンフィルタ14によって分離されたセグメント化された
画像構造を処理するために特定にデザインされたフィル
タや他の公知の技術を用いてもよい。更に、一度処理さ
れるとセグメント化画像は再結合されて、マーキングエ
ンジン18による改良された描画に適切な形で出力画像
16を形成する。
た画像がセグメンテーションフィルタ14によって生成
されると、セグメント化画像は次にブロック15で示さ
れる画像処理及び/又は再結合動作によって処理され
る。特に、画像処理動作はフィルタやセグメンテーショ
ンフィルタ14によって分離されたセグメント化された
画像構造を処理するために特定にデザインされたフィル
タや他の公知の技術を用いてもよい。更に、一度処理さ
れるとセグメント化画像は再結合されて、マーキングエ
ンジン18による改良された描画に適切な形で出力画像
16を形成する。
【0035】次に図6及び7を参照すると、本発明のテ
ンプレートベースのセグメンテーションフィルタをデザ
インするのに使用される処理における様々な段階を示す
データフロー図が述べられる。図6に示されるように、
LUT1 は教材文書のペアを使用することにより生成さ
れ、該教材文書のペアにおいて第1の教材文書150は
テキスト領域とハーフトーン領域の双方を含む電子文書
のデジタル表示である。第2の教材文書、文書152は
第1の教材文書と同一であるが、ハーフトーン領域を除
いて編集されている。LUT1 に記憶されるようにテン
プレートを生成するため、第1及び第2の教材文書はテ
ンプレートマッチングプログラム156へ送られる。一
般的に、テンプレートマッチングプログラムによって達
成されるフィルタデザイン処理は最適化されたテンプレ
ートマッチングフィルタのデザインを可能にし、該フィ
ルタは次にLUT1 としてプログラム可能メモリに記憶
される。明白なように、本発明又は関連するテンプレー
トデザイン処理の多くの態様は、プログラム可能データ
処理システムを使用して達成される又はシミュレートさ
れることができる。
ンプレートベースのセグメンテーションフィルタをデザ
インするのに使用される処理における様々な段階を示す
データフロー図が述べられる。図6に示されるように、
LUT1 は教材文書のペアを使用することにより生成さ
れ、該教材文書のペアにおいて第1の教材文書150は
テキスト領域とハーフトーン領域の双方を含む電子文書
のデジタル表示である。第2の教材文書、文書152は
第1の教材文書と同一であるが、ハーフトーン領域を除
いて編集されている。LUT1 に記憶されるようにテン
プレートを生成するため、第1及び第2の教材文書はテ
ンプレートマッチングプログラム156へ送られる。一
般的に、テンプレートマッチングプログラムによって達
成されるフィルタデザイン処理は最適化されたテンプレ
ートマッチングフィルタのデザインを可能にし、該フィ
ルタは次にLUT1 としてプログラム可能メモリに記憶
される。明白なように、本発明又は関連するテンプレー
トデザイン処理の多くの態様は、プログラム可能データ
処理システムを使用して達成される又はシミュレートさ
れることができる。
【0036】上記のアプリケーションにおいて、LUT
デザイン処理は入力画像へ適用されると最小数のエラー
画素を生じるフィルタを生成する。本発明では、画像の
テキスト部分とは対照的に、画像のハーフトーン部分に
おけるエラーを生じないことがより重要である。従っ
て、代わりの実施の形態として、1より大きい重み係数
を教材文書のハーフトーン画素に適用することが好まし
く、これによって統計デザインの手順はハーフトーン画
素の分類エラーをテキスト画素の分類エラーよりも多く
最小化しようとする。一般に、教材文書における1つの
構造の画素に重みを付けることが好ましい。N個の画素
が通常処理されると各ハーフトーン画素が統計量の計算
に入れられるなど、重み付けが直送的であることが可能
である。
デザイン処理は入力画像へ適用されると最小数のエラー
画素を生じるフィルタを生成する。本発明では、画像の
テキスト部分とは対照的に、画像のハーフトーン部分に
おけるエラーを生じないことがより重要である。従っ
て、代わりの実施の形態として、1より大きい重み係数
を教材文書のハーフトーン画素に適用することが好まし
く、これによって統計デザインの手順はハーフトーン画
素の分類エラーをテキスト画素の分類エラーよりも多く
最小化しようとする。一般に、教材文書における1つの
構造の画素に重みを付けることが好ましい。N個の画素
が通常処理されると各ハーフトーン画素が統計量の計算
に入れられるなど、重み付けが直送的であることが可能
である。
【0037】セグメンテーションフィルタの第1の段階
又は反復が生成され、LUT1 として記憶されると、第
2の段階が生成される。図7のデータフロー図によって
示されるように、もとの画像150はLUT1 で表され
る第1段階のセグメンテーションフィルタへ送られる。
出力、即ちフィルタリングされた画像154が次にXO
R論理回路158へ送られるように記憶され、該XOR
論理回路158において画像154はテキストのみの教
材文書152とXOR処理される。XOR動作158の
出力、即ちエラー画像160が次にフィルタリングされ
た画像154と共にテンプレートマッチングプログラム
156へ送られる。テンプレートマッチングプログラム
のこの第2の発生において、出力はLUT2 として示さ
れる一連のテンプレートである。第2のセグメンテーシ
ョンフィルタデザイン処理(図7)の追加の反復は、追
加のテンプレート(LUTn ) を生成して更なるセグメ
ンテーションフィルタリングを達成するのに必要である
ことに注目すべきである。
又は反復が生成され、LUT1 として記憶されると、第
2の段階が生成される。図7のデータフロー図によって
示されるように、もとの画像150はLUT1 で表され
る第1段階のセグメンテーションフィルタへ送られる。
出力、即ちフィルタリングされた画像154が次にXO
R論理回路158へ送られるように記憶され、該XOR
論理回路158において画像154はテキストのみの教
材文書152とXOR処理される。XOR動作158の
出力、即ちエラー画像160が次にフィルタリングされ
た画像154と共にテンプレートマッチングプログラム
156へ送られる。テンプレートマッチングプログラム
のこの第2の発生において、出力はLUT2 として示さ
れる一連のテンプレートである。第2のセグメンテーシ
ョンフィルタデザイン処理(図7)の追加の反復は、追
加のテンプレート(LUTn ) を生成して更なるセグメ
ンテーションフィルタリングを達成するのに必要である
ことに注目すべきである。
【0038】要約して、本発明はテンプレートマッチン
グフィルタを使用する自動画像セグメンテーションの方
法及び装置である。本発明は一般に、1つ又はそれより
多くの構造を通過させると共に他の構造を取り除くこと
によって入力画像内の異なるバイナリテクスチャー又は
構造をセグメント化する。より詳細には、該方法及び装
置は、例えばハーフトーン領域を取り除く一方でテキス
ト領域を通過させるようにデザインされるテンプレート
マッチングフィルタを用いて、記憶されたバイナリ画像
をセグメント化する。
グフィルタを使用する自動画像セグメンテーションの方
法及び装置である。本発明は一般に、1つ又はそれより
多くの構造を通過させると共に他の構造を取り除くこと
によって入力画像内の異なるバイナリテクスチャー又は
構造をセグメント化する。より詳細には、該方法及び装
置は、例えばハーフトーン領域を取り除く一方でテキス
ト領域を通過させるようにデザインされるテンプレート
マッチングフィルタを用いて、記憶されたバイナリ画像
をセグメント化する。
【0039】
【発明の効果】本発明によって、広範囲の可能なパター
ンを示すあらゆる数の入力文書のタイプに適応できる、
柔軟でかつ低コストの画像セグメンテーションシステム
が行われることができる。
ンを示すあらゆる数の入力文書のタイプに適応できる、
柔軟でかつ低コストの画像セグメンテーションシステム
が行われることができる。
【図面の簡単な説明】
【図1】本発明による自動画像セグメンテーション装置
の実施の形態を示す一般的なブロック図であり、本発明
は文書複製システムにおいて使用されている。
の実施の形態を示す一般的なブロック図であり、本発明
は文書複製システムにおいて使用されている。
【図2】本発明による2段階の画像セグメンテーション
処理を示すデータフロー図である。
処理を示すデータフロー図である。
【図3】テンプレートベースのセグメンテーションフィ
ルタを図1の入力画像に適用するのに使用される連続処
理の様々なステップを示すフローチャートである。
ルタを図1の入力画像に適用するのに使用される連続処
理の様々なステップを示すフローチャートである。
【図4】(A)及び(B)は本発明によるテンプレート
ベースのセグメンテーションフィルタの画像の領域に対
する動作の絵による表示である。
ベースのセグメンテーションフィルタの画像の領域に対
する動作の絵による表示である。
【図5】本発明の1態様に従ってテンプレートベースの
セグメンテーション回路並列処理方式の実施を示す単純
な電気概略図である。
セグメンテーション回路並列処理方式の実施を示す単純
な電気概略図である。
【図6】本発明のテンプレートベースのセグメンテーシ
ョンフィルタをデザインするのに使用される処理におけ
る様々な段階を示すデータフロー図である。
ョンフィルタをデザインするのに使用される処理におけ
る様々な段階を示すデータフロー図である。
【図7】本発明のテンプレートベースのセグメンテーシ
ョンフィルタをデザインするのに使用される処理におけ
る様々な段階を示すデータフロー図である。
ョンフィルタをデザインするのに使用される処理におけ
る様々な段階を示すデータフロー図である。
10 文書 12 デジタルプリンタ 14 セグメンテーションフィルタ 32、42 ルックアップテーブル 136a〜f、138 テンプレート 202 ウィンドウ 204 レジスタ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ロバート ピー.ロース アメリカ合衆国 14580 ニューヨーク州 ウェブスター ストニー ポイント ト レイル 206 (72)発明者 レイナー エッシュバッハ アメリカ合衆国 14580 ニューヨーク州 ウェブスター ウェストウッド トレイ ル 812
Claims (2)
- 【請求項1】 デジタルプロセッサにおいて行われ
る、文書画像に存在する画像のタイプを決定するために
前記文書画像を処理する方法であって、 各画素が濃度信号によって表される複数の画素を有する
文書画像を画像源から受け取り、前記文書画像の1つの
領域を表示する前記濃度信号の少なくとも一部分をデー
タバッファに記憶するステップを含み、 前記データバッファから前記文書画像の濃度信号を検索
するステップを含み、 テンプレートマッチングフィルタを用いて、文書画像の
前記領域に存在する画像のタイプを決定するステップを
含む、 文書画像の処理方法。 - 【請求項2】 第1の構造を有する領域を優先的に通過
させて前記第1の構造を示す領域で主に構成される出力
画像を生成するように、複数の画素のラスタで表される
画像のバイナリ画像画素を処理する装置であって、 前記バイナリ画像信号を記憶する画像メモリを含み、 複数のラスタから複数の画像信号を記憶するウィンドウ
バッファを含み、前記画像信号が目標画素の周囲に集中
した画素を表し、 前記ウィンドウバッファに記憶された画像信号の関数と
して出力画像信号を生成するテンプレートフィルタを含
み、前記出力信号は前記目標画素が前記第1の構造を表
すバイナリ画像の領域の画像信号に相当し、前記出力信
号は前記目標画素が他の構造を表すバイナリ画像の領域
に対してゼロであり、 複数の目標画素の各々毎に出力信号を記憶する出力メモ
リを含み、前記出力メモリの各位置において記憶された
前記信号は前記テンプレートフィルタによってウィンド
ウ内の画像信号の関数として生成され、前記ウィンドウ
の内容は対応する目標画素の位置の関数として決定され
る、 バイナリ画像画素処理装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US342283 | 1994-11-18 | ||
US08/342,283 US6389163B1 (en) | 1994-11-18 | 1994-11-18 | Method and apparatus for automatic image segmentation using template matching filters |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08228282A true JPH08228282A (ja) | 1996-09-03 |
Family
ID=23341145
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7292284A Withdrawn JPH08228282A (ja) | 1994-11-18 | 1995-11-10 | 文書画像の処理方法及びバイナリ画像画素処理装置 |
Country Status (4)
Country | Link |
---|---|
US (3) | US6389163B1 (ja) |
EP (1) | EP0713329B1 (ja) |
JP (1) | JPH08228282A (ja) |
DE (1) | DE69511507T2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008004093A (ja) * | 2006-06-22 | 2008-01-10 | Xerox Corp | 画像データ編集システム及び方法 |
Families Citing this family (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19741359A1 (de) * | 1997-01-13 | 1998-07-23 | Hewlett Packard Co | Mehrfachbildabtastvorrichtung |
JP3304858B2 (ja) * | 1997-11-28 | 2002-07-22 | 富士ゼロックス株式会社 | 画像送信装置および画像送信方法 |
US6363162B1 (en) | 1998-03-05 | 2002-03-26 | Ncr Corporation | System and process for assessing the quality of a signature within a binary image |
US6415062B1 (en) * | 1998-03-05 | 2002-07-02 | Ncr Corporation | System and process for repairing a binary image containing discontinuous segments of a character |
US6683696B1 (en) * | 1998-10-27 | 2004-01-27 | Hewlett-Packard Development Company, L.P. | Filter based data imaging method for an image forming device |
JP2000217000A (ja) * | 1998-11-19 | 2000-08-04 | Murata Mach Ltd | 画像処理装置、画像処理方法及び記録媒体 |
US6650775B1 (en) * | 1999-08-23 | 2003-11-18 | Xerox Corporation | Method and apparatus for implementing a streaming two-dimensional digital image segmentation |
US6678414B1 (en) * | 2000-02-17 | 2004-01-13 | Xerox Corporation | Loose-gray-scale template matching |
US6584465B1 (en) * | 2000-02-25 | 2003-06-24 | Eastman Kodak Company | Method and system for search and retrieval of similar patterns |
US6721458B1 (en) * | 2000-04-14 | 2004-04-13 | Seiko Epson Corporation | Artifact reduction using adaptive nonlinear filters |
US7058221B1 (en) * | 2000-07-07 | 2006-06-06 | Tani Electronics Industry Co., Ltd. | Method of recognizing object based on pattern matching and medium for recording computer program having same |
US6813367B1 (en) * | 2000-09-11 | 2004-11-02 | Seiko Epson Corporation | Method and apparatus for site selection for data embedding |
JP2004511863A (ja) * | 2000-10-13 | 2004-04-15 | ピクチャーアイキュー インコーポレイテッド | 画像の解像度非依存型レンダリングのための手法 |
US20020067509A1 (en) * | 2000-12-06 | 2002-06-06 | Roylance Eugene A. | Method, apparatus and system for dynamic switching of image processing techniques |
US6757431B2 (en) * | 2000-12-19 | 2004-06-29 | Xerox Corporation | Resolution conversion for anti-aliased images using loose gray scale template matching |
US7254273B2 (en) * | 2000-12-28 | 2007-08-07 | Evolvable Systems Research Institute, Inc. | Data coding method and device, and data coding program |
US6735337B2 (en) * | 2001-02-02 | 2004-05-11 | Shih-Jong J. Lee | Robust method for automatic reading of skewed, rotated or partially obscured characters |
US6778700B2 (en) * | 2001-03-14 | 2004-08-17 | Electronics For Imaging, Inc. | Method and apparatus for text detection |
US20020176628A1 (en) | 2001-05-22 | 2002-11-28 | Starkweather Gary K. | Document imaging and indexing system |
US7277191B2 (en) * | 2001-06-27 | 2007-10-02 | Xerox Corporation | Fast efficient window region coalescing in a two-pass auto-windowing environment |
US20040027593A1 (en) * | 2001-10-12 | 2004-02-12 | David Wilkins | Techniques for resolution independent rendering of images |
KR20040103918A (ko) * | 2002-01-23 | 2004-12-09 | 마리나 시스템 코포레이션 | 결함 검출 및 분석을 위한 적외선 서모그래피 |
US7538815B1 (en) | 2002-01-23 | 2009-05-26 | Marena Systems Corporation | Autofocus system and method using focus measure gradient |
US7203356B2 (en) * | 2002-04-11 | 2007-04-10 | Canesta, Inc. | Subject segmentation and tracking using 3D sensing technology for video compression in multimedia applications |
US7079686B2 (en) * | 2002-08-20 | 2006-07-18 | Lexmark International, Inc. | Systems and methods for content-based document image enhancement |
US7336400B2 (en) * | 2002-10-31 | 2008-02-26 | Hewlett-Packard Development Company, L.P. | Transforming an input image to produce an output image |
US7312898B2 (en) * | 2002-10-31 | 2007-12-25 | Hewlett-Packard Development Company, L.P. | Transformation of an input image to produce an output image |
US7301674B2 (en) * | 2002-10-31 | 2007-11-27 | Hewlett-Packard Development Company, L.P. | Translation of an input pixel value to an output pixel value |
US20040096102A1 (en) * | 2002-11-18 | 2004-05-20 | Xerox Corporation | Methodology for scanned color document segmentation |
US7209244B2 (en) * | 2003-03-31 | 2007-04-24 | Eastman Kodak Company | Post RIP image rendering in an electrographic printer to minimize screen frequency sensitivity |
US7245779B2 (en) * | 2003-07-23 | 2007-07-17 | Marvell International Technology Ltd. | Image enhancement employing partial template matching |
US20080159640A1 (en) * | 2003-11-06 | 2008-07-03 | Chaoqiang Liu | Document Image Encoding Decoding |
US7995238B2 (en) * | 2004-01-30 | 2011-08-09 | Fuji Xerox Co., Ltd. | Image processing that can use both process and spot color plates |
US7447358B2 (en) * | 2004-03-31 | 2008-11-04 | Intel Corporation | Image segmentation using branch and bound analysis |
US7379595B2 (en) * | 2004-05-24 | 2008-05-27 | Xerox Corporation | Manual windowing with auto-segmentation assistance in a scanning system |
CN100377171C (zh) * | 2004-08-13 | 2008-03-26 | 富士通株式会社 | 生成劣化字符图像的方法和装置 |
CN100373399C (zh) * | 2004-08-18 | 2008-03-05 | 富士通株式会社 | 建立劣化字典的方法和装置 |
KR100643759B1 (ko) * | 2004-12-01 | 2006-11-10 | 삼성전자주식회사 | 문서 압축 장치 및 그 방법 |
JP4118872B2 (ja) * | 2004-12-06 | 2008-07-16 | シャープ株式会社 | 管理装置、印刷処理システム、管理装置の制御方法、管理装置の制御プログラム、管理装置の制御プログラムが記録された記録媒体 |
US7787158B2 (en) * | 2005-02-01 | 2010-08-31 | Canon Kabushiki Kaisha | Data processing apparatus, image processing apparatus, data processing method, image processing method, and programs for implementing the methods |
WO2007001272A1 (en) * | 2005-06-21 | 2007-01-04 | Hewlett-Packard Development Company, L.P. | Image reproduction method and apparatus |
US7466873B2 (en) * | 2005-06-29 | 2008-12-16 | Xerox Corporation | Artifact removal and quality assurance system and method for scanned images |
US7570794B2 (en) * | 2005-09-02 | 2009-08-04 | Gm Global Technology Operations, Inc. | System and method for evaluating a machined surface of a cast metal component |
US7672539B2 (en) * | 2005-12-15 | 2010-03-02 | General Instrument Corporation | Method and apparatus for scaling selected areas of a graphics display |
US7702154B2 (en) * | 2006-01-13 | 2010-04-20 | Adobe Systems, Incorporated | Method and apparatus indentifying halftone regions within a digital image |
US8031940B2 (en) * | 2006-06-29 | 2011-10-04 | Google Inc. | Recognizing text in images using ranging data |
US7953295B2 (en) * | 2006-06-29 | 2011-05-31 | Google Inc. | Enhancing text in images |
US8098934B2 (en) | 2006-06-29 | 2012-01-17 | Google Inc. | Using extracted image text |
US20080005684A1 (en) * | 2006-06-29 | 2008-01-03 | Xerox Corporation | Graphical user interface, system and method for independent control of different image types |
DE102007011785B3 (de) * | 2007-03-12 | 2008-09-11 | Meiller Direct Gmbh | Verfahren zur Erzeugung einer Zeichen- und/oder Symbolfolge in einem der menschlichen Handschrift ähnlichen Format |
US8228561B2 (en) * | 2007-03-30 | 2012-07-24 | Xerox Corporation | Method and system for selective bitmap edge smoothing |
US20090323134A1 (en) * | 2008-06-30 | 2009-12-31 | Kabushiki Kaisha Toshiba | Apparatus and method for generating segmentation data of a scanned image |
US8368959B2 (en) * | 2009-05-18 | 2013-02-05 | Xerox Corporation | Method and system for selective smoothing of halftoned objects using bitmap encoding |
US8762873B2 (en) * | 2009-10-26 | 2014-06-24 | Hewlett-Packard Development Company, L.P. | Graphical user interface component identification |
US9104450B2 (en) * | 2009-10-26 | 2015-08-11 | Hewlett-Packard Development Company, L.P. | Graphical user interface component classification |
US20110099498A1 (en) * | 2009-10-26 | 2011-04-28 | Barkol Omer | Graphical user interface hierarchy generation |
US8670157B2 (en) | 2012-07-12 | 2014-03-11 | Xerox Corporation | Dot growth system and method |
US8665499B2 (en) | 2012-07-12 | 2014-03-04 | Xerox Corporation | Isolated hole detection and growth |
US8842342B2 (en) | 2012-07-12 | 2014-09-23 | Xerox Corporation | Method and system for isolated hole detection and growth in a document image |
US8804200B2 (en) | 2012-07-12 | 2014-08-12 | Xerox Corporation | Method and system for isolated dot detection and growth in a document image |
US8810859B2 (en) | 2012-07-12 | 2014-08-19 | Xerox Corporation | Dot growth system and method |
US8643905B1 (en) | 2012-07-12 | 2014-02-04 | Xerox Corporation | Isolated hole detection and growth |
CN113257392B (zh) * | 2021-04-20 | 2024-04-16 | 哈尔滨晓芯科技有限公司 | 一种超声机普适外接数据自动预处理方法 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1545117A (en) * | 1976-05-25 | 1979-05-02 | Nat Res Dev | Comparison apparatus eg for use in character recognition |
US4194221A (en) | 1978-12-26 | 1980-03-18 | Xerox Corporation | Automatic multimode continuous halftone line copy reproduction |
GB2153619B (en) | 1983-12-26 | 1988-01-20 | Canon Kk | Image processing apparatus |
US4741046A (en) * | 1984-07-27 | 1988-04-26 | Konishiroku Photo Industry Co., Ltd. | Method of discriminating pictures |
US4703362A (en) | 1985-04-17 | 1987-10-27 | The United States Of America As Represented By The Secretary Of The Army | Mixed-mode symbol removal method for facsimile data compression |
GB8525509D0 (en) * | 1985-10-16 | 1985-11-20 | Int Computers Ltd | Symbol pattern matching |
US4852183A (en) * | 1986-05-23 | 1989-07-25 | Mitsubishi Denki Kabushiki Kaisha | Pattern recognition system |
US4811115A (en) | 1987-10-16 | 1989-03-07 | Xerox Corporation | Image processing apparatus using approximate auto correlation function to detect the frequency of half-tone image data |
US5005139A (en) * | 1988-08-16 | 1991-04-02 | Hewlett-Packard Company | Piece-wise print image enhancement for dot matrix printers |
DE69032318T2 (de) * | 1989-08-31 | 1998-09-24 | Canon Kk | Vorrichtung zur Bildverarbeitung |
US5034990A (en) * | 1989-09-05 | 1991-07-23 | Eastman Kodak Company | Edge enhancement error diffusion thresholding for document images |
US5131049A (en) | 1989-12-08 | 1992-07-14 | Xerox Corporation | Identification, characterization, and segmentation of halftone or stippled regions of binary images by growing a seed to a clipping mask |
US5065437A (en) | 1989-12-08 | 1991-11-12 | Xerox Corporation | Identification and segmentation of finely textured and solid regions of binary images |
US5351138A (en) * | 1990-04-24 | 1994-09-27 | Ricoh Company, Ltd. | Image area discriminating device |
US5200841A (en) * | 1990-05-25 | 1993-04-06 | Nikon Corporation | Apparatus for binarizing images |
JPH0772861B2 (ja) * | 1990-08-24 | 1995-08-02 | 富士ゼロックス株式会社 | プログラム作成装置 |
JPH04294466A (ja) | 1991-03-22 | 1992-10-19 | Ricoh Co Ltd | 画像処理装置 |
JP3276985B2 (ja) | 1991-06-27 | 2002-04-22 | ゼロックス・コーポレーション | イメージピクセル処理方法 |
US5379130A (en) * | 1992-12-02 | 1995-01-03 | Industrial Technology Research Institute | Text/image separation method |
US5341226A (en) | 1993-04-22 | 1994-08-23 | Xerox Corporation | Automatic image segmentation for color documents |
US5387985A (en) | 1993-12-17 | 1995-02-07 | Xerox Corporation | Non-integer image resolution conversion using statistically generated look-up tables |
-
1994
- 1994-11-18 US US08/342,283 patent/US6389163B1/en not_active Expired - Lifetime
-
1995
- 1995-11-10 JP JP7292284A patent/JPH08228282A/ja not_active Withdrawn
- 1995-11-16 DE DE69511507T patent/DE69511507T2/de not_active Expired - Lifetime
- 1995-11-16 EP EP95308204A patent/EP0713329B1/en not_active Expired - Lifetime
-
1999
- 1999-06-15 US US09/333,452 patent/US6157736A/en not_active Expired - Lifetime
-
2000
- 2000-11-09 US US09/710,797 patent/US6298151B1/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008004093A (ja) * | 2006-06-22 | 2008-01-10 | Xerox Corp | 画像データ編集システム及び方法 |
Also Published As
Publication number | Publication date |
---|---|
EP0713329A1 (en) | 1996-05-22 |
US6389163B1 (en) | 2002-05-14 |
EP0713329B1 (en) | 1999-08-18 |
US6298151B1 (en) | 2001-10-02 |
US6157736A (en) | 2000-12-05 |
DE69511507D1 (de) | 1999-09-23 |
DE69511507T2 (de) | 2000-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH08228282A (ja) | 文書画像の処理方法及びバイナリ画像画素処理装置 | |
US6377711B1 (en) | Methods and systems for detecting the edges of objects in raster images using diagonal edge detection | |
US20020080144A1 (en) | Adaptive thresholding using loose gray scale template matching | |
KR100524072B1 (ko) | 화질 개선 방법 | |
JPH04354470A (ja) | 画像処理方法と、前記方法を行うための走査/印刷システムと、前記走査/印刷システム用の画像選択装置 | |
JPH11154226A (ja) | 解像度改善方法及び装置 | |
JP2008092447A (ja) | 画像処理装置、画像出力装置、および画像処理方法 | |
JP3514050B2 (ja) | 画像処理装置 | |
EP0680194B1 (en) | Image processing device and image output device converting binary image into multi-valued image | |
JP4050382B2 (ja) | 多値画像のスムージング装置及び画像形成装置 | |
JP2972172B2 (ja) | 網点領域検出方法 | |
JP4035696B2 (ja) | 線分検出装置及び画像処理装置 | |
JP3251988B2 (ja) | 画像形成装置 | |
JPH07254982A (ja) | 混在画像処理装置 | |
EP0786895A2 (en) | Image processing system and method | |
JP2777378B2 (ja) | 網点領域検出方法 | |
JP3564216B2 (ja) | 画像処理装置 | |
JPH0766976A (ja) | 画像処理装置 | |
JP2777380B2 (ja) | 網点領域検出方法 | |
JP2724177B2 (ja) | 網点領域分離方式 | |
JP2972171B2 (ja) | 網点領域検出方法 | |
JP2635306B2 (ja) | 画像処理装置 | |
JP2778669B2 (ja) | 網点領域検出方法 | |
JP3596962B2 (ja) | 画像処理装置 | |
JP3359361B2 (ja) | 拡大印刷装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20030204 |