JPH1079026A - イメージデータを区分化し、分類する方法及び装置 - Google Patents

イメージデータを区分化し、分類する方法及び装置

Info

Publication number
JPH1079026A
JPH1079026A JP9193423A JP19342397A JPH1079026A JP H1079026 A JPH1079026 A JP H1079026A JP 9193423 A JP9193423 A JP 9193423A JP 19342397 A JP19342397 A JP 19342397A JP H1079026 A JPH1079026 A JP H1079026A
Authority
JP
Japan
Prior art keywords
image
window
image data
type
pass
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP9193423A
Other languages
English (en)
Inventor
Zhigang Fan
ファン ジーガン
Kathleen Ryall
ライアル カスリーン
Jeng-Nan Shiau
ナン シアウ イェン
Shriram Revankar
レヴァンカル スリラム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH1079026A publication Critical patent/JPH1079026A/ja
Abandoned legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 イメージデータをウィンドウに区分化し、そ
のウィンドウを一般的なイメージ型として分類する。 【解決手段】 イメージデータの始めから終りまで第1
パスを行って、ウィンドウを識別し、各ウィンドウの開
始点とイメージ型を記録するステップと、イメージデー
タの始めから終まで第2パスを行って、各画素に特定の
イメージ型としてラベルを付けるステップを含んでい
る。さらに、イメージデータの走査線をエッジとイメー
ジランに区分けし、各エッジとイメージランを標準イメ
ージ型として分類するマクロ検出方法を含む。マクロ検
出方法では、ミクロ検出結果と、隣接するイメージラン
のイメージ型とに基づいて、イメージランおよびエッジ
を分類する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、イメージデータのペー
ジをウィンドウに区分化し、各ウィンドウ内のイメージ
データを特定のタイプのイメージデータとして分類する
方法および装置に関する。
【0002】
【従来の技術】イメージデータは、各走査線が多数の画
素から成る複数の走査線の形で格納されることが多い。
この種のイメージデータを処理するときは、データによ
って表されたイメージタイプを知っていることが役に立
つ。たとえば、イメージデータは図形、テキスト、ハー
フトーン、コントーン(連続トーン)、または別の認識
されたイメージのタイプを表しているかもしれない。イ
メージデータのページはすべて1つのタイプであるかも
しれないし、複数のイメージタイプの組合せであるかも
しれない。
【0003】この分野においては、イメージデータのペ
ージを受け取り、そのイメージデータを同様なイメージ
タイプのウィンドウに区分化する方法が知られている。
たとえば、イメージデータのページはハーフトーンピク
チャとピクチャを説明する添付テキストを含んでいるこ
とがある。イメージデータを効率的に処理するために、
イメージデータのページを2つのウィンドウ(すなわ
ち、ハーフトーンイメージを表す第1ウィンドウと、テ
キストを表す第2ウィンドウ)に区分けすることは知ら
れている。そのあと、処理をイメージデータのタイプに
合わせることによって、イメージデータのページの処理
を効率的に実行することができる。
【0004】また、イメージデータの1ページの全体を
1パスをまたは2パスを行うことによって、イメージデ
ータのページをウィンドウに区分けし、ウィンドウ内の
イメージデータを分類し、処理することは知られてい
る。1パス方法はより迅速であるが、既に生成された情
報を、「未来の」文脈の前後関係を使用して訂正するこ
とはできない。2パス方法においては、第3また第4走
査線について得た情報を使用して、第1または第2走査
線に関する情報を生成する、すなわち訂正することがで
きる。言い換えると、未来の前後関係を使用することが
できる。
【0005】2パス方法においては、第1パスの間に、
イメージをウィンドウに区分けして、各ウィンドウ内の
イメージデータのタイプに関して判断を行う。第1パス
の終りに、各画素についてイメージタイプをメモリに記
録する。第2パスの間に、第1パスから得た情報すなわ
ちイメージタイプのデータを使用して、イメージデータ
を処理する。都合の悪いことに、イメージデータのペー
ジの各画素についてイメージタイプの情報を格納するに
は、大量のメモリを必要とするので、この方法を実施す
る装置のコストが高くなる。
【0006】
【発明が解決しようとする課題】本発明は、イメージデ
ータをウィンドウに区分けし、各ウィンドウ内のイメー
ジデータを分類する、改良された2パス方法および装置
を提供する。
【0007】
【課題を解決するための手段】本方法においては、イメ
ージデータの始めから終りまでの第1パスの間に、デー
タの各走査線をエッジ区分とイメージラン区分に区分け
するためにミクロ検出とマクロ検出を行う。ミクロ検出
の間に、隣接画素を調べて、各画素のイメージタイプを
決定する。マクロ検出の間に、ミクロ検出結果に基づい
て走査線のイメージランのイメージタイプを決定する。
これらの機能を果たすために、既知のミクロ検出方法、
たとえば米国特許第5,293,430号に記載されて
いるミクロ検出方法を用いることができる。
【0008】次に、走査線のイメージラン区分を組み合
わせてウィンドウを作る。これは、「白い」のイメージ
部分を捜し出すことによって行われる。そのような領域
は通常「ガター」と呼ばれる。たとえば、白いガター領
域はハーフトーンイメージと、イメージを説明するテキ
ストの間に存在するであろう。テキストのページの異な
るパラグラフの間に水平ガターが存在することがある。
同様に、テキストの2つの欄(カラム)の間に垂直ガタ
ーが存在することがある。
【0009】その後、各ウィンドウ内のマクロ検出結果
について統計量を集めて、調べる。その統計量に基づい
て、もし可能であれば、各ウィンドウを特定のイメージ
タイプとして分類する。第1パスの終りに、各ウィンド
ウの開始点をメモリに記録する。もしウィンドウが主と
して単一タイプのイメージデータを含んでいるように見
えれば、イメージタイプも記録する。もしウィンドウが
1つ以上のイメージタイプを含んでいるように見えれ
ば、そのウィンドウを「混在(mixed) タイプ」ウィンド
ウとして識別する。
【0010】イメージデータの始めから終りまでの第2
パスの間に、ミクロ検出、マクロ検出、およびウィンド
ウ処理の各ステップを繰り返す。第1パスのとき単一イ
メージタイプとしてラベルが付けられたウィンドウ内の
画素は既知のイメージタイプによって簡単にラベルが付
けられる。第1パスの間に混在タイプウィンドウとして
分類されたウィンドウの中の画素は、第2パスの間に実
行されたミクロ検出、マクロ検出、およびウィンドウ処
理の各ステップの結果に基づいて分類される。いったん
画素を特定のイメージタイプとして分類してしまえば、
イメージデータのそれ以後の処理は第2パスの間に起き
てもよい。
【0011】第1パスと第2パスを実行するのに同じハ
ードウェアを使用するので、第2パスのための追加コス
トはない。さらに、各画素のイメージタイプの種別は第
1パスの終りに記録されないから、メモリの必要量が少
なく、従って本方法を実施する装置のコストが下がる。
【0012】本発明に係る方法の場合、イメージデータ
の走査線を調べるマクロ検出ステップは、走査線をエッ
ジ区分とイメージラン区分に区分化するステップと、各
イメージラン内のイメージデータに関する統計量に基づ
いて各イメージランを分類するステップを含むことがで
きる。マクロ検出ステップは、さらに、1)エッジ区分
のイメージデータと、2)周囲のイメージランの種別に
基づいて、走査線の各エッジ区分を分類するクリーンア
ップステップを含むことができる。クリーンアップステ
ップは、さらに、周囲のイメージランの種別に基づいて
イメージランを再分類するステップを含むことができ
る。
【0013】以下、添付図面を参照して本発明の好まし
い実施例を説明する。図中、同じ構成要素は同じ符号で
表示してある。
【0014】
【発明の実施の形態】図1は、本発明を具体化する2パ
ス区分化・分類方法を示す。本方法は、イメージデータ
のページをウィンドウに区分化し、各ウィンドウ内のイ
メージデータを特定のイメージタイプとして分類し、各
画素のウィンドウおよびイメージタイプに関する情報を
記録する。いったん各ウィンドウのイメージタイプを知
りさえすれば、イメージデータのそれ以後の処理を効率
的に実施することができる。
【0015】イメージデータは画素イメージデータの多
数の走査線から成っている。各走査線は一般に走査線内
の各画素に関する濃度情報を含んでいる。典型的なイメ
ージタイプとしては、図形、テキスト、低周波ハーフト
ーン、高周波ハーフトーン、コントーン、等がある。
【0016】第1ステップS101において、ミクロ検
出を実行する。ミクロ検出の間に、イメージデータの多
数の走査線をメモリにバッファする。各画素を調べて、
画素のイメージタイプについて予備的決定を行う。さら
に、各画素の濃度とその周囲の隣接画素の濃度とを比較
する。調べている画素の濃度が周囲の隣接画素の濃度よ
り著しく異なるかどうかの判断を行う。画素が隣接画素
より著しく異なるる濃度を有するときは、その画素をエ
ッジ画素として分類する。
【0017】第2ステップS103において、マクロ検
出を実行する。マクロ検出ステップの間に、ミクロ検出
ステップの結果を用いて、各走査線内のエッジである画
素と、イメージランに属する画素とを識別する。次にミ
クロ検出結果に基づいて、各イメージランのイメージタ
イプを決定する。イメージランのイメージタイプは、そ
のほかに、前の走査線の隣接イメージランのイメージタ
イプと、信頼係数に基づいていることがある。さらに、
たとえ前の走査線のイメージランを標準のイメージタイ
プとして分類することができなかったとしても、現在の
走査線の調査中に生成された情報により前の走査線のイ
メージランのイメージタイプを決定することが可能であ
れば、その決定を行い、そして前の走査線のイメージラ
ンのイメージタイプを記録する。
【0018】図5に、イメージデータの1本の走査線5
0の例を示す。マクロ検出ステップの間に、高濃度の画
素はエッジ54,58,62として分類される。エッジ
間の走査線部分はイメージラン52,56,60,64
として分類される。
【0019】次のステップS105において、隣接走査
線のイメージランを組み合わせて、ウィンドウを生成す
る。図2に、ウィンドウにグループ分けされた多数の走
査線の図的表現を示す。イメージデータはガター11で
隔てられた第1ウィンドウ12と第2ウィンドウ13に
区分けされる。第1エッジ14はイメージデータの残り
の部分から第1ウィンドウ12を隔てている。第2エッ
ジ16はイメージデータの残りの部分から第2ウィンド
ウ13を隔てている。さらに、第3エッジ18は第2ウ
ィンドウ13を異なるイメージタイプをもつ第1部分と
第2部分に区分けしている。
【0020】次のステップS107において、各ウィン
ドウについて統計量を集め、計算する。統計量はウィン
ドウ内の各画素に関する濃度とマクロ検出結果に基づい
ている。
【0021】次のステップS109において、各ウィン
ドウを分類するために統計量を調べる。主として1つの
タイプのイメージデータを含んでいるように見えるウィ
ンドウは、それらの支配的なイメージタイプに従って分
類する。1つ以上のイメージタイプを含んでいるウィン
ドウは「混在タイプ」として分類する。
【0022】第1パスの終りに、ステップS110にお
いて、各ウィンドウの開始点とイメージタイプを記録す
る。
【0023】第2パスの間に、ステップS111,S1
13,S115において、それぞれミクロ検出、マクロ
検出、およびウィンドウ生成ステップを繰り返す。次の
ステップS117において、画素のラベル付けを行う。
ラベル付けステップの間に、イメージタイプおよび各画
素のウィンドウに関する情報を記録する。もし画素が第
1パスの間に特定のイメージタイプとして分類されたウ
ィンドウ内にあれば、そのウィンドウのイメージタイプ
を用いてそのウィンドウ内の各画素にラベルを付ける。
もし画素が第1パスの間に「混在タイプ」として分類さ
れたウィンドウ内にあれば、第2パスの間に実行された
ミクロ検出、マクロ検出、およびウィンドウ生成ステッ
プの結果を用いて、その画素にイメージタイプを指定す
る。ラベル付けの終りに、各画素に特定のイメージタイ
プとしてラベルを付ける。
【0024】いったん標準のイメージタイプに従ってイ
メージデータの各部分を分類しさえすれば、イメージデ
ータのそれ以後の処理を効率的に実施することができ
る。第1パスからのミクロ検出結果とマクロ検出結果は
イメージの各画素ごとに記録されないので、本発明を具
体化する装置の必要なメモリ量は少なくて済む。これは
装置のコストを下げる一助になる。
【0025】図2および図3に、イメージ内のウィンド
ウを識別し、分類するのに、2パス方法をどのように使
用するかの例を示す。イメージデータ10は画素データ
の多数の走査線から成っている。図2はイメージデータ
の始めから終りまでの第1パスの結果を示し、図3は同
じイメージデータの始めから終りまでの第2パスの結果
を示す。
【0026】第1パスのミクロ検出ステップとマクロ検
出ステップの間に、各走査線のイメージランとエッジを
識別し、もし可能ならば、イメージランとエッジのイメ
ージタイプを決定する。ウィンドウ生成ステップの間
に、ウィンドウを識別する。図2に示すように、第1ウ
ィンドウ12内のイメージデータの第1部分20は未知
のイメージタイプであり、第2部分22はコントーンと
して識別された。第2ウィンドウ13内の第1部分24
は低周波ハーフトーンとして識別され、第2部分26は
未知のイメージタイプであり、第3部分28はコントー
ンとして識別された。
【0027】第1パスの終りに、第1および第2ウィン
ドウのイメージタイプと開始点を記録する。第1ウィン
ドウ12の開始点をX0 ,Y0 として記録する。第1ウ
ィンドウ12内で主として単一タイプのイメージデータ
(コントーン)が検出されたので、第1ウィンドウ12
のイメージタイプをコントーンとして記録する。第2ウ
ィンドウ13の開始点をX2 ,Y0 として記録する。第
2ウィンドウ13内で2つのイメージタイプ(低周波ハ
ーフトーンとコントーン)が検出されたので、第2ウィ
ンドウ13のイメージタイプは混在タイプとして記録す
る。
【0028】また、たとえ混在タイプウィンドウの1つ
またはそれ以上のイメージランを初期調査のとき分類す
ることが不可能であったとしても、次の走査線の隣接イ
メージランの調査によって未知のイメージランのイメー
ジタイプを決定することが可能であれば、第1パスの終
りに未知のイメージランの開始点とイメージタイプを同
様に記録する。たとえば、図2を参照すると、第2ウィ
ンドウ13の第2部分26を通過するめ第1パスの間
に、最初に、始めの2本の走査線のイメージランを分類
することは不可能であった。これらのイメージランは、
未知であることを示すために図2では、黒く陰影を付け
てある。しかし、第2部分26の第3走査線の処理の間
に、始めの2本の走査線のイメージランをコントーンと
して識別することが可能になった。従って、第1パスの
終りに、イメージタイプコントーンと共に未知の区分の
開始点X3 ,Y0 を記録する。この情報を第2パスの間
に使用して、通常はミクロ検出結果のみに基づいて分類
することが不可能なイメージランを直接に分類すること
ができる。
【0029】第2パスの間に、ミクロ検出、マクロ検
出、およびウィンドウ生成の諸ステップを再度実施す
る。次に各画素にイメージタイプを用いてラベルを付け
る。第1ウィンドウ12内の画素はコントーンとしてラ
ベルを付ける。第2ウィンドウ13内の画素とイメージ
ランは、第2パスの間に実施したミクロ検出とマクロ検
出のステップの結果と、第1パスの間に記録した未知区
分に関する情報に基づいて、ラベルを付ける。
【0030】図3に示すように、第1ウィンドウ12内
の画素はコントーンとして分類され、第2ウィンドウ1
3の第1部分24内の画素は低周波ハーフトーンとして
分類され、そして第2ウィンドウ13の第2部分28内
の画素は今度はまったくコントーンであるとしてラベル
が付けられる。
【0031】図4に、本発明の2パス方法を実施するこ
とが可能なページ区分化・分類装置のブロック図を示
す。ページ区分化・分類手段40は、ミクロ検出ステッ
プを実行するためのミクロ検出手段42、マクロ検出ス
テップを実行するためのマクロ検出手段43、および走
査線のイメージランをグループ化して一緒にウィンドウ
を作るウィンドウ生成手段44を備えている。装置は、
さらに、各ウィンドウ内の画素に関する統計量を集めて
計算するための統計手段45と、集めた統計量に基づい
て各ウィンドウを特定のイメージタイプとして分類する
ための分類手段46を備えている。
【0032】装置は、さらに、各ウィンドウの開始点と
イメージタイプと、第1パスの間に続いて分類された最
初は未知のイメージランの開始点とイメージタイプを記
録するためのメモリ手段47を備えている。メモリ手段
47は、さらに、第2パスの終りにウィンドウと各画素
のイメージタイプを格納するため使用できる。しかし、
一般に、イメージデータは、イメージを処理され、転送
し、および(または)印刷するため直接使用されたあ
と、廃棄される。
【0033】ページ区分化・分類手段40は、さらに、
各画素にイメージタイプを用いてラベルを付けたあと、
特定のウィンドウに属しているイメージデータを処理す
るための画像処理手段48を備えている。
【0034】本発明を具体化するページ区分化・分類装
置は、さらに、典型的なコンピュータプロセッサと、2
パス方法の各ステップを実行するように設計されたソフ
トウェアを備えることができる。装置は、さらに、2パ
ス方法によって処理されるイメージを取得するためのイ
メージデータ取得手段36を備えることができる。装置
は、さらに、2パス方法によって区分化し、分類される
イメージデータを生成するためのイメージデータ生成手
段38を備えることができる。イメージデータ生成手段
38は、テキストのページまたはテキストとイメージが
混在するページを生成するイメージまたはワード処理プ
ログラムを生成するためのソフトウェアプログラムを備
えることができる。
【0035】図6に、上に述べた2パス区分化・分類方
法と一緒に使用するのに適したマクロ検出方法のブロッ
ク図を示す。マクロ検出方法は、既にミクロ検出ステッ
プにおいて生成されたミクロ検出結果を使用して、イメ
ージデータの走査線をイメージランとエッジに区分け
し、そのあとイメージランとエッジをイメージタイプと
して分類する。
【0036】ステップS603において、ミクロ検出ス
テップの間に検出した高濃度エッジ画素の場所に基づい
て、イメージランの開始点と終了点を決定する。次のス
テップS605において、各イメージラン内の各画素に
関する統計量を集め、(または)ミクロ検出結果に基づ
いて計算する。次のステップS607において、統計量
のほかに、前の走査線の結果を用いて、各イメージラン
について予想イメージタイプの種別を決定する。
【0037】この方法は、さらに、各イメージランにつ
いて信頼係数を決定するステップ609を含むことがで
きる。イメージランの「信頼係数」はイメージランが正
しく分類された相対的可能性を示す。相対的に均一な濃
度の画素を有するイメージランの場合は、信頼係数は高
いであろう。多くの異なる濃度レベルの画素を有するイ
メージランの場合は、信頼係数は相対的に低いであろ
う。イメージランに関する信頼係数はメモリに記録され
るであろう。プロセスが次の走査線へ進むと、前の走査
線の隣接区分の信頼係数をミクロ検出結果と組み合わせ
て使用し、イメージランのイメージタイプを決定するこ
とができるであろう。
【0038】クリーンアップステップS611におい
て、各エッジにイメージタイプ種別を割り当てることが
でき、そしてイメージランの一部を再分類することがで
きる。
【0039】図7に、可能性のあるクリーンアップステ
ップS611のブロック図を示す。ステップS703に
おいて、ミクロ検出結果と隣接する左右のイメージラン
のイメージタイプに基づいて、垂直エッジのイメージタ
イプを決定する。さらに、ステップS703において、
ミクロ検出結果と隣接する左右のイメージランの種別に
基づいて、短いイメージランを再分類することができ
る。
【0040】次のステップS705において、水平エッ
ジに関するミクロ検出結果と、前の走査線の隣接区分の
イメージタイプに基づいて、水平エッジのイメージタイ
プを決定する。
【0041】本発明の幾つかの実施例では、クリーンア
ップステップはこの時点で終了する。本発明の別の実施
例では、クリーンアップステップは、さらに、ミクロ検
出結果と、隣接する左右のイメージランのイメージタイ
プに基づいて、長いイメージランを再分類する追加ステ
ップS707を含んでいる。
【0042】さらに別の実施例では、クリーンアップス
テップは、ミクロ検出結果、隣接する左右のイメージラ
ンのイメージタイプ、および前の走査線の1つまたはそ
れ以上の隣接区分のイメージタイプに基づいて、長いイ
メージランを再分類するステップS709を含むことが
できる。
【0043】従って、クリーンアップステップS611
においては、周囲のイメージ部分の前後関係に基づい
て、そして(または)前の走査線の前後関係に基づい
て、エッジおよび短いイメージランを再分類することが
できる。そのほかに、周囲のイメージランの前後関係お
よび(または)前の走査線の前後関係に基づいて、長い
イメージランを再分類することができる。
【0044】図8に、本発明に係るマクロ検出方法を実
施できる装置のブロック図を示す。マクロ検出手段70
は、イメージデータの走査線をエッジとイメージランに
区分けするための区分化手段71、各走査線内の画素に
関する統計量を集め、計算するための統計手段72、イ
メージランとエッジのイメージタイプを決定するための
分類手段73、およびエッジを分類し、イメージランを
再分類するためのクリーンアップ手段74を備えてい
る。マクロ検出手段70は、さらに、イメージランのイ
メージタイプ種別が正しい確率を示す信頼係数を決定す
るための信頼係数決定手段75を備えることができる。
【0045】クリーンアップ手段74は、イメージラン
を再分類するための再分類手段77、垂直エッジを分類
するための垂直エッジ分類手段79、および水平エッジ
を分類するための水平エッジ分類手段81を備えること
ができる。
【0046】本発明を具体化し、かつマクロ検出方法を
実施することができる装置は、図6および図7に示した
各ステップを実行するためコンピュータプロセッサと関
連ソフトウェアプログラムを備えることができる。
【0047】以上、好ましい実施例について発明を説明
したが、発明は開示した実施例に限定されない。それど
ころか、本出願は特許請求の範囲に記載された発明の精
神および範囲に含めることができるすべての代替物、修
正物、および均等物を包含しているものとする。
【図面の簡単な説明】
【図1】本発明を具体化する2パス区分化・分類方法を
示すブロック図である。
【図2】第1パスの間にウィンドウに区分けされたイメ
ージデータの走査線の図的表現である。
【図3】第2パスの間にウィンドウに区分けされたイメ
ージデータの走査線の図的表現である。
【図4】本発明を具体化するページ区分化・分類装置の
ブロック図である。
【図5】イメージデータの走査線の図的表現である。
【図6】本発明を具体化するマクロ検出方法のブロック
図である。
【図7】本発明を具体化するマクロ検出方法のクリーン
アップステップのブロック図である。
【図8】本発明を具体化するマクロ検出装置のブロック
図である。
【符号の説明】
10 イメージデータ 11 ガター 12 第1ウィンドウ 13 第2ウィンドウ 14 第1エッジ 16 第2エッジ 18 第3エッジ 20 第1ウィンドウの第1部分 22 同第2部分 24 第2ウィンドウの第1部分 26 同第2部分 28 同第3部分 36 イメージデータ取得手段 38 イメージデータ生成手段 40 ページ区分化・分類手段 42 ミクロ検出手段 43 マクロ検出手段 44 ウィンドウ生成手段 45 統計手段 46 分類手段 47 メモリ手段 48 イメージ処理手段 50 イメージデータの走査線 52,56,60,64 イメージラン 54,58,62 エッジ 70 マクロ検出手段 71 区分化手段 72 統計手段 73 分類手段 74 クリーンアップ手段 75 信頼係数決定手段 77 再分類手段 79 垂直エッジ分類手段 81 水平エッジ分類手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 カスリーン ライアル アメリカ合衆国 マサチューセッツ州 02138ケンブリッジ ハーヴァード スト リート 378 アパートメント 4 (72)発明者 イェン ナン シアウ アメリカ合衆国 ニューヨーク州 14580 ウェブスター シャドー ウッド レー ン 687 (72)発明者 スリラム レヴァンカル アメリカ合衆国 ニューヨーク州 14580 ウェブスター プランク ロード 551

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 画素データの複数の走査線から成るイメ
    ージデータを区分化して分類するのを、コンピュータで
    実施する方法において、 少なくとも1つのウィンドウを識別し且つ少なくとも1
    つのウィンドウ内のイメージデータのイメージのタイプ
    を決定するように、前記イメージデータを通して第1の
    パスを実行するステップと、 前記少なくとも1つのウィンドウのイメージタイプと開
    始点とを記録するステップと、 前記イメージデータの各画素を特定のイメージタイプと
    してラベルを付けるように、前記イメージデータを通し
    て第2のパスを実行するステップとから成ることを特徴
    とする方法。
  2. 【請求項2】 イメージデータの走査線を区分化して分
    類するように、マクロ検出を行う装置において、 イメージデータの走査線を、少なくとも1つのイメージ
    ランと少なくとも1つのエッジとに区分化する手段と、 少なくとも1つのイメージランの少なくとも1つのイメ
    ージタイプを決定する手段と、 少なくとも1つのエッジのイメージタイプを決定するよ
    うに、クリーンアッププロシージャを手段とを備え、 さらに、前記少なくとも1つのイメージランの、前記決
    定した少なくとも1つのイメージタイプについて信頼係
    数を決定する手段を含んでいることを特徴とする装置。
JP9193423A 1996-07-26 1997-07-18 イメージデータを区分化し、分類する方法及び装置 Abandoned JPH1079026A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/686,803 US5850474A (en) 1996-07-26 1996-07-26 Apparatus and method for segmenting and classifying image data
US08/686803 1996-07-26

Publications (1)

Publication Number Publication Date
JPH1079026A true JPH1079026A (ja) 1998-03-24

Family

ID=24757834

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9193423A Abandoned JPH1079026A (ja) 1996-07-26 1997-07-18 イメージデータを区分化し、分類する方法及び装置

Country Status (5)

Country Link
US (2) US5850474A (ja)
EP (1) EP0821318A3 (ja)
JP (1) JPH1079026A (ja)
BR (1) BR9705229A (ja)
CA (1) CA2205764C (ja)

Families Citing this family (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5966462A (en) * 1997-06-19 1999-10-12 Xerox Corporation Method and system for processing and rendering object oriented neutral image data
JP3891654B2 (ja) * 1997-08-20 2007-03-14 株式会社東芝 画像形成装置
US6252675B1 (en) 1998-05-08 2001-06-26 Xerox Corporation Apparatus and method for halftone hybrid screen generation
JP3558893B2 (ja) * 1998-10-08 2004-08-25 シャープ株式会社 画像処理装置および画像処理方法
US6289122B1 (en) * 1999-04-15 2001-09-11 Electronics For Imaging, Inc. Intelligent detection of text on a page
US6674901B1 (en) * 1999-04-21 2004-01-06 Hewlett-Packard Development Company, L.P. Document analysis system and method
US6650775B1 (en) 1999-08-23 2003-11-18 Xerox Corporation Method and apparatus for implementing a streaming two-dimensional digital image segmentation
US6639692B1 (en) 1999-09-09 2003-10-28 Xerox Corporation Pixel level segmentation tag cleanup
US6636331B1 (en) 1999-09-09 2003-10-21 Xerox Corporation Segmentation tag cleanup based on connected components
US6650439B1 (en) 1999-09-09 2003-11-18 Xerox Corporation Segmentation tag cleanup system
US6493463B1 (en) 1999-09-09 2002-12-10 Xerox Corporation Segmentation tag cleanup using neighborhood tags
US6516091B1 (en) 1999-09-09 2003-02-04 Xerox Corporation Block level analysis of segmentation tags
US6976223B1 (en) * 1999-10-04 2005-12-13 Xerox Corporation Method and system to establish dedicated interfaces for the manipulation of segmented images
US6594401B1 (en) * 1999-10-20 2003-07-15 Xerox Corporation Detection and elimination of scanning artifacts
JP3386025B2 (ja) * 1999-12-15 2003-03-10 株式会社ニコン 画像特徴抽出装置、画像特徴抽出方法、監視検査システム、半導体露光システム、およびインターフェースシステム
US7136528B2 (en) 2000-02-11 2006-11-14 Sony Corporation System and method for editing digital images
US7262778B1 (en) 2000-02-11 2007-08-28 Sony Corporation Automatic color adjustment of a template design
US6993719B1 (en) 2000-02-11 2006-01-31 Sony Corporation System and method for animated character photo-editing interface and cross-platform education icon
US6625312B1 (en) 2000-02-28 2003-09-23 Xerox Corporation Document classification using segmentation tag statistics
US7218784B1 (en) 2000-05-01 2007-05-15 Xerox Corporation Method and apparatus for controlling image quality and compression ratios
US6567099B1 (en) * 2000-11-15 2003-05-20 Sony Corporation Method and system for dynamically allocating a frame buffer for efficient anti-aliasing
US6941014B2 (en) * 2000-12-15 2005-09-06 Xerox Corporation Method and apparatus for segmenting an image using a combination of image segmentation techniques
US6741741B2 (en) * 2001-02-01 2004-05-25 Xerox Corporation System and method for automatically detecting edges of scanned documents
US7277191B2 (en) * 2001-06-27 2007-10-02 Xerox Corporation Fast efficient window region coalescing in a two-pass auto-windowing environment
US6806458B2 (en) * 2001-12-05 2004-10-19 Em Microelectronic - Marin Sa Method, sensing device and optical pointing device including a sensing device for comparing light intensity between pixels
DE10162559B4 (de) * 2001-12-19 2006-08-10 Siemens Ag Verfahren und Vorrichtung zur Unterdrückung von periodischen Störsignalen
US7039232B2 (en) * 2001-12-20 2006-05-02 Xerox Corporation Block level analysis of segmentation tags
US8103104B2 (en) * 2002-01-11 2012-01-24 Hewlett-Packard Development Company, L.P. Text extraction and its application to compound document image compression
US6978046B2 (en) * 2002-03-29 2005-12-20 Xerox Corporation Systems and methods for automated template creation using scanned input
US7218332B2 (en) * 2002-04-30 2007-05-15 Xerox Corporation Method and apparatus for windowing and image rendition
US20040096102A1 (en) * 2002-11-18 2004-05-20 Xerox Corporation Methodology for scanned color document segmentation
US7239430B2 (en) * 2002-12-12 2007-07-03 Xerox Corporation Binary halftone detection
US7345792B2 (en) * 2002-12-17 2008-03-18 Xerox Corporation Segmentation-based halftoning
US20050058350A1 (en) * 2003-09-15 2005-03-17 Lockheed Martin Corporation System and method for object identification
US7409086B2 (en) * 2003-11-21 2008-08-05 Xerox Corporation Segmentation of image data
US7951083B2 (en) * 2004-02-05 2011-05-31 Siemens Medical Solutions Usa, Inc. Motion analysis improvements for medical diagnostic ultrasound
US7826664B2 (en) * 2004-05-24 2010-11-02 Xerox Corporation Systems and methods for efficient manual windowing operation
US20050265600A1 (en) * 2004-06-01 2005-12-01 Xerox Corporation Systems and methods for adjusting pixel classification using background detection
US7421143B2 (en) * 2004-06-01 2008-09-02 Xerox Corporation Systems and methods for optimal dynamic range adjustment of scanned images
US7272261B2 (en) * 2004-06-04 2007-09-18 Xerox Corporation Method and system for classifying scanned-media
US7424151B2 (en) * 2004-06-04 2008-09-09 Xerox Corporation Method and system for image classification and halftone frequency detection
US20060072819A1 (en) * 2004-10-06 2006-04-06 Kabushiki Kaisha Toshiba Image forming apparatus and method
US7078673B1 (en) * 2004-12-27 2006-07-18 Em Microelectronic-Marin Sa Method and sensing device for motion detection in an optical pointing device, such as an optical mouse
US7822290B2 (en) * 2005-04-28 2010-10-26 Xerox Corporation System and method for processing images with leaky windows
US7787703B2 (en) * 2005-05-11 2010-08-31 Xerox Corporation Method and system for extending binary image data to contone image data
US20060269132A1 (en) * 2005-05-31 2006-11-30 Xerox Corporation Apparatus and method for detecting white areas within windows and selectively merging the detected white areas into the enclosing window
US20060269133A1 (en) * 2005-05-31 2006-11-30 Xerox Corporation Systems and methods for information handling in an image processing system
US20060269142A1 (en) * 2005-05-31 2006-11-30 Xerox Corporation Apparatus and method for subtyping window elements in a document windowing system
US7724955B2 (en) * 2005-05-31 2010-05-25 Xerox Corporation Apparatus and method for auto windowing using multiple white thresholds
US7580569B2 (en) * 2005-11-07 2009-08-25 Xerox Corporation Method and system for generating contone encoded binary print data streams
US7773254B2 (en) * 2005-11-10 2010-08-10 Xerox Corporation Method and system for improved copy quality in a multifunction reprographic system
US7869093B2 (en) * 2005-11-17 2011-01-11 Xerox Corporation Method and system for improved copy quality in a multifunction reprographic system
US7729546B2 (en) * 2005-12-23 2010-06-01 Lexmark International, Inc. Document segmentation for mixed raster content representation
US7742658B2 (en) * 2006-01-26 2010-06-22 Xerox Corporation System and method for boundary artifact elimination in parallel processing of large format images
US7663782B2 (en) 2006-01-26 2010-02-16 Xerox Corporation System and method for high addressable binary image generation using rank ordered error diffusion on pixels within a neighborhood
US7586646B2 (en) * 2006-04-12 2009-09-08 Xerox Corporation System for processing and classifying image data using halftone noise energy distribution
US20080005684A1 (en) * 2006-06-29 2008-01-03 Xerox Corporation Graphical user interface, system and method for independent control of different image types
US20080049238A1 (en) * 2006-08-28 2008-02-28 Xerox Corporation Method and system for automatic window classification in a digital reprographic system
US7352490B1 (en) 2006-09-13 2008-04-01 Xerox Corporation Method and system for generating contone encoded binary print data streams
US7965413B2 (en) 2007-03-29 2011-06-21 Xerox Corporation Method and system for detection of binary halftone frequencies
US8228561B2 (en) * 2007-03-30 2012-07-24 Xerox Corporation Method and system for selective bitmap edge smoothing
US7763876B2 (en) 2007-04-06 2010-07-27 Xerox Corporation Gloss and differential gloss measuring system
US8390877B2 (en) * 2007-05-25 2013-03-05 Xerox Corporation Exportation of scanner's internal image auto-segmentation
US8014560B2 (en) * 2007-05-25 2011-09-06 Xerox Corporation Preserving scanner signature using MRC technology
US8051016B2 (en) * 2007-10-16 2011-11-01 Xerox Corporation System and method of billing for printing service costs by examining the content of a page
US8477367B2 (en) * 2007-10-31 2013-07-02 Xerox Corporation System and method for selectively printing color content of a page with a reduced color gamut and billing based on printed content
US7764893B2 (en) * 2008-01-31 2010-07-27 Xerox Corporation Use of customer documents for gloss measurements
US7755800B2 (en) * 2008-02-05 2010-07-13 Xerox Corporation Estimating an amount of color content in a document
US7903285B2 (en) * 2008-02-05 2011-03-08 Xerox Corporation Estimating an amount of color in a document
US7907305B2 (en) * 2008-02-05 2011-03-15 Xerox Corporation Estimating an amount of color content in a document
US8077358B2 (en) * 2008-04-24 2011-12-13 Xerox Corporation Systems and methods for implementing use of customer documents in maintaining image quality (IQ)/image quality consistency (IQC) of printing devices
US8150106B2 (en) * 2008-04-30 2012-04-03 Xerox Corporation Printer characterization, monitoring and diagnosis using dynamic test patterns generated by sensing and analyzing customer documents
US9460491B2 (en) * 2008-08-25 2016-10-04 Xerox Corporation Method for binary to contone conversion with non-solid edge detection
US8208183B2 (en) * 2008-11-19 2012-06-26 Xerox Corporation Detecting image quality defects by measuring images printed on image bearing surfaces of printing devices
JP5334042B2 (ja) * 2008-11-23 2013-11-06 日本電産サンキョー株式会社 文字列認識方法及び文字列認識装置
US20100131428A1 (en) * 2008-11-24 2010-05-27 Xerox Corporation System and method for personalized price/file size per scan
US8339653B2 (en) * 2009-03-30 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for rendering data based on overlap characteristics
US8339671B2 (en) * 2009-03-30 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for rendering data by partitioning a graphics list
US20100245918A1 (en) * 2009-03-30 2010-09-30 Nguyen Uoc H Methods and Systems for Rendering Data
US8339672B2 (en) * 2009-03-30 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for rendering data using graphic-list partitions and associated rendering processors
US8339670B2 (en) * 2009-03-30 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for rendering data based on graphic-list partitioning
US20100245889A1 (en) * 2009-03-30 2010-09-30 Nguyen Uoc H Methods and Systems for Rendering Data
US8411319B2 (en) * 2009-03-30 2013-04-02 Sharp Laboratories Of America, Inc. Methods and systems for concurrent rendering of graphic-list elements
US8508786B2 (en) * 2009-05-12 2013-08-13 Xerox Corporation System and method of billing for scanning service costs
US8368959B2 (en) * 2009-05-18 2013-02-05 Xerox Corporation Method and system for selective smoothing of halftoned objects using bitmap encoding
US8711419B2 (en) * 2009-12-15 2014-04-29 Xerox Corporation Preserving user applied markings made to a hardcopy original document
US8488181B2 (en) 2010-04-07 2013-07-16 Xerox Corporation Preserving user applied markings made to a hardcopy original document
US9223769B2 (en) 2011-09-21 2015-12-29 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
US8937749B2 (en) 2012-03-09 2015-01-20 Xerox Corporation Integrated color detection and color pixel counting for billing
US8797601B2 (en) 2012-03-22 2014-08-05 Xerox Corporation Method and system for preserving image quality in an economy print mode
US9842281B2 (en) 2014-06-05 2017-12-12 Xerox Corporation System for automated text and halftone segmentation
US9167129B1 (en) * 2014-12-12 2015-10-20 Xerox Corporation Method and apparatus for segmenting image into halftone and non-halftone regions
US9445108B1 (en) 2015-05-26 2016-09-13 International Business Machines Corporation Document compression with neighborhood biased pixel labeling
CN112612914A (zh) * 2020-12-29 2021-04-06 浙江金实乐环境工程有限公司 一种基于深度学习的图片垃圾识别方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3881392T2 (de) * 1988-09-12 1993-10-21 Oce Nederland Bv System und Verfahren für automatische Segmentierung.
US5280367A (en) * 1991-05-28 1994-01-18 Hewlett-Packard Company Automatic separation of text from background in scanned images of complex documents
JP3276985B2 (ja) * 1991-06-27 2002-04-22 ゼロックス・コーポレーション イメージピクセル処理方法
US5285504A (en) * 1991-09-27 1994-02-08 Research Foundation Of The State University Of New York Page segmentation with tilt compensation
US5359673A (en) * 1991-12-27 1994-10-25 Xerox Corporation Method and apparatus for converting bitmap image documents to editable coded data using a standard notation to record document recognition ambiguities

Also Published As

Publication number Publication date
EP0821318A3 (en) 1998-11-04
BR9705229A (pt) 1999-03-30
US6240205B1 (en) 2001-05-29
EP0821318A2 (en) 1998-01-28
CA2205764C (en) 2001-08-21
US5850474A (en) 1998-12-15
CA2205764A1 (en) 1998-01-26

Similar Documents

Publication Publication Date Title
JPH1079026A (ja) イメージデータを区分化し、分類する方法及び装置
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US7046850B2 (en) Image matching
US6674900B1 (en) Method for extracting titles from digital images
US6574375B1 (en) Method for detecting inverted text images on a digital scanning device
US6973213B2 (en) Background-based image segmentation
US5073953A (en) System and method for automatic document segmentation
US4403257A (en) Halftone detection and delineation
US7277191B2 (en) Fast efficient window region coalescing in a two-pass auto-windowing environment
JP2000112997A (ja) 画像をイベントに自動的に分類する方法
CN113256608B (zh) 工件缺陷检测方法和装置
US10460219B2 (en) Generating an object map from a plurality of binary images
US20040161152A1 (en) Automatic natural content detection in video information
CN116935268A (zh) 视频目标检测数据主区域标注方法、装置、设备及介质
US20060269132A1 (en) Apparatus and method for detecting white areas within windows and selectively merging the detected white areas into the enclosing window
CA2319911C (en) Apparatus and method for segmenting and classifying image data
KR102556350B1 (ko) 병변 면적비율 산출 방법 및 그를 위한 장치
Basu et al. Image segmentation by syntactic method
JP4627845B2 (ja) デジタル画像のセグメント化方法及びデジタル画像処理装置
JPS6136874A (ja) 光学文字読取装置における訂正文字処理方法
JPH06259597A (ja) ドキュメントイメージ処理方法並びに文字認識システムおよびドキュメントイメージ処理装置
JPH10124665A (ja) 画像処理方法および画像処理装置
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
CN116935269A (zh) 视频密集目标检测数据标注方法、装置、设备及存储介质
KR100245337B1 (ko) 거리 영상 파일 분류 및 검색 방법 및 장치

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040720

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040720

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20051013