JPH0612523A - 画像用の文字及びストロークサイズ及びスペースの測定 - Google Patents

画像用の文字及びストロークサイズ及びスペースの測定

Info

Publication number
JPH0612523A
JPH0612523A JP4197248A JP19724892A JPH0612523A JP H0612523 A JPH0612523 A JP H0612523A JP 4197248 A JP4197248 A JP 4197248A JP 19724892 A JP19724892 A JP 19724892A JP H0612523 A JPH0612523 A JP H0612523A
Authority
JP
Japan
Prior art keywords
data
image
space
histogram
spacing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4197248A
Other languages
English (en)
Other versions
JP3361124B2 (ja
Inventor
Daniel P Huttenlocher
ダニエル・ピー・フッテンロッハー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH0612523A publication Critical patent/JPH0612523A/ja
Application granted granted Critical
Publication of JP3361124B2 publication Critical patent/JP3361124B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 (修正有) 【目的】画像を区分化せず文字とストロークのサイズ及
びスペースを測定することにより、光学式文字読み取り
装置で語の間のスペースを検出する技術を改良する。 【構成】テキストの行に平行、又は垂直な方向のような
測定方向に延びる線に沿って連結性のある構成要素のエ
ッジ間の間隔を測定する。測定結果は測定方向での連結
性のある構成要素のエッジ間の間隔の配分を示す配分デ
ータを得るために利用される。配分データがストローク
幅、最大文字幅又は高さ、又は文字、語又は行間のスペ
ースのような、画像の連結性のある構成要素のサイズ又
はスペースの尺度を更に示すのに充分な数の間隔が測定
される。

Description

【発明の詳細な説明】
【0001】本発明はテキストを含む画像の分析に関す
る。
【0002】タナカらは米国特許第4,847,912
号明細書において、光学式文字読み取り装置で語の間の
スペースを検出する技術を記載している。図2ないし図
6に図示され、説明されているように、読み取り装置は
各々の印書された線をその高さ方向に始端から終端まで
所定の時間間隔で順次走査する。黒のビット間の連続す
る白のビット数がカウントされる。カウントのヒストグ
ラムは文字間の間隙と、語の間の間隙に対応する2つの
ピークを有している。
【0003】本発明は画像を区分化せずに文字とストロ
ークのサイズ及びスペースを測定することにより、前述
の技術を改良することを課題としている。
【0004】本発明はテキストを含む画像を分析するた
めの画像処理技術を提供するものである。この技術は例
えばテキストの行に平行、又は垂直な方向のような測定
方向に延びる線に沿って連結性のある構成要素のエッジ
間の間隔を測定する。測定結果は測定方向での連結性の
ある構成要素のエッジ間の間隔の配分を示す配分データ
を得るために利用される。配分データがストローク幅、
最大文字幅又は高さ、又は文字、語又は行間のスペース
のような、画像の連結性のある構成要素のサイズ又はス
ペースの尺度を更に示すのに充分な数の間隔が測定され
る。
【0005】本発明の一側面は画像内のテキストの文字
及びストロークのサイズ及びスペースを測定するが、画
像をテキストの行又は文字へと区分化することに起因す
る、文字とストロークの測定における問題点を解消する
技術の発見に基づいたものである。行のスペースが密接
しているか、又は文字が互いにはみ出しているか、連結
性がある場合は、区分化は困難である。区分化の誤りに
よって、測定の誤りが生じ、単一の行又は単一の文字の
測定を行う際に、境界付けボックスの発見のような非効
率的な計算が必要になることがある。更に、文字とスト
ロークのサイズ及びスペースがあらかじめ分かっていれ
ば、区分化は一層効率的に実行可能である。
【0006】この技術は画像を区分化せずに文字とスト
ロークのサイズ及びスペースを測定する。区分化の代わ
りに、この技術は単一又は複数の測定方向に延びる線に
沿って、連結性のある構成要素のエッジ間の間隔を測定
し、測定結果を各測定方向での間隔の配分を示す配分デ
ータを作成するために利用する。各間隔は連結性のある
構成要素、又は連結性のある構成要素間のスペースを跨
いで測定される。間隔は例えば、テキストの行とほぼ平
行な方向、又はテキストの行とほぼ垂直な方向で測定す
ることができる。充分な数の間隔が測定されると、配分
データが測定方向での連結性のある構成要素のサイズ又
はスペースの単一又は複数の尺度を画像用に示す。言い
換えると、画像内の全ての間隔を測定する必要がない。
測定された間隔の配分が画像の間隔の配分とほぼ同一で
あるためには、画像の適当な部分のより少ない数の間隔
を測定するだけで充分である。このような技術は、例え
ば各方向での間隔の関数として測定の配分を示す配分デ
ータを得ることによって実行可能である。配分データは
ヒストグラムの形式をとることができる。例えば、テキ
ストの行が水平に延びる画像では、それぞれ、連結性の
ある構成要素のエッジ間のスペースを跨ぐ水平間隔、連
結性のある構成要素のエッジ間のスペースを跨ぐ垂直間
隔、連結性のある構成要素を跨ぐ水平間隔及び連結性の
ある構成要素を跨ぐ垂直間隔である4つのヒストグラム
を得ることができる。その後、文字とストロークのサイ
ズ及びスペースを示すデータをヒストグラムから得るこ
とができる。
【0007】図1は、テキストを含む画像の文字とスト
ロークの間隔の測定を示す概略図である。
【0008】図2は、画像内の連結性のある構成要素内
の文字とストロークのサイズの測定を示す概略図であ
る。
【0009】図3は、文字又はストロークのサイズ又は
スペースを示す配分データを得るための技術における基
本段階を示すフローチャートである。
【0010】図4は、開始ピクセルから基準に合致する
ピクセルまでの間隔を示す間隔カウントを得るための段
階を示すフローチャートである。
【0011】図5は、図4に示すように測定された間隔
のヒストグラムを得る段階を示すフローチャートであ
る。
【0012】図6は、水平間隔を示すデータを得るため
に図5に示すように作成されたヒストグラムを利用する
段階を示すフローチャートである。
【0013】図7は、垂直間隔を示すデータを得るため
に図5に示すように作成されたヒストグラムを利用する
段階を示すフローチャートである。
【0014】図8は、水平サイズを示すデータを得るた
めに図5に示すように作成されたヒストグラムを利用す
る段階を示すフローチャートである。
【0015】図9は、垂直サイズを示すデータを得るた
めに図5に示すように作成されたヒストグラムを利用す
る段階を示すフローチャートである。
【0016】図10Aは、図6に示すように作成された
ヒストグラムである。図10Bは、図10Aのヒストグ
ラムの平滑化された形態である。
【0017】図11Aは、図7に示すように作成された
ヒストグラムである。図11Bは、図11Aのヒストグ
ラムの平滑化された形態である。
【0018】図12は、図8に示すように作成されたヒ
ストグラムである。
【0019】図13は、図9に示すように作成されたヒ
ストグラムである。
【0020】図14は、図6−図9に示すように属性を
示すデータを作成する際にスキュー・データを利用する
段階を示すフローチャートである。
【0021】図15は、本発明が直列機械で実施される
システムの概略構成図である。
【0022】図16は、本発明が並列機械で実施される
システムの概略構成図である。
【0023】図17は、本発明の実施態様に基づき間隔
測定データを得るための段階を示すフローチャートであ
る。
【0024】図18は、ヒストグラム・データを得るた
めに図17に示すように作成された間隔測定データを利
用する段階を示すフローチャートである。
【0025】図19は、特定の文字又はストロークのサ
イズ又はスペースの属性を示すデータを得るために図1
8に示すように作成されたヒストグラム・データを利用
する段階を示すフローチャートである。
【0026】図20は、コピー機における本発明の応用
を示した概略構成図である。
【0027】図1−図3は本発明の基本的特徴を示して
いる。図1は文字と行の間のスペースを示すデータを得
るために連結性のある構成要素間の間隔が測定される画
像を示している。図2は文字のサイズとストローク幅を
示すデータを得るために連結性のある構成要素を跨いで
測定が行われた画像を示している。図3は連結性のある
構成要素のサイズ又はスペースを示すデータを得る基本
的段階を示すフローチャートである。
【0028】図1は画像内の連結性のある構成要素のス
ペースを測定するために、連結性のある構成要素間で水
平又は垂直に間隔測定を行うことができるテキストの線
を含む画像10を示している。各測定はエッジ基準に合
致する開始位置から開始され、連結性のある構成要素間
のスペースを跨いで、これもエッジ基準に合致する終了
位置まで継続される。
【0029】第1の間隔d1 は開始位置12から開始さ
れ、テキストの行に平行な線に沿って線がエッジと交わ
る位置14まで測定される。第2の間隔d2 は、開始位
置16から開始され、テキストの行に平行な線に沿って
線がエッジと交わる位置18まで測定される。第3の間
隔d3 は、開始位置20から開始され、テキストの行に
垂直な線に沿って線がエッジと交わる位置22まで測定
される。第4の間隔d4 は、開始位置24から開始さ
れ、テキストの行に水平な線に沿って線がエッジと交わ
る位置26まで測定される。第5の間隔d5 は、開始位
置28から開始され、テキストの行に垂直な線に沿って
線がエッジと交わる位置30まで測定される。間隔d1
は文字間のスペースを示し、d2 は語間のスペースを示
し、d3 は行間のスペースを示す。間隔d4 及びd5
文字内部の水平及び垂直スペースをそれぞれ示してい
る。
【0030】図2は文字のサイズを測定するために間隔
の測定を行うことができる連結性のある構成要素40を
示している。各測定はエッジ基準と合致する開始位置か
ら開始され、連結性のある構成要素40を跨いで、これ
もエッジ基準と合致する終了位置まで継続される。水平
及び垂直方向は連結性のある構成要素40を含むテキス
ト行に平行及び垂直であることができる。
【0031】間隔d6 は、開始位置42から開始され、
垂直な線に沿って線がエッジと交わる位置44まで測定
される。間隔d7 は、開始位置46から開始され、線が
エッジと交わる位置44まで水平に測定される。間隔d
8 は、開始位置50から開始され、線がエッジと交わる
位置52まで垂直に測定される。間隔d9 は、開始位置
54から開始され、線がエッジと交わる位置56まで水
平に測定される。間隔d7 は構成要素の幅を示してい
る。間隔d8 は水平ストロークの幅を示し、間隔d9
垂直ストロークの幅を示している。
【0032】図3のフローチャートでは、ボックス70
の段階はテキストの画像内の連結性のある構成要素のエ
ッジ間の一方向の間隔を測定する。ボックス72の段階
は一方向での間隔の配分を示す配分データを得るために
前記間隔を利用する。測定される間隔は配分データが画
像用の連結性のある構成要素のサイズもしくはスペース
を示すのに充分な数である。これは画像内の全てのエッ
ジ位置を測定することによっても実行可能であろうが、
以下に詳述するように、より少ない数のエッジ位置を開
始位置として選択することによって、一層効率よく実行
可能である。開始位置は間隔測定が画像のエッジ位置間
の間隔を表すように選択される。
【0033】図4及び図5のフローチャートは間隔デー
タのヒストグラムを得るために利用可能な方法を示して
いる。図4のフローチャートは開始位置から終了位置ま
での間隔を測定する段階を示している。図5のフローチ
ャートは図4で測定された間隔データをヒストグラム・
データ構造で記憶する段階を示している。
【0034】図4は基準、例えばエッジ基準と合致する
線に沿って一つの位置から最も近接する位置への一方向
の線に沿った間隔を示すデータを得る段階を示してい
る。ボックス80の段階は一つの位置から開始される。
ボックス81の段階は間隔のカウントを開始するために
間隔カウントをリセットする。ボックス82の段階は間
隔カウントを増分する。ボックス84でのテストは間隔
カウントが限度を超えているかどうかを判定する。間隔
の限度は画像の高さと幅、又はその後では重要なデータ
を発見し得ないと思われる任意の長さに基づいて設定可
能であろう。間隔限度を超えていない場合は、ボックス
86の段階が線に沿った次の位置を定義するデータをア
クセスする。次ぎにボックス88の段階がアクセスされ
た位置が基準と合致するかどうかをテストする。
【0035】アクセスされた位置が基準に合致しない場
合は、段階82の段階で別の反復が開始される。この反
復はボックス88で基準と合致する位置が発見される
か、又はボックス84で間隔のカウントが間隔限度を超
えるまで継続される。例えば、基準がエッジ・ピクセル
である場合は、ボックス88の段階は次の位置がエッジ
・ピクセルであるかどうかをテストし、エッジ・ピクセ
ルが発見されるか、間隔限度を超えるまで反復が継続さ
れる。この時点で、ボックス90の段階は間隔のカウン
トに復帰し、このカウントは最も近いエッジ・ピクセル
までの間隔、又は間隔の限度を示す。
【0036】ボックス88の段階は簡単な基準に基づい
てエッジ・ピクセルを発見することができる。例えば、
開始位置が黒のエッジ・ピクセルである場合は、連結性
のある構成要素間の間隔を測定する場合には、次の隣接
していない黒のピクセルがエッジ・ピクセルであり、連
結性のある構成要素を跨ぐ間隔を測定する場合には次の
隣接していない白のピクセルがエッジ・ピクセルであ
る。
【0037】図5は画像内の複数の選択された位置の間
隔データを組み合わせて、前記位置を含む画像の間隔の
ヒストグラムを得るための基本段階を示している。
【0038】ボックス92の段階は一群の位置の各々を
取り扱う反復ループを開始する。次の位置についての間
隔を示すデータはボックス94の段階によって、例えば
開始基準に合致する位置を発見し、次ぎに図4の段階を
介して前記位置からの間隔カウントを得ることによって
得られる。次ぎにボックス96の段階が間隔データによ
って示される間隔を含む範囲にわたって周波数カウント
を増分する。周波数カウントは記憶装置内のデータ構造
内の別の範囲の周波数カウントと共に記憶されることが
できるので、データ構造内の各周波数カウントはそれぞ
れの範囲内でどれほど多くの位置での間隔が測定された
かを示す。充分な数の位置で間隔が測定され終わると、
ボックス98の段階は周波数カウントを利用してヒスト
グラムを得る。そこでヒストグラムは利用されるか、記
憶される。
【0039】図5のループが反復される毎に同じ方向で
間隔が測定され、その結果得られるヒストグラムは画像
の前記方向での間隔の配分を示す。この方向はヒストグ
ラムが画像内の連結性のある構成要素のサイズ又はスペ
ースを示すように選択することができる。測定される属
性に応じて、間隔は異なる方向、例えば文字の幅又は語
の間のスペース用に画像内のテキストの行と平行な方
向、又は文字の高さ又は行間のスペース用にテキストの
行と垂直な方向で測定できる。
【0040】図6−図9のフローチャートは画像内のテ
キストの文字又はストロークのサイズ又はスペースを示
すデータを得るためにヒストグラムを利用する段階を示
している。
【0041】図6のボックス110の段階では図5の段
階に引き続いて、画像内のテキストの行と平行な方向で
の連結性のある構成要素間の間隔のヒストグラムが得ら
れる。この段階は白の背景を持つ黒のテキスト用に、エ
ッジ・ピクセル間の白のピクセルに跨がる間隔を測定す
る。ボックス112の段階は画像用の文字又は語の間の
スペースを示すデータを得るためヒストグラムを利用す
る。
【0042】図7のボックス120の段階では図5の段
階に引き続いて、画像内のテキストの行と垂直な方向で
の連結性のある構成要素間の間隔のヒストグラムが得ら
れる。この段階は白の背景を持つ黒のテキスト用に、エ
ッジ・ピクセル間の白のピクセルに跨がる間隔を測定す
る。ボックス122の段階は画像用の文字又は語の間の
スペースを示すデータを得るためヒストグラムを利用す
る。
【0043】図8のボックス130の段階では図5の段
階に引き続いて、画像内のテキストの行と平行な方向で
の連結性のある構成要素間の間隔のヒストグラムが得ら
れる。この段階は白の背景を持つ黒のテキスト用に、エ
ッジ・ピクセル間の黒のピクセルに跨がる間隔を測定す
る。ボックス132の段階はテキスト内の文字の幅又は
垂直ストロークの幅を示すデータを得るためヒストグラ
ムを利用する。
【0044】図9のボックス140の段階では図5の段
階に引き続いて、画像内のテキストの行と垂直な方向で
の連結性のある構成要素間の間隔のヒストグラムが得ら
れる。この段階は白の背景を持つ黒のテキスト用に、エ
ッジ・ピクセル間の黒のピクセルに跨がる間隔を測定す
る。ボックス142の段階はテキスト内の文字の高さ又
は水平ストロークの幅を示すデータを得るためヒストグ
ラムを利用する。
【0045】図10−図13は白の背景を持つ黒のテキ
ストのテキスト画像用の、図6−図9で説明した方法で
得られた間隔のヒストグラムを示している。
【0046】図19Aは図6に示した段階に引き続いて
得られたニューヨーク字形の画像内のテキストの行に平
行な方向での連結性のある構成要素間の間隔のヒストグ
ラムを示している。水平軸は白の継続の長さであり、垂
直軸は所定の長さの白の継続を有するエッジ・ピクセル
数である。最も一般的な白の継続長さは文字間のスペー
ス間隔と、語間のスペース間隔に出現する。
【0047】図10Bは平滑化された後の図10Aのヒ
ストグラムを示しており、ピークは一層明確である。関
数を平滑化する段階は更に、例えば画像内の文字内のス
ペース、すなわちノイズに起因する偽りピークをも平滑
化する。図10Bでは、およそ7ピクセルの文字間のス
ペース間隔が第1の大きいピーク150によって示さ
れ、語間のスペース間隔はおよそ25ピクセルでそれよ
りも小さいピーク152によって示されている。各ピー
クの幅は字形に左右され、文字間のスペースが相当に変
化する字形の場合は第1のピークは幅広く、文字間のス
ペースが一定である場合は、ピークは狭い。語間のスペ
ースの場合も同様である。
【0048】別のピークが48ピクセルの周辺に示され
ている。このピークは間隔の限度を示しており、これは
画像のそれぞれの側の限界に近いエッジ・ピクセルから
の間隔を測定した結果である場合が多い。
【0049】図11Aは図7に示した段階に引き続いて
得られたニューヨーク字形の画像内のテキストの行に垂
直な方向での、連結性のある構成要素間の間隔のヒスト
グラムを示している。このヒストグラムは文字内の白の
スペース、基本字体よりも上に出る文字及び下に出る文
字の上下のスペース及び行間のスペースを含むテキスト
の一連の特性を把握する。図11Bは平滑化されたヒス
トグラムを示している。第3のピークであるピーク16
0はおよそ25ピクセルでの行間のスペースである。お
よそ7ピクセルでの第1のピーク162は文字内の白の
スペースを示している。およそ13ピクセルでの第2の
ピーク164は基本字体よりも上に出る文字及び下に出
る文字の上下のスペースを示している。
【0050】更に、別のピークが48ピクセルの周辺に
示されている。このピークは間隔限度を示しており、こ
れは画像の上部及び下部での白の限界に近いエッジ・ピ
クセルからの間隔を測定した結果である場合が多い。
【0051】図12は図8に示した段階に引き続いて得
られたニューヨーク字形の画像内のテキストの行に平行
な方向での、連結性のある構成要素を跨ぐ間隔のヒスト
グラムを示している。このヒストグラムは垂直ストロー
クの幅を把握し、ページに文字だけがある場合は、この
ヒストグラムは文字の幅をも把握する。ピーク170は
垂直ストロークの幅を示している。第2ピーク172は
このタイプフェースが色々なストローク幅を用いるため
生じている。アバンギャルドのような一定のストローク
幅を持つタイプフェースは、そのストローク幅において
単一のピークのみを持つ。ヒストグラムは16ピクセル
でゼロに落ちるが、これは文字の最大幅を示している。
【0052】図13は図9に示した段階に引き続いて得
られたニューヨーク字形の画像内のテキストの行に垂直
な方向での、連結性のある構成要素を跨ぐ間隔のヒスト
グラムを示している。このヒストグラムは水平ストロー
クの幅を把握し、ページに文字だけがある場合は、この
ヒストグラムは文字の高さをも把握する。およそ3ピク
セルでのピーク180は画像内の水平ストロークの幅を
示している。ヒストグラムはおよそ25ピクセルにおい
てゼロにまで下がり、文字の最大高さを示す。およそ1
8ピクセルでのピーク182の降下は小文字の文字の高
さを示す。この後者の尺度はヒストグラムから確実に抽
出することは極めて困難である。
【0053】図14のフローチャートはスキューに関す
る情報を利用して画像内のテキストのサイズ及びスペー
ス・データを得る段階を示している。画像のスキューを
考慮に入れなければ、テキストのヒストグラムは文字と
ストロークのサイズ及びスペースの正しい尺度を示すこ
とができない。
【0054】ボックス190の段階は画像内のテキスト
行のスキューを示すスキュー・データを得る段階であ
る。
【0055】ボックス192の段階は画像の連結性のあ
る構成要素のサイズ又はスペースを示す配分データを得
る際にスキュー・データを利用する。これは先ずページ
の向きを修正して画像をデスキューし、又は間隔が測定
された角度をシフトしてスキューを補償することによっ
て行うことができる。ボックス194の段階は図10−
図13に示したように文字又はストロークのサイズ又は
スペースの属性を示すデータを得るために成分データを
利用し、このデータは図6−図9の一つに示したように
得られる。
【0056】図15は本発明が直列の機械で実現される
システム220を示している。プロセッサ222は入力
装置224から入力データを受領し、且つ出力装置22
6に出力データを供給するように接続されている。プロ
セッサ222はワークステーションのCPUであり、入
力装置224及び出力装置226はI/O装置であるこ
とができる。例えば、入力装置224はスキャナ又はデ
ィジタル画像ソースのような画像入力装置であることが
できる。入力装置224は更に周辺記憶装置又はその他
の記憶装置又は伝送媒体へと接続可能であり、それらの
装置から方向関数のような間隔を示すモデル輪郭を受領
することができる。同様にして、出力装置226はプロ
セッサ222から得られたデータ、例えば画像内の方向
関数のような間隔を示す字形又は輪郭を示すデータを記
憶又は伝送媒体へと供給する装置であることができる。
【0057】動作中、プロセッサ222はプログラム・
メモリ228からの命令を実行し、且つデータの読出
し、書き込みのためにデータ・メモリ230をアクセス
する。プログラム・メモリ228はプロセッサ222の
種々の動作用の命令を記憶する。データ・メモリ230
は図示のようなデータ構造を記憶し、更にプロセッサ2
22が動作を行う際に利用する中間データを一時的に記
憶することができる。
【0058】画像データ記憶動作段232は入力装置2
24を介して画像データを受領し、画像データ修正動作
段234は画像データ260を修正する。同様に、画像
データ出力動作段236は画像データ260を出力装置
226へと供給する。
【0059】サイズ獲得動作段238は画像内の文字又
はストロークのサイズ属性を示すデータを獲得し、その
結果をサイズ・データ266としてデータ・メモリ23
0内に記憶することができる。スペース獲得動作段24
0は文字、語又は行の間のスペースのような画像内の文
字又はストロークのスペース属性を示すデータを獲得
し、且つ、その結果をスペース・データ268として記
憶することができる。サイズ獲得動作段238及びスペ
ース獲得動作段240は配分データ264を得るために
配分獲得動作段248を呼出すことができ、その結果は
データ・メモリ230内の配分データ264内に記憶す
ることができる。測定動作段244は画像内の一方向で
の開始位置からの間隔を測定するために配分獲得動作段
242によって呼出し可能であり、その結果は測定デー
タとしてデータ・メモリ230内に記憶することができ
る。
【0060】スキュー獲得動作段246はサイズ又はス
ペース情報を得るために利用できる画像に関するスキュ
ー情報を得るために、サイズ獲得動作段238及びスペ
ース獲得動作段240によって呼出されることができ
る。ランダム位置動作段248は測定動作段244がそ
こから間隔を測定する開始位置を得るために、配分獲得
動作段242によって呼出されることができる。
【0061】データ・メモリ230内の画像データ26
0は画像の各ピクセルの値を示すデータを含んでいる。
画像データ260は画像データ記憶動作段232によっ
て記憶されることができる。測定データ262は連結性
のある構成要素を跨ぐ、又、その間の間隔を記憶し、前
述のように測定動作段244の結果を記憶するためにア
クセスされることができる。
【0062】配分データ264は前述のように配分獲得
動作段242の結果を記憶するためにアクセスされるこ
とができる。サイズ・データ266はサイズ獲得動作段
238によってアクセスされることができ、スペース・
データ268はスペース獲得動作段240によってアク
セスされることができる。
【0063】図16のシステム280は図15のシステ
ム220と類似した並列システムである。システム28
0は入力装置284からデータを受領し、且つ、出力装
置286へとデータを供給するように接続されたホス
ト、プロセッサ282を含んでいる。ホスト・プロセッ
サ282は更にデータを並列プロセッサ290と交換す
るようにも接続され、この並列プロセッサは例えばシン
キング・マシン・コーポレーションの接続機械であるこ
とができよう。並列プロセッサ290は各々が局部記憶
装置292を有する処理装置294を含んでいる。画像
を定義するデータを局部記憶装置292内に記憶するこ
とができるので、各ピクセルの値はそれぞれの処理装置
の局部記憶装置内に記憶される。各処理装置はその局部
記憶装置内の単数又は複数のそれぞれの値を記憶するこ
とができる。ホスト・プロセッサ282はプログラム・
メモリ300からの命令を実行し、図15に関連して前
述したように、画像処理を行う際にデータ・メモリ30
2をアクセスする。ホスト・プロセッサ282は文字又
はストロークのサイズ又はスペースの属性を示す成分デ
ータを獲得するために利用される間隔を得るために、各
ピクセルのそれぞれの処理装置を並行動作させることを
含む動作を実行する。
【0064】図17−19は図15のシステム220に
よって実行可能である動作の実施態様を示している。図
17は画像内の一方向での間隔カウントを作成する動作
を示している。図18は画像内の連結性のある構成要素
のサイズ又はスペースに関する情報を提供する間隔のヒ
ストグラムを作成する動作を示している。図19はヒス
トグラム内のピークと底部とを発見し、文字又はストロ
ークのサイズ又はスペースの所望の属性に対応するピー
クを選択する動作を示している。
【0065】図17は画像内の一つの位置からの間隔を
測定する方法を示している。ボックス310の段階はあ
る位置で開始する。ボックス312の段階は間隔が測定
されている方向に基づくx及びyの双方の方向での増分
を判定し、且つ、間隔カウントd及び方向カウントxx
及びyyをリセットする。
【0066】ボックス314の段階は、カウントxx及
びyyをそれぞれの増分によって増分することにより、
繰り返しループを開始する。ボックス316での段階
は、新たな座標が、画像の境界であるxmax及びym
axの限界を超えないかどうかをチェックする。もしそ
れらが、座標が画像の境界限界を超えることを示してい
れば、ボックス318の段階はゼロ (nil)に戻る。
【0067】もし座標xx及びyyが画像の境界の外側
になければ、ボックス320の段階は、座標xx及びy
yをそれぞれ整数値x及びyに丸める。ボックス322
の段階は画像を規定しているデータ項目のアレイにアク
セスし、また画像内の位置を規定しているデータ項目を
得るために指数〔x,y〕を使用する。
【0068】ボックス324の段階は、間隔カウントd
を増分する。ボックス326の段階は間隔限度に達した
かどうかが点検される。この方法はこの限度が50ピク
セルである間隔でも良好に機能する。間隔限度に達して
いない場合は、ボックス328の段階が、検索されたデ
ータ項目により定義された位置が停止基準に合致するか
どうかを判定する。この基準は実行中の測定においてエ
ッジが出現するピクセルのカラーを示す可変最終値によ
って示されることができる。間隔限度に達しているか、
又はその位置が最終値の値を有している場合は、ボック
ス330の段階が間隔カウントdの値に戻す。それ以外
の場合は、ループは更に反復されるためにボックス31
4に復帰する。
【0069】図18は図17で獲得された間隔データを
利用して画像内の一方向で測定された間隔のヒストグラ
ムを得るための動作を示している。ボックス348の段
階は最終値の値をセットする。この値は測定が黒のピク
セルを跨いで行われるか、白のピクセルを跨いで行われ
るかを判定する。最終値が黒である場合は、黒のエッジ
・ピクセルに遭遇するまで、白のピクセルを跨いで測定
が行われる。逆に、最終値が白である場合は、白のエッ
ジ・ピクセルに遭遇するまで、黒のピクセルを跨いで測
定が行われる。
【0070】ボックス350の段階は一群の位置のそれ
ぞれを処理する反復ループを開始する。この技術は50
00の位置でも良好に機能することが判明している。ボ
ックス354の段階はランダム位置を選択する。ボック
ス356の段階は選択された位置がエッジ・ピクセルで
あるかどうかを点検し、そうではない場合は、ボックス
354に戻って別の位置が選択される。ボックス358
の段階は図17に示した方法を用いて最終値に合致する
ピクセルまでの間隔dを測定する。それそれの間隔測定
は同じ方向で行われる。ボックス360の段階は間隔d
が1よりも大きいかどうかが点検される。そうではない
場合は、現在位置と隣接するピクセルが最終値と合致し
ているので、間隔は測定できない。従って、ループはボ
ックス350に戻り、別の反復ループを開始する。dの
値が1以上である場合は、ボックス362の段階は位置
カウンタを増分し、ボックス364の段階がヒストグラ
ム・データ構造をアクセスし、間隔dを含む間隔の範囲
について周波数カウントを増分する。
【0071】ボックス350の段階により、充分な数の
位置が測定されたものと判定された場合は、ボックス3
52の段階はヒストグラム・データ構造に戻る。このヒ
ストグラム・データ構造は文字又はストロークのサイズ
又はスペースの属性を暗示的に示す配分データである。
【0072】図19は図18で得られたヒストグラムを
利用して、画像内のテキストの特定の文字又はストロー
クのサイズ又はスペースの属性を明示的に示すデータを
得るための動作を示している。ボックス380の段階は
測定がそれを跨いで行われるピクセルの方向とカラーを
決定する定数をセットする。例えば、所望の属性が語間
のスペースである場合は、黒のエッジ・ピクセルに達す
るまで白のピクセルをカウントすることによって、テキ
ストの行と平行に測定が行われる。ボックス382の段
階はボックス380でセットされた定数を用いて、図1
8に示したようにヒストグラムを計算する。
【0073】ボックス384の段階は従来の平滑化技術
を用いてボックス382で得られたヒストグラムの曲線
を平滑化する。この段階によってピークは抽出し易くな
る。この段階で、白のピクセルのヒストグラム用に良好
な結果を得るには因数2又は3の平滑化で充分であるこ
とが判明している。更に、ピークと底部とを確実に抽出
するには、黒のピクセルのヒストグラムは平滑化を必要
としないことも判明している。ボックス386の段階は
ヒストグラム中のピークと底部のリストを収集する。
【0074】ボックス386で得られたリストは所望の
属性に対応するピーク又は底部を選択するために利用で
きよう。例えば、検出されるべき所望の属性が語間のス
ペースである場合は、ヒストグラムはテキストの行と平
行に行われた白のピクセルの測定によって作成される。
平滑化されたヒストグラムの第1のピークは文字間のス
ペースを示し、第2のピークは語間のスペースを示す。
このステップはリスト又はヒストグラムを見ることによ
って手動的に行っても、リストから適宜のピーク又は底
部を自動的に選択する機械を使用して行ってもよい。ピ
ークが自動的に選択される場合は、機械はピークが出現
した間隔に戻ることが可能であろう。
【0075】本発明は多くの態様で応用できよう。一般
に、文字又はストロークのサイズ又はスペースの属性を
示すデータは区分化を用いる任意の画像処理の用途で利
用可能である。図20はコピー機での本発明の用途を示
している。
【0076】図20では、コピー機400はスキャナ4
02と、画像処理システム404と、プリンタ406と
を備えている。スキャナ402は入力文書の画像を定義
するデータを作成可能である。画像処理システム404
は図15又は図16に示したように実現可能であり、文
字及びストロークのサイズ及びスペースの測定に加え
て、文書中の文字を識別するために光学式文字認識技術
を利用することができる。文字及びストロークのサイズ
及びスペース測定は文字認識を向上させるためのページ
の区分化に利用することができる。画像処理システム4
04は変更された画像を定義するデータを作成する技術
をも応用できよう。例えば、文字、又は文字群が選択を
示すように強調、又はその他の方法で示されるならば、
強調、その他の外の境界を判定するために文字の間隔測
定を利用できよう。文字のサイズ及び間隔の測定は更に
印書されたテキスト部分ではない、連結性のある構成要
素を識別することの補助にも利用でき、それによってこ
れらの要素を画像から排除することが可能である。その
後、変更された画像を定義するデータをプリンタ406
に送って、出力文書を印書することが可能であろう。
【0077】これまで、画像内のテキストの文字及びス
トロークのサイズ及びスペースに関する情報を示すデー
タを得るために、画像を定義するデータにおいて動作が
実行される実施態様に関連して本発明を説明してきた。
本発明は更に画像内のテキストの文字及びストロークの
サイズ及びスペースに関する情報を示すデータを直接得
るために光センサと接続された特別な回路においても実
施可能であろう。
【0078】これまで、間隔が無作為に選択された位置
から測定された実施態様に関連して本発明を説明してき
た。その代わりに、間隔測定の開始位置は例えばエッジ
の全てのピクセル又はN番目毎のエッジ・ピクセルのよ
うな別の基準によって選択することもできよう。
【0079】これまで、ヒストグラムを得ることによっ
て配分データが得られる実施態様に関連して本発明を説
明してきた。配分データを得るには、間隔の関数として
周波数を示す技術又は間隔の関数として周波数の中心値
を示す技術のような技術を含む他の技術も利用できよ
う。一般に、配分データは全ての間隔測定が得られた後
で得ることがてき、又は、データ記憶の需要を削減する
ために、間隔測定が得られた時点でそれらを組み合わせ
ることも可能である。
【0080】これまで本発明をソフトウェアの実施態様
で説明してきたが、本発明は専用のハードウェアによっ
ても実施可能であろう。
【図面の簡単な説明】
【図1】 テキストを含む画像の文字とストロークの間
隔の測定を示す概略図である。
【図2】 画像内の連結性のある構成要素内の文字とス
トロークのサイズの測定を示す概略図である。
【図3】 文字又はストロークのサイズ又はスペースを
示す配分データを得るための技術における基本段階を示
すフローチャートである。
【図4】 開始ピクセルから基準に合致するピクセルま
での間隔を示す間隔カウントを得るための段階を示すフ
ローチャートである。
【図5】 図4に示すように測定された間隔のヒストグ
ラムを得る段階を示すフローチャートである。
【図6】 水平間隔を示すデータを得るために図5に示
すように作成されたヒストグラムを利用する段階を示す
フローチャートである。
【図7】 垂直間隔を示すデータを得るために図5に示
すように作成されたヒストグラムを利用する段階を示す
フローチャートである。
【図8】 水平サイズを示すデータを得るために図5に
示すように作成されたヒストグラムを利用する段階を示
すフローチャートである。
【図9】 垂直サイズを示すデータを得るために図5に
示すように作成されたヒストグラムを利用する段階を示
すフローチャートである。
【図10】 Aは図6に示すように作成されたヒストグ
ラムである。Bは図10Aのヒストグラムの平滑化され
た形態である。
【図11】 Aは図7に示すように作成されたヒストグ
ラムである。Bは図11Aのヒストグラムの平滑化され
た形態である。
【図12】 図8に示すように作成されたヒストグラム
である。
【図13】 図9に示すように作成されたヒストグラム
である。
【図14】 図6−図9に示すように属性を示すデータ
を作成する際にスキュー・データを利用する段階を示す
フローチャートである。
【図15】 本発明が直列機械で実施されるシステムの
概略構成図である。
【図16】 本発明が並列機械で実施されるシステムの
概略構成図である。
【図17】 本発明の実施態様に基づき間隔測定データ
を得るための段階を示すフローチャートである。
【図18】 ヒストグラム・データを得るために図17
に示すように作成された間隔測定データを利用する段階
を示すフローチャートである。
【図19】 特定の文字又はストロークのサイズ又はス
ペースの属性を示すデータを得るために図18に示すよ
うに作成されたヒストグラム・データを利用する段階を
示すフローチャートである。
【図20】 コピー機における本発明の応用を示した概
略構成図である。
【符号の説明】
10 画像、12 開始位置、14 線がエッジと交わ
る位置、16 開始位置、18 線がエッジと交わる位
置、20 開始位置、22 線がエッジと交わる位置、
24 開始位置、26 線がエッジと交わる位置、28
開始位置、30線がエッジと交わる位置、40 連結
性のある構成要素、42 開始位置、44 線がエッジ
と交わる位置、46 開始位置、48 線がエッジと交
わる位置、50 開始位置、52 線がエッジと交わる
位置、54 開始位置、56 線がエッジと交わる位
置、150 第1ピーク、152 第2ピーク、160
ピーク、162 第1ピーク、164 第2ピーク、
170 ピーク、172 第2ピーク、180 ピー
ク、182 ピーク、220 システム、222 プロ
セッサ、224 入力装置、226 出力装置、228
プログラム・メモリ、230 データ・メモリ、23
2 画像データ記憶動作段、234 画像データ修正動
作段、236 画像データ出力動作段、238 サイズ
獲得動作段、240 スペース獲得動作段、242 配
分獲得動作段、244 測定動作段、246 スキュー
獲得動作段、248 ランダム位置動作段、260 画
像データ、262 測定データ、264 配分データ、
266 サイズ・データ、268スペース・データ、2
80 システム、282 ホスト・プロセッサ、284
入力装置、286 出力装置、290 並列プロセッ
サ、292 局部記憶装置、300 プログラム・メモ
リ、302 データ・メモリ、400 コピー機、40
2 スキャナ、404 画像処理システム、406 プ
リンタ、d1-d9間隔

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 次のものを含む画像処理装置:テキスト
    を含む画像を定義する画像データを記憶する記憶装置で
    あって、前記画像にはテキストを形成する連結性のある
    構成要素が含まれているもの;および前記記憶装置をア
    クセスするために接続されたプロセッサ、このプロセッ
    サは次のものを含む:画像内の測定方向に延びる線に沿
    って連結性のある構成要素のエッジ間の複数の間隔を測
    定して、各間隔ごとに間隔を示すそれぞれの測定データ
    を得るための測定装置;および測定データを利用して測
    定方向で連結性のある構成要素のエッジ間での間隔の配
    分を示す配分データを獲得する配分装置であって、複数
    の間隔の数は配分データが更に画像用に測定方向での連
    結性のある構成要素のサイズもしくはスペースの尺度を
    表示するのに充分な数であるもの。
JP19724892A 1991-07-30 1992-07-23 テキストを含む2次元画像上での画像処理方法と画像処理装置 Expired - Fee Related JP3361124B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US737955 1985-05-28
US73795591A 1991-07-30 1991-07-30

Publications (2)

Publication Number Publication Date
JPH0612523A true JPH0612523A (ja) 1994-01-21
JP3361124B2 JP3361124B2 (ja) 2003-01-07

Family

ID=24965966

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19724892A Expired - Fee Related JP3361124B2 (ja) 1991-07-30 1992-07-23 テキストを含む2次元画像上での画像処理方法と画像処理装置

Country Status (4)

Country Link
US (1) US5513277A (ja)
EP (1) EP0526196B1 (ja)
JP (1) JP3361124B2 (ja)
DE (1) DE69225541T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4868595A (en) * 1986-02-12 1989-09-19 Minolta Camera Kabushiki Kaisha Photographic camera

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PT604687E (pt) * 1992-12-30 2000-09-29 Koninkl Kpn Nv Metodo para derivar caracteristicas de caracteres num sistema de reconhecimento de caracteres
US5796409A (en) * 1993-04-06 1998-08-18 Ecole Polytechnique Federale De Lausanne Method for producing contrast-controlled grayscale characters
JP2842781B2 (ja) * 1993-12-24 1999-01-06 日本電気株式会社 画像情報処理方式
US5649024A (en) * 1994-11-17 1997-07-15 Xerox Corporation Method for color highlighting of black and white fonts
US5668891A (en) * 1995-01-06 1997-09-16 Xerox Corporation Methods for determining font attributes of characters
JP3366497B2 (ja) * 1995-07-12 2003-01-14 松下電器産業株式会社 部品検出方法
US5638466A (en) * 1995-08-30 1997-06-10 Horizon Marketing Corporation Aka Wordwand Method and apparatus for deskewing images of symbols having a non-linear baseline
EP0767581B1 (en) * 1995-09-29 2002-05-22 Hewlett-Packard Company, A Delaware Corporation Image processing apparatus and method
US5828771A (en) * 1995-12-15 1998-10-27 Xerox Corporation Method and article of manufacture for determining whether a scanned image is an original image or fax image
US5956468A (en) * 1996-07-12 1999-09-21 Seiko Epson Corporation Document segmentation system
FR2756952B1 (fr) * 1996-12-06 1999-06-25 Itesoft Systeme de reconnaissance de caracteres manuscrits
KR100239357B1 (ko) * 1997-04-17 2000-01-15 구자홍 영상 표시 장치의 문자 처리 방법 및 장치
JP3471578B2 (ja) * 1997-08-29 2003-12-02 シャープ株式会社 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
US5995661A (en) * 1997-10-08 1999-11-30 Hewlett-Packard Company Image boundary detection for a scanned image
GB2364417B (en) * 2000-06-30 2004-10-06 Post Office Image processing
US6741745B2 (en) 2000-12-18 2004-05-25 Xerox Corporation Method and apparatus for formatting OCR text
US7333798B2 (en) 2002-08-08 2008-02-19 Value Added Communications, Inc. Telecommunication call management and monitoring system
RU2323470C2 (ru) * 2002-12-18 2008-04-27 Майкрософт Корпорейшн Система и способ автоматического измерения высоты строки, размера и других параметров международного шрифта
US7385606B2 (en) * 2002-12-18 2008-06-10 Microsoft Corporation International font measurement system and method
US7271806B2 (en) * 2002-12-18 2007-09-18 Microsoft Corporation International automatic line height system and method
US20040119714A1 (en) * 2002-12-18 2004-06-24 Microsoft Corporation International automatic font size system and method
US7788258B1 (en) * 2004-06-21 2010-08-31 Google Inc. Automatic determination of whether a document includes an image gallery
NO20052656D0 (no) * 2005-06-02 2005-06-02 Lumex As Geometrisk bildetransformasjon basert pa tekstlinjesoking
US8164762B2 (en) * 2006-09-07 2012-04-24 Xerox Corporation Intelligent text driven document sizing
KR100833346B1 (ko) * 2007-01-03 2008-05-28 (주)폴리다임 디스플레이 장치에 표시된 문자 이미지의 픽셀 단위 가로폭 측정 방법
JP4396757B2 (ja) * 2007-10-22 2010-01-13 ソニー株式会社 ノイズ補正回路、撮像装置及びノイズ補正方法
US8917935B2 (en) * 2008-05-19 2014-12-23 Microsoft Corporation Detecting text using stroke width based text detection
US8320674B2 (en) 2008-09-03 2012-11-27 Sony Corporation Text localization for image and video OCR
WO2011017746A1 (en) * 2009-08-11 2011-02-17 Someones Group Intellectual Property Holdings Pty Ltd Method, system and controller for searching a database
ATE546011T1 (de) * 2009-09-09 2012-03-15 European Central Bank Verfahren zur erzeugung eines sicherheitsbildes auf zwei ebenen für banknoten
US8194983B2 (en) * 2010-05-13 2012-06-05 Hussein Khalid Al-Omari Method and system for preprocessing an image for optical character recognition
US8494284B2 (en) * 2011-11-21 2013-07-23 Nokia Corporation Methods and apparatuses for facilitating detection of text within an image
US9697431B2 (en) 2013-08-16 2017-07-04 Conduent Business Services, Llc Mobile document capture assist for optimized text recognition
US9396404B2 (en) 2014-08-04 2016-07-19 Datalogic ADC, Inc. Robust industrial optical character recognition
US9392127B1 (en) * 2015-01-12 2016-07-12 Xerox Corporation Document production system having automatic adjustment of content to fit the printable area of a pre-printed media
US9798948B2 (en) 2015-07-31 2017-10-24 Datalogic IP Tech, S.r.l. Optical character recognition localization tool
US9563961B1 (en) 2016-01-19 2017-02-07 Xerox Corporation Method and system for image processing
US10685261B2 (en) * 2018-06-11 2020-06-16 GM Global Technology Operations LLC Active segmention of scanned images based on deep reinforcement learning for OCR applications
US11386636B2 (en) 2019-04-04 2022-07-12 Datalogic Usa, Inc. Image preprocessing for optical character recognition
CN110210470B (zh) * 2019-06-05 2023-06-23 复旦大学 商品信息图像识别系统

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL104327C (ja) * 1952-06-28 1900-01-01
NL108567C (ja) * 1956-10-26
US3297989A (en) * 1964-03-23 1967-01-10 Ling Temco Vought Inc Probability transform generator for image recognition
US3873972A (en) * 1971-11-01 1975-03-25 Theodore H Levine Analytic character recognition system
JPS5847064B2 (ja) * 1978-07-08 1983-10-20 工業技術院長 文字読取方式
US4773098A (en) * 1980-05-27 1988-09-20 Texas Instruments Incorporated Method of optical character recognition
US4377803A (en) * 1980-07-02 1983-03-22 International Business Machines Corporation Algorithm for the segmentation of printed fixed pitch documents
DE3480667D1 (de) * 1983-03-01 1990-01-11 Nec Corp System zum bestimmen des zeichenabstandes.
US4610025A (en) * 1984-06-22 1986-09-02 Champollion Incorporated Cryptographic analysis system
US4723297A (en) * 1984-09-27 1988-02-02 Siemens Aktiengesellschaft Method for automatic correction of character skew in the acquisition of a text original in the form of digital scan results
US4887301A (en) * 1985-06-05 1989-12-12 Dest Corporation Proportional spaced text recognition apparatus and method
US5046114A (en) * 1985-10-01 1991-09-03 The Palantir Corporation Method and structure for separating joined patterns for use in pattern and character recognition system
US4773099A (en) * 1985-10-10 1988-09-20 The Palantir Corporation Pattern classification means for use in a pattern recognition system
JPS63158678A (ja) * 1986-12-23 1988-07-01 Sharp Corp 単語間スペ−ス検出方法
US4802230A (en) * 1987-03-13 1989-01-31 Gtx Corporation Method and apparatus for generating size and orientation invariant shape features
US4809344A (en) * 1987-05-11 1989-02-28 Nippon Sheet Glass Co., Ltd. Apparatus for preprocessing of character recognition
US5001766A (en) * 1988-05-16 1991-03-19 At&T Bell Laboratories Apparatus and method for skew control of document images
US4901362A (en) * 1988-08-08 1990-02-13 Raytheon Company Method of recognizing patterns
JP2930612B2 (ja) * 1989-10-05 1999-08-03 株式会社リコー 画像形成装置
US5054094A (en) * 1990-05-07 1991-10-01 Eastman Kodak Company Rotationally impervious feature extraction for optical character recognition
US5216725A (en) * 1990-10-31 1993-06-01 Environmental Research Institute Of Michigan Apparatus and method for separating handwritten characters by line and word
US5245674A (en) * 1991-07-30 1993-09-14 Xerox Corporation Image processing using distance as a function of direction
US5253307A (en) * 1991-07-30 1993-10-12 Xerox Corporation Image analysis to obtain typeface information

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4868595A (en) * 1986-02-12 1989-09-19 Minolta Camera Kabushiki Kaisha Photographic camera
US4868597A (en) * 1986-02-12 1989-09-19 Minolta Camera Kabushiki Kaisha Photographic camera having a piezo-electric actuating element
US4873544A (en) * 1986-02-12 1989-10-10 Minolta Camera Kabushiki Kaisha Photographic camera having a piezo-electric actuating element
US4882602A (en) * 1986-02-12 1989-11-21 Minolta Camera Kabushiki Kaisha Photographic camera having a piezo-electric actuating element

Also Published As

Publication number Publication date
EP0526196A2 (en) 1993-02-03
JP3361124B2 (ja) 2003-01-07
DE69225541D1 (de) 1998-06-25
EP0526196B1 (en) 1998-05-20
EP0526196A3 (ja) 1994-03-23
US5513277A (en) 1996-04-30
DE69225541T2 (de) 1998-11-26

Similar Documents

Publication Publication Date Title
JP3361124B2 (ja) テキストを含む2次元画像上での画像処理方法と画像処理装置
US5245674A (en) Image processing using distance as a function of direction
JP3242158B2 (ja) タイプフェース情報を取得するためのイメージ処理装置および方法
US6741745B2 (en) Method and apparatus for formatting OCR text
US5889886A (en) Method and apparatus for detecting running text in an image
US5784487A (en) System for document layout analysis
JP4101290B2 (ja) 書式処理時の自動ページ登録及び自動領域検出のためのシステム及び方法
US6009196A (en) Method for classifying non-running text in an image
JP3833153B2 (ja) 画像処理方法及び装置
US8515176B1 (en) Identification of text-block frames
US8811751B1 (en) Method and system for correcting projective distortions with elimination steps on multiple levels
US8897600B1 (en) Method and system for determining vanishing point candidates for projective correction
US5416851A (en) Image analysis based on location sampling
JP2003132358A (ja) 画像処理方法、装置およびシステム
EP2321794B1 (en) Method for red-eye detection
US10423851B2 (en) Method, apparatus, and computer-readable medium for processing an image with horizontal and vertical text
US9734132B1 (en) Alignment and reflow of displayed character images
JPH1075351A (ja) テキストのバイナリー画像から抽出されたシンボルを比較する方法
US8913836B1 (en) Method and system for correcting projective distortions using eigenpoints
US5592574A (en) Method and apparatus for expansion of white space in document images on a digital scanning device
US5923782A (en) System for detecting and identifying substantially linear horizontal and vertical lines of engineering drawings
US8064636B2 (en) Image processing apparatus and method of controlling the same
JP6542230B2 (ja) 投影ひずみを補正するための方法及びシステム
US6373997B1 (en) Coarse and fine skew measurement
JP4070486B2 (ja) 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20020208

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020906

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees