JP3361124B2 - テキストを含む2次元画像上での画像処理方法と画像処理装置 - Google Patents
テキストを含む2次元画像上での画像処理方法と画像処理装置Info
- Publication number
- JP3361124B2 JP3361124B2 JP19724892A JP19724892A JP3361124B2 JP 3361124 B2 JP3361124 B2 JP 3361124B2 JP 19724892 A JP19724892 A JP 19724892A JP 19724892 A JP19724892 A JP 19724892A JP 3361124 B2 JP3361124 B2 JP 3361124B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- image
- iteration
- coordinates
- spacing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
【0001】本発明はテキストを含む画像の分析に関す
る。
る。
【0002】タナカらは米国特許第4,847,912
号明細書において、光学式文字読み取り装置で語の間の
スペースを検出する技術を記載している。図2ないし図
6に図示され、説明されているように、読み取り装置は
各々の印書された線をその高さ方向に始端から終端まで
所定の時間間隔で順次走査する。黒のビット間の連続す
る白のビット数がカウントされる。カウントのヒストグ
ラムは文字間の間隙と、語の間の間隙に対応する2つの
ピークを有している。
号明細書において、光学式文字読み取り装置で語の間の
スペースを検出する技術を記載している。図2ないし図
6に図示され、説明されているように、読み取り装置は
各々の印書された線をその高さ方向に始端から終端まで
所定の時間間隔で順次走査する。黒のビット間の連続す
る白のビット数がカウントされる。カウントのヒストグ
ラムは文字間の間隙と、語の間の間隙に対応する2つの
ピークを有している。
【0003】本発明は画像を区分化せずに文字とストロ
ークのサイズ及びスペースを測定することにより、前述
の技術を改良することを課題としている。
ークのサイズ及びスペースを測定することにより、前述
の技術を改良することを課題としている。
【0004】本発明はテキストを含む画像を分析するた
めの画像処理技術を提供するものである。この技術は例
えばテキストの行に平行、又は垂直な方向のような測定
方向に延びる線に沿って連結性のある構成要素のエッジ
間の間隔を測定する。測定結果は測定方向での連結性の
ある構成要素のエッジ間の間隔の分布を示す分布データ
を得るために利用される。充分な数のエッジ間の間隔を
測定し、その測定結果から得られる間隔の分布データ
が、ストローク幅、最大文字幅又は高さ、又は文字、語
又は行間のスペースのような、画像内の連結性のある構
成要素のサイズ又はスペースの分布を示すようにする。
めの画像処理技術を提供するものである。この技術は例
えばテキストの行に平行、又は垂直な方向のような測定
方向に延びる線に沿って連結性のある構成要素のエッジ
間の間隔を測定する。測定結果は測定方向での連結性の
ある構成要素のエッジ間の間隔の分布を示す分布データ
を得るために利用される。充分な数のエッジ間の間隔を
測定し、その測定結果から得られる間隔の分布データ
が、ストローク幅、最大文字幅又は高さ、又は文字、語
又は行間のスペースのような、画像内の連結性のある構
成要素のサイズ又はスペースの分布を示すようにする。
【0005】本発明は、画像内のテキストにおける文字
及びストロークのサイズやスペースを測定するが、画像
をテキストの行又は文字へと区分化することに起因す
る、文字とストロークの測定における問題点を解消する
技術の発見に基づいたものである。行のスペースが密接
しているか、又は文字が互いにはみ出しているか、連結
性がある場合は、区分化は困難である。区分化の誤りに
よって、測定の誤りが生じ、単一の行又は単一の文字の
測定を行う際に、区分付け枠を探し出す必要がある等の
非効率的な計算が必要になることがある。なお、文字と
ストロークのサイズ及びスペースがあらかじめ分かって
いれば、区分化は一層効率的に実行可能である。
及びストロークのサイズやスペースを測定するが、画像
をテキストの行又は文字へと区分化することに起因す
る、文字とストロークの測定における問題点を解消する
技術の発見に基づいたものである。行のスペースが密接
しているか、又は文字が互いにはみ出しているか、連結
性がある場合は、区分化は困難である。区分化の誤りに
よって、測定の誤りが生じ、単一の行又は単一の文字の
測定を行う際に、区分付け枠を探し出す必要がある等の
非効率的な計算が必要になることがある。なお、文字と
ストロークのサイズ及びスペースがあらかじめ分かって
いれば、区分化は一層効率的に実行可能である。
【0006】この技術は画像を区分化せずに文字とスト
ロークのサイズ及びスペースを測定する。区分化の代わ
りに、この技術は単一又は複数の測定方向に延びる線に
沿って、連結性のある構成要素のエッジ間の間隔を測定
し、測定結果を各測定方向での間隔の分布を示す分布デ
ータを作成するために利用する。各間隔は連結性のある
構成要素、又は連結性のある構成要素間のスペースを跨
いで測定される。間隔は例えば、テキストの行とほぼ平
行な方向、又はテキストの行とほぼ垂直な方向で測定す
ることができる。充分な数の間隔が測定されると、分布
データが測定方向での連結性のある構成要素のサイズ又
はスペースの単一又は複数の尺度を画像用に示す。言い
換えると、画像内の全ての間隔を測定する必要がない。
測定された間隔の分布が画像の間隔の分布とほぼ同一で
あるためには、画像の適当な部分のより少ない数の間隔
を測定するだけで充分である。これは、例えば各方向で
の間隔の関数として測定結果(間隔)の分布を示す分布
データを得ることによって実行可能である。分布データ
はヒストグラムの形式をとることができる。例えば、テ
キストの行が水平に延びる画像では、それぞれ、連結性
のある構成要素のエッジ間のスペースを跨ぐ水平間隔、
連結性のある構成要素のエッジ間のスペースを跨ぐ垂直
間隔、連結性のある構成要素を跨ぐ水平間隔及び連結性
のある構成要素を跨ぐ垂直間隔である4つのヒストグラ
ムを得ることができる。その後、文字とストロークのサ
イズ及びスペースを示すデータをヒストグラムから得る
ことができる。
ロークのサイズ及びスペースを測定する。区分化の代わ
りに、この技術は単一又は複数の測定方向に延びる線に
沿って、連結性のある構成要素のエッジ間の間隔を測定
し、測定結果を各測定方向での間隔の分布を示す分布デ
ータを作成するために利用する。各間隔は連結性のある
構成要素、又は連結性のある構成要素間のスペースを跨
いで測定される。間隔は例えば、テキストの行とほぼ平
行な方向、又はテキストの行とほぼ垂直な方向で測定す
ることができる。充分な数の間隔が測定されると、分布
データが測定方向での連結性のある構成要素のサイズ又
はスペースの単一又は複数の尺度を画像用に示す。言い
換えると、画像内の全ての間隔を測定する必要がない。
測定された間隔の分布が画像の間隔の分布とほぼ同一で
あるためには、画像の適当な部分のより少ない数の間隔
を測定するだけで充分である。これは、例えば各方向で
の間隔の関数として測定結果(間隔)の分布を示す分布
データを得ることによって実行可能である。分布データ
はヒストグラムの形式をとることができる。例えば、テ
キストの行が水平に延びる画像では、それぞれ、連結性
のある構成要素のエッジ間のスペースを跨ぐ水平間隔、
連結性のある構成要素のエッジ間のスペースを跨ぐ垂直
間隔、連結性のある構成要素を跨ぐ水平間隔及び連結性
のある構成要素を跨ぐ垂直間隔である4つのヒストグラ
ムを得ることができる。その後、文字とストロークのサ
イズ及びスペースを示すデータをヒストグラムから得る
ことができる。
【0007】図1は、テキストを含む画像の文字とスト
ロークの間隔の測定を示す概略図である。
ロークの間隔の測定を示す概略図である。
【0008】図2は、画像内の連結性のある構成要素内
の文字とストロークのサイズの測定を示す概略図であ
る。
の文字とストロークのサイズの測定を示す概略図であ
る。
【0009】図3は、文字又はストロークのサイズ又は
スペースを示す分布データを得るための技術における基
本段階を示すフローチャートである。
スペースを示す分布データを得るための技術における基
本段階を示すフローチャートである。
【0010】図4は、開始ピクセルから基準に合致する
ピクセルまでの間隔を示す間隔カウントを得るための段
階を示すフローチャートである。
ピクセルまでの間隔を示す間隔カウントを得るための段
階を示すフローチャートである。
【0011】図5は、図4に示すように測定された間隔
のヒストグラムを得る段階を示すフローチャートであ
る。
のヒストグラムを得る段階を示すフローチャートであ
る。
【0012】図6は、水平間隔を示すデータを得るため
に図5に示すように作成されたヒストグラムを利用する
段階を示すフローチャートである。
に図5に示すように作成されたヒストグラムを利用する
段階を示すフローチャートである。
【0013】図7は、垂直間隔を示すデータを得るため
に図5に示すように作成されたヒストグラムを利用する
段階を示すフローチャートである。
に図5に示すように作成されたヒストグラムを利用する
段階を示すフローチャートである。
【0014】図8は、水平サイズを示すデータを得るた
めに図5に示すように作成されたヒストグラムを利用す
る段階を示すフローチャートである。
めに図5に示すように作成されたヒストグラムを利用す
る段階を示すフローチャートである。
【0015】図9は、垂直サイズを示すデータを得るた
めに図5に示すように作成されたヒストグラムを利用す
る段階を示すフローチャートである。
めに図5に示すように作成されたヒストグラムを利用す
る段階を示すフローチャートである。
【0016】図10Aは、図6に示すように作成された
ヒストグラムである。図10Bは、図10Aのヒストグ
ラムの平滑化された形態である。
ヒストグラムである。図10Bは、図10Aのヒストグ
ラムの平滑化された形態である。
【0017】図11Aは、図7に示すように作成された
ヒストグラムである。図11Bは、図11Aのヒストグ
ラムの平滑化された形態である。
ヒストグラムである。図11Bは、図11Aのヒストグ
ラムの平滑化された形態である。
【0018】図12は、図8に示すように作成されたヒ
ストグラムである。
ストグラムである。
【0019】図13は、図9に示すように作成されたヒ
ストグラムである。
ストグラムである。
【0020】図14は、図6−図9に示すように属性を
示すデータを作成する際にスキュー・データを利用する
段階を示すフローチャートである。
示すデータを作成する際にスキュー・データを利用する
段階を示すフローチャートである。
【0021】図15は、本発明が直列機械で実施される
システムの概略構成図である。
システムの概略構成図である。
【0022】図16は、本発明が並列機械で実施される
システムの概略構成図である。
システムの概略構成図である。
【0023】図17は、本発明の実施態様に基づき間隔
測定データを得るための段階を示すフローチャートであ
る。
測定データを得るための段階を示すフローチャートであ
る。
【0024】図18は、ヒストグラム・データを得るた
めに図17に示すように作成された間隔測定データを利
用する段階を示すフローチャートである。
めに図17に示すように作成された間隔測定データを利
用する段階を示すフローチャートである。
【0025】図19は、特定の文字又はストロークのサ
イズ又はスペースの属性を示すデータを得るために図1
8に示すように作成されたヒストグラム・データを利用
する段階を示すフローチャートである。
イズ又はスペースの属性を示すデータを得るために図1
8に示すように作成されたヒストグラム・データを利用
する段階を示すフローチャートである。
【0026】図20は、コピー機における本発明の応用
を示した概略構成図である。
を示した概略構成図である。
【0027】図1−図3は本発明の基本的特徴を示して
いる。図1は文字と行の間のスペースを示すデータを得
るために連結性のある構成要素間の間隔が測定される画
像を示している。図2は文字のサイズとストローク幅を
示すデータを得るために連結性のある構成要素を跨いで
測定が行われた画像を示している。図3は連結性のある
構成要素のサイズ又はスペースを示すデータを得る基本
的段階を示すフローチャートである。
いる。図1は文字と行の間のスペースを示すデータを得
るために連結性のある構成要素間の間隔が測定される画
像を示している。図2は文字のサイズとストローク幅を
示すデータを得るために連結性のある構成要素を跨いで
測定が行われた画像を示している。図3は連結性のある
構成要素のサイズ又はスペースを示すデータを得る基本
的段階を示すフローチャートである。
【0028】図1は画像内の連結性のある構成要素のス
ペースを測定するために、連結性のある構成要素間で水
平又は垂直に間隔測定を行うことができるテキストの線
を含む画像10を示している。各測定はエッジ基準に合
致する開始位置から開始され、連結性のある構成要素間
のスペースを跨いで、これもエッジ基準に合致する終了
位置まで継続される。
ペースを測定するために、連結性のある構成要素間で水
平又は垂直に間隔測定を行うことができるテキストの線
を含む画像10を示している。各測定はエッジ基準に合
致する開始位置から開始され、連結性のある構成要素間
のスペースを跨いで、これもエッジ基準に合致する終了
位置まで継続される。
【0029】第1の間隔d1は開始位置12から開始さ
れ、テキストの行に平行な線に沿って線がエッジと交わ
る位置14まで測定される。第2の間隔d2は、開始位
置16から開始され、テキストの行に平行な線に沿って
線がエッジと交わる位置18まで測定される。第3の間
隔d3は、開始位置20から開始され、テキストの行に
垂直な線に沿って線がエッジと交わる位置22まで測定
される。第4の間隔d4は、開始位置24から開始さ
れ、テキストの行に水平な線に沿って線がエッジと交わ
る位置26まで測定される。第5の間隔d5は、開始位
置28から開始され、テキストの行に垂直な線に沿って
線がエッジと交わる位置30まで測定される。間隔d1
は文字間のスペースを示し、d2は語間のスペースを示
し、d3は行間のスペースを示す。間隔d4及びd5は
文字内部の水平及び垂直スペースをそれぞれ示してい
る。
れ、テキストの行に平行な線に沿って線がエッジと交わ
る位置14まで測定される。第2の間隔d2は、開始位
置16から開始され、テキストの行に平行な線に沿って
線がエッジと交わる位置18まで測定される。第3の間
隔d3は、開始位置20から開始され、テキストの行に
垂直な線に沿って線がエッジと交わる位置22まで測定
される。第4の間隔d4は、開始位置24から開始さ
れ、テキストの行に水平な線に沿って線がエッジと交わ
る位置26まで測定される。第5の間隔d5は、開始位
置28から開始され、テキストの行に垂直な線に沿って
線がエッジと交わる位置30まで測定される。間隔d1
は文字間のスペースを示し、d2は語間のスペースを示
し、d3は行間のスペースを示す。間隔d4及びd5は
文字内部の水平及び垂直スペースをそれぞれ示してい
る。
【0030】図2は文字のサイズを測定するために間隔
の測定を行うことができる連結性のある構成要素40を
示している。各測定はエッジ基準と合致する開始位置か
ら開始され、連結性のある構成要素40を跨いで、これ
もエッジ基準と合致する終了位置まで継続される。水平
及び垂直方向は連結性のある構成要素40を含むテキス
ト行に平行及び垂直であることができる。
の測定を行うことができる連結性のある構成要素40を
示している。各測定はエッジ基準と合致する開始位置か
ら開始され、連結性のある構成要素40を跨いで、これ
もエッジ基準と合致する終了位置まで継続される。水平
及び垂直方向は連結性のある構成要素40を含むテキス
ト行に平行及び垂直であることができる。
【0031】間隔d6は、開始位置42から開始され、
垂直な線に沿って線がエッジと交わる位置44まで測定
される。間隔d7は、開始位置46から開始され、線が
エッジと交わる位置48まで水平に測定される。間隔d
8は、開始位置50から開始され、線がエッジと交わる
位置52まで垂直に測定される。間隔d9は、開始位置
54から開始され、線がエッジと交わる位置56まで水
平に測定される。間隔d7は構成要素の幅を示してい
る。間隔d8は水平ストロークの幅を示し、間隔d9は
垂直ストロークの幅を示している。
垂直な線に沿って線がエッジと交わる位置44まで測定
される。間隔d7は、開始位置46から開始され、線が
エッジと交わる位置48まで水平に測定される。間隔d
8は、開始位置50から開始され、線がエッジと交わる
位置52まで垂直に測定される。間隔d9は、開始位置
54から開始され、線がエッジと交わる位置56まで水
平に測定される。間隔d7は構成要素の幅を示してい
る。間隔d8は水平ストロークの幅を示し、間隔d9は
垂直ストロークの幅を示している。
【0032】図3のフローチャートでは、ボックス70
の段階はテキストの画像内の連結性のある構成要素のエ
ッジ間の一方向の間隔を測定する。ボックス72の段階
は一方向での間隔の分布を示す分布データを得るために
前記間隔を利用する。測定される間隔の数は、分布デー
タが画像内の連結性のある構成要素のサイズもしくはス
ペースの分布を示すのに充分な数である。これは画像内
の全てのエッジ位置を測定することによっても実行可能
であろうが、以下に詳述するように、より少ない数のエ
ッジ位置を開始位置として選択することによって、一層
効率よく実行可能である。開始位置は間隔測定が画像の
エッジ位置間の間隔を表すように選択される。
の段階はテキストの画像内の連結性のある構成要素のエ
ッジ間の一方向の間隔を測定する。ボックス72の段階
は一方向での間隔の分布を示す分布データを得るために
前記間隔を利用する。測定される間隔の数は、分布デー
タが画像内の連結性のある構成要素のサイズもしくはス
ペースの分布を示すのに充分な数である。これは画像内
の全てのエッジ位置を測定することによっても実行可能
であろうが、以下に詳述するように、より少ない数のエ
ッジ位置を開始位置として選択することによって、一層
効率よく実行可能である。開始位置は間隔測定が画像の
エッジ位置間の間隔を表すように選択される。
【0033】図4及び図5のフローチャートは間隔デー
タのヒストグラムを得るために利用可能な方法を示して
いる。図4のフローチャートは開始位置から終了位置ま
での間隔を測定する段階を示している。図5のフローチ
ャートは図4で測定された間隔データをヒストグラム・
データ構造で記憶する段階を示している。
タのヒストグラムを得るために利用可能な方法を示して
いる。図4のフローチャートは開始位置から終了位置ま
での間隔を測定する段階を示している。図5のフローチ
ャートは図4で測定された間隔データをヒストグラム・
データ構造で記憶する段階を示している。
【0034】図4は基準、例えばエッジ基準と合致する
線に沿って一つの位置から最も近接する位置への一方向
の線に沿った間隔を示すデータを得る段階を示してい
る。ボックス80の段階は一つの位置から開始される。
ボックス81の段階は間隔のカウントを開始するために
間隔カウントをリセットする。ボックス82の段階は間
隔カウントを増分する。ボックス84でのテストは間隔
カウントが限度を超えているかどうかを判定する。間隔
の限度は画像の高さと幅、又はその後では重要なデータ
を発見し得ないと思われる任意の長さに基づいて設定可
能であろう。間隔限度を超えていない場合は、ボックス
86の段階が線に沿った次の位置を定義するデータをア
クセスする。次ぎにボックス88の段階がアクセスされ
た位置が基準と合致するかどうかをテストする。
線に沿って一つの位置から最も近接する位置への一方向
の線に沿った間隔を示すデータを得る段階を示してい
る。ボックス80の段階は一つの位置から開始される。
ボックス81の段階は間隔のカウントを開始するために
間隔カウントをリセットする。ボックス82の段階は間
隔カウントを増分する。ボックス84でのテストは間隔
カウントが限度を超えているかどうかを判定する。間隔
の限度は画像の高さと幅、又はその後では重要なデータ
を発見し得ないと思われる任意の長さに基づいて設定可
能であろう。間隔限度を超えていない場合は、ボックス
86の段階が線に沿った次の位置を定義するデータをア
クセスする。次ぎにボックス88の段階がアクセスされ
た位置が基準と合致するかどうかをテストする。
【0035】アクセスされた位置が基準に合致しない場
合は、段階82の段階で別の反復が開始される。この反
復はボックス88で基準と合致する位置が発見される
か、又はボックス84で間隔のカウントが間隔限度を超
えるまで継続される。例えば、基準がエッジ・ピクセル
である場合は、ボックス88の段階は次の位置がエッジ
・ピクセルであるかどうかをテストし、エッジ・ピクセ
ルが発見されるか、間隔限度を超えるまで反復が継続さ
れる。そして、ボックス90の段階で計測された間隔の
カウントのデータを返す。このカウントは最も近いエッ
ジ・ピクセルまでの間隔、又は間隔の限度を示す。
合は、段階82の段階で別の反復が開始される。この反
復はボックス88で基準と合致する位置が発見される
か、又はボックス84で間隔のカウントが間隔限度を超
えるまで継続される。例えば、基準がエッジ・ピクセル
である場合は、ボックス88の段階は次の位置がエッジ
・ピクセルであるかどうかをテストし、エッジ・ピクセ
ルが発見されるか、間隔限度を超えるまで反復が継続さ
れる。そして、ボックス90の段階で計測された間隔の
カウントのデータを返す。このカウントは最も近いエッ
ジ・ピクセルまでの間隔、又は間隔の限度を示す。
【0036】ボックス88の段階は簡単な基準に基づい
てエッジ・ピクセルを発見することができる。例えば、
開始位置が黒のエッジ・ピクセルである場合は、連結性
のある構成要素間の間隔を測定する場合には、次の隣接
していない黒のピクセルがエッジ・ピクセルであり、連
結性のある構成要素を跨ぐ間隔を測定する場合には次の
隣接していない白のピクセルがエッジ・ピクセルであ
る。
てエッジ・ピクセルを発見することができる。例えば、
開始位置が黒のエッジ・ピクセルである場合は、連結性
のある構成要素間の間隔を測定する場合には、次の隣接
していない黒のピクセルがエッジ・ピクセルであり、連
結性のある構成要素を跨ぐ間隔を測定する場合には次の
隣接していない白のピクセルがエッジ・ピクセルであ
る。
【0037】図5は画像内の複数の選択された位置の間
隔データを組み合わせて、前記位置を含む画像の間隔の
ヒストグラムを得るための基本段階を示している。
隔データを組み合わせて、前記位置を含む画像の間隔の
ヒストグラムを得るための基本段階を示している。
【0038】ボックス92の段階は一群の位置の各々を
取り扱う反復ループを開始する。次の位置についての間
隔を示すデータはボックス94の段階によって、例えば
開始基準に合致する位置を発見し、次ぎに図4の段階を
介して前記位置からの間隔カウントを得ることによって
得られる。次ぎにボックス96の段階が間隔データによ
って示される間隔を含む領域において度数カウントを増
分する。度数カウントは記憶装置内のデータ構造内の別
の領域の度数カウントと共に記憶されることができるの
で、データ構造内の各度数カウントはそれぞれの領域内
でどれほど多くの位置での間隔が測定されたかを示す。
充分な数の位置で間隔が測定され終わると、ボックス9
8の段階は度数カウントを利用してヒストグラムを得
る。そこでヒストグラムは利用されるか、記憶される。
取り扱う反復ループを開始する。次の位置についての間
隔を示すデータはボックス94の段階によって、例えば
開始基準に合致する位置を発見し、次ぎに図4の段階を
介して前記位置からの間隔カウントを得ることによって
得られる。次ぎにボックス96の段階が間隔データによ
って示される間隔を含む領域において度数カウントを増
分する。度数カウントは記憶装置内のデータ構造内の別
の領域の度数カウントと共に記憶されることができるの
で、データ構造内の各度数カウントはそれぞれの領域内
でどれほど多くの位置での間隔が測定されたかを示す。
充分な数の位置で間隔が測定され終わると、ボックス9
8の段階は度数カウントを利用してヒストグラムを得
る。そこでヒストグラムは利用されるか、記憶される。
【0039】図5のループが反復される毎に同じ方向で
間隔が測定され、その結果得られるヒストグラムは画像
の前記方向での間隔の分布を示す。この方向はヒストグ
ラムが画像内の連結性のある構成要素のサイズ又はスペ
ースを示すように選択することができる。測定される属
性に応じて、間隔は異なる方向、例えば文字の幅又は語
の間のスペース用に画像内のテキストの行と平行な方
向、又は文字の高さ又は行間のスペース用にテキストの
行と垂直な方向で測定できる。
間隔が測定され、その結果得られるヒストグラムは画像
の前記方向での間隔の分布を示す。この方向はヒストグ
ラムが画像内の連結性のある構成要素のサイズ又はスペ
ースを示すように選択することができる。測定される属
性に応じて、間隔は異なる方向、例えば文字の幅又は語
の間のスペース用に画像内のテキストの行と平行な方
向、又は文字の高さ又は行間のスペース用にテキストの
行と垂直な方向で測定できる。
【0040】図6−図9のフローチャートは画像内のテ
キストの文字又はストロークのサイズ又はスペースを示
すデータを得るためにヒストグラムを利用する段階を示
している。
キストの文字又はストロークのサイズ又はスペースを示
すデータを得るためにヒストグラムを利用する段階を示
している。
【0041】図6のボックス110の段階では図5の段
階に引き続いて、画像内のテキストの行と平行な方向で
の連結性のある構成要素間の間隔のヒストグラムが得ら
れる。この段階は白の背景を持つ黒のテキスト用に、エ
ッジ・ピクセル間の白のピクセルに跨がる間隔を測定す
る。ボックス112の段階は画像用の文字又は語の間隔
を示すデータを得るためヒストグラムを利用する。
階に引き続いて、画像内のテキストの行と平行な方向で
の連結性のある構成要素間の間隔のヒストグラムが得ら
れる。この段階は白の背景を持つ黒のテキスト用に、エ
ッジ・ピクセル間の白のピクセルに跨がる間隔を測定す
る。ボックス112の段階は画像用の文字又は語の間隔
を示すデータを得るためヒストグラムを利用する。
【0042】図7のボックス120の段階では図5の段
階に引き続いて、画像内のテキストの行と垂直な方向で
の連結性のある構成要素間の間隔のヒストグラムが得ら
れる。この段階は白の背景を持つ黒のテキスト用に、エ
ッジ・ピクセル間の白のピクセルに跨がる間隔を測定す
る。ボックス122の段階は画像用のテキストの行又は
文字内の間隔を示すデータを得るためヒストグラムを利
用する。
階に引き続いて、画像内のテキストの行と垂直な方向で
の連結性のある構成要素間の間隔のヒストグラムが得ら
れる。この段階は白の背景を持つ黒のテキスト用に、エ
ッジ・ピクセル間の白のピクセルに跨がる間隔を測定す
る。ボックス122の段階は画像用のテキストの行又は
文字内の間隔を示すデータを得るためヒストグラムを利
用する。
【0043】図8のボックス130の段階では図5の段
階に引き続いて、画像内のテキストの行と平行な方向で
の連結性のある構成要素間の間隔のヒストグラムが得ら
れる。この段階は白の背景を持つ黒のテキスト用に、エ
ッジ・ピクセル間の黒のピクセルに跨がる間隔を測定す
る。ボックス132の段階はテキスト内の文字の幅又は
垂直ストロークの幅を示すデータを得るためヒストグラ
ムを利用する。
階に引き続いて、画像内のテキストの行と平行な方向で
の連結性のある構成要素間の間隔のヒストグラムが得ら
れる。この段階は白の背景を持つ黒のテキスト用に、エ
ッジ・ピクセル間の黒のピクセルに跨がる間隔を測定す
る。ボックス132の段階はテキスト内の文字の幅又は
垂直ストロークの幅を示すデータを得るためヒストグラ
ムを利用する。
【0044】図9のボックス140の段階では図5の段
階に引き続いて、画像内のテキストの行と垂直な方向で
の連結性のある構成要素間の間隔のヒストグラムが得ら
れる。この段階は白の背景を持つ黒のテキスト用に、エ
ッジ・ピクセル間の黒のピクセルに跨がる間隔を測定す
る。ボックス142の段階はテキスト内の文字の高さ又
は水平ストロークの幅を示すデータを得るためヒストグ
ラムを利用する。
階に引き続いて、画像内のテキストの行と垂直な方向で
の連結性のある構成要素間の間隔のヒストグラムが得ら
れる。この段階は白の背景を持つ黒のテキスト用に、エ
ッジ・ピクセル間の黒のピクセルに跨がる間隔を測定す
る。ボックス142の段階はテキスト内の文字の高さ又
は水平ストロークの幅を示すデータを得るためヒストグ
ラムを利用する。
【0045】図10−図13は白の背景を持つ黒のテキ
ストのテキスト画像用の、図6−図9で説明した方法で
得られた間隔のヒストグラムを示している。
ストのテキスト画像用の、図6−図9で説明した方法で
得られた間隔のヒストグラムを示している。
【0046】図10Aは図6に示した段階に引き続いて
得られたニューヨーク字形の画像内のテキストの行に平
行な方向での連結性のある構成要素間の間隔のヒストグ
ラムを示している。水平軸は白の継続の長さであり、垂
直軸は所定の長さの白の継続を有するエッジ・ピクセル
数である。最も一般的な白の継続長さは文字間のスペー
ス間隔と、語間のスペース間隔に出現する。
得られたニューヨーク字形の画像内のテキストの行に平
行な方向での連結性のある構成要素間の間隔のヒストグ
ラムを示している。水平軸は白の継続の長さであり、垂
直軸は所定の長さの白の継続を有するエッジ・ピクセル
数である。最も一般的な白の継続長さは文字間のスペー
ス間隔と、語間のスペース間隔に出現する。
【0047】図10Bは平滑化された後の図10Aのヒ
ストグラムを示しており、ピークは一層明確である。関
数を平滑化する段階は更に、例えば画像内の文字内のス
ペース、又はノイズに起因する偽りピークをも平滑化す
る。図10Bでは、およそ7ピクセルの文字間のスペー
ス間隔が第1の大きいピーク150によって示され、語
間のスペース間隔はおよそ25ピクセルでそれよりも小
さいピーク152によって示されている。各ピークの幅
は字形に左右され、文字間のスペースが相当に変化する
字形の場合は第1のピークは幅広く、文字間のスペース
が一定である場合は、ピークは狭い。語間のスペースの
場合も同様である。
ストグラムを示しており、ピークは一層明確である。関
数を平滑化する段階は更に、例えば画像内の文字内のス
ペース、又はノイズに起因する偽りピークをも平滑化す
る。図10Bでは、およそ7ピクセルの文字間のスペー
ス間隔が第1の大きいピーク150によって示され、語
間のスペース間隔はおよそ25ピクセルでそれよりも小
さいピーク152によって示されている。各ピークの幅
は字形に左右され、文字間のスペースが相当に変化する
字形の場合は第1のピークは幅広く、文字間のスペース
が一定である場合は、ピークは狭い。語間のスペースの
場合も同様である。
【0048】別のピークが48ピクセルの周辺に示され
ている。このピークは間隔の限度を示しており、これは
画像のそれぞれの側の限界に近いエッジ・ピクセルから
の間隔を測定した結果である場合が多い。
ている。このピークは間隔の限度を示しており、これは
画像のそれぞれの側の限界に近いエッジ・ピクセルから
の間隔を測定した結果である場合が多い。
【0049】図11Aは図7に示した段階に引き続いて
得られたニューヨーク字形の画像内のテキストの行に垂
直な方向での、連結性のある構成要素間の間隔のヒスト
グラムを示している。このヒストグラムは文字内の白の
スペース、基本字体よりも上に出る文字及び下に出る文
字の上下のスペース及び行間のスペースを含むテキスト
の一連の特性を把握する。図11Bは平滑化されたヒス
トグラムを示している。第3のピークであるピーク16
0はおよそ25ピクセルでの行間のスペースである。お
よそ7ピクセルでの第1のピーク162は文字内の白の
スペースを示している。およそ13ピクセルでの第2の
ピーク164は基本字体よりも上に出る文字及び下に出
る文字の上下のスペースを示している。
得られたニューヨーク字形の画像内のテキストの行に垂
直な方向での、連結性のある構成要素間の間隔のヒスト
グラムを示している。このヒストグラムは文字内の白の
スペース、基本字体よりも上に出る文字及び下に出る文
字の上下のスペース及び行間のスペースを含むテキスト
の一連の特性を把握する。図11Bは平滑化されたヒス
トグラムを示している。第3のピークであるピーク16
0はおよそ25ピクセルでの行間のスペースである。お
よそ7ピクセルでの第1のピーク162は文字内の白の
スペースを示している。およそ13ピクセルでの第2の
ピーク164は基本字体よりも上に出る文字及び下に出
る文字の上下のスペースを示している。
【0050】更に、別のピークが48ピクセルの周辺に
示されている。このピークは間隔限度を示しており、こ
れは画像の上部及び下部での白の限界に近いエッジ・ピ
クセルからの間隔を測定した結果である場合が多い。
示されている。このピークは間隔限度を示しており、こ
れは画像の上部及び下部での白の限界に近いエッジ・ピ
クセルからの間隔を測定した結果である場合が多い。
【0051】図12は図8に示した段階に引き続いて得
られたニューヨーク字形の画像内のテキストの行に平行
な方向での、連結性のある構成要素を跨ぐ間隔のヒスト
グラムを示している。このヒストグラムは垂直ストロー
クの幅を把握し、ページに文字だけがある場合は、この
ヒストグラムは文字の幅をも把握する。ピーク170は
垂直ストロークの幅を示している。第2ピーク172は
このタイプフェースが色々なストローク幅を用いるため
生じている。アバンギャルドのような一定のストローク
幅を持つタイプフェースは、そのストローク幅において
単一のピークのみを持つ。ヒストグラムは16ピクセル
でゼロに落ちるが、これは文字の最大幅を示している。
られたニューヨーク字形の画像内のテキストの行に平行
な方向での、連結性のある構成要素を跨ぐ間隔のヒスト
グラムを示している。このヒストグラムは垂直ストロー
クの幅を把握し、ページに文字だけがある場合は、この
ヒストグラムは文字の幅をも把握する。ピーク170は
垂直ストロークの幅を示している。第2ピーク172は
このタイプフェースが色々なストローク幅を用いるため
生じている。アバンギャルドのような一定のストローク
幅を持つタイプフェースは、そのストローク幅において
単一のピークのみを持つ。ヒストグラムは16ピクセル
でゼロに落ちるが、これは文字の最大幅を示している。
【0052】図13は図9に示した段階に引き続いて得
られたニューヨーク字形の画像内のテキストの行に垂直
な方向での、連結性のある構成要素を跨ぐ間隔のヒスト
グラムを示している。このヒストグラムは水平ストロー
クの幅を把握し、ページに文字だけがある場合は、この
ヒストグラムは文字の高さをも把握する。およそ3ピク
セルでのピーク180は画像内の水平ストロークの幅を
示している。ヒストグラムはおよそ25ピクセルにおい
てゼロにまで下がり、文字の最大高さを示す。およそ1
8ピクセルでのピーク182の降下は小文字の文字の高
さを示す。この後者の尺度はヒストグラムから確実に抽
出することは極めて困難である。
られたニューヨーク字形の画像内のテキストの行に垂直
な方向での、連結性のある構成要素を跨ぐ間隔のヒスト
グラムを示している。このヒストグラムは水平ストロー
クの幅を把握し、ページに文字だけがある場合は、この
ヒストグラムは文字の高さをも把握する。およそ3ピク
セルでのピーク180は画像内の水平ストロークの幅を
示している。ヒストグラムはおよそ25ピクセルにおい
てゼロにまで下がり、文字の最大高さを示す。およそ1
8ピクセルでのピーク182の降下は小文字の文字の高
さを示す。この後者の尺度はヒストグラムから確実に抽
出することは極めて困難である。
【0053】図14のフローチャートはスキューに関す
る情報を利用して画像内のテキストのサイズ及びスペー
ス・データを得る段階を示している。画像のスキューを
考慮に入れなければ、テキストのヒストグラムは文字と
ストロークのサイズ及びスペースの正しい尺度を示すこ
とができない。
る情報を利用して画像内のテキストのサイズ及びスペー
ス・データを得る段階を示している。画像のスキューを
考慮に入れなければ、テキストのヒストグラムは文字と
ストロークのサイズ及びスペースの正しい尺度を示すこ
とができない。
【0054】ボックス190の段階は画像内のテキスト
行のスキューを示すスキュー・データを得る段階であ
る。
行のスキューを示すスキュー・データを得る段階であ
る。
【0055】ボックス192の段階は画像の連結性のあ
る構成要素のサイズ又はスペースを示す分布データを得
る際にスキュー・データを利用する。これは先ずページ
の向きを修正して画像をデスキューし、又は間隔が測定
された角度をシフトしてスキューを補償することによっ
て行うことができる。ボックス194の段階は図10−
図13に示したように文字又はストロークのサイズ又は
スペースの属性を示すデータを得るために成分データを
利用し、このデータは図6−図9の一つに示したように
得られる。
る構成要素のサイズ又はスペースを示す分布データを得
る際にスキュー・データを利用する。これは先ずページ
の向きを修正して画像をデスキューし、又は間隔が測定
された角度をシフトしてスキューを補償することによっ
て行うことができる。ボックス194の段階は図10−
図13に示したように文字又はストロークのサイズ又は
スペースの属性を示すデータを得るために成分データを
利用し、このデータは図6−図9の一つに示したように
得られる。
【0056】図15は本発明が直列の機械で実現される
システム220を示している。プロセッサ222は入力
装置224から入力データを受領し、且つ出力装置22
6に出力データを供給するように接続されている。プロ
セッサ222はワークステーションのCPUであり、入
力装置224及び出力装置226はI/O装置であるこ
とができる。例えば、入力装置224はスキャナ又はデ
ィジタル画像ソースのような画像入力装置であることが
できる。入力装置224は更に周辺記憶装置又はその他
の記憶装置又は伝送媒体へと接続可能であり、それらの
装置からモデル輪郭のデータを受領することができる。
このモデル輪郭を示すデータは、方向の関数として間隔
を示しているものである。同様にして、出力装置226
はプロセッサ222から得られたデータ、例えば字形又
は輪郭を示すデータを記憶又は伝送媒体へと供給する装
置であることができる。上記の字形又は輪郭を示すデー
タは、画像内の方向の関数として間隔を示しているもの
である。
システム220を示している。プロセッサ222は入力
装置224から入力データを受領し、且つ出力装置22
6に出力データを供給するように接続されている。プロ
セッサ222はワークステーションのCPUであり、入
力装置224及び出力装置226はI/O装置であるこ
とができる。例えば、入力装置224はスキャナ又はデ
ィジタル画像ソースのような画像入力装置であることが
できる。入力装置224は更に周辺記憶装置又はその他
の記憶装置又は伝送媒体へと接続可能であり、それらの
装置からモデル輪郭のデータを受領することができる。
このモデル輪郭を示すデータは、方向の関数として間隔
を示しているものである。同様にして、出力装置226
はプロセッサ222から得られたデータ、例えば字形又
は輪郭を示すデータを記憶又は伝送媒体へと供給する装
置であることができる。上記の字形又は輪郭を示すデー
タは、画像内の方向の関数として間隔を示しているもの
である。
【0057】動作中、プロセッサ222はプログラム・
メモリ228からの命令を実行し、且つデータの読出
し、書き込みのためにデータ・メモリ230をアクセス
する。プログラム・メモリ228はプロセッサ222の
種々の動作用の命令を記憶する。データ・メモリ230
は図示のようなデータ構造を記憶し、更にプロセッサ2
22が動作を行う際に利用する中間データを一時的に記
憶することができる。
メモリ228からの命令を実行し、且つデータの読出
し、書き込みのためにデータ・メモリ230をアクセス
する。プログラム・メモリ228はプロセッサ222の
種々の動作用の命令を記憶する。データ・メモリ230
は図示のようなデータ構造を記憶し、更にプロセッサ2
22が動作を行う際に利用する中間データを一時的に記
憶することができる。
【0058】画像データ記憶動作段232は入力装置2
24を介して画像データを受領し、画像データ修正動作
段234は画像データ260を修正する。同様に、画像
データ出力動作段236は画像データ260を出力装置
226へと供給する。
24を介して画像データを受領し、画像データ修正動作
段234は画像データ260を修正する。同様に、画像
データ出力動作段236は画像データ260を出力装置
226へと供給する。
【0059】サイズ獲得動作段238は画像内の文字又
はストロークのサイズ属性を示すデータを獲得し、その
結果をサイズ・データ266としてデータ・メモリ23
0内に記憶することができる。スペース獲得動作段24
0は文字、語又は行の間のスペースのような画像内の文
字又はストロークのスペース属性を示すデータを獲得
し、且つ、その結果をスペース・データ268として記
憶することができる。サイズ獲得動作段238及びスペ
ース獲得動作段240は分布データ264を得るために
分布獲得動作段248を呼出すことができ、その結果は
データ・メモリ230内の分布データ264内に記憶す
ることができる。測定動作段244は画像内の一方向で
の開始位置からの間隔を測定するために分布獲得動作段
242によって呼出し可能であり、その結果は測定デー
タとしてデータ・メモリ230内に記憶することができ
る。
はストロークのサイズ属性を示すデータを獲得し、その
結果をサイズ・データ266としてデータ・メモリ23
0内に記憶することができる。スペース獲得動作段24
0は文字、語又は行の間のスペースのような画像内の文
字又はストロークのスペース属性を示すデータを獲得
し、且つ、その結果をスペース・データ268として記
憶することができる。サイズ獲得動作段238及びスペ
ース獲得動作段240は分布データ264を得るために
分布獲得動作段248を呼出すことができ、その結果は
データ・メモリ230内の分布データ264内に記憶す
ることができる。測定動作段244は画像内の一方向で
の開始位置からの間隔を測定するために分布獲得動作段
242によって呼出し可能であり、その結果は測定デー
タとしてデータ・メモリ230内に記憶することができ
る。
【0060】スキュー獲得動作段246はサイズ又はス
ペース情報を得るために利用できる画像に関するスキュ
ー情報を得るために、サイズ獲得動作段238及びスペ
ース獲得動作段240によって呼出されることができ
る。ランダム位置動作段248は測定動作段244がそ
こから間隔を測定する開始位置を得るために、分布獲得
動作段242によって呼出されることができる。
ペース情報を得るために利用できる画像に関するスキュ
ー情報を得るために、サイズ獲得動作段238及びスペ
ース獲得動作段240によって呼出されることができ
る。ランダム位置動作段248は測定動作段244がそ
こから間隔を測定する開始位置を得るために、分布獲得
動作段242によって呼出されることができる。
【0061】データ・メモリ230内の画像データ26
0は画像の各ピクセルの値を示すデータを含んでいる。
画像データ260は画像データ記憶動作段232によっ
て記憶されることができる。測定データ262は連結性
のある構成要素を跨ぐ、又、その間の間隔を記憶し、前
述のように測定動作段244の結果を記憶するためにア
クセスされることができる。
0は画像の各ピクセルの値を示すデータを含んでいる。
画像データ260は画像データ記憶動作段232によっ
て記憶されることができる。測定データ262は連結性
のある構成要素を跨ぐ、又、その間の間隔を記憶し、前
述のように測定動作段244の結果を記憶するためにア
クセスされることができる。
【0062】分布データ264は前述のように分布獲得
動作段242の結果を記憶するためにアクセスされるこ
とができる。サイズ・データ266はサイズ獲得動作段
238によってアクセスされることができ、スペース・
データ268はスペース獲得動作段240によってアク
セスされることができる。
動作段242の結果を記憶するためにアクセスされるこ
とができる。サイズ・データ266はサイズ獲得動作段
238によってアクセスされることができ、スペース・
データ268はスペース獲得動作段240によってアク
セスされることができる。
【0063】図16のシステム280は図15のシステ
ム220と類似した並列システムである。システム28
0は入力装置284からデータを受領し、且つ、出力装
置286へとデータを供給するように接続されたホス
ト、プロセッサ282を含んでいる。ホスト・プロセッ
サ282は更にデータを並列プロセッサ290と交換す
るようにも接続され、この並列プロセッサは例えばシン
キング・マシン・コーポレーションの接続機械であるこ
とができよう。並列プロセッサ290は各々が局部記憶
装置292を有する処理装置294を含んでいる。画像
を定義するデータを局部記憶装置292内に記憶するこ
とができるので、各ピクセルの値はそれぞれの処理装置
の局部記憶装置内に記憶される。各処理装置はその局部
記憶装置内の単数又は複数のそれぞれの値を記憶するこ
とができる。ホスト・プロセッサ282はプログラム・
メモリ300からの命令を実行し、図15に関連して前
述したように、画像処理を行う際にデータ・メモリ30
2をアクセスする。ホスト・プロセッサ282は文字又
はストロークのサイズ又はスペースの属性を示す成分デ
ータを獲得するために利用される間隔を得るために、各
ピクセルのそれぞれの処理装置を並行動作させることを
含む動作を実行する。
ム220と類似した並列システムである。システム28
0は入力装置284からデータを受領し、且つ、出力装
置286へとデータを供給するように接続されたホス
ト、プロセッサ282を含んでいる。ホスト・プロセッ
サ282は更にデータを並列プロセッサ290と交換す
るようにも接続され、この並列プロセッサは例えばシン
キング・マシン・コーポレーションの接続機械であるこ
とができよう。並列プロセッサ290は各々が局部記憶
装置292を有する処理装置294を含んでいる。画像
を定義するデータを局部記憶装置292内に記憶するこ
とができるので、各ピクセルの値はそれぞれの処理装置
の局部記憶装置内に記憶される。各処理装置はその局部
記憶装置内の単数又は複数のそれぞれの値を記憶するこ
とができる。ホスト・プロセッサ282はプログラム・
メモリ300からの命令を実行し、図15に関連して前
述したように、画像処理を行う際にデータ・メモリ30
2をアクセスする。ホスト・プロセッサ282は文字又
はストロークのサイズ又はスペースの属性を示す成分デ
ータを獲得するために利用される間隔を得るために、各
ピクセルのそれぞれの処理装置を並行動作させることを
含む動作を実行する。
【0064】図17−19は図15のシステム220に
よって実行可能である動作の実施態様を示している。図
17は画像内の一方向での間隔カウントを作成する動作
を示している。図18は画像内の連結性のある構成要素
のサイズ又はスペースに関する情報を提供する間隔のヒ
ストグラムを作成する動作を示している。図19はヒス
トグラム内のピークと底部とを発見し、文字又はストロ
ークのサイズ又はスペースの所望の属性に対応するピー
クを選択する動作を示している。
よって実行可能である動作の実施態様を示している。図
17は画像内の一方向での間隔カウントを作成する動作
を示している。図18は画像内の連結性のある構成要素
のサイズ又はスペースに関する情報を提供する間隔のヒ
ストグラムを作成する動作を示している。図19はヒス
トグラム内のピークと底部とを発見し、文字又はストロ
ークのサイズ又はスペースの所望の属性に対応するピー
クを選択する動作を示している。
【0065】図17は画像内の一つの位置からの間隔を
測定する方法を示している。ボックス310の段階はあ
る位置で開始する。ボックス312の段階は間隔が測定
されている方向に基づくx及びyの双方の方向での増分
を判定し、且つ、間隔カウントd及び方向カウントxx
及びyyをリセットする。
測定する方法を示している。ボックス310の段階はあ
る位置で開始する。ボックス312の段階は間隔が測定
されている方向に基づくx及びyの双方の方向での増分
を判定し、且つ、間隔カウントd及び方向カウントxx
及びyyをリセットする。
【0066】ボックス314の段階は、カウントxx及
びyyをそれぞれの増分によって増分することにより、
繰り返しループを開始する。ボックス316での段階
は、新たな座標が、画像の境界であるxmax及びym
axの限界を超えないかどうかをチェックする。もしそ
れらが、座標が画像の境界限界を超えることを示してい
れば、ボックス318の段階はゼロ(nil)を返す。
びyyをそれぞれの増分によって増分することにより、
繰り返しループを開始する。ボックス316での段階
は、新たな座標が、画像の境界であるxmax及びym
axの限界を超えないかどうかをチェックする。もしそ
れらが、座標が画像の境界限界を超えることを示してい
れば、ボックス318の段階はゼロ(nil)を返す。
【0067】もし座標xx及びyyが画像の境界の外側
になければ、ボックス320の段階は、座標xx及びy
yをそれぞれ整数値x及びyに丸める。ボックス322
の段階は画像を規定しているデータ項目のアレイにアク
セスし、また画像内の位置を規定しているデータ項目を
得るために指数〔x,y〕を使用する。
になければ、ボックス320の段階は、座標xx及びy
yをそれぞれ整数値x及びyに丸める。ボックス322
の段階は画像を規定しているデータ項目のアレイにアク
セスし、また画像内の位置を規定しているデータ項目を
得るために指数〔x,y〕を使用する。
【0068】ボックス324の段階は、間隔カウントd
を増分する。ボックス326の段階は間隔限度に達した
かどうかが点検される。この方法はこの限度が50ピク
セルである間隔でも良好に機能する。間隔限度に達して
いない場合は、ボックス328の段階が、検索されたデ
ータ項目により定義された位置が停止基準に合致するか
どうかを判定する。この基準は実行中の測定においてエ
ッジが出現するピクセルのカラーを示す可変最終値によ
って示されることができる。間隔限度に達しているか、
又はその位置が最終値の値を有している場合は、ボック
ス330の段階が間隔カウントdの値に戻す。それ以外
の場合は、ループは更に反復されるためにボックス31
4に復帰する。
を増分する。ボックス326の段階は間隔限度に達した
かどうかが点検される。この方法はこの限度が50ピク
セルである間隔でも良好に機能する。間隔限度に達して
いない場合は、ボックス328の段階が、検索されたデ
ータ項目により定義された位置が停止基準に合致するか
どうかを判定する。この基準は実行中の測定においてエ
ッジが出現するピクセルのカラーを示す可変最終値によ
って示されることができる。間隔限度に達しているか、
又はその位置が最終値の値を有している場合は、ボック
ス330の段階が間隔カウントdの値に戻す。それ以外
の場合は、ループは更に反復されるためにボックス31
4に復帰する。
【0069】図18は図17で獲得された間隔データを
利用して画像内の一方向で測定された間隔のヒストグラ
ムを得るための動作を示している。ボックス348の段
階は最終値の値をセットする。この値は測定が黒のピク
セルを跨いで行われるか、白のピクセルを跨いで行われ
るかを判定する。最終値が黒である場合は、黒のエッジ
・ピクセルに遭遇するまで、白のピクセルを跨いで測定
が行われる。逆に、最終値が白である場合は、白のエッ
ジ・ピクセルに遭遇するまで、黒のピクセルを跨いで測
定が行われる。
利用して画像内の一方向で測定された間隔のヒストグラ
ムを得るための動作を示している。ボックス348の段
階は最終値の値をセットする。この値は測定が黒のピク
セルを跨いで行われるか、白のピクセルを跨いで行われ
るかを判定する。最終値が黒である場合は、黒のエッジ
・ピクセルに遭遇するまで、白のピクセルを跨いで測定
が行われる。逆に、最終値が白である場合は、白のエッ
ジ・ピクセルに遭遇するまで、黒のピクセルを跨いで測
定が行われる。
【0070】ボックス350の段階は一群の位置のそれ
ぞれを処理する反復ループを開始する。この技術は50
00の位置でも良好に機能することが判明している。ボ
ックス354の段階はランダム位置を選択する。ボック
ス356の段階は選択された位置がエッジ・ピクセルで
あるかどうかを点検し、そうではない場合は、ボックス
354に戻って別の位置が選択される。ボックス358
の段階は図17に示した方法を用いて最終値に合致する
ピクセルまでの間隔dを測定する。それぞれの間隔測定
は同じ方向で行われる。ボックス360の段階は間隔d
が1よりも大きいかどうかが点検される。そうではない
場合は、現在位置と隣接するピクセルが最終値と合致し
ているので、間隔は測定できない。従って、ループはボ
ックス350に戻り、別の反復ループを開始する。dの
値が1以上である場合は、ボックス362の段階は位置
カウンタを増分し、ボックス364の段階がヒストグラ
ム・データ構造をアクセスし、間隔dを含む間隔の範囲
について度数カウントを増分する。
ぞれを処理する反復ループを開始する。この技術は50
00の位置でも良好に機能することが判明している。ボ
ックス354の段階はランダム位置を選択する。ボック
ス356の段階は選択された位置がエッジ・ピクセルで
あるかどうかを点検し、そうではない場合は、ボックス
354に戻って別の位置が選択される。ボックス358
の段階は図17に示した方法を用いて最終値に合致する
ピクセルまでの間隔dを測定する。それぞれの間隔測定
は同じ方向で行われる。ボックス360の段階は間隔d
が1よりも大きいかどうかが点検される。そうではない
場合は、現在位置と隣接するピクセルが最終値と合致し
ているので、間隔は測定できない。従って、ループはボ
ックス350に戻り、別の反復ループを開始する。dの
値が1以上である場合は、ボックス362の段階は位置
カウンタを増分し、ボックス364の段階がヒストグラ
ム・データ構造をアクセスし、間隔dを含む間隔の範囲
について度数カウントを増分する。
【0071】ボックス350の段階により、充分な数の
位置が測定されたものと判定された場合は、ボックス3
52の段階はヒストグラム・データ構造を返す。このヒ
ストグラム・データ構造は文字又はストロークのサイズ
又はスペースの属性を暗示的に示す分布データである。
位置が測定されたものと判定された場合は、ボックス3
52の段階はヒストグラム・データ構造を返す。このヒ
ストグラム・データ構造は文字又はストロークのサイズ
又はスペースの属性を暗示的に示す分布データである。
【0072】図19は図18で得られたヒストグラムを
利用して、画像内のテキストの特定の文字又はストロー
クのサイズ又はスペースの属性を明示的に示すデータを
得るための動作を示している。ボックス380の段階は
測定がそれを跨いで行われるピクセルの方向とカラーを
決定する定数をセットする。例えば、所望の属性が語間
のスペースである場合は、黒のエッジ・ピクセルに達す
るまで白のピクセルをカウントすることによって、テキ
ストの行と平行に測定が行われる。ボックス382の段
階はボックス380でセットされた定数を用いて、図1
8に示したようにヒストグラムを計算する。
利用して、画像内のテキストの特定の文字又はストロー
クのサイズ又はスペースの属性を明示的に示すデータを
得るための動作を示している。ボックス380の段階は
測定がそれを跨いで行われるピクセルの方向とカラーを
決定する定数をセットする。例えば、所望の属性が語間
のスペースである場合は、黒のエッジ・ピクセルに達す
るまで白のピクセルをカウントすることによって、テキ
ストの行と平行に測定が行われる。ボックス382の段
階はボックス380でセットされた定数を用いて、図1
8に示したようにヒストグラムを計算する。
【0073】ボックス384の段階は従来の平滑化技術
を用いてボックス382で得られたヒストグラムの曲線
を平滑化する。この段階によってピークは抽出し易くな
る。この段階で、白のピクセルのヒストグラム用に良好
な結果を得るには因数2又は3の平滑化で充分であるこ
とが判明している。更に、ピークと底部とを確実に抽出
するには、黒のピクセルのヒストグラムは平滑化を必要
としないことも判明している。ボックス386の段階は
ヒストグラム中のピークと底部のリストを収集する。
を用いてボックス382で得られたヒストグラムの曲線
を平滑化する。この段階によってピークは抽出し易くな
る。この段階で、白のピクセルのヒストグラム用に良好
な結果を得るには因数2又は3の平滑化で充分であるこ
とが判明している。更に、ピークと底部とを確実に抽出
するには、黒のピクセルのヒストグラムは平滑化を必要
としないことも判明している。ボックス386の段階は
ヒストグラム中のピークと底部のリストを収集する。
【0074】ボックス386で得られたリストは所望の
属性に対応するピーク又は底部を選択するために利用で
きよう。例えば、検出されるべき所望の属性が語間のス
ペースである場合は、ヒストグラムはテキストの行と平
行に行われた白のピクセルの測定によって作成される。
平滑化されたヒストグラムの第1のピークは文字間のス
ペースを示し、第2のピークは語間のスペースを示す。
このステップはリスト又はヒストグラムを見ることによ
って手動的に行っても、リストから適宜のピーク又は底
部を自動的に選択する機械を使用して行ってもよい。ピ
ークが自動的に選択される場合は、機械はピークが出現
した間隔を返すことが可能であろう。
属性に対応するピーク又は底部を選択するために利用で
きよう。例えば、検出されるべき所望の属性が語間のス
ペースである場合は、ヒストグラムはテキストの行と平
行に行われた白のピクセルの測定によって作成される。
平滑化されたヒストグラムの第1のピークは文字間のス
ペースを示し、第2のピークは語間のスペースを示す。
このステップはリスト又はヒストグラムを見ることによ
って手動的に行っても、リストから適宜のピーク又は底
部を自動的に選択する機械を使用して行ってもよい。ピ
ークが自動的に選択される場合は、機械はピークが出現
した間隔を返すことが可能であろう。
【0075】本発明は多くの態様で応用できよう。一般
に、文字又はストロークのサイズ又はスペースの属性を
示すデータは区分化を用いる任意の画像処理の用途で利
用可能である。図20はコピー機での本発明の用途を示
している。
に、文字又はストロークのサイズ又はスペースの属性を
示すデータは区分化を用いる任意の画像処理の用途で利
用可能である。図20はコピー機での本発明の用途を示
している。
【0076】図20では、コピー機400はスキャナ4
02と、画像処理システム404と、プリンタ406と
を備えている。スキャナ402は入力文書の画像を定義
するデータを作成可能である。画像処理システム404
は図15又は図16に示したように実現可能であり、文
字及びストロークのサイズ及びスペースの測定に加え
て、文書中の文字を識別するために光学式文字認識技術
を利用することができる。文字及びストロークのサイズ
及びスペース測定は文字認識を向上させるためのページ
の区分化に利用することができる。画像処理システム4
04は変更された画像を定義するデータを作成する技術
をも応用できよう。例えば、文字、又は文字群が選択を
示すように強調、又はその他の方法で示されるならば、
強調、その他の外の境界を判定するために文字の間隔測
定を利用できよう。文字のサイズ及び間隔の測定は更に
印書されたテキスト部分ではない、連結性のある構成要
素を識別することの補助にも利用でき、それによってこ
れらの要素を画像から排除することが可能である。その
後、変更された画像を定義するデータをプリンタ406
に送って、出力文書を印書することが可能であろう。
02と、画像処理システム404と、プリンタ406と
を備えている。スキャナ402は入力文書の画像を定義
するデータを作成可能である。画像処理システム404
は図15又は図16に示したように実現可能であり、文
字及びストロークのサイズ及びスペースの測定に加え
て、文書中の文字を識別するために光学式文字認識技術
を利用することができる。文字及びストロークのサイズ
及びスペース測定は文字認識を向上させるためのページ
の区分化に利用することができる。画像処理システム4
04は変更された画像を定義するデータを作成する技術
をも応用できよう。例えば、文字、又は文字群が選択を
示すように強調、又はその他の方法で示されるならば、
強調、その他の外の境界を判定するために文字の間隔測
定を利用できよう。文字のサイズ及び間隔の測定は更に
印書されたテキスト部分ではない、連結性のある構成要
素を識別することの補助にも利用でき、それによってこ
れらの要素を画像から排除することが可能である。その
後、変更された画像を定義するデータをプリンタ406
に送って、出力文書を印書することが可能であろう。
【0077】これまで、画像内のテキストの文字及びス
トロークのサイズ及びスペースに関する情報を示すデー
タを得るために、画像を定義するデータにおいて動作が
実行される実施態様に関連して本発明を説明してきた。
本発明は更に画像内のテキストの文字及びストロークの
サイズ及びスペースに関する情報を示すデータを直接得
るために光センサと接続された特別な回路においても実
施可能であろう。
トロークのサイズ及びスペースに関する情報を示すデー
タを得るために、画像を定義するデータにおいて動作が
実行される実施態様に関連して本発明を説明してきた。
本発明は更に画像内のテキストの文字及びストロークの
サイズ及びスペースに関する情報を示すデータを直接得
るために光センサと接続された特別な回路においても実
施可能であろう。
【0078】これまで、間隔が無作為に選択された位置
から測定された実施態様に関連して本発明を説明してき
た。その代わりに、間隔測定の開始位置は例えばエッジ
の全てのピクセル又はN番目毎のエッジ・ピクセルのよ
うな別の基準によって選択することもできよう。
から測定された実施態様に関連して本発明を説明してき
た。その代わりに、間隔測定の開始位置は例えばエッジ
の全てのピクセル又はN番目毎のエッジ・ピクセルのよ
うな別の基準によって選択することもできよう。
【0079】これまで、ヒストグラムを得ることによっ
て分布データが得られる実施態様に関連して本発明を説
明してきた。分布データを得るには、間隔の関数として
度数を示す技術又は間隔の関数として度数の中心値を示
す技術のような技術を含む他の技術も利用できよう。一
般に、分布データは全ての間隔測定が得られた後で得る
ことができ、又は、データ記憶の要求を低減するため
に、間隔測定データが得られた時点でそれらを組み合わ
せることも可能である。
て分布データが得られる実施態様に関連して本発明を説
明してきた。分布データを得るには、間隔の関数として
度数を示す技術又は間隔の関数として度数の中心値を示
す技術のような技術を含む他の技術も利用できよう。一
般に、分布データは全ての間隔測定が得られた後で得る
ことができ、又は、データ記憶の要求を低減するため
に、間隔測定データが得られた時点でそれらを組み合わ
せることも可能である。
【0080】これまで本発明をソフトウェアの実施態様
で説明してきたが、本発明は専用のハードウェアによっ
ても実施可能であろう。
で説明してきたが、本発明は専用のハードウェアによっ
ても実施可能であろう。
【図1】 テキストを含む画像の文字とストロークの間
隔の測定を示す概略図である。
隔の測定を示す概略図である。
【図2】 画像内の連結性のある構成要素内の文字とス
トロークのサイズの測定を示す概略図である。
トロークのサイズの測定を示す概略図である。
【図3】 文字又はストロークのサイズ又はスペースを
示す分布データを得るための技術における基本段階を示
すフローチャートである。
示す分布データを得るための技術における基本段階を示
すフローチャートである。
【図4】 開始ピクセルから基準に合致するピクセルま
での間隔を示す間隔カウントを得るための段階を示すフ
ローチャートである。
での間隔を示す間隔カウントを得るための段階を示すフ
ローチャートである。
【図5】 図4に示すように測定された間隔のヒストグ
ラムを得る段階を示すフローチャートである。
ラムを得る段階を示すフローチャートである。
【図6】 水平間隔を示すデータを得るために図5に示
すように作成されたヒストグラムを利用する段階を示す
フローチャートである。
すように作成されたヒストグラムを利用する段階を示す
フローチャートである。
【図7】 垂直間隔を示すデータを得るために図5に示
すように作成されたヒストグラムを利用する段階を示す
フローチャートである。
すように作成されたヒストグラムを利用する段階を示す
フローチャートである。
【図8】 水平サイズを示すデータを得るために図5に
示すように作成されたヒストグラムを利用する段階を示
すフローチャートである。
示すように作成されたヒストグラムを利用する段階を示
すフローチャートである。
【図9】 垂直サイズを示すデータを得るために図5に
示すように作成されたヒストグラムを利用する段階を示
すフローチャートである。
示すように作成されたヒストグラムを利用する段階を示
すフローチャートである。
【図10】 Aは図6に示すように作成されたヒストグ
ラムである。Bは図10Aのヒストグラムの平滑化され
た形態である。
ラムである。Bは図10Aのヒストグラムの平滑化され
た形態である。
【図11】 Aは図7に示すように作成されたヒストグ
ラムである。Bは図11Aのヒストグラムの平滑化され
た形態である。
ラムである。Bは図11Aのヒストグラムの平滑化され
た形態である。
【図12】 図8に示すように作成されたヒストグラム
である。
である。
【図13】 図9に示すように作成されたヒストグラム
である。
である。
【図14】 図6−図9に示すように属性を示すデータ
を作成する際にスキュー・データを利用する段階を示す
フローチャートである。
を作成する際にスキュー・データを利用する段階を示す
フローチャートである。
【図15】 本発明が直列機械で実施されるシステムの
概略構成図である。
概略構成図である。
【図16】 本発明が並列機械で実施されるシステムの
概略構成図である。
概略構成図である。
【図17】 本発明の実施態様に基づき間隔測定データ
を得るための段階を示すフローチャートである。
を得るための段階を示すフローチャートである。
【図18】 ヒストグラム・データを得るために図17
に示すように作成された間隔測定データを利用する段階
を示すフローチャートである。
に示すように作成された間隔測定データを利用する段階
を示すフローチャートである。
【図19】 特定の文字又はストロークのサイズ又はス
ペースの属性を示すデータを得るために図18に示すよ
うに作成されたヒストグラム・データを利用する段階を
示すフローチャートである。
ペースの属性を示すデータを得るために図18に示すよ
うに作成されたヒストグラム・データを利用する段階を
示すフローチャートである。
【図20】 コピー機における本発明の応用を示した概
略構成図である。
略構成図である。
10 画像、12 開始位置、14 線がエッジと交わ
る位置、16 開始位置、18 線がエッジと交わる位
置、20 開始位置、22 線がエッジと交わる位置、
24 開始位置、26 線がエッジと交わる位置、28
開始位置、30線がエッジと交わる位置、40 連結
性のある構成要素、42 開始位置、44 線がエッジ
と交わる位置、46 開始位置、48 線がエッジと交
わる位置、50 開始位置、52 線がエッジと交わる
位置、54 開始位置、56 線がエッジと交わる位
置、150 第1ピーク、152 第2ピーク、160
ピーク、162 第1ピーク、164 第2ピーク、
170 ピーク、172 第2ピーク、180 ピー
ク、182 ピーク、220 システム、222 プロ
セッサ、224 入力装置、226 出力装置、228
プログラム・メモリ、230 データ・メモリ、23
2 画像データ記憶動作段、234 画像データ修正動
作段、236 画像データ出力動作段、238 サイズ
獲得動作段、240 スペース獲得動作段、242 分
布獲得動作段、244 測定動作段、246 スキュー
獲得動作段、248 ランダム位置動作段、260 画
像データ、262 測定データ、264 分布データ、
266 サイズ・データ、268スペース・データ、2
80 システム、282 ホスト・プロセッサ、284
入力装置、286 出力装置、290 並列プロセッ
サ、292 局部記憶装置、300 プログラム・メモ
リ、302 データ・メモリ、400 コピー機、40
2 スキャナ、404 画像処理システム、406 プ
リンタ、d1-d9間隔
る位置、16 開始位置、18 線がエッジと交わる位
置、20 開始位置、22 線がエッジと交わる位置、
24 開始位置、26 線がエッジと交わる位置、28
開始位置、30線がエッジと交わる位置、40 連結
性のある構成要素、42 開始位置、44 線がエッジ
と交わる位置、46 開始位置、48 線がエッジと交
わる位置、50 開始位置、52 線がエッジと交わる
位置、54 開始位置、56 線がエッジと交わる位
置、150 第1ピーク、152 第2ピーク、160
ピーク、162 第1ピーク、164 第2ピーク、
170 ピーク、172 第2ピーク、180 ピー
ク、182 ピーク、220 システム、222 プロ
セッサ、224 入力装置、226 出力装置、228
プログラム・メモリ、230 データ・メモリ、23
2 画像データ記憶動作段、234 画像データ修正動
作段、236 画像データ出力動作段、238 サイズ
獲得動作段、240 スペース獲得動作段、242 分
布獲得動作段、244 測定動作段、246 スキュー
獲得動作段、248 ランダム位置動作段、260 画
像データ、262 測定データ、264 分布データ、
266 サイズ・データ、268スペース・データ、2
80 システム、282 ホスト・プロセッサ、284
入力装置、286 出力装置、290 並列プロセッ
サ、292 局部記憶装置、300 プログラム・メモ
リ、302 データ・メモリ、400 コピー機、40
2 スキャナ、404 画像処理システム、406 プ
リンタ、d1-d9間隔
─────────────────────────────────────────────────────
フロントページの続き
(58)調査した分野(Int.Cl.7,DB名)
G06K 9/20
G06K 9/34
G06K 9/36
Claims (2)
- 【請求項1】 テキストを含む2次元画像上での画像処
理方法であって、 前記画像には前記テキストを形成する2あるいはそれ以
上の連結された構成要素が含まれており、 前記構成要素は共に、前記画像の測定方向での突出した
サイズまたはスペースを有するものであり、 前記画像は、X−Y座標のそれぞれの位置のアレイとし
てアクセス可能であり、 前記アレイは、それぞれの位置におけるデータ項目を含
むものである画像処理方法において、 前記測定方向に伸びるラインに沿って、構成要素のエッ
ジ間の2つあるいはそれ以上の数の間隔を測定し、それ
ぞれの間隔に関して、前記間隔を示す測定データとし、 前記間隔は以下によって測定される画像処理方法: 連結された構成要素のエッジにおける開始位置のX−Y
スタート座標を得ること; 測定方向に伸びる増分ラインを画定する増分値を前記X
−Y座標のそれぞれについて得ること; 第1の反復と最後の反復を含む一連の反復作業を行うこ
と;それぞれの反復は、開始位置のX−Y初期座標と、
最終位置のX−Y最終座標を有するものであり、前記第
1の反復のX−Y初期座標は前記X−Yスタート座標で
あり、それぞれの反復は、反復のX−Y初期座標とX−
Y増分値とを使用して反復のX−Y最終座標を得ること
を含み、前記反復の最終位置は、前記測定方向に伸びる
ラインに沿って反復の開始位置から増分量だけ位置変更
されるものであること; 前記反復のX−Y最終座標を用いて、アレイ中に位置す
るデータ項目にアクセスすること; アクセスしたデータ項目が連結された構成要素の別のエ
ッジに位置するもので あるかどうかを判断し、そのアク
セスしたデータ項目が連結された構成要素の別のエッジ
に位置する場合には、開始位置と反復の最終位置との間
の間隔を示す測定データを求め、その測定データを得る
反復は一連の反復中の最終反復であること; その測定データを用いて分布データを求めること;その
分布データは前記測定方向における連結された構成要素
のエッジ間の間隔の分布を示すものであり、その間隔は
連結された構成要素の充分な数のエッジ間の間隔を測定
したものであり、そのエッジ間の間隔の分布は更に画像
の測定方向における連結された構成要素の突出したサイ
ズあるいはスペースを示すものであること。 - 【請求項2】 データを記憶するメモリとメモリにアク
セスするために連結されたプロセッサとを有し、 メモリに記憶されたデータは、 テキストを含む2次元画像を規定する画像データであっ
て、前記画像には前記テキストを形成する2あるいはそ
れ以上の連結された構成要素が含まれており、前記構成
要素は共に、前記画像の測定方向での突出したサイズま
たはスペースを有するものであり、前記画像データは、
X−Y座標のそれぞれの位置のアレイとしてアクセス可
能であり、前記アレイは、それぞれの位置におけるデー
タ項目を含むものである、画像データと、 前記プロセッサが画像処理できるように指示事項を示す
指示データとを有し、 前記プロセッサが実行する指示事項は、 前記画像内での測定方向に伸びるラインに沿って、連結
された構成要素のエッジ間の2あるいはそれ以上の数の
間隔を測定することであって、それぞれの測定データは
前記間隔を示すものであり、それぞれの間隔は以下によ
って測定されるものである画像処理装置: 連結された構成要素のエッジにおける開始位置のX−Y
スタート座標を得ること; 前記測定方向に伸びる増分ラインを画定する増分値を前
記X−Y座標のそれぞれについて得ること; 第1の反復と最後の反復を含む一連の反復作業を行うこ
と;それぞれの反復は 、開始位置のX−Y初期座標と、
最終位置のX−Y最終座標を有するものであり、前記第
1の反復のX−Y初期座標は前記X−Yスタート座標で
あり、それぞれの反復は、反復のX−Y初期座標とX−
Y増分値とを使用して反復のX−Y最終座標を得ること
を含み、前記反復の最終位置は、前記測定方向に伸びる
ラインに沿って増分量だけ位置変更されるものであるこ
と; 前記反復のX−Y最終座標を用いて、アレイ中に位置す
るデータ項目にアクセスすること; アクセスしたデータ項目が連結された構成要素の別のエ
ッジに位置するものであるかどうかを判断し、そのアク
セスしたデータ項目が連結された構成要素の別のエッジ
に位置する場合には、開始位置と反復の最終位置との間
の間隔を示す測定データを求め、その測定データを得る
反復は一連の反復中の最終反復であること; その測定データを用いて分布データを求めること;その
分布データは前記測定方向の連結された構成要素のエッ
ジ間の間隔の分布を示すものであり、その間隔は連結さ
れた構成要素の充分な数のエッジ間の間隔を測定したも
のであり、そのエッジ間の間隔の分布は更に画像の測定
方向における連結された構成要素の突出サイズあるいは
スペースを示すものであること。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US737955 | 1985-05-28 | ||
US73795591A | 1991-07-30 | 1991-07-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0612523A JPH0612523A (ja) | 1994-01-21 |
JP3361124B2 true JP3361124B2 (ja) | 2003-01-07 |
Family
ID=24965966
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP19724892A Expired - Fee Related JP3361124B2 (ja) | 1991-07-30 | 1992-07-23 | テキストを含む2次元画像上での画像処理方法と画像処理装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5513277A (ja) |
EP (1) | EP0526196B1 (ja) |
JP (1) | JP3361124B2 (ja) |
DE (1) | DE69225541T2 (ja) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62186237A (ja) * | 1986-02-12 | 1987-08-14 | Minolta Camera Co Ltd | バイモルフ駆動素子を有するカメラ |
DK0604687T3 (da) * | 1992-12-30 | 2000-10-23 | Koninkl Kpn Nv | Fremgangsmåde til afledning af tegneegenskaber i et tegngenkendelsessystem |
US5796409A (en) * | 1993-04-06 | 1998-08-18 | Ecole Polytechnique Federale De Lausanne | Method for producing contrast-controlled grayscale characters |
JP2842781B2 (ja) * | 1993-12-24 | 1999-01-06 | 日本電気株式会社 | 画像情報処理方式 |
US5649024A (en) * | 1994-11-17 | 1997-07-15 | Xerox Corporation | Method for color highlighting of black and white fonts |
US5668891A (en) * | 1995-01-06 | 1997-09-16 | Xerox Corporation | Methods for determining font attributes of characters |
JP3366497B2 (ja) * | 1995-07-12 | 2003-01-14 | 松下電器産業株式会社 | 部品検出方法 |
US5638466A (en) * | 1995-08-30 | 1997-06-10 | Horizon Marketing Corporation Aka Wordwand | Method and apparatus for deskewing images of symbols having a non-linear baseline |
DE69526792T2 (de) * | 1995-09-29 | 2002-12-05 | Hewlett-Packard Co. (N.D.Ges.D.Staates Delaware), Palo Alto | Bildverarbeitungsgerät und -verfahren |
US5828771A (en) * | 1995-12-15 | 1998-10-27 | Xerox Corporation | Method and article of manufacture for determining whether a scanned image is an original image or fax image |
US5956468A (en) * | 1996-07-12 | 1999-09-21 | Seiko Epson Corporation | Document segmentation system |
FR2756952B1 (fr) * | 1996-12-06 | 1999-06-25 | Itesoft | Systeme de reconnaissance de caracteres manuscrits |
KR100239357B1 (ko) * | 1997-04-17 | 2000-01-15 | 구자홍 | 영상 표시 장치의 문자 처리 방법 및 장치 |
JP3471578B2 (ja) * | 1997-08-29 | 2003-12-02 | シャープ株式会社 | 行方向判定装置、画像傾き検出装置及び画像傾き補正装置 |
US5995661A (en) * | 1997-10-08 | 1999-11-30 | Hewlett-Packard Company | Image boundary detection for a scanned image |
GB2364417B (en) * | 2000-06-30 | 2004-10-06 | Post Office | Image processing |
US6741745B2 (en) | 2000-12-18 | 2004-05-25 | Xerox Corporation | Method and apparatus for formatting OCR text |
US7333798B2 (en) | 2002-08-08 | 2008-02-19 | Value Added Communications, Inc. | Telecommunication call management and monitoring system |
US7271806B2 (en) * | 2002-12-18 | 2007-09-18 | Microsoft Corporation | International automatic line height system and method |
US20040119714A1 (en) * | 2002-12-18 | 2004-06-24 | Microsoft Corporation | International automatic font size system and method |
RU2323470C2 (ru) * | 2002-12-18 | 2008-04-27 | Майкрософт Корпорейшн | Система и способ автоматического измерения высоты строки, размера и других параметров международного шрифта |
US7385606B2 (en) * | 2002-12-18 | 2008-06-10 | Microsoft Corporation | International font measurement system and method |
US7788258B1 (en) * | 2004-06-21 | 2010-08-31 | Google Inc. | Automatic determination of whether a document includes an image gallery |
NO20052656D0 (no) | 2005-06-02 | 2005-06-02 | Lumex As | Geometrisk bildetransformasjon basert pa tekstlinjesoking |
US8164762B2 (en) * | 2006-09-07 | 2012-04-24 | Xerox Corporation | Intelligent text driven document sizing |
KR100833346B1 (ko) | 2007-01-03 | 2008-05-28 | (주)폴리다임 | 디스플레이 장치에 표시된 문자 이미지의 픽셀 단위 가로폭 측정 방법 |
JP4396757B2 (ja) * | 2007-10-22 | 2010-01-13 | ソニー株式会社 | ノイズ補正回路、撮像装置及びノイズ補正方法 |
US8917935B2 (en) | 2008-05-19 | 2014-12-23 | Microsoft Corporation | Detecting text using stroke width based text detection |
US8320674B2 (en) | 2008-09-03 | 2012-11-27 | Sony Corporation | Text localization for image and video OCR |
EP2465056B1 (en) * | 2009-08-11 | 2019-07-31 | Someones Group Intellectual Property Holdings Pty | Method, system and controller for searching a database |
EP2296362B1 (en) * | 2009-09-09 | 2012-02-15 | European Central Bank | A method for generating a security bi-level image for a banknote |
US8194983B2 (en) * | 2010-05-13 | 2012-06-05 | Hussein Khalid Al-Omari | Method and system for preprocessing an image for optical character recognition |
US8494284B2 (en) * | 2011-11-21 | 2013-07-23 | Nokia Corporation | Methods and apparatuses for facilitating detection of text within an image |
US9697431B2 (en) | 2013-08-16 | 2017-07-04 | Conduent Business Services, Llc | Mobile document capture assist for optimized text recognition |
US9396404B2 (en) | 2014-08-04 | 2016-07-19 | Datalogic ADC, Inc. | Robust industrial optical character recognition |
US9392127B1 (en) * | 2015-01-12 | 2016-07-12 | Xerox Corporation | Document production system having automatic adjustment of content to fit the printable area of a pre-printed media |
US9798948B2 (en) | 2015-07-31 | 2017-10-24 | Datalogic IP Tech, S.r.l. | Optical character recognition localization tool |
US9563961B1 (en) | 2016-01-19 | 2017-02-07 | Xerox Corporation | Method and system for image processing |
US10685261B2 (en) * | 2018-06-11 | 2020-06-16 | GM Global Technology Operations LLC | Active segmention of scanned images based on deep reinforcement learning for OCR applications |
US11386636B2 (en) | 2019-04-04 | 2022-07-12 | Datalogic Usa, Inc. | Image preprocessing for optical character recognition |
CN110210470B (zh) * | 2019-06-05 | 2023-06-23 | 复旦大学 | 商品信息图像识别系统 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL179454B (nl) * | 1952-06-28 | Jan Hendrik Gerlings | Plaatvormig kunststofelement. | |
NL221903A (ja) * | 1956-10-26 | |||
US3297989A (en) * | 1964-03-23 | 1967-01-10 | Ling Temco Vought Inc | Probability transform generator for image recognition |
US3873972A (en) * | 1971-11-01 | 1975-03-25 | Theodore H Levine | Analytic character recognition system |
JPS5847064B2 (ja) * | 1978-07-08 | 1983-10-20 | 工業技術院長 | 文字読取方式 |
US4773098A (en) * | 1980-05-27 | 1988-09-20 | Texas Instruments Incorporated | Method of optical character recognition |
US4377803A (en) * | 1980-07-02 | 1983-03-22 | International Business Machines Corporation | Algorithm for the segmentation of printed fixed pitch documents |
DE3480667D1 (de) * | 1983-03-01 | 1990-01-11 | Nec Corp | System zum bestimmen des zeichenabstandes. |
US4610025A (en) * | 1984-06-22 | 1986-09-02 | Champollion Incorporated | Cryptographic analysis system |
US4723297A (en) * | 1984-09-27 | 1988-02-02 | Siemens Aktiengesellschaft | Method for automatic correction of character skew in the acquisition of a text original in the form of digital scan results |
US4887301A (en) * | 1985-06-05 | 1989-12-12 | Dest Corporation | Proportional spaced text recognition apparatus and method |
US5046114A (en) * | 1985-10-01 | 1991-09-03 | The Palantir Corporation | Method and structure for separating joined patterns for use in pattern and character recognition system |
US4773099A (en) * | 1985-10-10 | 1988-09-20 | The Palantir Corporation | Pattern classification means for use in a pattern recognition system |
JPS63158678A (ja) * | 1986-12-23 | 1988-07-01 | Sharp Corp | 単語間スペ−ス検出方法 |
US4802230A (en) * | 1987-03-13 | 1989-01-31 | Gtx Corporation | Method and apparatus for generating size and orientation invariant shape features |
US4809344A (en) * | 1987-05-11 | 1989-02-28 | Nippon Sheet Glass Co., Ltd. | Apparatus for preprocessing of character recognition |
US5001766A (en) * | 1988-05-16 | 1991-03-19 | At&T Bell Laboratories | Apparatus and method for skew control of document images |
US4901362A (en) * | 1988-08-08 | 1990-02-13 | Raytheon Company | Method of recognizing patterns |
JP2930612B2 (ja) * | 1989-10-05 | 1999-08-03 | 株式会社リコー | 画像形成装置 |
US5054094A (en) * | 1990-05-07 | 1991-10-01 | Eastman Kodak Company | Rotationally impervious feature extraction for optical character recognition |
US5216725A (en) * | 1990-10-31 | 1993-06-01 | Environmental Research Institute Of Michigan | Apparatus and method for separating handwritten characters by line and word |
US5253307A (en) * | 1991-07-30 | 1993-10-12 | Xerox Corporation | Image analysis to obtain typeface information |
US5245674A (en) * | 1991-07-30 | 1993-09-14 | Xerox Corporation | Image processing using distance as a function of direction |
-
1992
- 1992-07-23 JP JP19724892A patent/JP3361124B2/ja not_active Expired - Fee Related
- 1992-07-30 DE DE69225541T patent/DE69225541T2/de not_active Expired - Lifetime
- 1992-07-30 EP EP92306948A patent/EP0526196B1/en not_active Expired - Lifetime
-
1993
- 1993-06-14 US US08/077,702 patent/US5513277A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0526196B1 (en) | 1998-05-20 |
EP0526196A2 (en) | 1993-02-03 |
DE69225541T2 (de) | 1998-11-26 |
US5513277A (en) | 1996-04-30 |
EP0526196A3 (ja) | 1994-03-23 |
DE69225541D1 (de) | 1998-06-25 |
JPH0612523A (ja) | 1994-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3361124B2 (ja) | テキストを含む2次元画像上での画像処理方法と画像処理装置 | |
EP0526199B1 (en) | Image processing apparatus | |
JP3242158B2 (ja) | タイプフェース情報を取得するためのイメージ処理装置および方法 | |
US5854854A (en) | Skew detection and correction of a document image representation | |
US6741745B2 (en) | Method and apparatus for formatting OCR text | |
JP4101290B2 (ja) | 書式処理時の自動ページ登録及び自動領域検出のためのシステム及び方法 | |
US10817559B2 (en) | Image processing apparatus with document similarity processing, and image processing method and storage medium therefor | |
US5001766A (en) | Apparatus and method for skew control of document images | |
JP3576570B2 (ja) | 比較方法 | |
US5416851A (en) | Image analysis based on location sampling | |
JP2536966B2 (ja) | テキスト編集システム | |
EP0334472B1 (en) | Methods of detecting character strings | |
US8515176B1 (en) | Identification of text-block frames | |
US8811751B1 (en) | Method and system for correcting projective distortions with elimination steps on multiple levels | |
US8897600B1 (en) | Method and system for determining vanishing point candidates for projective correction | |
EP0629078A1 (en) | Apparatus for processing and reproducing image information | |
CN101908136A (zh) | 一种表格识别处理方法及系统 | |
US8913836B1 (en) | Method and system for correcting projective distortions using eigenpoints | |
US5517586A (en) | Method and apparatus for automatically specifying a portion of text from a bitmap image of the text | |
US8064636B2 (en) | Image processing apparatus and method of controlling the same | |
US5923782A (en) | System for detecting and identifying substantially linear horizontal and vertical lines of engineering drawings | |
EP0701223A2 (en) | Method and apparatus for identifying words described in a page description language file | |
JP6542230B2 (ja) | 投影ひずみを補正するための方法及びシステム | |
US6373997B1 (en) | Coarse and fine skew measurement | |
US20090279802A1 (en) | Image processing device and image processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20020208 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20020906 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |