JP2576079B2 - 文字切出し方法 - Google Patents
文字切出し方法Info
- Publication number
- JP2576079B2 JP2576079B2 JP4259501A JP25950192A JP2576079B2 JP 2576079 B2 JP2576079 B2 JP 2576079B2 JP 4259501 A JP4259501 A JP 4259501A JP 25950192 A JP25950192 A JP 25950192A JP 2576079 B2 JP2576079 B2 JP 2576079B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- processing step
- forced
- character string
- circumscribed rectangle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
(以下、「OCR」ともいう)における文字切出し方法に関
するものである。
画素連結成分の外接方形座標を求め、複数の外接方形を
統合した結果が、予め推定した文字サイズに等しくなる
ような統合パタンを切出す方式が一般的である。しかし
ながら、特に自由手書き文字列の場合は、複数の文字や
文字部位間での接触が生じるため、文字境界の検出結果
に基づき、外接方形を強制的に切断することが必要とな
る。この方法の一つに、文字列の方向と垂直の方向に文
字線数を計数した線密度を用いる方法がある。この方法
では、分割対象の方形の中央付近で、垂直方向の線密度
が極小となるところで方形を分割する。なお、これに関
しては、例えば、仲林等による「あいまい検索を用いた
高速枠なし手書き文字列読取り方式」(信学論(D-II),J
74-D-II,11,PP.1528-1537)の記載が参考になる。
来技術は、文字形状の局所的な情報のみに着目したもの
であり、文字列内における文字の記入ピッチは等しくな
る傾向にあるといった文字列の周期性については特に考
慮されていない。また、図3における31のように、複
数の文字や文字の部位が接触している場合には、線密度
の探索範囲が必ずしも中央付近にはならないため、上記
従来技術では、正確に文字を切出すことができないとい
う問題があった。本発明は上記事情に鑑みてなされたも
ので、その目的とするところは、従来の技術における上
述の如き問題を解消し、文字列の周期性を考慮すること
で、複数文字や文字部位が接触して記入された自由手書
き文字列から文字を正確に切出すことが可能な文字切出
し方法を提供することにある。
文字列を光学的に走査することにより画像データを取得
するステップと、取得した画像データを文字列の方向に
直交する方向に走査して黒連結成分の外接方形の座標を
求める外接方形計算処理ステップと、該ステップと並行
して、文字列の方向に直交する方向に黒画素数を計数す
る周辺分布計算処理ステップと、前記外接方形を文字列
の方向に直交する方向に統合するか否かを判定するファ
ーストマージ処理ステップと、ファーストマージ後の外
接方形から文字サイズを推定する文字サイズ推定処理ス
テップと、外接方形の文字列方向の長さと推定された文
字サイズとの比から、強制切断を実施するか否かを判定
する強制切断判定処理ステップと、該ステップによる判
定結果に基づき、必要に応じて前記外接方形を分割する
強制切断処理ステップと、方形座標を文字列の方向に統
合するか否かを判定するセカンドマージ処理ステップを
有する文字切出し方法において、前記強制切断処理ステ
ップを、前記強制切断判定処理ステップにより強制切断
の対象となった外接方形領域内での周辺分布の結果を少
なくとも2段階のピッチで平滑化する平滑化処理ステッ
プと、該ステップによる前述の異なるピッチでの平滑化
処理の結果を比較して強制切断点を探索する範囲を求め
る強制切断探索範囲検出処理ステップとで構成し、前記
強制切断探索範囲検出処理ステップにより検出した強制
切断探索範囲の中から周辺分布が極小となる位置を求め
てこの位置で外接方形を分割することを特徴とする文字
切出し方法により達成される。
の周辺分布を異なるピッチで平滑化(移動平均化)した
結果に着目している。すなわち、OCRでは、帳票等を
ラスタスキャンした画素データを処理対象とするが、周
辺分布は、このデータ中の文字列の方向と垂直の方向に
黒画素数を計数した値である。文字には、中央付近の黒
画素数が多くなる傾向があること、文字の記入ピッチは
文字列内においては等しくなる傾向にあること等の特性
があり、このことは、文字列の周期性としてとらえるこ
とができる。図2に、文字列の一例を示す。図2におけ
る21は文字の原パタン、22は周辺分布の取得結果、
23は予め推定した文字サイズの1/4をピッチとして
周辺分布に対して平滑化処理を2回施した後の黒画素
数、24は上述の黒画素数23の結果に対して更に文字
サイズをピッチとして平滑化処理を施した後の黒画素数
を示している。図2の黒画素数23および24からも明
らかなように、平滑化処理後の黒画素数は局所的な変動
が取り除かれ、文字列の周期的な変動傾向が反映された
ものとなっている。黒画素数の変動傾向を更に詳細に検
討すると、図2の黒画素数23では、各文字ごとに文字
のピークが顕著に現われている。また、図2の黒画素数
23のピークを検出した後の周辺分布の取得結果24と
黒画素数23の交点と次の交点との間に文字の境界が存
在し、この境界は黒画素数が極小となる位置と一致する
ことが分かる。
に説明する。図1は、本発明の一実施例に係る文字切出
し装置の構成を示すブロック図である。スキャナ等の画
像入力装置から読み込まれた画像データは、図1におけ
る画像メモリ1に格納される。黒連結成分外接方形計算
回路2では、画像メモリ1中の文字列を、文字列の方向
と直交する方向に走査して、黒連結成分外接方形を求め
る。求められた結果の一例を、図3(a)に示す。これ
と並行して、周辺分布計算回路3では、文字列の方向と
直交する方向に黒画素数を計数することにより、周辺分
布を求める。求められた結果の一例を、図2の22に示
す。次に、ファーストマージ回路4では、黒連結成分外
接方形の文字列の方向と直交する方向への統合を行う。
すなわち、文字列の方行と平行な座標軸への写像の重な
り部分の長さが、重なる両外接方形の文字列方向の長さ
のうち短い方の値の1/2と比較して長い場合に統合を
行う。統合後の外接方形の一例を、図3(b)に示す。
なお、このファーストマージ処理については、前述の文
献(信学論(D−IIDにも、記載されている如く、当
業者にとって普通の処理である。
ほぼ等しくなるという特性があるため、文字の幅または
高さのいずれかが推定できれば、この値を文字サイズと
考えることができる。文字サイズ推定回路5では、文字
のこのような特性に基づき、ファーストマージ後の外接
方形の文字列の方向と直交する方向の長さの平均値また
は中央値を求めることにより、文字サイズを推定する。
次に、強制切断判定回路6では、ファーストマージ後の
外接方形の文字列方向の長さと、文字サイズ推定値との
比をとり、この値がしきい(閾)値以上である場合に、
当該外接方形を強制切断候補とする。なお、しきい値を
1.2とした場合、図3(b)における31が強制切断
候補となる。平滑化回路7では、強制切断候補となった
領域(図3(b)におえる31)内での周辺分布の平滑
化を実施する。平滑化は、1画素ずつの移動平均法によ
る。ここでは、文字のサイズの1/4をピッチとして2
回の平滑化を実施した。求められた結果の一例を、図2
の23(実際は、破線で囲んだ部分のみ)に示し、この
結果を更に文字幅をピッチとして平滑化した結果を、図
2の24に示す。このように、強制切断候補となった領
域(上記31)内でのみ、周辺分布の平滑化を実施する
ことにより、処理量の無用な増加を抑止することができ
る。
上述の平滑化結果を用いて、強制切断探索範囲を、図4
にその詳細を示す方法で決定する。これは、0005項
で述べた、図2の24と23の交点と次の交点との間に
存在する文字の境界の検出処理に相当する。 ステップ41:初期設定 平滑化結果の追跡開始位置を登録する。 ステップ42:フラグクリア flg_one(尾根を検出したことを示すフラグ),
flg_tani(谷を検出したことを示すフラグ),
flg_start(切断探索範囲の開始点とすること
を示すフラグ),flg_end(切断探索範囲の終了
点とすることを示すフラグ)をオフにする。 ステップ43:追跡位置での平滑化結果の取得 文字サイズの1/4をピッチとして、2回平滑化した削
果をa、aを更に文字サイズをピッチとして平滑化した
結果をbとする。 ステップ44:a−bがしきい値より大きい場合 flg_oneをオンにする。
は、登録されている探索開始点,終了点を出力し、flg_
start,flg_end,flg_taniをオフにする。 ステップ45:flg_oneがオン、かつ、flg_start要オフ、
かつ、a≦bの場合 現在の追跡位置を探索開始点として登録する。flg_star
tをオンにする。 ステップ46:flg_startがオン、かつ、b−aがしきい
値より大きい場合 flg_taniをオンにする。 ステップ47:flg_taniがオン、かつ、flg_endがオフ、
かつ、a≧bの場合 現在点の追跡位置を探索終了点として登録する。flg_en
dをオンにする。flg_taniをオンにする。 ステップ48:追跡位置が対象領域内である場合はステッ
プ43に進み、領域外である場合は、終了する。
探索範囲検出回路8により求めた強制切断探索範囲中の
周辺分布が極小となる位置で、外接方形を強制切断す
る。求められた結果の一例を、図3(c)に示す。セカ
ンドマージ回路10では、外接方形の文字列の方向での
統合を試み、統合後の外接方形の縦横比が1に近くなる
ように、外接方形を求める。求められた結果の一例を、
図3(d)に示す。これが、最終的な切出し結果とな
る。なお、このセカンドマージ処理についても、先に示
した文献(信学論(D−II))に記載されており、当
業者にとって普通の処理である。上記実施例によれば、
文字や文字の部位間での接触が発生する自由手書き文字
列からの文字の切出しにおいても、文ぱパタンを確度よ
く切出すことができるという効果が得られる。図5に、
上記実施例に示した文字切出し装置を応用したOCRの
構成を示す。図中、51はスキャナ等の画像入力装置、
52は本発明に係る文字切出し装置、53は文字の特徴
抽出部、54は文字識別部、55は識別結果の表示部を
示している。
効果に基づき文字認識を行う結果、文字を精度よく認識
できる点にある。なお、上記実施例は本発明の一例を示
したものであり、本発明はこれに限定されるべきもので
ないことは言うまでもないことである。例えば、図1に
示した平滑化処理7は、必ずしも文字列すべてについて
行う必要はなく、文字や文字の部位間での接触が発生し
ている部分についてのみ行うようにしてもよい。
れば、文字列の周期性を考慮することで、複数文字や文
字部位が接触して記入された自由手書き文字列から文字
を正確に切出すことが可能な文字切出し方法を実現でき
るという顕著な効果を奏するものである。
を示すブロック図である。
である。
連結外接方形により説明する図である。
図である。
のブロック構成図である。
3:周辺分布計算回路、4:ファーストマージ回路、
5:文字サイズ推定回路、6:強制切断判定回路、7:
平滑化回路、8:強制切断探索範囲検出回路、9:強制
切断回路、10:セカンドマージ回路、21:文字の原
パタン、22:周辺分布の取得結果、23:周辺分布を
平滑化処理した結果の黒画素数、24:黒画素数23を
更に平滑化処理した結果の黒画素数。
Claims (1)
- 【請求項1】文字列を光学的に走査することにより画像
データを取得するステップと、取得した画像データを文
字列の方向に直交する方向に走査して黒連結成分の外接
方形の座標を求める外接方形計算処理ステップと、該ス
テップと並行して、文字列の方向に直交する方向に黒画
素数を計数する周辺分布計算処理ステップと、前記外接
方形を文字列の方向に直交する方向に統合するか否かを
判定するファーストマージ処理ステップと、ファースト
マージ後の外接方形から文字サイズを推定する文字サイ
ズ推定処理ステップと、外接方形の文字列方向の長さと
推定された文字サイズとの比から、強制切断を実施する
か否かを判定する強制切断判定処理ステップと、該ステ
プブによる判定結果に基づき、必要に応じて前記外接方
形を分割する強制切断処理ステップと、方形座標を文字
列の方向に統合するか否かを判定するセカンドマージ処
理ステップを有する文字切出し方法において、前記強制
切断処理ステップを、前記強制切断判定処理ステップに
より強制切断の対象となった外接方形領域内での周辺分
布の結果を少なくとも2段階のピッチで平滑化する平滑
化処理ステップと、該ステップによる前述の異なるピッ
チでの平滑化処理の結果を比較して強制切断点を探索す
る範囲を求める強制切断探索範囲検出処理ステップとで
構成し、前記強制切断探索範囲検出処理ステップにより
検出した強制切断探索範囲の中から周辺分布が極小とな
る位置を求めてこの位置で外接方形を分割することを特
徴とする文字切出し方法。」
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4259501A JP2576079B2 (ja) | 1992-09-29 | 1992-09-29 | 文字切出し方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4259501A JP2576079B2 (ja) | 1992-09-29 | 1992-09-29 | 文字切出し方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06111064A JPH06111064A (ja) | 1994-04-22 |
JP2576079B2 true JP2576079B2 (ja) | 1997-01-29 |
Family
ID=17334979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4259501A Expired - Lifetime JP2576079B2 (ja) | 1992-09-29 | 1992-09-29 | 文字切出し方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2576079B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101354746B (zh) * | 2007-07-23 | 2011-08-31 | 夏普株式会社 | 文字图像抽出装置及文字图像抽出方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59128678A (ja) * | 1983-01-12 | 1984-07-24 | Nec Corp | 文字切り出し装置 |
JPS6015781A (ja) * | 1983-07-08 | 1985-01-26 | Nippon Telegr & Teleph Corp <Ntt> | 文字切出し装置 |
JPH02277185A (ja) * | 1989-04-18 | 1990-11-13 | Sharp Corp | 矩形座標抽出方法 |
JPH0417086A (ja) * | 1990-05-10 | 1992-01-21 | Ricoh Co Ltd | 文字切り出し方法 |
JPH0415776A (ja) * | 1990-05-01 | 1992-01-21 | Fuji Facom Corp | 文字のサイズ情報抽出方法 |
JPH0484279A (ja) * | 1990-07-26 | 1992-03-17 | Matsushita Electric Ind Co Ltd | 画像編集装置 |
JPH04130979A (ja) * | 1990-09-21 | 1992-05-01 | Ricoh Co Ltd | 文字画像切出し方法 |
JPH04149685A (ja) * | 1990-10-09 | 1992-05-22 | Nec Corp | 接触文字切出し方法 |
-
1992
- 1992-09-29 JP JP4259501A patent/JP2576079B2/ja not_active Expired - Lifetime
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59128678A (ja) * | 1983-01-12 | 1984-07-24 | Nec Corp | 文字切り出し装置 |
JPS6015781A (ja) * | 1983-07-08 | 1985-01-26 | Nippon Telegr & Teleph Corp <Ntt> | 文字切出し装置 |
JPH02277185A (ja) * | 1989-04-18 | 1990-11-13 | Sharp Corp | 矩形座標抽出方法 |
JPH0415776A (ja) * | 1990-05-01 | 1992-01-21 | Fuji Facom Corp | 文字のサイズ情報抽出方法 |
JPH0417086A (ja) * | 1990-05-10 | 1992-01-21 | Ricoh Co Ltd | 文字切り出し方法 |
JPH0484279A (ja) * | 1990-07-26 | 1992-03-17 | Matsushita Electric Ind Co Ltd | 画像編集装置 |
JPH04130979A (ja) * | 1990-09-21 | 1992-05-01 | Ricoh Co Ltd | 文字画像切出し方法 |
JPH04149685A (ja) * | 1990-10-09 | 1992-05-22 | Nec Corp | 接触文字切出し方法 |
Also Published As
Publication number | Publication date |
---|---|
JPH06111064A (ja) | 1994-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6072895A (en) | System and method using minutiae pruning for fingerprint image processing | |
JP4208918B2 (ja) | 文書画像からテキストを抽出する方法及び装置並びにコンピュータプログラム及びその記憶媒体 | |
US6674900B1 (en) | Method for extracting titles from digital images | |
US6111978A (en) | System and method for determining ridge counts in fingerprint image processing | |
US5539841A (en) | Method for comparing image sections to determine similarity therebetween | |
JPH07234915A (ja) | 画像認識装置 | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JP6268023B2 (ja) | 文字認識装置およびその文字切り出し方法 | |
US5081690A (en) | Row-by-row segmentation and thresholding for optical character recognition | |
WO2016086877A1 (zh) | 一种文本检测的方法和装置 | |
JP3830998B2 (ja) | 罫線除去方法及びこれを用いた文字認識装置 | |
JP3411472B2 (ja) | パターン抽出装置 | |
JP2576079B2 (ja) | 文字切出し方法 | |
JP3090342B2 (ja) | 文字列方向判別装置 | |
JP2868134B2 (ja) | 画像処理方法及び装置 | |
Parodi et al. | Efficient and flexible text extraction from document pages | |
JPH02278104A (ja) | 文書画像の傾き角検出方法 | |
JP2832928B2 (ja) | 文字認識方法 | |
JP3437296B2 (ja) | 文字列高速抽出装置 | |
JP3077929B2 (ja) | 文字切出し方式 | |
JP3411795B2 (ja) | 文字認識装置 | |
JP2872757B2 (ja) | 行方向判定装置 | |
JP2580976B2 (ja) | 文字切出し装置 | |
JP3193573B2 (ja) | かぎかっこ付文字認識装置 | |
JP3190794B2 (ja) | 文字切り出し装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071107 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081107 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091107 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091107 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101107 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111107 Year of fee payment: 15 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121107 Year of fee payment: 16 |
|
EXPY | Cancellation because of completion of term |