JP2576079B2 - 文字切出し方法 - Google Patents

文字切出し方法

Info

Publication number
JP2576079B2
JP2576079B2 JP4259501A JP25950192A JP2576079B2 JP 2576079 B2 JP2576079 B2 JP 2576079B2 JP 4259501 A JP4259501 A JP 4259501A JP 25950192 A JP25950192 A JP 25950192A JP 2576079 B2 JP2576079 B2 JP 2576079B2
Authority
JP
Japan
Prior art keywords
character
processing step
forced
character string
circumscribed rectangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4259501A
Other languages
English (en)
Other versions
JPH06111064A (ja
Inventor
正臣 中嶋
敏之 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Corp
Original Assignee
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Communications Systems Corp filed Critical NTT Data Communications Systems Corp
Priority to JP4259501A priority Critical patent/JP2576079B2/ja
Publication of JPH06111064A publication Critical patent/JPH06111064A/ja
Application granted granted Critical
Publication of JP2576079B2 publication Critical patent/JP2576079B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学式文字読取り装置
(以下、「OCR」ともいう)における文字切出し方法に関
するものである。
【0002】
【従来の技術】文字列から文字パタンを切出す場合、黒
画素連結成分の外接方形座標を求め、複数の外接方形を
統合した結果が、予め推定した文字サイズに等しくなる
ような統合パタンを切出す方式が一般的である。しかし
ながら、特に自由手書き文字列の場合は、複数の文字や
文字部位間での接触が生じるため、文字境界の検出結果
に基づき、外接方形を強制的に切断することが必要とな
る。この方法の一つに、文字列の方向と垂直の方向に文
字線数を計数した線密度を用いる方法がある。この方法
では、分割対象の方形の中央付近で、垂直方向の線密度
が極小となるところで方形を分割する。なお、これに関
しては、例えば、仲林等による「あいまい検索を用いた
高速枠なし手書き文字列読取り方式」(信学論(D-II),J
74-D-II,11,PP.1528-1537)の記載が参考になる。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来技術は、文字形状の局所的な情報のみに着目したもの
であり、文字列内における文字の記入ピッチは等しくな
る傾向にあるといった文字列の周期性については特に考
慮されていない。また、図3における31のように、複
数の文字や文字の部位が接触している場合には、線密度
の探索範囲が必ずしも中央付近にはならないため、上記
従来技術では、正確に文字を切出すことができないとい
う問題があった。本発明は上記事情に鑑みてなされたも
ので、その目的とするところは、従来の技術における上
述の如き問題を解消し、文字列の周期性を考慮すること
で、複数文字や文字部位が接触して記入された自由手書
き文字列から文字を正確に切出すことが可能な文字切出
し方法を提供することにある。
【0004】
【課題を解決するための手段】本発明の上述の目的は、
文字列を光学的に走査することにより画像データを取得
するステップと、取得した画像データを文字列の方向に
直交する方向に走査して黒連結成分の外接方形の座標を
求める外接方形計算処理ステップと、該ステップと並行
して、文字列の方向に直交する方向に黒画素数を計数す
る周辺分布計算処理ステップと、前記外接方形を文字列
の方向に直交する方向に統合するか否かを判定するファ
ーストマージ処理ステップと、ファーストマージ後の外
接方形から文字サイズを推定する文字サイズ推定処理ス
テップと、外接方形の文字列方向の長さと推定された文
字サイズとの比から、強制切断を実施するか否かを判定
する強制切断判定処理ステップと、該ステップによる判
定結果に基づき、必要に応じて前記外接方形を分割する
強制切断処理ステップと、方形座標を文字列の方向に統
合するか否かを判定するセカンドマージ処理ステップを
有する文字切出し方法において、前記強制切断処理ステ
ップを、前記強制切断判定処理ステップにより強制切断
の対象となった外接方形領域内での周辺分布の結果を少
なくとも2段階のピッチで平滑化する平滑化処理ステッ
プと、該ステップによる前述の異なるピッチでの平滑化
処理の結果を比較して強制切断点を探索する範囲を求め
る強制切断探索範囲検出処理ステップとで構成し、前記
強制切断探索範囲検出処理ステップにより検出した強制
切断探索範囲の中から周辺分布が極小となる位置を求め
てこの位置で外接方形を分割することを特徴とする文字
切出し方法により達成される。
【0005】
【作用】本発明に係る文字切出し方法においては、文字
の周辺分布を異なるピッチで平滑化(移動平均化)した
結果に着目している。すなわち、OCRでは、帳票等を
ラスタスキャンした画素データを処理対象とするが、周
辺分布は、このデータ中の文字列の方向と垂直の方向に
黒画素数を計数した値である。文字には、中央付近の黒
画素数が多くなる傾向があること、文字の記入ピッチは
文字列内においては等しくなる傾向にあること等の特性
があり、このことは、文字列の周期性としてとらえるこ
とができる。図2に、文字列の一例を示す。図2におけ
る21は文字の原パタン、22は周辺分布の取得結果、
23は予め推定した文字サイズの1/4をピッチとして
周辺分布に対して平滑化処理を2回施した後の黒画素
数、24は上述の黒画素数23の結果に対して更に文字
サイズをピッチとして平滑化処理を施した後の黒画素数
を示している。図2の黒画素数23および24からも明
らかなように、平滑化処理後の黒画素数は局所的な変動
が取り除かれ、文字列の周期的な変動傾向が反映された
ものとなっている。黒画素数の変動傾向を更に詳細に検
討すると、図2の黒画素数23では、各文字ごとに文字
のピークが顕著に現われている。また、図2の黒画素数
23のピークを検出した後の周辺分布の取得結果24
黒画素数23の交点と次の交点との間に文字の境界が存
在し、この境界は黒画素数が極小となる位置と一致する
ことが分かる。
【0006】
【実施例】以下、本発明の実施例を図面に基づいて詳細
に説明する。図1は、本発明の一実施例に係る文字切出
し装置の構成を示すブロック図である。スキャナ等の画
像入力装置から読み込まれた画像データは、図1におけ
る画像メモリ1に格納される。黒連結成分外接方形計算
回路2では、画像メモリ1中の文字列を、文字列の方向
と直交する方向に走査して、黒連結成分外接方形を求め
る。求められた結果の一例を、図3(a)に示す。これ
と並行して、周辺分布計算回路3では、文字列の方向と
直交する方向に黒画素数を計数することにより、周辺分
布を求める。求めらた結果の一例を、図2の22に示
す。次に、ファーストマージ回路4では、黒連結成分外
接方形の文字列の方向と直交する方向への統合を行う。
すなわち、文字列の方行と平行な座標軸への写像の重な
り部分の長さが、重なる両外接方形の文字列方向の長さ
のうち短い方の値の1/2と比較して長い場合に統合を
行う。統合後の外接方形の一例を、図3(b)に示す。
なお、このファーストマージ処理については、前述の文
献(信学論(D−IIDにも、記載されている如く、当
業者にとって普通の処理である。
【0007】前述の如く、文字には、文字の幅と高さが
ほぼ等しくなるという特性があるため、文字の幅または
高さのいずれかが推定できれば、この値を文字サイズと
考えることができる。文字サイズ推定回路5では、文字
のこのような特性に基づき、ファーストマージ後の外接
方形の文字列の方向と直交する方向の長さの平均値また
は中央値を求めることにより、文字サイズを推定する。
次に、強制切断判定回路6では、ファーストマージ後の
外接方形の文字列方向の長さと、文字サイズ推定値との
比をとり、この値がしきい(閾)値以上である場合に、
当該外接方形を強制切断候補とする。なお、しきい値を
1.2とした場合、図3(b)における31が強制切断
候補となる。平滑化回路7では、強制切断候補となった
領域(図3(b)におえる31)内での周辺分布の平滑
化を実施する。平滑化は、1画素ずつの移動平均法によ
る。ここでは、文字のサイズの1/4をピッチとして2
回の平滑化を実施した。求められた結果の一例を、図2
の23(実際は、破線で囲んだ部分のみ)に示し、この
結果を更に文字幅をピッチとして平滑化した結果を、図
2の24に示す。このように、強制切断候補となった領
域(上記31)内でのみ、周辺分布の平滑化を実施する
ことにより、処理量の無用な増加を抑止することができ
る。
【0008】次に、強制切断探索範囲検出回路8では、
上述の平滑化結果を用いて、強制切断探索範囲を、図4
にその詳細を示す方法で決定する。これは、0005項
で述べた、図2の24と23の交点と次の交点との間に
存在する文字の境界の検出処理に相当する。 ステップ41:初期設定 平滑化結果の追跡開始位置を登録する。 ステップ42:フラグクリア flg_one(尾根を検出したことを示すフラグ),
flg_tani(谷を検出したことを示すフラグ),
flg_start(切断探索範囲の開始点とすること
を示すフラグ),flg_end(切断探索範囲の終了
点とすることを示すフラグ)をオフにする。 ステップ43:追跡位置での平滑化結果の取得 文字サイズの1/4をピッチとして、2回平滑化した削
果をa、aを更に文字サイズをピッチとして平滑化した
結果をbとする。 ステップ44:a−bしきい値より大きい場合 flg_oneをオンにする。
【0009】なお、flg_start,flg_endがオンの場合に
は、登録されている探索開始点,終了点を出力し、flg_
start,flg_end,flg_taniをオフにする。 ステップ45:flg_oneがオン、かつ、flg_start要オフ、
かつ、a≦bの場合 現在の追跡位置を探索開始点として登録する。flg_star
tをオンにする。 ステップ46:flg_startがオン、かつ、b−aがしきい
値より大きい場合 flg_taniをオンにする。 ステップ47:flg_taniがオン、かつ、flg_endがオフ、
かつ、a≧bの場合 現在点の追跡位置を探索終了点として登録する。flg_en
dをオンにする。flg_taniをオンにする。 ステップ48:追跡位置が対象領域内である場合はステッ
プ43に進み、領域外である場合は、終了する。
【0010】次に、強制切断回路9では、上で強制切断
探索範囲検出回路8により求めた強制切断探索範囲中の
周辺分布が極小となる位置で、外接方形を強制切断す
る。求められた結果の一例を、図3(c)に示す。セカ
ンドマージ回路10では、外接方形の文字列の方向での
統合を試み、統合後の外接方形の縦横比が1に近くなる
ように、外接方形を求める。求められた結果の一例を、
図3(d)に示す。これが、最終的な切出し結果とな
る。なお、このセカンドマージ処理についても、先に示
した文献(信学論(D−II))に記載されており、当
業者にとって普通の処理である。上記実施例によれば、
文字や文字の部位間での接触が発生する自由手書き文字
列からの文字の切出しにおいても、文ぱパタンを確度よ
く切出すことができるという効果が得られる。図5に、
上記実施例に示した文字切出し装置を応用したOCRの
構成を示す。図中、51はスキャナ等の画像入力装置、
52は本発明に係る文字切出し装置、53は文字の特徴
抽出部、54は文字識別部、55は識別結果の表示部を
示している。
【0011】本装置の効果は、前述の文字切出し装置の
効果に基づき文字認識を行う結果、文字を精度よく認識
できる点にある。なお、上記実施例は本発明の一例を示
したものであり、本発明はこれに限定されるべきもので
ないことは言うまでもないことである。例えば、図1に
示した平滑化処理7は、必ずしも文字列すべてについて
行う必要はなく、文字や文字の部位間での接触が発生し
ている部分についてのみ行うようにしてもよい。
【0012】
【発明の効果】以上、詳細に説明した如く、本発明によ
れば、文字列の周期性を考慮することで、複数文字や文
字部位が接触して記入された自由手書き文字列から文字
を正確に切出すことが可能な文字切出し方法を実現でき
るという顕著な効果を奏するものである。
【0013】
【図面の簡単な説明】
【図1】本発明の一実施例に係る文字切出し装置の構成
を示すブロック図である。
【図2】周辺分布と前辺分布の平滑化結果を説明する図
である。
【図3】実施例に係る文字切出し装置の処理の流れを黒
連結外接方形により説明する図である。
【図4】強制切断探索範囲検出方法の処理の流れを示す
図である。
【図5】本発明に係る文字切出し方法を適用したOCR
のブロック構成図である。
【符号の説明】
1:画像メモリ、2:黒連結成分外接方形計算回路、
3:周辺分布計算回路、4:ファーストマージ回路、
5:文字サイズ推定回路、6:強制切断判定回路、7:
平滑化回路、8:強制切断探索範囲検出回路、9:強制
切断回路、10:セカンドマージ回路、21:文字の原
パタン、22:周辺分布の取得結果、23:周辺分布を
平滑化処理した結果の黒画素数、24:黒画素数23を
更に平滑化処理した結果の黒画素数。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文字列を光学的に走査することにより画像
    データを取得するステップと、取得した画像データを文
    字列の方向に直交する方向に走査して黒連結成分の外接
    方形の座標を求める外接方形計算処理ステップと、該ス
    テップと並行して、文字列の方向に直交する方向に黒画
    素数を計数する周辺分布計算処理ステップと、前記外接
    方形を文字列の方向に直交する方向に統合するか否かを
    判定するファーストマージ処理ステップと、ファースト
    マージ後の外接方形から文字サイズを推定する文字サイ
    ズ推定処理ステップと、外接方形の文字列方向の長さと
    推定された文字サイズとの比から、強制切断を実施する
    か否かを判定する強制切断判定処理ステップと、該ステ
    プブによる判定結果に基づき、必要に応じて前記外接方
    形を分割する強制切断処理ステップと、方形座標を文字
    列の方向に統合するか否かを判定するセカンドマージ処
    理ステップを有する文字切出し方法において、前記強制
    切断処理ステップを、前記強制切断判定処理ステップに
    より強制切断の対象となった外接方形領域内での周辺分
    布の結果を少なくとも2段階のピッチで平滑化する平滑
    化処理ステップと、該ステップによる前述の異なるピッ
    チでの平滑化処理の結果を比較して強制切断点を探索す
    る範囲を求める強制切断探索範囲検出処理ステップとで
    構成し、前記強制切断探索範囲検出処理ステップにより
    検出した強制切断探索範囲の中から周辺分布が極小とな
    る位置を求めてこの位置で外接方形を分割することを特
    徴とする文字切出し方法。」
JP4259501A 1992-09-29 1992-09-29 文字切出し方法 Expired - Lifetime JP2576079B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4259501A JP2576079B2 (ja) 1992-09-29 1992-09-29 文字切出し方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4259501A JP2576079B2 (ja) 1992-09-29 1992-09-29 文字切出し方法

Publications (2)

Publication Number Publication Date
JPH06111064A JPH06111064A (ja) 1994-04-22
JP2576079B2 true JP2576079B2 (ja) 1997-01-29

Family

ID=17334979

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4259501A Expired - Lifetime JP2576079B2 (ja) 1992-09-29 1992-09-29 文字切出し方法

Country Status (1)

Country Link
JP (1) JP2576079B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101354746B (zh) * 2007-07-23 2011-08-31 夏普株式会社 文字图像抽出装置及文字图像抽出方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59128678A (ja) * 1983-01-12 1984-07-24 Nec Corp 文字切り出し装置
JPS6015781A (ja) * 1983-07-08 1985-01-26 Nippon Telegr & Teleph Corp <Ntt> 文字切出し装置
JPH02277185A (ja) * 1989-04-18 1990-11-13 Sharp Corp 矩形座標抽出方法
JPH0417086A (ja) * 1990-05-10 1992-01-21 Ricoh Co Ltd 文字切り出し方法
JPH0415776A (ja) * 1990-05-01 1992-01-21 Fuji Facom Corp 文字のサイズ情報抽出方法
JPH0484279A (ja) * 1990-07-26 1992-03-17 Matsushita Electric Ind Co Ltd 画像編集装置
JPH04130979A (ja) * 1990-09-21 1992-05-01 Ricoh Co Ltd 文字画像切出し方法
JPH04149685A (ja) * 1990-10-09 1992-05-22 Nec Corp 接触文字切出し方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59128678A (ja) * 1983-01-12 1984-07-24 Nec Corp 文字切り出し装置
JPS6015781A (ja) * 1983-07-08 1985-01-26 Nippon Telegr & Teleph Corp <Ntt> 文字切出し装置
JPH02277185A (ja) * 1989-04-18 1990-11-13 Sharp Corp 矩形座標抽出方法
JPH0415776A (ja) * 1990-05-01 1992-01-21 Fuji Facom Corp 文字のサイズ情報抽出方法
JPH0417086A (ja) * 1990-05-10 1992-01-21 Ricoh Co Ltd 文字切り出し方法
JPH0484279A (ja) * 1990-07-26 1992-03-17 Matsushita Electric Ind Co Ltd 画像編集装置
JPH04130979A (ja) * 1990-09-21 1992-05-01 Ricoh Co Ltd 文字画像切出し方法
JPH04149685A (ja) * 1990-10-09 1992-05-22 Nec Corp 接触文字切出し方法

Also Published As

Publication number Publication date
JPH06111064A (ja) 1994-04-22

Similar Documents

Publication Publication Date Title
US6072895A (en) System and method using minutiae pruning for fingerprint image processing
JP4208918B2 (ja) 文書画像からテキストを抽出する方法及び装置並びにコンピュータプログラム及びその記憶媒体
US6674900B1 (en) Method for extracting titles from digital images
US6111978A (en) System and method for determining ridge counts in fingerprint image processing
US5539841A (en) Method for comparing image sections to determine similarity therebetween
JPH07234915A (ja) 画像認識装置
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JP6268023B2 (ja) 文字認識装置およびその文字切り出し方法
US5081690A (en) Row-by-row segmentation and thresholding for optical character recognition
WO2016086877A1 (zh) 一种文本检测的方法和装置
JP3830998B2 (ja) 罫線除去方法及びこれを用いた文字認識装置
JP3411472B2 (ja) パターン抽出装置
JP2576079B2 (ja) 文字切出し方法
JP3090342B2 (ja) 文字列方向判別装置
JP2868134B2 (ja) 画像処理方法及び装置
Parodi et al. Efficient and flexible text extraction from document pages
JPH02278104A (ja) 文書画像の傾き角検出方法
JP2832928B2 (ja) 文字認識方法
JP3437296B2 (ja) 文字列高速抽出装置
JP3077929B2 (ja) 文字切出し方式
JP3411795B2 (ja) 文字認識装置
JP2872757B2 (ja) 行方向判定装置
JP2580976B2 (ja) 文字切出し装置
JP3193573B2 (ja) かぎかっこ付文字認識装置
JP3190794B2 (ja) 文字切り出し装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071107

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081107

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091107

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091107

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101107

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 16

EXPY Cancellation because of completion of term