JPS62121589A - 文字切出し方法 - Google Patents

文字切出し方法

Info

Publication number
JPS62121589A
JPS62121589A JP60261488A JP26148885A JPS62121589A JP S62121589 A JPS62121589 A JP S62121589A JP 60261488 A JP60261488 A JP 60261488A JP 26148885 A JP26148885 A JP 26148885A JP S62121589 A JPS62121589 A JP S62121589A
Authority
JP
Japan
Prior art keywords
character
histogram
point
black
segmenting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60261488A
Other languages
English (en)
Other versions
JPH07120390B2 (ja
Inventor
Shigeru Goto
茂 後藤
Yoshiyuki Yamashita
山下 義征
Shinji Narita
成田 真二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP60261488A priority Critical patent/JPH07120390B2/ja
Publication of JPS62121589A publication Critical patent/JPS62121589A/ja
Publication of JPH07120390B2 publication Critical patent/JPH07120390B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、文字切出し方式に関し、更に詳細には帳票
に記入された文字を読取シ、読取った文字に基づく文字
パタン列を1文字領域毎に分離して抽出する文字切出し
方式に関する。
(従来の技術) 光学式文字認識装置(以下、OCRと略す)においては
帳票に記入された文字を行毎に走査し、光信号を光電変
換器により画像信号に変換し、ラインバッファに格納す
る。そのラインバッファを順次読み出し文字パタン列を
1文字領域毎に分離し、その分離された文字パタンによ
り認識を行っているので、文字パタン列の中から1文字
領域を抽出する文字切出し法はOCRの性能に大きく影
響する。
OCRにおいて、文字列が格納されているラインバッフ
ァの上端から下端に向って1列走査し、この走査と直角
な方向に順次列を移動することにより、ラインバッファ
の文字パタン々読出しを行う。また1列の走査中に黒点
(文字部分を黒点。
背景部分を白点)を計数することによりヒストグラムを
作成し、その黒点ヒストグラムを参照して、1文字の領
域を決定する。
しかしながら手書文字の場合において記入者が者が文字
の一部をはねたため等の理由により、隣接する文字が重
なって、2文字以上の文字パタンか1文字として切出さ
れるという問題がある。
この問題点を解決するために本出願人が先に提案した特
願昭60−36573号ではヒストグラム作成手段によ
υ文字パタン列に対して黒点ヒストグラムを作成し、所
定の閾値により黒点ヒストグラムの始点から終点までの
幅を検出手段で検出する。
この黒点ヒストグラムの幅より何文字分に相当するか判
定し、2文字以上の場合は、その文字パタン列の文字外
接枠を検出し、該文字外接枠について、水平方向に予め
指定された分割数の領域に分割し、各領域内で前記検出
された文字外接枠内で前記ヒストグラム作成手段及び検
出手段により、再度始点及び終点を検出して前記分割数
の領域毎に各文字パタンの切出し位置を決定していた。
第6図は、以上説明した従来の文字切出し方式のパタン
例を示したものである。100はパタン101゜102
の外接枠、103は外接枠100の水平2等分割線(以
下C軸とする)、104 、105はC軸に投影した上
側の領域のパタンの黒点ヒストグラムのブロックを示し
ている。108は外接枠100の底辺を示している(以
下E軸とする)。106 、107はE軸108上に投
影された、C軸とE軸の間のパタンの黒点ヒストグラム
のブロックを示している。109゜110はブロック1
04 、105および106 、107の中点を示して
いる。外接枠100の水平2等分割線(C軸)103に
よって外接枠を2つの領域に分割し、それぞれの領域で
垂直方向の黒点ヒストグラムを作成し、黒点ヒストグラ
ムが連続するブロック104〜105 、106〜10
7を検出しそれぞれの領域でブロック間の中点109 
、110を切出し点とし、第6図に示すごとき、A−A
’を切出し位置としていた。
(発明が解決しよりとする問題点) しかしながら上記従来の文字切出し方式では、外接枠の
水平分割領域において黒点ヒストグラムのブロックが1
つしか検出できない領域が1つ以上あると1文字を正し
く切出すことは出来なかった。
すなわち、帳票記入者の習慣、くせ等により文字が記入
枠より大きくはみ出したシ、はねてしまうために、文字
の一部が隣接する文字に大きく入シ込んだシ、より複雑
に重った場合を第7図(a)(b)に示す。同図(a)
はパタン201 、202を含む文字外接枠200内の
領域をC軸203で2等分割した場合ずれの場合もE軸
210に投影されたパタンの黒点ヒストグラムはブロッ
ク209が1つしか検出されず、従って正しい切出し位
置を検出することが出来ないというような問題点があっ
た。さらに文字外接枠の水平分割数を増加させると処理
時間も増大するという問題があった。
本発明は、これらの問題点を解決するためのもので、簡
単な構成で精度の良い文字切出し方式を提供することを
目的とする。
(問題点を解決するだめの手段) 本発明は前記問題点を解決するために、帳票上に記入さ
れた文字列を光電変換して得られる量子化された文字パ
タン列を格納するラインバッファメモリを備え、該文字
パタン列を1文字毎に分離して抽出する文字切出し方式
において、前記ラインバッファメモリを文字パタン列の
列方向に1列毎に走査して列方向の黒点ヒストグラムを
作成し、第1の閾値より大きい黒点ヒストグラムが連続
して第2の閾値以上続く列方向の黒点ヒストグラムの幅
と第3の閾値とを比較して該幅が何文字分に相当するか
を判定する判定手段と、前記列方向の黒点ヒストグラム
の幅に対応する文字パタン列を行方向に1行毎に走査し
て作成した行方向の黒点ヒストグラムと前記列方向の黒
点ヒストグラムとに基づいて文字外接枠を検出する外接
枠検出手段と、前記外接枠検出手段で検出された文字外
接枠内の文字パタン列を保持するパタン記憶手段と、前
記文字外接枠内を水平方向に分割した分割領域毎に1列
毎走査した列方向の黒点ヒストグラムを作成する黒点ヒ
ストグラム作成手段と、前記黒点ヒストグラム作成手段
で作成した黒点ヒストグラムを分割領域毎に記憶するヒ
ストグラム記憶手段と、前記ヒストグラム記憶手段より
所望の分割領域の黒点ヒストグラムの連続するブロック
を検出し該分割領域の切出し点を決定する決定手段とを
有し、前記決定手段で切出し点が決定できない分ヒスト
グラム記憶手段及び決定手段を用いて再分割領域のブロ
ックを検出し、全ての分割領域の切出し点が決定できる
まで上記再分割処理を繰返し、決定した各分割領域の切
出し点及び水平方向の分割線に基づいて文字切出し位置
を決定するものである。
好ましくは前記黒点ヒストグラム作成手段が文字外接枠
内の1回の走査で分割領域毎の黒点ヒストグラムを作成
するものである。
(作用) 本発明によれば以上のように文字切出し方式をムを作成
し、黒点ヒストグラムの幅が何文字分に相当するかを判
定し、文字パタン列の切出し対象の領域が決定される。
次に外接枠検出手段は文字パタン列の文字外接枠を検出
する。パタン記憶手段は文字外接枠内の文字パタンを記
憶する。黒点ヒストグラム作成手段は文字外接枠内を水
平方向に分割した分割領域毎の黒点ヒストグラムを作成
し、ヒストグラム記憶手段に分割領域毎に格納する。決
定手段はヒストグラム記憶手段の分割領域毎に列方向の
黒点ヒストグラムの連続するブロックを検出し、分割領
域毎の切出し点を決定する。
決定手段で切出し点が決定できない分割領域がある場合
には、その分割領域に対して水平方向に再分割し、パタ
ン記憶手段、黒点ヒストグラム作成手段、ヒストグラム
記憶手段及び決定手段を用いて、再分割領域のブロック
を検出し、全ての分割領域の切出し点が決定できるまで
再分割処理を繰返す。最終的に決定した分割領域の切出
し点及び水平方向の分割線に基づいて文字切出し位置を
決定する。従って、隣接する文字間で文字の一部が深く
入り込んだような場合にも精度よく文字の切出しを行な
うことができる。
(実施例) 本発明の実施例を第1図乃至第5図に基づいて説明する
。第1図はこの発明の一実施例を示すブロック図である
。同図において300は図示されていない光電変換部よ
りの画像信号、301はラインバッファ、302はパタ
ンバッファ、303ハパタンバツフアのX方向のアドレ
スカウンタ、同じ<304はY方向のアドレスカウンタ
、305は、ラインバッファ301の出力とパタンバッ
ファ302の出力を切換える切換回路、306は、ライ
ンバッファ301あるいはパタンバッファ302の黒点
ヒストグラム作成回路、307はラインバッファ301
の黒点ヒストグラムを格納する1行ヒストグラムメモリ
、308はパタンバッファ302の黒点ヒストグラムを
格納するパタンヒストグラムメモリ、309は、1行ヒ
ストグラムメモリ307とパタンヒストグラムメモリ3
08を切換える切換回路、310は黒点ヒストグラム演
算回路、311は黒点ヒストグラムのブロック、及び文
字外接枠を検出するブロック検出回路、312は制御回
路である。また、同図において一重の矢印はデータの流
れを示し、二重の矢印は制御回路312の制御信号を示
す。
以下に、第1図のブロック図を用いて本実施例の動作に
ついて説明を行う。
帳票上の文字列は光電変換器により2値化された画像信
号300に変換され、ラインバッファ301に格納され
る。制御回路312の制御により以下の処理が行われる
。制御回路312はラインバッファ301に格納されて
いる画像信号をラインバッファ301の先頭位置より1
列単位に読出し、順次列を更進し、1行分の文字パタン
データを全て読出した時点で終了する。また、制御回路
312では、切換回路305をラインバッファ301に
切換えて、ラインバッファ301より1列単位にパタン
データを読出すと同時に黒点ヒストグラム作成回路30
6を起動する。黒点ヒストグラム作成回路306では、
1列の読出し中の黒点数を計数することにより当該列の
黒点ヒストグラムを作成し、1行ヒストグラムメモリ3
07に格納する。以上の処理を繰り返し1行分、全列の
黒点ヒストグラムを1行ヒストグラムメモリ307に格
納した時点で処理を終了する。1行ヒストグラムメモリ
307はラインバッファ301の全列数に相当する黒点
ヒストグラムを格納できる容量をもっている。
1行分の黒点ヒストグラムを作成した後は、黒点ヒスト
グラム作成回路306中の1行ヒストグラムメモリ30
7を先頭より読出して、黒点ヒストグラムを参照してブ
ロックの検出を行う。制御回路312は切換回路309
を1行ヒストグラムメモリ307に切換え、ブロック検
出回路311を起動する。ブロック検出回路311は1
行ヒストグラムメモリ307より、順次黒点ヒストグラ
ムを読出し、黒点ヒストグラムと閾値α(α:定数、た
だし、本実施例においてはα=1とする)を比較し、黒
点ヒストグラムが大きければ文字のブロックの始点候補
とし、順次黒点ヒストグラムの格納番地を更進し、読出
された黒点ヒストグラムが閾値αより大きい列を計数し
、β(β:定数、ただし、本実施例においてはβ=2と
する)列連続した場合、前記始点候補を始点とする。さ
らて列の更進を続け、始点が検出された後、tlめて黒
点ヒストグラムが閾値αより小さくなる列を終点とし、
始点から終点までの長さで示される領域をブロックとす
る。次に、制御回路312は検出されたブロックの長さ
を読取対象としている文字の平均的な幅より求められた
閾値γ1.γ2(γ1.γ2は定数、ただし、本実施例
においてはγ、=75.γ2=125とする)と比較す
る。そして、当該ブロックの長さWが閾値γ1より小さ
いときには当該ブロックを1文字と判定し、γ1≦W≦
γ2のときは2文字と判定し、さらに、W〉γ2のとき
は3文字以上と判定する。また、制御回路312では当
該ブロックの判定の後、該ブロックについてブロック検
出回路311で外接枠を検出する。さらに、このブロッ
クの外接枠が検出されると、前記外接枠内の文字パタン
をパタンバッファ302に転送する。ここで、W〉γ2
の場合つまシ前記ブロックを3文字以上と判定した場合
、始点からγ2まで切出し処理を行って1文字目と2文
字目を分割し、その結果の切出し点を始点としてその始
点からγ2まで切出し処理を行ってさらに2文字目と3
文字目を分割するごとき順次切出しを行いWまで処理す
ることとなる。更に、W〉γ2の場合は、始点からγ2
までの前記外接枠内のパタンバッファ302に転送し、
残シは以下の処理で始点からγ2までの間の切出し点が
決定した時点で再度転送する。ここで、後述する第4図
に示すように文字外接枠の上辺左端を原点とし、下辺位
置をPB。
右辺位置をPRとする。
次に、上記のような文字の判定により2文字以上と判定
されたものの処理について第1図に基づいて説明する。
制御回路312は切換回路305をパタンバッファ30
2に切換え黒点ヒストグラム作成回路306を起動する
。黒点ヒストグラム作成回路306は、パタンバッファ
302に格納されている文字パタン列について、その文
字外接枠内の垂直方向の黒点ヒストグラムを作成する。
以下にその詳細について第2図および第3図を用いて説
明する。
第2図はパタンバッファ302の垂直方向の黒点ヒスト
グラムを作成するブロックである。同図において、30
8は第1図と同一のパタンヒストグラムメモリ、400
は黒点ヒストグラム作成回路306の黒点ヒストグラム
、401はパタンバッファ302のXアドレスカウンタ
303の出力を示す。402ハ文字外接枠内を水平方向
に分割し、その分割領域の文字外接枠の上側よりアドレ
スを示す領域アドレスカウンタ、403はパタンバッフ
ァ302のXアドレスカウンタ304の出力、404は
制御回路312より与えられる文字外接枠の分割情報、
405は分割情報404により分割位置を算出する分割
位置指定回路、406はXアドレスカウンタ304の出
力403と分割位置指定回路405の出力の一致を検出
する分割位置一致検出回路、410はパタンヒストグラ
ムメモリリ308の出力、411は分割位置が一致した
ことを制御回路312に知らせる一致信号を示している
。412は領域アドレスカウンタ402を制御する制御
回路312よりの制御信号(アドレス)である。
次に第3図は第1図および第2図に示したパタンヒスト
グラムメモリ308の構成を示したものである。501
は文字外接枠検出用エリアであシ、502゜503は黒
点ヒストグラムの演算およびブロック検出用のエリアで
ある分割領域用テンボラ(1) 、 (2)、504〜
509は所定の分割領域の黒点ヒストグラムを格納する
エリアを示している。
第1図乃至第2図を用いて文字外接枠内の文字パタン列
について垂直方向の黒点ヒストグラムの作成方法につい
て説明する。制御回路312では文字外接枠が検出され
ると、Yアドレス方向の所定の分割位置を算出する。本
実施例においては分割数は6とした。次に制御回路31
2は第2図に示す領域アドレスカウンタ402に所定の
アドレス(412)をセットし、分割位置指定回路40
5に分割位置情報404をセットした後、黒点ヒストグ
ラム作成回路306を起動する。黒点ヒストグラム作成
回路306は、Xアドレスカウンタ303.およびXア
ドレスカウンタ304を初期化し、Xアドレスカウンタ
304をインクリメントしてパタンの黒点の計数を行い
、Yアドレスが文字外接枠の下辺圧到達しだ時点で黒点
の計数結果をパタンヒストグラムメモリ308に格納し
、Xアドレスカウンタ303をインクリメントし、Xア
ドレスカウンタ304はクリヤする。
以上ノ処理をXアドレスカウンタ303が文字外接枠の
右辺に到達するまで行う。なお、パタンバッファ302
の座標は第4象限に取っている。
次に第1図乃至第3図を用いて文字外接枠の分割領域毎
の黒点ヒストグラムの作成方法を示す。
黒点ヒストグラム作成回路306によ、DYXアドレス
カウンタ304インクリメントされて分割位置指定回路
405で与えられる分割位置とXアドレスカウンタ30
4が分割位置一致検出回路406により一致が検出され
ると、そのときまでに計数された黒点数をパタンヒスト
グラムメモリ308の領域アドレスカウンタ402とX
アドレスカウンタ401で示される位置に格納する。同
時に領域アドレスカウンタ402をインクリメントする
。なお、領域アドレスカウンタ402はXアドレスカウ
ンタ304が初期化されるときに同時に初期化する。以
上の様にして分割領域毎の黒点ヒストグラムが第3図に
示すパタンヒストグラムメモリ308の分割領域(1)
504〜分割領域(6) 509に作成され格納される
分割領域毎の黒点ヒストグラムが作成されると、第1図
において制御回路312は、黒点ヒストグラム演算回路
310を起動して、文字外接枠を中央で分割した場合の
上下の分割領域の黒点ヒストグラムを作成する。作成方
法は上側については第3図に示す分割領域(3) 50
6に格納されている黒点ヒストグラムそのものであシ、
下側の領域は、分割領域(6) 509の黒点ヒストグ
ラムから分割領域(3) 506の黒点ヒストグラムを
差し引いた残りである。すなわち、ある分割領域の黒点
ヒストグラムをHnm(nは1〜6の分割領域の番号、
mは0−PRでPRは文字外接枠の右端)とし、求める
黒点ヒストグラムで上側の分割領域のものをHum +
下側をHLmとすれば、以下の式により求める。
Hum ” Hsm   Ht、m = Hsm −H
3rd黒点ヒストグラム演算回路で、2分割した領域の
黒点ヒストグラムが求まると第3図に示すパタンヒスト
グラムメモリ308の分割領域用テンポラリ(1)50
2および(2) 503に格納する。
次に制御回路312は、切換回路309をパタンヒスト
グラムメモリ308に切換え、前記検出した黒点ヒスト
グラムについてブロック検出回路311を起動しブロッ
クを検出する。このときの閾値はα:1.β=2とした
。ブロックが検出されたら隣接するブロック間の中点を
求め切出し点とする。
該切出し点が1つの分割領域で複数本検出された場合は
、文字外接枠の水平方向の中央位置に最も近いものを切
出し点とする。上下それぞれの分割領域で切出し点が決
定されたら、それらの切出し点により切出し位置を決定
する。もし各分割領域の一方でも切出し点が決定されな
い場合には、その決定されなかった分割領域について、
さらに3分割した領域の黒点ヒストグラムを黒点ヒスト
グラム演算回路310により作成しブロック検出回路3
11にて、3つの分割領域それぞれで黒点ヒストグラム
のブロックを検出して分割領域毎の切出し点を決定する
。分割領域の切出し点が全て検出されたら各切出し点と
水平分割線とにより文字の切出し位置とする。
以下に、第4図に示す切出し位置が決定されたパタン例
を使用して、パタンの切出方法を説明する。また、第4
図は、第1図のブロック図におけるパタンバッファ30
2に格納されているパタンおよび切出し位置を示してい
る。座標は横軸をY軸。
縦軸をY軸としておシ、パタンバッファ302は第4象
限に位置しているものとする。XMおよびNはパタンバ
ッファ302の大きさを示しておシ、本実施例において
はXM=YM=128メツシュとした。PRおよびPB
はパタンバッファ302に格納されているパタンの外接
枠を示すものでX−0゜X=PR,Y=0 、Y=PR
の4本の直線により表わされる。第4図において600
 、601はパタン、602で示される折れ線は切出し
位置を示している。
y3の分割線により上下の分割領域に分けてそれぞれの
領域の黒点ヒストグラムのブロック検出を行いそれぞれ
の分割領域の切出し点を求めると上側はX、と検出され
るが下側は切出し位置を検出することが出来ない。そこ
で下側のy3からPBまでの領域について予め指定され
ている点y41 ysで3分割する。次にそれぞれの分
割領域についてその領域の黒点ヒストグラムによりブロ
ック検出を行い切出し点を決定し、X2およびX3を得
る。以上により文字の切出し線が、折れ線602のよう
に決定される。よって文字外接枠と該折れ線602で示
される多角形内のパタン600 、601を次段に転送
する。
次に、第5図に示すフローチャートに基づいて本実施例
の流れを詳細に説明する。第5図においテ3700で処
理を開始する。5701でラインバッファ301の読出
し位置を先頭列にセットし、初期化を行った後、570
2でラインバッファ301に格納されたパタンデータを
1列読み出し切換回路305を介し黒点ヒストグラム作
成回路306にて黒点ヒストグラムを作成し1行ヒスト
グラムメモリ307に格納する。5703においては1
行分全ての黒点ヒストグラムの作成終了を検出し、1行
全て作成されるまで8702の処理を繰シ返す。570
4においては処理した文字を管理し、1行中全部の文字
の切出しが終了するまで以下の処理を繰り返す。
5705では黒点ヒストグラムを1行ヒストグラムメモ
リ307よυ読出し、黒点ヒストグラムの始点、および
終点を検出しブロックとする。また、該ブロックの長さ
と閾値γ8.γ2とを比較し細文字で構成されるブロッ
クであるかを保持しておく。8706においてはブロッ
ク検出回路311においてブロックの外接枠を検出し、
その外接枠内のパタンデータをパタンバッファ302に
転送する。5707ニオいては前記保持されたブロック
の長さの判定結果により、1文字であればパタンバッフ
ァ302のパタンデータを出力段へ転送し次の文字の処
理へ進む、2文字以上であれば、以下の処理を行う。
5708において文字外接枠内の文字パタン列に垂直方
向の黒点ヒストグラムを指定された分割領域毎に作成し
、パタンヒストグラムメモリ308に格納する。570
9で文字外接枠の分割位置を中央に選定し、5710で
黒点ヒストグラム演算回路310で2分割された上下の
分割領域の黒点ヒストグラムをそれぞれ作成し、パタン
ヒストグラムメモリ308に格納する。5711では5
710で作成された2つの領域の黒点ヒストグラムのブ
ロックを検出し、切出し点を決定する。5712では各
分割領域の切出し点より位置を判定し、5713で全て
の分割領域で決定済であれば、5714で文字の切出し
位置を検出し、5715でパタンを次段へ転送し、次の
文字の処理へ進む。5713において、切出し点が決定
されなかった領域がある場合には5717へ進み、該領
域についてさらに3分割する分割点を決定し、5710
へ進み再度分割領域毎の黒点ヒストグラムを作成し、ブ
ロック検出して分割領域の切出し点を決定する。以上の
処理により文字の切出し位置を決定する。
本実施例においては、切出し点が検出できない分割領域
は1回の再分割で切出し点が検出できたが、切出し点が
検出できない領域について上記切出し点検出処理を繰返
し実施して切出し点を検出することにより、より複雑に
重った文字を切出すことも可能である。
以上のように、本実施例によれば、前後の文字パタンか
当該文字パタンに重なった場合でも、当該文字パタンか
欠落したシ、前後の文字パタンの一部が混入することな
く文字パタンの切出しを行うことが出来る。
さらに、本実施例においては、2文字が重なり合った場
合を示したが、3文字以上重なり合った場合においても
、重なり合った文字の先頭より2文字を基準に順次切出
し点を決定することにより同様な効果を得ることが出来
る。
(発明の効果) 以上説明したように、本発明によれば、文字外接枠を水
平方向に分割して黒点ヒストグラムを作成し、分割領域
毎に切出し位置を決定しているので当該文字の一部が欠
落したり、他の文字の一部が混入することなく精度の高
い文字切出しを行うことが出来る。分割領域の切出し点
が決定されない分割領域のみについて、切出し点が検出
されるまで繰り返し再分割を行っているので隣接する文
字が複雑に重っている場合でも処理時間が早く精度の良
い切出しを行うことが出来る。分割領域毎の黒点ヒスト
グラムを予め指定された領域数分を1回のパタンバッフ
ァの走査により作成しているので処理時間の速い文字切
出しを実現することが可能である。また、単なる黒点の
計数という処理により作成される黒点ヒストグラムを利
用して高精度な文字切出しを実現しているので簡単な回
路構成で実現することが可能である。
さらに、本発明を用いることにより、隣接した文字が重
9合った場合に切出しが可能であるので文字記入枠の間
隔を小さくすることができ1行当りの読取可能文字数を
増やすことができる。従つて多くの種類の帳票等の記録
媒体に対応でき、帳票設計の自由度が犬きく、従って性
能のよい光学式文字認識装置が実現出来るという効果が
ある。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
第1図の実施例の文字外接枠内の黒点ヒストグラムを作
成するだめのブロック図、第3図はパタンヒストグラム
メモリの構成図、第4図は切出し位置が決定されたパタ
ン例を示す図、第5図は第1図の実施例の文字切出し処
理を示すフローチャート、第6図は従来の文字切出し方
式によるパタン例を示す図、第7図(a) 、 (b)
は従来の方式で問題となるパタン例を示す図である。 300・・・画像信号、301・・・ラインバッファ、
302・・・パタンバッファ、303・・・Xアドレス
カウンタ、304・・・Xアドレスカウンタ、305 
、309・・・切換回路、306・・・黒点ヒストグラ
ム作成回路、307・・・1行ヒストグラムメモリ、3
08・・・パタンヒストグラムメモリ、310・・・黒
点ヒストグラム演算回路、311・・・ブロック検出回
路、312・・・制御回路、400・・・黒点ヒストグ
ラム、401・・・Xアドレスカウンタの出力、402
・・・領域アドレスカウンタ、403・・・Yアドレス
カウンタの出力、404・・・分割情報、405・・・
分割位置指定回路、410・・・パタンヒストグラムメ
モリの出力、411・・・一致信号。

Claims (2)

    【特許請求の範囲】
  1. (1)帳票上に記入された文字列を光電変換して得られ
    る量子化された文字パタン列を格納するラインバッファ
    メモリを備え、該文字パタン列を1文字毎に分離して抽
    出する文字切出し方式において、 前記ラインバッファメモリを文字パタン列の列方向に1
    列毎に走査して列方向の黒点ヒストグラムを作成し、第
    1の閾値より大きい黒点ヒストグラムが連続して第2の
    閾値以上続く列方向の黒点ヒストグラムの幅と第3の閾
    値とを比較して該幅が何文字分に相当するかを判定する
    判定手段と、前記列方向の黒点ヒストグラムの幅に対応
    する文字パタン列を行方向に1行毎に走査して作成した
    行方向の黒点ヒストグラムと前記列方向の黒点ヒストグ
    ラムとに基づいて文字外接枠を検出する外接枠検出手段
    と、 前記外接枠検出手段で検出された文字外接枠内の文字パ
    タン列を保持するパタン記憶手段と、前記文字外接枠内
    を水平方向に分割した分割領域毎に1列毎走査した列方
    向の黒点ヒストグラムを作成する黒点ヒストグラム作成
    手段と、 前記黒点ヒストグラム作成手段で作成した黒点ヒストグ
    ラムを分割領域毎に記憶するヒストグラム記憶手段と、 前記ヒストグラム記憶手段より所望の分割領域の黒点ヒ
    ストグラムの連続するブロックを検出し該分割領域の切
    出し点を決定する決定手段とを有し、 前記決定手段で切出し点が決定できない分割領域に対し
    、該分割領域を水平方向に再分割し、前記パタン記憶手
    段、黒点ヒストグラム作成手段、ヒストグラム記憶手段
    及び決定手段を用いて再分割領域のブロックを検出し、
    全ての分割領域の切出し点が決定できるまで上記再分割
    処理を繰返し、決定した各分割領域の切出し点及び水平
    方向の分割線に基づいて文字切出し位置を決定すること
    を特徴とする文字切出し方式。
  2. (2)前記黒点ヒストグラム作成手段は文字外接枠内の
    1回の走査で分割領域毎の黒点ヒストグラムを作成する
    ことを特徴とする特許請求の範囲第1項記載の文字切出
    し方式。
JP60261488A 1985-11-22 1985-11-22 文字切出し方法 Expired - Lifetime JPH07120390B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60261488A JPH07120390B2 (ja) 1985-11-22 1985-11-22 文字切出し方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60261488A JPH07120390B2 (ja) 1985-11-22 1985-11-22 文字切出し方法

Publications (2)

Publication Number Publication Date
JPS62121589A true JPS62121589A (ja) 1987-06-02
JPH07120390B2 JPH07120390B2 (ja) 1995-12-20

Family

ID=17362603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60261488A Expired - Lifetime JPH07120390B2 (ja) 1985-11-22 1985-11-22 文字切出し方法

Country Status (1)

Country Link
JP (1) JPH07120390B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63313287A (ja) * 1987-06-16 1988-12-21 Fujitsu Ltd 食い込み文字切り出し方式
JPS6472209A (en) * 1987-09-09 1989-03-17 Ibm Detector for collision between objects
JPH01124082A (ja) * 1987-11-10 1989-05-16 Matsushita Electric Ind Co Ltd 文字認識装置
JPH02128292A (ja) * 1988-11-09 1990-05-16 Nec Corp 光学文字読取装置
JPH02128293A (ja) * 1988-11-09 1990-05-16 Nec Corp 光学文字読取装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63313287A (ja) * 1987-06-16 1988-12-21 Fujitsu Ltd 食い込み文字切り出し方式
JPS6472209A (en) * 1987-09-09 1989-03-17 Ibm Detector for collision between objects
JPH01124082A (ja) * 1987-11-10 1989-05-16 Matsushita Electric Ind Co Ltd 文字認識装置
JPH02128292A (ja) * 1988-11-09 1990-05-16 Nec Corp 光学文字読取装置
JPH02128293A (ja) * 1988-11-09 1990-05-16 Nec Corp 光学文字読取装置

Also Published As

Publication number Publication date
JPH07120390B2 (ja) 1995-12-20

Similar Documents

Publication Publication Date Title
JP3343864B2 (ja) 語体の分離方法
JP3253356B2 (ja) 文書画像の領域識別方法
EP0843275B1 (en) Pattern extraction apparatus and method for extracting patterns
JPH03122773A (ja) 画像形成装置
JPH05242298A (ja) 記号列の認識方法
JPS63158678A (ja) 単語間スペ−ス検出方法
JPS62121589A (ja) 文字切出し方法
JP2868134B2 (ja) 画像処理方法及び装置
JP2890306B2 (ja) 表領域分離装置および表領域分離方法
JPS6311832B2 (ja)
JP2796561B2 (ja) 表形式文書認識方式
JP3153439B2 (ja) 文書画像傾き検出方法
JPS615383A (ja) 文字パタ−ン分離装置
JPS61196381A (ja) 文字切出し方式
JP2789622B2 (ja) 文字/図形領域判定装置
JP2003317107A (ja) 罫線抽出方法及び装置
JPS62126485A (ja) 文字切出し方式
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JPH02278104A (ja) 文書画像の傾き角検出方法
JPH03268181A (ja) 文書読み取り装置
JP2954218B2 (ja) 画像処理方法及び装置
JPS61160180A (ja) 文字列方向判別装置
JPH07120392B2 (ja) 文字パターン切り出し装置
JPH0660220A (ja) 文書画像の領域抽出方法
JP2918363B2 (ja) 文字分類方法及び文字認識装置