JP2888885B2 - 文字切出し装置 - Google Patents

文字切出し装置

Info

Publication number
JP2888885B2
JP2888885B2 JP1279554A JP27955489A JP2888885B2 JP 2888885 B2 JP2888885 B2 JP 2888885B2 JP 1279554 A JP1279554 A JP 1279554A JP 27955489 A JP27955489 A JP 27955489A JP 2888885 B2 JP2888885 B2 JP 2888885B2
Authority
JP
Japan
Prior art keywords
character
scanning
area
line
mask
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1279554A
Other languages
English (en)
Other versions
JPH03141482A (ja
Inventor
晃治 伊東
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1279554A priority Critical patent/JP2888885B2/ja
Publication of JPH03141482A publication Critical patent/JPH03141482A/ja
Application granted granted Critical
Publication of JP2888885B2 publication Critical patent/JP2888885B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、帳票類に記載された文字図形の原画像パ
タンから、一単位の文字図形パタンを切出すための文字
切出し装置に関する。
(従来の技術) 従来より文字認識処理において、行単位に格納された
文字図形の原画像パタン(データ)から1文字分のパタ
ン(データ)を分離することが行なわれている。
この分離に広く用いられている従来技術では、1行分
の原画像パタンを文字行方向に垂直な列方向に走査して
各主走査位置毎に文字線部分を表す黒ビットを累積し1
行分の画像パタンに関する黒ビットのヒストグラムを作
成する。そして各主走査位置毎に累積黒ビット数を予め
定めた特定の値Sと比較し、行方向における文字始端及
び終端の位置として累積黒ビット数がS以上となる主走
査位置及びSより小さい値となる主走査位置を検出し、
文字始端から終端までの領域のパタンを1文字のパタン
として分離する(切出す)。
しかしこの従来技術では、隣接する文字同士がオーバ
ーラップする又は接触する場合、これら文字を表す黒ビ
ットの分布領域が重なってひとつとなり、これがため一
文字分のパタンを正しく切出すことができなかった。
このような問題点を解決する従来技術として、文献I:
特公昭62−46039号公報に開示されている技術がある。
この従来技術は、一定幅の帯状の文字枠内に記入され
た複数の文字の原画像パタンから一文字分のパタンを切
出す技術であり、この従来技術においては、文字枠の一
方の枠線から文字線部までの列方向における第一文字距
離の変化と、文字枠の他方の枠線から文字線部までの列
方向における第二文字距離の変化とを検出し、これら文
字距離の変化が所定以上変化した変化点を検出し、一方
の枠側にて検出された第一の変化点と他方の枠側にて検
出された第二の変化点との間の少なくとも文字行方向に
おける距離が所定距離内にある一対の変化点を一つの組
として検出し、この一対の変化点の位置に対応して文字
の切出し位置を決定する。この結果、隣接する文字同士
がオーバーラップする場合にも、これら接触文字を精度
良く分離して一文字分のパタンを切出すことができる。
(発明が解決しようとする課題) しかしながら上述した文献Iの従来技術では、第一文
字距離の変化を検出するために文字枠の全面に関して原
画像パタンを走査し、さらに第二文字距離の変化を検出
するために文字枠の全面に関して原画像パタンを走査す
る必要があり、これら2回の走査を行なうために処理速
度が遅くなるという問題点があった。
この発明の目的は上述した従来の問題点を解決するた
め、文字同士がオーバーラップ又は接触している場合に
少ない走査量で原画像パタンから一文字分のパタンを切
出すことができる文字切出し装置を提供することにあ
る。
(課題を解決するための手段) この目的の達成を図るため、この発明の文字切出し装
置は、 文字図形の原画像パタンから一単位の文字図形パタン
を切出す文字切出し装置において、 1行分の原画像パタンを行方向と垂直な列方向に投影
して得られる列方向の累積黒ビット数のヒストグラムに
基づいて、1行分の原画像パタンの文字線領域を検出す
るブロック検出手段と、 文字線領域の行方向における長さが所定の閾値を越え
るとき、当該文字線領域を接触文字領域とみなし、この
接触文字領域内に局所領域を設定し、この局所領域の列
方向の累積黒ビット数のなかから最小の累積黒ビット数
を検出し、この最小の累積黒ビット数を得た行方向の位
置及び当該位置近傍の領域を包含するマスク走査領域を
設定する走査領域設定手段と、 走査経路がそれぞれ異なる複数の走査線マスクを用い
てマスク走査領域内の原画像パタンを走査し、走査線マ
スクの走査経路のなかから走査線路上の黒ビット数が最
小となる最小走査経路を検出するマスク走査手段と、 最小走査経路の位置に基づき設定した分割線で接触文
字領域を分割し、該分割した接触文字領域毎の文字図形
パタンを一単位の文字図形パタンとして切出す文字切出
し手段とを備えて成ることを特徴とする。
(作用) このような構成の文字切出し装置によれば、行方向に
おける長さが所定の閾値を越える文字線領域を検出した
場合、当該文字線領域を隣接する文字図形同士がオーバ
ーラップする或は接触する接触文字領域とみなす(以
下、これら互いにオーバーラップ或は接触する文字図形
を接触文字図形と称す)。そしてこの接触文字領域を、
接触文字図形の各文字図形毎に分割するための分割線を
設定する。この分割線で分割された接触文字領域の文字
図形パタンを一単位例えば一文字分のパタンとして原画
像データから切出す。
分割線の設定に当っては、接触文字領域に対しマスク
走査領域を設定し、このマスク走査領域内を、走査経路
が異なる複数の走査線マスクを用いて走査する。そし
て、走査線マスクの走査経路のなかからその経路上の黒
ビット数が最小となる走査経路を検出する。この最小走
査経路上の黒ビット数が最小であるがゆえに、最小走査
経路及びこの経路近傍領域では接触文字図形の文字線の
重なりは最も少ないか又は重なりは無いとみなせる。
従って最小走査経路及びこの経路近傍領域を包含する
領域内の任意好適な位置に分割線を設定する(例えば最
小走査経路を分割線とする)ことによって、精度良く一
単位の文字図形パタンを切出せる。
(実施例) 以下、図面を参照し、この発明の実施例につき説明す
る。尚、図面はこの発明が理解できる程度に概略的に示
されているにすぎず、従って各構成成分の形状、配設位
置及び寸法を図示例に限定するものではない。
第1図はこの発明の実施例の構成の説明に供する機能
ブロック図である。
この実施例の文字切出し装置10は、第1図にも示すよ
うに、1行分の原画像パタンを行方向と垂直な列方向に
投影して得られる列方向の累積黒ビット数のヒストグラ
ムに基づいて、1行分の原画像パタンの文字線領域を検
出するブロック検出手段12と、文字線領域の行方向にお
ける長さが所定の閾値を越えるとき、当該文字線領域を
接触文字領域とみなし接触文字領域のマスク走査領域の
位置を設定する走査領域設定手段14と、走査経路がそれ
ぞれ異なる複数の走査線マスクを用いてマスク走査領域
内の原画像パタンを走査し、走査線マスクの走査経路の
なかから走査経路上の黒ビット数が最小となる最小走査
経路を検出するマスク走査手段16と、最小走査経路の位
置に基づき設定した分割線で接触文字領域を分割し、こ
の分割した接触文字領域毎の文字図形パタンを一単位の
文字図形パタンとして切出す文字切出し手段18とを備
え、さらに走査線マスクを格納するマスクメモリ20を備
えて成る。
以下、この実施例につきより詳細に説明する。
この実施例では、原画像パタンとして、光電変換部22
からの画像パタンを用いる。
光電変換部22は、帳票類の文字行記載領域を1行ずつ
光学的に走査し、文字行記載領域からの光信号Lを光電
変換して量子化した画像パタン、例えば文字線部を黒ビ
ット及び文字背景部を白ビットで表現した白黒2値のデ
ィジタル信号を出力する。画像メモリ24は光電変換部22
からの1行分の画像パタンを原画像パタンとして格納す
る。
第2図は画像メモリ24に格納された原画像パタンの例
であり、同図において26は原画像パタンを示す。
第2図にも示すように、画像メモリ24上には任意好適
な位置を原点OとするX−Y座標系を設定しており、こ
の座標系で表される画素位置の原画像パタンのデータを
自在に読出せるように構成している。第2図に示す例で
は、文字行が横書きの例なので、仮想的に、X軸方向を
文字行に沿う行方向及びY軸方向を行方向と直交する列
方向とする。
画像メモリ24に原画像パタンが格納されると、ブロッ
ク検出部12は1行分の原画像パタン26を列方向に投影し
て列方向の累積黒ビット数のヒストグラムを作成する。
第3図は第2図の画像パタン26を走査して作成したヒ
ストグラムの例を示す図であり、同図の縦軸は累積黒ビ
ット数及び横軸は第2図のX軸に対応するX軸である。
ブロック検出手段12はヒストグラムの作成のために、
列方向を主走査方向として画像メモリ24内の原画像デー
タ26を走査する。そして各副走査位置X毎に走査線SC1
(第2図参照)上の黒ビット数を累積し、各位置X毎の
累積黒ビット数から成るヒストグラムを得る。
次いでブロック検出手段12はヒストグラムを調べ、原
画像データ26の行方向の文字線領域を検出する。
第4図は第3図のヒストグラムを調べて検出した文字
線領域の分布状態を示す図であり、同図においては、第
3図のX軸に対応するX軸を横軸とすると共に、検出さ
れた文字線領域の位置をハッチングを付した矩形領域で
表す。第4図中、検出された文字線領域を符号Bn(n=
1、2、3)を付して示した。また第4図において、文
字線領域Bnの始端位置及び終端位置を符号XSn及びXEn
付して示し、さらに理解の助けのために、第2図及び第
3図において第4図の始端位置XSn及び終端位置XEnに対
応する位置を符号XSn及びXEnを付して示した。以下の説
明では検出された文字線領域Bn、始端位置XSn及び終端
位置XEnを単に文字線領域B、始端位置XS及び終端位置X
Eとも表現する。
ブロック検出手段12は文字線領域Bを検出するため、
列方向の累積黒ビット数が予め定めた閾値THL1(例えば
THL1=1)未満からTHL1以上となったときの副走査位置
XS及びTHL1以上からTHL1未満になったときの副走査位置
XEを検出し、これら位置XS及びXE間のTHL1以上の累積黒
ビット数が連続する領域Bの行方向における長さΔXを
求める。そして長さΔXを予め定めた閾値THL2(例えば
THL2=2)と比較し、閾値THL2以上の長さΔXを有する
領域Bを文字線領域として検出する。このときの位置XS
及びXEは、文字線領域Bの行方向の始端及び終端位置で
ある。閾値THL1及びTHL2を任意好適に設定することによ
って原画像データ26中のノイズ領域を文字線領域として
検出するのを避けることができる。
文字線領域Bが検出されると、走査領域設定手段14
は、ブロック検出手段12から入力した文字線領域Bの長
さΔXを予め定めた閾値THL3と比較する。閾値THL3は文
字線領域Bが何単位分の文字図形パタンを包含するか判
定するためのものであり、この実施例では1個の任意好
適な値の閾値THL3を設定し、閾値THL3以下の長さΔXを
有する文字線領域Bは1単位分の文字図形パタンを包含
し、閾値THL3を越える長さΔXを有する文字線領域Bは
オーバーラップ又は接触する文字図形(接触文字図形)
例えば第2図の数字「1」及び「2」の2単位分のパタ
ンを包含する接触文字領域であるとみなす。
走査領域設定手段14は長さΔXが閾値THL3以下のとき
当該長さΔXの文字線領域Bの始端位置XS及びXEと、当
該文字線領域Bを分割しないことを表す情報Pとを出力
する。
また走査領域設定手段14は長さΔXが閾値THL3を越え
るとき当該長さΔXの文字線領域Bは接触文字図形を包
含する接触文字領域であるのでこれら文字図形を一単位
毎に分離するための分割線を得るべくマスク走査領域の
位置を設定し、当該接触文字領域Bの始端位置XS及び終
端位置XEと、マスク走査領域の行方向の始端位置XMS
び終端位置MMEと、当該接触文字領域Bを分割すること
を示す情報Qとを出力する。
この実施例では、接触文字領域Bの全領域又は局所領
域の列方向の累積黒ビット数のなかから最小の累積黒ビ
ット数を検出し、この最小の累積黒ビット数を得た行方
向の位置Xmin及び当該位置近傍の領域を包含するように
マスク走査領域の位置XMS及びXMEを設定する。これらX
MS及びXMEの設定は、例えばXS≦MMS<XME≦XEとなるよ
うに行なえばよい。
第5図はマスク走査領域の設定例を示す図であり、第
3図と同様の列方向の累積黒ビット数のヒストグラムを
示す。
第5図に示す例では、接触文字領域Bの任意好適な位
置例えば中央部に局所領域を設定しており、例えば行方
向の長さがΔX/2となるように設定した接触文字領域B
内のXC−(ΔX/4)≦X≦XC+(ΔX/4)の範囲を局所領
域とする。但し、XCは行方向における接触文字領域Bの
中心位置を表す。
またマスク走査領域30を例えば行方向の長さがX/4と
なるように設定しており、例えば接触文字領域B内のX
min−(ΔX/8)≦X≦Xmin+(ΔX/8)の範囲の領域を
マスク走査領域30とする。
マスク走査手段16は走査領域設定手段14より情報P又
はQを入力し、これら情報に応じた動作を行なう。
情報Pを入力した場合、マスク走査手段16は走査領域
設定手段14から入力した情報Pと文字線領域Bの位置XS
及びXEとを出力する。
また情報Qを入力した場合マスク走査手段16は走査領
域設定手段14から入力した接触文字領域Bの位置XS及び
XEと、マスク走査領域の位置XMS及びXMEとに基づき、走
査線マスクを用いた処理のための動作を開始する。この
動作につき第6図〜第8図を参照し、説明する。
第6図は接触文字領域の列方向の位置検出の説明に供
する図であり、第2図と同様の原画像パタンを示す。
まずマスク走査手段16は接触文字領域Bの列方向の始
端位置YS及び終端位置YEを検出する。
これら位置YS、YEの検出のため、マスク走査手段16
は、接触文字領域B(XS≦X≦XEの領域)内の原画像パ
タン26を行方向に投影して行方向の累積黒ビット数のヒ
ストグラムを作成する。この作成では、行方向を主走査
方向として接触文字領域Bの原画像データ26を走査し、
各副走査位置Y毎に走査線SC2(第6図参照)上の黒ビ
ット数を累積し、各位置Y毎の累積黒ビット数から成る
ヒストグラムを得る。そしてこのヒストグラムを調べブ
ロック検出手段12の行方向の文字線領域Bの検出の場合
と同様にして、接触文字領域Bにおける列方向の文字線
領域の始端位置YS及び終端位置YEを検出する。
第6図にも示すように、点(XS、YS)、(XE、YS)、
(XS、YE)及び(XE、YE)を結ぶ矩形枠は接触文字図形
の外接枠Gとなる。
そしてマスク走査手段16は検出した位置YS及びYEに基
づいて、マスク走査領域30の列方向の始端位置YMS及びY
MEを設定する。これら位置YMS及びYMEの設定は、例えば
1行分の画像パタン26の格納領域内においてYMS≦YS、Y
E≦YMEとなるように行なえばよいが、以下の説明ではY
MS=YS及びYME=YEとする。
マスク走査領域30の位置YMS、YMEを設定すると、次に
マスク走査手段16はマスク走査領域30(XMS≦X≦XME
つYMS≦Y≦YMEの領域)のマスク走査を行なう。
第7図はマスク走査手段のマスク走査処理の流れの一
例を示す図である。
マスク走査手段16は、マスク走査領域30の位置YMS、Y
MSを設定し終えると、当該マスク領域30を設定した接触
文字領域Bに関してのマスク走査を開始する(STAR
T)。
マスク走査を開始したマスク走査手段16は、走査線マ
スクの走査経路SC3(後述する第7図参照)上の累積黒
ビット数の最小を検出するための最小値レジスタ(MIN
レジスタ)に初期値例えば1000を設定してMINレジスタ
を初期化し(S1)、そして各走査線マスク毎に付された
番号(No)を指定するための走査Noカウンタに初期値例
えば1を設定して走査Noカウンタを初期化する(S2)。
次にマスク走査手段16は、走査Noカウンタの格納値で
指定される番号の走査線マスクをマスクメモリ20から読
み込み、マスク走査領域30内において走査線マスクの走
査経路SC3上の黒ビット数を計数(累積)し、計数結果
をBLACKレジスタに保存する(S3)。
第8図(A)〜(F)は6種類の走査線マスクを1組
の走査線マスクとして用意した例を示す図であり、同図
(A)、(B)、(C)、(D)、(E)及び(F)は
それぞれ走査No1、2、3、4、5及び6が付された走
査線マスクを示す。これら図において線分、、、
及びはそれぞれ直線X=XMS、Y=YMS+ΔY/2、X
=XME、Y=YMS+ΔY/4及びY=YMS+(ΔY・3/4)上
の走査経路を示し(但しΔYは位置YMS及びYMEの間の列
方向における離間距離)、第8図にも示すように、行方
向の走査経路と、列方向の走査経路、又はと、
行方向の走査経路とを任意好適に組合せることによっ
て6種の走査経路SC3を形成している。
S3の次に、マスク走査手段16はBLACKレジスタの内容
が0か否か、すなわち走査経路SC3上に黒ビットが無い
走査経路SC3を検出したか否かを判定する(S4)。
S4でBLACKレジスタの内容が0でなければマスク走査
手段16はS5の処理を行なう。
第6図のマスク走査領域30を第8図(A)の走査No1
の走査線マスクを用いて走査した場合、走査経路SC3上
の累積黒ビット数は2となり、従ってBLACKレジスタに
は2が保存されS4に次いでS5の処理が行なわれる。
S5では、BLACKレジスタ及びMINレジスタの内容(格納
値)を比較する。
S5でBLACKレジスタの内容がMINレジスタの内容より小
さければ、走査経路SC3上の累積黒ビット数の最小を検
出すべくMINレジスタの内容をBLACKレジスタの内容に書
換え、これと共に最小走査経路SC3を検出すべくSCANレ
ジスタの内容をこのときの走査Noレジスタの内容に書換
え(S6)、その後走査Noレジスタの格納値に1を加算し
て走査Noを更新する(S7)。
走査No1の走査では、BLACKレジスタの内容が2でMIN
レジスタの内容が1000であるのでS5の次にS6、S7が行な
われる。
またS5でBLACKレジスタの内容がMINレジスタの内容と
等しいか大きければ、S5の次にS6を行なわずにS7の処理
を行なう。
S7の次に、マスク走査手段16はマスクメモリ20に格納
された走査線マスク(例えば第8図に示す6種の走査線
マスク)の全てにつきマスク走査を終了したか否かを判
定する(S8)。
S8でマスク走査を行なっていない走査線マスクが残っ
ていたらS3の処理に戻る。
またS8で走査線マスクの全てにつきマスク走査を終了
していれば、SCANレジスタの格納値で指定される番号の
走査線マスクの走査経路SC3が最小走査経路であるの
で、当該最小走査経路の位置と、接触文字領域Bの行方
向の位置XS、XEと情報Qとを出力し(S9)、次いでマス
ク走査処理を終了し、そして次の接触文字領域Bが検出
され次の接触文字領域Bにつきマスク走査領域30の位置
YMS、YMEが設定されたらS1から処理を開始すべく待機す
る(END)。
またS4でBLACKレジスタの内容が0であった場合に
は、マスク走査手段16はこのときの走査Noレジスタの内
容(格納値)で指定される走査線マスクの走査経路SC3
は最小走査経路であるとみなしAレジスタの内容をこの
ときの走査Noレジスタの内容に置換え(S10)、その後S
9の処理を行なう。
第6図のマスク走査領域30を第8図(C)の走査No3
の走査線マスクを用いて走査した場合、走査経路SC3上
の累積黒ビット数は0となりS4でBLACKレジスタの内容
が0であるためS4の次にS10の処理が行なわれる。この
場合S10では最小走査経路SC3の位置として、例えば走査
経路SC3の端点D1(XME、YS)、D4(XMS、YME)及び折れ
点D2(XME、YS+3・ΔY/4)、D3(XMS、YS+3・ΔY/
4)の位置が出力される。
文字切出し手段18はマスク走査手段16から情報P及び
文字線領域Bの行方向の位置XS、XEを受信すると、1行
分の画像データ26の位置XS、XE間のパタンを一単位の文
字図形パタンとして切出し出力する。
また、文字切出し手段18はマスク走査手段16から情報
Q、最小走査経路の位置D1〜D4及び接触文字領域Bの位
置XS、XEを入力すると、位置D1〜D4及び接触文字領域B
の位置XS、XEに基づき接触文字領域Bを分割し、分割し
た接触文字領域B内のパタンをそれぞれ切出し一単位の
文字図形パタンとして出力する。第6図にも示すよう
に、例えば点(XME、0)、D1、D2、D3、D4及び(XMS
Yedg)を結ぶ線分を分割線として接触文字領域Bを分割
すればよい。
この発明は上述した実施例にのみ限定されるものでは
なく、従って各構成成分の数値的条件、範囲、形状、位
置関係、動作、入出力信号の流れを任意好適に変更でき
る。
例えば上述した実施例では走査線マスクとして6個の
マスクを用意したが、マスク数を増加することにより一
単位の文字図形パタンの欠けがない状態で又は欠けを最
小限度に抑えて精度良く文字切出しを行なえるようにな
る。
第9図(A)〜(H)は8種類の走査線マスクを用意
した例を示す図である。これら図において線分、、
及びはそれぞれ直線Y=YMS+ΔY/8、Y=YMS+Δ
Y・3/8、Y=YMS+ΔY・5/8及びY=YMS+ΔY・7/8
上の走査経路を示し、第9図にも示すように、走査経路
と、走査経路、、又はと、走査経路とを任
意好適な位置、長さで結合し組合せることによって8種
の走査経路SC3を形成している。これら8種類の走査線
マスクにおいて行方向の走査経路、、、の位置
はΔY/8を単位として変化し、従ってこのΔY/8単位の変
化に応じて精度良く接触文字領域を分割し一単位の文字
図形パタンの切出しが行なえる。
走査線マスクの走査経路の形状は任意好適に変更する
ことができ、上述の走査線マスクの他、文字切出し対象
となる文字図形の連続する2文字(或は接触文字図形)
を分離するために、最も効率よく分離できる走査線マス
クを予め統計処理により求め、当該マスクをマスクメモ
リに登録し用いるようにしてもよい。
また上述の実施例では画像メモリに1行単位に格納し
た原画像パタンから一単位の文字図形パタンを切出す例
につき説明したが、複数行単位に原画像パタンを格納
し、1行分の原画像パタンを切出して或は行位置等の書
式情報を用いて1行分の原画像パタンを走査するように
し上述と同様にして一単位の文字図形パタンを切出すよ
うにしてもよい。
またマスク走査領域は位置Xmin及びその近傍領域を包
含する領域に限定されず、任意好適に設定することがで
き、例えば接触文字領域の中央部の領域をマスク走査領
域としてもよい。
また一単位の文字図形パタンの列方向及び行方向にお
ける切出し位置は上述の実施例のものに限定されず任意
好適に変更することができる。
また原画像パタンとして背景処理等の前処理が施され
た画像パタンを用いてもよい。
(発明の効果) 上述した説明からも明らかなように、この発明の文字
切出し装置によれば、1行分の原画像パタンを列方向に
投影して得たヒストグラムを調べて文字線領域の行方向
の位置を検出し、この行方向の位置から文字線領域の行
方向の長さを求める。そして行方向の長さが所定の閾値
を越える文字線領域(接触文字領域)を検出した場合に
のみ、マスク走査領域内を走査線マスクを用いて走査し
て走査線マスクの走査経路につきその経路上の累積黒ビ
ット数が最小となる最小走査経路を検出し、この最小走
査経路の位置に基づいて接触文字領域を分割し、一単位
の文字図形パタンを切出す。
最小走査経路の位置に基づいて一単位の文字図形パタ
ンを切出すので、隣接する文字同士が手書きによりオー
バーラップ又は接触して帳票類に記入された場合でも、
一単位の文字図形パタンの欠けを無くし或は欠けが非常
に少ない状態で切出しを精度良く行なえる。
また行方向の長さが所定の閾値を越える文字線領域
(接触文字領域)を検出した場合にのみ、マスク走査領
域内を走査線マスクを用いて走査するので、従来の文字
切出し処理よりも原画像パタンの走査量を少なくするこ
とができ、これがため高速に文字切出しを行なえる。
従って本発明を文字認識装置に利用すれば高速な文字
認識装置が実現可能となる。
【図面の簡単な説明】
第1図はこの発明の実施例の構成をの説明に供する機能
ブロック図、 第2図は原画像パタンの例を示す図、 第3図は列方向の累積黒ビット数のヒストグラムの例を
示す図、 第4図は文字線領域の分布状態の例を示す図、 第5図は実施例におけるマスク走査領域の設定例を示す
図、 第6図は実施例における接触文字領域の列方向の位置検
出の説明に供する図、 第7図は実施例におけるマスク走査処理の流れの一例を
示す図、 第8図(A)〜(F)は6種類の走査線マスクを用意し
た例を示す図、 第9図(A)〜(H)は8種類の走査線マスクを用意し
た例を示す図である。 10……文字切出し装置、12……ブロック検出手段 14……走査領域設定手段 16……マスク走査手段、26……原画像パタン 30……マスク走査領域。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭56−68871(JP,A) 特開 昭64−38884(JP,A) 特開 昭61−117671(JP,A) 特開 昭62−127985(JP,A) 特開 平1−213770(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06K 9/34

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文字図形の原画像パタンから一単位の文字
    図形パタンを切出す文字切出し装置において、 1行分の原画像パタンを行方向と垂直な列方向に投影し
    て得られる列方向の累積黒ビット数のヒストグラムに基
    づいて、前記1行分の原画像パタンの文字線領域を検出
    するブロック検出手段と、 前記文字線領域の行方向における長さが所定の閾値を越
    えるとき、当該文字線領域を接触文字領域とみなし、該
    接触文字領域内に局所領域を設定し、該局所領域の列方
    向の累積黒ビット数のなかから最小の累積黒ビット数を
    検出し、該最小の累積黒ビット数を得た行方向の位置及
    び当該位置近傍の領域を包含するマスク走査領域を設定
    する走査領域設定手段と、 走査経路がそれぞれ異なる複数の走査線マスクを用いて
    前記マスク走査領域内の原画像パタンを走査し、前記走
    査線マスクの走査経路のなかから走査線路上の黒ビット
    数が最小となる最小走査経路を検出するマスク走査手段
    と、 前記最小走査経路の位置に基づき設定した分割線で前記
    接触文字領域を分割し、該分割した接触文字領域毎の文
    字図形パタンを一単位の文字図形パタンとして切出す文
    字切出し手段とを備えて成ることを特徴とする文字切出
    し装置。
JP1279554A 1989-10-26 1989-10-26 文字切出し装置 Expired - Fee Related JP2888885B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1279554A JP2888885B2 (ja) 1989-10-26 1989-10-26 文字切出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1279554A JP2888885B2 (ja) 1989-10-26 1989-10-26 文字切出し装置

Publications (2)

Publication Number Publication Date
JPH03141482A JPH03141482A (ja) 1991-06-17
JP2888885B2 true JP2888885B2 (ja) 1999-05-10

Family

ID=17612584

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1279554A Expired - Fee Related JP2888885B2 (ja) 1989-10-26 1989-10-26 文字切出し装置

Country Status (1)

Country Link
JP (1) JP2888885B2 (ja)

Also Published As

Publication number Publication date
JPH03141482A (ja) 1991-06-17

Similar Documents

Publication Publication Date Title
CA1160347A (en) Method for recognizing a machine encoded character
JPH08287184A (ja) 画像切り出し装置及び文字認識装置
JP4011646B2 (ja) 行検出方法および文字認識装置
JPH07105312A (ja) 光学式文字読取装置における文字イメージのごみ除去方法及び装置
JP3006466B2 (ja) 文字入力装置
JPH04270485A (ja) 印刷文字認識装置
JP2888885B2 (ja) 文字切出し装置
KR960001645B1 (ko) 문자가 불필요한 영상과 접촉된 경우 문자에 관련하여 판독 에러를 감소시키는 광학식 문자 판독 장치
KR100295360B1 (ko) 쉐이딩알고리즘을이용한영상처리방법
JPH06187489A (ja) 文字認識装置
JP2917427B2 (ja) 図面読取装置
JP2957729B2 (ja) 行方向判定装置
JP4079411B2 (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムが格納されたコンピュータ読み取り可能な記憶媒体
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JPH07160810A (ja) 文字認識装置
JP3437296B2 (ja) 文字列高速抽出装置
JP3710164B2 (ja) 画像処理装置及び方法
JP2929919B2 (ja) 光学文字切出し装置
JPH05274472A (ja) 画像認識装置
KR930005568B1 (ko) 오 추출 라인 검출 방법
JP3196603B2 (ja) バーコード認識方法及びシステム
JPH07120392B2 (ja) 文字パターン切り出し装置
JP2980636B2 (ja) 文字認識装置
JP2878327B2 (ja) 文字切り出し装置
JPH10162104A (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees