JP2963532B2 - 行方向判定装置 - Google Patents

行方向判定装置

Info

Publication number
JP2963532B2
JP2963532B2 JP2321528A JP32152890A JP2963532B2 JP 2963532 B2 JP2963532 B2 JP 2963532B2 JP 2321528 A JP2321528 A JP 2321528A JP 32152890 A JP32152890 A JP 32152890A JP 2963532 B2 JP2963532 B2 JP 2963532B2
Authority
JP
Japan
Prior art keywords
feature
value
histogram
circumscribed rectangle
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2321528A
Other languages
English (en)
Other versions
JPH04205074A (ja
Inventor
和弘 石川
晃治 伊東
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2321528A priority Critical patent/JP2963532B2/ja
Publication of JPH04205074A publication Critical patent/JPH04205074A/ja
Application granted granted Critical
Publication of JP2963532B2 publication Critical patent/JP2963532B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、光学的文字読取装置(OCR)等において、
名刺等の文書の行方向(文字列方向)を検出する行方向
判定装置に関するものである。
(従来の技術) 従来、文字認識のために名刺の行方向を検出する行方
向判定装置としては、例えば特開昭62−166479号公報に
記載されるものがあった。以下、その構成を説明する。
第2図(A)〜(C)は、従来の行方向判定装置の原
理説明図である。
第2図(A)は名刺の画像データ1の一例を示す図で
あり、この画像データ1上にはX−Y座標系が設定され
ている。また、第2図(B)及び(C)は、第2図
(A)の画像データ1に関する水平及び垂直方向の周辺
分布が示されている。第2図(B)では縦軸にY軸及び
横軸に副走査座標Yの水平走査線上の累積黒画素数が取
られ、また第2図(C)では横軸にX軸及び縦軸に副走
査座標Xの垂直走査線上の累積黒画素数が取られてい
る。
この種の行方向判定装置では、名刺全体の画像データ
1の射影を取り、水平及び垂直方向の周辺分布を作成す
る。そして、水平方向の周辺分布の文字部領域2の先頭
の文字部領域の始端から末尾の文字部領域の終端までの
長さWXと、垂直方向の周辺分布の文字部領域2の先頭の
始端から末尾の終端までの長さWYとを得、これらの長さ
のうち、長いほうの長さを得た周辺分布の主走査方向を
文字行方向と判定する。
(発明が解決しようとする課題) しかしながら、上部構成の装置では、次のような課題
があった。
第3図(A)〜(C)は、従来装置の問題点の説明図
であり、同図(A)は他の画像データ1aの例、同図
(B)及び(C)は同図(A)の画像データ1aにおける
水平及び垂直方向の周辺分布を示す。
第3図(A)に示すように、画像データ1aにおける文
字行が名刺の局部(例えば、中央部)に集中して存在
し、かつ文字行の長さが短い場合、該画像データ1aの周
辺分布から得られる文字部領域2aの長さWXa,WYaの大小
関係はWXa<WYaとなる。そのため、行方向が実際には水
平方向であるにもかかわらず、WXa<WYaという関係か
ら、垂直方向を行方向としてしまい、誤った判定結果に
なるという問題があり、それを解決することが困難であ
った。
本発明は前記従来技術が持っていた課題として、文字
行が名刺の局部に集中して存在し、かつ文字行の長さが
短いと、行方向を必ずしも正しく判定することができな
いという点について解決した行方向判定装置を提供する
ものである。
(課題を解決するための手段) 前記課題を解決するために、第1の発明は、画像デー
タを走査して該画像データ中の文字行の行方向を判定す
る行方向判定装置において、次のような手段を備えてい
る。
即ち、第1の発明では、前記画像データを走査して前
記画像データ中の情報領域を外接矩形として検出する外
接矩形検出手段と、前記外接矩形検出手段で検出された
外接矩形より特徴点及び特徴量を検出する特徴検出手段
と、前記特徴点検出手段で検出された特徴点の位置座標
より、第1及び第2の所定範囲のうち、該第1の所定範
囲内に位置する水平方向のヒストグラム値の値を該特徴
点に対応した特徴量分だけ加算すると共に、該第2の所
定範囲内に位置する垂直方向のヒストグラム値の値を該
特徴点に対応した特徴量分だけ加算することによって水
平方向と垂直方向のヒストグラムを作成するヒストグラ
ム作成手段と、前記ヒストグラム作成手段で作成された
水平方向と垂直方向の各ヒストグラムにおいて最大ヒス
トグラム値をそれぞれ検出し、それらの検出値に基づい
て前記文字行の行方向を判定する行方向判定手段とを、
備えている。
第2の発明では、第1の発明の特徴検出手段を、前記
外接矩形の中心点、左上点、右下点、左下点及び右上点
のいずれかに基づいて前記特徴点を検出する構成にして
いる。
第3の発明では、第1の発明の特徴検出手段を、前記
外接矩形の幅、高さ、幅と高さの和、及び幅と高さのい
ずれか大きい方の値のいずれか1つに基づき1つの特徴
量を検出する構成にしている。
第4の発明では、第1の発明の特徴検出手段を、前記
外接矩形の幅を特徴量1、及び高さを特徴量2として2
つの特徴量を検出する構成にしている。
第5の発明では、第1の発明の行方向判定手段を、前
記水平方向のヒストグラムから検出された値の方が、前
記垂直方向のヒストグラムから検出された値より大きけ
れば前記文字行の行方向を水平方向と、そうでなければ
前記文字行の行方向を垂直方向と判定する構成にしてい
る。
(作 用) 第1の発明によれば、以上のように行方向判定装置を
構成したので、画像データが入力されると、外接矩形検
出手段では、該画像データを走査して文字部等の情報領
域(例えば、文字部を形成する黒画素領域)を外接矩形
として検出する。検出された外接矩形は、特徴検出手段
により、特徴点及び特徴量が検出される。ヒストグラム
作成手段では、検出された特徴点の位置座標より、第1
の所定範囲内に位置する水平方向のヒストグラム値の値
を該特徴点に対応した特徴量分だけ加算すると共に、第
2の所定範囲内に位置する垂直方向のヒストグラム値の
値を該特徴点に対応した特徴量分だけ加算することによ
り、水平方向と垂直方向のヒストグラムを作成する。行
方向判定手段では、水平方向と垂直方向の各ヒストグラ
ムにおいて、最もヒストグラム値の大きい値をそれぞれ
検出し、それらの検出された値に基づいて文字行の行方
向を判定する。これにより、情報領域の位置に誤差があ
る程度生じても、高精度に、文字行の方向の判定が行え
る。
第2の発明では、特徴検出手段により、外接矩形の中
心点及びその四隅のいずれかに着目して特徴点を検出す
るので、活字文字等の該特徴点の検出を簡単かつ的確に
行える。
第3の発明では、特徴検出手段により、外接矩形の
幅、高さ、幅と高さの和、及び幅と高さのいずれか大き
い方の値のいずれかに着目して1つの特徴量を検出す
る。さらに、第4の発明では、外接矩形の幅を特徴量
1、高さを特徴量2として2つの特徴量を検出する。そ
のため、文字の大、小等にかかわらず、特徴量の検出が
的確に行える。
第5の発明では、行方向判定手段により、ヒストグラ
ム値の大小関係から文字行の方向を判定するので、名刺
等の文書における行方向の判定が簡単に行える。
従って、前記課題を解決できるのである。
(実施例) 第1図は、本発明の一実施例を示す行方向判定装置の
概略の機能ブロック図である。
第1図において、名刺等の入力原稿を画像データの形
で読取る画像入力部10と、その読み取った画像データを
格納する画像メモリ20とを備え、該画像メモリ20の出力
側に、行方向判定装置30が接続されている。
行方向判定装置30は、画像メモリ20に格納された画像
データを走査して文字部等の情報領域(例えば、文字部
等を形成する黒画素領域)を外接矩形として検出する外
接矩形検出手段31を有し、その出力側には、外接矩形装
置メモリ32が接続されている。外接矩形位置メモリ32
は、検出された外接矩形の位置情報を保存するもので、
その出力側には、特徴検出手段33、特徴メモリ34、及び
ヒストグラム作成手段35が接続されている。
特徴検出手段33は、外接矩形位置メモリ32内の外接矩
形の位置情報より、特徴点及び特徴量を検出する機能を
有し、その特徴点の位置情報及び該特徴点に対応した特
徴量が特徴メモリ34に順次保存されるようになってい
る。ヒストグラム作成手段35は、特徴メモリ34に保存さ
れた特徴点の位置座標より、第1の所定範囲内に位置す
る水平方向のヒストグラム値の値を、該特徴点に対応し
た特徴量分だけ加算し、また該特徴点の位置座標より、
第2の所定範囲内に位置する垂直方向のヒストグラム値
の値を、該特徴点に対応した特徴量分だけ加算すること
により、水平方向と垂直方向のヒストグラムを作成する
機能を有し、その出力側には、水平方向ヒストグラムメ
モリ36及び垂直方向ヒストグラムメモリ37を介して行方
向判定手段38が接続されている。
水平方向ヒストグラムメモリ36及び垂直方向ヒストグ
ラムメモリ37は、ヒストグラム作成手段35で作成された
水平方向と垂直方向のヒストグラムをそれぞれ保存する
機能を有している。行方向判定手段38は、メモリ36,37
に保存された水平方向と垂直方向の各ヒストグラムにお
いて、最もヒストグラム値の大きい値をそれぞれ検出
し、それらの検出値に基づいて文字行の方向を判定する
機能を有している。
次に、第4図〜第12図を参照しつつ、第1図中の各回
路ブロックの動作(1)〜(5)を説明する。
(1) 画像入力部10の動作 画像入力部10は、処理対象となる入力原稿(例えば、
名刺)を走査し、画素分解して読取って文字線部を黒ビ
ット及び文字背景部を白ビットで表す白黒2値の画像デ
ータを出力する。画像メモリ20は、画像入力部10からの
画像データを走査順次に格納する。本実施例における画
像入力部10での読取り解像度は、16本1mmの解像度で行
った。
(2) 外接矩形検出手段31の動作 第4図は画像データ及び第5図は外接矩形検出結果の
一例を示す図である。第4図は画像メモリ20に格納され
た白黒2値の画像データ40の全体、また第5図の実線で
示す矩形枠は第4図の画像データ40の一例につき検出さ
れた外接矩形42を示す。
第4図に示すように、画像メモリ20上にはx−y座標
系を設定し、この座標系で表される画素位置の画像デー
タ(画素データ)40の読出しが自在に行えるようになっ
ている。例えば、名刺の読取りの際には、名刺を画像入
力部10の読取り面に載置して走査するが、このとき名刺
の角点が座標系の原点0と一致し、かつ名刺の文字行方
向がx軸に沿う方向(水平方向)及びy軸に沿う方向
(垂直方向)のいずれか一方となるように、名刺を読取
り面にセットする。そして、画像入力部10の読取り面に
おいて、名刺が載置されていない領域が白ビットで表さ
れるようにする。
また、画像データ40の処理領域(第4図中のx,y軸及
び一点鎖線で囲む領域)41は、0≦x≦XEかつ0≦y≦
YEなる範囲であるが、名刺の長手方向が水平及び垂直方
向のいずれとなっても、名刺全体の画像データを処理領
域41内に格納できるように、XE及びYEの値を名刺の長手
方向の、画像データ40上における長さよりもやや大きめ
の値に設定する。
画像入力部10が画像メモリ20へ画像データ40を格納し
終えると、第1の方向を水平方向及び第2の方向を垂直
方向とした場合の情報領域(黒画素領域)を外接矩形42
として、その始点及び終点を検出する外接矩形検出手段
31を起動する。
次に、第6図〜第9図を参照し、外接矩形検出手段31
の動作を説明する。
第6図は第1図中の外接矩形検出手段31の動作例を示
すフローチャート、及び第7図は外接矩形検出手段31を
説明する図である。なお、第6図及び第7図中のS50〜S
66,S70〜S73,…はステップ、iは階層、mはx方向に切
り出された領域番号、nはy方向に切り出た領域番号で
ある。また、この外接矩形検出手段31では、第4図に示
すように、画像メモリ20中の画像データ40を走査するこ
とにより行う。
先ず、第6図のS50〜S52において、i,n,mをそれぞれ
初期値1に初期化する。そして、領域の始点座標{xs
(i−1,m),ys(i−1,n)}、終点座標{xe(i−1,
m),ye(i−1,n)}に対し、第7図のS70に示すよう
に、y軸方向の領域をn個の領域に切り出す処理を行う
(S53)。
この切り出し処理について、第8図のy方向の切り出
し処理を説明する図を用いて説明する。始点座標{xs
(i−1,m),ys(i−1,n)}、終点座標{xe(i−1,
m)、ye(i−1,n)}で示される背景パタン43上の情報
領域44に対して、第4図に示す画像データ40中にx方向
に黒画素が1つでも存在する黒ラインを検出する。その
黒ラインのy座標値を始点y座標として抽出し、次いで
x方向に黒画素が1つも存在しない白ラインが連続して
閾値THを越える白ラインを検出する。その注目する白ラ
インの(TH+1)ライン前の黒ラインのy座標値を終点
y座標値として抽出する。
以上の操作を領域{xs(i−1,m),ys(i−1,
n)},{xe(i−1,m),ye(i−1,n)}の全てのy座
標について行い、n個の領域{xs(i−1,m),ys(i,
n)},{xe(i−1,m),ye(i,n)}(但し、n;正の整
数)を切り出す。このとき、領域{xz(0,1),ys(0,
1)},{xe(0,1),ye(0,1)}は、初期値として(0,
0),(XE,YE)を予めセットしておき、これは画像デー
タ40の全領域を示す。
さらに、検出された連続する白ラインの数が閾値THを
越えない間に黒ラインを検出した場合、上下の領域は同
領域と判断して処理を継続して行い、連続する白ライン
が閾値THを越えるまで繰り返し行う。黒ラインのy座標
値がye(i−1,n)と等しくなる場合、ye(i−1,n)を
終点y座標値として抽出し、y座標値がye(i−1,n)
となったら処理を終了する。
このように、領域{xs(i−1,m),ys(i−1,
n)},{xe(i−1,m),ye(i−1,n)}に対して、y
方向に切り出されたn個の領域{xs(i−1,m),ys(i,
n)},{xe(i−1,m),ye(i,n)}(但し、n;正の整
数)は、そのn個の始点、終点y座標の情報を外接矩形
位置メモリ32に保存する(S54)。第7図のS70に示すi
=1の時のnの値が1,2,3で示される領域が、その処理
結果例を示す。
次に、第6図のS53でy方向に切り出されたn個の領
域{xs(i−1,m),ys(i,n)},{xe(i−1,m),ye
(i,n)}(但し、n;正の整数)について、以下の処理
を行う。
先ず、nの値を初期化する(nの初期値=1(S5
5))。そして領域始点座標{xs(i−1,m),ys(i,
n)}、終点座標{xs(i−1,m),ye(i,n)}に対し、
第7図のS71のように、x軸方向について領域を複数個
(m個)の領域に切り出す処理を行う(S56)。
この切り出し処理について、第9図のx軸方向の切り
出し処理を説明する図を用いて説明する。
前記始点座標及び終点座標で示される領域に対して、
第4図の画像データ40中にy方向に黒画素が1つでも存
在する黒カラムを検出し、その黒カラムのx座標値を始
点x座標として抽出する。次いで、y方向に黒画素が1
つでも存在しない白カラムが連続して閾値HTを越える白
カラムを検出し、その注目する白カラムの(TH+1)カ
ラム前の黒カラムのx座標値を終点x座標値として抽出
する。
以上の操作を領域{xs(i−1,m),ys(1,n)},{x
e(i−1,m),ye(i,n)}の全てのx座標について行
い、m個の領域{xs(i,m),ys(i,n)},{xe(i,
m),ye(i,n)}(但し、m;正の整数)を切り出す(S5
6)。さらに、検出された連続する白カラムの数が閾値T
Hを越えない間に黒カラムを検出した場合、左右の領域
は同領域と判断して処理の継続を行い、連続する白カラ
ムが閾値THを越えるまで繰り返し行う。黒カラムのx座
標値がxe(i−1,m)と等しくなる場合、xe(i−1,m)
を終点x座標値として抽出し、x座標値がxe(i−1,
m)となったら処理を終了する。
このように、領域{xs(i−1,m),ys(i,n)},{x
e(i−1,m),ye(i,n)}に対して、x方向に切り出さ
れたm個の領域{xs(i,m),ys(i,n)},{xe(i,
m),ye(i,n)}は、そのm個の始点、終点x座標値の
情報を外接矩形位置メモリ32に保存する(S57)。第7
図のS71に示すi=1の時のmの値が1,2,3で示される領
域がその処理結果例を示す。
以上の切り出し方法で処理を行い、第7図のS72,S73,
…のように、階層iにおけるmの値とnの値がそれぞれ
1,1のみとなるように処理を繰り返し行う。そこで、階
層iにおけるmの値とnの値がそれぞれ1,1のみであっ
た場合(S58)、領域の始点座標{xs(i,1),ys(i,
1)}、終点座標{xe(i,1),ye(i,1)}を外接矩形領
域として抽出し(S59)、その始点、終点座標を外接矩
形位置メモリ32に保存する(S60)。
次いで、この階層の値を減分し(S61)、階層i番目
の全てのnについて行ったか否かを判定する(S62)。
もし全てのnについて行ったと判定されたら、次に階層
i番目の全てのmについて行ったか否かを判定し(S6
3)、もし全てのmについて行っていれば、処理を終了
する(S64)。一方、S58でノーの場合、階層iの値を増
分し(S67)、S52の処理に戻る。また、S62でノーの場
合、nの値を増分し(S65)、S56の処理に戻り、同様に
S63でノーの場合、mの値を増分し(S66)、S53に戻
る。
以上が外接矩形検出手段31の一連の処理であり、第7
図に示す容量で順次、処理を繰り返す。要するに、閾値
TH以上の白ライン、白カラムに囲まれる情報領域を、こ
れ以上の切り出しはないという段階まで処理を繰り返し
行い、最終的に切り出された領域を外接矩形42として検
出し、外接矩形位置メモリ32に保存するものである。
(3) 特徴検出手段33の動作 外接矩形検出手段31で画像データ40を全面走査して外
接矩形42の検出を行い、全ての外接矩形42の位置を示す
始点座標、終点座標が外接矩形位置メモリ32に保存され
ると、次に特徴検出手段33により、全ての外接矩形42に
ついて特徴点及び特徴量を検出する処理が行われる。
(3a)特徴点の検出処理 特徴点の検出処理は、検出された各外接矩形42の領域
内から、特徴となる点を1点検出するものである。これ
は、外接矩形42の始点xy座標(左上点座標)、終点XY座
標(右下点座標)、始点x終点y座標(左下点座標)、
終点x始点y座標(右上点座標)、及び中心xy座標(中
心点座標)のいずれかに着目して検出する。
全ての外接矩形42を(xsi,ysi),(xei,yei)(但
し、i;正の整数)で表すとすると、外接矩形42の始点xy
座標(左上点座標)に着目する場合、特徴点は(xsi,ys
i)の点で表される。外接矩形42の終点xy座標(右下点
座標)に着目する場合、特徴点は(xei,yei)の点で表
され、外接矩形42の始点x終点y座標(右下点座標)に
着目する場合、特徴点は(xsi,yei)の点で表され、外
接矩形42の終点x始点y座標(右上点座標)に着目する
場合、特徴点は(xei,ysi)の点で表され、さらに外接
矩形42の中心xy座標(中心点座標)に着目する場合、特
徴点は{xsi+[(xei−xsi+1)/2],ysi+[(yei−
ysi+1)/2]}の点で表される。
ここで、[ ]の部分は小数点以下の値をもつ実数値
になることが考えられるので、切り捨て、切り上げ等の
処理を行って整数値に変換することを意味する。
(3b)特徴量の検出処理 特徴量の検出処理では、検出された各外接矩形42の領
域の特徴量を1つ、ないしは2つ検出する。例えば、外
接矩形42の幅、高さ、幅と高さの和、幅と高さのいずれ
か大きい方の値のいずれかに着目して1つの特徴量を検
出したり、外接矩形42の幅を特徴量1、高さを特徴量2
として2つの特徴量を検出する。
全ての外接矩形42を(xsi,ysi),(xei,yei)(但
し、i;正の整数)で表すとすると、外接矩形42の高さに
着目する場合、特徴量はyei−ysi+1の値で表され、外
接矩形42の幅に着目する場合、特徴量はxei−xsi+1の
値で表され、外接矩形42の幅と高さの和に着目する場
合、特徴量は(yei−ysi+1)+(xei−xsi+1)の値
で表される。外接矩形42の幅と高さのいずれか大きい方
の値に着目する場合、xei−xsi+1>yei−ysi+1の条
件が満たされるときxei−xsi+1の値を、そうでなけれ
ばyei−ysi+1の値を特徴量とするといった様に、これ
らのいずれかに着目して1つの特徴量を検出する。
また、外接矩形42の幅を特徴量1、高さを特徴量2と
して2つの特徴量を検出する場合には、xei−xsi+1の
値を特徴量1とし、yei−ysi+1の値を特徴量2とす
る。この時、高さを特徴量1とし、幅を特徴量2として
もさしつかえない。
(3c)検出後の処理等 検出された特徴点の位置情報と1つないし2つの特徴
量の値は、特徴メモリ34に保存する。この時、各外接矩
形42から検出された特徴点に対応して、該外接矩形42か
ら検出された1つないし2つの特徴量が対応している。
第10図(A)〜(C)は、第1図のヒストグラム作成
手段35を説明する図であり、同図(A)中の×印で示す
点が、検出された特徴点の一例を示している。この図に
示される特徴点は、外接矩形42の中心xy座標(中心点座
標)に着目した場合である。
(4)ヒストグラム作成手段35の動作 特徴検出手段33で全ての外接矩形42について特徴点及
び特徴量の検出を行い、全ての特徴点の位置情報及びそ
の特徴点に対応した特徴量が順次、特徴メモリ34に保存
されると、次にヒストグラム作成手段35によってヒスト
グラム作成処理が行われる。この処理では、検出された
特徴点の位置座標より、第1の所定範囲内に位置する水
平方向のヒストグラム値の値を、該特徴点に対応した特
徴量分だけ加算する。さらに、特徴点の位置座標より、
第2の所定範囲内に位置する垂直方向のヒストグラム値
の値を、該特徴点に対応した特徴量分だけ加算すること
により、水平方向と垂直方向のヒストグラムを作成す
る。
なお、特徴検出手段33で、1つの特徴点に対応して、
1つないし2つの特徴量が検出されるので、このヒスト
グラム作成手段35では、1つの特徴点に対応した特徴量
の数に応じて処理が行われる。
そこで、特徴量が1つの場合のヒストグラム作成手段
35の動作を第11図のフローチャートを参照し、また特徴
量が2つの場合のヒストグラム作成手段35の動作を第12
図のフローチャートを参照し、説明する。
なお、第11図及び第12図において、S80−1〜S93−1,
S80−2〜S93−2はステップである。そして、全ての特
徴点を(pxi,pyi)(但し、i;正の整数)で表し、該特
徴点の全てをm個(i=1,2,…,m)で表し、その各特徴
点に対応して得られた1つないし2つの特徴量をchiな
いしch1i,ch2i(但し、i;正の整数)で表す。さらに、
水平方向(x方向)のヒストグラムの作成については、
ヒストグラム値HY(y)で表し、yは0,1,2,…,YEの範
囲をとりうる。垂直方向(y方向)のヒストグラムの作
成については、ヒストグラム値HY(x)で表し、xは0,
1,2,…,XEの範囲をとりうる。これらHY(y)とHX
(x)のヒストグラム値は、それぞれ水平方向ヒストグ
ラムメモリ36と垂直方向ヒストグラムメモリ37中に存在
し、以下に示す処理を実行することによってその都度、
メモリ中の値が更新され、保存される。
また、水平方向のヒストグラムの作成の際に用いる第
1の所定範囲を示す値をPR1、垂直方向のヒストグラム
の作成の際に用いる第2の所定範囲を示す値をPR2と表
す。この第1及び第2の所定範囲を示す値PR1,PR2は、
画像入力部10において入力文書の印刷ずれや、画像読取
り時のセッティングずれ等によって情報領域の位置に誤
差が生じるのを考慮して用いられ、予め任意の値(0以
上の整数値)を設定する。
(4a)特徴量が1つの場合のヒストグラム作成処理 なお、この時の各特徴点(pxi,pyi)(但し、i;正の
整数)に対応して得られた1つの特徴量は、前述したよ
うにchi(但し、i;正の整数)で表す。
先ず、第11図のS80−1,S81−1において、全てのyに
おけるHY(y)の値を初期値0に、全てのxにおけるHX
(x)の値を初期値0にそれぞれ初期化するS82−1
で、iを初期値1に初期化する。次に、特徴点のy座標
値pyi(但し、i;正の整数)から第1の所定範囲を示す
値PR1を引いた値をhyに代入する(S83−1)。S83−1
で得られた値hyに位置する水平方向のヒストグラム値HY
(hy)の値に対し、該特徴点に対応した特徴量分chi
(但し、i;正の整数)を加算する(S84−1)。
S85−1で、hyの値が、pyiにPR1を加算した値と等し
いか否かを判定する。等しいと判定されたら、特徴点の
x座標値pxi(但し、i;正の整数)から、第2の所定範
囲を示す値PR2を引いた値を、hxに代入する(S87−
1)。そしてS87−1で得られた値hxに位置する垂直方
向のヒストグラム値HX(hx)の値に対し、該特徴点に対
応した特徴量分chi(但し、i;正の整数)を加算する(S
88−1)。
S89−1で、hxの値がpxiにPR2を加算した値と等しい
か否かを判定する。等しいと判定されたら、m個全ての
特徴点に関して行ったか否かを判定し(S91−1)、m
個全ての特徴点に関して行ったならば、処理を終了する
(S92−1)。
一方、S85−1でノーならば、hyの値を増分し(S86−
1)、S84−1の処理に戻る。S89−1でノーならば、hx
の値を増分し(S90−1)、S88−1の処理に戻る。ま
た、S91−1でノーならば、iの値を増分し(S93−
1)、S83−1の処理に戻る。
(4b)特徴量が2つの場合のヒストグラム作成処理 なお、この時の各特徴点(pxi,pyi)(但し、i;正の
整数)に対応して得られた特徴量1と特徴量2の2つの
特徴量は、前述したようにch1i,ch2i(但し、i;正の整
数)で表す。
第12図のS80−2〜S83−2,S85−2〜S87−2,S89−2
〜S93−2の処理においては、第11図で示したS80−1〜
S83−1,S85−1〜S87−1,S89−1〜S93−1のそれぞれ
に対応する処理と同様な処理を行う。
S84−2の処理については、S83−2で得られた値hyに
位置する水平方向のヒストグラム値HY(y)の値に対
し、該特徴点に対応した特徴量1分ch1i(但し、i;正の
整数)を加算する処理を行う。S88−2の処理について
は、S87−2で得られた値hxに位置する垂直方向のヒス
トグラム値HX(x)の値に対し、該特徴点に対応した特
徴量2分ch2i(但し、i;正の整数)を加算する処理を行
う。
以上の(4a)または(4b)の処理により、水平方向の
ヒストグラムHY(y)(y=0,1,2,…,YE)と垂直方向
のヒストグラムHX(x)(x=0,1,2,…,XE)を作成す
る。
(4c)処理結果 第10図(C)に、特徴検出手段33で、外接矩形42の領
域の幅を特徴量1、高さを特徴量2として、1つの特徴
点に対応して2つの特徴量が検出された時に、ヒストグ
ラム作成手段35で、特徴量が2つの場合のヒストグラム
の作成を行う処理によって、第1の所定範囲を示す値PR
1に0を設定して作成された水平方向のヒストグラム作
成結果を示す。また、第10図(B)に、同処理によっ
て、第2の所定範囲を示す値PR2に0を設定して作成さ
れた垂直方向のヒストグラム作成結果を示す。この時に
用いられた特徴点は、第10図(A)の×印で示される点
であり、これは前述した外接矩形42の中心xy座標(中心
点座標)を特徴点とした場合である。
(5) 行方向判定手段38の動作 ヒストグラム作成手段35で、水平方向(X方向)及び
垂直方向(y方向)について特徴点のヒストグラムが作
成され、それらのヒストグラムの作成結果がそれぞれ水
平方向ヒストグラムメモリ36と垂直方向ヒストグラムメ
モリ37に保存されると、次に、水平方向と垂直方向の各
ヒストグラムにおいて、最もヒストグラム値の大きい値
をそれぞれ検出し、それらの検出された値に基づいて文
字行の方向を判定する処理が以下のように行われる。
先ず、水平方向のヒストグラムから最もヒストグラム
値の大きい値を検出する処理においては、水平方向のヒ
ストグラムHY(y)(y=0,1,2,…,YE)の中から、最
も値の大きいHY(y)(但し、y;正の整数)の値を第10
図(C)に示すmaxHYとして検出する。垂直方向のヒス
トグラムから最もヒストグラム値の大きい値を検出する
処理においては、垂直方向のヒストグラムHY(x)(x
=0,1,2,…,XE)の中から、最も値の大きいHX(x)
(但し、x;正の整数)の値を第10図(B)に示すmaxHX
として検出する。
これら検出されたmaxHYとmaxHXの値を比較することに
より、文字行の方向の判定を行う。この判定方法は、ma
xHY≧HX…の条件が満たされるならば、行方向が水平
方向(x方向)であると判定し、そうでないならば、行
方向が垂直方向(y方向)であると判定する。
第4図に示すように、横書き名刺の行方向が水平方向
となるように画像入力部10による読取りを行った場合、
条件が満足され、文字行の行方向は水平方向(x方
向)と判定される。これに対し、横書き名刺の行方向が
垂直方向となるように画像入力部10による読取りを行っ
た場合、条件が満足されず、文字行の行方向は垂直方
向(y方向)と判定される。従って、処理対象文書、特
に多種多様なレアウト構造の名刺における文字行方向の
判定を精度良く行える。しかも、ヒストグラム作成手段
35では、第1の所定範囲内に位置する水平方向のヒスト
グラム値の値を増分し、さらに第2の所定範囲内に位置
する垂直方向のヒストグラム値の値を増分することによ
り、水平方向と垂直方向のヒストグラムを作成してい
る。そのため、入力文書の印刷ずれや、画像読取り時の
セッティングずれ等によって情報領域の位置に誤差があ
る程度生じても、文字行方向の判定を精度良く行える。
なお、本発明は図示の実施例に限定されない。例え
ば、第1図の行方向判定装置30内の回路ブロックを個別
回路や専用LSI等で構成する以外に、マイクロプロセッ
サ等を用いたプログラム制御により実行する構成にして
もよい。また、情報領域は黒地に白地の白画素領域でも
よい。さらに、本発明は、名刺以外の他の文書について
も適用できる。
(発明の効果) 以上詳細に説明したように、第1の発明によれば、画
像データを走査して情報領域を外接矩形として検出し、
その検出された外接矩形より特徴点及び特徴量を検出す
る。検出された特徴点の位置座標より、第1の所定範囲
内に位置する水平方向のヒストグラム値の値を、該特徴
点に対応した特徴量分だけ加算し、さらに特徴点の位置
座標より、第2の所定の範囲内に位置する垂直方向のヒ
ストグラム値の値を、該特徴点に対応した特徴量分だけ
加算することにより、水平方向と垂直方向のヒストグラ
ムを作成する。そして、得られた水平方向と垂直方向の
各ヒストグラムにおいて、最もヒストグラム値の大きい
値をそれぞれ検出し、それらの検出された値に基づいて
文字行の方向を判定する。
そのため、処理対象文書における文字行方向の判定を
制度良く行える。しかも、入力文書の印刷ずれや、画像
読取り時のセッティングずれ等によって情報領域の位置
に誤差がある程度生じても、文字行方向の判定を精度良
く行なえる。
第2の発明によれば、外接矩形の中心点及び四隅のい
ずれかに基づいて特徴点を検出するので、活字文字等の
特徴点の検出を簡単かつ的確に行える。
第3及び第4の発明によれば、外接矩形の幅等に着目
して特徴量を検出しているので、文字の大、小等にかか
わらず、簡単かつ的確に、特徴量の検出が行える。
第5の発明によれば、ヒストグラム値の大小より、行
方向を判定するので、判定が簡単で、かつ精度良く行え
る。
【図面の簡単な説明】
第1図は本発明の実施例を示す行方向判定装置の機能ブ
ロック図、第2図(A)〜(C)は従来の行方向判定装
置の原理説明図、第3図(A)〜(C)は従来の問題点
の説明図、第4図は第1図の画像データを示す図、第5
図は第1図の外接矩形検出結果を示す図、第6図は第1
図の外接矩形検出手段のフローチャート、第7図は第1
図の外接矩形検出手段を説明する図、第8図は第5図の
y方向切り出し処理を説明する図、第9図は第5図のx
方向切り出し処理を説明する図、第10図(A)〜(C)
は第1図のヒストグラム作成手段を説明する図、第11図
は10図の特徴量が1つの場合のヒストグラム作成手段の
フローチャート、第12図は第10図の特徴量が2つの場合
のヒストグラム作成手段のフローチャートである。 30……行方向判定装置、31……外接矩形検出手段、33…
…特徴検出手段、35……ヒストグラム作成手段、38……
行方向判定手段。

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】画像データを走査して該画像データ中の文
    字行の行方向を判定する行方向判定装置において、 前記画像データを走査して前記画像データ中の情報領域
    を外接矩形として検出する外接矩形検出手段と、 前記外接矩形検出手段で検出された外接矩形より特徴点
    及び特徴量を検出する特徴検出手段と、 前記特徴検出手段で検出された特徴点の位置座標より、
    第1及び第2の所定範囲のうち、該第1の所定範囲内に
    位置する水平方向のヒストグラム値の値を該特徴点に対
    応した特徴量分だけ加算すると共に、該第2の所定範囲
    内に位置する垂直方向のヒストグラム値の値を該特徴点
    に対応した特徴量分だけ加算することによって水平方向
    と垂直方向のヒストグラムを作成するヒストグラム作成
    手段と、 前記ヒストグラム作成手段で作成された水平方向と垂直
    方向の各ヒストグラムにおいて最大ヒストグラム値をそ
    れぞれ検出し、それらの検出値に基づいて前記文字行の
    行方向を判定する行方向判定手段とを、 備えたことを特徴とする行方向判定装置。
  2. 【請求項2】請求項1記載の行方向判定装置において、 前記特徴検出手段は、前記外接矩形の中心点、左上点、
    右下点、左下点及び右上点のいずれかに基づいて前記特
    徴点を検出する構成にした行方向判定装置。
  3. 【請求項3】請求項1記載の行方向判定装置において、 前記特徴検出手段は、前記外接矩形の幅、高さ、幅と高
    さの和、及び幅と高さのいずれか大きい方の値のいずれ
    か1つに基づき1つの特徴量を検出する構成にした行方
    向判定装置。
  4. 【請求項4】請求項1記載の行方向判定装置において、 前記特徴検出手段は、前記外接矩形の幅を特徴量1、及
    び高さを特徴量2として2つの特徴量を検出する構成に
    した行方向判定装置。
  5. 【請求項5】請求項1記載の行方向判定装置において、 前記行方向判定手段は、前記水平方向のヒストグラムか
    ら検出された値の方が、前記垂直方向のヒストグラムか
    ら検出された値より大きければ前記文字行の行方向を水
    平方向と、そうでなければ前記文字行の行方向を垂直方
    向と判定する構成にした行方向判定装置。
JP2321528A 1990-11-26 1990-11-26 行方向判定装置 Expired - Fee Related JP2963532B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2321528A JP2963532B2 (ja) 1990-11-26 1990-11-26 行方向判定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2321528A JP2963532B2 (ja) 1990-11-26 1990-11-26 行方向判定装置

Publications (2)

Publication Number Publication Date
JPH04205074A JPH04205074A (ja) 1992-07-27
JP2963532B2 true JP2963532B2 (ja) 1999-10-18

Family

ID=18133579

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2321528A Expired - Fee Related JP2963532B2 (ja) 1990-11-26 1990-11-26 行方向判定装置

Country Status (1)

Country Link
JP (1) JP2963532B2 (ja)

Also Published As

Publication number Publication date
JPH04205074A (ja) 1992-07-27

Similar Documents

Publication Publication Date Title
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
US20080069398A1 (en) Code image processing method
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
US5050229A (en) Method and apparatus for thinning alphanumeric characters for optical character recognition
JP2963532B2 (ja) 行方向判定装置
JP2957729B2 (ja) 行方向判定装置
JP2868134B2 (ja) 画像処理方法及び装置
JP2957739B2 (ja) 行方向判定装置
JP2957774B2 (ja) 行方向判定装置
JP2957707B2 (ja) 行方向判定装置
JP3698867B2 (ja) 円形パターン判定方法、装置および記録媒体
JP2957740B2 (ja) 行方向判定装置
JP3095470B2 (ja) 文字認識装置
JP2986185B2 (ja) 線図形の線幅分類方式
JP2004158041A (ja) 表画像処理装置及びそのプログラム記憶媒体
JP2007004724A (ja) 文字検索装置、文字検索方法、及びプログラム
JPH0373916B2 (ja)
JP2908495B2 (ja) 文字画像抽出装置
JPS63136179A (ja) 文字切出し装置
JP2715930B2 (ja) 線分検出方法
JP3193135B2 (ja) ドットパターンのドット位置検出方法
JP2882056B2 (ja) 特定パターンの識別方法
JP2613060B2 (ja) 罫線検出方式
JP2929710B2 (ja) 文字読み取り方法
JPH07120392B2 (ja) 文字パターン切り出し装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees