JP2957774B2 - 行方向判定装置 - Google Patents

行方向判定装置

Info

Publication number
JP2957774B2
JP2957774B2 JP3236614A JP23661491A JP2957774B2 JP 2957774 B2 JP2957774 B2 JP 2957774B2 JP 3236614 A JP3236614 A JP 3236614A JP 23661491 A JP23661491 A JP 23661491A JP 2957774 B2 JP2957774 B2 JP 2957774B2
Authority
JP
Japan
Prior art keywords
value
circumscribed rectangle
feature
histogram
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3236614A
Other languages
English (en)
Other versions
JPH056457A (ja
Inventor
和弘 石川
晃治 伊東
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3236614A priority Critical patent/JP2957774B2/ja
Publication of JPH056457A publication Critical patent/JPH056457A/ja
Application granted granted Critical
Publication of JP2957774B2 publication Critical patent/JP2957774B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学的文字読取装置
(OCR)等において、名刺等の文書の行方向(文字列
方向)を検出する行方向判定装置に関するものである。
【0002】
【従来の技術】従来、文字認識のために名刺の行方向を
検出する行方向判定装置としては、例えば特開昭62−
166479号公報に記載されるものがあった。以下、
その構成を説明する。
【0003】図2の(A)〜(C)は、従来の行方向判
定装置の原理説明図である。図2(A)は名刺の画像デ
ータ1の一例を示す図であり、この画像データ1上には
X−Y座標系が設定されている。また、図2(B)及び
(C)は、図2(A)の画像データ1に関する水平及び
垂直方向の周辺分布が示されている。図2(B)では縦
軸にY軸及び横軸に副走査座標Yの水平走査線上の累積
黒画素数が取られ、また図2(C)では横軸にX軸及び
縦軸に副走査座標Xの垂直走査線上の累積黒画素数が取
られている。
【0004】この種の行方向判定装置では、名刺全体の
画像データ1の射影を取り、水平及び垂直方向の周辺分
布を作成する。そして、水平方向の周辺分布の文字部領
域2の先頭の文字部領域の始端から末尾の文字部領域の
終端までの長さWYと、垂直方向の周辺分布の文字部領
域2の先頭の始端から末尾の終端までの長さWXとを
得、これらの長さのうち、長いほうの長さを得た周辺分
布の主走査方向を文字行方向と判定する。
【0005】
【発明が解決しようとする課題】しかしながら、上部構
成の装置では、次のような課題があった。図3の(A)
〜(C)は、従来装置の問題点の説明図であり、同図
(A)は他の画像データ1aの例、同図(B)及び
(C)は同図(A)の画像データ1aにおける水平及び
垂直方向の周辺分布を示す。
【0006】図3(A)に示すように、画像データ1a
における文字行が名刺の局部(例えば、中央部)に集中
して存在し、かつ文字行の長さが短い場合、該画像デー
タ1aの周辺分布から得られる文字部領域2aの長さW
Xa,WYaの大小関係はWXa<WYaとなる。その
ため、行方向が実際には水平方向であるにもかかわら
ず、WXa<WYaという関係から、垂直方向を行方向
としてしまい、誤った判定結果になるという問題があ
り、それを解決することが困難であった。
【0007】本発明は前記従来技術が持っていた課題と
して、文字行が名刺の局部に集中して存在し、かつ文字
行の長さが短いと、行方向を必ずしも正しく判定するこ
とができないという点について解決した行方向判定装置
を提供するものである。
【0008】
【課題を解決するための手段】前記課題を解決するため
に、第1の発明は、画像データを走査して該画像データ
中の文字行の行方向を判定する行方向判定装置におい
て、次のような手段を備えている。即ち、第1の発明で
は、前記画像データを走査して前記画像データ中の情報
領域を外接矩形として検出する外接矩形検出手段と、前
記外接矩形検出手段で検出された外接矩形の中から文字
部の外接矩形のみを抽出する外接矩形選別手段と、前記
外接矩形選別手段で抽出された文字部の外接矩形より特
徴点及び特徴量を検出する特徴検出手段と、前記特徴検
出手段で検出された特徴点及び特徴量に基づき、水平方
向と垂直方向のヒストグラムを作成するヒストグラム作
成手段と、前記ヒストグラム作成手段で作成された水平
方向と垂直方向の各ヒストグラムにおいて最大ヒストグ
ラム値をそれぞれ検出し、それらの検出値に基づいて前
記文字行の行方向を判定する行方向判定手段とを、備え
ている。
【0009】ヒストグラム作成手段は、前記特徴検出手
段で検出された前記特徴点の位置座標より、第1の所定
の範囲内に位置する水平方向のヒストグラム値の値に対
してその特徴点に対応した特徴量分を加算し、かつ前記
特徴点の位置座標より、第2の所定の範囲内に位置する
垂直方向のヒストグラム値の値に対してその特徴点に対
応した特徴量分を加算することによって水平方向と垂直
方向のヒストグラムを作成する機能を有している。
【0010】第2の発明では、第1の発明の外接矩形選
別手段を、前記外接矩形の幅が第1の所定の値より大き
い、あるいは高さが第2の所定の値より大きいと判定さ
れた外接矩形について、該外接矩形の幅と高さの小さい
方の値から、幅と高さの大きい方の値で割った値が第3
の所定の値より小さく、幅と高さの大きい方の値が第4
の所定の値より大きいと判定されず、また該外接矩形の
幅と高さの積が第5の所定の値より大きいと判定されな
かった外接矩形を、前記文字部の外接矩形と判定して抽
出する構成にしている。
【0011】第3の発明では、第1の発明の特徴検出手
段を、前記文字部の外接矩形の中心点、左上点、右下
点、左下点及び右上点のいずれかに基づいて前記特徴点
を検出する構成にしている。
【0012】第4の発明では、第1の発明の特徴検出手
段を、前記文字部の外接矩形の幅、高さ、幅と高さの大
きい方のいずれかに基づき、あるいは幅と高さの両方に
基づき、前記特徴量を検出する構成にしている。
【0013】第5の発明では、第1の発明のヒストグラ
ム作成手段における第1の所定の範囲及び第2の所定の
範囲を示す値として、任意適度な0以上の整数値を設定
する構成にしている。
【0014】第6の発明では、第1の発明の行方向判定
手段を、前記水平方向のヒストグラムから検出された値
の方が、前記垂直方向のヒストグラムから検出された値
より大きければ前記文字行の行方向を水平方向と、そう
でなければ前記文字行の行方向を垂直方向と判定する構
成にしている。
【0015】
【作用】第1の発明によれば、以上のように行方向判定
装置を構成したので、画像データが入力されると、外接
矩形検出手段では、該画像データを走査して文字部等の
情報領域(例えば、文字部を形成する黒画素領域)を外
接矩形として検出する。検出された外接矩形は、その中
より、文字部の外接矩形のみが外接矩形選別手段で抽出
される。抽出された文字部の外接矩形は、特徴検出手段
により、特徴点及び特徴量が検出される。ヒストグラム
作成手段では、検出された特徴点及び特徴量に基づき、
加算処理を行って水平方向と垂直方向のヒストグラムを
作成する。行方向判定手段では、水平方向と垂直方向の
各ヒストグラムにおいて、最もヒストグラム値の大きい
値をそれぞれ検出し、それらの検出された値に基づいて
文字行の行方向を判定する。これにより、高精度に、文
字行の方向の判定が行える。第2の発明では、外接矩形
選別手段により、外接矩形の幅及び高さを所定の値と比
較する等して、外接矩形検出手段で検出された外接矩形
の中から文字部の外接矩形のみを抽出するので、文字部
の外接矩形の抽出処理が簡単に行える。さらに、抽出し
た文字部の外接矩形を特徴検出手段へ送り、その特徴検
出手段で特徴点及び特徴量の検出を行わせるので、以後
の処理がより簡単になる。
【0016】第3の発明では、特徴検出手段により、文
字部の外接矩形の中心点及びその四隅のいずれかに着目
して特徴点を検出するので、活字文字等の該特徴点の検
出を簡単かつ的確に行える。第4の発明では、特徴検出
手段により、文字部の外接矩形の幅、高さ、幅と高さの
大きい方等に着目して特徴量を検出するので、活字文字
等の該特徴量の検出を簡単かつ的確に行える。第5の発
明では、第1及び第2の所定の範囲を示す値に、任意適
度な0以上の整数値を設定するので、情報領域の位置に
誤差が生じても、水平方向と垂直方向の各ヒストグラム
の特徴を顕在化させる。第6の発明では、行方向判定手
段により、ヒストグラム値の大小関係から文字行の方向
を判定するので、名刺等の文書における行方向の判定が
簡単に行える。従って、前記課題を解決できるのであ
る。
【0017】
【実施例】図1は、本発明の一実施例を示す行方向判定
装置の概略の機能ブロック図である。図1において、名
刺等の入力原稿を画像データの形で読み取る画像入力部
10と、その読み取った画像データを格納する画像メモ
リ11とを備え、該画像メモリ11の出力側に、行方向
判定装置20が接続されている。
【0018】行方向判定装置20は、画像メモリ11に
格納された画像データを走査して文字部等の情報領域
(例えば、文字部等を形成する黒画素領域)を外接矩形
として検出する外接矩形検出手段21を有し、その出力
側には、外接矩形位置メモリ22が接続されている。外
接矩形位置メモリ22は、検出された外接矩形の位置情
報を保存するもので、その出力側には、外接矩形選別手
段23、及び文字部外接矩形位置メモリ24が接続され
ている。外接矩形選別手段23は、外接矩形位置メモリ
22に保存された外接矩形の中から、文字部の外接矩形
のみを抽出し、その位置情報を文字部外接矩形位置メモ
リ24へ保存させる機能を有している。
【0019】文字部外接矩形位置メモリ24の出力側に
は、特徴検出手段25、特徴メモリ26、及びヒストグ
ラム作成手段27が接続されている。特徴検出手段25
は、文字部外接矩形位置メモリ24内の文字部の外接矩
形の位置情報より、特徴点及び特徴量を検出する機能を
有し、その特徴点の位置情報及びその特徴点に対応した
特徴量が特徴メモリ26に順次保存されるようになって
いる。
【0020】ヒストグラム作成手段27は、特徴メモリ
26に保存された特徴点の位置座標より、第1の所定の
範囲内に位置する水平方向のヒストグラム値の値に対し
てその特徴点に対応した特徴量分を加算し、さらに特徴
点の位置座標より、第2の所定の範囲内に位置する垂直
方向のヒストグラム値の値に対してその特徴点に対応し
た特徴量分を加算することにより、水平方向と垂直方向
のヒストグラムを作成する機能を有し、その出力側に
は、水平方向ヒストグラムメモリ28及び垂直方向ヒス
トグラムメモリ29を介して行方向判定手段30が接続
されている。
【0021】水平方向ヒストグラムメモリ28及び垂直
方向ヒストグラムメモリ29は、ヒストグラム作成手段
27で作成された水平方向と垂直方向のヒストグラムを
それぞれ保存する機能を有している。行方向判定手段3
0は、メモリ28,29に保存された水平方向と垂直方
向の各ヒストグラムにおいて、最もヒストグラム値の大
きい値をそれぞれ検出し、それらの検出値に基づいて文
字行の方向を判定する機能を有している。
【0022】次に、図4〜図14を参照しつつ、図1中
の各回路ブロックの動作(1)〜(6)を説明する。 (1) 画像入力部10の動作 画像入力部10は、処理対象となる入力原稿(例えば、
名刺)を走査し、画素分解して読取って文字線部を黒ビ
ット及び文字背景部を白ビットで表す白黒2値の画像デ
ータを出力する。画像メモリ11は、画像入力部10か
らの画像データを走査順次に格納する。本実施例におけ
る画像入力部10での読取り解像度は、16本/1mmの
解像度で行った。
【0023】(2) 外接矩形検出手段21の動作 図4は画像データ及び図5は外接矩形検出結果の一例を
示す図である。図4は画像メモリ11に格納された白黒
2値の画像データ40の全体、また図5の実線で示す矩
形枠は図4の画像データ40の一例につき検出された外
接矩形42を示す。
【0024】図4に示すように、画像メモリ11上には
x−y座標系を設定し、この座標系で表される画素位置
の画像データ(画素データ)40の読出しが自在に行え
るようになっている。例えば、名刺の読取りの際には、
名刺を画像入力部10の読取り面に載置して走査する
が、このとき名刺の角点が座標系の原点0と一致し、か
つ名刺の文字行方向がx軸に沿う方向(水平方向)及び
y軸に沿う方向(垂直方向)のいずれか一方となるよう
に、名刺を読取り面にセットする。そして、画像入力部
10の読取り面において、名刺が載置されていない領域
が白ビットで表されるようにする。
【0025】また、画像データ40の処理領域(図4中
のx,y軸及び一点鎖線で囲む領域)41は、0≦x≦
XEかつ0≦y≦YEなる範囲であるが、名刺の長手方
向が水平及び垂直方向のいずれとなっても、名刺全体の
画像データを処理領域41内に格納できるように、XE
及びYEの値を名刺の長手方向の、画像データ40上に
おける長さよりもやや大きめの値に設定する。
【0026】画像入力部10が画像メモリ11へ画像デ
ータ40を格納し終えると、第1の方向を水平方向及び
第2の方向を垂直方向とした場合の情報領域(黒画素領
域)を外接矩形42として、その始点及び終点を検出す
る外接矩形検出手段21を起動する。
【0027】次に、図6〜図9を参照し、外接矩形検出
手段21の動作を説明する。図6は図1中の外接矩形検
出手段21の動作例を示すフローチャート、及び図7は
外接矩形検出手段21を説明する図である。なお、図6
及び図7中のS50〜S67,S70〜S73,…はス
テップ、iは階層、mはx方向に切り出された領域番
号、nはy方向に切り出た領域番号である。また、この
外接矩形検出手段21では、図4に示すように、画像メ
モリ11中の画像データ40を走査することにより行
う。
【0028】先ず、図6のS50〜S52において、
i,n,mをそれぞれ初期値1に初期化する。そして、
領域の始点座標{xs(i−1,m),ys(i−1,
n)}、終点座標{xe(i−1,m),ye(i−
1,n)}に対し、図7のS70に示すように、y軸方
向の領域をn個の領域に切り出す処理を行う(S5
3)。この切り出し処理について、図8のy方向の切り
出し処理を説明する図を用いて説明する。始点座標{x
s(i−1,m),ys(i−1,n)}、終点座標
{xe(i−1,m)、ye(i−1,n)}で示され
る背景パタン43上の情報領域44に対して、図4に示
す画像データ40中にx方向に黒画素が1つでも存在す
る黒ラインを検出する。その黒ラインのy座標値を始点
y座標として抽出し、次いでx方向に黒画素が1つも存
在しない白ラインが連続して閾値THを越える白ライン
を検出する。その注目する白ラインの(TH+1)ライ
ン前の黒ラインのy座標値を終点y座標値として抽出す
る。
【0029】以上の操作を領域{xs(i−1,m),
ys(i−1,n)},{xe(i−1,m),ye
(i−1,n)}の全てのy座標について行い、n個の
領域{xs(i−1,m),ys(i,n)},{xe
(i−1,m),ye(i,n)}(但し、n;正の整
数)を切り出す。このとき、領域{xs(0,1),y
s(0,1)},{xe(0,1),ye(0,1)}
は、初期値として(0,0),(XE,YE)を予めセ
ットしておき、これは画像データ40の全領域を示す。
【0030】さらに、検出された連続する白ラインの数
が閾値THを越えない間に黒ラインを検出した場合、上
下の領域は同領域と判断して処理を継続して行い、連続
する白ラインが閾値THを越えるまで繰り返し行う。黒
ラインのy座標値がye(i−1,n)と等しくなる場
合、ye(i−1,n)を終点y座標値として抽出し、
y座標値がye(i−1,n)となったら処理を終了す
る。
【0031】このように、領域{xs(i−1,m),
ys(i−1,n)},{xe(i−1,m),ye
(i−1,n)}に対して、y方向に切り出されたn個
の領域{xs(i−1,m),ys(i,n)},{x
e(i−1,m),ye(i,n)}(但し、n;正の
整数)は、そのn個の始点、終点y座標の情報を外接矩
形位置メモリ22に保存する(S54)。図7のS70
に示すi=1の時のnの値が1,2,3で示される領域
が、その処理結果例を示す。
【0032】次に、図6のS53でy方向に切り出され
たn個の領域{xs(i−1,m),ys(i,
n)},{xe(i−1,m),ye(i,n)}(但
し、n;正の整数)について、以下の処理を行う。
【0033】先ず、nの値を初期化する(nの初期値=
1(S55))。そして領域始点座標{xs(i−1,
m),ys(i,n)}、終点座標{xe(i−1,
m),ye(i,n)}に対し、図7のS71のよう
に、x軸方向について領域を複数個(m個)の領域に切
り出す処理を行う(S56)。
【0034】この切り出し処理について、図9のx軸方
向の切り出し処理を説明する図を用いて説明する。前記
始点座標及び終点座標で示される領域に対して、図4の
画像データ40中にy方向に黒画素が1つでも存在する
黒カラムを検出し、その黒カラムのx座標値を始点x座
標として抽出する。次いで、y方向に黒画素が1つでも
存在しない白カラムが連続して閾値THを越える白カラ
ムを検出し、その注目する白カラムの(TH+1)カラ
ム前の黒カラムのx座標値を終点x座標値として抽出す
る。以上の操作を領域{xs(i−1,m),ys
(i,n)},{xe(i−1,m),ye(i,
n)}の全てのx座標について行い、m個の領域{xs
(i,m),ys(i,n)},{xe(i,m),y
e(i,n)}(但し、m;正の整数)を切り出す(S
56)。さらに、検出された連続する白カラムの数が閾
値THを越えない間に黒カラムを検出した場合、左右の
領域は同領域と判断して処理の継続を行い、連続する白
カラムが閾値THを越えるまで繰り返し行う。黒カラム
のx座標値がxe(i−1,m)と等しくなる場合、x
e(i−1,m)を終点x座標値として抽出し、x座標
値がxe(i−1,m)となったら処理を終了する。
【0035】このように、領域{xs(i−1,m),
ys(i,n)},{xe(i−1,m),ye(i,
n)}に対して、x方向に切り出されたm個の領域{x
s(i,m),ys(i,n)},{xe(i,m),
ye(i,n)}は、そのm個の始点、終点x座標値の
情報を外接矩形位置メモリ22に保存する(S57)。
図7のS71に示すi=1の時のmの値が1,2,3で
示される領域がその処理結果例を示す。
【0036】以上の切り出し方法で処理を行い、図7の
S72,S73,…のように、階層iにおけるmの値と
nの値がそれぞれ1,1のみとなるように処理を繰り返
し行う。そこで、階層iにおけるmの値とnの値がそれ
ぞれ1,1のみであった場合(S58)、領域の始点座
標{xs(i,1),ys(i,1)}、終点座標{x
e(i,1),ye(i,1)}を外接矩形領域として
抽出し(S59)、その始点、終点座標を外接矩形位置
メモリ22に保存する(S60)。
【0037】次いで、この階層の値を減分し(S6
1)、階層i番目の全てのnについて行ったか否かを判
定する(S62)。もし全てのnについて行ったと判定
されたら、次に階層i番目の全てのmについて行ったか
否かを判定し(S63)、もし全てのmについて行って
いれば、処理を終了する(S64)。一方、S58でノ
ーの場合、階層iの値を増分し(S67)、S52の処
理に戻る。また、S62でノーの場合、nの値を増分し
(S65)、S56の処理に戻り、同様にS63でノー
の場合、mの値を増分し(S66)、S53に戻る。
【0038】以上が外接矩形検出手段21の一連の処理
であり、図7に示す要領で順次、処理を繰り返す。要す
るに、閾値TH以上の白ライン、白カラムに囲まれる情
報領域を、これ以上の切り出しはないという段階まで処
理を繰り返し行い、最終的に切り出された領域を外接矩
形42として検出し、外接矩形位置メモリ22に保存す
るものである。
【0039】(3) 外接矩形選別手段23の動作 外接矩形検出手段21で画像データ40を全面走査して
外接矩形42の検出を行い、全ての外接矩形42の位置
を示す始点座標、終点座標が外接矩形位置メモリ22に
保存されると、次に外接矩形選別手段23により、検出
された外接矩形42の中から文字部の外接矩形のみを抽
出する処理が行われる。その処理を、図10を参照して
以下説明する。
【0040】図10は、図1の外接矩形選別手段23の
フローチャートである。なお、図10中のS80〜93
はステップである。ここで、全ての外接矩形42を(x
sj,ysj),(xej,yej)(但し、j;正の
整数)で表すとし、その外接矩形の全てをM個(j;
1,2,3,…,M)で表す。また、第1〜5の所定の
値をそれぞれPR1〜PR5で表し、これらの値は予め
任意の値(0以上の実数値)を設定する。
【0041】先ず、図10のS80において、jを初期
値1に初期化した後、外接矩形の幅をxej−xsi+
1により求め、その値をwdに代入する(S81)。次
いで、外接矩形の高さをyej−ysj+1により求
め、その値をhtに代入する(S82)。そして、S8
1で得られた値wdが第1の所定の値PR1より大きい
か、あるいはS82で得られた値htが第2の所定の値
PR2より大きいか否かを判定する(S83)。
【0042】S83で、いずれか一方でも大きいと判定
されたら、wdとhtの小さい方の値をv1に代入し
(S84)、wdとhtの大きい方の値をv2に代入す
る(S85)。さらに、wdとhtとの積をv3に代入
し(S86)、v1からv2を割った値をv4に代入す
る(S87)。なお、v3は外接矩形の面積を表す。
【0043】S88において、S87で得られたv4が
第3の所定の値PR3より小さく、かつS85で得られ
た値v2が第4の所定の値PR4より大きいか否かの判
定を行う。その条件が満たされなかったら、S86で得
られた値v3が第5の所定の値5より大きいか否かの判
定を行う(S89)。もし小さいと判定されたら、その
外接矩形は文字部の外接矩形と判定して、その外接矩形
の位置情報(xsj,ysj),(xej,yej)
(但し、j;正の整数)を文字部外接矩形位置メモリ2
4に保存する(S90)。そして、M個全ての外接矩形
に関して処理を行ったか否かを判定し(S91)、もし
M個全ての外接矩形について行ったと判定されたら、処
理を終了する(S92)。
【0044】一方、S83でノー、S88でイエス、S
89てイエスならば、S91の処理を行う。また、S9
1でノーならば、iの値を増分し(S93)、S81の
処理に戻る。この様にして文字部の外接矩形が抽出され
ると、その位置情報が文字部外接矩形位置メモリ24に
順次保存される。
【0045】(4) 特徴検出手段25の動作 外接矩形選別手段23で、全ての外接矩形42の中から
文字部の外接矩形のみを抽出する処理を行い、全ての文
字部の外接矩形の位置を示す始点座標、終点座標が文字
部外接矩形位置メモリ24に保存されると、次に特徴検
出手段25により、全ての文字部の外接矩形について特
徴点及び特徴量を検出する処理が行われる。
【0046】先ず、特徴点の検出処理は、検出された各
文字部の外接矩形の領域内から、特徴となる点を1点検
出するものである。これは、文字部の外接矩形の始点x
y座標(左上点座標)、終点XY座標(右下点座標)、
始点x終点y座標(左下点座標)、終点x始点y座標
(右上点座標)、及び中心xy座標(中心点座標)のい
ずれかに着目して検出する。
【0047】全ての文字部の外接矩形を(xsi,ys
i),(xei,yei)(但し、i;正の整数)で表
すとすると、文字部の外接矩形の始点xy座標(左上点
座標)に着目する場合、特徴点は(xsi,ysi)の
点で表される。文字部の外接矩形の終点xy座標(右下
点座標)に着目する場合、特徴点は(xei,yei)
の点で表され、文字部の外接矩形の始点x、終点y座標
(左下点座標)に着目する場合、特徴点は(xsi,y
ei)の点で表され、文字部の外接矩形の終点x、始点
y座標(右上点座標)に着目する場合、特徴点は(xe
i,ysi)の点で表され、さらに文字部の外接矩形の
中心xy座標(中心点座標)に着目する場合、特徴点は
{xsi+[(xei−xsi+1)/2],ysi+
[(yei−ysi+1)/2]}の点で表される。こ
こで、[ ]の部分は小数点以下の値をもつ実数値にな
ることが考えられるので、切り捨て、切り上げ等の処理
を行って整数値に変換することを意味する。
【0048】次に、特徴量の検出処理は、検出された各
文字部の外接矩形の領域の特徴量を1つないしは2つ検
出するものであり、文字部の外接矩形の幅、高さ、幅と
高さの和、幅と高さのいずれか大きい方の値のいずれか
に着目して1つの特徴量を検出する。あるいは、文字部
の外接矩形の幅を特徴量1、高さを特徴量2として2つ
の特徴量を検出する。
【0049】例えば、全ての文字部の外接矩形を(xs
i,ysi),(xei,yei)(但し、i;正の整
数)で表す。そして、文字部の外接矩形の高さに着目す
る場合、特徴量はyei−ysi+1の値で表され、文
字部の外接矩形の幅に着目する場合、特徴量はxei−
xsi+1の値で表される。文字部の外接矩形の幅と高
さの和に着目する場合、特徴量は(yei−ysi+
1)+(xei−xsi+1)の値で表される。文字部
の外接矩形の幅と高さのいずれか大きい方の値に着目す
る場合は、xei−xsi+1>yei−ysi+1の
条件が満たされるときxei−xsi+1の値を、そう
でなければyei−ysi+1の値を、特徴量とする。
【0050】このように、前記方法のいずれかに着目し
て1つの特徴量を検出する。また、文字部の外接矩形の
幅を特徴量1、高さを特徴量2として、2つの特徴量を
検出する場合は、xei−xsi+1の値を特徴量1と
し、yei−ysi+1の値を特徴量2とする。この
時、高さを特徴量1、幅を特徴量2としても何らさしつ
かえない。
【0051】以上説明した特徴点の位置情報と、1つな
いし2つの特徴量の値とは、特徴メモリ26に保存す
る。なお、この時、各文字部の外接矩形から検出された
特徴点に対応して、同文字部の外接矩形から検出された
1つないし2つの特徴量が対応している。
【0052】図11(A)〜(C)、及び図12(A)
〜(C)は、図1のヒストグラム作成手段27を説明す
る図であり、図11(A)及び図12(A)中の×印で
示す点が、検出された特徴点の一例を示している。この
図に示される特徴点は、文字部の外接矩形の中心xy座
標(中心点座標)に着目した場合である。
【0053】(5) ヒストグラム作成手段27の動作 特徴検出手段25で全ての文字部の外接矩形について特
徴点及び特徴量の検出を行い、全ての特徴点の位置情報
及びその特徴点に対応した特徴量が順次、特徴メモリ2
6に保存されると、次にヒストグラム作成手段27によ
り、検出された特徴点の位置座標より、第1の所定の範
囲内に位置する水平方向のヒストグラム値の値に対して
その特徴点に対応した特徴量分を加算し、さらに特徴点
の位置座標より、第2の所定の範囲内に位置する垂直方
向のヒストグラム値の値に対してその特徴点に対応した
特徴量分を加算することにより、水平方向と垂直方向の
ヒストグラムを作成する処理が行われる。
【0054】特徴検出手段40で、1つの特徴点に対応
して1つないし2つの特徴量が検出されるようになって
いる。そのため、ヒストグラム作成手段27では、その
1つの特徴点に対応した特徴量の数に応じて処理が行わ
れる。そこで、特徴量が1つの場合のヒストグラム作成
手段27の動作(5)(a)を図13を参照し、また特
徴量が2つの場合のヒストグラム作成手段27の動作
(5)(b)を図14を参照しつつ説明する。
【0055】(5)(a)特徴量が1つの場合の動作 図13は、特徴点が1つの場合のヒストグラム作成手段
27のフローチャートである。なお、図13中のS10
0〜S113は、ステップを表す。ここで、例えば全て
の特徴点を(pxi,pyi)(但し、i;正の整数)
で表し、その特徴点の全てをm個(i;1,2,…,
m)で表す。各特徴点に対応して得られた1つないし2
つの特徴量をchiないしch1i,ch2i(但し、
i;正の整数)で表す。さらに、水平方向(x方向)の
ヒストグラムの作成については、ヒストグラム値HY
(y)で表す。yは0,1,2,…,YEの範囲をとり
うる。垂直方向(y方向)のヒストグラムの作成につい
ては、ヒストグラム値HX(x)で表し、xは0,1,
2,…,XEの範囲をとりうる。これらHY(y)とH
X(x)のヒストグラム値は、それぞれ水平方向ヒスト
グラムメモリ28と垂直方向ヒストグラムメモリ29中
に存在し、以下に示す処理を実行することにより、その
都度、メモリ中の値が更新され、保存される。
【0056】また、水平方向のヒストグラムの作成の際
に用いる第1の所定の範囲を示す値をPR1、垂直方向
のヒストグラムの作成の際に用いる第2の所定の範囲を
示す値をPR2と表す。この第1及び第2の所定の範囲
を示す値PR1,PR2は、画像入力部10において入
力文書の印刷ずれや、画像読取り時のセッテングずれ等
によって情報領域の位置に誤差が生じるのを考慮して用
いられ、予め任意の値(0以上の整数値)を設定する。
【0057】先ず、図13のS100,S101におい
て、全てのyにおけるHY(y)の値を、また全てのx
におけるHX(x)の値を、それぞれ初期値0に初期化
する。さらに、S102において、iを初期値1に初期
化する。次に、特徴点のy座標値Pyi(但し、i;正
の整数)から第1の所定の範囲を示す値PR1を引いた
値をhyに代入する(S103)。そして、S103で
得られた値hyに位置する水平方向のヒストグラム値H
Y(hy)の値に対し、その特徴点に対応した特徴量分
chi(但し、i;正の整数)を加算する(S10
4)。
【0058】S105では、hyの値が、PyiにPR
1を加算した値と等しいか否を判定する。もし、等しい
と判定されたら、S107において、特徴点のx座標値
Pxi(但し、i;正の整数)から第2の所定の範囲を
示す値PR2を引き、その値をhxに代入する。そし
て、S107で得られた値hxに位置する垂直方向のヒ
ストグラム値HX(hx)の値に対し、その特徴点に対
応した特徴量分chiを加算する(S108)。
【0059】次に、hxの値が、PxiにPR2を加算
した値と等しいか否かを判定し(S109)、もし等し
いと判定されたら、m個全ての特徴点に関して行ったか
否かを判定し(S111)、もしm個全ての特徴点に関
して行ったならば、処理を終了する(S112)。
【0060】一方、S105でノーならば、hyの値を
増分し(S106)、S104の処理に戻る。S109
でノーならば、hxの値を増分し(S110)、S10
8の処理に戻る。また、S111でノーならば、iの値
を増分し(S113)、S103の処理に戻る。
【0061】(5)(b)特徴量が2の場合の動作 図14は、特徴点が2つの場合のヒストグラム作成手段
27のフローチャートである。なお、図14中のS20
0〜S213は、ステップを表す。ここで、例えば各特
徴点(pxi,pyi)に対応して得られた特徴量1と
特徴量2の2つの特徴量を前述したようにch1i,c
h2iで表す。
【0062】図14のS200〜S203,S205〜
S207,S209〜S213の処理においては、図1
3で示したS100〜S103,S105〜S107,
S109〜S113のそれぞれに対応する処理と同様な
処理を行う。
【0063】そこで、S204の処理については、S2
03で得られた値hyに位置する水平方向のヒストグラ
ム値HY(y)の値に対し、その特徴点に対応した特徴
量1分ch1i(但し、i;正の整数)を加算する処理
を行う。S208の処理については、S207で得られ
た値hxに位置する垂直方向のヒストグラム値HX
(x)の値に対し、その特徴点に対応した特徴量2分c
h2i(但し、i;正の整数)を加算する処理を行う。
【0064】以上が特徴量が2つの場合のヒストグラム
作成手段27の動作の説明である。これらいずれかのよ
うにして水平方向のヒストグラムHY(y)(y;0,
1,2,…,YE)と、垂直方向のヒストグラムHX
(x)(x;0,1,2,…,XE)を作成する図11
(C)に、特徴検出手段25で、文字部の外接矩形の領
域の幅を特徴量1、高さを特徴量2として、1つの特徴
点に対応して2つ特徴量が検出された時に、ヒストグラ
ム作成手段27で、特徴量が2つの場合のヒストグラム
の作成を行う処理によって、第1の所定の範囲を示す値
PR1に0を設定して作成された水平方向のヒストグラ
ム作成結果を示す。図11(B)に、同処理によって、
第2の所定の範囲を示す値PR2に0を設定して作成さ
れた垂直方向のヒストグラム作成結果を示す。
【0065】また、図12(C)に、同処理によって、
第1の所定の範囲を示す値PR1に1を設定して作成さ
れた水平方向のヒストグラム作成結果を示す。図12
(B)に、同処理によって、第2の所定の範囲を示す値
PR2に1を設定して作成された垂直方向のヒストグラ
ム作成結果を示す。
【0066】ここで、用いられた特徴点は、図11
(A)及び図12(A)の×印で示される点であり、こ
れは前述した文字部の外接矩形の中心xy座標(中心点
座標)を特徴点とした場合である。
【0067】図12を見ると分る様に、第1と第2の所
定の範囲を示す値PR1,PR2に任意適度な値(例え
ば、正の整数)を設定することにより、入力文書の印刷
ずれや、画像読取り時のセッティングずれ等により、情
報領域の位置に誤差がある程度生じても、水平方向と垂
直方向の各ヒストグラムは、顕著な特徴が得られる。そ
のため、後述する文字行方向の判定を精度良く行える。
【0068】(6) 行方向判定手段30の動作 ヒストグラム作成手段27で、水平方向(X方向)及び
垂直方向(y方向)について特徴点のヒストグラムが作
成され、それらのヒストグラムの作成結果がそれぞれ水
平方向ヒストグラムメモリ28と垂直方向ヒストグラム
メモリ29に保存されると、次に、水平方向と垂直方向
の各ヒストグラムにおいて、最もヒストグラム値の大き
い値をそれぞれ検出し、それらの検出された値に基づい
て文字行の方向を判定する処理が以下のように行われ
る。
【0069】先ず、水平方向のヒストグラムから最もヒ
ストグラム値の大きい値を検出する処理においては、水
平方向のヒストグラムHY(y)(y=0,1,2,
…,YE)の中から、最も値の大きいHY(y)(但
し、y;正の整数)の値を図11(C)に示すmaxH
Yとして検出する。垂直方向のヒストグラムから最もヒ
ストグラム値の大きい値を検出する処理においては、垂
直方向のヒストグラムHX(x)(x=0,1,2,
…,XE)の中から、最も値の大きいHX(x)(但
し、x;正の整数)の値を図11(B)に示すmaxH
Xとして検出する。
【0070】これら検出されたmaxHYとmaxHX
の値を比較することにより、文字行の方向の判定を行
う。この判定方法は、maxHY≧maxHX…の条
件が満たされるならば、行方向が水平方向(x方向)で
あると判定し、そうでないならば、行方向が垂直方向
(y方向)であると判定する。
【0071】図4に示すように、横書き名刺の行方向が
水平方向となるように画像入力部10による読取りを行
った場合、条件が満足され、文字行の行方向は水平方
向(x方向)と判定される。これに対し、横書き名刺の
行方向が垂直方向となるように画像入力部10による読
取りを行った場合、条件が満足されず、文字行の行方
向は垂直方向(y方向)と判定される。従って、処理対
象文書、特に多種多様なレアウト構造の名刺における文
字行方向の判定を精度良く行える。この際、入力文書の
印刷ずれや、画像読取り時のセッテングずれ等により、
情報領域の位置に誤差がある程度生じても、文字行方向
の判定を精度良く行える。
【0072】なお、本発明は上記の実施例に限定され
ず、種々の変形が可能である。その変形例としては、例
えば次のようなものがある。 (i) 図1の外接矩形検出手段21と外接矩形選別手
段23において、画像データを走査して文字部等の情報
領域(例えば、文字部を形成する黒画素領域)を外接矩
形として検出し、その検出された外接矩形の中から文字
部の外接矩形を外接矩形として検出し、その検出された
外接矩形の中から文字部の外接矩形を抽出する処理を、
次のようにして実行してもよい。例えば、特願平2−3
0832号明細書に示されるように、領域分割処理によ
り得られた文字領域の範囲内に位置する外接矩形を検出
して、文字部の外接矩形として抽出しても良い。
【0073】(ii)図1の行方向判定装置20内の回路
ブロックを個別回路や専用LSI等で構成する以外に、
マイクロプロセッサ等を用いたプログラム制御により実
行する構成にしてもよい。また、情報領域は黒地に白地
の白画素領域でもよい。さらに、本発明は、名刺以外の
他の文書についても適用できる。
【0074】
【発明の効果】以上詳細に説明したように、第1の発明
によれば、画像データを走査して情報領域を外接矩形と
して検出し、その検出された外接矩形の中から文字部の
外接矩形のみを抽出し、その抽出された文字部の外接矩
形より特徴点及び特徴量を検出し、その検出された特徴
点の位置座標より、加算処理によって水平方向と垂直方
向のヒストグラムを作成する。そして、得られた水平方
向と垂直方向の各ヒストグラムにおいて、最もヒストグ
ラム値の大きい値をそれぞれ検出し、それらの検出され
た値に基づいて文字行の方向を判定する。そのため、処
理対象文書における文字行方向の判定を精度良く行え
る。
【0075】第2の発明によれば、外接矩形検出手段で
検出された外接矩形の幅及び高さを所定の値と比較する
等して、文字部の外接矩形のみを抽出するようにしてい
るので、該文字部の外接矩形の抽出が簡単、かつ的確に
行える。しかも、抽出した文字部の外接矩形を特徴検出
手段へ送るので、以後の処理が簡単、かつ精度よく行え
る。
【0076】第3の発明によれば、外接矩形の中心点及
び四隅のいずれかに基づいて特徴点を検出するので、活
字文字等の特徴点の検出を簡単かつ的確に行える。第4
の発明によれば、外接矩形の幅、高さ等に着目して特徴
量を検出するので、活字文字等の特徴量の検出を簡単か
つ的確に行える。
【0077】第5の発明によれば、第1及び第2の所定
の範囲を示す値に、任意適度な0以上の整数値を設定す
ることにより、入力文書の印刷ずれや、画像読取り時の
セッティングずれ等によって情報領域の位置に誤差があ
る程度生じても、水平方向と垂直方向の各ヒストグラム
は顕著な特徴が得られる。そのため、文字行方向の判定
を精度良く行える。第6の発明によれば、ヒストグラム
値の大小より、行方向を判定するので、判定が簡単で、
かつ精度良く行える。
【図面の簡単な説明】
【図1】本発明の実施例を示す行方向判定装置の機能ブ
ロック図である。
【図2】従来の行方向判定装置の原理説明図である。
【図3】従来の問題点の説明図である。
【図4】図1の画像データを示す図である。
【図5】図1の外接矩形検出結果を示す図である。
【図6】図1の外接矩形検出手段のフローチャートであ
る。
【図7】図1の外接矩形検出手段を説明する図である。
【図8】図5のy方向切り出し処理を説明する図であ
る。
【図9】図5のx方向切り出し処理を説明する図であ
る。
【図10】図1の外接矩形選別手段のフローチャートで
ある。
【図11】図1のヒストグラム作成手段を説明する図で
ある。
【図12】図1のヒストグラム作成手段を説明する図で
ある。
【図13】図1のヒストグラム作成手段において特徴量
が1つの場合のフローチャートである。
【図14】図1のヒストグラム作成手段において特徴量
が2つの場合のフローチャートである。
【符号の説明】
20 行方向判定装置 21 外接矩形検出手段 23 外接矩形選別手段 25 特徴検出手段 27 ヒストグラム作成手段 30 行方向判定手段

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 画像データを走査して該画像データ中の
    文字行の行方向を判定する行方向判定装置において、前
    記画像データを走査して前記画像データ中の情報領域を
    外接矩形として検出する外接矩形検出手段と、前記外接
    矩形検出手段で検出された外接矩形の中から文字部の外
    接矩形のみを抽出する外接矩形選別手段と、前記外接矩
    形選別手段で抽出された文字部の外接矩形より特徴点及
    び特徴量を検出する特徴検出手段と、前記特徴検出手段
    で検出された前記特徴点の位置座標より、第1の所定の
    範囲内に位置する水平方向のヒストグラム値の値に対し
    てその特徴点に対応した特徴量分を加算し、かつ前記特
    徴点の位置座標より、第2の所定の範囲内に位置する垂
    直方向のヒストグラム値の値に対してその特徴点に対応
    した特徴量分を加算することによって水平方向と垂直方
    向のヒストグラムを作成するヒストグラム作成手段と、
    前記ヒストグラム作成手段で作成された水平方向と垂直
    方向の各ヒストグラムにおいて最大ヒストグラム値をそ
    れぞれ検出し、それらの検出値に基づいて前記文字行の
    行方向を判定する行方向判定手段とを、備えたことを特
    徴とする行方向判定装置。
  2. 【請求項2】 請求項1記載の行方向判定装置におい
    て、前記外接矩形選別手段は、前記外接矩形の幅が第1
    の所定の値より大きい、あるいは高さが第2の所定の値
    より大きいと判定された外接矩形について、該外接矩形
    の幅と高さの小さい方の値から、幅と高さの大きい方の
    値で割った値が第3の所定の値より小さく、幅と高さの
    大きい方の値が第4の所定の値より大きいと判定され
    ず、また該外接矩形の幅と高さの積が第5の所定の値よ
    り大きいと判定されなかった外接矩形を、前記文字部の
    外接矩形と判定して抽出する構成にした行方向判定装
    置。
  3. 【請求項3】 請求項1記載の行方向判定装置におい
    て、前記特徴検出手段は、前記文字部の外接矩形の中心
    点、左上点、右下点、左下点及び右上点のいずれかに基
    づいて前記特徴点を検出する構成にした行方向判定装
    置。
  4. 【請求項4】 請求項1記載の行方向判定装置におい
    て、前記特徴検出手段は、前記文字部の外接矩形の幅、
    高さ、幅と高さの大きい方のいずれかに基づき、あるい
    は幅と高さの両方に基づき、前記特徴量を検出する構成
    にした行方向判定装置。
  5. 【請求項5】 請求項1記載の行方向判定装置におい
    て、前記第1の所定の範囲及び第2の所定の範囲を示す
    値として、任意適度な0以上の整数値を設定する構成に
    した行方向判定装置。
  6. 【請求項6】 請求項1記載の行方向判定装置におい
    て、前記行方向判定手段は、前記水平方向のヒストグラ
    ムから検出された値の方が、前記垂直方向のヒストグラ
    ムから検出された値より大きければ前記文字行の行方向
    を水平方向と、そうでなければ前記文字行の行方向を垂
    直方向と判定する構成にした行方向判定装置。
JP3236614A 1991-04-22 1991-09-17 行方向判定装置 Expired - Fee Related JP2957774B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3236614A JP2957774B2 (ja) 1991-04-22 1991-09-17 行方向判定装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP9083691 1991-04-22
JP3-90836 1991-04-22
JP3236614A JP2957774B2 (ja) 1991-04-22 1991-09-17 行方向判定装置

Publications (2)

Publication Number Publication Date
JPH056457A JPH056457A (ja) 1993-01-14
JP2957774B2 true JP2957774B2 (ja) 1999-10-06

Family

ID=26432247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3236614A Expired - Fee Related JP2957774B2 (ja) 1991-04-22 1991-09-17 行方向判定装置

Country Status (1)

Country Link
JP (1) JP2957774B2 (ja)

Also Published As

Publication number Publication date
JPH056457A (ja) 1993-01-14

Similar Documents

Publication Publication Date Title
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JP2957729B2 (ja) 行方向判定装置
JP2957774B2 (ja) 行方向判定装置
JP2957739B2 (ja) 行方向判定装置
JP2963532B2 (ja) 行方向判定装置
JP2868134B2 (ja) 画像処理方法及び装置
JP2957707B2 (ja) 行方向判定装置
JPH02293989A (ja) 文字認識装置
JPS6132187A (ja) 文字認識方式
JP2957740B2 (ja) 行方向判定装置
JPH06187489A (ja) 文字認識装置
JPH0373916B2 (ja)
JP3052438B2 (ja) 表認識装置
JP3710164B2 (ja) 画像処理装置及び方法
JP3162414B2 (ja) 罫線認識方法及び表処理方法
JP2888885B2 (ja) 文字切出し装置
JPH0728934A (ja) 文書画像処理装置
JPH04360294A (ja) 表認識装置および表認識方法
JP2922356B2 (ja) 文字認識処理装置
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JPH0573718A (ja) 領域属性識別方式
JP2929710B2 (ja) 文字読み取り方法
JP3045086B2 (ja) 光学式文字読取方法および装置
JPH0573721A (ja) 表認識装置
JPH10233930A (ja) 画像処理装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990706

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080723

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090723

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees