JPH04311283A - 行方向判定装置 - Google Patents

行方向判定装置

Info

Publication number
JPH04311283A
JPH04311283A JP3076369A JP7636991A JPH04311283A JP H04311283 A JPH04311283 A JP H04311283A JP 3076369 A JP3076369 A JP 3076369A JP 7636991 A JP7636991 A JP 7636991A JP H04311283 A JPH04311283 A JP H04311283A
Authority
JP
Japan
Prior art keywords
circumscribed rectangle
histogram
character
rectangle
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3076369A
Other languages
English (en)
Other versions
JP2957729B2 (ja
Inventor
Kazuhiro Ishikawa
和弘 石川
Koji Ito
伊東 晃治
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3076369A priority Critical patent/JP2957729B2/ja
Publication of JPH04311283A publication Critical patent/JPH04311283A/ja
Application granted granted Critical
Publication of JP2957729B2 publication Critical patent/JP2957729B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学的文字読取装置(
OCR)等において、名刺等の文書の行方向(文字列方
向)を検出する行方向判定装置に関するものである。
【0002】
【従来の技術】従来、文字認識のために名刺の行方向を
検出する行方向判定装置としては、例えば特開昭62−
166479号公報に記載されるものがあった。以下、
その構成を説明する。
【0003】図2の(A)〜(C)は、従来の行方向判
定装置の原理説明図である。
【0004】図2(A)は名刺の画像データ1の一例を
示す図であり、この画像データ1上にはX−Y座標系が
設定されている。また、図2(B)及び(C)は、図2
(A)の画像データ1に関する水平及び垂直方向の周辺
分布が示されている。図2(B)では縦軸にY軸及び横
軸に副走査座標Yの水平走査線上の累積黒画素数が取ら
れ、また図2(C)では横軸にX軸及び縦軸に副走査座
標Xの垂直走査線上の累積黒画素数が取られている。
【0005】この種の行方向判定装置では、名刺全体の
画像データ1の射影を取り、水平及び垂直方向の周辺分
布を作成する。そして、水平方向の周辺分布の文字部領
域2の先頭の文字部領域の始端から末尾の文字部領域の
終端までの長さWXと、垂直方向の周辺分布の文字部領
域2の先頭の始端から末尾の終端までの長さWYとを得
、これらの長さのうち、長いほうの長さを得た周辺分布
の主走査方向を文字行方向と判定する。
【0006】
【発明が解決しようとする課題】しかしながら、上部構
成の装置では、次のような課題があった。
【0007】図3の(A)〜(C)は、従来装置の問題
点の説明図であり、同図(A)は他の画像データ1aの
例、同図(B)及び(C)は同図(A)の画像データ1
aにおける水平及び垂直方向の周辺分布を示す。
【0008】図3(A)に示すように、画像データ1a
における文字行が名刺の局部(例えば、中央部)に集中
して存在し、かつ文字行の長さが短い場合、該画像デー
タ1aの周辺分布から得られる文字部領域2aの長さW
Xa,WYaの大小関係はWXa<WYaとなる。その
ため、行方向が実際には水平方向であるにもかかわらず
、WXa<WYaという関係から、垂直方向を行方向と
してしまい、誤った判定結果になるという問題があり、
それを解決することが困難であった。
【0009】本発明は前記従来技術が持っていた課題と
して、文字行が名刺の局部に集中して存在し、かつ文字
行の長さが短いと、行方向を必ずしも正しく判定するこ
とができないという点について解決した行方向判定装置
を提供するものである。
【0010】
【課題を解決するための手段】前記課題を解決するため
に、第1の発明は、画像データを走査して該画像データ
中の文字行の行方向を判定する行方向判定装置において
、次のような手段を備えている。
【0011】即ち、第1の発明では、前記画像データを
走査して前記画像データ中の情報領域を外接矩形として
検出する外接矩形検出手段と、前記外接矩形検出手段で
検出された外接矩形の中から文字部の外接矩形のみを抽
出する外接矩形選別手段と、前記外接矩形選別手段で抽
出された文字部の外接矩形より特徴点を検出する特徴点
検出手段と、前記特徴点検出手段で検出された特徴点の
位置座標における水平方向及び垂直方向のヒストグラム
値の値を増分することによって水平方向と垂直方向のヒ
ストグラムを作成するヒストグラム作成手段と、前記ヒ
ストグラム作成手段で作成された水平方向と垂直方向の
各ヒストグラムにおいて最大ヒストグラム値をそれぞれ
検出し、それらの検出値に基づいて前記文字行の行方向
を判定する行方向判定手段とを、備えている。
【0012】第2の発明では、第1の発明の外接矩形選
別手段を、前記外接矩形の幅が第1の所定の値より大き
い、あるいは高さが第2の所定の値より大きいと判定さ
れた外接矩形について、該外接矩形の幅と高さの小さい
方の値から、幅と高さの大きい方の値で割った値が第3
の所定の値より小さく、幅と高さの大きい方の値が第4
の所定の値より大きいと判定されず、また該外接矩形の
幅と高さの積が第5の所定の値より大きいと判定されな
かった外接矩形を、前記文字部の外接矩形と判定して抽
出する構成にしている。
【0013】第3の発明では、第1の発明の特徴点検出
手段を、前記文字部の外接矩形の中心点、左上点、右下
点、左下点及び右上点のいずれかに基づいて前記特徴点
を検出する構成にしている。
【0014】第4の発明では、第1の発明の行方向判定
手段を、前記水平方向のヒストグラムから検出された値
の方が、前記垂直方向のヒストグラムから検出された値
より大きければ前記文字行の行方向を水平方向と、そう
でなければ前記文字行の行方向を垂直方向と判定する構
成にしている。
【0015】
【作用】第1の発明によれば、以上のように行方向判定
装置を構成したので、画像データが入力されると、外接
矩形検出手段では、該画像データを走査して文字部等の
情報領域(例えば、文字部を形成する黒画素領域)を外
接矩形として検出する。検出された外接矩形は、その中
より、文字部の外接矩形のみが外接矩形選別手段で抽出
される。抽出された文字部の外接矩形は、特徴点検出手
段により、特徴点が検出される。ヒストグラム作成手段
では、検出された特徴点の位置座標に位置する水平方向
及び垂直方向のヒストグラム値の値を増分することによ
り、水平方向と垂直方向のヒストグラムを作成する。行
方向判定手段では、水平方向と垂直方向の各ヒストグラ
ムにおいて、最もヒストグラム値の大きい値をそれぞれ
検出し、それらの検出された値に基づいて文字行の行方
向を判定する。これにより、高精度に、文字行の方向の
判定が行える。
【0016】第2の発明では、外接矩形選別手段により
、外接矩形の幅及び高さを所定の値と比較する等して、
外接矩形検出手段で検出された外接矩形の中から文字部
の外接矩形のみを抽出するので、文字部の外接矩形の抽
出処理が簡単に行える。さらに、抽出した文字部の外接
矩形を特徴点検出手段へ送り、その特徴点検出手段で特
徴点の検出を行わせるので、以後の処理がより簡単にな
る。
【0017】第3の発明では、特徴点検出手段により、
文字部の外接矩形の中心点及びその四隅のいずれかに着
目して特徴点を検出するので、活字文字等の該特徴点の
検出を簡単かつ的確に行える。
【0018】第4の発明では、行方向判定手段により、
ヒストグラム値の大小関係から文字行の方向を判定する
ので、名刺等の文書における行方向の判定が簡単に行え
る。従って、前記課題を解決できるのである。
【0019】
【実施例】図1は、本発明の一実施例を示す行方向判定
装置の概略の機能ブロック図である。
【0020】図1において、名刺等の入力原稿を画像デ
ータの形で読み取る画像入力部10と、その読み取った
画像データを格納する画像メモリ11とを備え、該画像
メモリ11の出力側に、行方向判定装置20が接続され
ている。
【0021】行方向判定装置20は、画像メモリ11に
格納された画像データを走査して文字部等の情報領域(
例えば、文字部等を形成する黒画素領域)を外接矩形と
して検出する外接矩形検出手段21を有し、その出力側
には、外接矩形位置メモリ22が接続されている。外接
矩形位置メモリ22は、検出された外接矩形の位置情報
を保存するもので、その出力側には、外接矩形選別手段
23、及び文字部外接矩形位置メモリ24が接続されて
いる。外接矩形選別手段23は、外接矩形位置メモリ2
2に保存された外接矩形の中から、文字部の外接矩形の
みを抽出し、その位置情報を文字部外接矩形位置メモリ
24へ保存させる機能を有している。
【0022】文字部外接矩形位置メモリ24の出力側に
は、特徴点検出手段25、特徴点位置メモリ26、及び
ヒストグラム作成手段27が接続されている。特徴点検
出手段25は、文字部外接矩形位置メモリ24内の文字
部の外接矩形の位置情報より、特徴点を検出する機能を
有し、その特徴点の位置情報が特徴点位置メモリ26に
保存されるようになっている。ヒストグラム作成手段2
7は、特徴点位置メモリ26に保存された特徴点の位置
座標に位置する水平方向及び垂直方向のヒストグラム値
の値を増分することにより、水平方向と垂直方向のヒス
トグラムを作成する機能を有し、その出力側には、水平
方向ヒストグラムメモリ28及び垂直方向ヒストグラム
メモリ29を介して行方向判定手段30が接続されてい
る。
【0023】水平方向ヒストグラムメモリ28及び垂直
方向ヒストグラムメモリ29は、ヒストグラム作成手段
27で作成された水平方向と垂直方向のヒストグラムを
それぞれ保存する機能を有している。行方向判定手段3
0は、メモリ28,29に保存された水平方向と垂直方
向の各ヒストグラムにおいて、最もヒストグラム値の大
きい値をそれぞれ検出し、それらの検出値に基づいて文
字行の方向を判定する機能を有している。
【0024】次に、図4〜図12を参照しつつ、図1中
の各回路ブロックの動作(1)〜(6)を説明する。
【0025】(1)  画像入力部10の動作画像入力
部10は、処理対象となる入力原稿(例えば、名刺)を
走査し、画素分解して読取って文字線部を黒ビット及び
文字背景部を白ビットで表す白黒2値の画像データを出
力する。画像メモリ11は、画像入力部10からの画像
データを走査順次に格納する。本実施例における画像入
力部10での読取り解像度は、16本1mmの解像度で
行った。
【0026】(2)  外接矩形検出手段21の動作図
4は画像データ及び図5は外接矩形検出結果の一例を示
す図である。図4は画像メモリ11に格納された白黒2
値の画像データ40の全体、また図5の実線で示す矩形
枠は図4の画像データ40の一例につき検出された外接
矩形42を示す。
【0027】図4に示すように、画像メモリ11上には
x−y座標系を設定し、この座標系で表される画素位置
の画像データ(画素データ)40の読出しが自在に行え
るようになっている。例えば、名刺の読取りの際には、
名刺を画像入力部10の読取り面に載置して走査するが
、このとき名刺の角点が座標系の原点0と一致し、かつ
名刺の文字行方向がx軸に沿う方向(水平方向)及びy
軸に沿う方向(垂直方向)のいずれか一方となるように
、名刺を読取り面にセットする。そして、画像入力部1
0の読取り面において、名刺が載置されていない領域が
白ビットで表されるようにする。
【0028】また、画像データ40の処理領域(図4中
のx,y軸及び一点鎖線で囲む領域)41は、0≦x≦
XEかつ0≦y≦YEなる範囲であるが、名刺の長手方
向が水平及び垂直方向のいずれとなっても、名刺全体の
画像データを処理領域41内に格納できるように、XE
及びYEの値を名刺の長手方向の、画像データ40上に
おける長さよりもやや大きめの値に設定する。
【0029】画像入力部10が画像メモリ11へ画像デ
ータ40を格納し終えると、第1の方向を水平方向及び
第2の方向を垂直方向とした場合の情報領域(黒画素領
域)を外接矩形42として、その始点及び終点を検出す
る外接矩形検出手段21を起動する。
【0030】次に、図6〜図9を参照し、外接矩形検出
手段21の動作を説明する。
【0031】図6は図1中の外接矩形検出手段21の動
作例を示すフローチャート、及び図7は外接矩形検出手
段21を説明する図である。なお、図6及び図7中のS
50〜S66,S70〜S73,…はステップ、iは階
層、mはx方向に切り出された領域番号、nはy方向に
切り出た領域番号である。また、この外接矩形検出手段
21では、図4に示すように、画像メモリ11中の画像
データ40を走査することにより行う。
【0032】先ず、図6のS50〜S52において、i
,n,mをそれぞれ初期値1に初期化する。そして、領
域の始点座標{xs(i−1,m),ys(i−1,n
)}、終点座標{xe(i−1,m),ye(i−1,
n)}に対し、図7のS70に示すように、y軸方向の
領域をn個の領域に切り出す処理を行う(S53)。こ
の切り出し処理について、図8のy方向の切り出し処理
を説明する図を用いて説明する。始点座標{xs(i−
1,m),ys(i−1,n)}、終点座標{xe(i
−1,m)、ye(i−1,n)}で示される背景パタ
ン43上の情報領域44に対して、図4に示す画像デー
タ40中にx方向に黒画素が1つでも存在する黒ライン
を検出する。その黒ラインのy座標値を始点y座標とし
て抽出し、次いでx方向に黒画素が1つも存在しない白
ラインが連続して閾値THを越える白ラインを検出する
。その注目する白ラインの(TH+1)ライン前の黒ラ
インのy座標値を終点y座標値として抽出する。
【0033】以上の操作を領域{xs(i−1,m),
ys(i−1,n)},{xe(i−1,m),ye(
i−1,n)}の全てのy座標について行い、n個の領
域{xs(i−1,m),ys(i,n)},{xe(
i−1,m),ye(i,n)}(但し、n;正の整数
)を切り出す。このとき、領域{xs(0,1),ys
(0,1)},{xe(0,1),ye(0,1)}は
、初期値として(0,0),(XE,YE)を予めセッ
トしておき、これは画像データ40の全領域を示す。
【0034】さらに、検出された連続する白ラインの数
が閾値THを越えない間に黒ラインを検出した場合、上
下の領域は同領域と判断して処理を継続して行い、連続
する白ラインが閾値THを越えるまで繰り返し行う。黒
ラインのy座標値がye(i−1,n)と等しくなる場
合、ye(i−1,n)を終点y座標値として抽出し、
y座標値がye(i−1,n)となったら処理を終了す
る。
【0035】このように、領域{xs(i−1,m),
ys(i−1,n)},{xe(i−1,m),ye(
i−1,n)}に対して、y方向に切り出されたn個の
領域{xs(i−1,m),ys(i,n)},{xe
(i−1,m),ye(i,n)}(但し、n;正の整
数)は、そのn個の始点、終点y座標の情報を外接矩形
位置メモリ32に保存する(S54)。図7のS70に
示すi=1の時のnの値が1,2,3で示される領域が
、その処理結果例を示す。
【0036】次に、図6のS53でy方向に切り出され
たn個の領域{xs(i−1,m),ys(i,n)}
,{xe(i−1,m),ye(i,n)}(但し、n
;正の整数)について、以下の処理を行う。
【0037】先ず、nの値を初期化する(nの初期値=
1(S55))。そして領域始点座標{xs(i−1,
m),ys(i,n)}、終点座標{xe(i−1,m
),ye(i,n)}に対し、図7のS71のように、
x軸方向について領域を複数個(m個)の領域に切り出
す処理を行う(S56)。
【0038】この切り出し処理について、図9のx軸方
向の切り出し処理を説明する図を用いて説明する。
【0039】前記始点座標及び終点座標で示される領域
に対して、図4の画像データ40中にy方向に黒画素が
1つでも存在する黒カラムを検出し、その黒カラムのx
座標値を始点x座標として抽出する。次いで、y方向に
黒画素が1つでも存在しない白カラムが連続して閾値T
Hを越える白カラムを検出し、その注目する白カラムの
(TH+1)カラム前の黒カラムのx座標値を終点x座
標値として抽出する。以上の操作を領域{xs(i−1
,m),ys(i,n)},{xe(i−1,m),y
e(i,n)}の全てのx座標について行い、m個の領
域{xs(i,m),ys(i,n)},{xe(i,
m),ye(i,n)}(但し、m;正の整数)を切り
出す(s56)。さらに、検出された連続する白カラム
の数が閾値THを越えない間に黒カラムを検出した場合
、左右の領域は同領域と判断して処理の継続を行い、連
続する白カラムが閾値THを越えるまで繰り返し行う。 黒カラムのx座標値がxe(i−1,m)と等しくなる
場合、xe(i−1,m)を終点x座標値として抽出し
、x座標値がxe(i−1,m)となったら処理を終了
する。
【0040】このように、領域{xs(i−1,m),
ys(i,n)},{xe(i−1,m),ye(i,
n)}に対して、x方向に切り出されたm個の領域{x
s(i,m),ys(i,n)},{xe(i,m),
ye(i,n)}は、そのm個の始点、終点x座標値の
情報を外接矩形位置メモリ22に保存する(S57)。 図7のS71に示すi=1の時のmの値が1,2,3で
示される領域がその処理結果例を示す。
【0041】以上の切り出し方法で処理を行い、図7の
S72,S73,…のように、階層iにおけるmの値と
nの値がそれぞれ1,1のみとなるように処理を繰り返
し行う。そこで、階層iにおけるmの値とnの値がそれ
ぞれ1,1のみであった場合(S58)、領域の始点座
標{xs(i,1),ys(i,1)}、終点座標{x
e(i,1),ye(i,1)}を外接矩形領域として
抽出し(S59)、その始点、終点座標を外接矩形位置
メモリ22に保存する(S60)。
【0042】次いで、この階層の値を減分し(S61)
、階層i番目の全てのnについて行ったか否かを判定す
る(S62)。もし全てのnについて行ったと判定され
たら、次に階層i番目の全てのmについて行ったか否か
を判定し(S63)、もし全てのmについて行っていれ
ば、処理を終了する(S64)。一方、S58でノーの
場合、階層iの値を増分し(S67)、S52の処理に
戻る。また、S62でノーの場合、nの値を増分し(S
65)、S56の処理に戻り、同様にS63でノーの場
合、mの値を増分し(S66)、S53に戻る。
【0043】以上が外接矩形検出手段21の一連の処理
であり、図7に示す要領で順次、処理を繰り返す。要す
るに、閾値TH以上の白ライン、白カラムに囲まれる情
報領域を、これ以上の切り出しはないという段階まで処
理を繰り返し行い、最終的に切り出された領域を外接矩
形42として検出し、外接矩形位置メモリ22に保存す
るものである。
【0044】(3)  外接矩形選別手段23の動作外
接矩形検出手段21で画像データ40を全面走査して外
接矩形42の検出を行い、全ての外接矩形42の位置を
示す始点座標、終点座標が外接矩形位置メモリ22に保
存されると、次に外接矩形選別手段23により、検出さ
れた外接矩形42の中から文字部の外接矩形のみを抽出
する処理が行われる。その処理を、図10を参照して以
下説明する。
【0045】図10は、図1の外接矩形選別手段23の
フローチャートである。
【0046】なお、図10中のS80〜93はステップ
である。ここで、全ての外接矩形42を(xsj,ys
j),(xej,yej)(但し、j;正の整数)で表
すとし、その外接矩形の全てをM個(j;1,2,3,
…,M)で表す。また、第1〜5の所定の値をそれぞれ
PR1〜PR5で表し、これらの値は予め任意の値(0
以上の実数値)を設定する。
【0047】先ず、図10のS80において、jを初期
値1に初期化した後、外接矩形の幅をxej−xsi+
1により求め、その値をwdに代入する(S81)。次
いで、外接矩形の高さをyej−ysj+1により求め
、その値をhtに代入する(S82)。そして、S81
で得られた値wdが第1の所定の値PR1より大きいか
、あるいはS82で得られた値htが第2の所定の値P
R2より大きいか否かを判定する(S83)。
【0048】S83で、いずれか一方でも大きいと判定
されたら、wdとhtの小さい方の値をv1に代入し(
S84)、wdとhtの大きい方の値をv2に代入する
(S85)。さらに、wdとhtとの積をv3に代入し
(S86)、v1からv2を割った値をv4に代入する
(S87)。なお、v3は外接矩形の面積を表す。
【0049】S88において、S87で得られたv4が
第3の所定の値PR3より小さく、かつS85で得られ
た値v2が第4の所定の値PR4より大きいか否かの判
定を行う。その条件が満たされなかったら、S86で得
られた値v3が第5の所定の値5より大きいか否かの判
定を行う(S89)。もし小さいと判定されたら、その
外接矩形は文字部の外接矩形と判定して、その外接矩形
の位置情報(xsj,ysj),(xej,yej)(
但し、j;正の整数)を文字部外接矩形位置メモリ24
に保存する(S90)。そして、M個全ての外接矩形に
関して処理を行ったか否かを判定し(S91)、もしM
個全ての外接矩形について行ったと判定されたら、処理
を終了する(S92)。
【0050】一方、S83でノー、S88でイエス、S
89てイエスならば、S91の処理を行う。また、S9
1でノーならば、iの値を増分し(S93)、S81の
処理に戻る。
【0051】この様にして文字部の外接矩形が抽出され
ると、その位置情報が文字部外接矩形位置メモリ24に
順次保存される。
【0052】(4)  特徴点検出手段25の動作外接
矩形選別手段23で、全ての外接矩形42の中から文字
部の外接矩形のみを抽出する処理を行い、全ての文字部
の外接矩形の位置を示す始点座標、終点座標が文字部外
接矩形位置メモリ24に保存されると、次に特徴点検出
手段25により、全ての文字部の外接矩形について特徴
点を検出する処理が行われる。
【0053】この特徴点の検出処理は、検出された各文
字部の外接矩形の領域内から、特徴となる点を1点検出
するものである。これは、文字部の外接矩形の始点xy
座標(左上点座標)、終点XY座標(右下点座標)、始
点x終点y座標(左下点座標)、終点x始点y座標(右
上点座標)、及び中心xy座標(中心点座標)のいずれ
かに着目して検出する。
【0054】全ての文字部の外接矩形を(xsi,ys
i),(xei,yei)(但し、i;正の整数)で表
すとすると、文字部の外接矩形の始点xy座標(左上点
座標)に着目する場合、特徴点は(xsi,ysi)の
点で表される。文字部の外接矩形の終点xy座標(右下
点座標)に着目する場合、特徴点は(xei,yei)
の点で表され、文字部の外接矩形の始点x、終点y座標
(右下点座標)に着目する場合、特徴点は(xsi,y
ei)の点で表され、文字部の外接矩形の終点x、始点
y座標(右上点座標)に着目する場合、特徴点は(xe
i,ysi)の点で表され、さらに文字部の外接矩形の
中心xy座標(中心点座標)に着目する場合、特徴点は
{xsi+[(xei−xsi+1)/2],ysi+
[(yei−ysi+1)/2]}の点で表される。こ
こで、[  ]の部分は小数点以下の値をもつ実数値に
なることが考えられるので、切り捨て、切り上げ等の処
理を行って整数値に変換することを意味する。
【0055】以上説明したいずれかの点に着目して検出
された特徴点の位置情報は、特徴点位置メモリ26に保
存する。
【0056】図11(A)〜(C)は、図1のヒストグ
ラム作成手段27を説明する図であり、同図(A)中の
×印で示す点が、検出された特徴点の一例を示している
。この図に示される特徴点は、文字部の外接矩形の中心
xy座標(中心点座標)に着目した場合である。
【0057】(5)  ヒストグラム作成手段27の動
作特徴点検出手段25で全ての文字部の外接矩形につい
て特徴点の検出を行い、全ての特徴点の位置情報が特徴
点位置メモリ26に保存されると、次にヒストグラム作
成手段27により、検出された特徴点の位置座標に位置
する水平方向及び垂直方向のヒストグラム値の値を増分
することによって、水平方向と垂直方向のヒストグラム
を作成する処理が行われる。
【0058】図12は図11のヒストグラム作成手段2
7のフローチャートであり、これらを参照しつつ、ヒス
トグラム作成手段27の動作を説明する。
【0059】なお、図12中のS100〜S107は、
ステップを表す。ここで、全ての特徴点を(pxi,p
yi)(但し  i;正の整数)で表し、その特徴点の
全てをm個(i=1,2,…,m)で表す。水平方向(
x方向)のヒストグラムの作成についてはHY(y)で
表し、yは0,1,2,…,YEの範囲をとりうる。垂
直方向(y方向)のヒストグラムの作成についてはHX
(x)で表し、xは0,1,2,…,XEの範囲をとり
うる。これらのHY(y)とHX(x)のヒストグラム
値は、それぞれ水平方向ヒストグラムメモリ28と垂直
方向ヒストグラムメモリ29中に存在し、以下に示す処
理を実行することにより、その都度、該メモリ28,2
9内の値が更新され、保存されるものである。
【0060】先ず、図12のS100,S101におい
て、全てのyにおけるHY(y)の値を初期値0に、ま
た全てのxにおけるHX(x)の値を初期値0にそれぞ
れ初期化する。S102において、iを初期値1に初期
化する。そしてS103で、特徴点のx座標値pxi(
但し、i;正の整数)に位置する垂直方向ヒストグラム
値HX(pxi)の値を増分し、S104で、特徴点の
y座標値pyi(但し、i;正の整数)に位置する水平
方向ヒストグラム値HY(pyi)の値を増分する。 次に、m個全ての特徴点に関して行ったか否を判定し(
S105)、もしm個全ての特徴点に関して行ったなら
ば、処理を終了する(S106)。
【0061】一方、S105でノーならば、iの値を増
分し(S107)、S103の処理に戻る。
【0062】この様にして水平方向のヒストグラムHY
(y)(y=0,1,2,…,YE)と垂直方向のヒス
トグラムHX(x)(x=0,1,2,…,XE)を作
成し、その結果をメモリ28,29に保存する。
【0063】図11(B)にヒストグラム作成手段27
で作成された垂直方向のヒストグラムの作成結果HX(
x)(x=0,1,2,…,XE)を示し、図11(C
)に水平方向のヒストグラムの作成結果HY(y)(y
=0,1,2,…,YE)を示す。ここで用いられた特
徴点は、図11(A)の×印で示される点であり、これ
は前述した文字部の外接矩形の中心xy座標(中心点座
標)を特徴点とした場合である。
【0064】(6)  行方向判定手段30の動作ヒス
トグラム作成手段27で、水平方向(X方向)及び垂直
方向(y方向)について特徴点のヒストグラムが作成さ
れ、それらのヒストグラムの作成結果がそれぞれ水平方
向ヒストグラムメモリ28と垂直方向ヒストグラムメモ
リ29に保存されると、次に、水平方向と垂直方向の各
ヒストグラムにおいて、最もヒストグラム値の大きい値
をそれぞれ検出し、それらの検出された値に基づいて文
字行の方向を判定する処理が以下のように行われる。
【0065】先ず、水平方向のヒストグラムから最もヒ
ストグラム値の大きい値を検出する処理においては、水
平方向のヒストグラムHY(y)(y=0,1,2,…
,YE)の中から、最も値の大きいHY(y)(但し、
y;正の整数)の値を図11(C)に示すmaxHYと
して検出する。垂直方向のヒストグラムから最もヒスト
グラム値の大きい値を検出する処理においては、垂直方
向のヒストグラムHX(x)(x=0,1,2,…,X
E)の中から、最も値の大きいHX(x)(但し、x;
正の整数)の値を図11(B)に示すmaxHXとして
検出する。
【0066】これら検出されたmaxHYとmaxHX
の値を比較することにより、文字行の方向の判定を行う
。この判定方法は、maxHY≧HX…■の条件が満た
されるならば、行方向が水平方向(x方向)であると判
定し、そうでないならば、行方向が垂直方向(y方向)
であると判定する。
【0067】図4に示すように、横書き名刺の行方向が
水平方向となるように画像入力部10による読取りを行
った場合、条件■が満足され、文字行の行方向は水平方
向(x方向)と判定される。これに対し、横書き名刺の
行方向が垂直方向となるように画像入力部10による読
取りを行った場合、条件■が満足されず、文字行の行方
向は垂直方向(y方向)と判定される。従って、処理対
象文書、特に多種多様なレアウト構造の名刺における文
字行方向の判定を精度良く行える。
【0068】なお、本発明は上記の実施例に限定されず
、種々の変形が可能である。その変形例としては、例え
ば次のようなものがある。
【0069】(i)  図1の外接矩形検出手段21と
外接矩形選別手段23において、画像データを走査して
文字部等の情報領域(例えば、文字部を形成する黒画素
領域)を外接矩形として検出し、その検出された外接矩
形の中から文字部の外接矩形を外接矩形として検出し、
その検出された外接矩形の中から文字部の外接矩形を抽
出する処理を、次のようにして実行してもよい。例えば
、特願平2−30832号明細書に示されるように、領
域分割処理により得られた文字領域の範囲内に位置する
外接矩形を検出して、文字部の外接矩形として抽出して
も良い。
【0070】(ii)図1の行方向判定装置20内の回
路ブロックを個別回路や専用LSI等で構成する以外に
、マイクロプロセッサ等を用いたプログラム制御により
実行する構成にしてもよい。また、情報領域は黒地に白
地の白画素領域でもよい。さらに、本発明は、名刺以外
の他の文書についても適用できる。
【0071】
【発明の効果】以上詳細に説明したように、第1の発明
によれば、画像データを走査して情報領域を外接矩形と
して検出し、その検出された外接矩形の中から文字部の
外接矩形のみを抽出し、その抽出された文字部の外接矩
形より特徴点を検出し、その検出された特徴点の位置座
標に位置する水平方向及び垂直方向のヒストグラム値の
値を増分することによって、水平方向と垂直方向のヒス
トグラムを作成する。そして、得られた水平方向と垂直
方向の各ヒストグラムにおいて、最もヒストグラム値の
大きい値をそれぞれ検出し、それらの検出された値に基
づいて文字行の方向を判定する。そのため、処理対象文
書における文字行方向の判定を精度良く行える。
【0072】第2の発明によれば、外接矩形検出手段で
検出された外接矩形の幅及び高さを所定の値と比較する
等して、文字部の外接矩形のみを抽出するようにしてい
るので、該文字部の外接矩形の抽出が簡単、かつ的確に
行える。しかも、抽出した文字部の外接矩形を特徴点検
出手段へ送るので、以後の処理が簡単、かつ精度よく行
える。
【0073】第3の発明によれば、外接矩形の中心点及
び四隅のいずれかに基づいて特徴点検出するので、活字
字等の特徴点の検出を簡単かつ的確に行える。
【0074】第4の発明によれば、ヒストグラム値の大
小より、行方向を判定するので、判定が簡単で、かつ精
度良く行える。
【図面の簡単な説明】
【図1】本発明の実施例を示す行方向判定装置の機能ブ
ロック図である。
【図2】従来の行方向判定装置の原理説明図である。
【図3】従来の問題点の説明図である。
【図4】図1の画像データを示す図である。
【図5】図1の外接矩形検出結果を示す図である。
【図6】図1の外接矩形検出手段のフローチャートであ
る。
【図7】図1の外接矩形検出手段を説明する図である。
【図8】図5のy方向切り出し処理を説明する図である
【図9】図5のx方向切り出し処理を説明する図である
【図10】図1の外接矩形選別手段のフローチャートで
ある。
【図11】図1のヒストグラム作成手段を説明する図で
ある。
【図12】図11のヒストグラム作成手段のフローチャ
ートである。
【符号の説明】
20    行方向判定装置 21    外接矩形検出手段 23    外接矩形選別手段 25    特徴点検出手段 27    ヒストグラム作成手段 30    行方向判定手段

Claims (1)

  1. 【特許請求の範囲】 【請求項1】  画像データを走査して該画像データ中
    の文字行の行方向を判定する行方向判定装置において、
    前記画像データを走査して前記画像データ中の情報領域
    を外接矩形として検出する外接矩形検出手段と、前記外
    接矩形検出手段で検出された外接矩形の中から文字部の
    外接矩形のみを抽出する外接矩形選別手段と、前記外接
    矩形選別手段で抽出された文字部の外接矩形より特徴点
    を検出する特徴点検出手段と、前記特徴点検出手段で検
    出された特徴点の位置座標における水平方向及び垂直方
    向のヒストグラム値の値を増分することによって水平方
    向と垂直方向のヒストグラムを作成するヒストグラム作
    成手段と、前記ヒストグラム作成手段で作成された水平
    方向と垂直方向の各ヒストグラムにおいて最大ヒストグ
    ラム値をそれぞれ検出し、それらの検出値に基づいて前
    記文字行の行方向を判定する行方向判定手段とを、備え
    たことを特徴とする行方向判定装置。 【請求項2】  請求項1記載の行方向判定装置におい
    て、前記外接矩形選別手段は、前記外接矩形の幅が第1
    の所定の値より大きい、あるいは高さが第2の所定の値
    より大きいと判定された外接矩形について、該外接矩形
    の幅と高さの小さい方の値から、幅と高さの大きい方の
    値で割った値が第3の所定の値より小さく、幅と高さの
    大きい方の値が第4の所定の値より大きいと判定されず
    、また該外接矩形の幅と高さの積が第5の所定の値より
    大きいと判定されなかった外接矩形を、前記文字部の外
    接矩形と判定して抽出する構成にした行方向判定装置【
    請求項3】  請求項1記載の行方向判定装置において
    、前記特徴点検出手段は、前記文字部の外接矩形の中心
    点、左上点、右下点、左下点及び右上点のいずれかに基
    づいて前記特徴点を検出する構成にした行方向判定装置
    。 【請求項4】  請求項1記載の行方向判定装置におい
    て、前記行方向判定手段は、前記水平方向のヒストグラ
    ムから検出された値の方が、前記垂直方向のヒストグラ
    ムから検出された値より大きければ前記文字行の行方向
    を水平方向と、そうでなければ前記文字行の行方向を垂
    直方向と判定する構成にした行方向判定装置。
JP3076369A 1991-04-09 1991-04-09 行方向判定装置 Expired - Fee Related JP2957729B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3076369A JP2957729B2 (ja) 1991-04-09 1991-04-09 行方向判定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3076369A JP2957729B2 (ja) 1991-04-09 1991-04-09 行方向判定装置

Publications (2)

Publication Number Publication Date
JPH04311283A true JPH04311283A (ja) 1992-11-04
JP2957729B2 JP2957729B2 (ja) 1999-10-06

Family

ID=13603433

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3076369A Expired - Fee Related JP2957729B2 (ja) 1991-04-09 1991-04-09 行方向判定装置

Country Status (1)

Country Link
JP (1) JP2957729B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8457404B2 (en) 2010-08-24 2013-06-04 Fuji Xerox Co., Ltd. Image processing apparatus, computer readable medium for image processing and computer data signal for image processing
US8787676B2 (en) 2010-08-03 2014-07-22 Fuji Xerox, Co., Ltd. Image processing apparatus, computer readable medium storing program, and image processing method
US9280725B2 (en) 2013-02-14 2016-03-08 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8787676B2 (en) 2010-08-03 2014-07-22 Fuji Xerox, Co., Ltd. Image processing apparatus, computer readable medium storing program, and image processing method
US8457404B2 (en) 2010-08-24 2013-06-04 Fuji Xerox Co., Ltd. Image processing apparatus, computer readable medium for image processing and computer data signal for image processing
US9280725B2 (en) 2013-02-14 2016-03-08 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium

Also Published As

Publication number Publication date
JP2957729B2 (ja) 1999-10-06

Similar Documents

Publication Publication Date Title
CA1160347A (en) Method for recognizing a machine encoded character
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JP2957729B2 (ja) 行方向判定装置
JP2957774B2 (ja) 行方向判定装置
JP2957739B2 (ja) 行方向判定装置
JP2963532B2 (ja) 行方向判定装置
JP2957707B2 (ja) 行方向判定装置
JP2957740B2 (ja) 行方向判定装置
JP2788506B2 (ja) 文字認識装置
JPH0373916B2 (ja)
JP3052438B2 (ja) 表認識装置
JP3162414B2 (ja) 罫線認識方法及び表処理方法
JP2888885B2 (ja) 文字切出し装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPH0728934A (ja) 文書画像処理装置
JPH04360294A (ja) 表認識装置および表認識方法
JPH0573718A (ja) 領域属性識別方式
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JP2929919B2 (ja) 光学文字切出し装置
JPH05128305A (ja) 領域分割方法
JPH0573721A (ja) 表認識装置
JPS6327990A (ja) 文字認識方法
JPH10233930A (ja) 画像処理装置
JPH05274472A (ja) 画像認識装置
JPH0721816B2 (ja) 文字イメージ抽出処理装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990706

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080723

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090723

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees