JP3090342B2 - 文字列方向判別装置 - Google Patents

文字列方向判別装置

Info

Publication number
JP3090342B2
JP3090342B2 JP03127131A JP12713191A JP3090342B2 JP 3090342 B2 JP3090342 B2 JP 3090342B2 JP 03127131 A JP03127131 A JP 03127131A JP 12713191 A JP12713191 A JP 12713191A JP 3090342 B2 JP3090342 B2 JP 3090342B2
Authority
JP
Japan
Prior art keywords
character
rectangle
character string
inter
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP03127131A
Other languages
English (en)
Other versions
JPH04352295A (ja
Inventor
康人 石谷
俊二 有吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP03127131A priority Critical patent/JP3090342B2/ja
Publication of JPH04352295A publication Critical patent/JPH04352295A/ja
Application granted granted Critical
Publication of JP3090342B2 publication Critical patent/JP3090342B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
[発明の目的]
【0001】
【産業上の利用分野】本発明は入力文書に記載された文
字列方向を判別する文字列方向判別方式及び文字列方向
を判別する文字列方向判別装置に関する。
【0002】
【従来の技術】縦書き及び横書きの文書を自動的に読み
取る場合には、文字の認識処理に先立って入力文書にお
ける文字列の方向を判別し、正しい読み取り方向を決定
する必要がある。従来の文字列方向判別方式および装置
は、行間より字間が小さいという印刷文書に対する経験
的事実から、入力文書から字間と行間を推定し、これら
を比較することにより実現されている。
【0003】ところで、近年ワードプロセッサやDTP
システムが普及したことで、手軽に印刷文書が作成でき
るようになっている。こうして作成された文書は同じサ
イズの用紙を使っていても、作成者によって字間や行間
の大きさの関係はまちまちであり、必ずしも”字間<行
間”という関係が成り立つとはいえない。このような場
合には単純に「字間は行間よりも小さい」という性質を
前提とした文字列方向判別方式では、判別誤りが生じて
しまうという問題点があった。
【0004】
【発明が解決しようとする課題】従来の文字列方向判別
方式及び装置では、字間よりも行間の方が広いという経
験的事実に基づき文字列方向の判別を行なっていたた
め、わずかでも字間が行間より大きい文書の文字列方向
を判別する場合に正しく判別することができないという
問題点があった。
【0005】本発明は上記の問題点に鑑みなされたもの
で、字間が行間より大きい文書を読み込む場合でも、文
字列の方向を正確に判別できる文字列方向判別方式及び
文字列方向判別装置を提供することを目的とする。 [発明の構成]
【0006】
【課題を解決するための手段】本発明は、入力された画
像データから文字候補矩形を抽出し、水平方向及び垂直
方向に隣接する文字候補矩形間の距離を求めて、文字候
補矩形に占有されないデータ領域の状態を検出する手段
と、前記検出されたデータ領域の状態から文字列方向を
判別する手段とを有することを特徴をする文字列方向判
別方式、およびこのような文字列方向判別方法により文
字列方向判別を行なうことを特徴とする文字列方向判別
装置を提供する。
【0007】
【作用】本発明によれば、水平方向及び垂直方向の文字
並びの度合を抽出し、水平方向及び垂直方向の文字並び
の度合の抽出結果により入力文書の文字列以外の部分、
いわゆる空白行(あるいは空白列)の部分の状態を検出
することにより文字列の方向を判別するため、字間が行
間より大きい文書の場合を含む様々な文書において文字
列方向を正しく判別することができる。
【0008】
【実施例】以下、図面に基づいて本発明の一実施例につ
いて説明する。図1は本発明の文字列方向判別方式を説
明するためのブロック図である。まず本発明の文字列方
向判別方式の手続きを概説する。
【0009】イメージスキャナー等の画像入力装置で入
力された入力画像に対して、「黒連結矩形生成部」1
で、画像情報のうち黒点の連結している部分の外接矩形
を抽出する。抽出された黒連結部分の外接矩形をもとに
「文字の大きさ推定部」2により、出現頻度の大きい黒
連結矩形の矩形サイズ、あるいは平均的な黒連結矩形の
矩形サイズを、その入力文書における文字矩形の大きさ
と推定する。文字矩形の大きさが推定されると、「文字
候補矩形抽出部」3にて、先に求めた黒連結部分の外接
矩形とその推定された文字矩形との矩形サイズを比較
し、その推定された文字矩形の矩形サイズに近い黒連結
矩形が文字候補矩形群として抽出される。
【0010】「文字間スペース推定部」4では、抽出さ
れた文字候補矩形群から垂直方向及び水平方向に隣合っ
た文字候補矩形ペアについて、それぞれ垂直方向及び水
平方向の文字候補矩形間の距離を算出し、この距離に統
計処理を施すことにより例えば最頻値あるいは平均値
を、その入力文書における垂直方向または水平方向の文
字間スペースの大きさとして推定する。この垂直方向の
文字間スペースと水平方向の文字間スペースの大きさと
を比較することにより、文字間スペースの間隔が狭い方
向に連続して文字が並んでいるとして、「第1文字列方
向判別部」5にて文字列方向の判別を行なう。すなわち
第1文字列方向判別部では、垂直方向の文字間スペース
と水平方向の文字間スペースとを比較し、垂直方向の文
字間スペースが水平方向の文字間スペースよりもある設
定値より大きい場合は入力文書の文字列方向が水平方向
であると判別し、水平方向の文字間スペースが垂直方向
の文字間スペースよりもある設定値より大きい場合は入
力文書の文字列方向が垂直方向であると判別し、垂直方
向の文字間スペースと水平方向の文字間スペースとの大
きさの差がある設定値以下である場合には、文字方向の
判別をすることなく次のステップに移る。
【0011】例えば図2にように、文字候補矩形が水平
方向、垂直方向にほぼ同程度の字間で並んでいる場合
は、前述の第1文字列方向判別部では文字列方向が判別
されずに、「文字並びの度合抽出部」6にデータが送ら
れて詳細判別を行なう。ここでは、入力された文書の
「段落の終わり」の後続の空白部分(図の斜線で示した
部分)以外の部分の文字並びの状態を数値化することに
より、その文書の文字列の方向を推定し判別する。隣接
する文字候補矩形の間隔が文字間スペース推定部4で推
定した文字間スペースよりもある程度以上大きくならな
い文字候補矩形ペアの数を数えることにより行なう。
【0012】図3は図2に示した斜線部分を拡大したも
のである。ここで文字候補矩形Aについて注目する。文
字候補矩形Aと水平方向に隣接する文字候補矩形aある
いはcとは、推定される水平方向文字間スペースとほぼ
等しい距離で隣接して並んでいると考えられる。これら
の文字候補矩形ペアは、「水平方向の文字並びの度合」
に計数される。また文字候補矩形Aに対して図面向かっ
て下方向に隣接する文字候補矩形bとの距離も、推定さ
れる垂直方向文字間スペースとほぼ等しいと考えられ
る。この文字候補矩形ペアは、「垂直方向の文字並びの
度合」に計数される。
【0013】これに対し文字候補矩形Aに対して図面向
かって上方向に隣接する文字候補矩形dとは1つの文字
候補矩形の大きさ以上の広い間隔が空いているため、推
定される垂直方向文字間スペースよりもある程度以上大
きい間隔を示す文字候補矩形ペアとして垂直方向の文字
並びの度合には計数されない。この計数作業を全ての文
字候補矩形ペアについて行う。図2で斜線で示した部分
に隣接する文字候補矩形について考えると、互いに垂直
方向に隣接する文字候補矩形同士の距離が一文字候補矩
形以上あるため、これらをそれぞれ垂直方向の文字並び
の度合に計数されない。
【0014】この方法によれば、垂直方向の文字間スペ
ースと水平方向の文字間スペースとの大きさの差により
文字方向を判別することが困難な場合にも、精度の高い
文字方向判別を行なうことが可能となる。以下各構成部
分での動作を詳述する。
【0015】黒連結矩形生成部1では、入力画像の黒地
データに注目して、連続した黒地データの形状に外接す
る矩形を生成し、この矩形の座標をデータとして求める
働きをする。入力画像はイメージスキャナー等の読み取
り装置の走査ピッチに対応して白、黒2値のデータとし
て取り込まれている。例えば、取り込まれた入力画像に
XY座標系を設け、X方向に走査して黒地データを検出
する。そして最初に黒地データが検出されると、このデ
ータと垂直、水平方向に隣接する部分に黒地データが存
在しないかを検出する。隣接する部分に黒地データが存
在する場合には、さらに連続する部分に黒地データが存
在しないかどうか検出を続け、隣接する部分に黒地デー
タが存在しない場合には、そこで黒地データの検出をや
める。そして全ての隣接する部分について連続する黒地
部分が検出されなくなった時点で、この連続する黒地部
分の形状に外接するような矩形を生成する。黒連結矩形
の生成例を図4に示す。そしてこの黒地部分に外接する
黒連結矩形の座標をデータとして求める。こうして入力
画像から得られた全ての画像データに対して、水平方向
及び垂直方向に2次元的に黒地データの検出、走査を行
なう。求められた全ての黒連結矩形の座標データ、矩形
の水平、垂直方向の辺の長さのデータを、幅wおよび高
さhとして取り込み(図5参照)、文字の大きさ推定部
2にデータを渡す。この場合に黒連結矩形の座標データ
は矩形の1角の座標と水平、垂直方向の2辺の長さとす
ることも、矩形の対角に位置する2角の座標とすること
も可能であり、また矩形の4角の座標をデータとしても
よい。
【0016】文字の大きさ推定部2では、黒連結矩形生
成部で得られた黒連結矩形の幅w、高さhから、その入
力文書の本文を構成する文字矩形の大きさを推定する。
これは得られた黒連結矩形の幅w、高さhをデータとし
て用い、それぞれ最も出現頻度の大きい値(あるいは平
均値)を入力文書の本文を構成する文字の外接矩形の幅
Wと高さHの推定値として用いる。この場合に、文字候
補矩形の大きさを推定する際に、文字矩形の幅w、高さ
hはそれぞれ独立に用いることにより推定可能である。
この段階でw、hについてある設定値よりも大きいも
の、あるいは別の設定値よりも小さいものを除去するこ
とも可能である。
【0017】この操作をすることにより入力文書と無関
係の紙面の汚れ、斑点等を排除することができるととも
に、挿入図面、見出し等の文字データよりも比較的大き
な画像データを除くことができる。
【0018】次に、文字候補矩形抽出部3において、文
字の大きさの推定部2で仮定した外接矩形の幅Wと高さ
Hを用いて、データとして取り込んだ黒連結矩形のうち
文字候補矩形として用いるものを選別する。これは、 W×n1 < w < W×n2 (ただし0<n1 <n2 )…式1 と H×n3 < h < H×n4 (ただし0<n3 <n4 )…式2 なる条件式をともに満足するものを選び出すことにより
行なわれる。
【0019】ここでn1 、n2 、n3 、n4 はある定数
を表わす。例えば、n1 =n3 =0.2、n2 =n4 =
4なる値をとるものとする。この作業を行なうことによ
り、文字候補矩形として適当でない「文字の一部分」あ
るいは差入れられている図面等の黒連結矩形を取り除く
ことができる。
【0020】続いて、文字間スペース推定部4におい
て、文字候補矩形抽出部3において選び出された文字候
補矩形から水平方向の文字間スペースと垂直方向の文字
間スペースを推定する。この推定部の動作を説明するた
めに図6を参照する。これは本実施例に説明する文字候
補矩形抽出部3までの手順により抽出された文字候補矩
形のうち、ある文字候補矩形iと、これと水平方向に隣
接する文字候補矩形jを表わしたものである。文字候補
矩形iの左上角の座標を(xi1,yi1)、右下角の
座標を(xi2,yi2)とし、文字候補矩形jの左上
角の座標を(xi1,yi1)、右下角の座標を(xj
2,yj2)とする。このときに水平方向の文字間スペ
ースを推定するために、文字間スペース推定部4では、 min(yi2,yj2)−max(yi1,yj1)>H×α …式3 (ただしmin(a,b)は、a,bのうち値の小さい
方を表わす。)(またmax(a,b)は、a,bのう
ち値の大きい方を表わす。)の条件を満たす文字矩形候
補ペアを検出する。ここでHは文字の大きさ推定部2で
推定された文字の高さであり、αはある定数、例えばα
=1/3とする。
【0021】この条件は水平方向に隣接する文字候補矩
形ペアのうち垂直方向へのずれが小さいもののみを選別
するためのものであり、この条件により隣接する文字候
補矩形ペアのうち垂直方向に大きくずれているものを、
不適当な文字候補矩形ペアとして除去する。そして式3
の条件を満足する文字候補矩形ペアについて、その文字
候補矩形ペアの文字候補矩形間水平距離(xj1−xi
2)を求める。この文字候補矩形間水平距離は入力文書
の文字候補矩形ペアから求められるもので、水平方向の
文字間を推定するためのデータとなる。この作業を抽出
された全ての文字候補矩形に対して行ない、求められた
文字候補矩形間水平距離のうち、出現頻度の最も高い値
(あるいは平均値)を求め、これを水平方向文字間スペ
ースHSと推定する。
【0022】また同様に、この推定部の動作を説明する
ために図7を参照する。これは本実施例に説明する文字
候補矩形抽出部3までの手順により抽出された文字候補
矩形のうち、ある文字候補矩形iと、これと垂直方向に
隣接する文字候補矩形jを表わしたものである。文字候
補矩形iの左上角の座標を(xi1,yi1)、右下角
の座標を(xi2,yi2)とし、文字候補矩形jの左
上角の座標を(xi1,yi1)、右下角の座標を(x
j2,yj2)とする。このときに垂直方向の文字間ス
ペースを推定するために、 min(xi2,xj2)−max(xi1,xj1)>W×α …式4 (ただしmin(a,b)は、a,bのうち値の小さい
方を表わす。)(またmax(a,b)は、a,bのう
ち値の大きい方を表わす。)の条件を満たす文字矩形候
補ペアを検出する。ここでWは文字の大きさ推定部2で
推定された文字の幅であり、αはある定数、例えばα=
1/3とする。この条件は垂直方向に隣接する文字候補
矩形ペアの中で水平方向へのずれが小さいものを選別す
るためのものであり、この条件により隣接する文字候補
矩形ペアのうち水平方向に大きくずれているものを、不
適当な文字候補矩形ペアとして除去する。そして式4の
条件を満足する文字候補矩形ペアについて、その文字候
補矩形ペアの文字候補矩形間垂直距離(yj1−yi
2)を求める。この文字候補矩形間垂直距離は入力文書
の文字候補矩形から求められた垂直方向の文字間を推定
するためのデータとなる。この作業を抽出された全ての
文字候補矩形に対して行ない、求められた文字候補矩形
間垂直距離のうち、出現頻度の最も高い値(あるいは平
均値)を求め、これを垂直方向文字間スペースVSと推
定する。
【0023】ここで文字間スペース推定部4における作
業を効率よく行なうために、以下の動作を加えてもよ
い。文字間スペース推定部において水平方向文字間スペ
ースHSを推定するための作業を開始する前に、文字候
補矩形抽出部3で抽出された文字候補矩形全てについ
て、文字候補矩形の左上角のx座標の値を基準として昇
順のソートを行なう。この結果文字候補矩形はx座標の
小さい順に順序づけられるので、ある文字候補矩形iに
対して水平方向に隣接する隣接文字候補矩形jは必ず文
字候補矩形iより後に出現することになる。したがっ
て、文字候補矩形iに対して水平水平方向に隣接する文
字候補矩形を探索する場合には、文字候補矩形iの後方
に続く文字候補矩形について探索を始めることができる
ので、探索を開始して最初に式3の条件を満足する文字
候補矩形が発見された場合には、これを水平方向の文字
候補矩形間距離(xj1ーxj2)とすることができ
る。
【0024】同様に文字間スペース推定部において垂直
方向文字間スペースVSを推定するための作業を開始す
る前に、文字候補矩形抽出部3で抽出された文字候補矩
形全てについて、文字候補矩形の左上角のy座標の値を
基準として昇順のソートを行なう。この結果文字候補矩
形はy座標の小さい順に順序づけられるので、ある文字
候補矩形iに対して垂直方向に隣接する隣接文字候補矩
形jは必ず文字候補矩形iより後に出現することにな
る。したがって、文字候補矩形iに対して垂直方向に隣
接する文字候補矩形を探索する場合には、文字候補矩形
iの後方に続く文字候補矩形について探索を始めること
ができるので、探索を開始して最初に式4の条件を満足
する文字候補矩形が発見された場合には、これを垂直方
向の文字候補矩形間距離(yj1ーyj2)とすること
ができる。
【0025】第1文字列方向判別部5では、文字間スペ
ース推定部4で抽出された水平方向文字間スペースHS
と垂直方向文字間スペースVSの値の大きさを比較す
る。これは通常の文章では意味のつながりがある方向に
文字の間隔が狭く並んでおり、意味的につながりのない
方向に文字の間隔が広く並んでいるという、経験則に基
づいている。即ち図8に示すように、 VS>HS+th1 …式5 が成り立つ領域(すなわち領域1)では、入力文書にお
ける文字列方向を水平方向即ち横書きであると判断し、 VS<HS+th2 …式6 が成り立つ領域(すなわち領域3)では、入力文書にお
ける文字列方向を垂直方向即ち縦書きであると判断す
る。そして、 th2<(VS−HS)<th1 …式7 が成り立つ領域(すなわち領域2)の場合には判別不能
とする。ここでth1、th2はあるしきい値とし、本
方式ではth1、th2の大きさまで、字間が行間より
大きいことを許す。このようにして入力文書の文字列方
向を判別することにより、入力文書の文字列が水平方向
につながっているか、垂直方向につながっているか、若
しくは判別不能であるかを判別する。ただし VS=HS+th1…式8 の条件を満たす場合を、領域1または領域2のいずれか
に含めるよう予め定めるものとする。また、 VS=HS+th2…式9 の条件を満たす場合を、領域2または領域3のいずれか
に含めるよう予め定めるものとする。
【0026】第1文字列方向判別部5で判別不能と判断
した場合には、文字並びの度合抽出部6で水平方向の文
字並びの度合と、垂直方向の文字並びの度合を抽出す
る。この文字並びの度合はその方向における文字列らし
さを数値化したものである。例えば、図6のように互い
に水平方向に隣接している文字候補矩形について、 min(yi2,yj2)−max(yi1,yj1)>H×β …式8 及び xj1−xi2<HS+th2 …式9 を満たすような文字候補矩形ペアを計数する。この計数
値を水平方向における文字並びの度合HCとする。また
図7のように、互いに垂直方向に隣接している文字候補
矩形が、 min(xi2,xj2)−max(xi1,xj1)>W×β …式10 及び yj1―yi2<VS+th3 …式11 を満たすような文字候補矩形ペアを計数する。この計数
値を垂直方向における文字並びの度合VCとする。ここ
で例えばβ=1/2としてもよい。th2 、th3 はし
きい値である。この値は抽出された文字候補矩形の水平
方向、垂直方向の大きさの分布がある程度の幅をもって
おり、またそのようにして抽出された文字候補矩形の間
隔も一様であるとは限らないことから、その幅に対して
誤った判断を下すことが少なくなるように冗長係数を足
し合わせることとしたものである。これらの判別式の意
味するところは以下の通りである。式10の意味すると
ころは、垂直方向に隣接する文字候補矩形ペアの中で水
平方向へのずれが小さいものを選別するためのものであ
り、垂直方向に隣接する文字候補矩形ペアのうち水平方
向に大きくずれているものを、不適当な文字候補矩形ペ
アとして除去することである。また式11の意味すると
ころは、垂直方向に隣接する文字候補矩形ペアの文字間
距離(yj1−yi2)が、文字間スペース推定部4で
推定した垂直方向文字間スペースVSと比較してある程
度以上大きくない文字候補矩形ペアである関係を有する
ということである。すなわち式10と式11の条件によ
り、垂直方向に隣合った文字候補矩形ペアについて(式
8の条件に対応)、文字候補矩形間の距離が垂直方向文
字間スペースVSよりも大きい関係をもつ文字候補矩形
ペアを垂直方向における文字並びの度合VCに計数しな
いことになる。
【0027】これにより垂直方向に隣接した文字候補矩
形ペアについて、垂直方向に1文字以上間隔が空いてい
る文字候補矩形ペアならば、垂直方向における文字並び
の度合VCに計数されない条件とすることができる。先
の式10と式11の条件によれば、βおよびth3 を適
当に設定することにより、空白行(または空白列)の部
分と文字列が連続して存在する部分とを区別することが
可能となる。図9に文字候補矩形のみを抽出した入力デ
ータの例を示す。垂直方向に隣接する文字候補矩形ペア
のうち、文字候補矩形間距離が文字間スペース推定部4
で推定される行間程度の間隔であるもの(例えば文字候
補矩形a1 と文字候補矩形b1 )をVCに計数すること
とし、文字候補矩形距離が文字間スペース推定部4で推
定される行間よりもかなり大きい間隔であるもの、特に
文字候補矩形一つ分よりも大きな間隔であるもの(例え
ば文字候補矩形a4 と文字候補矩形c4 )をVCに計数
しないこととする。同様の動作を式8と式9の条件につ
いて行ない、水平方向に存在する入力画像の空白部分に
ついて水平方向における文字並びの度合HCを計数す
る。
【0028】この作業を抽出された全ての文字候補矩形
について行ない、入力文書における空白部の状態を計測
する。図9に示したような水平方向に連続する空白部分
が存在する場合は、その空白部分の垂直方向に相隣接す
る文字候補矩形ペア(例えば文字候補矩形a4 とc4 、
あるいはa5 とc5)については、その部分の垂直方向
における文字並びの度合VCが計数されず、同様に垂直
方向に連続する空白部分が存在する場合は、その部分の
水平方向における文字並びの度合HCは計数されない。
これにより例えば入力文書の文字方向が水平方向である
場合に、「段落の終わり」に後続する空白行が存在すれ
ば、この部分ではVCよりもHCの方が多く計数され
る。逆に入力文書の文字方向が垂直方向である場合に、
「段落の終わり」に後続する空白列が存在すれば、その
部分でHCよりもVCの方が多く計数される。したがっ
てHCがVCよりも大きな値であれば入力文書は水平方
向に文字が並んでおり、VCがHCよりも大きな値であ
れば入力文書は垂直方向に文字が並んでいると判断をす
ることが可能となる。
【0029】そして第2文字列方向判別部7において、
文字並びの度合抽出部6で抽出されたHCとVCを比較
して最終的な文字列方向の判別を行う。ここでは、例え
ば、 HC−VC>γ1 …式12 (ただしγ1 は0以上の実数)であるとき、入力文書の
文字列方向を水平方向とし、また VC−HC>γ2 …式13 (ただしγ2 は0以上の実数)であるとき、入力文書の
文字列方向を垂直方向とする。そして式12、式13の
条件により判別することができないときは、最終的に判
別不能であるとする。以上により本発明の文字列方向判
別方式の手続きを終了する。
【0030】図10は本発明を文書読取り装置11に適
用する場合のブロック図である。即ち文書画像入力部8
で入力された文書画像に対して文字列方向判別部9で文
字列方向を判別し、入力文書画像が水平方向に連続する
ものであるか、垂直方向に連続するものであるかを決定
して、その結果を後段の文書読み取り部10に供給す
る。以上の処理の結果、入力文書の文字列方向が判別さ
れ、その情報が文書読取り部10に供給されるが、情報
の内容は、文書読取り部10の制御方式によって異な
る。例えば、文書読取り部10が入力文書の文字列方向
によって読取り方向が異なるような制御方式を採用して
いるならば、文字列方向判別部9は文書読取り部10
に、入力文書画像と一緒に文字列方向の情報を供給す
る。また、文書読取り部10が文書の読取り方向が一定
であるように制御されているならば、読取り方向と文字
列方向が一致するように入力文書画像を変換して文書読
取り部10に供給する。本実施例をまとめると以下のよ
うになる。
【0031】まず、入力文書の画像データから画像デー
タが連結している形状の外接矩形の大きさの分布を求
め、最も出現頻度の高い画像データ連結矩形の大きさを
その文書における文字の大きさと推定する。推定された
文字の大きさとほぼ等しい大きさの画像データ連結矩形
を文字候補矩形として選別し、この文字候補矩形の水平
方向、及び垂直方向の分布から、その文書の水平方向及
び垂直方向の文字間スペースの大きさを決定する。水平
方向の文字間スペースと垂直方向の文字間スペースの大
きさとを比較して、水平方向の文字間スペースが垂直方
向の文字間スペースよりも設定値以上大きい場合には、
入力された文書の文字列は垂直方向に並んでいると判別
する。逆に、垂直方向の文字間スペースが水平方向の文
字間スペースよりも設定値以上大きい場合には、入力さ
れた文書の文字列は水平方向に並んでいると判別する。
【0032】次に、上記の条件で判別することができな
い場合には、その文書についての水平方向、垂直方向に
隣合った文字候補矩形同士の間隔と、先に決定した水平
方向及び垂直方向の文字間スペースとを比較して、これ
らの間隔がほぼ等しい文字候補矩形のペアの数を水平方
向、垂直方向それぞれについてカウントする。この操作
によりカウントされた計数値は、水平方向、垂直方向に
平均的な字間程度の間隔をおいて隣接する文字候補矩形
のペアの数を表わしており、例えば1つの文字候補矩形
の大きさ以上大きい間隔をおいて隣接する文字候補矩形
のペアを含まないものとしている。通常の文章において
は「段落の終わり」で改行されている部分等では空白行
(あるいは空白列)となるため、この部分は平均的な字
間程度の間隔をおいて隣接する文字候補矩形のペアとし
てカウントされない。したがって上記の動作により水平
方向、垂直方向についてカウントされた計数値の大きさ
を比較することにより、水平方向、垂直方向の文字候補
矩形の見かけ上の配置を識別し、入力された文書の文字
列方向の判別を行なう。すなわち水平方向についてカウ
ントされた計数値が、垂直方向についてカウントされた
計数値よりも設定値以上大きい場合には、文字列は水平
方向に並んでいると判別する。また垂直方向についてカ
ウントされた計数値が、水平方向についてカウントされ
た計数値よりも設定値以上大きい場合には、文字列は垂
直方向に並んでいると判別する。以上の動作により文字
列方向を適切に判別することができる。 (実施例2)
【0033】実施例1では、第1文字列方向判別部5に
おいて文字間スペース推定部4で抽出された水平方向文
字間スペースHSと垂直方向文字間スペースVSとの値
の大きさを比較することにより入力文書の文字列方向を
判別することとした。そこで判別に用いた条件式はそれ
ぞれ、 VS>HS+th1 …式5 VS<HS+th2 …式6 th2<(VS−HS)<th1 …式7 VS=HS+th1…式8 VS=HS+th2…式9 であったが、これらの条件式のかわりに以下の条件を用
いることも可能である。 VS>HS …式5−2 及び VS/HS>th1’ …式5−3 が成り立つ領域(以下領域4とする)では、入力文書に
おける文字列方向を水平方向であると判断し、 HS>VS …式6−2 及び HS/VS>th2’ …式6−3 が成り立つ領域(以下領域6とする)では、入力文書に
おける文字列方向を垂直方向であると判断する。そし
て、 1/th2’<(VS/HS)<th1’ …式7−2 (ただしth2’≠0とする)が成り立つ領域(以下領
域5)の場合には判別不能とする。ここでth1’、t
h2’はあるしきい値とする。このようにして入力文書
の文字列方向を判別することにより、入力文書の文字列
方向を水平方向であるか、垂直方向であるか、若しくは
判別不能であるかを判別する。ただし VS/HS=th1’…式8−2 の条件を満たす場合を、領域4または領域5のいずれか
に含めるよう予め定めるものとする。また、 HS/VS=th2’…式9−2 の条件を満たす場合を、領域5または領域6のいずれか
に含めるよう予め定めるものとする。このような判別式
を用いても、上記説明した実施例と同様の効果を得るこ
とができる。同様に先の実施例で説明した第2文字列方
向判別部7で用いた以下の判別式 HC−VC>γ1 …式12 VC−HC>γ2 …式13 についても、以下のように条件を変更することが可能で
ある。 HC>VC …式12−2 及び HC/VC>th1’ …式12−3 が成り立つ領域では、入力文書における文字列方向を水
平方向であると判断し、 VC>HC …式13−2 及び VC/HC>th2’ …式13−3 が成り立つ領域では、入力文書における文字列方向を垂
直方向であると判断する。このような条件式を用いても
上記の実施例と同様の効果を得ることができる。 (実施例3)
【0034】実施例1では第1文字列方向判別部5によ
り判別を行なった後に第2文字列方向判別部7で判別を
行なう方法について説明したが、以下に説明するように
判断条件を変更することにより、判別方法の順序を逆に
することによっても文字列方向判別を行なうことが可能
である。
【0035】これを図11を用いて説明する。入力画像
に対して黒連結連結矩形を生成し、その入力文書におけ
る文字の大きさの推定を行ない、文字候補矩形の抽出を
行ない、水平、垂直方向の文字間スペースを推定すると
ころまでは、上記の実施例と同様であるので説明を省略
する。
【0036】次に、文字並びの度合抽出部6で水平方向
の文字並びの度合と、垂直方向の文字並びの度合を抽出
し、入力画像の水平方向、及び垂直方向に存在するそれ
ぞれの方向の文字間スペースとほぼ等しい文字候補矩形
間距離を有する文字候補矩形ペアの数を計数する。この
計数結果をもとに第2文字列判別部7で「文字列方向の
判別」を行なう。すなわち垂直方向における文字並びの
度合VC、水平方向における文字並びの度合HCを用い
て HC−VC>γ1 …式12 (ただしγ1 は0以上の実数)であるとき、入力文書の
文字列方向を水平方向とし、また VC−HC>γ2 …式13 (ただしγ2 は0以上の実数)であるとき、入力文書の
文字列方向を垂直方向とする。そして式12、式13の
条件により判別することができないときは、判別するこ
となく次のステップに移る。
【0037】そして第2文字列方向判別部で判別しなか
った入力文書につき、第1文字列方向判別部5で文字列
方向の判別を行なう。すなわち文字間スペース推定部4
で抽出された水平方向文字間スペースHSと垂直方向文
字間スペースVSの値の大きさを比較し、 VS>HS+th1 …式5 が成り立つ領域では、入力文書における文字列方向を水
平方向であると判断し、 VS<HS+th2 …式6 が成り立つ領域では、入力文書における文字列方向を垂
直方向であると判断する。そして、 th2<(VS−HS)<th1 …式7 が成り立つ領域の場合には最終的に判別を行なうことな
く文字列方向判別を終了する。このように先の実施例で
説明した第1文字列方向判別部5と第2文字列方向判別
部7を順序を逆にしても、文字列方向判別は可能であ
る。
【0038】この場合にも第1文字列判別部、第2文字
列判別部で判断に用いる条件式を式5−2〜式13−3
のように変更することによっても、文字列方向の判別を
行なうことができ、同様の効果を得ることができる。
【0039】以上全ての実施例では、文字列方向判別手
段として、第1文字列方向判定部と第2文字列方向判定
部を設けたが、入力文書が行間よりも字間の方が小さい
という性質を持った文書に限られるならば第1文字列方
向判定部5の判定結果に基づいて文字列方向を判定する
ようにしても高い精度が得られることはもちろんであ
る。
【0040】また入力文書全体を文字列方向判別部に入
力して文字列方向を判別していたが、例えば部分領域抽
出装置などによって抽出された、入力文書の一部である
文章領域(見出し、本文、図表・写真等の説明文など)
を文字列方向判別部に入力して、各文章領域で文字列方
向を判別するようにしてもよい。このようにすれば、各
文章領域において文字列方向を判別することができ、縦
書きと横書きの文章が混在した文書に対しても正確にそ
の文字列方向を決定することができる。
【0041】さらに、英文文書読み取り装置において、
入力装置の大きさが縦長(あるいは横長)であるため横
長(あるいは縦長)に長い文書を90度回転して入力し
なければならない場合に、入力後の文書画像の文字列方
向を判別して画像をもとに戻す処理を行うことにより、
正しい文字列方向で入力文書を読み取ることができる。
【0042】
【発明の効果】本発明によれば、入力文書の画像データ
から得られる空白行(あるいは空白列)の状態を検出す
ることにより文字列の方向を判別するため、従来のやり
方では正しく判断できなかった字間が行間より大きい文
書の場合を含む様々な文書において、文字列方向を正し
く判別することができる。
【図面の簡単な説明】
【図1】 文字列方向判別方式の構成を示すブロック
図。
【図2】 入力画像から文字候補矩形を生成した例を示
す図。
【図3】 入力画像から文字候補矩形を生成した例を示
す図。
【図4】 黒連結矩形の生成例を示す図。
【図5】 黒連結矩形の座標データ例を示す図。
【図6】 水平方向に隣接する文字候補矩形ペアを示す
図。
【図7】 垂直方向に隣接する文字候補矩形ペアを示す
図。
【図8】 文字列方向判別を行なう判別領域例を示す
図。
【図9】 文字候補矩形のみを抽出した入力データの例
を示す図。
【図10】 本方式を文書読み取り装置に適用した場合
の図。
【図11】 文字列方向判別方式の別の構成を示すブロ
ック図。
【符号の説明】
1 黒連結矩形生成部 2 文字の大きさの推定部 3 文字候補矩形抽出部 4 文字間スペース推定部 5 第1文字列方向判別部 6 文字並びの度合抽出部 7 第2文字列方向判別部 8 文書画像入力部 9 文字列方向判別部 10 文書読取り部 11 文書読取り装置 14 判定部
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/20

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された画像データであって、黒色の画
    像データが連続する領域に外接する矩形を生成する黒連
    結矩形生成手段と、 この黒連結矩形生成手段によって生成された黒連結矩形
    の大きさを求め、複数の黒連結矩形のうち最も出現頻度
    の大きい黒連結矩形の大きさを選択する文字の大きさを
    推定する推定手段と、 この推定手段によって推定された文字の大きさと前記黒
    連結矩形の大きさと比較することにより文字候補矩形を
    抽出する文字候補矩形抽出手段と、 この文字候補矩形抽出手段によって抽出された相隣合っ
    た2つの文字候補矩形間の距離を算出することにより水
    平方向及び垂直方向の文字間スペースを推定する文字間
    スペース推定手段と、 この文字間スペース推定手段によって推定された水平方
    向の文字間スペースと垂直方向の文字間スペースとの大
    きさを比較することにより文字列方向の判別を行う第1
    文字列方向判別手段と、 水平方向に相隣合った2つの文字候補矩形間の距離HL
    と前記水平方向の文字間スペースHCとが、HL<HC
    +th1なる関係を有する文字候補矩形ペアの数を計数
    する第1の計数手段と、 垂直方向に相隣合った2つの文字候補矩形間の距離VL
    と前記垂直方向の文字間スペースVCとが、VL<VC
    +th2なる関係を有する文字候補矩形ペアの数を計数
    する第2の計数手段と、 前記第1の計数部で計数された計数値と前記第2の計数
    部で計数された計数値とを比較することにより文字列方
    向の判別を行う第2文字列方向判別手段と、前記第1文字列方向判別手段によって文字列方向を判別
    できなかった場合、第2文字列方向判定手段の判定結果
    から文字列候補判別結果を出力する判定手段とを備えた
    ことを特徴とする文字列方向判別装置。
  2. 【請求項2】入力された画像データであって、黒色の画
    像データが連続する領域に外接する矩形を生成する黒連
    結矩形生成手段と、 この黒連結矩形生成手段によって生成された黒連結矩形
    の大きさを求め、複数の黒連結矩形のうち最も出現頻度
    の大きい黒連結矩形の大きさを選択する文字の大きさを
    推定する推定手段と、 この推定手段によって推定された文字の大きさと前記黒
    連結矩形の大きさと比較することにより文字候補矩形を
    抽出する文字候補矩形抽出手段と、 この文字候補矩形抽出手段によって抽出された相隣合っ
    た2つの文字候補矩形間の距離を算出することにより水
    平方向及び垂直方向の文字間スペースを推定する文字間
    スペース推定手段と、 この文字間スペース推定手段によって推定された水平方
    向の文字間スペースと垂直方向の文字間スペースとの大
    きさを比較することにより文字列方向の判別を行う第1
    文字列方向判別手段と、 水平方向に相隣合った2つの文字候補矩形間の距離HL
    と前記水平方向の文字間スペースHCとが、HL<HC
    +th1なる関係を有する文字候補矩形ペアの数を計数
    する第1の計数手段と、 垂直方向に相隣合った2つの文字候補矩形間の距離VL
    と前記垂直方向の文字間スペースVCとが、VL<VC
    +th2なる関係を有する文字候補矩形ペアの数を計数
    する第2の計数手段と、 前記第1の計数部で計数された計数値と前記第2の計数
    部で計数された計数値とを比較することにより文字列方
    向の判別を行う第2文字列方向判別手段と、この第2文字列方向判別手段によって文字列方向を判別
    できなかった場合に、前記第1文字列方向判定手段の判
    定結果から 文字列候補判別結果を出力する判定手段とを
    備えたことを特徴とする文字列方向判別装置。
JP03127131A 1991-05-30 1991-05-30 文字列方向判別装置 Expired - Lifetime JP3090342B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03127131A JP3090342B2 (ja) 1991-05-30 1991-05-30 文字列方向判別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03127131A JP3090342B2 (ja) 1991-05-30 1991-05-30 文字列方向判別装置

Publications (2)

Publication Number Publication Date
JPH04352295A JPH04352295A (ja) 1992-12-07
JP3090342B2 true JP3090342B2 (ja) 2000-09-18

Family

ID=14952383

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03127131A Expired - Lifetime JP3090342B2 (ja) 1991-05-30 1991-05-30 文字列方向判別装置

Country Status (1)

Country Link
JP (1) JP3090342B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3095470B2 (ja) * 1991-09-13 2000-10-03 松下電器産業株式会社 文字認識装置
JP3335844B2 (ja) * 1996-08-16 2002-10-21 富士通株式会社 文字列方向推定方法および装置
JP5672828B2 (ja) * 2010-08-03 2015-02-18 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5577948B2 (ja) * 2010-08-24 2014-08-27 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5838887B2 (ja) * 2012-03-29 2016-01-06 大日本印刷株式会社 文書認識装置、文書認識方法、プログラム
JP6863753B2 (ja) * 2017-01-20 2021-04-21 リード テクノロジーズ,インコーポレイティド テキストの回転角を決定する装置、方法及びコンピュータ可読記憶媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0797390B2 (ja) * 1985-08-20 1995-10-18 松下電器産業株式会社 文字認識装置
JPS62197881A (ja) * 1986-02-26 1987-09-01 Hitachi Ltd 文書画像縦書・横書判定方式
JPH04290185A (ja) * 1991-03-19 1992-10-14 Omron Corp 縦書横書判別方法

Also Published As

Publication number Publication date
JPH04352295A (ja) 1992-12-07

Similar Documents

Publication Publication Date Title
US6332046B1 (en) Document image recognition apparatus and computer-readable storage medium storing document image recognition program
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US7440618B2 (en) Apparatus for extracting rules line from multiple-valued image
US5889886A (en) Method and apparatus for detecting running text in an image
US7580571B2 (en) Method and apparatus for detecting an orientation of characters in a document image
US20030063802A1 (en) Image processing method, apparatus and system
US7146047B2 (en) Image processing apparatus and method generating binary image from a multilevel image
JP2008217833A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
US6532303B2 (en) Line direction deciding device, image inclination detecting device and image inclination correcting device
JP3090342B2 (ja) 文字列方向判別装置
JP2002199206A (ja) メッセージ埋込並びに抽出方法、装置および媒体
Kim et al. Word segmentation of printed text lines based on gap clustering and special symbol detection
JP5041775B2 (ja) 文字切出方法及び文字認識装置
JP2000090194A (ja) 画像処理方法および画像処理装置
JPH10162102A (ja) 文字認識装置
JPH0822507A (ja) 文書認識装置
JP3071479B2 (ja) 行間スペース検出方法
JP3190794B2 (ja) 文字切り出し装置
JP2576079B2 (ja) 文字切出し方法
JP3220226B2 (ja) 文字列方向判別方法
JP2982221B2 (ja) 文字読み取り装置
JP2576080B2 (ja) 文字切出し方法
JPH0573718A (ja) 領域属性識別方式
JP3381803B2 (ja) 傾き角検出装置
JPH10214308A (ja) 文字判別方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080721

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090721

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090721

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100721

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100721

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110721

Year of fee payment: 11

EXPY Cancellation because of completion of term