JP3471578B2 - 行方向判定装置、画像傾き検出装置及び画像傾き補正装置 - Google Patents

行方向判定装置、画像傾き検出装置及び画像傾き補正装置

Info

Publication number
JP3471578B2
JP3471578B2 JP23362697A JP23362697A JP3471578B2 JP 3471578 B2 JP3471578 B2 JP 3471578B2 JP 23362697 A JP23362697 A JP 23362697A JP 23362697 A JP23362697 A JP 23362697A JP 3471578 B2 JP3471578 B2 JP 3471578B2
Authority
JP
Japan
Prior art keywords
character
character element
distance
elements
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23362697A
Other languages
English (en)
Other versions
JPH1173475A (ja
Inventor
尚史 斎鹿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP23362697A priority Critical patent/JP3471578B2/ja
Priority to US09/124,087 priority patent/US6532303B2/en
Priority to DE69813416T priority patent/DE69813416T2/de
Priority to EP98114831A priority patent/EP0899679B1/en
Publication of JPH1173475A publication Critical patent/JPH1173475A/ja
Application granted granted Critical
Publication of JP3471578B2 publication Critical patent/JP3471578B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、紙面画像を処理す
る画像処理装置、文字認識装置等に適用可能な、行方向
判定装置、画像傾き検出装置及び画像傾き補正装置に関
する。
【0002】
【従来の技術】紙面画像の処理、特に文字認識処理を行
うにあたっては、文章の行方向の判定、つまり文書が縦
書きであるか横書きであるかの判定は重要である。その
理由として、文字切出し処理が多くの場合、行方向に依
存することが挙げられる。
【0003】従来、行方向判定の方法として、入力画像
の縦方向、横方向の周辺分布を用いる方法が主流であっ
た(例えば、電子情報通信学会、信学技報PRL80−
70)。これは周辺分布によって取り出される、文書が
縦書きと横書きとの違いによって生じる空白行に着目し
たものである。
【0004】これに対して、周辺分布を用いない方法も
提案されている。例えば、特開平4−90082号公報
に記載のものが挙げられ、これは、縦方向、横方向の白
画素(空白部分)ランレングスの長さの頻度分布を作成
し、その頻度のピーク値を、縦方向、横方向で比較する
ことで、行方向を判定するものであり、例えば横書きで
あれば、文字の間隔は横方向の方が縦方向より小さく、
縦書きであれば、文字の間隔は縦方向の方が小さいこと
を利用している。
【0005】
【発明が解決しようとする課題】上に述べたような、従
来の行方向判定装置や手法に関しては、以下の問題があ
る。
【0006】第1に周辺分布を利用した手法では、複雑
なレイアウトを持った紙面については正しい結果が得ら
れないことがある。これは、複雑なレイアウトを持った
紙面においては、領域全体の周辺分布では、必ずしも各
文字列の周囲の空白が検出できないことに起因してい
る。
【0007】第2に空白部分のランレングスを利用した
手法では、画像中の空白部分のランの情報を画像の広い
範囲から取り出すことになるが、この情報は文字認識な
どの処理では多くの場合有用ではないので、行方向抽出
以外で利用できない情報を得るために、多くの演算時間
および計算資源を費やすことになり、効率が低下する。
【0008】第3に空白部分のランレングスを利用した
手法では、判定が可能な方向が限定される。判定可能な
方向を図1に示す。ランレングスが自然に定義できる縦
方向20、横方向21、あるいは45度の倍数の角度を
もった方向22、23以外には判定できない。このこと
は、大きな傾きを持った紙面が入力された場合は、まず
画像の傾き補正を行わなければ、正しい処理を行えない
ことを意味しており、画像が傾きやすい、手持ち型スキ
ャナや、カメラからの入力にあたっては問題となる。ま
た、45度の倍数の角度についても判定対象に加えるた
めには、新たにこの方向のランレングスを抽出すること
になり、画像記憶手段(画像メモリ)へのアクセスが増
大する。画像メモリを斜め方向にスキャンすることは、
連続しないアドレスをアクセスすること、アドレス計算
が必要なことから、処理時間の増大につながりやすい。
また、縦、横の周辺分布を利用した手法では、縦横以外
の方向の判定が不可能なことはいうまでもない。
【0009】第4に周辺分布を利用した手法、空白部分
のランレングスを利用したいずれにおいても、上で述べ
たように処理可能な方向は限られているので、処理結果
を画像の傾き検出、あるいは画像の傾き補正に用いるこ
とは不可能である。したがって、行方向検出装置とは全
く別途に画像傾き検出処理および画像傾き補正装置が必
要となり、装置の大型化、高価格化につながる。
【0010】本発明の目的は、複雑なレイアウトを処理
可能で、しかも途中処理結果の大半が文字認識などの処
理に利用可能であり、縦横以外の方向の判定にも容易に
拡張可能な、行方向判定装置を提供し、あわせてそれを
利用した画像傾き検出装置及び画像傾き補正装置を提供
することである。
【0011】
【課題を解決するための手段】本発明の行方向判定装置
は、入力された画像を記憶する画像記憶手段と、前記画
像記憶手段に記憶された画像から、文字等の構成要素と
なる文字要素を抽出する文字要素抽出手段と、少なくと
も縦、横以外の方向を含む、360度を複数の角度に分
割した複数の方向それぞれについて前記文字要素の密度
を算出する文字要素密度算出手段と、前記文字要素の密
度から前記複数の方向に対して前記文字要素が密に分布
している方向を検出し、前記文字要素が密に分布してい
る方向を文字の行方向とする行方向判定手段と、を備え
たことを特徴とする。
【0012】また、前記複数の方向は、前記文字要素
表点を中心とした円を分割して形成される方向である
ことを特徴とする。
【0013】また、前記文字要素密度算出手段は、複
の方向ごとに前記文字要素と近接する各文字要素との最
も近い距離を算出する文字要素距離算出手段からなり、
前記行方向判定手段は、前記文字要素距離算出手段から
得られた文字要素の距離を方向ごとに比較し、多数決原
理に基づいて前記文字要素が密に分布している方向を決
めることを特徴とする。
【0014】さらに、前記行方向判定手段は、前記各文
字要素ごとに、前記文字要素距離算出手段から得られた
文字要素の距離を複数の方向について比較し、前記各文
字要素ごとの最小値が分布している頻度に基づいて、前
記文字要素が密に分布している方向を判定することを特
徴とする。
【0015】また、前記文字要素密度算出手段は、前記
複数の方向について前記文字要素と近接する各文字要素
との最も近い距離を方向の向きごとに算出し、前記向き
ごとに算出された文字要素の距離のうち距離の大きい方
をその方向の文字要素の距離とする文字要素距離算出手
段からなり、前記行方向判定手段は、前記文字要素距離
算出手段から得られた文字要素の距離を前記複数の方向
ごとに比較し、多数決原理に基づいて前記文字要素が密
に分布している方向を決めることを特徴とする。
【0016】さらに、前記行方向判定手段は、前記各文
字要素ごとに、前記文字要素距離算出手段から得られた
複数の方向それぞれについての前記その方向の文字要素
の距離を比較して、その各文字要素ごとの最小値が前記
複数の方向それぞれに分布している頻度に基づいて、前
記文字要素が密に分布している方向を判定することを特
徴とする。
【0017】また、前記文字要素密度は、前記文字要素
の代表点が前記円を分割した領域に含まれる数で決めら
れることを特徴とする。
【0018】さらに、本発明の画像傾き検出装置は、上
述のいずれかに記載の行方向判定装置と、その処理結果
である行の方向と基準行方向とから、入力画像の傾きを
検出する画像傾き検出手段を備えることを特徴とする。
【0019】また、さらに画像傾き補正装置は、前記画
像傾き検出装置と、前記画像傾き検出手段から得られる
処理結果から画像の補正を行う画像傾き補正手段を備え
ることを特徴とする。
【0020】
【発明の実施の形態】第1の実施の形態 図2は、本発明の第1の実施の形態である行方向判定装
置のブロック図である。図3は、本発明の第1の実施の
形態の処理フローチャートである。以下、これらを用い
て説明する。
【0021】画像情報が記載された紙面はスキャナない
しカメラで構成される画像入力部1から入力され、得ら
れた画像データは画像メモリ2に格納される(ステップ
301)。画像メモリ2の内容は表示装置4に転送され
る(ステップ302)。表示装置4はディスプレイ5
に、転送された画像データを表示する(ステップ30
3)。
【0022】以下、必要に応じて画像上の任意の点を、
例えば左上の点を原点(0,0)として、そこから横方
向をx方向、縦方向をy方向とした、ピクセル単位の座
標系の点として表わす。また、縦書きとは、画像で縦方
向に行が走っている場合を指し、横書きとは、画像で横
方向に行が走っている場合とする。
【0023】ここで、ユーザは、キーボード6またはマ
ウス7を用いて処理領域を指定し、その処理領域データ
がCPU3に貯えられる(ステップ304)。ここで、
単一の処理領域の中では、異なった方向を持つ行は混在
しないことが前提となっており、また、文字以外の領
域、つまり写真や線画などは含まれていないことが望ま
しい。処理領域の指定方法としては、処理領域を紙面上
の長方形として、その左上の座標(X0,Y0)と、右
下の座標(X1,Y1)の組で指定することが考えられ
るが、さらに複雑な指定法をとることももちろん可能で
ある。また、ここでユーザが手動で処理領域を指定して
いるが、領域分割を自動的に行う技術も特開平5−22
5378号公報に記載のものなど、従来数多く提案され
ており、これを利用しても差し支えない。
【0024】指定された処理領域の位置データはCPU
3から文字要素抽出部8に転送され、文字要素抽出部8
は位置データと、画像メモリ2の内容を参照して、文字
要素を抽出し、文字要素バッファ9に格納する(ステッ
プ305)。本明細書では、文字要素の抽出は通常黒画
素と呼ばれる画素に着目して行うものとするが、具体的
なピクセルの値は、システムによって定まっているもの
とする。
【0025】ここで、文字要素について説明する。文字
要素を抽出するのは、簡単にいえば文字がどの方向に密
に分布しているかを調べるためである。したがって、文
字要素として文字自体をとることができれば理想的であ
るが、画像内で、どの部分が1つの文字をなしているか
は文字認識処理が終了していない限り分かっていないの
が普通である。そのため、文字を構成する部品と考えら
れる画像の要素でこれを代用する。その代表的な例とし
ては、画像の連結領域があげられる。これを画像から抽
出する方法としては、長尾、「画像認識論」、コロナ
社、1983年、85ページなど、公知のどのような技
術を用いてもよい。なお、本発明では、文字は言うまで
もなく、英数字や記号等を用いた場合でも文字認識処理
を必要としないので行方向判定を行うことができる。
【0026】連結領域の外接矩形が分かれば充分な場合
は、同一出願人による特開平5−81474号公報に記
載の連結成分の外接矩形を取得する手法を利用すれば高
速に処理を行うことができる。以下、文字要素抽出部8
は画像の連結領域の外接矩形を左上の座標(sx,s
y)および右下の座標(ex,ey)の組として取り出
して、文字要素バッファ9に格納するとして説明する
が、外接矩形の表し方はこれに限るものではない。図4
は文字要素バッファ9の構造の例である。2次元的な構
成となっており、縦方向の並びは各文字要素に対応して
おり、横方向の並びは文字要素の外接矩形の左上の座標
のx座標、y座標、右下のx座標、y座標に対応してい
る。図4では、i番めの文字要素(i=0,1,…,N
−1;ただしNは文字要素の数)の外接矩形の左上のx
座標、y座標をそれぞれsx[i],sy[i],右下
のx座標、y座標をそれぞれex[i],ey[i]と
している。もちろん、文字要素およびその表わし方は連
結矩形の外接矩形に限るものではなく、たとえば、外接
矩形の座標の代わりに各文字要素の中心点や重心の座標
を保持することも考えられるし、同一出願人による特開
平02−277185号公報に記載されているような、
連結成分に基づかない文字要素またはその外接矩形を用
いることもできる。また、別の装置によって、文字がす
でに切出されている場合は、文字自体を文字要素とでき
るのは無論のことであり、この場合は図2のブロック図
からは文字要素抽出部9は不要になる。
【0027】文字要素距離算出部10は、文字要素バッ
ファ9の内容を参照して、各文字要素に対して、各方向
ごとに近傍にある各文字要素への距離を算出して、その
最も小さな距離を文字要素距離バッファ11に格納する
(ステップ306)。
【0028】文字要素間の距離を算出するのは、文字要
素間の距離が小さいほど、文字要素が密に分布している
と考えられるためであり、文字要素の密度を測定した場
合と、大小関係は逆になるが、本質的には同じである。
文字要素間の距離についてもいろいろな定義の仕方があ
り、一般の距離と異なり、任意の2つの文字要素の間で
距離が定義されている必要は必ずしもない。図5では、
そのような距離の定義の例を「ト」51の文字と「キ」
52の文字を用いて説明するための図である。「ト」5
1の文字要素をsx[0],sy[0],ex[0],
ey[0]とし、「キ」52の文字要素をsx[1],
sy[1],ex[1],ey[1]とする。2つの文
字要素のx座標の範囲が重なっている場合のみ、双方の
外接矩形の横方向の辺で、最も近いy座標を持つ組み合
わせを取り出して、そのy座標の差を縦方向の距離と定
義する。図5(a)はそのような距離が定義される場
合、図5(b)はされない場合を示した図である。2つ
の外接矩形処理された文字要素「ト」51と「キ」52
とのy座標の範囲が重なっている場合(図5(a)の場
合)のみ、横方向への距離を、双方の外接矩形の縦方向
の辺で、最も近いx座標を持つ組み合わせを取り出し
て、そのx座標の差を横方向の距離(sx[1]−ex
[0])と定義する。図5(c)はそのような距離が定
義される場合、図5(d)はされない場合を示した図で
ある。2つの外接矩形処理された文字要素のx座標の範
囲が重なっている場合(図5(c)の場合)のみ、縦方
向への距離を、双方の外接矩形の横方向の辺で、最も近
いy座標を持つ組み合わせを取り出して、そのy座標の
差を縦方向の距離(sy[1]−ey[0])と定義す
る。
【0029】ここであげた例は行方向の判定対象が、横
方向、縦方向の2方向の場合であり、以下これを用いて
説明するが、後述するように、2つの文字要素の間の距
離の定義はこれに限らないし、その定義の仕方によって
は横方向、縦方向以外にも行方向の判定対象を拡張でき
る。
【0030】図5で示した距離に対応した文字要素距離
バッファ11の構成例を図6に示す。図6に示すよう
に、2次元的な構成となっており、縦方向の並びは各文
字要素に対応しており、横方向の並びは各文字要素か
ら、横方向に最も近い距離を持つ文字要素への距離、縦
方向に最も近い距離を持つ文字要素への距離に対応して
いる。以下、文字要素距離バッファ11に格納されてい
る、i番めの文字要素(i=0,1,…N−1;ただし
Nは文字要素の個数)から横方向に最も近い距離を持つ
文字要素への距離をD[i][0],縦方向に最も近い
距離を持つ文字要素への距離をD[i][1]として説
明する。
【0031】文字要素距離算出部10が文字要素バッフ
ァ9の内容を参照して、各文字要素、各方向ごとに、近
傍にある各文字要素への距離を算出して、その最も小さ
な距離を文字要素距離バッファ11に格納する際の手順
の例としては以下のようなものが考えられる。 (1) 各D[i][j](i=0,1,…N−1,j
=0,1)の要素をUDで初期化する。ただし、UD=
max(lx,ly)であり、lx=処理領域の横方向
の幅,ly=処理領域の縦方向への高さである。 (2) i=0(3) j=0(4) k=0(5) i番
めの文字要素とj番めの文字要素との間の距離dを方向
k(k=0;横方向、k=1;縦方向)について算出す
る。 (6) dが定義されているときはD[i][k]=m
in(D[i][k],d)とする。すなわち、現在の
D[i][k]と比較して、dの方が小さいときのみD
[i][k]をdで更新する。dが定義されていないと
きは何もしない。 (7) k=k+1(8) k<2であれば(5)にもど
る。 (9) j=j+1(10) j==iであればj+=1
(11) j<Nであれば(4)に戻る。 (12) i=i+1(13) i<Nであれば(3)に
もどる。
【0032】上記で説明したように、一般の距離と違
い、任意の2つの文字要素の間で距離が定義されるので
はないため、文字要素と、方向によっては、他のどの文
字要素との間にも距離が定義されず、したがって、最も
近い文字要素への距離も定義されないことがある。この
ような場合に対応するD[i][j]の要素としては、
距離が定義されている場合と区別できる値を格納してお
けば良い。本実施例で述べた文字要素距離算出部10の
処理手順では、横方向に距離が定義されていない場合、
縦方向に距離が定義されていない場合とも、UD=ma
x(lx,ly)(ただし、lx=処理領域の横方向の
幅,ly=処理領域の縦方向への高さ)が格納されてい
ることになる。距離が定義されていない場合に、このよ
うな横方向、縦方向共通の、距離としてはありえない大
きな値を用いる利点は、異なる方向への距離の大小比較
の際、距離が定義されていない場合をそれ以外の場合と
区別せずに扱えることである。このような区別をいとわ
なければ、定義されない距離に対応する値は、距離とし
てありえない値でありさえすれば何を用いてもよく、さ
らに直接的に、文字要素バッファ9または文字要素距離
バッファ11と1対1対応する、距離が定義されている
かどうかを示すフラグを持たせるような構成でも良い。
【0033】なお、UDの値は、ここに用いたもの以外
でも、縦方向、横方向に共通の値であり、縦方向、横方
向の文字要素間の距離として可能な値よりも大きければ
効果は同じである。
【0034】あまりに小さな文字要素や、大きな文字要
素は、文字間隔を推定するという目的からは好ましくな
いので、文字要素距離算出部10は、文字要素バッファ
9を参照しながら、そのような文字要素(不適文字要
素)に対応するD[i][0]およびD[i][1]に
は上述のUDを格納しておき、また、不適文字要素以外
の文字要素から最も近い文字要素を探索する際にも、不
適文字要素は無視することとする。
【0035】あるいは、行方向判定で抽出した文字要素
を後段の処理で使わない場合は、文字要素バッファ9か
ら、あらかじめ不適文字要素を除去しておいてもよい。
不適文字要素を識別する基準としては、適切なしきい値
をあらかじめ定めておくことや、平均値からの隔たりを
用いる方法など、種々のものが考えられるし、形状など
大きさ以外の条件を付加することも考えられる。
【0036】行方向判定部12は、文字要素距離バッフ
ァ11の内容を参照しながら、多数決原理を用いて、文
字要素ごとに縦横いずれの方向に距離が小さいものが多
いかを調べる(ステップ307)。
【0037】すなわち、各i(i=0,1,…N−1;
ただしNは文字要素の個数)について、D[i][0]
<D[i][1]となるiの個数M[0],D[i]
[0]>D[i][1]となるiの個数M[1],をそ
れぞれ数えあげる。
【0038】M[0],M[1]の定義については他に
も考えられる。例えば、M[0],M[1]の算出にあ
たり、D[i][0]とD[i][1]の差が一定以上
にならないiは無視するようなことも可能である。
【0039】続いて、行方向判定部12はM[j0]=
max(M[0],M[1])となるj0を求める。こ
れは文字要素の距離が小さくなる頻度が最も高くなるよ
うな方向を求めることに対応する。このようなj0が複
数個ある場合は行方向判定部12は「判定不能」とし
て,j0=可能な方向の数(この場合は2)とする。
【0040】M[]の値と行方向との関係の定め方につ
いては他にも考えられる。例えば、「判定不能」という
場合分けは用いないで、いかなる場合もいずれかの方向
を表わす番号を出力することも考えられるし、最大の頻
度を持つ方向と、その次の頻度を持つ方向の差を「確信
度」として別途出力することもできる。
【0041】最後に、行方向判定部12は、番号方向対
応テーブル13を参照して、最大の頻度を持つ方向また
は「判定不能」などの他の情報を表わすj0の値を行方
向の角度やその他の出力に変換して出力する(ステップ
308)。番号方向対応テーブル14の例を図7に示
す。行方向判定部12の出力は、図2では表示装置4に
送られるようになっているが、本行方向判定装置の出力
を、文字認識装置などの他の装置の入力として用いる場
合は、別の適切な出力インターフェースを使用できるの
は無論のことである。
【0042】<第2の実施の形態> 本発明の第2の実施の形態では、第1の実施の形態で用
いた文字要素の距離の定義を変更して、より高精度な行
方向判定を行う。以下、図2と図3を流用して第1の実
施の形態との相違点を説明する。その他の部分について
は第1の実施の形態と同様である。
【0043】文字要素距離算出部10が文字要素バッフ
ァ9の内容を参照して、各文字要素ごとに、近傍にある
最も近い文字要素への距離を算出して、文字要素距離バ
ッファ11に格納する(ステップ306)際、第1の実
施の形態では、各文字要素(Aとする)から、その文字
要素がAの左、右のいずれに位置するか(横方向の場
合)、上、下のいずれに位置するか(縦方向の場合)を
区別していなかったが、第2の実施の形態では、この方
向に対する向きの区別を行う。つまり、第1の実施の形
態で、各文字要素Aごとに、縦方向、横方向に、最も近
くにある文字要素を取り出して、そのAからの距離を比
較した代わりに、第2の実施の形態では、上方向、下方
向の向きについても最もAから近いものの距離を調べ、
その大きい方の値を第1の実施の形態で用いた縦方向で
Aにもっとも近い文字要素への距離の代わりに用い、左
方向、右方向についても同様に、それぞれについて最も
Aから近いものの距離を調べ、その大きい方の値を横方
向でAにもっとも近い文字要素への距離の代わりに用い
るのである。
【0044】基準となる文字要素(Aとする)から、上
方向、下方向、左方向、右方向への文字要素Bの距離の
定める方法を図8を用いて説明する。
【0045】(1) 文字要素Aと、ある文字要素Bの
x座標の範囲が重なっており、y座標範囲が重なってお
らず、Bに含まれる任意の点のy座標がAに含まれる任
意の点のy座標より小さい(すなわち、BがAの上にあ
る)場合のみ、文字要素AからBの上方向への距離を、
文字要素Aの外接矩形の上側の横方向の辺と文字要素B
の外接矩形の下側の横方向の辺のy座標の差として定義
する(図8(a))。
【0046】(2) 文字要素Aと、ある文字要素Bの
x座標の範囲が重なっており、y座標の範囲が重なって
おらず、Bに含まれる任意の点のy座標がAに含まれる
任意の点のy座標より大きい(すなわち、BがAの下に
ある)場合のみ、文字要素AからBの下方向への距離
を、文字要素Aの外接矩形の下側の横方向の辺と文字要
素Bの外接矩形の上側の横方向の辺のy座標の差として
定義する(図8(b))。
【0047】(3) 文字要素Aと、ある文字要素Bの
y座標の範囲が重なっており、x座標の範囲が重なって
おらず、Bに含まれる任意の点のx座標がAに含まれる
任意の点のx座標より小さい(すなわち、BがAの左に
ある)場合のみ、文字要素AからBの左方向への距離
を、文字要素Aの外接矩形の左側の縦方向の辺と文字要
素Bの外接矩形の右側の縦方向の辺のx座標の差として
定義する(図8(c))。
【0048】(4) 文字要素Aと、ある文字要素Bの
y座標の範囲が重なっており、x座標の範囲が重なって
おらず、Bに含まれる任意の点のx座標がAに含まれる
任意の点のx座標より大きい(すなわち、BがAの右に
ある)場合のみ、文字要素AからBの右方向への距離
を、文字要素Aの外接矩形の右側の縦方向の辺と文字要
素Bの外接矩形の左側の縦方向の辺のx座標の差として
定義する(図8(d))。
【0049】図8で示した距離に対応した文字要素距離
バッファ11の構成例を図9に示す。第1の実施の形態
の項で述べたものと同様に、2次元的な構成となってお
り、縦方向の並びは各文字要素に対応しており、横方向
の並びは各文字要素から、左方向に最も近い距離を持つ
文字要素への距離、右方向に最も近い距離を持つ文字要
素への距離、上方向に最も近い距離を持つ文字要素への
距離、下方向に最も近い距離を持つ文字要素への距離に
対応している。図9では文字要素距離バッファ11に格
納されている、i番めの文字要素(i=0,1,…N−
1;ただしNは文字要素の個数)から左方向に最も近い
距離を持つ文字要素への距離をD[i][0],右方向
に最も近い距離を持つ文字要素への距離をD[i]
[1],上方向に最も近い距離を持つ文字要素への距離
をD[i][2],下方向に最も近い距離を持つ文字要
素への距離をD[i][3]として表わしており、以
下、この記法を用いて説明する。
【0050】文字要素距離算出部10の処理手順の例と
しては、以下のようなものがある。方向の種類が2つか
ら4つに増えている以外は第1の実施の形態で説明した
ものと同様である。 (1) 各D[i][j](i=0,1,…N−1,j
=0,1,2,3)の要素をUDで初期化する。ただ
し、UD=max(lx,ly)であり、lx=処理領
域の横方向の幅,ly=処理領域の縦方向への高さであ
る。 (2) j=0(3) k=0(4) i番めの文字要素
とj番めの文字要素との間の距離dを方向k(k=0:
左方向、k=1:右方向、k=2:上方向、k=3;下
方向)について算出する。 (5) dが定義されているときはD[i][k]=m
in(D[i][k],d)とする。すなわち、現在の
D[i][k]と比較して、dの方が小さいときのみD
[i][k]をdで更新する。dが定義されていないと
きは何もしない。 (6) k=k+1(7) k<4であれば(5)にもど
る。 (8) j=j+1(9) j==iであればj+=1
(10) j<Nであれば(4)に戻る。 (11) i=i+1(12) i<Nであれば(3)に
もどる。
【0051】行方向判定部12は、文字要素距離バッフ
ァ11の内容を参照しながら、文字要素ごとに、縦横い
ずれの方向に、距離が小さいものが多いかを調べる(ス
テップ307)際、以下のように行う。
【0052】行方向判定部12は、各i(i=0,1,
…N−1;ただしNは文字要素の個数)について、ma
x(D[i][0],D[i][1])<max(D
[i][2],D[i][3])となるiの個数M
[0]max(D[i][0],D[i][1])>m
ax(D[i][2],D[i][3])となるiの個
数M[1]をそれぞれ数えあげる。
【0053】本実施例ではD[i][]が定義されない
場合に、D[i][]にUDという値を割り当てている
ことになっているので、D[i][]が定義されていな
い場合の特別扱いが不要になっているが、このことは第
1の実施の形態と同様に、必須でない。また、UDの値
としてはこれに限るものではないのも同様である。
【0054】行方向判定部12はM[0]>=M[1]
であれば、行方向は横方向、M[0]<M[1]であれ
ば、行方向は縦方向と判定する。(ステップ308)。
なお、M[0],M[1]の定義方法や、その値と行方
向との関係については他にも考えられること、「判定不
能」など、行方向以外の出力を定めることができるのは
第1の実施の形態と同様である。
【0055】以上に述べた距離の定義を採用する利点を
説明する図が図10である。図10(a)のような縦書
き文字列からなる領域があった場合、第1の実施の形
態、第2の実施の形態とも連結成分を文字要素としてい
るため、文字要素は共通である。
【0056】図10(b)、図10(c)に示す矢印
が、対応する文字要素距離バッファ11に格納される距
離の対象となる文字要素を表わしており、第1の実施の
形態で用いた文字要素距離の定義を行った場合を図10
(b)に示し、第2の実施の形態で用いた文字要素距離
の定義を行った場合を図10(c)に示す。
【0057】図10(b)に示されるように、第1の実
施の形態で定義した方法では、文字要素102から見て
横方向に最も近い文字要素は文字要素103に、文字要
素103から見て横方向に最も近い文字要素は文字要素
102に、文字要素104から見て横方向に最も近い文
字要素は文字要素103になり、実際の横方向の文字間
隔に比べて過小な値が文字要素距離バッファ11に格納
されることになる。実際にはこのようなことが起こる割
合は、小さすぎる文字要素を判定対象から除いておく限
り、それほど多くなく、領域全体の文字要素から判定を
行う際には問題になることは少ない。
【0058】しかし、このようなことが起こりにくくす
るために、第2の実施の形態では左方向、右方向への最
も近い文字要素を取り出しておき、そのどちらか遠い方
を横方向で最も近い文字要素とし、縦方向についても上
方向、下方向への最も近い文字要素を取り出しておき、
そのどちらか遠い方を最も近い文字要素に用いたのが、
第2の実施の形態である。これによって、図10(c)
に示されるように、文字要素102から見て横方向に最
も近い文字要素は文字要素101に、文字要素104か
ら見て横方向に最も近い文字要素は文字要素105にな
り、問題となるような現象が大幅に減少している。第2
の実施の形態では、上述したことを利用してより高精度
の行判定を行うことを目的としたものである。
【0059】<第3の実施の形態> 本発明の第3の実施の形態では、第1の実施の形態で用
いた文字要素の距離の定義を変更して、縦、横以外の方
向も判定の対象に加える。以下、図2と図3を流用して
第1の実施の形態との相違点を説明する。その他の部分
については、第1の実施の形態と同様である。
【0060】文字要素距離算出部10が文字要素バッフ
ァ9の内容を参照して、各文字要素、各方向ごとに、近
傍にある最も近い文字要素への距離を算出して、文字要
素距離バッファ11に格納する(ステップ306)際に
用いる各方向への距離を、以下のように定める。
【0061】まず、文字要素ごとに、代表点を定める。
文字要素の代表点の例としては、文字要素の重心点や、
文字要素の外接矩形の中心点、すなわち外接矩形の左上
の座標が(sx,sy),右下の座標が(ex,ey)
で与えられているとき、((sx+ex)/2,(sy
+ey)/2)で与えられる点などが考えられるが、こ
れに限るものではない。
【0062】以下、文字要素の外接矩形の中心点を文字
要素の代表点とした例で説明する。各文字要素から、各
方向への他の文字要素への距離を以下のように定義す
る。まず、360度を複数の角度に分割しておく。図1
1(a)は15度から始まり、30度ごとに、12個に
分割した例であり、以下これを用いて説明するが、分割
の数、仕方はこれに限るものではなく、また、かならず
しも等分である必要はない。ただし、分割を円の分割で
表わした場合、分割線は全て、円の中心を通り、円周と
2点で交差するものが望ましい。
【0063】これは、180度異なる角度は同一視する
ためである。各分割の中心となる角度が180度未満の
場合は、これをその分割が表わす方向とし、180度以
上の場合は、そこから180度を引いた角度を各分割が
表わす方向とする。例えば、図8の例では、各分割は、
0度、30度、…、150度、0度、30度、…、15
0度を表わしていることになる。この様子を図11
(b)に示す。
【0064】以下では、横方向を0度、縦方向を90度
とする。着目している文字要素をAとすると、Aの代表
点から、任意の文字要素(Bとする)の代表点への距離
を測定できる。ここでは2点間の距離dは2点をむすぶ
線分の長さとするが、その2乗を取っても論理的には変
わらないし、目的によっては、シティブロック距離(x
座標の差と、y座標の差の和)など、他の距離尺度も可
能である。
【0065】この2点間を結ぶ線分は、線分をAの代表
点を中心とした円の上に配置すると、分割のいずれかに
含まれる。この様子を図11(c)に示す。このとき、
文字要素Aと文字要素Bの間の方向は、線分が含まれる
分割が表わす方向(分割の中心となる角度)であり、距
離はdであるとする。また、このとき、他の方向につい
ては、文字要素Aと文字要素Bの間で距離は定義されな
いとする。
【0066】以下、各分割があらわす角度に図11
(d)で示すような番号を付けて表わす。配列と角度の
対応をつけるときには、この番号を用いるものとする。
なお、分割の方法と同様、この番号付与法は可能なもの
の一例であり、角度と対応さえ取れていれば他のもので
も構わない。以下、i番めの文字要素(i=0,1,…
N−1;ただしNは文字要素の個数)からj番めの方向
(j=0,1,…5)への最も近い距離を持つ文字要素
への距離をD[i][j]で表わす。
【0067】この距離に対応した文字要素距離バッファ
11の構成例を図12に示す。第1の実施の形態の項で
述べたものと同様に、2次元的な構成となっており、縦
方向の並びは各文字要素に対応しており、横方向の並び
は各方向への距離に対応している。ここであげた距離の
例では6通りの方向番号があるので、文字要素距離バッ
ファ11の横方向の並びは6個ある。
【0068】文字要素距離算出部10の処理手順の例と
しては、以下のようなものがあげられる。第1の実施の
形態で述べたものに比べて、方向の種類が増えているこ
と以外に、第3の実施の形態では、任意の2つの文字要
素A、文字要素Bの間で、距離が定義される方向は1つ
だけであり、逆に必ず1つの方向では距離が定義される
ため、少し簡略化されている部分がある。 (1) 各D[i][j](i=0,1,…N−1,j
=0,1,…5)の要素をUDで初期化する。ただし、
UD=max(lx,ly)であり、lx=処理領域の
横方向の幅,ly=処理領域の縦方向への高さである。 (2) i=0(3) j=0(4) i番めの文字要素
とj番めの文字要素との間の距離dおよび方向k(k=
0,1,…11)を算出する。 (5) dが定義されているときはD[i][k]=m
in(D[i][k],d)とする。すなわち、現在の
D[i][k]と比較して、dの方が小さいときのみD
[i][k]をdで更新する。dが定義されていないと
きは何もしない。 (6) j=j+1(7) j==iであればj+=1
(8) j<Nであれば(4)に戻る。 (9) i=i+1(10) i<Nであれば(3)にも
どる。
【0069】ここではD[i][]が定義されない場合
に、D[i][]にUDという値を割り当てていること
になっているので、D[i][]が定義されていない場
合の特別扱いが不要になっているが、第1の実施の形態
と同様に、このことは必須でない。また、UDの値とし
てはこれに限るものではないのも同様である。
【0070】行方向判定部12は、文字要素距離バッフ
ァ11の内容を参照しながら、文字要素ごとに、いずれ
の方向に、距離が小さいものが多いかを調べる(ステッ
プ307)。すなわち、各i(i=0,1,…N−1;
ただしNは文字要素の個数)について、D[i][0]
=min(D[i][0],D[i][1],…,D
[i][5])となるiの個数M[0] D[i][1]=min(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[1] D[i][2]=min(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[2] D[i][3]=min(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[3] D[i][4]=min(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[4] D[i][5]=min(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[5] をそれぞれ数えあげ、M[j0]= max(M
[0],M[1],…,M[5])となるj0を求め
て、j0を行方向の番号とするのである。このようなj
0が複数ある場合は「判定不能」として、j0=可能な
方向の数(この場合は6)とする。
【0071】M[]の定義方法や、その値と行方向との
関係についてはこれが唯一のものではないのは、第1の
実施の形態と同様である。
【0072】以上の方法で、行方向が抽出できるのは、
文書の文字配置は、行方向に密であるという経験的事実
を利用したものである。また、縦方向、横方向以外の方
向の検出は、文書自体に行が斜めに走っている場合だけ
ではなく、ハンディスキャナやカメラなどの入力機器を
用いたために紙面に対して傾きが大きくなった場合に、
行方向を取り出すことにも利用できる。
【0073】最後に、行方向判定部12は、番号方向対
応テーブル13を参照して、最大の頻度を持つ方向また
は「判定不能」であることを表わすjの値を行方向の角
度やその他の出力に変換して出力する(ステップ30
8)。番号方向対応テーブル13の例を図13に示す。
行方向判定部12の出力は、図2では表示装置4に送ら
れるようになっているが、本行方向判定装置の出力を、
文字認識装置などの他の装置の入力として用いる場合
は、別の適切な出力インターフェースを使用できるのは
第1の実施の形態と同様である。
【0074】<第4の実施の形態> 発明の第4の実施の形態は、第3の実施の形態で、各文
字要素の近傍の文字要素への距離を用いた代わりに、各
文字要素の近傍の文字要素密度を算出して、最も密度の
高い方向を文字要素ごとに調べ、最も高い密度を示す頻
度が最も高い方向を、画像の処理領域の行方向とするも
のである。
【0075】図14は、発明の第4の実施の形態のブロ
ック図である。図2の文字要素距離算出部10が文字要
素密度算出部1410に、文字要素距離バッファ11が
文字要素密度バッファ1411になっている以外は図2
と同様である。
【0076】図15は、本発明の第4の実施の形態の処
理フローチャートである。ステップ1506とステップ
1507以外は、図3と同様である。
【0077】以下、第3の実施の形態との相違点につい
て説明する。文字要素密度算出部1410は、各文字要
素、各方向について、その近傍の文字要素の分布の密度
を算出して、文字要素密度バッファ1411に格納する
(ステップ1506)。文字要素およびその代表点の定
義については、第3の実施の形態で用いた例をここでも
用いて説明するが、これに限るものではない。
【0078】ここで、文字要素の近傍の文字要素密度を
定義する。文字要素密度の定義の例としてここでは以下
のものを用いるが、これはあくまでも一例である。図1
6(a)のように、各文字要素の代表点を中心とした半
径Rの円を考え、その円を角度により分割して、各分割
に含まれる、周囲の文字要素の代表点の数を、その分割
に対応する方向への文字要素密度とする。ここでは円の
中心にある「を」の近傍の文字要素の分布が示されてい
る。
【0079】なお、角度の分割については、ここでは図
11(a)で表わされているものを用い、各分割が表わ
している方向は図11(b)で与えられているものとす
る。また、各方向への番号は図11(d)で表わされて
いるものを用いる。他にも考えられるのは、発明の第3
の実施の形態と同様である。
【0080】図16(b)は、図16(a)の文字要素
をその代表点に置き換えた図である。ただし、半径Rの
円に収まっているものだけを図示した。30度の角度に
対応する分割に含まれる文字要素の数(図中「30度」
と書かれた2つの部分の合計)が最も多く、すなわち、
この角度に最も密に文字要素が分布していることがより
明確に示されている。
【0081】ここに述べたステップ1506の処理手順
の例としては、以下のようなものがあげられる。以下方
向に図11(d)で示すような番号を付けて表わし、i
番めの文字要素(i=0,1,…N−1;ただしNは文
字要素の個数)の近傍の、j番めの方向への文字要素の
密度をD[i][j]で表わす。 (1) 各D[i][j](i=0,1,…N−1,j
=0,1,…,5)の要素を0で初期化する。 (2) i=0(3) j=0(4) i番めの文字要素
の近傍の、j番めの方向を表わす角度分割に含まれてい
る代表点を数えて、その数をD[i][j]に格納す
る。 (5) j=j+1(6) j<6であれば(4)にもど
る。 (7) i=i+1(8) i<Nであれば(3)にもど
る。
【0082】行方向判定部1412は、文字要素距離バ
ッファ1411の内容を参照しながら、文字要素ごと
に、いずれの方向に、近傍での文字要素密度が大きいも
のが多いかを調べる(ステップ1507)。
【0083】すなわち、各i(i=0,1,…N−1;
ただしNは文字要素の個数)について、D[i][0]
=max(D[i][0],D[i][1],…,D
[i][5])となるiの個数M[0] D[i][1]=max(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[1] D[i][2]=max(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[2] D[i][3]=max(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[3] D[i][4]=max(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[4] D[i][5]=max(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[5] をそれぞれ数えあげ、M[j0]= max(M
[0],M[1],…,M[5])となるj0を求め
て、j0を行方向の番号とするのである。このようなj
0が複数ある場合は「判定不能」として、j0=可能な
方向の数(この場合は6)とする。
【0084】M[]の定義方法や、その値と行方向との
関係についてはこれが唯一のものではないのは、第3の
実施の形態と同様である。ステップ1508以降は第3
の実施の形態と同様の処理を行えば良い。
【0085】<第5の実施の形態> 第5の実施の形態は、第3の実施の形態で、縦、横以外
の行方向を取り出せることを利用して、あらかじめ正し
い行方向が分かっている場合に、紙面画像から取り出さ
れた行方向と、正しい行方向を比較することによって、
紙面画像の傾きを抽出して、補正する画像傾き補正装置
である。
【0086】図18は、本発明の第5の実施の形態であ
る、画像傾き補正装置のブロック図である。図19は、
本発明の第5の実施の形態の処理フローチャートであ
る。以下これらを用いて説明する。
【0087】第5の実施の形態で行われる処理は、行方
向判定部1813が番号方向対応テーブル1813を参
照して、最大の頻度を持つ方向または「判定不能」であ
ることを表わすj0の値を行方向の角度やその他の出力
に変換して出力する(ステップ1908)までは以下を
除いて全く第3の実施の形態と同様である。
【0088】すなわち、ユーザが、キーボード1807
またはマウス1808を用いて処理領域を指定する際
(ステップ1904)、処理領域中の正しい行方向を入
力し、その入力がCPU1803によって基準行方向メ
モリ1814に格納されるのである。ユーザが基準行方
向を入力する方法としては、種々なものが考えられる。
ここでは、ユーザが角度を数字でキーボード1807か
ら入力するとする。
【0089】また、行方向としては、あらかじめ、縦方
向(90度)か横方向(0度)のいずれかと仮定してお
き、行方向判定部1812の出力角度に近い方を正しい
行方向とすることも、以下の2つの仮定が成り立つ場合
には有効である。この場合は、基準行方向入力メモリ1
814は不要となる。 (1) 行方向は縦方向か横方向のいずれかである。 (2) 紙面の傾きは90度より充分小さい。この場
合、ユーザが角度を指定する操作が不要になるため、さ
らに操作が簡略化される。
【0090】ステップ1908において、画像傾き算出
部1815は行方向判定部1812の出力を受け取り、
それが「判定不能」など、角度を表わす出力ではない場
合を除いて(ステップ1909)、これとステップ19
04で得られた基準行方向メモリ1814の内容とを比
較して、画像の傾きを角度として算出する。例えば、、
行方向判定部1812で行方向が30度である場合に、
基準行方向が30度であれば画像傾きは0度として検出
され、また、行方向判定部1812で行方向が0度であ
る場合には、基準行方向が30度であれば画像傾きは−
30度傾いているとして検出される。このような処理を
行った結果を画像傾き補正部1816に転送する(ステ
ップ1910)。
【0091】画像傾き補正部1816は、画像メモリ1
802に格納されている画像データに、算出された画像
の傾きの逆の角度をもつ回転の補正を加えて、画像の推
定の傾きの影響を打ち消す(ステップ1911)。画像
傾き補正部1816による画像の回転にあたっては、特
開昭63−191192号公報など、適切な公知技術を
用いるものとする。
【0092】
【発明の効果】本発明による行方向判定装置では、文字
を構成する文字要素の局所的な密度に着目しているの
で、レイアウトが複雑な画像データのような大域的な特
徴に影響を受けずに判定が可能である。
【0093】また、本発明による行方向判定装置は、文
字を構成する文字要素に基づいて処理を行っているの
で、他の目的で文字要素の抽出がすでに行われていれば
それをそのまま利用することができ、行方向判定のため
に新たに文字要素抽出を行っても、抽出された文字要素
は文字認識において文字切出し等に利用できるため、極
めて効率が高い。
【0094】さらに、本発明による行方向判定装置は、
縦、横以外でも、一定以上角度に差のある方向は区別で
きるため、傾きが大きくなっても行方向は検出可能であ
り、このことは、手持ちスキャナやカメラなど、幅広い
入力機器に対応可能であることを意味している。また、
斜め方向も判定対象に入れた場合も、文字要素の抽出の
段階には関係しないため、画像メモリへのアクセスが増
大するようなことはない。
【0095】本発明による画像傾き検出装置および画像
傾き補正装置は、本発明による行方向判定装置の上に述
べた特徴を利用して、少量の処理を付加するのみで構成
できる。このため、特に本発明による行方向判定装置と
併用するときわめて効率が高くすることができる。
【図面の簡単な説明】
【図1】ランレングスを自然に定義できるのは限られた
方向のみであることを説明した図である。
【図2】本発明の第1〜3の実施の形態のブロック図で
ある。
【図3】本発明の第1〜3の実施の形態の処理フローチ
ャートである。
【図4】本発明の第1の形態における、文字要素バッフ
ァの構造の例である。
【図5】本発明の第1の形態における、文字要素の間の
距離を説明した図である。
【図6】本発明の第1の形態における文字要素距離バッ
ファの構造例である。
【図7】本発明の第1の形態における番号方向対応テー
ブルの例である。
【図8】本発明の第2の形態における文字要素の間の距
離を説明した図である。
【図9】本発明の第2の形態における文字要素距離バッ
ファの構造例である。
【図10】本発明の第2の形態における文字要素の間の
距離の利点を説明した図である。
【図11】本発明の第3の実施の形態における角度の分
割を示した図である。
【図12】本発明の第3の実施の形態における文字要素
距離バッファの構造例である。
【図13】本発明の第3の実施の形態における番号方向
対応テーブルの例である。
【図14】本発明の第4の実施の形態のブロック図であ
る。
【図15】本発明の第4の実施の形態の処理フローチャ
ートである。
【図16】本発明の第4の実施の形態における、各方向
への文字要素密度の定義の一例を説明した図である。
【図17】本発明の第4の実施の形態における文字要素
密度バッファの構造例である。
【図18】本発明の第5の実施の形態のブロック図であ
る。
【図19】本発明の第5の実施の形態の処理フローチャ
ートである。
【符号の説明】
1、1401、1801 画像入力部 2、1402、1802 画像メモリ 3、1403、1803 CPU 4、1404、1804 表示装置 5、1405、1805 ディスプレイ 6、1406、1806 キーボード 7、1407 1807 マウス 8、1408、1808 文字要素抽出部 9、1409、1809 文字要素バッファ 10 文字要素距離算出部 11 文字要素距離バッファ 12、1412、1812 行方向判定部 13、1413、1813 番号方向対応テーブル 1410、1810 文字要素密度算出部 1411、1811 文字要素密度バッファ 1814 基準行方向メモリ 1815 画像傾き算出部 1816 画像傾き補正部
フロントページの続き (56)参考文献 特開 平3−62284(JP,A) 特開 平6−243286(JP,A) 特開 平2−311975(JP,A) 特開 平3−198177(JP,A) 特開 平5−242298(JP,A) 特開 平5−314309(JP,A) 特開 平8−194773(JP,A) 特開 昭62−197881(JP,A) 特開 昭62−274480(JP,A) PRU93−26 名刺読み取りシステ ム,電子情報通信学会技術研究報告,日 本,1993年 7月 8日,第93巻第133 号,pp.9−16 PRU92−32 文書構造解析のための 前処理,電子情報通信学会技術研究報 告,日本,1992年 9月18日,第92巻第 227号,pp.57−64 (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (9)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された画像を記憶する画像記憶手段
    と、 前記画像記憶手段に記憶された画像から、文字等の構成
    要素となる文字要素を抽出する文字要素抽出手段と、少なくとも縦、横以外の方向を含む、360度を複数の
    角度に分割した複 数の方向それぞれについて前記文字要
    素の密度を算出する文字要素密度算出手段と、 前記文字要素の密度から前記複数の方向に対して前記文
    字要素が密に分布している方向を検出し、前記文字要素
    が密に分布している方向を文字の行方向とする行方向判
    定手段と、を備えたことを特徴とする行方向判定装置。
  2. 【請求項2】前記複数の方向は、前記文字要素の代表点
    を中心とした円を分割して形成される方向であることを
    特徴とする請求項1に記載の行方向判定装置。
  3. 【請求項3】前記文字要素密度算出手段は、複数の方向
    ごとに前記文字要素と近接する各文字要素との最も近い
    距離を算出する文字要素距離算出手段からなり、 前記行方向判定手段は、前記文字要素距離算出手段から
    得られた文字要素の距離を方向ごとに比較し、多数決原
    理に基づいて前記文字要素が密に分布している方向を決
    めることを特徴とする請求項1または請求項2に記載の
    行方向判定装置。
  4. 【請求項4】入力された画像を記憶する画像記憶手段
    と、 前記画像記憶手段に記憶された画像から、文字等の構成
    要素となる文字要素を抽出する文字要素抽出手段と、 複数の方向について前記文字要素の密度を算出する文字
    要素密度算出手段と、 前記文字要素の密度から前記複数の方向に対して前記文
    字要素が密に分布している方向を検出し、前記文字要素
    が密に分布している方向を文字の行方向とする行方向判
    定手段とを備え、 前記文字要素密度算出手段は、前記複数の方向について
    前記文字要素と近接する各文字要素との最も近い距離を
    方向の向きごとに算出し、前記向きごとに算出された文
    字要素の距離のうち距離の大きい方をその方向の文字要
    素の距離とする文字要素距離算出手段からなり、 前記行方向判定手段は、前記文字要素距離算出手段から
    得られた文字要素の距離を前記複数の方向ごとに比較
    し、多数決原理に基づいて前記文字要素が密に分布して
    いる方向を決めることを特徴とする行方向判定装置。
  5. 【請求項5】前記文字要素密度は、前記文字要素の代
    点が前記円を分割した領域に含まれる数で決められるこ
    とを特徴とする請求項2に記載の行方向判定装置。
  6. 【請求項6】請求項1乃至5のいずれかに記載の行方向
    判定装置と、 その処理結果である行の方向と基準行方向とから、入力
    画像の傾きを検出する画像傾き検出手段を備えることを
    特徴とする画像傾き検出装置。
  7. 【請求項7】請求項6に記載の画像傾き検出装置と、 前記画像傾き検出手段から得られる処理結果から画像の
    補正を行う画像傾き補正手段を備えることを特徴とする
    画像傾き補正装置。
  8. 【請求項8】前記行方向判定手段は、前記各文字要素ご
    とに、前記文字要素距離算出手段から得られた文字要素
    の距離を複数の方向について比較し、前記各文字要素ご
    との最小値が分布している頻度に基づいて、前記文字要
    素が密に分布している方向を判定することを特徴とする
    請求項3に記載の行方向判定装置
  9. 【請求項9】前記行方向判定手段は、前記各文字要素ご
    とに、前記文字要素距離算出手段から得られた複数の方
    向それぞれについての前記その方向の文字要素の距離を
    比較して、その各文字要素ごとの最小値が前記複数の方
    向それぞれに分布している頻度に基づいて、前記文字要
    素が密に分布している方向を判定することを特徴とする
    請求項4に記載の行方向判定装置
JP23362697A 1997-08-29 1997-08-29 行方向判定装置、画像傾き検出装置及び画像傾き補正装置 Expired - Fee Related JP3471578B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP23362697A JP3471578B2 (ja) 1997-08-29 1997-08-29 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
US09/124,087 US6532303B2 (en) 1997-08-29 1998-07-29 Line direction deciding device, image inclination detecting device and image inclination correcting device
DE69813416T DE69813416T2 (de) 1997-08-29 1998-08-06 Vorrichtungen zur Linienrichtungsbestimmung, Bildschrägeerfassung und Bildschrägekorrektur.
EP98114831A EP0899679B1 (en) 1997-08-29 1998-08-06 Line direction deciding device, image inclination detecting device and image inclination correction device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23362697A JP3471578B2 (ja) 1997-08-29 1997-08-29 行方向判定装置、画像傾き検出装置及び画像傾き補正装置

Publications (2)

Publication Number Publication Date
JPH1173475A JPH1173475A (ja) 1999-03-16
JP3471578B2 true JP3471578B2 (ja) 2003-12-02

Family

ID=16958002

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23362697A Expired - Fee Related JP3471578B2 (ja) 1997-08-29 1997-08-29 行方向判定装置、画像傾き検出装置及び画像傾き補正装置

Country Status (4)

Country Link
US (1) US6532303B2 (ja)
EP (1) EP0899679B1 (ja)
JP (1) JP3471578B2 (ja)
DE (1) DE69813416T2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002358514A (ja) * 2000-12-14 2002-12-13 Ricoh Co Ltd 画像歪み補正装置、プログラム、記憶媒体、画像歪み補正方法、画像読取装置および画像形成装置
US7411593B2 (en) * 2001-03-28 2008-08-12 International Business Machines Corporation Image rotation with substantially no aliasing error
US6999207B2 (en) * 2001-09-19 2006-02-14 Kabushiki Kaisha Toshiba Image processing apparatus, image forming apparatus, and method of them
US7286718B2 (en) 2004-01-26 2007-10-23 Sri International Method and apparatus for determination of text orientation
KR100774479B1 (ko) * 2004-07-06 2007-11-08 엘지전자 주식회사 휴대단말기의 영상신호 기울기 보정장치 및 방법
JP4553241B2 (ja) * 2004-07-20 2010-09-29 株式会社リコー 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体
JP4605260B2 (ja) * 2008-06-18 2011-01-05 コニカミノルタビジネステクノロジーズ株式会社 ベクタ画像生成方法、画像処理装置、およびコンピュータプログラム
US9734132B1 (en) * 2011-12-20 2017-08-15 Amazon Technologies, Inc. Alignment and reflow of displayed character images
JP6021078B2 (ja) * 2011-12-21 2016-11-02 パナソニックIpマネジメント株式会社 画像処理装置および画像処理方法
JP6105521B2 (ja) * 2014-06-24 2017-03-29 京セラドキュメントソリューションズ株式会社 画像処理装置、プログラム及び画像形成装置
CN106778733A (zh) * 2015-11-25 2017-05-31 中兴通讯股份有限公司 调整图片文字的显示方法及装置
JP7211166B2 (ja) * 2019-03-04 2023-01-24 京セラドキュメントソリューションズ株式会社 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム
CN112241737B (zh) * 2020-11-12 2024-01-26 瞬联软件科技(北京)有限公司 文字图像校正方法和装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2597006B2 (ja) 1989-04-18 1997-04-02 シャープ株式会社 矩形座標抽出方法
US5191438A (en) * 1989-12-12 1993-03-02 Sharp Kabushiki Kaisha Facsimile device with skew correction and text line direction detection
US5245676A (en) 1989-12-21 1993-09-14 Xerox Corporation Determination of image skew angle from data including data in compressed form
JPH0766413B2 (ja) 1990-08-02 1995-07-19 富士ゼロックス株式会社 文書文字方向検出装置
JPH04195485A (ja) * 1990-11-28 1992-07-15 Hitachi Ltd 画像情報入力装置
JPH05225378A (ja) 1991-06-03 1993-09-03 Fujitsu Ltd 文書画像の領域分割システム
US5253307A (en) * 1991-07-30 1993-10-12 Xerox Corporation Image analysis to obtain typeface information
JP3361124B2 (ja) * 1991-07-30 2003-01-07 ゼロックス・コーポレーション テキストを含む2次元画像上での画像処理方法と画像処理装置
JP3058489B2 (ja) 1991-09-20 2000-07-04 シャープ株式会社 文字列抽出方法
JPH0737103A (ja) * 1993-07-23 1995-02-07 Olympus Optical Co Ltd 傾き角度検出装置
JP3050007B2 (ja) * 1993-08-26 2000-06-05 ミノルタ株式会社 画像読取装置およびこれを備えた画像形成装置
JP3108979B2 (ja) * 1994-07-28 2000-11-13 セイコーエプソン株式会社 画像処理方法および画像処理装置
JP3534128B2 (ja) * 1995-01-24 2004-06-07 オムロン株式会社 書類の上下方向検知方法及び装置
US5889884A (en) * 1995-05-23 1999-03-30 Minolta Co., Ltd. Image forming apparatus capable of recognizing top and bottom of document image

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PRU92−32 文書構造解析のための前処理,電子情報通信学会技術研究報告,日本,1992年 9月18日,第92巻第227号,pp.57−64
PRU93−26 名刺読み取りシステム,電子情報通信学会技術研究報告,日本,1993年 7月 8日,第93巻第133号,pp.9−16

Also Published As

Publication number Publication date
DE69813416D1 (de) 2003-05-22
DE69813416T2 (de) 2004-03-25
EP0899679B1 (en) 2003-04-16
JPH1173475A (ja) 1999-03-16
EP0899679A3 (en) 2001-01-24
US20010046322A1 (en) 2001-11-29
US6532303B2 (en) 2003-03-11
EP0899679A2 (en) 1999-03-03

Similar Documents

Publication Publication Date Title
JP3471578B2 (ja) 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
CN109697414B (zh) 一种文本定位方法及装置
EP1091320A2 (en) Processing multiple digital images
US20070041642A1 (en) Post-ocr image segmentation into spatially separated text zones
JPH11219407A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
CN109948521B (zh) 图像纠偏方法和装置、设备及存储介质
CN111428700B (zh) 表格识别方法、装置、电子设备、存储介质
JP2008217833A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
CN112036232A (zh) 一种图像表格结构识别方法、系统、终端以及存储介质
CN100456317C (zh) 行方向判定方法以及装置
US10679049B2 (en) Identifying hand drawn tables
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP6609181B2 (ja) 文字属性推定装置、及び文字属性推定プログラム
JP3095470B2 (ja) 文字認識装置
JP7384470B2 (ja) 図面認識システム及び図面認識方法
JP7396620B2 (ja) 情報処理装置及びプログラム
JPH0830725A (ja) 画像処理装置及び方法
JP2755299B2 (ja) 画像処理方法
JP3100825B2 (ja) 線認識方法
JP2023036478A (ja) 情報処理装置、プログラム、及び情報処理方法
JP2882056B2 (ja) 特定パターンの識別方法
CN115797938A (zh) 文件图片的自动校正方法、电子设备及存储介质
JPH07254065A (ja) 画像検出装置および方法
JP2002109544A (ja) 印影位置決め方法および装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030902

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080912

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080912

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090912

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090912

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100912

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110912

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees