JPH1173475A - 行方向判定装置、画像傾き検出装置及び画像傾き補正装置 - Google Patents

行方向判定装置、画像傾き検出装置及び画像傾き補正装置

Info

Publication number
JPH1173475A
JPH1173475A JP9233626A JP23362697A JPH1173475A JP H1173475 A JPH1173475 A JP H1173475A JP 9233626 A JP9233626 A JP 9233626A JP 23362697 A JP23362697 A JP 23362697A JP H1173475 A JPH1173475 A JP H1173475A
Authority
JP
Japan
Prior art keywords
character
character element
distance
image
elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9233626A
Other languages
English (en)
Other versions
JP3471578B2 (ja
Inventor
Hisafumi Saika
尚史 斎鹿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP23362697A priority Critical patent/JP3471578B2/ja
Priority to US09/124,087 priority patent/US6532303B2/en
Priority to EP98114831A priority patent/EP0899679B1/en
Priority to DE69813416T priority patent/DE69813416T2/de
Publication of JPH1173475A publication Critical patent/JPH1173475A/ja
Application granted granted Critical
Publication of JP3471578B2 publication Critical patent/JP3471578B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 複雑なレイアウトを有するような画像につい
ての行判定や縦横以外の行方向の判定を行うことのでき
る行判定装置が必要とされていた。 【解決手段】 本発明では、画像から文字部分をなす画
像要素(文字要素)を取り出し、各文字要素の近傍で文
字要素がいずれの方向に密に分布しているかを調べ、多
数決原理に基づいて処理領域の文字行の方向を判定する
ことを特徴とする行方向判定装置、および画像傾き検手
段を有する行方向判定装置の処理結果を利用して画像の
傾きを補正することを特徴とする画像傾き補正装置を提
供する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、紙面画像を処理す
る画像処理装置、文字認識装置等に適用可能な、行方向
判定装置、画像傾き検出装置及び画像傾き補正装置に関
する。
【0002】
【従来の技術】紙面画像の処理、特に文字認識処理を行
うにあたっては、文章の行方向の判定、つまり文書が縦
書きであるか横書きであるかの判定は重要である。その
理由として、文字切出し処理が多くの場合、行方向に依
存することが挙げられる。
【0003】従来、行方向判定の方法として、入力画像
の縦方向、横方向の周辺分布を用いる方法が主流であっ
た(例えば、電子情報通信学会、信学技報PRL80−
70)。これは周辺分布によって取り出される、文書が
縦書きと横書きとの違いによって生じる空白行に着目し
たものである。
【0004】これに対して、周辺分布を用いない方法も
提案されている。例えば、特開平4−90082号公報
に記載のものが挙げられ、これは、縦方向、横方向の白
画素(空白部分)ランレングスの長さの頻度分布を作成
し、その頻度のピーク値を、縦方向、横方向で比較する
ことで、行方向を判定するものであり、例えば横書きで
あれば、文字の間隔は横方向の方が縦方向より小さく、
縦書きであれば、文字の間隔は縦方向の方が小さいこと
を利用している。
【0005】
【発明が解決しようとする課題】上に述べたような、従
来の行方向判定装置や手法に関しては、以下の問題があ
る。
【0006】第1に周辺分布を利用した手法では、複雑
なレイアウトを持った紙面については正しい結果が得ら
れないことがある。これは、複雑なレイアウトを持った
紙面においては、領域全体の周辺分布では、必ずしも各
文字列の周囲の空白が検出できないことに起因してい
る。
【0007】第2に空白部分のランレングスを利用した
手法では、画像中の空白部分のランの情報を画像の広い
範囲から取り出すことになるが、この情報は文字認識な
どの処理では多くの場合有用ではないので、行方向抽出
以外で利用できない情報を得るために、多くの演算時間
および計算資源を費やすことになり、効率が低下する。
【0008】第3に空白部分のランレングスを利用した
手法では、判定が可能な方向が限定される。判定可能な
方向を図1に示す。ランレングスが自然に定義できる縦
方向20、横方向21、あるいは45度の倍数の角度を
もった方向22、23以外には判定できない。このこと
は、大きな傾きを持った紙面が入力された場合は、まず
画像の傾き補正を行わなければ、正しい処理を行えない
ことを意味しており、画像が傾きやすい、手持ち型スキ
ャナや、カメラからの入力にあたっては問題となる。ま
た、45度の倍数の角度についても判定対象に加えるた
めには、新たにこの方向のランレングスを抽出すること
になり、画像記憶手段(画像メモリ)へのアクセスが増
大する。画像メモリを斜め方向にスキャンすることは、
連続しないアドレスをアクセスすること、アドレス計算
が必要なことから、処理時間の増大につながりやすい。
また、縦、横の周辺分布を利用した手法では、縦横以外
の方向の判定が不可能なことはいうまでもない。
【0009】第4に周辺分布を利用した手法、空白部分
のランレングスを利用したいずれにおいても、上で述べ
たように処理可能な方向は限られているので、処理結果
を画像の傾き検出、あるいは画像の傾き補正に用いるこ
とは不可能である。したがって、行方向検出装置とは全
く別途に画像傾き検出処理および画像傾き補正装置が必
要となり、装置の大型化、高価格化につながる。
【0010】本発明の目的は、複雑なレイアウトを処理
可能で、しかも途中処理結果の大半が文字認識などの処
理に利用可能であり、縦横以外の方向の判定にも容易に
拡張可能な、行方向判定装置を提供し、あわせてそれを
利用した画像傾き検出装置及び画像傾き補正装置を提供
することである。
【0011】
【課題を解決するための手段】本発明の行方向判定装置
は、入力された画像を記憶する画像記憶手段と、前記画
像記憶手段に記憶された画像から、文字等の構成要素と
なる文字要素を抽出する文字要素抽出手段と、前記文字
要素の密度を予め定められた複数の方向それぞれについ
て文字要素の密度を算出する文字要素密度算出手段と、
前記文字要素の密度から前記予め定められた複数の方向
に対して前記文字要素が密に分布している方向を検出
し、前記文字要素が密に分布している方向を文字の行方
向とする行方向判定手段と、を備えたことを特徴とす
る。
【0012】また、前記予め定められた複数の方向は、
前記文字要素の外接矩形における代表点を中心とした円
を分割して形成される方向であることを特徴とする。
【0013】また、前記文字密度算出手段は、予め定め
られた複数の方向ごとに前記文字要素と近接する各文字
要素との最も近い距離を算出する文字要素距離算出手段
からなり、前記行判定手段は、前記文字要素距離算出手
段から得られた文字要素の距離を予め定められた方向ご
とに比較し、多数決原理に基づいて前記文字要素が密に
分布している方向を決めることを特徴とする。
【0014】また、前記文字密度算出手段は、まず、前
記予め定められた方向について前記文字要素と近接する
各文字要素との最も近い距離を方向の向きごとに算出
し、次に、前記向きごとに算出された文字要素の距離の
うち距離の大きい方をその方向の文字要素の距離とする
文字要素距離算出手段からなり、前記行判定手段は、前
記文字要素距離算出手段から得られた文字要素の距離を
予め定められた方向ごとに比較し、多数決原理に基づい
て前記文字要素が密に分布している方向を決めることを
特徴とする。
【0015】また、別の前記文字要素密度として、前記
文字要素の外接矩形の代表点が前記円を分割した領域に
含まれる数で決められることを特徴とする。
【0016】さらに、本発明の画像傾き検出装置は、上
述のいずれかに記載の行方向判定装置と、その処理結果
である行の方向と予め入力された基準行方向とから、入
力画像の傾きを検出する画像傾き検出手段を備えること
を特徴とする。
【0017】また、さらに画像傾き補正装置は、前記画
像傾き検出装置と、前記画像傾き検出手段から得られる
処理結果から画像の補正を行う画像傾き補正手段を備え
ることを特徴とする。
【0018】
【発明の実施の形態】
(第1の実施の形態)図2は、本発明の第1の実施の形
態である行方向判定装置のブロック図である。図3は、
本発明の第1の実施の形態の処理フローチャートであ
る。以下、これらを用いて説明する。
【0019】画像情報が記載された紙面はスキャナない
しカメラで構成される画像入力部1から入力され、得ら
れた画像データは画像メモリ2に格納される(ステップ
301)。画像メモリ2の内容は表示装置4に転送され
る(ステップ302)。表示装置4はディスプレイ5
に、転送された画像データを表示する(ステップ30
3)。
【0020】以下、必要に応じて画像上の任意の点を、
例えば左上の点を原点(0,0)として、そこから横方
向をx方向、縦方向をy方向とした、ピクセル単位の座
標系の点として表わす。また、縦書きとは、画像で縦方
向に行が走っている場合を指し、横書きとは、画像で横
方向に行が走っている場合とする。
【0021】ここで、ユーザは、キーボード6またはマ
ウス7を用いて処理領域を指定し、その処理領域データ
がCPU3に貯えられる(ステップ304)。ここで、
単一の処理領域の中では、異なった方向を持つ行は混在
しないことが前提となっており、また、文字以外の領
域、つまり写真や線画などは含まれていないことが望ま
しい。処理領域の指定方法としては、処理領域を紙面上
の長方形として、その左上の座標(X0,Y0)と、右
下の座標(X1,Y1)の組で指定することが考えられ
るが、さらに複雑な指定法をとることももちろん可能で
ある。また、ここでユーザが手動で処理領域を指定して
いるが、領域分割を自動的に行う技術も特開平5−22
5378号公報に記載のものなど、従来数多く提案され
ており、これを利用しても差し支えない。
【0022】指定された処理領域の位置データはCPU
3から文字要素抽出部8に転送され、文字要素抽出部8
は位置データと、画像メモリ2の内容を参照して、文字
要素を抽出し、文字要素バッファ9に格納する(ステッ
プ305)。本明細書では、文字要素の抽出は通常黒画
素と呼ばれる画素に着目して行うものとするが、具体的
なピクセルの値は、システムによって定まっているもの
とする。
【0023】ここで、文字要素について説明する。文字
要素を抽出するのは、簡単にいえば文字がどの方向に密
に分布しているかを調べるためである。したがって、文
字要素として文字自体をとることができれば理想的であ
るが、画像内で、どの部分が1つの文字をなしているか
は文字認識処理が終了していない限り分かっていないの
が普通である。そのため、文字を構成する部品と考えら
れる画像の要素でこれを代用する。その代表的な例とし
ては、画像の連結領域があげられる。これを画像から抽
出する方法としては、長尾、「画像認識論」、コロナ
社、1983年、85ページなど、公知のどのような技
術を用いてもよい。なお、本発明では、文字は言うまで
もなく、英数字や記号等を用いた場合でも文字認識処理
を必要としないので行方向判定を行うことができる。
【0024】連結領域の外接矩形が分かれば充分な場合
は、同一出願人による特開平5−81474号公報に記
載の連結成分の外接矩形を取得する手法を利用すれば高
速に処理を行うことができる。以下、文字要素抽出部8
は画像の連結領域の外接矩形を左上の座標(sx,s
y)および右下の座標(ex,ey)の組として取り出
して、文字要素バッファ9に格納するとして説明する
が、外接矩形の表し方はこれに限るものではない。図4
は文字要素バッファ9の構造の例である。2次元的な構
成となっており、縦方向の並びは各文字要素に対応して
おり、横方向の並びは文字要素の外接矩形の左上の座標
のx座標、y座標、右下のx座標、y座標に対応してい
る。図4では、i番めの文字要素(i=0,1,…,N
−1;ただしNは文字要素の数)の外接矩形の左上のx
座標、y座標をそれぞれsx[i],sy[i],右下
のx座標、y座標をそれぞれex[i],ey[i]と
している。もちろん、文字要素およびその表わし方は連
結矩形の外接矩形に限るものではなく、たとえば、外接
矩形の座標の代わりに各文字要素の中心点や重心の座標
を保持することも考えられるし、同一出願人による特開
平02−277185号公報に記載されているような、
連結成分に基づかない文字要素またはその外接矩形を用
いることもできる。また、別の装置によって、文字がす
でに切出されている場合は、文字自体を文字要素とでき
るのは無論のことであり、この場合は図2のブロック図
からは文字要素抽出部9は不要になる。
【0025】文字要素距離算出部10は、文字要素バッ
ファ9の内容を参照して、各文字要素に対して、各方向
ごとに近傍にある各文字要素への距離を算出して、その
最も小さな距離を文字要素距離バッファ11に格納する
(ステップ306)。
【0026】文字要素間の距離を算出するのは、文字要
素間の距離が小さいほど、文字要素が密に分布している
と考えられるためであり、文字要素の密度を測定した場
合と、大小関係は逆になるが、本質的には同じである。
文字要素間の距離についてもいろいろな定義の仕方があ
り、一般の距離と異なり、任意の2つの文字要素の間で
距離が定義されている必要は必ずしもない。図5では、
そのような距離の定義の例を「ト」51の文字と「キ」
52の文字を用いて説明するための図である。「ト」5
1の文字要素をsx[0],sy[0],ex[0],
ey[0]とし、「キ」52の文字要素をsx[1],
sy[1],ex[1],ey[1]とする。2つの文
字要素のx座標の範囲が重なっている場合のみ、双方の
外接矩形の横方向の辺で、最も近いy座標を持つ組み合
わせを取り出して、そのy座標の差を縦方向の距離と定
義する。図5(a)はそのような距離が定義される場
合、図5(b)はされない場合を示した図である。2つ
の外接矩形処理された文字要素「ト」51と「キ」52
とのy座標の範囲が重なっている場合(図5(a)の場
合)のみ、横方向への距離を、双方の外接矩形の縦方向
の辺で、最も近いx座標を持つ組み合わせを取り出し
て、そのx座標の差を横方向の距離(sx[1]−ex
[0])と定義する。図5(c)はそのような距離が定
義される場合、図5(d)はされない場合を示した図で
ある。2つの外接矩形処理された文字要素のx座標の範
囲が重なっている場合(図5(c)の場合)のみ、縦方
向への距離を、双方の外接矩形の横方向の辺で、最も近
いy座標を持つ組み合わせを取り出して、そのy座標の
差を縦方向の距離(sy[1]−ey[0])と定義す
る。
【0027】ここであげた例は行方向の判定対象が、横
方向、縦方向の2方向の場合であり、以下これを用いて
説明するが、後述するように、2つの文字要素の間の距
離の定義はこれに限らないし、その定義の仕方によって
は横方向、縦方向以外にも行方向の判定対象を拡張でき
る。
【0028】図5で示した距離に対応した文字要素距離
バッファ11の構成例を図6に示す。図6に示すよう
に、2次元的な構成となっており、縦方向の並びは各文
字要素に対応しており、横方向の並びは各文字要素か
ら、横方向に最も近い距離を持つ文字要素への距離、縦
方向に最も近い距離を持つ文字要素への距離に対応して
いる。以下、文字要素距離バッファ11に格納されてい
る、i番めの文字要素(i=0,1,…N−1;ただし
Nは文字要素の個数)から横方向に最も近い距離を持つ
文字要素への距離をD[i][0],縦方向に最も近い
距離を持つ文字要素への距離をD[i][1]として説
明する。
【0029】文字要素距離算出部10が文字要素バッフ
ァ9の内容を参照して、各文字要素、各方向ごとに、近
傍にある各文字要素への距離を算出して、その最も小さ
な距離を文字要素距離バッファ11に格納する際の手順
の例としては以下のようなものが考えられる。 (1) 各D[i][j](i=0,1,…N−1,j
=0,1)の要素をUDで初期化する。ただし、UD=
max(lx,ly) であり、lx=処理領域の横方
向の幅,ly=処理領域の縦方向への高さである。 (2) i=0 (3) j=0 (4) k=0 (5) i番めの文字要素とj番めの文字要素との間の
距離dを方向k(k=0;横方向、k=1;縦方向)に
ついて算出する。 (6) dが定義されているときはD[i][k]=m
in(D[i][k],d)とする。すなわち、現在の
D[i][k]と比較して、dの方が小さいときのみD
[i][k]をdで更新する。dが定義されていないと
きは何もしない。 (7) k=k+1 (8) k<2であれば(5)にもどる。 (9) j=j+1 (10) j==iであればj+=1 (11) j<Nであれば(4)に戻る。 (12) i=i+1 (13) i<Nであれば(3)にもどる。
【0030】上記で説明したように、一般の距離と違
い、任意の2つの文字要素の間で距離が定義されるので
はないため、文字要素と、方向によっては、他のどの文
字要素との間にも距離が定義されず、したがって、最も
近い文字要素への距離も定義されないことがある。この
ような場合に対応するD[i][j]の要素としては、
距離が定義されている場合と区別できる値を格納してお
けば良い。本実施例で述べた文字要素距離算出部10の
処理手順では、横方向に距離が定義されていない場合、
縦方向に距離が定義されていない場合とも、UD=ma
x(lx,ly)(ただし、lx=処理領域の横方向の
幅,ly=処理領域の縦方向への高さ)が格納されてい
ることになる。距離が定義されていない場合に、このよ
うな横方向、縦方向共通の、距離としてはありえない大
きな値を用いる利点は、異なる方向への距離の大小比較
の際、距離が定義されていない場合をそれ以外の場合と
区別せずに扱えることである。このような区別をいとわ
なければ、定義されない距離に対応する値は、距離とし
てありえない値でありさえすれば何を用いてもよく、さ
らに直接的に、文字要素バッファ9または文字要素距離
バッファ11と1対1対応する、距離が定義されている
かどうかを示すフラグを持たせるような構成でも良い。
【0031】なお、UDの値は、ここに用いたもの以外
でも、縦方向、横方向に共通の値であり、縦方向、横方
向の文字要素間の距離として可能な値よりも大きければ
効果は同じである。
【0032】あまりに小さな文字要素や、大きな文字要
素は、文字間隔を推定するという目的からは好ましくな
いので、文字要素距離算出部10は、文字要素バッファ
9を参照しながら、そのような文字要素(不適文字要
素)に対応するD[i][0]およびD[i][1]に
は上述のUDを格納しておき、また、不適文字要素以外
の文字要素から最も近い文字要素を探索する際にも、不
適文字要素は無視することとする。
【0033】あるいは、行方向判定で抽出した文字要素
を後段の処理で使わない場合は、文字要素バッファ9か
ら、あらかじめ不適文字要素を除去しておいてもよい。
不適文字要素を識別する基準としては、適切なしきい値
をあらかじめ定めておくことや、平均値からの隔たりを
用いる方法など、種々のものが考えられるし、形状など
大きさ以外の条件を付加することも考えられる。
【0034】行方向判定部12は、文字要素距離バッフ
ァ11の内容を参照しながら、多数決原理を用いて、文
字要素ごとに縦横いずれの方向に距離が小さいものが多
いかを調べる(ステップ307)。
【0035】すなわち、各i(i=0,1,…N−1;
ただしNは文字要素の個数)について、D[i][0]
<D[i][1]となるiの個数M[0],D[i]
[0]>D[i][1]となるiの個数M[1],をそ
れぞれ数えあげる。
【0036】M[0],M[1]の定義については他に
も考えられる。例えば、M[0],M[1]の算出にあ
たり、D[i][0]とD[i][1]の差が一定以上
にならないiは無視するようなことも可能である。
【0037】続いて、行方向判定部12はM[j0]=
max(M[0],M[1])となるj0を求める。こ
れは文字要素の距離が小さくなる頻度が最も高くなるよ
うな方向を求めることに対応する。このようなj0が複
数個ある場合は行方向判定部12は「判定不能」とし
て,j0=可能な方向の数(この場合は2)とする。
【0038】M[]の値と行方向との関係の定め方につ
いては他にも考えられる。例えば、「判定不能」という
場合分けは用いないで、いかなる場合もいずれかの方向
を表わす番号を出力することも考えられるし、最大の頻
度を持つ方向と、その次の頻度を持つ方向の差を「確信
度」として別途出力することもできる。
【0039】最後に、行方向判定部12は、番号方向対
応テーブル13を参照して、最大の頻度を持つ方向また
は「判定不能」などの他の情報を表わすj0の値を行方
向の角度やその他の出力に変換して出力する(ステップ
308)。番号方向対応テーブル14の例を図7に示
す。行方向判定部12の出力は、図2では表示装置4に
送られるようになっているが、本行方向判定装置の出力
を、文字認識装置などの他の装置の入力として用いる場
合は、別の適切な出力インターフェースを使用できるの
は無論のことである。
【0040】<第2の実施の形態>本発明の第2の実施
の形態では、第1の実施の形態で用いた文字要素の距離
の定義を変更して、より高精度な行方向判定を行う。以
下、図2と図3を流用して第1の実施の形態との相違点
を説明する。その他の部分については第1の実施の形態
と同様である。
【0041】文字要素距離算出部10が文字要素バッフ
ァ9の内容を参照して、各文字要素ごとに、近傍にある
最も近い文字要素への距離を算出して、文字要素距離バ
ッファ11に格納する(ステップ306)際、第1の実
施の形態では、各文字要素(Aとする)から、その文字
要素がAの左、右のいずれに位置するか(横方向の場
合)、上、下のいずれに位置するか(縦方向の場合)を
区別していなかったが、第2の実施の形態では、この方
向に対する向きの区別を行う。つまり、第1の実施の形
態で、各文字要素Aごとに、縦方向、横方向に、最も近
くにある文字要素を取り出して、そのAからの距離を比
較した代わりに、第2の実施の形態では、上方向、下方
向の向きについても最もAから近いものの距離を調べ、
その大きい方の値を第1の実施の形態で用いた縦方向で
Aにもっとも近い文字要素への距離の代わりに用い、左
方向、右方向についても同様に、それぞれについて最も
Aから近いものの距離を調べ、その大きい方の値を横方
向でAにもっとも近い文字要素への距離の代わりに用い
るのである。
【0042】基準となる文字要素(Aとする)から、上
方向、下方向、左方向、右方向への文字要素Bの距離の
定める方法を図8を用いて説明する。
【0043】(1) 文字要素Aと、ある文字要素Bの
x座標の範囲が重なっており、y座標範囲が重なってお
らず、Bに含まれる任意の点のy座標がAに含まれる任
意の点のy座標より小さい(すなわち、BがAの上にあ
る)場合のみ、文字要素AからBの上方向への距離を、
文字要素Aの外接矩形の上側の横方向の辺と文字要素B
の外接矩形の下側の横方向の辺のy座標の差として定義
する(図8(a))。
【0044】(2) 文字要素Aと、ある文字要素Bの
x座標の範囲が重なっており、y座標の範囲が重なって
おらず、Bに含まれる任意の点のy座標がAに含まれる
任意の点のy座標より大きい(すなわち、BがAの下に
ある)場合のみ、文字要素AからBの下方向への距離
を、文字要素Aの外接矩形の下側の横方向の辺と文字要
素Bの外接矩形の上側の横方向の辺のy座標の差として
定義する(図8(b))。
【0045】(3) 文字要素Aと、ある文字要素Bの
y座標の範囲が重なっており、x座標の範囲が重なって
おらず、Bに含まれる任意の点のx座標がAに含まれる
任意の点のx座標より小さい(すなわち、BがAの左に
ある)場合のみ、文字要素AからBの左方向への距離
を、文字要素Aの外接矩形の左側の縦方向の辺と文字要
素Bの外接矩形の右側の縦方向の辺のx座標の差として
定義する(図8(c))。
【0046】(4) 文字要素Aと、ある文字要素Bの
y座標の範囲が重なっており、x座標の範囲が重なって
おらず、Bに含まれる任意の点のx座標がAに含まれる
任意の点のx座標より大きい(すなわち、BがAの右に
ある)場合のみ、文字要素AからBの右方向への距離
を、文字要素Aの外接矩形の右側の縦方向の辺と文字要
素Bの外接矩形の左側の縦方向の辺のx座標の差として
定義する(図8(d))。
【0047】図8で示した距離に対応した文字要素距離
バッファ11の構成例を図9に示す。第1の実施の形態
の項で述べたものと同様に、2次元的な構成となってお
り、縦方向の並びは各文字要素に対応しており、横方向
の並びは各文字要素から、左方向に最も近い距離を持つ
文字要素への距離、右方向に最も近い距離を持つ文字要
素への距離、上方向に最も近い距離を持つ文字要素への
距離、下方向に最も近い距離を持つ文字要素への距離に
対応している。図9では文字要素距離バッファ11に格
納されている、i番めの文字要素(i=0,1,…N−
1;ただしNは文字要素の個数)から左方向に最も近い
距離を持つ文字要素への距離をD[i][0],右方向
に最も近い距離を持つ文字要素への距離をD[i]
[1],上方向に最も近い距離を持つ文字要素への距離
をD[i][2],下方向に最も近い距離を持つ文字要
素への距離をD[i][3]として表わしており、以
下、この記法を用いて説明する。
【0048】文字要素距離算出部10の処理手順の例と
しては、以下のようなものがある。方向の種類が2つか
ら4つに増えている以外は第1の実施の形態で説明した
ものと同様である。 (1) 各D[i][j](i=0,1,…N−1,j
=0,1,2,3)の要素をUDで初期化する。ただ
し、UD=max(lx,ly) であり、lx=処理
領域の横方向の幅,ly=処理領域の縦方向への高さで
ある。 (2) j=0 (3) k=0 (4) i番めの文字要素とj番めの文字要素との間の
距離dを方向k(k=0:左方向、k=1:右方向、k
=2:上方向、k=3;下方向)について算出する。 (5) dが定義されているときはD[i][k]=m
in(D[i][k],d)とする。すなわち、現在の
D[i][k]と比較して、dの方が小さいときのみD
[i][k]をdで更新する。dが定義されていないと
きは何もしない。 (6) k=k+1 (7) k<4であれば(5)にもどる。 (8) j=j+1 (9) j==iであればj+=1 (10) j<Nであれば(4)に戻る。 (11) i=i+1 (12) i<Nであれば(3)にもどる。
【0049】行方向判定部12は、文字要素距離バッフ
ァ11の内容を参照しながら、文字要素ごとに、縦横い
ずれの方向に、距離が小さいものが多いかを調べる(ス
テップ307)際、以下のように行う。
【0050】行方向判定部12は、各i(i=0,1,
…N−1;ただしNは文字要素の個数)について、 max(D[i][0],D[i][1])<max
(D[i][2],D[i][3])となるiの個数M
[0] max(D[i][0],D[i][1])>max
(D[i][2],D[i][3])となるiの個数M
[1]をそれぞれ数えあげる。
【0051】本実施例ではD[i][]が定義されない
場合に、D[i][]にUDという値を割り当てている
ことになっているので、D[i][]が定義されていな
い場合の特別扱いが不要になっているが、このことは第
1の実施の形態と同様に、必須でない。また、UDの値
としてはこれに限るものではないのも同様である。
【0052】行方向判定部12はM[0]>=M[1]
であれば、行方向は横方向、M[0]<M[1]であれ
ば、行方向は縦方向と判定する。(ステップ308)。
なお、M[0],M[1]の定義方法や、その値と行方
向との関係については他にも考えられること、「判定不
能」など、行方向以外の出力を定めることができるのは
第1の実施の形態と同様である。
【0053】以上に述べた距離の定義を採用する利点を
説明する図が図10である。図10(a)のような縦書
き文字列からなる領域があった場合、第1の実施の形
態、第2の実施の形態とも連結成分を文字要素としてい
るため、文字要素は共通である。
【0054】図10(b)、図10(c)に示す矢印
が、対応する文字要素距離バッファ11に格納される距
離の対象となる文字要素を表わしており、第1の実施の
形態で用いた文字要素距離の定義を行った場合を図10
(b)に示し、第2の実施の形態で用いた文字要素距離
の定義を行った場合を図10(c)に示す。
【0055】図10(b)に示されるように、第1の実
施の形態で定義した方法では、文字要素102から見て
横方向に最も近い文字要素は文字要素103に、文字要
素103から見て横方向に最も近い文字要素は文字要素
102に、文字要素104から見て横方向に最も近い文
字要素は文字要素103になり、実際の横方向の文字間
隔に比べて過小な値が文字要素距離バッファ11に格納
されることになる。実際にはこのようなことが起こる割
合は、小さすぎる文字要素を判定対象から除いておく限
り、それほど多くなく、領域全体の文字要素から判定を
行う際には問題になることは少ない。
【0056】しかし、このようなことが起こりにくくす
るために、第2の実施の形態では左方向、右方向への最
も近い文字要素を取り出しておき、そのどちらか遠い方
を横方向で最も近い文字要素とし、縦方向についても上
方向、下方向への最も近い文字要素を取り出しておき、
そのどちらか遠い方を最も近い文字要素に用いたのが、
第2の実施の形態である。これによって、図10(c)
に示されるように、文字要素102から見て横方向に最
も近い文字要素は文字要素101に、文字要素104か
ら見て横方向に最も近い文字要素は文字要素105にな
り、問題となるような現象が大幅に減少している。第2
の実施の形態では、上述したことを利用してより高精度
の行判定を行うことを目的としたものである。
【0057】<第3の実施の形態>本発明の第3の実施
の形態では、第1の実施の形態で用いた文字要素の距離
の定義を変更して、縦、横以外の方向も判定の対象に加
える。以下、図2と図3を流用して第1の実施の形態と
の相違点を説明する。その他の部分については、第1の
実施の形態と同様である。
【0058】文字要素距離算出部10が文字要素バッフ
ァ9の内容を参照して、各文字要素、各方向ごとに、近
傍にある最も近い文字要素への距離を算出して、文字要
素距離バッファ11に格納する(ステップ306)際に
用いる各方向への距離を、以下のように定める。
【0059】まず、文字要素ごとに、代表点を定める。
文字要素の代表点の例としては、文字要素の重心点や、
文字要素の外接矩形の中心点、すなわち外接矩形の左上
の座標が(sx,sy),右下の座標が(ex,ey)
で与えられているとき、((sx+ex)/2,(sy
+ey)/2)で与えられる点などが考えられるが、こ
れに限るものではない。
【0060】以下、文字要素の外接矩形の中心点を文字
要素の代表点とした例で説明する。各文字要素から、各
方向への他の文字要素への距離を以下のように定義す
る。まず、360度を複数の角度に分割しておく。図1
1(a)は15度から始まり、30度ごとに、12個に
分割した例であり、以下これを用いて説明するが、分割
の数、仕方はこれに限るものではなく、また、かならず
しも等分である必要はない。ただし、分割を円の分割で
表わした場合、分割線は全て、円の中心を通り、円周と
2点で交差するものが望ましい。
【0061】これは、180度異なる角度は同一視する
ためである。各分割の中心となる角度が180度未満の
場合は、これをその分割が表わす方向とし、180度以
上の場合は、そこから180度を引いた角度を各分割が
表わす方向とする。例えば、図8の例では、各分割は、
0度、30度、…、150度、0度、30度、…、15
0度を表わしていることになる。この様子を図11
(b)に示す。
【0062】以下では、横方向を0度、縦方向を90度
とする。着目している文字要素をAとすると、Aの代表
点から、任意の文字要素(Bとする)の代表点への距離
を測定できる。ここでは2点間の距離dは2点をむすぶ
線分の長さとするが、その2乗を取っても論理的には変
わらないし、目的によっては、シティブロック距離(x
座標の差と、y座標の差の和)など、他の距離尺度も可
能である。
【0063】この2点間を結ぶ線分は、線分をAの代表
点を中心とした円の上に配置すると、分割のいずれかに
含まれる。この様子を図11(c)に示す。このとき、
文字要素Aと文字要素Bの間の方向は、線分が含まれる
分割が表わす方向(分割の中心となる角度)であり、距
離はdであるとする。また、このとき、他の方向につい
ては、文字要素Aと文字要素Bの間で距離は定義されな
いとする。
【0064】以下、各分割があらわす角度に図11
(d)で示すような番号を付けて表わす。配列と角度の
対応をつけるときには、この番号を用いるものとする。
なお、分割の方法と同様、この番号付与法は可能なもの
の一例であり、角度と対応さえ取れていれば他のもので
も構わない。以下、i番めの文字要素(i=0,1,…
N−1;ただしNは文字要素の個数)からj番めの方向
(j=0,1,…5)への最も近い距離を持つ文字要素
への距離をD[i][j]で表わす。
【0065】この距離に対応した文字要素距離バッファ
11の構成例を図12に示す。第1の実施の形態の項で
述べたものと同様に、2次元的な構成となっており、縦
方向の並びは各文字要素に対応しており、横方向の並び
は各方向への距離に対応している。ここであげた距離の
例では6通りの方向番号があるので、文字要素距離バッ
ファ11の横方向の並びは6個ある。
【0066】文字要素距離算出部10の処理手順の例と
しては、以下のようなものがあげられる。第1の実施の
形態で述べたものに比べて、方向の種類が増えているこ
と以外に、第3の実施の形態では、任意の2つの文字要
素A、文字要素Bの間で、距離が定義される方向は1つ
だけであり、逆に必ず1つの方向では距離が定義される
ため、少し簡略化されている部分がある。 (1) 各D[i][j](i=0,1,…N−1,j
=0,1,…5)の要素をUDで初期化する。ただし、
UD=max(lx,ly)であり、lx=処理領域の
横方向の幅,ly=処理領域の縦方向への高さである。 (2) i=0 (3) j=0 (4) i番めの文字要素とj番めの文字要素との間の
距離dおよび方向k(k=0,1,…11)を算出す
る。 (5) dが定義されているときはD[i][k]=m
in(D[i][k],d)とする。すなわち、現在の
D[i][k]と比較して、dの方が小さいときのみD
[i][k]をdで更新する。dが定義されていないと
きは何もしない。 (6) j=j+1 (7) j==iであればj+=1 (8) j<Nであれば(4)に戻る。 (9) i=i+1 (10) i<Nであれば(3)にもどる。
【0067】ここではD[i][]が定義されない場合
に、D[i][]にUDという値を割り当てていること
になっているので、D[i][]が定義されていない場
合の特別扱いが不要になっているが、第1の実施の形態
と同様に、このことは必須でない。また、UDの値とし
てはこれに限るものではないのも同様である。
【0068】行方向判定部12は、文字要素距離バッフ
ァ11の内容を参照しながら、文字要素ごとに、いずれ
の方向に、距離が小さいものが多いかを調べる(ステッ
プ307)。すなわち、各i(i=0,1,…N−1;
ただしNは文字要素の個数)について、 D[i][0]=min(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[0] D[i][1]=min(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[1] D[i][2]=min(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[2] D[i][3]=min(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[3] D[i][4]=min(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[4] D[i][5]=min(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[5] をそれぞれ数えあげ、M[j0]= max(M
[0],M[1],…,M[5])となるj0を求め
て、j0を行方向の番号とするのである。このようなj
0が複数ある場合は「判定不能」として、j0=可能な
方向の数(この場合は6)とする。
【0069】M[]の定義方法や、その値と行方向との
関係についてはこれが唯一のものではないのは、第1の
実施の形態と同様である。
【0070】以上の方法で、行方向が抽出できるのは、
文書の文字配置は、行方向に密であるという経験的事実
を利用したものである。また、縦方向、横方向以外の方
向の検出は、文書自体に行が斜めに走っている場合だけ
ではなく、ハンディスキャナやカメラなどの入力機器を
用いたために紙面に対して傾きが大きくなった場合に、
行方向を取り出すことにも利用できる。
【0071】最後に、行方向判定部12は、番号方向対
応テーブル13を参照して、最大の頻度を持つ方向また
は「判定不能」であることを表わすjの値を行方向の角
度やその他の出力に変換して出力する(ステップ30
8)。番号方向対応テーブル13の例を図13に示す。
行方向判定部12の出力は、図2では表示装置4に送ら
れるようになっているが、本行方向判定装置の出力を、
文字認識装置などの他の装置の入力として用いる場合
は、別の適切な出力インターフェースを使用できるのは
第1の実施の形態と同様である。
【0072】<第4の実施の形態>発明の第4の実施の
形態は、第3の実施の形態で、各文字要素の近傍の文字
要素への距離を用いた代わりに、各文字要素の近傍の文
字要素密度を算出して、最も密度の高い方向を文字要素
ごとに調べ、最も高い密度を示す頻度が最も高い方向
を、画像の処理領域の行方向とするものである。
【0073】図14は、発明の第4の実施の形態のブロ
ック図である。図2の文字要素距離算出部10が文字要
素密度算出部1410に、文字要素距離バッファ11が
文字要素密度バッファ1411になっている以外は図2
と同様である。
【0074】図15は、本発明の第4の実施の形態の処
理フローチャートである。ステップ1506とステップ
1507以外は、図3と同様である。
【0075】以下、第3の実施の形態との相違点につい
て説明する。文字要素密度算出部1410は、各文字要
素、各方向について、その近傍の文字要素の分布の密度
を算出して、文字要素密度バッファ1411に格納する
(ステップ1506)。文字要素およびその代表点の定
義については、第3の実施の形態で用いた例をここでも
用いて説明するが、これに限るものではない。
【0076】ここで、文字要素の近傍の文字要素密度を
定義する。文字要素密度の定義の例としてここでは以下
のものを用いるが、これはあくまでも一例である。図1
6(a)のように、各文字要素の代表点を中心とした半
径Rの円を考え、その円を角度により分割して、各分割
に含まれる、周囲の文字要素の代表点の数を、その分割
に対応する方向への文字要素密度とする。ここでは円の
中心にある「を」の近傍の文字要素の分布が示されてい
る。
【0077】なお、角度の分割については、ここでは図
11(a)で表わされているものを用い、各分割が表わ
している方向は図11(b)で与えられているものとす
る。また、各方向への番号は図11(d)で表わされて
いるものを用いる。他にも考えられるのは、発明の第3
の実施の形態と同様である。
【0078】図16(b)は、図16(a)の文字要素
をその代表点に置き換えた図である。ただし、半径Rの
円に収まっているものだけを図示した。30度の角度に
対応する分割に含まれる文字要素の数(図中「30度」
と書かれた2つの部分の合計)が最も多く、すなわち、
この角度に最も密に文字要素が分布していることがより
明確に示されている。
【0079】ここに述べたステップ1506の処理手順
の例としては、以下のようなものがあげられる。以下方
向に図11(d)で示すような番号を付けて表わし、i
番めの文字要素(i=0,1,…N−1;ただしNは文
字要素の個数)の近傍の、j番めの方向への文字要素の
密度をD[i][j]で表わす。 (1) 各D[i][j](i=0,1,…N−1,j
=0,1,…,5)の要素を0で初期化する。 (2) i=0 (3) j=0 (4) i番めの文字要素の近傍の、j番めの方向を表
わす角度分割に含まれている代表点を数えて、その数を
D[i][j]に格納する。 (5) j=j+1 (6) j<6であれば(4)にもどる。 (7) i=i+1 (8) i<Nであれば(3)にもどる。
【0080】行方向判定部1412は、文字要素距離バ
ッファ1411の内容を参照しながら、文字要素ごと
に、いずれの方向に、近傍での文字要素密度が大きいも
のが多いかを調べる(ステップ1507)。
【0081】すなわち、各i(i=0,1,…N−1;
ただしNは文字要素の個数)について、 D[i][0]=max(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[0] D[i][1]=max(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[1] D[i][2]=max(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[2] D[i][3]=max(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[3] D[i][4]=max(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[4] D[i][5]=max(D[i][0],D[i]
[1],…,D[i][5])となるiの個数M[5] をそれぞれ数えあげ、M[j0]= max(M
[0],M[1],…,M[5])となるj0を求め
て、j0を行方向の番号とするのである。このようなj
0が複数ある場合は「判定不能」として、j0=可能な
方向の数(この場合は6)とする。
【0082】M[]の定義方法や、その値と行方向との
関係についてはこれが唯一のものではないのは、第3の
実施の形態と同様である。ステップ1508以降は第3
の実施の形態と同様の処理を行えば良い。
【0083】<第5の実施の形態>第5の実施の形態
は、第3の実施の形態で、縦、横以外の行方向を取り出
せることを利用して、あらかじめ正しい行方向が分かっ
ている場合に、紙面画像から取り出された行方向と、正
しい行方向を比較することによって、紙面画像の傾きを
抽出して、補正する画像傾き補正装置である。
【0084】図18は、本発明の第5の実施の形態であ
る、画像傾き補正装置のブロック図である。図19は、
本発明の第5の実施の形態の処理フローチャートであ
る。以下これらを用いて説明する。
【0085】第5の実施の形態で行われる処理は、行方
向判定部1813が番号方向対応テーブル1813を参
照して、最大の頻度を持つ方向または「判定不能」であ
ることを表わすj0の値を行方向の角度やその他の出力
に変換して出力する(ステップ1908)までは以下を
除いて全く第3の実施の形態と同様である。
【0086】すなわち、ユーザが、キーボード1807
またはマウス1808を用いて処理領域を指定する際
(ステップ1904)、処理領域中の正しい行方向を入
力し、その入力がCPU1803によって基準行方向メ
モリ1814に格納されるのである。ユーザが基準行方
向を入力する方法としては、種々なものが考えられる。
ここでは、ユーザが角度を数字でキーボード1807か
ら入力するとする。
【0087】また、行方向としては、あらかじめ、縦方
向(90度)か横方向(0度)のいずれかと仮定してお
き、行方向判定部1812の出力角度に近い方を正しい
行方向とすることも、以下の2つの仮定が成り立つ場合
には有効である。この場合は、基準行方向入力メモリ1
814は不要となる。 (1) 行方向は縦方向か横方向のいずれかである。 (2) 紙面の傾きは90度より充分小さい。この場
合、ユーザが角度を指定する操作が不要になるため、さ
らに操作が簡略化される。
【0088】ステップ1908において、画像傾き算出
部1815は行方向判定部1812の出力を受け取り、
それが「判定不能」など、角度を表わす出力ではない場
合を除いて(ステップ1909)、これとステップ19
04で得られた基準行方向メモリ1814の内容とを比
較して、画像の傾きを角度として算出する。例えば、、
行方向判定部1812で行方向が30度である場合に、
基準行方向が30度であれば画像傾きは0度として検出
され、また、行方向判定部1812で行方向が0度であ
る場合には、基準行方向が30度であれば画像傾きは−
30度傾いているとして検出される。このような処理を
行った結果を画像傾き補正部1816に転送する(ステ
ップ1910)。
【0089】画像傾き補正部1816は、画像メモリ1
802に格納されている画像データに、算出された画像
の傾きの逆の角度をもつ回転の補正を加えて、画像の推
定の傾きの影響を打ち消す(ステップ1911)。画像
傾き補正部1816による画像の回転にあたっては、特
開昭63−191192号公報など、適切な公知技術を
用いるものとする。
【0090】
【発明の効果】本発明による行方向判定装置では、文字
を構成する文字要素の局所的な密度に着目しているの
で、レイアウトが複雑な画像データのような大域的な特
徴に影響を受けずに判定が可能である。
【0091】また、本発明による行方向判定装置は、文
字を構成する文字要素に基づいて処理を行っているの
で、他の目的で文字要素の抽出がすでに行われていれば
それをそのまま利用することができ、行方向判定のため
に新たに文字要素抽出を行っても、抽出された文字要素
は文字認識において文字切出し等に利用できるため、極
めて効率が高い。
【0092】さらに、本発明による行方向判定装置は、
縦、横以外でも、一定以上角度に差のある方向は区別で
きるため、傾きが大きくなっても行方向は検出可能であ
り、このことは、手持ちスキャナやカメラなど、幅広い
入力機器に対応可能であることを意味している。また、
斜め方向も判定対象に入れた場合も、文字要素の抽出の
段階には関係しないため、画像メモリへのアクセスが増
大するようなことはない。
【0093】本発明による画像傾き検出装置および画像
傾き補正装置は、本発明による行方向判定装置の上に述
べた特徴を利用して、少量の処理を付加するのみで構成
できる。このため、特に本発明による行方向判定装置と
併用するときわめて効率が高くすることができる。
【図面の簡単な説明】
【図1】ランレングスを自然に定義できるのは限られた
方向のみであることを説明した図である。
【図2】本発明の第1〜3の実施の形態のブロック図で
ある。
【図3】本発明の第1〜3の実施の形態の処理フローチ
ャートである。
【図4】本発明の第1の形態における、文字要素バッフ
ァの構造の例である。
【図5】本発明の第1の形態における、文字要素の間の
距離を説明した図である。
【図6】本発明の第1の形態における文字要素距離バッ
ファの構造例である。
【図7】本発明の第1の形態における番号方向対応テー
ブルの例である。
【図8】本発明の第2の形態における文字要素の間の距
離を説明した図である。
【図9】本発明の第2の形態における文字要素距離バッ
ファの構造例である。
【図10】本発明の第2の形態における文字要素の間の
距離の利点を説明した図である。
【図11】本発明の第3の実施の形態における角度の分
割を示した図である。
【図12】本発明の第3の実施の形態における文字要素
距離バッファの構造例である。
【図13】本発明の第3の実施の形態における番号方向
対応テーブルの例である。
【図14】本発明の第4の実施の形態のブロック図であ
る。
【図15】本発明の第4の実施の形態の処理フローチャ
ートである。
【図16】本発明の第4の実施の形態における、各方向
への文字要素密度の定義の一例を説明した図である。
【図17】本発明の第4の実施の形態における文字要素
密度バッファの構造例である。
【図18】本発明の第5の実施の形態のブロック図であ
る。
【図19】本発明の第5の実施の形態の処理フローチャ
ートである。
【符号の説明】
1、1401、1801 画像入力部 2、1402、1802 画像メモリ 3、1403、1803 CPU 4、1404、1804 表示装置 5、1405、1805 ディスプレイ 6、1406、1806 キーボード 7、1407 1807 マウス 8、1408、1808 文字要素抽出部 9、1409、1809 文字要素バッファ 10 文字要素距離算出部 11 文字要素距離バッファ 12、1412、1812 行方向判定部 13、1413、1813 番号方向対応テーブル 1410、1810 文字要素密度算出部 1411、1811 文字要素密度バッファ 1814 基準行方向メモリ 1815 画像傾き算出部 1816 画像傾き補正部

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 入力された画像を記憶する画像記憶手段
    と、 前記画像記憶手段に記憶された画像から、文字等の構成
    要素となる文字要素を抽出する文字要素抽出手段と、 前記文字要素の密度を予め定められた複数の方向それぞ
    れについて文字要素の密度を算出する文字要素密度算出
    手段と、 前記文字要素の密度から前記予め定められた複数の方向
    に対して前記文字要素が密に分布している方向を検出
    し、前記文字要素が密に分布している方向を文字の行方
    向とする行方向判定手段と、を備えたことを特徴とする
    行方向判定装置。
  2. 【請求項2】 前記予め定められた複数の方向は、前記
    文字要素の外接矩形における代表点を中心とした円を分
    割して形成される方向であることを特徴とする請求項1
    に記載の行方向判定装置。
  3. 【請求項3】 前記文字密度算出手段は、予め定められ
    た複数の方向ごとに前記文字要素と近接する各文字要素
    との最も近い距離を算出する文字要素距離算出手段から
    なり、 前記行判定手段は、前記文字要素距離算出手段から得ら
    れた文字要素の距離を予め定められた方向ごとに比較
    し、多数決原理に基づいて前記文字要素が密に分布して
    いる方向を決めることを特徴とする請求項1または請求
    項2に記載の行方向判定装置。
  4. 【請求項4】 前記文字密度算出手段は、まず、前記予
    め定められた方向について前記文字要素と近接する各文
    字要素との最も近い距離を方向の向きごとに算出し、次
    に、前記向きごとに算出された文字要素の距離のうち距
    離の大きい方をその方向の文字要素の距離とする文字要
    素距離算出手段からなり、 前記行判定手段は、前記文字要素距離算出手段から得ら
    れた文字要素の距離を予め定められた方向ごとに比較
    し、多数決原理に基づいて前記文字要素が密に分布して
    いる方向を決めることを特徴とする請求項1または請求
    項2に記載の行方向判定装置。
  5. 【請求項5】 前記文字要素密度は、前記文字要素の外
    接矩形の代表点が前記円を分割した領域に含まれる数で
    決められることを特徴とする請求項2に記載の行方向判
    定装置。
  6. 【請求項6】 請求項1乃至5のいずれかに記載の行方
    向判定装置と、 その処理結果である行の方向と予め入力された基準行方
    向とから、入力画像の傾きを検出する画像傾き検出手段
    を備えることを特徴とする画像傾き検出装置。
  7. 【請求項7】 請求項6に記載の画像傾き検出装置と、 前記画像傾き検出手段から得られる処理結果から画像の
    補正を行う画像傾き補正手段を備えることを特徴とする
    画像傾き補正装置。
JP23362697A 1997-08-29 1997-08-29 行方向判定装置、画像傾き検出装置及び画像傾き補正装置 Expired - Fee Related JP3471578B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP23362697A JP3471578B2 (ja) 1997-08-29 1997-08-29 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
US09/124,087 US6532303B2 (en) 1997-08-29 1998-07-29 Line direction deciding device, image inclination detecting device and image inclination correcting device
EP98114831A EP0899679B1 (en) 1997-08-29 1998-08-06 Line direction deciding device, image inclination detecting device and image inclination correction device
DE69813416T DE69813416T2 (de) 1997-08-29 1998-08-06 Vorrichtungen zur Linienrichtungsbestimmung, Bildschrägeerfassung und Bildschrägekorrektur.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23362697A JP3471578B2 (ja) 1997-08-29 1997-08-29 行方向判定装置、画像傾き検出装置及び画像傾き補正装置

Publications (2)

Publication Number Publication Date
JPH1173475A true JPH1173475A (ja) 1999-03-16
JP3471578B2 JP3471578B2 (ja) 2003-12-02

Family

ID=16958002

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23362697A Expired - Fee Related JP3471578B2 (ja) 1997-08-29 1997-08-29 行方向判定装置、画像傾き検出装置及び画像傾き補正装置

Country Status (4)

Country Link
US (1) US6532303B2 (ja)
EP (1) EP0899679B1 (ja)
JP (1) JP3471578B2 (ja)
DE (1) DE69813416T2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016009996A (ja) * 2014-06-24 2016-01-18 京セラドキュメントソリューションズ株式会社 画像処理装置、プログラム及び画像形成装置
JP2020144460A (ja) * 2019-03-04 2020-09-10 京セラドキュメントソリューションズ株式会社 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002358514A (ja) * 2000-12-14 2002-12-13 Ricoh Co Ltd 画像歪み補正装置、プログラム、記憶媒体、画像歪み補正方法、画像読取装置および画像形成装置
US7411593B2 (en) * 2001-03-28 2008-08-12 International Business Machines Corporation Image rotation with substantially no aliasing error
US6999207B2 (en) * 2001-09-19 2006-02-14 Kabushiki Kaisha Toshiba Image processing apparatus, image forming apparatus, and method of them
US7286718B2 (en) * 2004-01-26 2007-10-23 Sri International Method and apparatus for determination of text orientation
KR100774479B1 (ko) * 2004-07-06 2007-11-08 엘지전자 주식회사 휴대단말기의 영상신호 기울기 보정장치 및 방법
JP4553241B2 (ja) * 2004-07-20 2010-09-29 株式会社リコー 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体
JP4605260B2 (ja) * 2008-06-18 2011-01-05 コニカミノルタビジネステクノロジーズ株式会社 ベクタ画像生成方法、画像処理装置、およびコンピュータプログラム
US9734132B1 (en) * 2011-12-20 2017-08-15 Amazon Technologies, Inc. Alignment and reflow of displayed character images
US9183633B2 (en) * 2011-12-21 2015-11-10 Panasonic Intellectual Property Management Co., Ltd. Image processing apparatus and image processing method
CN106778733A (zh) * 2015-11-25 2017-05-31 中兴通讯股份有限公司 调整图片文字的显示方法及装置
CN112241737B (zh) * 2020-11-12 2024-01-26 瞬联软件科技(北京)有限公司 文字图像校正方法和装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2597006B2 (ja) 1989-04-18 1997-04-02 シャープ株式会社 矩形座標抽出方法
US5191438A (en) * 1989-12-12 1993-03-02 Sharp Kabushiki Kaisha Facsimile device with skew correction and text line direction detection
US5245676A (en) 1989-12-21 1993-09-14 Xerox Corporation Determination of image skew angle from data including data in compressed form
JPH0766413B2 (ja) 1990-08-02 1995-07-19 富士ゼロックス株式会社 文書文字方向検出装置
JPH04195485A (ja) * 1990-11-28 1992-07-15 Hitachi Ltd 画像情報入力装置
JPH05225378A (ja) 1991-06-03 1993-09-03 Fujitsu Ltd 文書画像の領域分割システム
JP3361124B2 (ja) * 1991-07-30 2003-01-07 ゼロックス・コーポレーション テキストを含む2次元画像上での画像処理方法と画像処理装置
US5253307A (en) * 1991-07-30 1993-10-12 Xerox Corporation Image analysis to obtain typeface information
JP3058489B2 (ja) 1991-09-20 2000-07-04 シャープ株式会社 文字列抽出方法
JPH0737103A (ja) * 1993-07-23 1995-02-07 Olympus Optical Co Ltd 傾き角度検出装置
JP3050007B2 (ja) * 1993-08-26 2000-06-05 ミノルタ株式会社 画像読取装置およびこれを備えた画像形成装置
JP3108979B2 (ja) * 1994-07-28 2000-11-13 セイコーエプソン株式会社 画像処理方法および画像処理装置
JP3534128B2 (ja) * 1995-01-24 2004-06-07 オムロン株式会社 書類の上下方向検知方法及び装置
US5889884A (en) * 1995-05-23 1999-03-30 Minolta Co., Ltd. Image forming apparatus capable of recognizing top and bottom of document image

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016009996A (ja) * 2014-06-24 2016-01-18 京セラドキュメントソリューションズ株式会社 画像処理装置、プログラム及び画像形成装置
JP2020144460A (ja) * 2019-03-04 2020-09-10 京セラドキュメントソリューションズ株式会社 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム

Also Published As

Publication number Publication date
US6532303B2 (en) 2003-03-11
EP0899679B1 (en) 2003-04-16
DE69813416T2 (de) 2004-03-25
EP0899679A2 (en) 1999-03-03
JP3471578B2 (ja) 2003-12-02
US20010046322A1 (en) 2001-11-29
EP0899679A3 (en) 2001-01-24
DE69813416D1 (de) 2003-05-22

Similar Documents

Publication Publication Date Title
US6774889B1 (en) System and method for transforming an ordinary computer monitor screen into a touch screen
JPH03144863A (ja) 画像の傾き検出方法および補正方法ならびに画像情報処理装置
US9959475B2 (en) Table data recovering in case of image distortion
CN109697414B (zh) 一种文本定位方法及装置
JP2005316946A (ja) レイアウトルール生成システム、レイアウトシステム、レイアウトルール生成プログラム、レイアウトプログラムおよび記憶媒体、並びにレイアウトルール生成方法およびレイアウト方法
JPH1173475A (ja) 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
JP2008217833A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
CN112016341A (zh) 一种文本图片矫正方法及装置
CN109961063B (zh) 文本检测方法及装置、计算机设备和存储介质
JPH04352295A (ja) 文字列方向判別装置
JP2000113106A (ja) 文書画像処理装置
TWI799050B (zh) 偵測和辨識文字的電子裝置和方法
CN117877038B (zh) 基于文字检测的文档图像纠偏方法、系统、设备及介质
JPH0916713A (ja) 画像領域分割方法
JP4697387B2 (ja) 原稿画像判定装置、原稿画像判定方法及びそのプログラム
JPH0573718A (ja) 領域属性識別方式
CN115797938A (zh) 文件图片的自动校正方法、电子设备及存储介质
JPH0830725A (ja) 画像処理装置及び方法
JPH09179982A (ja) 特定パターン検出方法
JPH0668304A (ja) 手書き文字正規化方式
JPH0728939A (ja) 表のベクトル化装置
JP2755299B2 (ja) 画像処理方法
JP6464891B2 (ja) 傍線問題採点方法、傍線問題採点プログラム及び傍線問題採点装置
JP2022041468A (ja) 識別方法、情報処理システム、方法、およびプログラム
JPH08194773A (ja) 画像処理方法および画像処理装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030902

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080912

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080912

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090912

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090912

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100912

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110912

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees