JPH05242297A - 文字切り出し方法 - Google Patents

文字切り出し方法

Info

Publication number
JPH05242297A
JPH05242297A JP4044480A JP4448092A JPH05242297A JP H05242297 A JPH05242297 A JP H05242297A JP 4044480 A JP4044480 A JP 4044480A JP 4448092 A JP4448092 A JP 4448092A JP H05242297 A JPH05242297 A JP H05242297A
Authority
JP
Japan
Prior art keywords
character
image
cutting
document image
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4044480A
Other languages
English (en)
Inventor
Takashi Nitta
隆志 新田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP4044480A priority Critical patent/JPH05242297A/ja
Publication of JPH05242297A publication Critical patent/JPH05242297A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 高速で正確な文字切り出し方法の提供を目的
とする。 【構成】 文書画像を階層構造を持つ小ブロックに分割
し、画素が存在するブロックに対してのみメモリの割り
当て及び切り出し処理を行う。また、最初に文字連結領
域の部分画像を切り出しておき、その部分画像を重ね合
わせることによって最終的な文字画像を作成する。ま
た、傾いた文書画像に対して、傾きを検出し、その傾き
方向に文字列を切り出し、文字列ごとに傾きの補正を行
う。 【効果】 無駄な領域に対して処理を行わないため、高
速で使用メモリが少なくてよい。また文書画像が大きく
傾いていても正確、高速に処理が可能である。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は日本語文書画像からの文
字切り出し方法に関する。
【0002】
【従来の技術】従来の文字切り出し方法は、例えば電子
通信学会論文誌D Vol.J67−D No.10の
「非接触文字優先切出しによる印刷物からの文字切出し
法」に示されているように、黒画素の周辺分布を用いて
文字列および個々の文字を切りだす方法がある。また、
別の方法として特開平3−62284に示されているよ
うに、ラベリング処理などによって抽出された文字連結
領域の外接矩形を、その配置関係に着目して統合処理す
ることにより文字列を切り出す方法がある。
【0003】
【発明が解決しようとする課題】しかし、前述の従来技
術のうち、第1の従来技術では周辺分布を使用して文字
列を切り出すため、文書画像が傾いている場合にはあら
かじめ文書画像全体に対して傾きの補正をする必要があ
る。そのため、この傾きの補正処理に非常に時間がかか
り、また元の文書画像と補正後の文書画像の両方を保持
するため多くの記憶領域が必要となる。
【0004】一方、第2の従来技術では文字連結領域の
外接矩形の配置情報を用いて文字列領域を切り出すた
め、ある程度の文書画像の傾きに対しては正確な切り出
しが可能である。しかし、文書画像が大きく傾いている
場合には、外接矩形の配置は傾きが無い場合と大きく異
なるためこの方法では正確な文字列切り出しが困難とな
る。
【0005】また、この二つの従来技術に共通する課題
として、次の二つの課題が存在する。一つめは、切り出
し結果の文字画像を元の文書画像からその都度作成する
ために、複数の異なる文字画像を作成するためには処理
に非常に時間がかかる。さらに、斜体文字やツメ組み等
が存在する場合には外接矩形が重なる場合があるため、
それを考慮した文字画像の作成処理に更に時間がかかる
という課題。
【0006】二つめは、文書画像には多くの空白領域が
含まれており、その空白領域に対して無駄な記憶領域や
処理時間を使用しているという課題である。
【0007】
【課題を解決するための手段】本発明の文字切り出し方
法は、画像読み取り装置で読み取った文書画像から、文
字画像を切り出す文字切り出し処理において、読み取っ
た文書画像を小ブロックに分割し、画素の存在する小ブ
ロックだけに画像データ記憶用領域を割り当てる。そし
て、個々の小ブロックごとの画素の有無を示すテーブル
を作成し、そのテーブルを参照することによって画素が
存在するブロックに対してのみ文字切り出し処理を行う
ことを特徴とする。
【0008】さらに、文書画像の分割は、階層構造を持
つ小ブロックによることを特徴とする。
【0009】また、最初に文字の外接矩形を抽出し、そ
の外接矩形に対応する部分画像を切り出し、以後の切り
出し処理は外接矩形を統合することによって行い、最終
的な文字画像をその部分画像を重ね合わせることによっ
て作成することを特徴とする。
【0010】さらに、個々の外接矩形に対応する部分画
像を切り出す場合に、画像データを座標点列データに変
換することを特徴とする。
【0011】また、最初に文書画像の傾きを検出し、そ
の検出した傾き方向に従って文字列を切り出すことを特
徴とする。
【0012】また、傾いた文書画像に対し最初に文字列
を切り出し、その切り出した個々の文字列ごとに傾きを
補正することを特徴とする。
【0013】また、傾いた文字画像に対し、文字画像デ
ータを傾き補正計算後の座標点列データに変換すること
によって傾きを補正することを特徴とする。
【0014】
【実施例】
(実施例1)以下、本発明を実施例に基づいて詳細に説
明する。
【0015】図1は本発明の文字切り出し方法を使用し
た文字認識装置のブロック図。図2は本発明の切り出し
方法における文書画像データ形式の説明図。図3は本発
明の文字切り出し方法における部分画像切り出しの説明
図。図4は本発明の文字切り出し方法における座標点列
データの説明図。図5は本発明の切り出し方法における
傾いた文書画像からの文字列切り出しの説明図。図6は
本発明の文字切り出し方法における文字列ごとの傾き補
正の説明図。図7は本発明の文字切り出し方法における
傾き補正の説明図。
【0016】以下、図面を用いて本発明の文字切り出し
方法について詳細に説明する。
【0017】最初に、図1を用いて本発明の文字切り出
し方法を使用した文字認識装置の処理の流れを説明す
る。読み取り対象の文書を画像読み取り部101で読み
取り、その文書画像データを画像データ変換部102で
本発明の文書画像データ形式に変換する。その文書画像
データから外接矩形抽出部103において文字連結領域
の外接矩形を抽出し、その外接矩形に対応する部分画像
を切り出す。以後の切り出し処理は外接矩形を使用して
行う。次に、傾き検出部105において文書画像の傾き
を検出し、検出された傾き情報を使用して文字列切り出
し部106で文字列を切り出す。切り出した個々の文字
列ごとに、傾き補正部107で傾きを補正する。次に、
文字切り出し部108において最終的な文字外接矩形を
抽出し、その外接矩形に対応する文字画像を文字画像作
成部109において部分画像から作成する。その作成さ
れた文字画像を文字認識部110において認識し文字コ
ード化する。
【0018】次に、図2を用いて本発明の文字画像デー
タ形式について説明する。画像読み取り部101で読み
取った文書画像データをそのまま使用する場合には、非
常に多くのメモリを必要とする。しかし、文書画像中に
は空白部が多く存在し、その空白部にはメモリを割り当
てる必要はない。図2に示すデータ形式は4つの階層を
持つツリー状のもので、画像を1ラインごとに扱う。こ
のデータ形式では1ライン当たり4096画素までのデ
ータを扱うことが可能である。第1テーブル201の上
側に示されている0、1の並びは画素情報205であ
る。1ラインを512画素ごとの小ブロックに分割した
場合に、対応する小ブロックに画素が存在する場合には
1、存在しない場合には0の値を取る。画素情報205
の値が1の時、第1テーブル201下側の対応するアド
レステーブル206には、第2テーブル202を示すア
ドレスを割り当てる。同様に、第2テーブル202は5
12画素を8分割した1ブロック64画素の画素情報テ
ーブルの値と対応する第3テーブル203のアドレステ
ーブルを持っている。第3テーブル203は64画素を
8分割した1ブロック8画素の画素情報を持っており、
対応するアドレステーブルには8画素の画像データ20
4のアドレスが入る。
【0019】このデータ形式においては、文書中に空白
が多いほど使用メモリ量が少なくてよい。また、テーブ
ルを参照して画素が存在するブロックに対してのみ以後
の処理を行うため、無駄な処理を削減でき処理時間の短
縮が可能である。また、階層構造を持っているので、大
きな空白部に対してはまとめて処理を削減できるため、
そのような場合にはさらに処理時間の短縮が可能であ
る。
【0020】また、本発明の方法は文字切り出しだけに
限らず、図形認識、マルチメディア通信等の画像処理に
応用可能なものである。
【0021】(実施例2)部分画像切り出し部104と
文字画像作成部109の処理について図3を用いて説明
する。外接矩形抽出部103において文字連結領域の外
接矩形301を抽出する。そして、部分画像切り出し部
104で個々の外接矩形301に対応する部分画像30
2を切り出し、別の場所に記憶する。以後の切り出し処
理は、外接矩形301を用いて行う。文字認識部110
へ渡す文字画像は、文字切り出し部108の文字切り出
し結果にしたがい、文字画像作成部109で部分画像3
02を文字画像303のように重ね合わせることによっ
て作成する。
【0022】部分画像は元の画像データメモリの不要に
なった部分へ上書きすることによって、新たにメモリを
確保する必要がない。また、1つの文字に対して考えら
れる切り出しパターンが複数存在する場合、従来の方法
ではそのパターン数と同じ回数、元の画像データから文
字画像を切り出す必要がある。しかし、本発明の方法で
は、その組み合わせパターンに対応する部分画像を重ね
合わせるだけでよく、簡単で高速に処理が可能である。
さらに、斜体文字やツメ組みなどで隣り合う文字矩形が
重なっている場合、従来の方法では不要な画像を切り出
さないための処理が毎回必要であるが、本発明の方法で
は最初に部分画像を切り出す時だけその処理を行えばよ
いため、高速に処理が可能となる。また、傾きの補正が
必要な場合、部分画像毎に補正処理を行うだけでよいた
め、文書画像全体に対して補正処理を行う場合と比較し
て、高速に処理が可能であり、補正作業用のメモリも非
常に少なくてよい。
【0023】また、部分画像を切り出す時に、図4に示
すように部分画像データ401を黒画素が存在する座標
の集合である座標点列データ402に変換する。ただ
し、図4で部分画像データ401は黒画素を1、白画素
を0で表している。この変換によって、図4の場合には
25個の画像データが5個の座標点列データになり、デ
ータ量が減少し使用メモリ量を削減することが可能とな
る。さらに、文字画像に対して傾きの補正もしくは正規
化処理を行う必要がある場合、この2つの処理は座標に
対する計算処理であるため、画像データの場合には一度
画像データを走査して黒画素の座標を求める必要があ
る。しかし、座標点列データの場合には既にデータが座
標形式であるので、この走査が不必要であり、処理が高
速となる。また、処理前の座標と処理後の座標は1対1
の関係になっているため、画像データに対して処理をす
る場合に必要な作業用のメモリが必要なくなる。
【0024】(実施例3)図5を用いて文字列切り出し
部106の処理について説明する。最初に、傾き検出部
105において文書画像の傾きθ506を検出する。そ
のθ506を使用して、画像が右下がりに傾いている場
合、注目している外接矩形の右上の頂点502と左下の
頂点503(画像が左下がりに傾いている場合は左上の
頂点と右下の頂点)から角度θの直線504、505を
考える。そして、その2つの直線504,505に挟ま
れる領域に存在する外接矩形で、注目矩形からの距離が
しきい値以下の矩形を注目矩形と同じ文字列に含まれる
矩形として文字列関係テーブルに記憶する。この処理を
すべての矩形に対して行い、文字列関係テーブルを整理
することによって、同一文字列に含まれる矩形が求めら
れる。
【0025】文書画像が大きく傾いている場合、同一文
字列内の文字の配置が、傾きが無い場合と比較して大き
く異なるため、従来の方法では最初に文書画像全体の傾
きを補正しなければ正確な文字列の切り出しが不可能で
あり、その補正処理に非常に時間がかかる。しかし、本
発明の方法では文書画像が大きく傾いている場合でも、
傾きを検出するだけで正確な文字列の切り出しが可能で
あり、文字列を切り出すまでの処理時間が大幅に短縮可
能となる。
【0026】文字認識装置の場合、一般的に認識処理の
方が切り出し処理よりも時間がかかる。そのため、認識
結果を表示させながら認識処理と文字切り出し処理を行
う場合には、その切り出し処理にかかる時間は人には余
り気にならない。しかし、認識結果が表示されるまでの
前処理の部分に時間がかかると、非常に気になる。この
点からも、文字列切り出しまでの前処理の部分の処理時
間を短縮可能である本発明の方法は効果がある。
【0027】(実施例4)傾き補正部107の処理につ
いて図6と図7を用いて説明する。傾いた文書画像から
文字列切り出し部106で切り出された文字列601に
対して、個々の文字列ごとに傾きの補正を行い、補正後
の文字列602を得る。
【0028】本発明の方法では、一つの文字列ごとに補
正処理を行うため、従来の方法のように文書画像全体に
対して処理を行う場合と比較して、無駄な空白領域に対
して処理を行わないため高速処理が可能となる。また、
傾き補正処理は処理が終了するまで元の画像と補正後の
画像の両方を保持する必要があるため、元の画像データ
の大きさとと同じ作業用メモリを必要とする。そのた
め、文書画像全体に対して処理を行う従来の方法では、
非常に多くの作業用メモリを必要とした。これに対し、
本発明の方法では一つの文字列ごとに処理を行うため、
作業用メモリは一つの文字列画像分でよく、大幅に削減
が可能となる。
【0029】また、図7に示すように角度θs 705傾
いている文字画像701に対して補正処理を行い、補正
後の文字画像702を得る。元の文字画像701の一つ
の黒画素の座標(xs,ys)703に対して補正計算を
行うことにより、補正後の座標(xd,yd)704が得
られる。(xs,ys)703と(xd,yd)704の関
係は、補正計算に一般的なアフィン変換を使用すると次
の式で表される。
【0030】 xd=xscosθs−yssinθs (1) yd=xssinθs+yscosθs (2) この式(1)、(2)から分かるように、(xs,ys
703と(xd,yd)704は1対1の関係になってい
る。従来の方法では、補正計算で求めた座標から補正後
の文字画像データを作成する。しかし、本発明では補正
後の座標704から画像データの作成はせず、座標をそ
のままデータとして使用し、その座標の集合である座標
点列データで文字画像を表す。本発明の方法では、補正
後の座標から画像データを作成する必要が無いため補正
処理が高速に実行可能となる。また、黒画素の座標だけ
を記憶するため、白画素に対応するデータ量を削減可能
となる。また、本発明の方法を使用することにより、文
字認識部へ渡すための文字の切り出し画像を文書画像デ
ータ中から切り出す必要がなくなる。これは、座標点列
データを文字認識部へそのまま渡すだけでよいからであ
る。つまり本発明の方法は傾きの補正処理と文字画像の
切り出し処理を同時に行っていることになり、文字切り
出し処理全体の高速化が可能となる。また、複数の文字
画像を統合して一つの文字画像を作成する場合にも、複
数の文字画像の座標点列データを一つにまとめるだけで
よく、処理の高速化が可能となる。また、正規化の処理
を実行する場合にも、この処理は座標に対する処理なの
で、画像データの場合には黒画素の座標を求める必要が
あるが、本発明の方法の場合既に座標形式となっている
ため、その必要がなく処理時間を短縮可能となる。
【0031】
【発明の効果】以上のように本発明の文字切り出し方法
は、文書画像を読み取り、その文書画像データを小ブロ
ックに分割し、画素の存在するブロックに対してのみメ
モリを割り当てる。また、そのブロック毎の画素情報を
テーブルに記憶し、そのテーブルを参照することによっ
て画素が存在するブロックに対してのみ以後の切り出し
処理を行う。そのため、文書画像データのためのメモリ
が少なくてよく、処理時間の短縮が可能である。また、
階層構造を持つ小ブロックを使用することにより、さら
に使用メモリの低減と処理の高速化が可能である。
【0032】また、文字の外接矩形抽出と同時に部分画
像を切り出し、文字画像をその部分画像の重ね合わせで
作成する。そのため、元の文書画像から毎回文字画像を
切り出す場合と比較して処理時間の短縮が可能である。
さらに、斜体文字やツメ組みなどで文字外接矩形の領域
が重なるような場合には、その重なりを除去するための
処理を最初の部分画像を切り出すときに行うだけでよい
ため、さらに処理の高速化が可能である。
【0033】また、文書画像の傾きを検出し、その検出
した傾き方向に矩形の位置を調べることによって文字列
を切り出す。そのため、非常に傾いて読み取られた文書
画像に対しても、傾きの検出処理を行うだけで正確に文
字列の切り出しが可能であり、処理に時間がかかる傾き
の補正処理を行わなくてよく、文字列切り出しまでの前
処理にかかる時間を大幅に短縮可能である。
【0034】また、認識のために傾きの補正が必要な場
合も、個々の文字列ごとに傾きの補正処理を行うことに
より、文書画像全体に対して補正処理を行う場合と比較
して、無駄な領域に対して処理を行わないので、補正処
理が高速に実行可能であり、作業用のメモリも少なくて
よい。また、その傾き補正処理を行うときに、画像デー
タを補正後の座標点列データに変換することによって、
傾きの補正と文字画像の切り出しが同時に実行できるた
め、さらに処理の高速化と使用メモリの低減が可能であ
る。
【0035】また、本発明の文字切り出し方法を使用し
た、文字認識装置は小型、高速、安価で、文書画像が大
きく傾いている場合にも正確に処理が可能なものとな
る。
【図面の簡単な説明】
【図1】 本発明の文字切り出し方法を使用した文字認
識装置のブロック図。
【図2】 本発明の切り出し方法における文書画像デー
タ形式の説明図。
【図3】 本発明の文字切り出し方法における部分画像
切り出しの説明図。
【図4】 本発明の文字切り出し方法における座標点列
データの説明図。
【図5】 本発明の切り出し方法における傾いた文書画
像からの文字列切り出しの説明図。
【図6】 本発明の文字切り出し方法における文字列ご
との傾き補正の説明図。
【図7】 本発明の文字切り出し方法における傾き補正
の説明図。
【符号の説明】
102 画像データ変換部 104 部分画像切り出し部 106 文字列切り出し部 107 傾き補正部 109 文字画像作成部 205 画素情報 206 アドレス 302 部分画像 402 座標点列データ 506 傾き角θ 703 傾き補正前の座標(xs,ys) 704 傾き補正後の座標(xd,yd

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 画像読み取り装置で読み取った文書画像
    から、文字画像を切り出す文字切り出し処理において、
    読み取った文書画像を小ブロックに分割し、画素の存在
    する小ブロックだけに画像データ記憶用領域を割り当
    て、個々の小ブロックごとの画素の有無を示すテーブル
    を作成し、そのテーブルを参照することによって画素が
    存在するブロックに対してのみ文字切り出し処理を行う
    ことを特徴とする文字切り出し方法。
  2. 【請求項2】 文書画像の分割は、階層構造を持つ小ブ
    ロックによることを特徴とする請求項1記載の文字切り
    出し方法。
  3. 【請求項3】 画像読み取り装置で読み取った文書画像
    から、文字画像を切り出す文字切り出し処理において、
    最初に文字の外接矩形を抽出し、その外接矩形に対応す
    る部分画像を切り出し、以後の切り出し処理は外接矩形
    を統合することによって行い、最終的な文字画像をその
    部分画像を重ね合わせることによって作成することを特
    徴とする文字切り出し方法。
  4. 【請求項4】 個々の外接矩形に対応する部分画像を切
    り出す場合に、画像データを座標点列データに変換する
    ことを特徴とする請求項3記載の文字切り出し方法。
  5. 【請求項5】 画像読み取り装置で読み取った文書画像
    から、文字画像を切り出す文字切り出し処理において、
    最初に文書画像の傾きを検出し、その検出した傾き方向
    に従って文字列を切り出すことを特徴とする文字切り出
    し方法。
  6. 【請求項6】 画像読み取り装置で読み取った文書画像
    から、文字画像を切り出す文字切り出し処理において、
    傾いた文書画像に対し最初に文字列を切り出し、その切
    り出した個々の文字列ごとに傾きを補正することを特徴
    とする文字切り出し方法。
  7. 【請求項7】 画像読み取り装置で読み取った文書画像
    から、文字画像を切り出す文字切り出し処理において、
    傾いた文字画像に対し、文字画像データを傾き補正計算
    後の座標点列データに変換することによって傾きを補正
    することを特徴とする文字切り出し方法。
JP4044480A 1992-03-02 1992-03-02 文字切り出し方法 Pending JPH05242297A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4044480A JPH05242297A (ja) 1992-03-02 1992-03-02 文字切り出し方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4044480A JPH05242297A (ja) 1992-03-02 1992-03-02 文字切り出し方法

Publications (1)

Publication Number Publication Date
JPH05242297A true JPH05242297A (ja) 1993-09-21

Family

ID=12692704

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4044480A Pending JPH05242297A (ja) 1992-03-02 1992-03-02 文字切り出し方法

Country Status (1)

Country Link
JP (1) JPH05242297A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6738530B1 (en) 1999-02-23 2004-05-18 Nec Corporation Method of recognizing character in which correction of inclination of character is carried out and apparatus for carrying out this method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6738530B1 (en) 1999-02-23 2004-05-18 Nec Corporation Method of recognizing character in which correction of inclination of character is carried out and apparatus for carrying out this method

Similar Documents

Publication Publication Date Title
JP2930612B2 (ja) 画像形成装置
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JPS6159568A (ja) 文書処理装置
JPH05233873A (ja) 領域分割方法
CN111126266B (zh) 文本处理方法、文本处理系统、设备及介质
US20020051574A1 (en) Character recognition method, program and recording medium
JP3149221B2 (ja) 画像処理装置
JPH05242297A (ja) 文字切り出し方法
JP3172498B2 (ja) イメージ認識用特徴値抽出方法、およびその装置、イメージ解析プログラムを格納する記憶媒体
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP2846486B2 (ja) 画像入力装置
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPH05292294A (ja) デジタル複写機
JP3095470B2 (ja) 文字認識装置
JPS615383A (ja) 文字パタ−ン分離装置
JP2803736B2 (ja) 文字認識方式
JP3437296B2 (ja) 文字列高速抽出装置
JP2954218B2 (ja) 画像処理方法及び装置
JPH117493A (ja) 文字認識処理装置
JP2987877B2 (ja) 文字認識方法
JP2003016385A (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JP2803735B2 (ja) 罫線を含んだ文字認識装置
JP2962525B2 (ja) テキストブロック認識方法
JP3145265B2 (ja) 文字認識装置