JPH08241376A - 文字認識装置および文字認識方法 - Google Patents

文字認識装置および文字認識方法

Info

Publication number
JPH08241376A
JPH08241376A JP7042833A JP4283395A JPH08241376A JP H08241376 A JPH08241376 A JP H08241376A JP 7042833 A JP7042833 A JP 7042833A JP 4283395 A JP4283395 A JP 4283395A JP H08241376 A JPH08241376 A JP H08241376A
Authority
JP
Japan
Prior art keywords
character
value
image
line segment
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7042833A
Other languages
English (en)
Inventor
Takashi Harada
隆史 原田
Katsuhiko Sakaguchi
克彦 阪口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP7042833A priority Critical patent/JPH08241376A/ja
Publication of JPH08241376A publication Critical patent/JPH08241376A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 前処理の時間が短くてすみ、複雑な線分を含
む画像からも文字を認識できる装置および方法を提供す
る。 【構成】 (a)に示す2値画像において、任意の画素
fijについて、fijの値が“1”あるいはfijの
左右の画素のいずれかの値が“1”のときfijの値を
“1”とし、その他のときfijの値を“0”とする処
理を複数回くりかえすと、画像は(b),(c)と変化
し、文字部分は(c)に示すように塊となる。(c)の
画像において、任意の画素fijについて、fijの値
が“0”あるいはfijの上下の画素のいずれかの値が
“0”のときfijの値を“0”とし、その他のときf
ijの値を“1”とする処理を複数回くりかえすと横方
向の線分が消去される。同様の処理で縦方向の線分を消
去する。前記塊部分に対応する元画像の領域から文字を
認識する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、地図,図面のように文
字,線分等からなる画像から文字を認識する装置および
方法に関するものである。
【0002】
【従来の技術】従来は、帳票等、文字と線分からなる文
書をスキャナ等で読み取り、コンピュータ上で編集,文
字検索等の処理する際、まず2値化,細線化,ラベリン
グ等の処理を行い、ラベルの付けられた画素群に対し、
画素数や長さをカウントし、画素数の多いもの(長さの
長いもの)を線分、短いものを文字を構成する要素とし
て認識することにより、文字と線分を同時に認識してい
る。
【0003】
【発明が解決しようとする課題】しかし、前述の従来の
手法では、文字,線分の画素数,長さをカウントし、文
字,線分の判別を行っているため、前処理に時間がかか
りすぎるという問題がある。また前述の手法は、帳票の
ようにある一定のフォーマットの決まったもの、あるい
は表のように縦線と横線のみで構成されるような簡単な
図面にしか適用されていなかった。
【0004】本発明は、このような状況のもとでなされ
たもので、前処理の時間が短かくてすみ、複雑な線分を
含む画像からも文字を認識できる装置および方法を提供
することを目的とするものである。
【0005】
【課題を解決するための手段】地図や図面上で文字の検
索を行う場合、線分の情報は不必要であり、文字の位置
とその文字コードのみが必要となる。そのため、地図や
図面から線分を消去し文字部分のみを抽出するほうが効
率が良い。
【0006】この点に着目し、本発明では文字認識装置
を次の(1)〜(6)のとおりに、また文字認識方法を
次の(7)のとおりに構成する。
【0007】(1)2値画像から線分を消去する線分消
去手段と、この線分消去手段で線分を消去した2値画像
から文字領域を抽出する文字領域抽出手段と、この文字
領域抽出手段で抽出した文字領域に対応する、前記線分
消去手段による処理前の画像の領域から文字を認識する
文字認識手段とを備えた文字認識装置。
【0008】(2)線分消去手段は、近傍画素の値に応
じて注目画素の値を1から0に変換する収縮処理を行う
ものである前記(1)記載の文字認識装置。
【0009】(3)2値画像において文字部分を塊化す
る文字部分塊化手段と、この文字部分塊化手段で文字部
分を塊化した2値画像からこの塊化した部分にもとづい
て文字領域を抽出する文字領域抽出手段と、この文字領
域抽出手段で抽出した文字領域に対応する、前記文字部
分塊化手段による処理前の画像の領域から文字を認識す
る文字認識手段とを備えた文字認識装置。
【0010】(4)文字部分塊化手段は、近傍画素の値
に応じて注目画素の値を0から1に変換する膨張処理を
行うものである前記(3)記載の文字認識装置。
【0011】(5)2値画像において、横方向の近傍画
素の値に応じて注目画素の値を0から1に変換する処理
により、文字部分を塊化する横方向膨張手段と、この横
方向膨張手段で処理した2値画像において、縦方向の近
傍画素の値に応じて注目画素の値を1から0に変換する
処理により横方向の線分を消去する縦方向収縮手段と、
この縦方向収縮手段で処理した2値画像において、横方
向の近傍画素の値により注目画素の値を1から0に変換
する処理により縦方向の線分を消去する横方向収縮手段
と、この横方向収縮手段で処理した2値画像における塊
化した部分にもとづいて文字領域を抽出する文字領域抽
出手段と、この文字領域抽出手段で抽出した文字領域に
対応する、前記横方向膨張手段による処理前の画像の領
域から文字を認識する文字認識手段とを備えた文字認識
装置。
【0012】(6)画像を任意角度づつ回転させる画像
回転手段を備え、この画像回転手段で回転させた画像に
ついて所定の処理を行う前記(1)〜前記(5)のいず
れかに記載の文字認識装置。
【0013】(7)2値画像において文字部分を塊化す
る第1のステップと、この第1のステップで処理した2
値画像から線分を消去する第2のステップと、この第2
のステップで処理した2値画像における塊化部分にもと
づいて文字領域を抽出する第3のステップと、この第3
のステップで抽出した文字領域に対応する、前記第1の
ステップによる処理前の画像の領域から文字を認識する
第4のステップとを備えた文字認識方法。
【0014】
【作用】前記(1),(2),(6)の構成により、2
値画像から線分を消去され、この線分が消去された2値
画像から文字領域が抽出され、この文字領域に対応する
元画像の領域から文字が認識される。前記(3),
(4),(6)の構成により、2値画像において、文字
部分が塊化され、この塊化部分にもとづいて文字領域が
抽出され、この抽出された文字領域に対応する元画像の
領域から文字が認識される。前記(5),(6),
(7)の構成により、2値画像において、文字部分が塊
化され、横方向,縦方向線分が消去され、塊化部分から
文字領域が抽出され、この文字領域に対応する元画像の
領域から文字が認識される。
【0015】
【実施例】以下本発明を実施例により詳しく説明する。
【0016】(実施例1)図1は実施例1である“文字
認識装置”の構成を示すブロック図、図2はその動作を
示すフローチャートである。
【0017】図1において、1は画像を読み込むための
画像入力装置であるスキャナ、2はスキャナ1からの画
像データ等の各種データを一時保存するためのRAMで
ある。3は装置全体の制御を行うCPUで、プログラム
メモリ6に記憶された制御プログラムに従って図2に示
す処理を行う。4はRAM2,VRAM7中のデータに
アクセスする際の位置(アドレス)を指定するアドレス
バス、5はアドレスバス4によって指定されたアドレス
のデータの入出力や、スキャナ1からのデータをRAM
2あるいはCPU3に送るためのデータバス、7はVR
AM(Video RAM)であり、表示装置8で表示
されるデータが置かれる。
【0018】図2のフローチャートを参照しながら動作
を説明する。
【0019】まずS1(ステップ1)においてスキャナ
1から画像データを読み込みRAM2に保存する。次に
S2において2値化を行う。S3ではS2において処理
された2値画像の任意の画素fijに対し次の式(1)
に従い横方向の膨張(拡散)処理を行う。なおgijは
処理後の画像における、fijに対応する画素を示す。
【0020】1:fij=1 あるいはfijの左右の
画素のいずれかが1のとき gij= (1) 0:その他 すなわち、任意の画素fijの値が“1”、あるいは任
意の画素fijの左右の画素のいずれかの値が“1”の
とき画素gijの値を“1”とし、その他のときは画素
gijの値を“0”とする。
【0021】この処理により、縦方向の線分の幅が太く
なると同時に、文字列部分を塊にすること(塊化)がで
きる。図3にこのときの様子を示す。
【0022】ここで、この処理を行った際に0から1に
変化する画素数の変化について見てみる。文字部分に注
目すると、はじめは文字を構成する各ストロークについ
て横方向に0から1へ変化する画素が発生する。そして
膨張処理を繰り返していくと図3(c)に示すように、
文字列部分がひとつの塊になり、その後は塊の左右両端
にのみ0から1に変化する画素が発生する。よって膨張
処理を行う回数と、それにより0から1に変化する画素
数の変化は図4のよう、次第に減少しある処理回数以降
は一定になる。このことから0から1に変化する画素数
の変化を調べることにより、膨張処理を行う所要回数が
決定できる。なお、この膨張処理の回数をαとして、R
AM2に保存しておく。
【0023】S4ではS3を行った結果出力された画像
の任意の画素gijに対し、以下の式(2)に従い縦方
向の収縮(縮退)処理を行う。 0:gij=1 あるいはgijの上下いずれかが0の
とき hij= (2) 1:その他 この処理を行うことにより、横方向の線分の幅を細く
し、消去することができる。
【0024】ここで、この処理を行った際に1から0に
変化する画素数の変化について見てみる。はじめは、文
字列が塊になった部分と横方向の線分の上と下の部分が
変化し幅が細くなっていき、縦方向の線分については長
さが短くなる。そして収縮処理を繰り返すうちにまず横
方向の線分が消え、文字列が塊になった部分が残る。こ
のことは、線分のほうが文字の縦方向の幅より細いこと
による。
【0025】このことから、収縮処理を行う回数と、そ
れにより1から0に変化する画素数の変化は図5に示す
ように急減後、漸減するようになる。このときの1から
0に変化する画素数の変化を調べることにより、収縮処
理を行う所要回数が決定できる。なお、この収縮処理の
回数をβとして、RAM2に保存しておく。
【0026】S4の収縮処理を終了した結果の画像にお
いて、文字列領域を示す画素の塊は元画像における文字
列領域よりも縦方向に関して小さくなる。そこでS5に
おいて、S4を行った結果出力された画像の任意の画素
hijに対し、以下の式(3)に従い縦方向の膨張(拡
散)処理をβ(S4において収縮処理を行った回数)回
行うことにより文字列が塊になった部分に対するS4の
影響を補正する。
【0027】1:hij=1 あるいはhijの上下の
画素のいずれかが1のとき mij= (3) 0:その他 次に、S6では、S5を行った結果出力された画像の任
意の画素mijに対し、以下の式(4)に従い横方向の
収縮(縮退)処理を行う。
【0028】0:mij=0 あるいはmijの左右い
ずれかが0のとき nij= (4) 1:その他 この処理を行うことにより、縦方向の線分の幅を細く
し、消去することができる。このとき行われる収縮処理
回数は、S4における収縮回数決定方法と同じ方法で決
定される。ただしこのときの回数γは、S3において横
方向膨張処理を行った回数α回より多くなる。なお、こ
の回数γはRAM2に保存しておく。
【0029】S6の横方向の収縮処理を終了した結果の
画像において、文字列領域を示す画素の塊は元画像にお
ける文字列領域より横方向に関して小さくなる。そこで
S7において、S6を行った結果出力された画像の任意
の画素nijに対し、以下の式(5)に従い横方向の膨
張(拡散)処理を(γ−α)回行うことにより文字列が
塊になった部分に対するS3,S6の影響を補正する。
ここでαはS3での膨張処理回数、γはS6での収縮処
理回数である。
【0030】1:nij=1 あるいはnijの左右の
画素のいずれかが1のとき pij= (5) 0:その他 S8では、S7において出力された画像データから画素
の塊を検出し、それを囲む矩形領域を検出する。
【0031】次に、S9ではS8で検出された領域に対
応する元画像内の矩形領域を抽出し、その矩形領域から
文字認識を行う。これは矩形領域に対し縦方向,横方向
から画素列に沿って黒画素数を数えヒストグラムを生成
し、ヒストグラムの谷の部分を文字間の隙間の部分と判
定し、山の部分を文字部分として判定することにより、
文字認識を行うことができる。
【0032】なお、本実施例では横方向の線分の消去
を、横方向の拡散処理と縦方向の収縮処理の組み合わせ
により行い、縦方向の線分の消去を縦方向の膨張処理と
横方向の収縮処理の組み合わせにより行う場合について
述べたが、4方向の膨張処理と収縮処理を組み合わせる
ことにより斜め方向の線分を同様に消去できる。
【0033】このように、本実施例では、文字,線分を
含む2値画像から線分を消去した後文字領域を抽出し、
この領域に対応する元画像の領域から文字を認識してい
るので、従来例より前処理の時間が短縮でき、また複雑
な線分を含む画像からも文字を認識することができる。
【0034】(実施例2)本実施例は、図1と同様の構
成で図6に示す動作を行うものである。すなわち本実施
例は実施例1のS3において式(1)により行っていた
横方向膨張(拡散)処理を図7,図8に示すように変更
するものである。変更部分について説明する。
【0035】はじめに画像の左端から右方向に処理を行
う(図6,S71)。まず画素値が1かつその右隣の画
素値が0になる点を捜す(S72,S78)。その点を
ipとする(S73)。次に画素値が0でその右隣の画
素値が1になる点を捜し(S74,S79)、その点を
iqとする(S75)。ここでiq−ipの値がある閾
値以下の場合(S76)には0であった点iqの画素値
を1にする(S77)。このような処理を行うことによ
り閾値で設定された距離よりも近接する文字列、あるい
は線分の左側への膨張処理のみが行われる。
【0036】次に画像の右端から左方向に処理を行う
(図8,S81)。画素値が1かつその左隣の画素値が
0になる点を捜す(S82,S89)。その点をipと
する(S83)。次に画素値が0でその左隣の画素値が
1になる点を捜し(S84,S90)、その点をiqと
する(S85)。ここでip−iqの値がある閾値以下
の場合(S86)には0であった点iqの画素値を1に
する(S87)。このような処理を行うことにより、閾
値で設定された距離よりも近接する文字列、あるいは線
分の右側への膨張処理のみが行われる。
【0037】以上のような処理を図6のS23,S24
において行うことにより、閾値が文字列の文字間隔より
大きく他の文字列あるいは線分との距離よりも小さけれ
ば、文字列部分は塊になった場合それ以上横方向に膨張
しなくなる。また近接する文字列あるいは線分との距離
が閾値以上にはなれている縦方向の線分の幅は太くなら
ない。したがって、図6のS27,S28の処理はS2
3,S24の処理に関係なく、S28ではS27と同じ
回数だけで処理すればよい。
【0038】このようにして本実施例により画像中の垂
直,水平方向の線分が消去できる。なお画像を任意角度
ずつ回転させ、それに対し前述した処理を行うことによ
り画像中の任意方向成分の線分を消去することができ
る。このようにして、本実施例において実施例1と同様
の効果を得ることができる。
【0039】(変形)以上の各実施例は、いずれもスキ
ャナで読み込んだ画像を2値化して所要の処理を行うも
のであるが、本発明はこれに限らず、2値画像をライン
入力して所要の処理をする形で実施することができる。
【0040】また、以上の各実施例では、塊化した文字
領域に対応する、領域を抽出する“元画像”として、ス
キャナで読み込んだ画像を想定しているが、本発明はこ
れに限らず、このスキャナで読み込んだ画像を2値化し
た画像あるいはライン入力した2値画像を元画像とする
形で実施することができる。
【0041】また、以上の各実施例は文字を認識するも
のであるが、本発明は文字に限らず各種の符号,シンボ
ルも同様に認識でき、請求項の“文字”はこれらを含む
意味で用いている。
【0042】
【発明の効果】以上説明したように、本発明によれば、
前処理時間が短くてすみ、複雑な線分を含む画像からも
文字を認識できる文字認識装置,文字認識方法を提供す
ることができる。
【図面の簡単な説明】
【図1】 実施例1の構成を示すブロック図
【図2】 実施例1の動作を示すフローチャート
【図3】 膨張処理の説明図
【図4】 横方向膨張処理の処理回数の説明図
【図5】 縦方向収縮処理の処理回数の説明図
【図6】 実施例2の動作を示すフローチャート
【図7】 S23の詳細を示すフローチャート
【図8】 S24の詳細を示すフローチャート
【符号の説明】
1 スキャナ 2 RAM 3 CPU

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 2値画像から線分を消去する線分消去手
    段と、この線分消去手段で線分を消去した2値画像から
    文字領域を抽出する文字領域抽出手段と、この文字領域
    抽出手段で抽出した文字領域に対応する、前記線分消去
    手段による処理前の画像の領域から文字を認識する文字
    認識手段とを備えたことを特徴とする文字認識装置。
  2. 【請求項2】 線分消去手段は、近傍画素の値に応じて
    注目画素の値を1から0に変換する収縮処理を行うもの
    であることを特徴とする請求項1記載の文字認識装置。
  3. 【請求項3】 2値画像において文字部分を塊化する文
    字部分塊化手段と、この文字部分塊化手段で文字部分を
    塊化した2値画像からこの塊化した部分にもとづいて文
    字領域を抽出する文字領域抽出手段と、この文字領域抽
    出手段で抽出した文字領域に対応する、前記文字部分塊
    化手段による処理前の画像の領域から文字を認識する文
    字認識手段とを備えたことを特徴とする文字認識装置。
  4. 【請求項4】 文字部分塊化手段は、近傍画素の値に応
    じて注目画素の値を0から1に変換する膨張処理を行う
    ものであることを特徴とする請求項3記載の文字認識装
    置。
  5. 【請求項5】 2値画像において、横方向の近傍画素の
    値に応じて注目画素の値を0から1に変換する処理によ
    り、文字部分を塊化する横方向膨張手段と、この横方向
    膨張手段で処理した2値画像において、縦方向の近傍画
    素の値に応じて注目画素の値を1から0に変換する処理
    により横方向の線分を消去する縦方向収縮手段と、この
    縦方向収縮手段で処理した2値画像において、横方向の
    近傍画素の値により注目画素の値を1から0に変換する
    処理により縦方向の線分を消去する横方向収縮手段と、
    この横方向収縮手段で処理した2値画像における塊化し
    た部分にもとづいて文字領域を抽出する文字領域抽出手
    段と、この文字領域抽出手段で抽出した文字領域に対応
    する、前記横方向膨張手段による処理前の画像の領域か
    ら文字を認識する文字認識手段とを備えたことを特徴と
    する文字認識装置。
  6. 【請求項6】 画像を任意角度づつ回転させる画像回転
    手段を備え、この画像回転手段で回転させた画像につい
    て所定の処理を行うことを特徴とする請求項1〜請求項
    5のいずれかに記載の文字認識装置。
  7. 【請求項7】 2値画像において文字部分を塊化する第
    1のステップと、この第1のステップで処理した2値画
    像から線分を消去する第2のステップと、この第2のス
    テップで処理した2値画像における塊化部分にもとづい
    て文字領域を抽出する第3のステップと、この第3のス
    テップで抽出した文字領域に対応する、前記第1のステ
    ップによる処理前の画像の領域から文字を認識する第4
    のステップとを備えたことを特徴とする文字認識方法。
JP7042833A 1995-03-02 1995-03-02 文字認識装置および文字認識方法 Withdrawn JPH08241376A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7042833A JPH08241376A (ja) 1995-03-02 1995-03-02 文字認識装置および文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7042833A JPH08241376A (ja) 1995-03-02 1995-03-02 文字認識装置および文字認識方法

Publications (1)

Publication Number Publication Date
JPH08241376A true JPH08241376A (ja) 1996-09-17

Family

ID=12646980

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7042833A Withdrawn JPH08241376A (ja) 1995-03-02 1995-03-02 文字認識装置および文字認識方法

Country Status (1)

Country Link
JP (1) JPH08241376A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014230119A (ja) * 2013-05-23 2014-12-08 大日本印刷株式会社 文書画像の傾き補正装置
JP2019161623A (ja) * 2018-03-16 2019-09-19 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014230119A (ja) * 2013-05-23 2014-12-08 大日本印刷株式会社 文書画像の傾き補正装置
JP2019161623A (ja) * 2018-03-16 2019-09-19 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム

Similar Documents

Publication Publication Date Title
JP3504054B2 (ja) 文書処理装置および文書処理方法
US20070237394A1 (en) Image processor for character recognition
JP2940936B2 (ja) 表領域識別方法
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
JPH0620092A (ja) 文書画像の領域識別方法
JPS6140684A (ja) 輪郭追跡装置
JP3062382B2 (ja) 画像処理装置及び方法
JPH10171922A (ja) 罫線消去装置及び記録媒体
JPH0418351B2 (ja)
JP3215163B2 (ja) 罫線識別方法及び領域識別方法
JPH08241376A (ja) 文字認識装置および文字認識方法
JP2796561B2 (ja) 表形式文書認識方式
Kise et al. Document image segmentation as selection of Voronoi edges
JP3090070B2 (ja) 帳票識別方法及び装置
JP2007295210A (ja) 画像処理装置、画像処理方法、画像処理プログラム、およびこれを記録した記録媒体
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP4731748B2 (ja) 画像処理装置、方法、プログラム及び記憶媒体
JPH05159062A (ja) 文書認識装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3502130B2 (ja) 表認識装置および表認識方法
JP3391987B2 (ja) 帳票認識装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP2002015283A (ja) 分離文字列統合方法および装置
JPH04276888A (ja) 文字読取装置
JPH04130979A (ja) 文字画像切出し方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020507