JPH0757048A - 微細文字画像の拡大方法 - Google Patents

微細文字画像の拡大方法

Info

Publication number
JPH0757048A
JPH0757048A JP5204882A JP20488293A JPH0757048A JP H0757048 A JPH0757048 A JP H0757048A JP 5204882 A JP5204882 A JP 5204882A JP 20488293 A JP20488293 A JP 20488293A JP H0757048 A JPH0757048 A JP H0757048A
Authority
JP
Japan
Prior art keywords
image
character
density
value
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5204882A
Other languages
English (en)
Other versions
JP3268542B2 (ja
Inventor
Hideaki Ozawa
英昭 小澤
Toru Nakagawa
透 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP20488293A priority Critical patent/JP3268542B2/ja
Publication of JPH0757048A publication Critical patent/JPH0757048A/ja
Application granted granted Critical
Publication of JP3268542B2 publication Critical patent/JP3268542B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 文字認識装置に必要な画像のサンプリングが
行えないような小さな文字でも読みとる。 【構成】 画像文字を入力し、文字コードを出力する認
識装置において、文字画像を少なくとも3値以上の多値
画像として入力し、定められた領域の画像毎に、各領域
に隣接する領域との間で、画像の濃度の差を求め、周囲
濃度の値が該領域の濃度よりも低い時は、該領域よりも
低い濃度の値を持つ画像領域を、周囲濃度の値が該領域
の濃度より高いときは該領域よりも大きい濃度の値を持
つ画像領域を生成して画像を拡大し、拡大画像の各領域
で濃度の値が、小さい値から大きい値へ変化している部
分では、該部分領域の濃度の値を大きくし、大きい値か
ら小さい値へ変化している部分と濃度の変化が存在しな
い部分では、該部分領域の濃度の値を保存し、文字を構
成する線を強調した画像を文字認識装置へ入力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、紙などの媒体上に表現
された文字の画像を、計算機内部で利用できる文字コー
ド情報に変換する光学式文字認識装置(OCR)に関す
るものである。
【0002】特に、紙に印刷された文字のように、筆順
といった特徴を持たず、文字を画像のみの情報として入
力し、文字コード情報に変換する装置に関するものであ
る。
【0003】
【従来の技術】従来の光学式文字認識装置では、紙など
の上に表現された文字画像を黒い部分と白い部分からな
る2値画像として、一文字当たり数十本から百数十本の
サンプリングを行って入力していた。
【0004】
【発明が解決しようとする課題】しかし、利用者が入力
する文字画像の中には、光学式の文字読みとり装置が対
象とする文字よりも小さい文字が含まれている場合があ
る。従来の文字認識装置では、対象外の小さい文字は十
分なサンプリングが行えないので、読みとることはでき
ないといった問題点があった。
【0005】本発明は、前記問題点を解決するためにな
されたものであり、本発明の目的は、文字認識装置に必
要な画像のサンプリングが行えないような小さな文字で
も読みとることができる微細文字画像の拡大方法を提供
することにある。
【0006】本発明の前記ならびにその他の目的と新規
な特徴は、本明細書の記述及び添付図面によって明らか
にする。
【0007】
【課題を解決するための手段】前記目的を達成するため
に、本発明の(1)の手段は、画像として文字を入力
し、文字コードを出力する文字画像の認識装置におい
て、該装置が対象としている文字画像の大きさよりも、
入力する文字画像が小さい時に、特に、該文字画像を少
なくとも3値以上の多値画像として入力する段階と、あ
らかじめ定められた領域の画像毎に、個々の領域に隣接
する少なくとも1つ以上の領域との間で、画像の濃度の
差を計測する段階と、画像の濃度が変化している場合
に、周囲の濃度の値が該領域の濃度よりも低い方向に対
しては、注目している該領域よりも低い濃度の値を持つ
画像領域を生成し、周囲の濃度の値が該領域よりも高い
方向に対しては該領域よりも大きい濃度の値を持つ画像
領域を生成することにより、濃度の変化の連続性を保ち
ながら画像を拡大する段階と、拡大された画像の各部分
領域で濃度の値が、小さい値から大きい値へ変化してい
る部分では、該部分領域の濃度の値を大きくし、大きい
値から小さい値へ変化している部分と、濃度の変化が存
在しない部分では、該部分領域の濃度の値を保存するこ
とにより、文字画像を構成する線の部分を、線と線の間
の領域と濃度の値の差を大きくする段階を有し、文字認
識装置が対象とする大きさに合わせて、文字を構成する
線を強調した画像を文字認識装置へ入力することを特徴
とする。
【0008】本発明の(2)の手段は、前記(1)の手
段の微細文字画像の拡大方法において、あらかじめ定め
られた領域と、その周囲の領域の濃度の差を用いて、濃
度の変化を保存しつつ拡大した画像に対して、特にあら
かじめ定められた横、もしくは縦の線分を抽出し該横も
しくは縦の線分の画像の濃度を、黒を示す濃度の値にあ
らかじめ定められた値だけ近付くように値を変換する段
階と、その結果横もしくは縦線を強調された画像に対し
て、拡大された画像の各部分領域で濃度の値が、小さい
値から大きい値へ変化している部分では、該部分領域の
濃度の値を大きくし、大きい値から小さい値へ変化して
いる部分と、濃度の変化が存在しない部分では、該部分
領域の濃度の値を保存することで、文字画像を構成する
線の部分を、線と線の間の領域と濃度の値の差を大きく
する段階を有し、縦もしくは横の一方向の線が他の線よ
りも細いような画像に対しても、文字認識装置が対象と
する大きさに合わせて、文字を構成する線を強調した画
像を、文字認識装置へ入力することを特徴とする。
【0009】
【作用】文字認識装置が対象としている文字よりも小さ
い文字の場合には、文字認識装置の一部である画像入力
部では、画像から文字認識装置に必要なサンプリングレ
ートで画像を取り込むことができない。サンプリングレ
ートが不十分な場合には、例えば、画像を単純に2値画
像として入力しようとすると、複数の線が近接すると多
くの箇所で融合が生じてしまう。
【0010】そこで、本発明の(1)の手段によれば、
文字画像を少なくとも3値以上の多値画像として入力す
る手段により、文字画像を構成する線の内、太い線と線
の間の空白も灰色として入力することにより融合を灰色
を用いて排除し、入力された多値画像に対して、あらか
じめ定められた領域の画像毎に、その領域の画像の濃度
と、周囲の画像の濃度を計測する手段により、画像にお
ける濃度の変化を測定する。
【0011】注目する領域と周囲の領域での画像の濃度
が異なっている際に、注目する画像よりも周囲の画像の
方が、濃度の値が小さいとすると、注目する画像よりも
濃度の小さな画像を注目する画像と周囲の画像との間に
生成する手段により、濃度の変化を保存して画像を拡大
できるので、灰色で表現される細い線や空白部分を保存
して、文字認識装置に必要な大きさの文字に拡大するこ
とができる。灰色で表現される部分には、文字を構成す
る線の部分と線と線の間の空白の部分があり、この両者
を分離して線の部分のみを強調することが必要である。
【0012】そこで、例えば、文字の線の様な黒い部分
は、濃度の値が小さい値で表現されるとすると、細い線
を表現する灰色の部分では、線と線の間の空白の部分に
対しては、黒い色を示す小さい値から大きい値へと値が
変化しているので、濃度の値が小さい値から大きい値へ
と変化している区間では、その区間の画像の濃度の値を
大きくする手段により、文字を構成する線と線の間を、
値の大きい白い色に近付けることで、空白部分を白くす
ることが可能となる。逆に線の場合には周囲は薄い灰色
を示す大きな値から、黒に近い小さい値へと変化してい
るので、濃度の値が大きい値から小さい値に変化する区
間では、濃度の値を変更しない処理をする手段により、
線の部分の小さい値は保存して、線から離れると値が大
きくなることで、文字を表す線の部分のみを黒くして、
文字認識装置が対象とする大きさの文字画像を生成でき
る。
【0013】文字を表現する書体の中には、例えば、明
朝体と呼ばれるように、文字を構成する線を縦の線と、
横の線に分類したとすると、横の線が縦の線よりも細い
書体の文字が存在する。このような書体を用いて表現さ
れた文字画像は、例えば、画像を2値画像として単純に
サンプリングしたとすると、微細な文字のために、文字
画像の読みとり装置のサンプリングレートに対して十分
でない細い線は、線として認識されずカスレてしまう場
合がある。
【0014】そこで、本発明の(2)の手段によれば、
文字画像を構成する線の内、縦方向の線と横方向の線の
太さが異なっている場合に、文字画像を少なくとも3値
以上の多値画像として入力する手段と、入力された多値
画像に対して、あらかじめ定められた領域の画像毎に、
その領域の画像の濃度と、周囲の画像の濃度を計測する
手段により、画像における濃度の変化を測定する。注目
する領域と周囲の領域での画像の濃度が異なっている際
に、注目する画像よりも周囲の画像の方が、濃度の値が
小さいとすると、注目する画像よりも濃度の小さい画像
を注目する画像と周囲の画像との間に生成する手段によ
り、濃度の変化を保存して画像を拡大する。
【0015】特に、あらかじめ定められた横もしくは縦
方向の直線を検出する手段により、例えば、明朝体であ
れば、文字を構成する横方向の線のみを取り出すことで
特に強調すべき線を決定し、例えば、文字の線の様な黒
い部分では、濃度の値が小さいとする時に、該横のみの
線の領域における各画素の濃度の値を小さくする手段に
より、細いために灰色で表現される横の線を縦の線と同
等の黒い線に置き換え、文字を構成する縦及び横の線の
太さを均一にする。
【0016】更に、濃度の値が小さい値から大きい値へ
と変化している区間では、その区間の画像の濃度の値を
大きくする手段により、文字を構成する線と線の間を、
値の大きい白い色に近付け、濃度の値が大きい値から小
さい値に変化する区間では、濃度の値を変更しない処理
をする手段により、線の部分の画素が持つ小さい濃度の
値は保存して、線から離れると値が大きくなることで、
文字を表す線の部分のみを黒くして、文字認識装置が対
象とする大きさの文字画像を生成できる。
【0017】
【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。
【0018】なお、実施例を説明するための全図におい
て、同一機能を有するものは同一符号を付け、その繰り
返しの説明は省略する。
【0019】(実施例1)図1は、本発明による微細文
字画像の拡大方法の実施例1を実施する装置の概略構成
を示すブロック図である。
【0020】本実施例1の実施装置は、図1に示すよう
に、利用者から入力された各画素が少なくとも3値以上
の値による多値画像として表現された文字画像を格納す
る入力画像格納部1と、入力された微細な文字画像の文
字を表現する線の部分を黒く強調し、線以外の背景の部
分を白くなるように強調し、さらに画像を大きくする濃
度勾配強調拡大部2と、拡大された画像を文字認識装置
で読みとれるように2値化する2値化画像生成部3と、
生成された文字画像を入力し、文字コードを出力する文
字認識部4と、入力された画像を拡大する際の倍率を決
定する拡大倍率計算部5の大きく5つのモジュールから
構成される。
【0021】前記濃度勾配強調拡大部2の構成は、図2
に示すように、与えられた拡大倍率を、2倍処理と3倍
処理の組合せに変更して、処理順序を決定する処理法決
定部11と、処理法決定部11によって決定された処理
順序にしたがって画像情報の流れを制御する処理法選択
スイッチ12と、3倍の処理を行う3倍処理部13と、
2倍の処理を行う2倍処理部14と、中間結果を格納す
る中間バッファ15の5つのモジュールから構成され
る。
【0022】図3は、本実施例1の微細文字画像の拡大
方法の処理手順を示すフローチャートである。本実施例
1の微細文字画像の拡大方法を図3を用いて説明する。
利用者から入力された微細な文字画像は、入力画像格納
部1に保持される(ステップ21)。次に、入力された
文字画像の文字の存在する部分のみを抽出し(ステップ
22)、その縦、横の大きさ情報を拡大倍率計算部5へ
送る。文字の存在する部分のみは、外周から連続する白
い領域を除去することで、切り出すことができる。
【0023】拡大倍率計算部5では、文字の縦横の大き
さと、文字認識装置における必要な縦横の大きさとの比
から拡大倍率を決定する(ステップ23)。次に、処理
法決定部11において、拡大倍率計算部5から得られた
拡大倍率を2倍と3倍の処理の組合せとして表現し、画
像の処理順序を決定する(ステップ24)。このとき拡
大倍率が、例えば、5倍,7倍のように2倍と3倍の組
合せで表現できない場合には、2倍と3倍の組合せで表
現でき、且つ拡大倍率よりも大きくなる値にする。例え
ば、5倍の時は6倍に、7倍の時は8倍にする。
【0024】処理法決定部11で決定された処理順序を
処理法選択スイッチ12に送り、入力画像の処理の制御
を行う(ステップ25)。例えば、3倍にする場合は、
入力画像を3倍処理部13に送り、画像の縦横を3倍に
して、結果を中間バッファ15に送る。次に、中間バッ
ファ15中のデータを、処理済みの画像として2値化画
像生成部3へ送る。拡大倍率が6倍のように、2倍と3
倍の組合せができている場合には、まず、例えば、3倍
の拡大処理をして中間バッファ15に格納し、次に、2
倍処理部14において、2倍拡大処理をして中間バッフ
ァ15に格納する(ステップ26)。
【0025】次に、濃度勾配強調拡大部2で拡大された
画像が2値化画像生成部3に送られ、2値画像に変換さ
れる(ステップ27)。この時の多値画像から2値画像
への変換法は、例えば、あらかじめ定められた閾値で黒
画素、白画素を決定することで容易に達成できる。2値
化された画像を文字認識部4によって文字コード化する
(ステップ28)。
【0026】2倍処理部14、3倍処理部13の一実施
例としては、注目する画素の値を図4に示すように4画
素、9画素に拡大することにより容易に達成することが
できる。
【0027】2倍処理部14、3倍処理部13の他の一
実施例としては、文字を構成する直線や、点などが特に
黒くなり、線に囲まれた空間や、線と線の間の領域が白
くなるように、注目する画素の周囲に濃度勾配が存在す
る時に、濃度勾配の黒を示す画素の方を黒くし、白を示
す画素の方を白くすることにより、単純に拡大する場合
よりも、線や空白を分離しやすくなる。処理としては、
例えば、文字を構成する線のにじみの様に、線の部分の
黒い色が、空白であるべき部分に湿潤している際には、
図5の5-1に示すような濃度勾配を示す。
【0028】ここでは、例えば、黒色に近い画素の値は
0に近く、白色に近い画素の値は255に近いものとす
る。例えば、3倍処理においては、以下に示すように注
目する画素の周囲の値から、新しく構成される9個の画
素の平均値は注目する画素の値と同じとし、黒い画素に
近い画素は黒く、白に近い画素は白くなるように、拡大
後の個々の画素の値を決定する。
【0029】図4において、現在注目している画素の濃
度をAとし、拡大された際の各画素の濃度を以下の数1
〜数9で決定する。
【0030】
【数1】
【0031】
【数2】
【0032】
【数3】
【0033】
【数4】
【0034】
【数5】
【0035】
【数6】
【0036】
【数7】
【0037】
【数8】
【0038】
【数9】
【0039】A及び、b,c,d,e,f,g,h,i
は、値が定まっているので、
【0040】
【数10】
【0041】となる。これを上記の各数式に代入して、
各画素の値を求める(中心の画素の濃度が決定する)。
【0042】但し、各画素の値は、0〜255の範囲を
逸脱する可能性があるが、ax<0には、0を代入し、
x>255の場合には、255を代入する。また、a0
が0〜255迄の範囲を逸脱する場合には、a1〜a8
値を計算した後、0もしくは255にする。
【0043】2値画像生成部3における一実施例として
は、画像を2値化する際に、線の部分と線と線の間の空
白の部分とを明確に分離するために、多値で表現される
画像に対してエッジの強調の処理を行い、黒い色として
表現される線の部分と、白い部分として表現される線と
線の間の部分との濃度の値の差を大きくすることで、文
字を構成する線の領域のみを黒くすることができる。
【0044】更に、前記2値化画像生成部3におけるエ
ッジの強調の処理としては、拡大された文字画像は、線
と線の間の領域の空白部分から線の部分へ向かって濃度
が濃くなる方向に変化しているので、線の中央部分がも
っとも黒く線と線の間の中央の部分がもっとも白い。そ
こで、例えば、黒を表現する濃度の値を0とし、白を表
現する濃度の値を255とし、灰色の値を、黒に近いほ
ど0に近く、白に近いほど255に近い値として表現す
ると、エッジを強調するための関数として、一般的なグ
ラジエントオペレータを用いれば、図5の5-2に示す
ような応答特性を持つ。
【0045】そこで、図5の5-3に示すように、応答
の値が0よりも大きい場合の値を用い、0よりも小さい
場合には値を0として、図5の5-4の様に各画素の濃
度の値と足し込み、白を示す255よりも大きくなった
場合には値を255にすると、線の部分から、空白部分
へと濃度が黒から白の方向に変化する際には、各画素の
値が白くなり、逆に空白から線の領域に近ずく場合に
は、濃度の値が変化しないので、線の部分のみを細い黒
領域として残すことができる。
【0046】前記2値化画像生成部3での2値化処理
は、例えば、白画素、黒画素となる濃度の各値に対し
て、黒画素となる濃度範囲の値の分散と、白画素となる
濃度範囲の値の分散から、白画素の濃度の範囲と黒画素
の濃度の範囲の閾値と決定する大津のアルゴリズム(参
考文献:N.Otsu,"A Threshold Selection Method from
Gray-Level Histgrams",IEEE Trans on System,Man,and
Cybernetics,Vol.SMC-9,No.1, pp.1322-1326,Dec,197
9)を使用することもできる。大津のアルゴリズムを用い
た場合には、印刷の濃淡などにより、黒画素にすべき範
囲と、白画素にすべき範囲の濃度の値が近接する場合
に、適当な閾値を自動的に設定できる可能性が高くな
る。
【0047】本発明に使用する文字画像のデータは、例
えば、256階調の画像データとして入力できるイメー
ジスキャナなどによって、容易に入手することができ
る。
【0048】(実施例2)図6は、本発明による微細文
字画像の拡大方法の実施例1を実施する装置の概略構成
を示すブロック図である。
【0049】入力される文字画像が日本語の場合におい
ては、多くの場合明朝体と呼ばれる書体が用いられる。
明朝体は、縦線が太く、横線が細いためにイメージスキ
ャナによって読み込んだ場合には、横線がかすれてしま
う可能性が高い。
【0050】そこで、本実施例2の実施装置は、図6に
示すように、濃度勾配強調拡大部において拡大された画
像に対して、横線を検出し、横線の部分を黒く強調する
横線強調部6を、図1の実施装置に付け加える。
【0051】すなわち、利用者から入力された各画素が
少なくとも3値以上の値による多値画像として表現され
た文字画像を格納する入力画像格納部1と、入力された
微細な文字画像の文字を表現する線の部分を黒く強調
し、線以外の背景の部分を白くなるように強調し、さら
に画像を大きくする濃度勾配強調拡大部2と、拡大され
た画像に対して横線の部分を強調し、縦線と同様に2値
化できるようにするための、横線強調部6と、処理済み
の多値画像を文字認識装置で読みとれるように2値化す
る2値化画像生成部3と、生成された文字画像を入力
し、文字コードを出力する文字認識部4と、入力された
画像を拡大する際の倍率を決定する拡大倍率計算部5の
大きく6つのモジュールから構成される。
【0052】前記横線強調部6の構成は、図7に示すよ
うに、入力された文字画像を一時的に格納する入力画像
格納部31と、入力された画像から横線のみを抽出する
横エッジ検出部32と、検出された横エッジを太くする
ためにエッジ画像をぼかす画像平滑部33と、入力され
た画像と、エッジ画像の各画素の値からの差を計算し、
新しい画素の値とする画素演算部34と、演算の結果横
線が太くなった画像から、文字を表現する線の部分と空
白の部分を分離するために、線の部分を強調するための
エッジ強調部35の大きく5つのモジュールから構成さ
れる。
【0053】図8は、本実施例2の微細文字画像の拡大
方法の処理手順を示すフローチャートである。本実施例
2の微細文字画像の拡大方法を図8を用いて説明する。
利用者から入力された微細な文字画像は、入力画像格納
部1に保持される(ステップ41)。濃度勾配強調拡大
部2と拡大倍率計算部5において、入力された画像の拡
大を行う(ステップ42)。このステップ42の処理
は、図2におけるステップ22からステップ26と同様
であり、容易に類推できるので省略する。拡大された画
像は、入力画像格納部31に格納する。
【0054】次に、ステップ43では、入力された文字
画像の横方行の線分を濃くするために、横エッジ検出部
32において、例えば、
【0055】
【数11】
【0056】というオペレータを用いて、横方向のエッ
ジ画像のみを抽出する。例えば黒色を示す値を0とし
て、白色を示す値を255として、黒に近い灰色を0に
近い値とし、白に近い灰色を255に近い値として表現
する場合、上記のエッジ検出のオペレータを用いると、
図9における9-2のように、横方向の線分の近傍で
は、濃度の値が大きく変動して絶対値を取ると、9-3
の様に線分の近傍では画素の値が大きくなり、それ以外
の領域の画素の値は、小さな値となる。
【0057】更に、画像平滑部33において、図9の9
-4のようにエッジ画像を平滑化し線の領域における濃
度勾配に凹凸を小さくする(ステップ44)。平滑化の
手法としては、例えば、注目する画素とその周囲の8近
傍の画素の濃度の値の平均値を取ることにより容易に達
成できる。
【0058】次に、ステップ45では、横方向のエッジ
画像のエッジの領域の値は255に近い値をしており、
エッジ画像以外の領域は0に近い値をしているので、入
力された文字画像の各画素に対して各画素の値からエッ
ジ画像の各画素の値を引き算する。この結果縦の線より
も細いために、各画素の濃度の値が白に近い横方向の線
の領域の各画素の値は、エッジ画像では大きな値をとる
ために、各画素の濃度の減算の結果、値が小さくなり、
図9の9-5に示すように黒い色を示す濃度の値に近づ
き、理想的な線の領域における濃度の値の変化とほぼ等
しくなる。
【0059】次に、横方向の線の濃度を濃くすること
で、縦横の線の各画素の濃度の値がほぼ均等になった画
像に対して、線の部分のみを黒くし、線と線の間の部分
は白くなるように、エッジの強調の処理を行う(ステッ
プ46)。
【0060】次に、文字の線の部分が強調された画像に
対し、2値化画像生成部3において、文字認識装置が読
みとれる白黒2値の文字画像を生成する(ステップ4
7)。このスフップ47の処理は、図3におけるステッ
プ27と同一であり、容易に類推できるので省略する。
前記2値化された画像を文字認識部4によって文字コー
ド化する(ステップ48)。
【0061】横方向の線の太さが縦方向の線の太さより
も細いような文字画像は、例えば明朝体と呼ばれる書体
があり、新聞や雑誌などの一般的な印刷文書において多
数存在する。
【0062】前記本実施例1,2の具体的な評価として
は、例えば、一つの文字の画像を縦横それぞれ64本〜
128本のサンプリングレートで文字認識を行う文字認
識装置において、本発明の方式と従来の単純な画像の拡
大方式により微細な文字画像を読みとった際の結果を示
す。
【0063】この評価条件については以下のとおりであ
る。
【0064】(1)文字のサンプリングレート 一文字当たり20本から24本のサンプリングレートで
入力した。対象は、新聞の縮刷版の文字であり、その新
聞の縮刷版の文字一文字の大きさは、約1.5mm角、
スキャナの読みとり精度は16本/mmとした。
【0065】(2)濃度の階調 0〜255までの256階調とした。
【0066】(3)入力した文字列の数 142個(4つのグループに分かれている)とし、総文
字数1725文字とした。
【0067】この評価条件で以下の実験1及び実験2を
行った。
【0068】実験1:多値画像として単純に拡大して、
大津の手法により2値化し、OCR装置で読みとる。
【0069】実験2:本発明の手法により、拡大して2
値化し、実験1と同一のOCR装置で読みとる。
【0070】前記実験1及び実験2の結果を表1に示
す。
【0071】表1においては、個々の文字列の中で、5
割以上の文字がOCR装置によって読みとれた場合の数
を、全体の文字列数に対する割合を、読み取り率として
評価した。
【0072】
【表1】
【0073】本実施例1,2の手法によれば、表1に示
した結果のように、OCRで対象としていないような微
細な文字画像も、従来の単純な拡大法に比べて高精度で
読みとることができる。
【0074】以上、本発明者によってなされた発明を、
前記実施例に基づき具体的に説明したが、本発明は、前
記実施例に限定されるものではなく、その要旨を逸脱し
ない範囲において種々変更可能であることは勿論であ
る。
【0075】
【発明の効果】以上、説明したように、本発明によれ
ば、文字認識装置の一部である画像入力装置では対象と
していないような微細な文字画像に対して、画像を少な
くとも3値以上の多値画像として入力することにより、
文字を構成する線と線の間の空白領域に対し、線の部分
から空白領域への濃度勾配に対して、濃度の値の大きい
部分の値を大きくし、濃度の値の小さい部分を小さく
し、線の部分と空白の部分の濃度の差を大きくなるよう
に拡大し、線の部分と空白の部分とを的確に分離するの
で、文字認識装置に必要となる文字の大きさを持ち、文
字を構成する線分を黒くし、線分間を白くすることがで
きる。
【0076】また、文字認識装置の一部である画像入力
装置では対象としていないような微細な文字画像の内、
特に、例えば、明朝体のように横方向の線分の太さが細
い等の特定の方向の線分が細いといった特徴を持つ画像
である場合、文字の拡大を行う際に、細い線分の方向に
対してエッジ画像を抽出し、抽出されたエッジの部分の
みの画像の濃度の値を小さくすることにより、細い線分
を太くし、細い線分の方向、太い線分の方向に対して、
均等に線分の画像を拡大することができる。
【図面の簡単な説明】
【図1】 本発明による微細文字画像の拡大方法の実施
例1を実施する装置の概略構成を示すブロック図、
【図2】 本実施例1の濃度勾配強調拡大部の概略構成
を示すブロック図、
【図3】 本実施例1の微細文字画像の拡大方法の処理
手順を示すフローチャート、
【図4】 本実施例1の濃度勾配強調拡大部での画像拡
大法を説明するための概念図、
【図5】 本実施例1の濃度勾配強調拡大部での拡大画
像の各画素の濃度を決定するための濃度決定演算結果及
び文字を構成する線のみを強調するエッジ強調演算結果
を示す図、
【図6】 本発明による微細文字画像の拡大方法の実施
例2を実施する装置の概略構成を示すブロック図、
【図7】 本実施例2の横方向の線の強調部の概略構成
を示すブロック図、
【図8】 本実施例2の微細文字画像の拡大方法の処理
手順を示すフローチャート、
【図9】 本実施例2における背景色に近い濃度を持つ
線の画像を協調する細い線の協調演算の結果を示す図。
【符号の説明】
1…入力画像格納部、2…濃度勾配強調拡大部、3…2
値化画像生成部、4…文字認識部、5…拡大倍率計算
部、6…横線強調部、11…処理法決定部、12…処理
法選択スイッチ、13…3倍処理部、14…2倍処理
部、15…中間バッファ、31…入力画像格納部、32
…横エッジ検出部、33…画像平滑部、34…画素演算
部、35…エッジ強調部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 画像として文字を入力し、文字コードを
    出力する文字画像の認識装置において、該装置が対象と
    している文字画像の大きさよりも、入力する文字画像が
    小さい時に、特に、該文字画像を少なくとも3値以上の
    多値画像として入力する段階と、あらかじめ定められた
    領域の画像毎に、個々の領域に隣接する少なくとも1つ
    以上の領域との間で、画像の濃度の差を計測する段階
    と、画像の濃度が変化している場合に、周囲の濃度の値
    が該領域の濃度よりも低い方向に対しては、注目してい
    る該領域よりも低い濃度の値を持つ画像領域を生成し、
    周囲の濃度の値が該領域よりも高い方向に対しては該領
    域よりも大きい濃度の値を持つ画像領域を生成すること
    により、濃度の変化の連続性を保ちながら画像を拡大す
    る段階と、拡大された画像の各部分領域で濃度の値が、
    小さい値から大きい値へ変化している部分では、該部分
    領域の濃度の値を大きくし、大きい値から小さい値へ変
    化している部分と、濃度の変化が存在しない部分では、
    該部分領域の濃度の値を保存することにより、文字画像
    を構成する線の部分を、線と線の間の領域と濃度の値の
    差を大きくする段階を有し、文字認識装置が対象とする
    大きさに合わせて、文字を構成する線を強調した画像を
    文字認識装置へ入力することを特徴とする微細文字画像
    の拡大方法。
  2. 【請求項2】 前記請求項(1)の微細文字画像の拡大
    方法において、あらかじめ定められた領域と、その周囲
    の領域の濃度の差を用いて、濃度の変化を保存しつつ拡
    大した画像に対して、特にあらかじめ定められた横もし
    くは縦の線分を抽出し該横もしくは縦の線分の画像の濃
    度を、黒を示す濃度の値にあらかじめ定められた値だけ
    近付くように値を変換する段階と、その結果横線もしく
    は縦線を強調された画像に対して、拡大された画像の各
    部分領域で濃度の値が、小さい値から大きい値へ変化し
    ている部分では、該部分領域の濃度の値を大きくし、大
    きい値から小さい値へ変化している部分と、濃度の変化
    が存在しない部分では、該部分領域の濃度の値を保存す
    ることで、文字画像を構成する線の部分を、線と線の間
    の領域と濃度の値の差を大きくする段階を有し、縦もし
    くは横の一方向の線が他の線よりも細いような画像に対
    しても、文字認識装置が対象とする大きさに合わせて、
    文字を構成する線を強調した画像を、文字認識装置へ入
    力することを特徴とする微細文字画像の拡大方法。
JP20488293A 1993-08-19 1993-08-19 微細文字画像の拡大方法 Expired - Fee Related JP3268542B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20488293A JP3268542B2 (ja) 1993-08-19 1993-08-19 微細文字画像の拡大方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20488293A JP3268542B2 (ja) 1993-08-19 1993-08-19 微細文字画像の拡大方法

Publications (2)

Publication Number Publication Date
JPH0757048A true JPH0757048A (ja) 1995-03-03
JP3268542B2 JP3268542B2 (ja) 2002-03-25

Family

ID=16497965

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20488293A Expired - Fee Related JP3268542B2 (ja) 1993-08-19 1993-08-19 微細文字画像の拡大方法

Country Status (1)

Country Link
JP (1) JP3268542B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001195571A (ja) * 2000-01-14 2001-07-19 Sony Corp 画像処理装置および方法、並びに記録媒体
JP2001283218A (ja) * 2000-03-31 2001-10-12 Nagoya Electric Works Co Ltd 混雑状況判定方法およびその装置
JP2011180747A (ja) * 2010-02-26 2011-09-15 Toshiba Corp コピー帳票のための伸縮補正読取機能

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001195571A (ja) * 2000-01-14 2001-07-19 Sony Corp 画像処理装置および方法、並びに記録媒体
JP2001283218A (ja) * 2000-03-31 2001-10-12 Nagoya Electric Works Co Ltd 混雑状況判定方法およびその装置
JP2011180747A (ja) * 2010-02-26 2011-09-15 Toshiba Corp コピー帳票のための伸縮補正読取機能

Also Published As

Publication number Publication date
JP3268542B2 (ja) 2002-03-25

Similar Documents

Publication Publication Date Title
US7054485B2 (en) Image processing method, apparatus and system
US6944341B2 (en) Loose gray-scale template matching for image processing of anti-aliased lines
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US6160913A (en) Method and apparatus for digital halftone dots detection and removal in business documents
JPH05314315A (ja) 光学文字認識用画像データ処理方法
JP2000132690A (ja) ト―クン化によるイメ―ジ分割を用いたイメ―ジ処理方法および装置
JP4077919B2 (ja) 画像処理方法及び装置及びその記憶媒体
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP3268542B2 (ja) 微細文字画像の拡大方法
JPH06168359A (ja) ピクセル重み付けによるテンプレートライブラリの強調方法
US7508987B2 (en) Method, apparatus, system, and program for image processing capable of recognizing, reproducing, and enhancing an image, and a medium storing the program
JP2700131B2 (ja) パターン認識方法
US20060233452A1 (en) Text enhancement methodology in scanned images of gray-scale documents
JP3955467B2 (ja) 画像処理プログラム及び画像処理装置
JPH09511598A (ja) ピクセル・データをバイナリー化するための方法と装置
JP2006277150A (ja) 画像分離装置、画像分離方法およびプログラム
JP2747136B2 (ja) 文字認識装置
JP3277977B2 (ja) 文字認識方法
JP2001197308A (ja) 2値化閾値算出方法および装置
JPH06274691A (ja) 文字認識装置
CN111476243A (zh) 影像文字识别方法及装置
JP4080973B2 (ja) 画像出力装置、画像出力プログラムおよびこのプログラムが記録された記録媒体
CN112785508A (zh) 一种电子文档图片去噪的方法和装置
JPH04343193A (ja) 2値化閾値設定方法
JPH09167228A (ja) 画像変換方法及び装置、並びに、それらを利用した画像整形方法及び装置、並びに、それらを利用したシステム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090118

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090118

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100118

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110118

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees