JP2522310B2 - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JP2522310B2
JP2522310B2 JP62165419A JP16541987A JP2522310B2 JP 2522310 B2 JP2522310 B2 JP 2522310B2 JP 62165419 A JP62165419 A JP 62165419A JP 16541987 A JP16541987 A JP 16541987A JP 2522310 B2 JP2522310 B2 JP 2522310B2
Authority
JP
Japan
Prior art keywords
value
data
character
area
distance conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62165419A
Other languages
English (en)
Other versions
JPS6410394A (en
Inventor
俊史 山内
康博 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP62165419A priority Critical patent/JP2522310B2/ja
Publication of JPS6410394A publication Critical patent/JPS6410394A/ja
Application granted granted Critical
Publication of JP2522310B2 publication Critical patent/JP2522310B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は多値レベル濃淡画像の2値化技術に関し、
特にラインプリンタなどで印字されたデータを認識する
光学的文字読取装置に関する。
〔従来の技術〕
従来、この種の光学的文字読取装置は例えば特公昭59
−98284号公報に示すように2値化を行なう際、背景部
の濃淡情報に応じて白黒検出用の3段階の閾値を自動的
に選択し、黒点部にある微少白点,白点部にある微少黒
点を検出する方式である。例えば第9図(a)のライン
プリンタなどで印字された文字データ“0"において斜線
で示す印字濃度がうすい部分が存在する、いわゆる印字
の濃淡のバラツキがある文字データを上記の光学的文字
読取装置で2値化すると、第9図(b)に示すように2
値化データになる。そして、この第9図(b)に示す入
力文字データの破線部Aにおける断面濃度値y(x)を
とると第10図に示すように濃度値が大きくなだらかに変
化するA2に対応する領域L3および濃度値が大きく急激に
変化するA3に対応する領域L4では閾値は追随して2値化
することができる。
〔発明が解決しようとする問題点〕
上述した従来の光学的文字読取方式は第10図に示すよ
うに濃度値が小さくなだらかに変化するA1に対応する領
域L1では閾値は追随できず、2値化を行なつた場合、第
11図に示すように文字イメージをとらえることができな
いうえ、2値化された文字に欠けが生じる。このよう
に、スキヤン領域全体において2値化のための閾値を決
定し、局部的に濃淡レベルが急激に変化した微小点に対
して正確に2値化を行なつているにすぎない。しかも、
2値化された文字に欠けが生じるため誤読するという欠
点がある。
〔問題点を解決するための手段〕
この発明の光学的文字読取装置は、スキヤナから得ら
れた入力文字の多値レベル濃度値データを全スキヤン領
域より求めた全域閾値により2値化した入力文字の2値
レベルデータに対し、距離変換として黒データからなる
各黒画素から黒データの集合で構成された文字の輪郭ま
での最小距離をデータとしてその黒画素に与える距離変
換回路と、入力文字の領域を所望の分割領域に分割し、
それぞれの分割領域毎に各黒画素の多値レベル濃度値デ
ータと距離変換値データの類似度計算を行う類似度計算
回路と、分割領域毎に、類似度計算回路により求めた類
似度の値に基づき全域閾値もしくは分割領域毎に求めた
2値化のための局所領域閾値どちらかを選択し再び2値
化を行う閾値選択回路とを有している。
〔作用〕
この発明は、所望の領域に分割した分割領域毎に、2
値化のための閾値を選択することにより、かすれた部分
のある文字も文字イメージを確実に検出することがで
き、認識性能を向上させることができる。
〔実施例〕
第1図(a)および第1図(b)はこの発明に係る光
学的文字読取装置の一実施例を示すブロツク図である。
同図において、まず本発明の概要について説明する。1
は帳票に書かれた文字データのスキヤン,光電変換およ
びA/D変換を行なうスキヤナー部、2はこのデイジタル
値に変換された文字データを格納し、座標値xiのときの
多値レベル濃度値データy(xi)を出力する多値レベル
濃度値データメモリ、3は帳票データの位置座標を示す
アドレス信号xiを出力するメモリーアドレスレジスタ
(MAR)、4はスキヤンを行なつた全領域において濃度
値の最大値ymaxおよび濃度値の最小値yminを検出するMA
X・MIN検出回路、5は2値化のための閾値(ymax
ymin)/2を求める加算器、6はこの閾値(ymax+ymin
/2と濃度値y(xi)を比較し、y(xi)≧(ymax
ymin)/2のとき画像値z(xi)=1を出力し、y(xi)
<(ymax+ymin)/2のとき画素値z(xi)=0を出力す
る比較器、9は2値画像z(xi)を格納する2値レベル
データメモリ、29は2値画像に対して距離変換処理を行
う距離変換回路、15距離変換回路29において処理された
距離変換値を格納する距離変換値データメモリ、30は多
値レベル濃度値データメモリ2の内容と距離変換値デー
タメモリ15の内容の間の類似度を求めるための類似度計
算回路、31は類似度計算回路で得られた類似度に基づ
き、画像全体から求めた閾値と画像の局部領域から求め
た閾値のいずれかを選択するための閾値選択回路からな
る。
ここで、本発明において用いる距離変換処理につい
て、第2図を用いて説明する。第2図は、2値レベルデ
ータメモリに格納されている2値画像の例で、座標xiを
含む閉曲線によって囲まれている領域が黒領域で、閉曲
線の外側の領域を白領域とする。閉曲線内の各点は、デ
ィジタル画像の離散的な座標を示している。黒領域の座
標xiにおける画素値はz(xi)=1とする。距離変換は
黒領域の座標xiに対して、黒領域と白領域の境界までの
距離を対応づける変換で、境界までの最短距離が、座標
xiを距離変換した値P(xi)である。第2図の例では、
座標値xiから最短距離をとる点は、第2図における7と
xiをむすぶ直線上と境界となる閉曲線との交点になる。
次ぎに、本発明における類似度計算について説明す
る。本発明では、各座標値xiにおける濃度値y(xi)と
距離変換値p(xi)との間の類似度の計算を行う。各座
標値(x1,…,xi,…,xN)に対する濃度値ベクトル(y
(x1),…,y(xi),…,y(xN))、距離変換値ベクト
ルを(p(x1),…,p(xi),…,p(xN))としたと
き、2つのベクトル間の類似度は、 で求められる。類似度rは2つのベクトルのなす角をθ
としたとき、r=cosθを示すものであり、2つのベク
トルの相関が大きいとき1に近い値をとり、相関が小さ
いとき0に近い値をとる。次ぎに距離変換回路29、類似
度計算回路30の構成について詳細に説明する。前述した
距離変換は、第2図において座標xiの8の近傍点の画素
値の累積より求めることができる。第1図(a)におい
て、7は第2図に示すように、あるxiの周辺の8つの近
傍点uj(ただし、j=1〜8)を出力する周辺データ発
生部、8は前記座標xiと8つの近傍点uj(ただし、j=
1〜8)を加算し、xi+ujを出力する加算器、9は2値
化されたデータz(xi)を格納して2値情報z(xi+u
j)を出力する2値レベルデータメモリ、10は加算器、1
1はvj(xj)+z(xi+uj)を出力するレジスタ、12は
このvj(xi)+z(xi+uj)を格納する連結黒点数デー
タメモリである。連結黒点とは、図2に示すように、黒
点のある座標xiから上下左右に加え、右上左上右下左下
の各8方向に連なる黒点を示している。そして、図2の
場合、座標xiの黒点より、右上の第1方向には5画素、
真上の第2方向には2画素、左上の第3方向には1画
素、左の第4方向には2画素、左下の第5方向には4画
素、真下の第6方向には1画素、右下の第7方向には黒
点がないので0画素、右の第8方向には1画素がある。
そして、ある画素xiの各方向vj(j=1,2,・・,8)毎の
上述した画素数を、連結黒点数vj(xi)で表すので、例
えば、上述の場合、連結黒点数v5(xi)=4となる。ま
た、13は座標xiにおける連結黒点数vj(xj)に関し各方
向に対し を算出して出力するMIN検出回路、14は加算器、15は距
離変換値データメモリ、16は所望の局所領域に分割を行
うため、局所領域Lの座標データxLiを発生するための
メモリアドレスレジスタである。メモリアドレスレジス
タ16に与える座標の集合を設定することで、局所領域L
は任意に変更可能であるが、以降の説明では、第3図〜
第11図に示すように、x座標を等間隔に4分割した座標
の集合を与える場合として説明する。例えば、文字全体
のx座標が{1,2,・・・,32}の場合、xL1={1,2,・・
・,8}、xL2={9,10,・・・,16}、xL3={17,18,・・
・,24}、xL4={24,25,・・・,32}である。また、17
は局所領域L内の濃度値の最大値 を求めるMAX・MIN検出回路、18は局所領域L内の2値化
のための閾値 を生成する加算器、19a〜19cはそれぞれ{y
(xLi)}2,p(xLi)y(xLi),および{p(xLi)}
を出力する乗算器、20a〜20cは加算器、21a〜21cはそ
れぞれ を出力するレジスタ、22は前記レジスタ21aの出力 とレジスタ21cの出力 とを乗算し、 を出力する乗算器、24はレジスタ21bの出力 を乗算器22の出力 で除算して類似度r を出力する除算器、25は値rtがセツトされたレジスタ、
26は値rtと類似度rとを比較しr≧rtのとき“1"を出力
し、r<rtとき0を出力する比較器、27はこの比較器28
から“1"が入力したとき全スキヤン領域において求めた
2値化のための閾値yt=(ymax+ymin)/2を選択して出
力する一方、比較器26から“0"が入力したとき局所領域
において求めた2値化のための閾値 を選択して出力する選択器、28は選択された2値化のた
めの閾値ytと多値レベル文字データ濃度値y(xLi)と
を比較し、y(xLi)≧ytのとき2値化データb(xLi
=1,y(xLi)<ytのとき2値化データb(xLi)=0を
出力する比較器である。
なお、29は前記の加算器10,レジスタ11,連結黒点数デ
ータメモリ12,MIN検出回路13,加算器14および距離変換
値データメモリ15から構成され、2値化されたデータに
対して距離変換回路、30は乗算器19a〜19c,加算器20a〜
20c,レジスタ21a〜21c,乗算器22および23,除算器24から
構成され、多値レベル濃度値データy(xLi)と距離変
換値データp(xLi)との類似度rを計算する類似度計
算回路、31はレジスタ25,比較器26,選択器27および比較
器28から構成された閾値選択回路である。また、第1図
(b)において、メモリアドレスレジスタ16から局所領
域L(L1〜L4)の座標データを発生すると、多値レベル
濃度値データ2からその局所領域を示す座標データにお
ける多値レベル濃度値データy(xLi)が出力し、距離
変換値データメモリ15からその局所領域を示す座標デー
タにおける距離変換値データp(xLi)が出力し、加算
器18から局所領域L内の2値化のための閾値 を出力する。
次に、上記構成による光学的文字読取装置の動作につ
いて第2図〜第8図を参照して説明する。まず、スキヤ
ナ部1は図示せぬ帳票に書かれた文字データを読取った
のち、デイジタル値に変換し、このデイジタル値に変換
された文字データDinを座標値xiのときの多値レベル濃
度値データy(xi)として多値レベル濃度値データメモ
リ2に記憶する。そして、MAX MIN検出回路4はスキヤ
ンを行なつた全領域における濃度値の最大値ymaxと最小
値yminを加算器5に出力する。このため、加算器5はこ
の濃度値の最大値ymaxと最小値yminとから2値化のため
の閾値である(ymax+ymin)/2を求めて比較器6に出力
する。したがつて、比較器6はこの閾値(ymax+ymin
/2と濃度値y(xi)と比較し、y(xi)≧(ymax
ymin)/2のときにはz(xi)=1を出力し、y(xi)<
(ymax+ymin)/2のときにはz(xi)=0を出力して2
値化し、この2値化されたデータz(xi)は2値化レベ
ルデータメモリ9に格納される。一方周辺座標データ発
生部7および加算器8はある座標xiの周辺の8近傍点に
対応する座標xi+uj(ただし、j=1〜8)を作成す
る。このため、加算器10およびレジスタ11あある座標xi
の8近傍点xi+uiの2値情報z(xi+ui)を加算し、vj
(xi)+z(xi+ui)を求めて連結黒点数データメモリ
12に格納する。そして、MIN検出回路13は座標xiにおけ
る連結黒点数vj(xi)に関し各方向(j=1〜8)に対
して を求めて距離変換値データメモリ15に格納する。このよ
うにして、多値レベル濃度値データメモリ2には座標値
xiのときの多値レベル濃度値データy(xi)が格納さ
れ、距離変換値データメモリ15には座標xiにおける連結
黒点数vj(xi)に関し、各方向(j=1〜8)における が格納される。すなわち、連結黒点数vj(xi)につい
て、第2図ではv1(xi)=5,v2(xi)=2,v3(xi)=1,
v4(xi)=2,v5(xi)=4,v6(xi)=1,v7(xi)=0と
からなる距離変換値p(xi)は、 となる。そして、第9図に示す入力データの濃度値を閾
値ytに基づいて2値化した第11図に示すデータについて
領域分割すると第3図に示すことができる。そして、こ
の第3図に示す2値化データに対し距離変換値p(x)
を第4図に示すことができ、この各領域分割における濃
度値y(x)を第5図に示すことができる。ここで、y
maxは全スキヤン領域における濃度値y(x)の最大値,
y1maxは局所領域1における濃度値の最大値である。そ
して、類似度計算回路32は多値レベル濃度値データy
(xLi)と距離変換値データp(xLj)との類似度rを計
算することにより、第6図に示すように各領域毎の類似
度rを示すことができる。なお、rtは予め定めた値であ
る。そして、閾値選択回路33は第7図に示すように領域
1では局所領域より求めた2値化のための閾値(y1max
+y1min)/2を選択し、領域2〜4では全スキヤン領域
より求めた2値化のための閾値(ymax+ymin)/2を選択
することにより第8図に示すように領域1におけるイメ
ージを検出することができる。
本発明では、文字にかすれの発生していない領域で
は、濃度値と距離変換値の相関が大きくなるため、大局
的な領域から求めた閾値を選択する。そして、文字のか
すれの発生している領域では、濃度値と距離変換値の相
関が小さくなるため、居所的な領域ら求めた閾値を選択
するようにしている。
両者を選択する理由は、大局的な領域から求めた閾値
は、領域に対する適応性は小さいが安定性が高く、局所
的な領域から求めた閾値は、安定性が低いが適応性に優
れているためである。
なお、上述の説明ではかすれた部分のある文字の検出
について説明したが、これに限定せず、文字のつぶれに
ついても同様に検出できることはもちろんである。
〔発明の効果〕
以上詳細に説明したように、この発明に係る光学的文
字読取装置によれば、局所領域の濃淡データを考慮し類
似度の尺度を用い、2値化のための閾値を選択すること
により、かすれた部分がある文字イメージを検出するこ
とができるので認識性能を向上させることができる効果
がある。
【図面の簡単な説明】
第1図(a)および第1図(b)はこの発明に係る光学
的文字読取装置の一実施例を示すブロツク図、第2図は
第1図(a)および第1図(b)を説明するための連結
黒点数vj(xi)を説明するための図、第3図は領域分割
について説明するための図、第4図は各領域についての
距離変換値を示す図、第5図は各領域における多値レベ
ル濃度値データを示す図、第6図は各領域における距離
変換値と多値レベル濃度値データとの類似度を示す図、
第7図は各領域における2値化のための閾値選択を示す
図、第8図は第7図に示す閾値により入力文字データを
2値化した図、第9図(a)および第9図(b)は入力
データおよび多値レベル入力文字データを示す図、第10
図は入力文字データの破線部Aにおける断面濃度値を示
す図、第11図は濃度値を閾値ytに基づいて2値化した図
である。 1……スキヤナ部、2……多値レベル濃度値データメモ
リ、3……MAR、4……MAX・MIN検出回路、5……加算
器、6……比較器、7……周辺座標データ発生部、8…
…加算器、9……2値レベルデータメモリ、10……加算
器、11……レジスタ、12……連結黒点数データメモリ、
13……MIN検出回路、14……加算器、15……距離変換値
データメモリ、16……メモリアドレスレジスタ、17……
MAX・MIN検出回路、18……加算器、19a〜19c……乗算
器、20a〜20c……加算器、21a〜21c……レジスタ、22…
…乗算器、23……乗算器、24……除算器、25……レジス
タ、26……比較器、27……選択器、28……比較器、29…
…距離変換回路、30……類似度計算回路、31……閾値選
択回路。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】スキヤナから得られた入力文字の多値レベ
    ル濃度値データを全スキヤン領域より求めた全域閾値に
    より2値化した入力文字の2値レベルデータに対し、距
    離変換として黒データからなる各黒画素から黒データの
    集合で構成された文字の輪郭までの最小距離をデータと
    してその黒画素に与える距離変換回路と、 入力文字の領域を所望の分割領域に分割し、それぞれの
    分割領域毎に前記各黒画素の多値レベル濃度値データと
    前記距離変換値データの類似度計算を行う類似度計算回
    路と、 前記分割領域毎に、前記類似度計算回路により求めた類
    似度の値に基づき前記全域閾値もしくは前記分割領域毎
    に求めた2値化のための局所領域閾値どちらかを選択し
    再び2値化を行う閾値選択回路と を備えたことを特徴とする光学的文字読取装置。
JP62165419A 1987-07-03 1987-07-03 光学的文字読取装置 Expired - Lifetime JP2522310B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62165419A JP2522310B2 (ja) 1987-07-03 1987-07-03 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62165419A JP2522310B2 (ja) 1987-07-03 1987-07-03 光学的文字読取装置

Publications (2)

Publication Number Publication Date
JPS6410394A JPS6410394A (en) 1989-01-13
JP2522310B2 true JP2522310B2 (ja) 1996-08-07

Family

ID=15812064

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62165419A Expired - Lifetime JP2522310B2 (ja) 1987-07-03 1987-07-03 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JP2522310B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5325908A (en) * 1992-01-17 1994-07-05 Toyota Jidosha Kabushiki Kaisha Hydraulically operated casting machine for producing a formed product, having mold closing and clamping cylinders

Also Published As

Publication number Publication date
JPS6410394A (en) 1989-01-13

Similar Documents

Publication Publication Date Title
US7016552B2 (en) Image processing device, image processing method, and recording medium storing image processing program
US7292375B2 (en) Method and apparatus for color image processing, and a computer product
EP0803842B1 (en) Binary image forming device
US6393150B1 (en) Region-based image binarization system
US20050190410A1 (en) Methods and apparatus for smoothing text outlines
JP3749282B2 (ja) 画像処理装置
US7151859B2 (en) Method and system for correcting direction or orientation of document image
JPH0725064A (ja) 電子写真プリンタの画像形成装置
JP2522310B2 (ja) 光学的文字読取装置
US4408343A (en) Image enhancement for optical character readers
EP0870276B1 (en) A method for transforming a gray-level image into a black-and-white image
JP2874592B2 (ja) 文字・写真・網点領域を判別する画像処理装置
JPH0818785A (ja) 画像出力装置
JP3358133B2 (ja) 画像処理装置
JP3052464B2 (ja) 多値化データを用いた輪郭点抽出法
JPH04290177A (ja) 多階調画像情報の2値化処理方法
JP3326309B2 (ja) 画像処理装置
JPH05128306A (ja) 文章画像の属性判別方法
JP3036244B2 (ja) 画像信号処理装置
JP2509448B2 (ja) イメ―ジ情報量削減方法
JP2647911B2 (ja) 文字・図形領域抽出方法
JPH1031717A (ja) 画像認識方法
JP3070884B2 (ja) 2値画像識別装置
JPH05282489A (ja) 文章画像の属性判別方法
JPH03125569A (ja) 画像2値化装置