JP3084833B2 - 特徴抽出装置 - Google Patents

特徴抽出装置

Info

Publication number
JP3084833B2
JP3084833B2 JP03247418A JP24741891A JP3084833B2 JP 3084833 B2 JP3084833 B2 JP 3084833B2 JP 03247418 A JP03247418 A JP 03247418A JP 24741891 A JP24741891 A JP 24741891A JP 3084833 B2 JP3084833 B2 JP 3084833B2
Authority
JP
Japan
Prior art keywords
value
pixel
feature
scanning
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03247418A
Other languages
English (en)
Other versions
JPH0589287A (ja
Inventor
保直 伊崎
東善 ▲はい▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP03247418A priority Critical patent/JP3084833B2/ja
Publication of JPH0589287A publication Critical patent/JPH0589287A/ja
Application granted granted Critical
Publication of JP3084833B2 publication Critical patent/JP3084833B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字または図形(以
下、被認識対象と称する)を認識するために行う被認識
対象の特徴を抽出する特徴抽出装置に関する。
【0002】OCR(光学式文字読み取り装置)の適用
分野が広まるに伴って、文字を記入する書き手が専従の
特定筆記者から各種申込用紙の記入のように申込者本人
のような不特定筆記者へと広がっている。
【0003】このため、筆記者で異なる形状の被認識対
象を高精度で認識するために有効な特徴を抽出すること
が必要になる。
【0004】
【従来の技術】図5は従来例を示す図であり、被認識対
象を文字とする。従来は、図示しない入力手段で読み取
られた入力画像を2値化処理し、生成された2値画像を
2値メモリに格納し、格納された2値画像から一文字分
の画像を切り出し、その切り出された文字画像を水平、
垂直、斜め方向に走査し、“0”から“1”、または、
“1”から“0”への変化点を数えることによって特徴
を抽出していた。
【0005】例えば、“0”から“1”への変化点を特
徴量として数えるとき、図5に示すような2値化された
文字画像の特徴を抽出するための水平方向に走査する際
の一走査Aにおける特徴量は、“0”から“1”への変
化点が2箇所あるので2となる。
【0006】前記のような走査を文字画像を囲む文字枠
内を水平、垂直、斜め方向について行い、各走査におけ
る特徴量を求める。全ての走査で求められた特徴量が切
り出された一文字の特徴となる。
【0007】
【発明が解決しようとする課題】図6は従来の特徴量を
抽出する図であり、同図(a)は手書きによるストロー
クを示す図であり、同図(b)はストロークの2値化処
理後を示す図であり、各格子は画素を表す。
【0008】例えば、図6(a)に示すように、太線で
示される線幅が3画素分の1本の水平なストロークを書
こうとするとき、手書きのためにストロークBは厳密に
は直線とはならないため、ストロークBと背景との境界
部分で画素の値が一定ではなくなる。この画素の値と
は、画素の面積に対する画像の部分の占める割合によっ
て求まる値である。
【0009】このストロークBを2値化処理すると、本
来は2値化処理した際に“1”となるべき画素も、その
画素の値が2値化のために設定された閾値を満たさなけ
れば“0”となるため、図6(b)のストロークB’の
ように背景との境界部分に凹凸が数多く生じる場合があ
る。
【0010】本来は1本の水平なストロークなのでその
ストロークを走査すると、走査C1、C5 での特徴量は
0、走査C2 、C3 、C4 での特徴量は1となるが、手
書きのストロークBを走査すると、走査C1 、C2 、C
3 、C5 での特徴量は1、走査C4 での特徴量は2とな
り、異なった特徴を抽出してしまう。
【0011】特に、粗い画素密度に対して細いストロー
クを書くと、画素の密度と手書きによるストロークの太
さの関係によっては、2値化処理後のストロークが切れ
る場合も生じ、そのストロークの特徴を抽出しても本来
の線を表すものとはならないため、異なった特徴を抽出
してしまう。
【0012】このように、手書きの被認識対象と背景の
境界部分で2値化のための量子化誤差による凹凸が発生
したり、線切れが生じたりすると、各方向に走査を行い
被認識対象の特徴を抽出したとしても、抽出された特徴
は本来の被認識対象を表す特徴と異なったものとなるた
め、走査によって得られた特徴と辞書に格納されている
標準パターンの特徴の照合を行っても正しく認識され
ず、誤った認識がなされたり、認識不能となったりする
ため、認識率が低下する。
【0013】本発明は、被認識対象を認識するために行
う被認識対象の特徴抽出において、画像を構成する画像
の値のばらつきから生じる量子化誤差による余分な特徴
を抽出することを減少させることによって、書き手の癖
などによる被認識対象の変形の多様性を吸収する特徴抽
出装置を提供することを目的とする。
【0014】
【課題を解決するための手段】図1は本発明の原理図で
ある。図中、1は入力画像であり、入力手段によって読
み取られた画像である。
【0015】2は多値メモリであり、入力画像1を多値
画像として格納するものである。3は切り出し部であ
り、多値メモリ2に格納されている多値画像から被認識
対象を切り出すものである。
【0016】4は特徴抽出部であり、切り出し部3によ
って切り出された被認識対象の一走査における特徴量
を、一走査で検出される画素のピーク値を累積した累積
値とし、該累積値を該被認識対象の特徴として抽出す
る。
【0017】
【作用】本発明では、入力手段によって読み取られた入
力画像に2値化処理を行わず、入力画像を多値画像とし
て多値メモリに格納し、格納された多値画像から被認識
対象を切り出し、切り出された多値のままの被認識対象
の特徴を抽出する。
【0018】即ち、多値にすることで、画素値が2階調
から数階調になり、画素値が数階調になることは被認識
対象と背景の境界部分のような画素の値が不安定の部分
をも特徴を抽出する際の一つの情報として加味すること
ができるため、本来の入力画像の画素の値と多値化処理
後の画素の値の差が小さくなり、従来のような2値化処
理によって発生する量子化誤差を減少させることができ
る。
【0019】この量子化誤差が減少すると、従来の2値
化処理することにより発生する量子化誤差のために特徴
抽出の際に考慮されなかった画素も特徴抽出の際に反映
することができ、被認識対象を走査して特徴を抽出する
ときに誤った特徴が抽出されることが減少されるため、
被認識対象の認識精度が高くなる。
【0020】
【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。図2は本発明の実施例である。
【0021】図3は水平方向の走査による特徴量の抽出
を示す図であり、同図(a)は画像メモリに格納されて
いる多値の文字画像を示す図であり、同図(b)は水平
方向の一走査における画素の値を示す図である。
【0022】図4は本発明の特徴抽出部の処理のフロー
チャートである。図2において、例えば、申込用紙から
被認識対象として文字画像を入力手段101によって読
み取り、読み取った文字画像を各画素が多値レベルをも
つ多値画像として多値メモリ102へ格納する。
【0023】この多値メモリ102に格納された多値画
像から切り出し部103が一文字に相当する文字画像を
切り出す。切り出された文字画像は、多値のまま画像メ
モリ104へ格納される。
【0024】特徴抽出部105は、画像メモリ104に
格納された多値の文字画像を多方向から走査し、その文
字画像の特徴を抽出する。図3(a)に示す文字画像を
使用し、図4のフローチャートを用いて水平方向の走査
による特徴量の抽出を以下に示す。
【0025】図3(a)に示すように、画像メモリ10
4に格納された文字画像に対して水平方向にX軸、垂直
方向にY軸の座標軸を設定し、その際のX軸方向の範囲
はX1 からXimax、Y軸方向の範囲はY1 からYjmax
で、それぞれの軸方向の座標の範囲は文字枠の範囲であ
り、imax及びjmaxは文字枠のドット数によって
決まるものである。この例では、文字枠が24×24ド
ットなのでimax、jmaxは共に24となる。ま
た、各格子は画素を表す。
【0026】Y座標Yj での水平走査による特徴量を求
めるには、Y座標をYj で固定してX座標をX1 からX
imaxまで変化させる。このときのX座標Xi 、Y座標Y
j における画素の値はf(Xi ,Yj )と表現し、この
画素の値fは、画素の面積に対する文字画像の部分の占
める割合によって求まり、多値のレベルをどの程度にと
るかによって変化する。
【0027】この例では、多値レベルを6レベルと設定
したので、各画素値は“0”から“5”となり、図3
(a)に示すような各画素の値が求まったものとする。
また、格子に値が書かれていない画素は背景であり、そ
の画素の値は“0”である。
【0028】まず、jを1とし(図4のS1)、Y座標
をY1 に固定する。また、Y1 における特徴量ACCを
0、iを1とし(図4のS2)、注目画素のX座標をX
1 に設定する。
【0029】ここで、iは1からimax、jは1から
jmaxの値をとり、特徴量ACCは一走査における注
目画素の値と走査方向に隣合う注目画素の直前の画素の
値の差が正のときの変化値を累積するものである。
【0030】図3(a)に示すように、注目画素のX座
標をXi 、その注目画素の走査方向に隣合う直前の画素
のX座標をXi-1 とすると、注目画素の座標(Xi ,Y
j )の値とその注目画素の直前の画素の座標(Xi-1 ,
Yj )の値との差DはD=f(Xi ,Yj )─f(Xi-
1 ,Yj )によって求まる(図4のS3)。
【0031】この水平方向の文字画像の走査において、
注目画素のX座標がX1 のときは注目画素の直前の画素
を仮想的に作成し、その仮想的に作成された画素の値を
背景値と設定して2つの座標の画素の値の差Dを求め
る。
【0032】前記によって求められた2つの座標の画素
の値の差Dが正のときのみ(図4のS4)、その差Dを
ACCに加算する(図4のS5)。iに1を加え(図4
のS7)、X座標を変えて次の座標の画素を注目画素と
し現注目画素と前注目画素について前記の処理を行い、
iがimaxまで、すなわち、X座標がXimaxになるま
で行う(図4のS6)。
【0033】注目画素のX座標がX1 からXimaxに達し
たときのACCの値がY座標Yj における一水平走査の
特徴量となる。この一走査によって求められた特徴量A
CCは、特徴メモリ106に格納される。
【0034】例として、図3(a)においてjが11、
すなわち、Y座標がY11における各X座標の画素の値を
図3(b)に示し、そのY座標Y11における水平方向の
走査による特徴量ACCを求める。
【0035】この水平方向の走査によって、注目画素と
走査方向に隣合う注目画素の直前の画素の差が正である
変化点は、(X8 ,Y11)と(X7 ,Y11)、(X9 ,
Y11)と(X8 ,Y11)、(X15,Y11)と(X14,Y
11)、(X16,Y11)と(X15,Y11)であり、それぞ
れの変化値は、4─0=4、5─4=1、3─0=3、
5─3=2となる。
【0036】従って、この走査での特徴量ACCは、4
+1+3+2=10と求まる。一走査による特徴量AC
Cが求められると、jに1を加え(図4のS9)、次の
Y座標の走査に移り、jがjmaxまで(図4のS
8)、すなわち、Y座標がYjmaxになるまで行い、水平
方向の各走査による特徴量を求める。
【0037】水平方向の各走査による特徴量を求める処
理が終わると、垂直方向及び斜め方向についても同様に
行い、それぞれの走査方向に対する各走査の特徴量を求
める。
【0038】各方向の走査によって求められた全特徴量
が切り出された文字画像の特徴として抽出される。この
特徴抽出部105によって抽出された文字画像の特徴
は、特徴メモリ106に格納され、格納された文字画像
の特徴は、辞書108に格納されている予め多数のサン
プルから作られた標準パターンの特徴と照合部107で
距離計算され、距離の小さい順に候補として候補メモリ
109に格納される。
【0039】候補メモリ109に格納された候補に対し
て、オペレータは、確認、修正作業を行う。本実施例で
は、被認識対象を走査し特徴量を求める際に、注目画素
の値と走査方向に隣合う注目画素の直前の画素の値との
差が正のときのみその差を累積し、一走査によって求め
られた累積値をその走査の特徴量としたが、2つの画素
の値の差が負のときのみその差を累積し、その求められ
た累積値を特徴量としてもよい。
【0040】また、一走査における特徴量を、一走査で
検出される画素のピーク値を累積し、その求められた累
積値を特徴量としても同等である。更に、被認識対象が
図形でも本発明によって特徴を抽出することは可能であ
り、その際には図2に示される辞書108を被認識対象
に対応した辞書に交換すればよい。
【0041】
【発明の効果】以上説明したように、本発明によれば被
認識対象と背景との境界部分で発生しやすい量子化誤差
に起因するノイズの影響を受けにくい特徴を抽出するこ
とができ、手書きの文字または図形の認識率の向上に寄
与するところが大きい。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】本発明の実施例を示す図である。
【図3】水平方向の走査による特徴量の抽出を示す図で
あり、同図(a)は画像メモリに格納されている多値の
文字画像を示す図であり、同図(b)は水平方向の一走
査における画素の値を示す図である。
【図4】本発明の特徴抽出部の処理のフローチャートで
ある。
【図5】従来例を示す図である。
【図6】従来の特徴量の抽出を示す図であり、同図
(a)は手書きによるストロークを示す図であり、同図
(b)はストロークの2値化処理後を示す図である。
【符号の説明】
1 入力画像 2 多値メモリ 3 切り出し部 4 特徴抽出部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/46 G06T 7/00 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 多値の被認識対象画像を走査する手段
    と、 一走査における特徴量を注目画素の値と該注目画素と走
    査方向に隣合う画素の値との差が正のときのみ、または
    負のときのみ前記差を累積した累積値とし、全走査によ
    って求められる特徴量を該被認識対象の特徴として抽出
    する手段と、 を有することを特徴とする特徴抽出装置。
JP03247418A 1991-09-26 1991-09-26 特徴抽出装置 Expired - Fee Related JP3084833B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03247418A JP3084833B2 (ja) 1991-09-26 1991-09-26 特徴抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03247418A JP3084833B2 (ja) 1991-09-26 1991-09-26 特徴抽出装置

Publications (2)

Publication Number Publication Date
JPH0589287A JPH0589287A (ja) 1993-04-09
JP3084833B2 true JP3084833B2 (ja) 2000-09-04

Family

ID=17163145

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03247418A Expired - Fee Related JP3084833B2 (ja) 1991-09-26 1991-09-26 特徴抽出装置

Country Status (1)

Country Link
JP (1) JP3084833B2 (ja)

Also Published As

Publication number Publication date
JPH0589287A (ja) 1993-04-09

Similar Documents

Publication Publication Date Title
CN111814722B (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
US5410611A (en) Method for identifying word bounding boxes in text
JP3343864B2 (ja) 語体の分離方法
EP0483391B1 (en) Automatic signature verification
US5539841A (en) Method for comparing image sections to determine similarity therebetween
JP3576570B2 (ja) 比較方法
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
EP0482187A1 (en) Row-by-row segmentation and thresholding for optical character recognition (system and method)
EP0877335B1 (en) Character recognition method, character recognition apparatus
JP3428494B2 (ja) 文字認識装置及びその文字認識方法並びにその制御プログラムを記録した記録媒体
JPH09311905A (ja) 行検出方法および文字認識装置
JP3084833B2 (ja) 特徴抽出装置
JP2868134B2 (ja) 画像処理方法及び装置
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
JP2985935B2 (ja) 手書文字・図形読取装置
JP2002133424A (ja) 文書の傾き角度及び境界の検出方法
JPH07141465A (ja) 文書画像の傾き検出方法
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP3127413B2 (ja) 文字認識装置
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JP2827288B2 (ja) 文字認識装置
JP2708604B2 (ja) 文字認識方法
JP2973892B2 (ja) 文字認識方式

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000606

LAPS Cancellation because of no payment of annual fees