JPH06215139A - 図形認識方法 - Google Patents

図形認識方法

Info

Publication number
JPH06215139A
JPH06215139A JP5004148A JP414893A JPH06215139A JP H06215139 A JPH06215139 A JP H06215139A JP 5004148 A JP5004148 A JP 5004148A JP 414893 A JP414893 A JP 414893A JP H06215139 A JPH06215139 A JP H06215139A
Authority
JP
Japan
Prior art keywords
matching distance
character
specific
distance distribution
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5004148A
Other languages
English (en)
Inventor
Yoshihisa Otsuka
喜久 大塚
Makiyuki Nakayama
万希志 中山
Toshinori Tsubomoto
利紀 坪本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP5004148A priority Critical patent/JPH06215139A/ja
Publication of JPH06215139A publication Critical patent/JPH06215139A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 文字等の特定図形がその他の図形と混在し,
かつ近接している場合でも正しく特定図形を切り出して
効率的に図形認識を行いうる図形認識方法。 【構成】 この方法は,図形認識を行うに際し,切り出
し対象となる特定図形3の種類毎に用意したサンプル4
を用いて2値画像2の全ての位置でパタンマッチングを
行うことにより特定図形3の種類毎にマッチング距離の
分布を表すマッチング距離分布図5を作成し,この全域
に亙りマッチング距離の分布の強度度合を変化させるこ
とにより強度マッチング距離分布図6を作成し,これに
対してしきい値処理をすることにより特定図形3を切り
出すように構成されている。上記構成により特定図形が
その他の図形と混在し,かつ近接している場合でも正し
く特定図形を切り出して効率的に図形認識を行うことが
できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は図形認識方法に係り,例
えば文字等の特定図形とその他の図形とが混在している
画像や文章フォーマットの異なる画像からでも特定図形
を効率的に切り出しできる図形認識方法に関するもので
ある。
【0002】
【従来の技術】近年のコンピュータの発達に伴い,文字
認識装置がOAやFAの分野で利用されるようになって
きた。図2はこのような文字認識装置等に用いられる一
般的な図形認識方法の全体フローを示すブロック図,図
11は文字列を容易に切り出せる画像の一例を示す説明
図,図12は文字と図形とが混在する画像の一例を示す
説明図である。図2に示す如く,従来の図形認識方法に
よる処理は前処理と識別処理とに大別される。この内,
前処理では先ず入力画像1を2値化し(S1),2値画
像2から特定図形である文字3だけを切り出す(S
2)。次に,正規化処理で切り出した文字3の大きさを
一定にそろえ,それを文字画像枠の所定の位置に配置す
る(S3)。そして,識別処理ではこの前処理をほどこ
した文字画像3′から特徴を抽出し(S4),それを用
いてその文字の種類を判定する(S5)。効率のよい識
別のためには,認識対象となる文字3の位置を的確に推
定し,2値画像2から文字3を正しく切り出す必要があ
る。このため,いままでに多くの切り出し手法が開発さ
れてきた。例えば,図11の文章のように文字列(点線
で囲まれている部分)を容易に切り出せる場合には,文
字幅の情報等を利用して文字列から文字を効率よく切り
出す手法(以下手法と記す。特開平2−255996
号,特開平4−109381号)が,また図12のよう
に図形と文字とが混在する場合には,ホップフィールド
型ニューラルネットワークを利用して文字の位置を推定
する手法(以下,手法と記す。特開平3−16368
4号)がそれぞれ公知である。
【0003】
【発明が解決しようとする課題】上記従来の図形認識方
法の切り出し処理に用いられる手法,では以下の問
題点があった。手法は文字列を容易に切り出せる2値
画像(図11)に対しては有効な文字切り出し手法であ
る。しかし,文字と図形とが混在する2値画像(図1
2)の場合,文字幅の情報等だけでは文字によっては図
形との違いが明確でないものがあるため文字だけの切り
出しが困難となる。従って,効率的な文字切り出しは困
難である。一方,手法を用いると手法で文字切り出
しが困難である図12の2値画像から文字の位置を効率
よく推定できる。しかし,図11のように文字が接近し
て存在する場合,個々の文字として認識されないことが
あり,このためそれらの文字の位置を正しく推定するこ
とは困難である。即ち,従来はいずれの手法を用い
ても,文字等の特定図形がその他の図形と混在してお
り,かつそれらが接近しているような2値画像からは正
しく特定図形を切り出すことが困難であった。本発明は
このような従来の技術における課題を解決するために図
形認識方法を改良し,文字等の特定図形がその他の図形
と混在し,かつ接近している場合でも正しく特定図形を
切り出して効率的に図形認識を行いうる図形認識方法の
提供を目的とするものである。
【0004】
【課題を解決するための手段】上記目的を達成するため
に本発明は,図形を含む入力画像を2値化した2値画像
から特定図形を切り出して図形認識を行う図形認識方法
において,切り出し対象となる特定図形の種類毎に用意
したサンプルを用いて上記2値画像の全ての位置でパタ
ンマッチングを行うことにより上記特定図形の種類毎に
マッチング距離の分布を表すマッチング距離分布図を作
成し,上記作成されたマッチング距離分布図の全域に亙
り上記マッチング距離の分布の強調度合を変化させるこ
とにより強調マッチング距離分布図を作成し,上記作成
された強調マッチング距離分布図に対してしきい値処理
をすることにより上記特定図形を切り出すことを特徴と
する図形認識方法として構成されている。更には,上記
マッチング距離の分布の強調度合の変化の調整が,上記
サンプルの大きさ毎に用意されたフィルタにより上記マ
ッチング距離分布図をフィルタリング処理することによ
り行われることを特徴とする図形認識方法である。
【0005】
【作用】本発明によれば,図形を含む入力画像を2値化
した2値画像から特定図形を切り出して図形認識を行う
に際し,切り出し対象となる特定図形の種類毎に用意し
たサンプルを用いて上記2値画像の全ての位置でパタン
マッチングを行うことにより上記特定図形の種類毎にマ
ッチング距離の分布を表すマッチング距離分布図が作成
される。上記作成されたマッチング距離分布図の全域に
亙り上記マッチング距離の分布の強調度合を変化させる
ことにより強調マッチング距離分布図が作成される。上
記作成された強調マッチング距離分布図に対してしきい
値処理をすることにより上記特定図形が切り出される。
従って,特定図形がその他の図形と混在しかつそれらが
接近している場合でも特定図形のみが強調されるため正
しく特定図形を切り出して効率的に図形認識を行うこと
ができる。更に,上記マッチング距離の分布の強調度合
の変化の調整が,上記サンプルの大きさ毎に用意された
フィルタにより上記マッチング距離分布図をフィルタリ
ング処理することにより行われる。上記マッチング距離
はよく知られているように切り出し対象となる特定図形
とそのサンプルとが一致するところで最小となり,また
サンプルの大きさだけ離れたときに最大となる特性を有
するため,この特性を強調するようにサンプルの大きさ
内で重みを変化させるフィルタを用いて特定図形のみを
強調させることができる。従って,切り出し対象に見合
ったフィルタを用いることにより一層効率的に特定図形
を切り出して図形認識を行うことができる。
【0006】
【実施例】以下,添付図面を参照して本発明を具体化し
た実施例につき説明し,本発明の理解に供する。尚,以
下の実施例は本発明を具体化した一例であって,本発明
の技術的範囲を限定する性格のものではない。ここに,
図1は本発明の一実施例に係る図形認識方法の切り出し
処理部分のフローを示すブロック図,図2は一般的な図
形認識方法の全体フローを示すブロック図(従来例と共
用),図3は2値画像の一例を示す説明図,図4は各文
字種のサンプル例を示す説明図,図5はマッチング距離
分布図(a),(b),図6は文字幅を基にして作成し
たフィルタの説明図,図7は強調マッチング距離分布
図,図8は文字の切り出し位置を示す説明図,図9はし
きい値決定方法を示す説明図(a),(b),図10は
文字の切り出し結果を示す説明図(a),(b)であ
る。図2に示す如く,本実施例に係る図形認識方法の切
り出し処理を含む全体フローは2値化処理(S1),切
り出し処理(S2)及び正規化処理(S3)からなる前
処理と,特徴抽出処理(S4)及び判別処理(S5)か
らなる識別処理とから構成されており,図形を含む入力
画像1を2値化した2値画像2から文字等の特定図形3
を切り出して図形認識を行う点で従来例と同様である。
しかし,本実施例では図1に示すように切り出し対象と
なる特定図形3の種類毎に用意したサンプル4を用いて
2値画像2の全ての位置でパタンマッチングを行うこと
により特定図形3の種類毎にマッチング距離分布図5を
作成し(S21),作成されたマッチング距離分布図5
の全域に亙りマッチング距離の分布の強調度合を変化さ
せることにより強調マッチング距離分布図6を作成し
(S22),作成された強調マッチング距離分布図6に
対してしきい値処理をすることにより特定図形3を切り
出す(S23)ように構成されている点で従来例と異な
る。更に,マッチング距離の分布の強調度合の変化の調
整が,サンプル4の大きさ毎に用意されたフィルタ7に
よりマッチング距離分布図5をフィルタリング処理する
ことにより行われるように構成されている点でも従来例
と異なる。
【0007】以下,図1,図2に示すこの方法の切り出
し処理(S2)を用いて図3に示すような2値画像2か
ら特定図形3として文字(数字“3”)を切り出す場合
を例にとって上記ステップS21,S22,…の順に説
明する。但し,その他の処理(S1,S3〜S5)につ
いては従来例と同様であり,既述の通りであるのでその
詳細説明は省略する。まず,従来例と同様に入力画像1
を2値化し(S1),切り出し対象となる文字3の切り
出し処理に入る(S2)。本実施例ではこれらの処理に
先立って切り出し対象となる文字3の種類毎にサンプル
4を予め用意しておくものとする。各サンプル4は文字
3の外接長方形と同じ大きさとする(図4参照)。ただ
し,各サンプル4のサイズが異なっていてもかまわな
い。そして,切り出し処理では,まず各サンプル4を用
いて認識対象とする2値画像2上の全ての位置でパタン
マッチングを行う。そのようにして各文字3の種類毎に
マッチング距離分布図5を作成する(S21)。図5
(a),(b)はそれぞれ図3に対する“3”と“5”
のマッチング距離分布図5である。図3は“3”を含ん
でいるため図5(a)の“3”の中心位置近辺に小さな
マッチング距離からなる領域が明確に存在する。即ち,
ここで用いられるマッチング距離はよく知られているよ
うに切り出し対象となる文字(ここでは数字“3”)と
そのサンプルとが一致するところで最小となり,またサ
ンプルの文字幅だけ離れたところで最大となる特性を有
することから,図5(a)では“3”の中心位置近辺に
は小さなマッチング距離からなる領域が,その周辺(中
心よりサンプルの文字幅ほど離れた領域)には大きなマ
ッチング距離からなる領域が現れる。それに対して,図
3には“5”が含まれていないので図5(b)には小さ
なマッチング距離からなる領域が明確に認められない。
そこで図6に示すようなサンプル4の文字幅をもとに作
成されたフィルタ7で各マッチング距離分布図5をフィ
ルタリング処理することにより文字3の位置を強調する
(S22)。このフィルタ7は,サンプル4の文字幅の
間でマッチング距離を強調する重みを変化させるもので
あり,例えば図6に示すようにフィルタ7の中心で重み
を最大(+1.5),中心から文字幅だけ離れたところ
で重みを最小(−1.0)とするものである。従って,
このようなフィルタ7をマッチング距離分布図5の全域
にかけたときフィルタ7の中心と文字3の中心とが一致
したところでマッチング距離はフィルタ7の重み分だけ
強調され,逆にフィルタ7の中心と文字3の中心とが文
字幅だけ離れたところでマッチング距離はフィルタ7の
重み分だけ減じられることになる。図7に示す強調マッ
チング距離分布図6は図5(a)に示すマッチング距離
分布図5に図6のフィルタ7をかけたものである。これ
により,“3”の中心位置の小さなマッチング距離から
なる領域はより明確に現れる。
【0008】次に,強調マッチング距離分布図6におい
て各文字3の種類毎に設定したしきい値以下のマッチン
グ距離を持つ領域を探査し,その領域の重心を文字の中
心位置とする。そして,文字3の中心位置をもとに文字
領域を切り出す(S23)。図8には図7の強調マッチ
ング距離分布図6においてしきい値以下のマッチング距
離からなる領域を示しており,その領域の重心を文字3
の中心距離と推定する。文字3の中心をもとに点線で描
かれた矩形で文字3を切り出す。この矩形のサイズをこ
こではサンプルのサイズの1割り増しとしている。ここ
で,しきい値決定法の一例を紹介する。図9(a)に示
すようなしきい値決定用の2値画像2を各文字3の種類
毎に用意する。図9(a)に対し,各文字3の種類毎に
強調マッチング距離分布図6を作成する。図9(b)に
は図9(a)に対する“7”の強調マッチング距離分布
図6を示す。文字3の中心位置を(x0 ,y0 ),位置
(x,y)での強調マッチング距離をV(x,y)とす
ると,“7”に対するしきい値Th7 は次の(1)式に
従って設定することができる。
【数1】 ただし,i=x0 −1,x0 ,x0 +1 j=y0 −1,y0 ,y0 +1 同様に他の文字種についてもしきい値を設定する。な
お,しきい値決定の際に使用する画像を各文字3の種類
毎に複数個用意し,その平均値をしきい値としてもよ
い。以上説明したような方法を用いて,図10(a)に
示すような2値画像2から文字3の切り出しを行った結
果を図10(b)に示す。図10(b)により文字3と
図形とが混在しかつ近接している場合でも正しく文字の
切り出しが行われることがわかる。このようにして正し
く切り出された文字3をこの後従来例と同様に正規化し
(S3),特徴を抽出し(S4),判別する(S5)こ
とにより効率的な図形認識を行うことができる。その結
果,文字等の特定図形がその他の図形と混在しかつ接近
している場合でも正しく特定図形を切り出して効率的な
図形認識を行い得る図形認識方法を得ることができる。
尚,上記実施例では特定図形3として文字(数字)を例
示したが,実使用に際しては,特殊記号等他のあらゆる
図形を特定図形としても何ら支障はない。尚,上記実施
例では切り出し対象として文字(数字)を想定してサン
プルの文字幅内でマッチング距離の強調度合を変化させ
るフィルタ7を用いたが,実使用に際しては,例えば特
殊記号等を切り出し対象とする場合にはその記号等の大
きさ内で上記強調度合を変化させるフィルタを用いても
良い。このように切り出し対象に見合ったフィルタ7を
用いることにより,一層効率的な図形認識を行うことが
できる。
【0009】
【発明の効果】本発明は上記したように構成されている
ため,文字等の特定図形がその他の図形と混在し,かつ
接近している場合でも正しく特定図形を切り出して効率
的な図形認識を行い得る図形認識方法とすることができ
る。更に,切り出し対象に見合ったフィルタを用いるこ
とにより,より正確な切り出し処理を行うことができる
ため,一層効率的な図形認識を行うことができる。
【図面の簡単な説明】
【図1】 本発明の一実施例に係る図形認識方法の切り
出し処理部分のフローを示すブロック図。
【図2】 一般的な図形認識方法の全体フローを示すブ
ロック図(従来例と共用)。
【図3】 2値画像の一例を示す説明図。
【図4】 各文字種のサンプル例を示す説明図。
【図5】 マッチング距離分布図(a),(b)。
【図6】 文字幅を基にして作成したフィルタの説明
図。
【図7】 強調マッチング距離分布図。
【図8】 文字の切り出し位置を示す説明図。
【図9】 しきい値決定方法を示す説明図(a),
(b)。
【図10】 文字の切り出し結果を示す説明図(a),
(b)。
【図11】 文字列を容易に切り出せる画像の一例を示
す説明図。
【図12】 文字と図形とが混在する画像の一例を示す
説明図。
【符号の説明】
1…入力画像 2…2値画像 3…特定図形(文字等) 4…サンプル 5…マッチング距離分布図 6…強調マッチング距離分布図 7…フィルタ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 図形を含む入力画像を2値化した2値画
    像から特定図形を切り出して図形認識を行う図形認識方
    法において,切り出し対象となる特定図形の種類毎に用
    意したサンプルを用いて上記2値画像の全ての位置でパ
    タンマッチングを行うことにより上記特定図形の種類毎
    にマッチング距離の分布を表すマッチング距離分布図を
    作成し,上記作成されたマッチング距離分布図の全域に
    亙り上記マッチング距離の分布の強調度合を変化させる
    ことにより強調マッチング距離分布図を作成し,上記作
    成された強調マッチング距離分布図に対してしきい値処
    理をすることにより上記特定図形を切り出すことを特徴
    とする図形認識方法。
  2. 【請求項2】 上記マッチング距離の分布の強調度合の
    変化の調整が,上記サンプルの大きさ毎に用意されたフ
    ィルタにより上記マッチング距離分布図をフィルタリン
    グ処理することにより行われることを特徴とする請求項
    1記載の図形認識方法。
JP5004148A 1993-01-13 1993-01-13 図形認識方法 Pending JPH06215139A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5004148A JPH06215139A (ja) 1993-01-13 1993-01-13 図形認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5004148A JPH06215139A (ja) 1993-01-13 1993-01-13 図形認識方法

Publications (1)

Publication Number Publication Date
JPH06215139A true JPH06215139A (ja) 1994-08-05

Family

ID=11576696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5004148A Pending JPH06215139A (ja) 1993-01-13 1993-01-13 図形認識方法

Country Status (1)

Country Link
JP (1) JPH06215139A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0701060A2 (en) 1994-09-09 1996-03-13 Nippondenso Co., Ltd. Ignition apparatus for internal combustion engine
WO2012101717A1 (ja) * 2011-01-26 2012-08-02 株式会社 日立ハイテクノロジーズ パターンマッチング装置、及びコンピュータープログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0701060A2 (en) 1994-09-09 1996-03-13 Nippondenso Co., Ltd. Ignition apparatus for internal combustion engine
WO2012101717A1 (ja) * 2011-01-26 2012-08-02 株式会社 日立ハイテクノロジーズ パターンマッチング装置、及びコンピュータープログラム
JP5707423B2 (ja) * 2011-01-26 2015-04-30 株式会社日立ハイテクノロジーズ パターンマッチング装置、及びコンピュータープログラム
US10535129B2 (en) 2011-01-26 2020-01-14 Hitachi High-Technologies Corporation Pattern matching apparatus and computer program

Similar Documents

Publication Publication Date Title
CN107067006B (zh) 一种服务于数据采集的验证码识别方法及系统
US6263113B1 (en) Method for detecting a face in a digital image
JPH05225378A (ja) 文書画像の領域分割システム
CN112507782A (zh) 文本图像的识别方法及装置
CN111738979A (zh) 证件图像质量自动检查方法及系统
CN108877030B (zh) 图像处理方法、装置、终端和计算机可读存储介质
Saddami et al. Improvement of binarization performance using local otsu thresholding.
CN111163332A (zh) 视频色情度检测方法、终端及介质
Ghandour et al. Building shadow detection based on multi-thresholding segmentation
JPH06215139A (ja) 図形認識方法
CN107330470B (zh) 识别图片的方法和装置
JPH1125222A (ja) 文字切り出し方法及び文字切り出し装置
CN110874547A (zh) 从视频中识别对象的方法和设备
CN114529570A (zh) 图像分割方法、图像识别方法、用户凭证补办方法及系统
JP2002245404A (ja) 領域切り出しプログラムおよび装置
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
JP4616522B2 (ja) 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体
JP3422896B2 (ja) 画像認識方法及びその装置
CN111507324B (zh) 卡片边框识别方法、装置、设备和计算机存储介质
CN112215783B (zh) 一种图像噪点识别方法、装置、存储介质及设备
JP4732626B2 (ja) 帳票処理方法および装置並びにプログラム
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
Patil Detection of Hazy Vehicle License Plate with Dark Channel Prior Dehazing and Optical Character Recognition
JP3349243B2 (ja) 文字列読み取り装置
JP3220226B2 (ja) 文字列方向判別方法