JP3411795B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3411795B2
JP3411795B2 JP26851797A JP26851797A JP3411795B2 JP 3411795 B2 JP3411795 B2 JP 3411795B2 JP 26851797 A JP26851797 A JP 26851797A JP 26851797 A JP26851797 A JP 26851797A JP 3411795 B2 JP3411795 B2 JP 3411795B2
Authority
JP
Japan
Prior art keywords
character
image
similarity
height
width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP26851797A
Other languages
English (en)
Other versions
JPH11110483A (ja
Inventor
喜一 杉本
信太郎 熊野
啓子 中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP26851797A priority Critical patent/JP3411795B2/ja
Publication of JPH11110483A publication Critical patent/JPH11110483A/ja
Application granted granted Critical
Publication of JP3411795B2 publication Critical patent/JP3411795B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明は、例えば車両番号等
の定型文字列認識装置に適用される文字認識装置に係
り、特に付着物により変形した文字画像の正確な文字領
域を求められるようにした文字認識装置に関するもので
ある。 【0002】 【従来の技術】一般に、例えば車両番号等の定型文字列
の認識を行なう際の文字認識処理においては、真の文字
領域の外側の付着物により変形した文字画像に対して、
文字画像毎の幾何情報(始点・終点座標、高さ、幅等)
と、隣接する文字画像同士の位置関係(始点・終点座
標)とから、付着物の位置を推定して切り出す方法が用
いられている。 【0003】 【発明が解決しようとする課題】しかしながら、上記の
ような従来の方法では、次のような種々の問題点があ
る。 【0004】(a)文字列が水平に並んでいる場合に
は、ある程度正確に付着物の位置を推定することができ
るが、文字列が斜めに並んでいるような場合には、隣接
文字画像の位置関係による付着物の位置推定が困難であ
る。 【0005】(b)文字画像の幾何情報のみを用いてい
るため、文字画像と文字以外の画像(ノイズ画像)との
区別が不正確であり、文字画像の付着物の位置推定の際
に、隣接するノイズ画像を用いて、付着物の位置推定を
誤ることがある。 【0006】(c)付着物除去後の文字画像の文字類似
度を考慮していないため、付着物の除去量が適切でない
ことがある。 【0007】といった問題点がある。 【0008】本発明は、上記のような問題点を解決する
ために成されたもので、その目的は、付着物により変形
した文字画像の正確な文字領域を求めることが可能な文
字認識装置を提供することにある。 【0009】 【課題を解決するための手段】上記の目的を達成するた
めに本発明では、与えられた文字列の2値化画像を入力
して、当該文字列を認識する文字認識装置において、
記与えられた文字列の2値化画像に対して連結領域毎の
ラベリング処理を施して各ラベルの始点・終点座標、高
さ及び幅を求め、これら各ラベルの始点・終点座標、高
さ及び幅に基づき前記2値化画像から文字画像を切り出
す文字切り出し手段と、前記文字切り出し手段により切
り出された文字画像に対し、文字認識処理を施して文字
類似度を求める文字認識手段と、前記文字切り出し手段
により切り出された文字画像の高さ、幅と、前記文字認
識手段により求められた文字類似度とを基に、文字類似
度の高い文字画像を選び出し、該選び出した文字画像の
高さ、幅の平均値を前記与えられた文字列の参照文字幾
何情報とする参照文字幾何情報推定手段と、前記文字画
像のうち、文字類似度が低く且つ高さ又は幅が、前記参
照文字幾何情報推定手段の参照文字幾何情報による高
さ、幅の平均値よりも大きい文字画像を変形文字画像と
し、該変形文字画像の四隅に高さと幅とで規定される複
数の矩形領域を設定し、各々の矩形領域に対して前記文
字認識手段により求められた文字類似度と前記参照文字
幾何情報推定手段からの参照文字幾何情報とを用いて、
最も文字類似度の高い矩形領域を求め、その領域を真の
文字領域として特定する文字領域特定手段と、を備えて
成ることを特徴とする。 【0010】 【発明の実施の形態】以下、本発明の一実施の形態につ
いて図面を参照して詳細に説明する。 【0011】始めに、以下の説明で用いる前提、および
記号、表現の定義をしておく。 【0012】まず、処理対象の文字列として、定型文字
列を取り上げる。ここで取り上げる定型文字列は、横一
列に書かれており、背景が白色で文字が黒色のものとす
る。縦書き、複数列、背景色と文字色の反転等の場合
も、基本的な原理は同じである。 【0013】また、説明の簡単のため、以下に示す実施
の形態では、文字の欠損、分離、文字同士の連結等はな
いものとする。 【0014】なお、説明の便宜上、画像の左上端を原点
とし、左から右にx軸、上から下にy軸を持つ座標系を
設定し、以下ではこの座標系を用いることとする。 【0015】次に、定型文字列認識装置と本実施の形態
による文字認識装置との関係について説明する。 【0016】図1は、本実施の形態による文字認識装置
を適用する定型文字列認識装置の処理の流れを示す機能
ブロック図である。 【0017】すなわち、定型文字列認識装置の処理は、
図1に示すように、文字認識処理の前段において、ノイ
ズ除去等の画像処理を行なう前処理S1、文字列らしい
領域を探索する文字列領域切り出し処理S2、文字領域
とその背景領域とを区別する文字列2値化処理S3の各
処理がなされる。 【0018】一方、本実施の形態の文字認識装置に関す
る処理は、大きく文字らしい領域を1文字として切り出
す文字切り出し処理S4、および切り出した領域毎にそ
の文字が何という文字であるかを特定する文字認識処理
S5から構成される。 【0019】すなわち、本実施の形態による文字認識装
置は、文字列として切り出した画像から、より正確に各
文字領域を切り出し、文字認識するための“文字認識処
理”を行なうものである。 【0020】なお、本実施の形態の文字認識装置を適用
する定型文字列認識装置においては、前処理S1、文字
列領域切り出し処理S2、文字列2値化処理S3、文字
切り出し処理S4、文字認識処理S5の各々について
は、従来手法を用いることとし、これらの手法により得
られる結果を用いて、本文字認識装置の各処理を行なう
ことになる。 【0021】図2は、本実施の形態の文字認識装置の全
体構成例を示す機能ブロック図である。 【0022】すなわち、本実施の形態の文字認識装置
は、図2に示すように、文字切り出し手段1と、文字認
識手段2と、参照文字幾何情報推定手段3と、文字領域
特定手段4とから構成している。 【0023】文字切り出し手段1は、前記文字列2値化
処理S3により与えられた文字列の2値化画像に対し、
連結領域毎の幾何情報を求め、文字画像として切り出す
文字認識手段2は、文字切り出し手段1により切り出さ
れた文字画像に対し、文字認識処理を施して文字類似度
を求めるものである。 【0024】参照文字幾何情報推定手段3は、文字切り
出し手段1より切り出された文字画像の幾何情報と、文
字認識手段2により求められた文字類似度とを用いて、
与えられた文字列の参照文字幾何情報の推定を行なうも
のである。 【0025】文字領域特定手段4は、参照文字幾何情報
推定手段3により推定された参照文字幾何情報と、文字
認識手段2により求められた文字類似度とを用いて、真
の文字領域の外側の付着物により変形した変形文字画像
に対して、当該付着物の位置を特定して真の文字領域を
求めるものである。 【0026】次に、以上のように構成した本実施の形態
の文字認識装置の作用について説明する。 【0027】なお、ここでは、図3に示すような文字列
の2値化画像を例に順を追って述べる。 【0028】また、本実施の形態の文字認識装置におい
ては、入力される文字列画像に関して、画像内に含まれ
る文字の大きさ(高さ、幅)についての最小値および最
大値が、あらかじめ分かっているものとする。 【0029】そして、最小文字高さ、最大文字高さをそ
れぞれHmin ,Hmax 、最小文字幅,最大文字幅をそれ
ぞれWmin ,Wmax と表わすことにする。 【0030】さらに、文字らしい文字画像を選ぶための
文字類似度の閾値sθも、あらかじめ設定されているも
のとする。 【0031】図2において、文字切り出し手段1によ
り、前記文字列2値化処理S3により与えられた文字列
の2値化画像に対して連結領域毎のラベリング処理を施
し、各ラベル毎に始点・終点座標、高さ、および幅を求
め、文字としての条件を満たすラベルを文字画像として
切り出す。 【0032】図4は、図3の入力画像に対してラベリン
グ処理した結果の一例を示す図である。 【0033】図4において、ラベル番号iのラベルをラ
ベルiと呼ぶことにし、ラベルiの高さ、幅をそれぞれ
Hi、Wiとする。 【0034】ラベリング処理を行なった後、 Hmin <Hi <Hmax かつ Wmin i W<Wmax を満たすラベルiを、文字画像として切り出す。 【0035】図5は、図4のラベリングに対して文字切
り出しを行なった結果の一例を示す図である(ラベル6
は、文字画像として切り出されていないことに注意)。 【0036】次に、文字認識手段2により、文字切り出
し手段1から出力された文字切り出し画像に対して、文
字認識処理を施し、各文字画像の識別クラス毎の文字類
似度を求める。 【0037】図6は、図5の各文字画像に対する文字認
識処理の結果の一例を示す図である。 【0038】図6において、類似度を表わす数値は、値
が小さいほど文字類似度が高いことを意味している。 【0039】次に、参照文字幾何情報推定手段3によ
り、文字切り出し手段1から出力された各文字画像の高
さ、幅と、文字認識手段2から出力された各文字画像の
文字類似度とを基に、文字類似度の高い文字画像を選び
出し、それらの高さ、幅の平均値を求めて、与えられた
文字列の参照文字幾何情報とする。 【0040】図6において、文字類似度閾値sθ=0.
03とし、各文字画像の認識結果1位の識別クラスおよ
び文字類似度で評価すると、文字画像2,3,4,5
が、文字類似度の高い文字画像として選ばれる。従っ
て、与えられた文字列の参照文字幾何情報Href ,W
ref は、それぞれ Href =(H2 +H3 +H4 +H5 )/4 Wref =(W2 +W3 +W4 +W5 )/4 となる。 【0041】次に、文字領域特定手段4により、文字類
似度が低く、かつその高さあるいは幅が、文字列の参照
文字幾何情報よりも大きい文字画像(変形文字画像)に
対して、その変形文字画像上に参照文字幾何情報で規定
される複数の矩形領域を設定し、各々の矩形領域に対し
て文字認識手段2および参照文字幾何情報推定手段3を
用いて、最も文字類似度の高い矩形領域を求め、その領
域を真の文字領域と設定する。 【0042】図6において、参照文字幾何情報推定手段
3で選ばれなかった文字画像1に対して、文字領域の特
定を行なう。 【0043】図7に示すように、文字画像の四隅に高さ
ref ,Wref で規定される矩形領域{rj }を設定
し、文字認識手段2により各々の矩形領域に対する文字
類似度を求めて、最も文字類似度の高い矩形領域r
3 を、真の文字領域として設定する。 【0044】以上の手順により、与えられた図3に示す
ような文字列の2値化画像の認識結果として“X623
4”を得る。 【0045】上述したように、本実施の形態の文字認識
装置は、文字列2値化処理S3により与えられた文字列
の2値化画像に対し、連結領域毎の幾何情報を求め、文
字画像として切り出す文字切り出し手段1と、文字切り
出し手段1により切り出された文字画像に対し、文字認
識処理を施して文字類似度を求める文字認識手段2と、
文字切り出し手段1より切り出された文字画像の幾何情
報と、文字認識手段2により求められた文字類似度とを
用いて、与えられた文字列の参照文字幾何情報の推定を
行なう参照文字幾何情報推定手段3と、参照文字幾何情
報推定手段3により推定された参照文字幾何情報と、文
字認識手段2により求められた文字類似度とを用いて、
真の文字領域の外側の付着物により変形した変形文字画
像に対して、当該付着物の位置を特定して真の文字領域
を求める文字領域特定手段4とから構成したものであ
る。 【0046】従って、次のような種々の効果を得ること
ができるものである。 【0047】(a)文字画像の幾何情報と文字類似度と
を考慮しているため、付着物の位置を正しく特定するこ
とができ、かつ正しい認識結果を得ることが可能とな
る。 【0048】(b)文字画像の始点・終点座標の情報に
依存していないため、文字列が斜めに並んでいるような
場合でも、正しく付着物の位置を特定することが可能と
なる。 【0049】(c)文字類似度の高い他の文字画像の幾
何情報から得られる参照文字幾何情報を用いることによ
り、文字列画像毎に精度良く参照文字幾何情報を求めら
れるため、文字列全体の大きさが変動しているような場
合でも、正確に変形文字画像を特定し、安定して正しい
認識結果を得ることが可能となる。 【0050】 【発明の効果】以上説明したように本発明では、与えら
れた文字列の2値化画像を入力して、当該文字列を認識
する文字認識装置において、前記与えられた文字列の2
値化画像に対して連結領域毎のラベリング処理を施して
各ラベルの始点・終点座標、高さ及び幅を求め、これら
各ラベルの始点・終点座標、高さ及び幅に基づき前記2
値化画像から文字画像を切り出す文字切り出し手段と、
前記文字切り出し手段により切り出された文字画像に対
し、文字認識処理を施して文字類似度を求める文字認識
手段と、前記文字切り出し手段により切り出された文字
画像の高さ、幅と、前記文字認識手段により求められた
文字類似度とを基に、文字類似度の高い文字画像を選び
出し、該選び出した文字画像の高さ、幅の平均値を前記
与えられた文字列の参照文字幾何情報とする参照文字幾
何情報推定手段と、前記文字画像のうち、文字類似度が
低く且つ高さ又は幅が、前記参照文字幾何情報推定手段
の参照文字幾何情報による高さ、幅の平均値よりも大き
い文字画像を変形文字画像とし、該変形文字画像の四隅
に高さと幅とで規定される複数の矩形領域を設定し、各
々の矩形領域に対して前記文字認識手段により求められ
た文字類似度と前記参照文字幾何情報推定手段からの参
照文字幾何情報とを用いて、最も文字類似度の高い矩形
領域を求め、その領域を真の文字領域として特定する文
字領域特定手段とを備えるようにしたものである。 【0051】従って、本発明の文字認識装置において
は、文字切り出し手段にて、与えられた文字列の2値化
画像に対して連結領域毎のラベリング処理を施し、各ラ
ベル毎に始点・終点座標、高さ、幅を求め、文字として
の条件を満たすラベルを文字画像として切り出す。そし
て、文字認識手段にて、文字切り出し手段から出力され
た文字画像に対して文字認識処理を施し、各文字画像の
識別クラス毎の文字類似度を求める。 【0052】一方、参照文字幾何情報推定手段にて、文
字切り出し手段から出力された各文字画像の高さ、幅
と、文字認識手段から出力された各文字画像の文字類似
度とを基に、文字類似度の高い文字画像を選び出し、そ
れらの高さ、幅の平均値を求めて、与えられた文字列の
参照文字幾何情報とする。そして、文字領域特定手段に
て、文字類似度が低くかつその高さあるいは幅が、文字
列の参照文字幾何情報よりも大きい文字画像(変形文字
画像)に対して、変形文字画像上に参照文字幾何情報で
規定される複数の矩形領域を設定し、各々の矩形領域に
対して文字認識手段および参照文字幾何情報推定手段を
用いて、最も文字類似度の高い矩形領域を求め、その領
域を真の文字領域と設定する。 【0053】以上により、文字画像の幾何情報と文字類
似度とを考慮しているため、付着物の位置を正しく特定
することができ、かつ正しい認識結果を得ることが可能
となる。 【0054】また、文字画像の始点・終点座標の情報に
依存していないため、文字列が斜めに並んでいるような
場合でも、正しく付着物の位置を特定することが可能と
なる。 【0055】さらに、文字類似度の高い他の文字画像の
幾何情報から得られる参照文字幾何情報を用いることに
より、文字列画像毎に精度良く参照文字幾何情報を求め
られるため、文字列全体の大きさが変動している場合で
も、正確に変形文字画像を特定し、安定して正しい認識
結果を得ることが可能となる。
【図面の簡単な説明】 【図1】本発明による文字認識装置を適用する定型文字
列認識装置の処理の流れを示す機能ブロック図。 【図2】本発明による文字認識装置の一実施の形態を示
す機能ブロック図。 【図3】同一実施の形態の文字認識装置が取り扱う文字
列画像の一例を示す図。 【図4】同一実施の形態の文字認識装置におけるラベリ
ング処理を施した画像の一例を示す図。 【図5】同一実施の形態の文字認識装置における文字切
り出し処理を施した画像の一例を示す図。 【図6】同一実施の形態の文字認識装置における各文字
画像に対する文字認識処理結果の一例を示す図。 【図7】同一実施の形態の文字認識装置における文字領
域特定処理の概念を説明するための図。 【符号の説明】 1…文字切り出し手段、 2…文字認識手段、 3…参照文字幾何情報推定手段、 4…文字領域特定手段、 S1…前処理、 S2…文字列領域切り出し処理、 S3…文字列2値化処理、 S4…文字切り出し処理、 S5…文字認識処理。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平7−49926(JP,A) 特開 平6−131501(JP,A) 特開 昭57−162084(JP,A) 特開 昭57−178572(JP,A) 特開 昭48−70438(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (1)

  1. (57)【特許請求の範囲】 【請求項1】 与えられた文字列の2値化画像を入力し
    て、当該文字列を認識する文字認識装置において、前記与えられた文字列の2値化画像に対して連結領域毎
    のラベリング処理を施して各ラベルの始点・終点座標、
    高さ及び幅を求め、これら各ラベルの始点・終点座標、
    高さ及び幅に基づき前記2値化画像から文字画像を切り
    出す文字切り出し手段と、 前記文字切り出し手段により切り出された文字画像に対
    し、文字認識処理を施して文字類似度を求める文字認識
    手段と、 前記文字切り出し手段により切り出された文字画像の高
    さ、幅と、前記文字認識手段により求められた文字類似
    度とを基に、文字類似度の高い文字画像を選び出し、該
    選び出した文字画像の高さ、幅の平均値を前記与えられ
    た文字列の参照文字幾何情報とする参照文字幾何情報推
    定手段と、 前記文字画像のうち、文字類似度が低く且つ高さ又は幅
    が、前記参照文字幾何情報推定手段の参照文字幾何情報
    による高さ、幅の平均値よりも大きい文字画像を変形文
    字画像とし、該変形文字画像の四隅に高さと幅とで規定
    される複数の矩形領域を設定し、各々の矩形領域に対し
    て前記文字認識手段により求められた文字類似度と前記
    参照文字幾何情報推定手段からの参照文字幾何情報とを
    用いて、最も文字類似度の高い矩形領域を求め、その領
    域を真の文字領域として特定する 文字領域特定手段と、 を備えて成ることを特徴とする文字認識装置。
JP26851797A 1997-10-01 1997-10-01 文字認識装置 Expired - Lifetime JP3411795B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26851797A JP3411795B2 (ja) 1997-10-01 1997-10-01 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26851797A JP3411795B2 (ja) 1997-10-01 1997-10-01 文字認識装置

Publications (2)

Publication Number Publication Date
JPH11110483A JPH11110483A (ja) 1999-04-23
JP3411795B2 true JP3411795B2 (ja) 2003-06-03

Family

ID=17459624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26851797A Expired - Lifetime JP3411795B2 (ja) 1997-10-01 1997-10-01 文字認識装置

Country Status (1)

Country Link
JP (1) JP3411795B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111898602B (zh) * 2020-08-10 2024-04-16 赞同科技股份有限公司 一种图像中的凭证号码区域识别方法、装置及设备

Also Published As

Publication number Publication date
JPH11110483A (ja) 1999-04-23

Similar Documents

Publication Publication Date Title
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
WO2011128777A2 (en) Segmentation of textual lines in an image that include western characters and hieroglyphic characters
JP4049560B2 (ja) 網点除去方法及びシステム
JPH09311905A (ja) 行検出方法および文字認識装置
JP2926066B2 (ja) 表認識装置
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JP3411795B2 (ja) 文字認識装置
JPH0410087A (ja) 基本ライン抽出方法
JP4867894B2 (ja) 画像認識装置、画像認識方法及びプログラム
JP3462727B2 (ja) 文字列2値化装置
JP2982221B2 (ja) 文字読み取り装置
JP2002245404A (ja) 領域切り出しプログラムおよび装置
JP3193573B2 (ja) かぎかっこ付文字認識装置
JP3753354B2 (ja) 破線識別装置および記録媒体
JP2909132B2 (ja) 光学的文字読取装置
JP3437296B2 (ja) 文字列高速抽出装置
JP2576079B2 (ja) 文字切出し方法
JP3190794B2 (ja) 文字切り出し装置
JP2963807B2 (ja) 郵便番号枠検出装置
JPH10171924A (ja) 文字認識装置
JP2023034823A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
JPH0573718A (ja) 領域属性識別方式
JPH10162104A (ja) 文字認識装置
JPH1185905A (ja) 書体識別装置および書体識別方法および情報記憶媒体
CN115700824A (zh) 文字分割方法、电子设备及存储介质

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030218

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080320

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090320

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100320

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110320

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110320

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120320

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130320

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140320

Year of fee payment: 11

EXPY Cancellation because of completion of term