JPH0830734A - 文字列認識装置 - Google Patents

文字列認識装置

Info

Publication number
JPH0830734A
JPH0830734A JP6166942A JP16694294A JPH0830734A JP H0830734 A JPH0830734 A JP H0830734A JP 6166942 A JP6166942 A JP 6166942A JP 16694294 A JP16694294 A JP 16694294A JP H0830734 A JPH0830734 A JP H0830734A
Authority
JP
Japan
Prior art keywords
character
recognition
image
address
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6166942A
Other languages
English (en)
Inventor
Kiichi Sugimoto
喜一 杉本
Shintaro Kumano
信太郎 熊野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP6166942A priority Critical patent/JPH0830734A/ja
Publication of JPH0830734A publication Critical patent/JPH0830734A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】本発明装置は、手書き宛名認識の文字領域の再
切り出し処理、再文字認識処理を効率よく正確に行なう
文字列認識装置を提供することを目的とする。 【構成】与えられた手書き宛名画像10を入力して、矩
形領域ごとに切り出した文字画像1を、さらに詳細に分
割する文字詳細切り出し手段2と、前記切り出された文
字領域を統合する文字画像統合手段3と、前記文字画像
統合手段3からの情報と、地名候補6を入力して、類似
する文字を認識する文字認識手段4と、前記文字認識手
段4からの情報と、地名情報としての地名候補6を照合
して類似度を判断する類似度判断手段5と、前記情報を
入力し、文字画像の再切り出しを行ない、文字画像統合
手段3に出力する再切り出し手段7と、再切り出し処理
・再認識処理手段9からの情報を入力し、切り出し一致
度と文字平均類似度から宛名を特定する宛名評価手段8
を有することを特徴とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、手書き宛名認識装置な
どに利用される文字列認識装置に関する。
【0002】
【従来の技術】一般に手書き宛名認識を行なう際には、
従来は与えられた宛名画像を2値化し、文字と思われる
領域ごとに矩形領域を切り出す文字切り出し処理を行な
い、切り出した文字ごとに文字認識処理を行ない、その
結果と地名辞書とを照合することにより、与えられた宛
名画像に書かれていると思われる地名の候補を選出す
る、という手順をとっていた。この一連の処理の流れを
図3に示す。また図4は、各処理における出力の例を示
す。図4(A)は2値化画像であり、図4(B)は文字
切り出しの結果で、各矩形領域が切り出された文字領域
を表している。また図5は切り出した領域ごとの文字認
識の結果、および文字認識結果と地名辞書とを照合した
結果得られる地名候補を表している。
【0003】
【発明が解決しようとする課題】従来の技術では、図6
に示すように、文字切り出し処理において文字領域が正
しい位置で切り出されていないときには、それ以降の文
字認識処理の結果およびそれに基づいて選出される地名
候補の信頼性は低いものになってしまう。このような状
況が発生したときには、再び文字切り出し処理、文字認
識処理を行なう必要性が生じてくる。
【0004】本発明は前述のような問題点を解決するた
めになされたもので、手書き宛名認識における文字領域
の再切り出し処理、再文字認識処理を効率的かつ正確に
行なう文字列認識装置を提供することを目的とする。
【0005】
【課題を解決するための手段】本発明に係る文字列認識
装置は、与えられた手書き宛名画像10を入力して、認
識結果70を出力する宛名認識装置100において、
(A)与えられた手書き宛名画像に対し、文字領域と思
われる矩形領域ごとに切り出した文字画像1を、さらに
詳細に分割する文字詳細切り出し手段2と、(B)前記
文字詳細切り出し手段2により切り出された文字領域を
統合する文字画像統合手段3と、(C)前記文字画像統
合手段3からの情報と、知識として持っている辞書デー
タベースの中の地名情報としての地名候補6を入力し
て、類似する文字を認識する文字認識手段4と、(D)
前記文字認識手段4からの情報と、辞書データベースの
中の地名情報としての地名候補6を照合して類似度を判
断する類似度判断手段5と、(E)前記類似度判断手段
5からの情報を入力し、文字画像の再切り出しを行な
い、その結果を文字画像統合手段3に出力する再切り出
し手段7と、(F)前記文字画像統合手段3と文字認識
手段4と類似度判断手段5と再切り出し手段7からなる
再切り出し処理・再認識処理手段9からの情報を入力
し、切り出し一致度と文字平均類似度から宛名を特定す
る宛名評価手段8を有することを特徴とする。
【0006】
【作用】文字詳細切り出し手段は、文字領域としての切
り出された文字画像をさらに詳細に分割する。文字画像
統合手段は、注目する文字画像に対して統合し得る最大
統合範囲を設定し、その中に含まれる文字画像を、注目
する文字画像に近い文字画像から順に下に向かって一つ
づつ統合する。
【0007】文字認識手段と類似度判断手段は、文字画
像統合手段から出力された文字画像に対して、照合した
い文字との類似度を求める。再切り出し処理・再認識処
理手段は、文字画像統合処理手段と文字認識手段とを繰
り返し用いることにより、地名候補の各文字に対応する
最適な文字切り出し位置と、各切り出し位置における対
応する文字の類似度を求める。
【0008】宛名評価手段は、再切り出し処理・再認識
処理手段によって求められる、各地名候補の各文字に対
応する文字切り出し位置と、各切り出し位置における対
応する文字の類似度から、切り出し位置のバランス、お
よび宛名画像全体での各文字領域の類似度を考慮して各
地名候補の宛名画像に対する類似度を求め、最も類似度
が高い候補地名を最終的な認識結果とする。
【0009】
【実施例】本発明の第1実施例を図1、2、7〜11に
示す。まず以下の説明で用いる前提および記号、表現の
定義をしておく。対象とする手書き宛名画像は、縦書き
とする。ただし、対象の画像が横書きであっても原理は
同じである。また説明の便宜上から画像の左上端を始点
とし、左から右にx軸、上から下にy軸を持つ座標系を
設定する。以下ではこの座標系を用いることとする(図
7参照)。また切り出された各文字領域のうち、文字部
分のことを“文字画像”と呼ぶことにする。
【0010】次に宛名認識装置100と本発明装置との
関係につき説明する。宛名認識装置100としての処理
の流れを図2に示す。図2に示す通り、本発明の文字列
認識装置に入る前(前段階)において、ノイズ除去等の
画像処理を行なう前処理20、文字らしい領域を一文字
として切り出す文字切り出し処理30、切り出した領域
毎にその文字が何という文字であるかを特定する文字認
識処理40、文字認識処理の結果と知識として持ってい
る地名辞書とを照合して、入力された画像に宛名として
書かれている住所の候補を列挙する知識処理50の4つ
の処理がなされる。本発明装置は、これら4つの処理を
受けて、文字切り出し結果の不正確な部分を再検定する
ことにより、認識精度を向上させるための“後処理6
0”としての装置に関するものである。
【0011】従って本発明装置では、従来手法を用い
て、文字切り出し画像(文字画像)と、宛名に書かれて
あると思われる住所の候補(地名候補)とを得た後、そ
れらの情報を用いて各処理を行なうことになる。
【0012】図1は、本発明に係る文字列認識装置の構
成図である。本発明に係る文字列認識装置には、あらか
じめ何らかの方法によって求められた、対象の手書き宛
名画像に対する文字切り出し位置に関する情報と、それ
に基づく地名候補が与えられるものとする。
【0013】ここで文字切り出し位置に関する情報は、
必ずしも正確である必要はない。以下、上記構成の文字
列認識装置の動作を、順を追って説明する。文字詳細切
り出し手段2における、具体的な処理内容は以下の通り
である(図8参照)。 1.各文字画像1に対して、y軸射影をとる。 2.まず、その文字画像が、y方向中央付近で上下に分
割している(すなわち、y方向射影値が0になってい
る)文字画像であるかを調べ、もしそうなっていればそ
こで二つの文字画像を切り出す(図8(A)参照)。 3.前記2.の条件を満たさなかった文字画像に対して
は、以下のような処理を行なう(図8(B)参照)。
【0014】(a)y軸射影ヒストグラムの平均値(ヒ
ストグラム総和/文字画像高さ)を計算する。 (b)y軸射影ヒストグラムを、文字画像の上から順に
調べていき、射影値が平均値の0.3倍以下になった点
の射影値を記憶しておく。
【0015】(c)前記(b)の点からさらに下に調べ
ていき、記憶した射影値の1.5倍以上になる点を求
め、切り出し候補点とする。 (d)前記(b)、(c)の処理を文字画像最下点まで
繰り返し行なう。
【0016】(e)前記(b)、(c)、(d)で求め
た切り出し候補点のうち、切り出し後の文字画像高さ
(各文字のy軸方向の長さ)が切り出し前の文字画像高
さの0.3倍以上となる点でのみ切り出しを行なう。
【0017】文字画像統合手段3は、注目する文字画像
に対して最大統合範囲を設定し、その中に含まれる文字
画像を統合対象文字画像とする。ここで最大統合範囲
は、各列ごとの詳細切り出し後の文字画像の平均高さの
2.0倍とし、統合対象文字画像は、同統合対象文字画
像の中心のy座標が最大統合範囲内に含まれている文字
画像とする(図9参照)。
【0018】文字画像の統合は、注目する文字画像にい
ちばん近い(すぐ下の)文字画像から順に一つづつ統合
していく。文字認識手段4及び類似度判断手段5は、文
字画像統合手段から出力された文字画像に対して、照合
させたい地名候補6の、文字画像に対する位置にある文
字と照合する。ここでは、既存の文字認識手法を用い
て、文字画像がどのくらいその文字に類似するかを、文
字の類似度として求める。ここで類似度は、0から1ま
での数値で表され、数値が大きいほど照合した文字に類
似するものとする。
【0019】再切り出し手段7は、類似度判断手段5か
らの情報に基づき、文字画像の再切り出しを行ない、そ
の結果を文字画像統合手段3に出力する。再切り出し処
理・再認識処理手段9は、文字画像統合手段3と文字認
識手段4と類似度判断手段5と再切り出し手段7とから
成り、文字画像統合手段と文字認識手段を繰り返し用い
ることにより、宛名画像の文字画像を統合して照合した
い文字との類似度を求め、統合できる範囲の中で最も類
似度の値が大きい切り出し位置での文字画像を、最終的
な文字切り出し画像とする。
【0020】具体的には、以下のような手順で処理を行
なう(図10参照)。 1.文字画像統合手段3を用いて、対象の文字画像1に
いちばん近い(すぐ下の)文字画像を統合する。 2.文字認識手段4と類似度判断手段5を用いて、統合
された文字画像に対して一文字認識処理を行ない、照合
したい文字との類似度を求める。 3.統合後の文字画像に対して、前記1.、2.の処理
を統合対象文字画像が尽きるまで行ない、類似度が最も
大きい点を最終的な文字切り出し位置とする。 4.切り出し点の次の文字画像を、次の文字の先頭の文
字画像として、上記の処理を繰り返す。
【0021】宛名評価手段8は、再切り出し処理・再認
識処理手段9から出力される、各地名候補の各文字に対
応する文字切り出し位置と、各切り出し位置に置ける対
応する文字の類似度とから、切り出し位置のバランス、
および宛名画像全体での各文字領域の類似度を考慮して
各地名候補の宛名画像に対する類似度を求める。 1.まず、最終的な文字切り出し位置と最初の文字切り
出し位置とを比較して、切り出し位置が一致している文
字領域の数を数える。一致した数をmatch-num とする。 2.再切り出し処理・再認識処理手段から出力される、
各文字領域の類似度の平均値(文字平均類似度)を求め
る。文字平均類似度をsimilar-charとする。 3.次式によって、候補地名の宛名画像に対する類似度
similar-addrを求める。
【0022】(similar-addr)2 =(w×match-num
2 +(similar-char)2 ただしw(=0.05)は正規化係数とする。上式の意
味は次の通りである。最初の文字切り出し位置は、文字
高さのバランスのみを考慮して切り出すのであるが、切
り出しに誤りがあるとしても全ての文字について切り出
し位置が誤っている率は極めて小さい。したがって最初
の切り出し位置と一致しているほど、切り出し位置のバ
ランスが良いといえる。
【0023】一方、文字平均類似度が大きいほど地名と
しての類似度が大きいといえる。切り出し位置の一致数
match-num に正規化係数wを掛けた値w×match-num を
切り出し一致度と呼ぶことにすると、切り出し一致度が
大きいほど、また文字平均類似度が大きいほど、その候
補地名は宛名画像に類似していると評価することができ
る。
【0024】そこで、図11のようにx軸に文字平均類
似度を、y軸に切り出し一致度をとった座標系におい
て、各候補地名の文字平均類似度と切り出し一致度の座
標値をプロットし、原点からその点までの距離をもっ
て、その候補地名の宛名画像に対する類似度とする。上
記類似度を地名候補全てについて求め、最も類似度が高
い候補地名を最終的な認識結果とする。
【0025】
【数1】
【0026】
【発明の効果】本発明は前述のように構成されているの
で、以下に記載するような効果を奏する。 (1)文字切り出し処理において、文字領域が正しく切
り出されていないときに、本発明装置により、正しい切
り出し位置に切り出しなおし、同時に地名候補の中から
正しい認識結果を得ることができる。 (2)地名候補を絞った後の結果を利用して、文字画像
と照合させる文字を一文字に限定した処理であり、照合
させる文字画像範囲を限定し、かつ統合方向が一方向的
であるため、繰り返し処理の回数を少なくすることがで
き、効率的かつ高速な再文字切り出し、再文字認識処理
ができる。
【図面の簡単な説明】
【図1】本発明の第1実施例の構成を示す図。
【図2】本発明装置と宛名認識装置との関係を示す図。
【図3】従来装置の構成を示す図。
【図4】図3の各処理における出力例を示す図。
【図5】図3の各処理における出力例を示す図。
【図6】文字切り出しが正しく行なわれていない例を示
す図。
【図7】対象とする手書き宛名画像の例を示す図。
【図8】文字切り出し手段における処理を示す図。
【図9】統合対象文字画像を示す図。
【図10】再認識処理・再切り出し処理手段における処
理を示す図。
【図11】候補地名の宛名画像に対する類似度の図形的
解釈を示す図。
【符号の説明】
1…文字画像、 2…文字詳細切り出し手段、 3…文字画像統合手段、 4…文字認識手段、 5…類似度判断手段、 6…地名候補、 7…再切り出し手段、 8…宛名評価手段、 9…再切り出し処理・再認識処理手段、 10…宛名画像入力、 20…前処理、 30…文字切り出し処理、 40…文字認識処理、 50…知識処理、 60…後処理、 70…認識結果出力、 100…宛名認識装置。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 与えられた手書き宛名画像(10)を入
    力して、認識結果(70)を出力する宛名認識装置(1
    00)において、(A)与えられた手書き宛名画像に対
    し、文字領域と思われる矩形領域ごとに切り出した文字
    画像(1)を、さらに詳細に分割する文字詳細切り出し
    手段(2)と、(B)前記文字詳細切り出し手段(2)
    により切り出された文字領域を統合する文字画像統合手
    段(3)と、(C)前記文字画像統合手段(3)からの
    情報と、知識として持っている辞書データベースの中の
    地名情報としての地名候補(6)を入力して、類似する
    文字を認識する文字認識手段(4)と、(D)前記文字
    認識手段(4)からの情報と、辞書データベースの中の
    地名情報としての地名候補(6)を照合して類似度を判
    断する類似度判断手段(5)と、(E)前記類似度判断
    手段(5)からの情報を入力し、文字画像の再切り出し
    を行ない、その結果を文字画像統合手段(3)に出力す
    る再切り出し手段(7)と、(F)前記文字画像統合手
    段(3)と文字認識手段(4)と類似度判断手段(5)
    と再切り出し手段(7)からなる再切り出し処理・再認
    識処理手段(9)からの情報を入力し、切り出し一致度
    と文字平均類似度から宛名を特定する宛名評価手段
    (8)を有することを特徴とする文字列認識装置。
JP6166942A 1994-07-19 1994-07-19 文字列認識装置 Withdrawn JPH0830734A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6166942A JPH0830734A (ja) 1994-07-19 1994-07-19 文字列認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6166942A JPH0830734A (ja) 1994-07-19 1994-07-19 文字列認識装置

Publications (1)

Publication Number Publication Date
JPH0830734A true JPH0830734A (ja) 1996-02-02

Family

ID=15840499

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6166942A Withdrawn JPH0830734A (ja) 1994-07-19 1994-07-19 文字列認識装置

Country Status (1)

Country Link
JP (1) JPH0830734A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6115707A (en) * 1997-02-21 2000-09-05 Nec Corporation Address reading apparatus and recording medium on which a program for an address reading apparatus is recorded
JP2016045943A (ja) * 2014-08-20 2016-04-04 三菱電機株式会社 シーンの取得画像を意味的にラベル付けする方法
CN111340029A (zh) * 2018-12-19 2020-06-26 富士通株式会社 用于识别收件人地址中的至少部分地址的装置和方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6115707A (en) * 1997-02-21 2000-09-05 Nec Corporation Address reading apparatus and recording medium on which a program for an address reading apparatus is recorded
JP2016045943A (ja) * 2014-08-20 2016-04-04 三菱電機株式会社 シーンの取得画像を意味的にラベル付けする方法
CN111340029A (zh) * 2018-12-19 2020-06-26 富士通株式会社 用于识别收件人地址中的至少部分地址的装置和方法

Similar Documents

Publication Publication Date Title
US6950555B2 (en) Holistic-analytical recognition of handwritten text
JPH0772905B2 (ja) 記号列の認識方法
JPH0684006A (ja) オンライン手書き文字認識方法
CN112151014B (zh) 语音识别结果的测评方法、装置、设备及存储介质
EP0432937B1 (en) Hand-written character recognition apparatus
JPH1166238A (ja) 手書き文字認識方法
JPH0830734A (ja) 文字列認識装置
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
JPH07220023A (ja) 表認識方法及びその装置
JPH1139313A (ja) 文書自動分類システム、文書分類向け知識ベース生成方法及びそのプログラムを記録した記録媒体
US9015573B2 (en) Object recognition and describing structure of graphical objects
US9224040B2 (en) Method for object recognition and describing structure of graphical objects
JPH06215184A (ja) 抽出領域のラベリング装置
JPH09134410A (ja) 認識結果の確信度決定方法及び文字認識装置
JPH08287188A (ja) 文字列認識装置
JPH0259979A (ja) 文書画像処理装置
JP2963474B2 (ja) 類似文字識別方法
JP3245241B2 (ja) 文字認識装置および方法
JP2000090203A (ja) 文字認識方法及びその装置
JP2972443B2 (ja) 文字認識装置
JP2851865B2 (ja) 文字認識装置
JPH06195508A (ja) 文字切り出し方法
JP2622004B2 (ja) 文字認識装置
JP2977244B2 (ja) 文字認識方法及び文字認識装置
JPH08272909A (ja) 文字認識方法および文字認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20011002