JPH11110486A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH11110486A JPH11110486A JP9268584A JP26858497A JPH11110486A JP H11110486 A JPH11110486 A JP H11110486A JP 9268584 A JP9268584 A JP 9268584A JP 26858497 A JP26858497 A JP 26858497A JP H11110486 A JPH11110486 A JP H11110486A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- dictionary
- similarity
- loss
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
損のないパターン)に対する認識精度を落とすことな
く、欠損文字に対しても高い精度で認識を行う。 【解決手段】1文字分の画像を取り込む文字画像取り込
み手段1と、文字の欠損の有無、欠損場所、欠損量に関
する情報を取り込む欠損量・欠損場所入力手段2と、文
字画像に対して、文字の各場所の局所的な情報に着目し
た局所特徴量を計算する局所特徴量計算手段3と、文字
認識用の辞書を各文字種毎に予め保存する認識辞書保存
手段4と、情報と局所特徴量と辞書とを用いて、各文字
種に対する類似度を計算するための、欠損部の特徴を補
填した認識用特徴量を作成する欠損部補填手段5と、認
識用特徴量に対して、辞書を用いて、各文字種毎に類似
度を計算する類似度計算手段6と、類似度から、文字画
像の文字種を判定する文字種判定手段7とを備える。
Description
しくは一部の文字のストロークが一部欠損した低品質文
字に対して、どの場所がどれだけ欠損しているかが何ら
かの方法でわかっている場合に、文字を高い精度で認識
できるようにした文字認識装置に関するものである。
る文字に関する幾何学的変形(手書き文字の場合は筆跡
の違い)等のばらつきも含めて学習するために、文字サ
ンプルをなるべく多く集め、統計的識別手法やニューラ
ルネットにより、最適な識別面を学習する方式が一般的
となっている。
字の構造的な特徴(穴が何個あいているとか、上が真っ
直ぐである等)を記述し、規則を当てはめることで認識
する手法がある。
の手法によって、文字の一部が欠損した文字と欠損のな
い文字とが混在する可能性のある時に、文字の一部が欠
損した文字を認識する場合には、以下に示すような問題
点がある。
による方式では、文字の変形等による分布を正確に把握
するために、数多くの文字パターンをサンプルとして用
い、サンプルにあまり現われない文字変形は、その文字
である可能性が低いという、パターン分布に関する情報
を利用することで、文字認識の精度を向上させている。
に認識するためには、同じように一部が欠損した文字サ
ンプルを数多く準備して、学習やパラメータ調整を行な
っておく必要がある。
のある課題では、欠損パターンと正常パターンとが混在
するサンプルを用いなくてはならない。しかしながら、
欠損パターンを正常パターンとを混在させると、正常パ
ターンの識別能力が著しく低減されてしまうという問題
がある。
上部が欠損する可能性がある課題を考える。すなわち、
いま例えば図4に示すように、「T」と「I」は、上部
が欠損すると、共に「I」のパターンになる。しかしな
がら、これを考慮して、「T」の集合に始めから「I」
を混在させると(欠損文字の「T」と「I」との識別が
できないのは仕方ないとして)、上部が隠れない場合の
「I」と「T」との識別が曖昧になり、文字認識の精度
が低下する。
断できる場合には、例えば図5に示すように、欠損する
場合のサンプルと欠損しない場合のサンプルとを分けて
おいて、それぞれのケースでの認識用辞書(統計的手法
の場合)や、結合重み(ニューラルネットの場合)を持
ち、認識時にこれらを使い分けすることによって、欠損
パターンと正常パターンとの混在学習に伴なう上記のよ
うな課題を回避する方法も考えられる。
種類(上部、下部、右部等の欠損場所毎、また何パーセ
ント欠損しているか)毎に辞書が必要となり、大量の記
憶領域が必要となるという問題がある。
を向上させようとすると大きくなりがちであり、欠損に
対応するためにそのような辞書を複数個持つことは、装
置作成上の問題となる。
識別する手法では、文字種毎に特徴の内容を人間が整理
し、個別に特徴計算部を作成する等問題に依存した方式
のため、文字種の変更や変形パターンの増加等への対応
に、多くの時間を要するという問題がある。
手法やニューラルネットに比ベて低いという問題もあ
る。なお、以降の説明では、従来手法としてこちらの方
式は除外して説明することにする。
ために成されたもので、その目的は、従来と同じ辞書の
大きさで、正常パターン(欠損していないパターン)に
対する認識精度を低下することなく、欠損文字に対して
も高い精度で認識を行なうことが可能な文字認識装置を
提供することにある。
めに本発明では、文字列の全文字もしくは一部の文字に
ついて、部分が欠損した文字の認識を行なう文字認識装
置において、1文字分の画像を取り込む文字画像取り込
み手段と、文字の欠損の有無、欠損場所、欠損量に関す
る情報を取り込む欠損量・欠損場所入力手段と、文字画
像取り込み手段により取り込まれた文字画像に対して、
文字の各場所の局所的な情報に着目した局所特徴量を計
算する局所特徴量計算手段と、文字認識用の辞書を各文
字種毎にあらかじめ保存する認識辞書保存手段と、欠損
量・欠損場所入力手段により取り込まれた情報と、局所
特徴量計算手段により計算された局所特徴量と、認識辞
書保存手段に保存されている辞書とを用いて、各文字種
に対する類似度を計算するための、欠損部の特徴を補填
した認識用特徴量を作成する欠損部補填手段と、欠損部
補填手段により作成された認識用特徴量に対して、認識
辞書保存手段に保存されている辞書を用いて、各文字種
毎に類似度を計算する類似度計算手段と、類似度計算手
段により各文字種毎に計算された類似度から、文字画像
取り込み手段により取り込まれた文字画像の文字種を判
定する文字種判定手段とを備えて成る。
て図面を参照して詳細に説明する。図1は、本実施の形
態による文字認識装置の全体構成例を示す機能ブロック
図である。
は、図1に示すように、文字画像取り込み装置1と、欠
損量・欠損場所入力装置2と、局所特徴量計算装置3
と、認識辞書保存装置4と、欠損部補填装置5と、類似
度計算装置6と、文字種判定装置7とから構成してい
る。
像を取り込むものである。欠損量・欠損場所入力装置2
は、その文字のどこがどの程度欠損しているか(いない
か)の情報、すなわち文字の欠損の有無、欠損場所、欠
損量に関する情報を取り込むものである。
み装置1により取り込まれた文字画像に対して、文字の
各場所の局所的な情報に着目した局所特徴量を計算する
ものである。
を各文字種毎にあらかじめ保存するものである。欠損部
補填装置5は、欠損量・欠損場所入力装置2により取り
込まれた情報と、局所特徴量計算装置3により計算され
た局所特徴量と、認識辞書保存装置4に保存されている
辞書とを用いて、各文字種に対する類似度を計算するた
めの、欠損部の特徴を補填した認識用特徴量を作成する
ものである。
より作成された認識用特徴量に対して、認識辞書保存装
置4に保存されている辞書を用いて、各文字種毎に類似
度を計算するものである。
より各文字種毎に計算された類似度から、文字画像取り
込み装置1により取り込まれた文字画像の文字種を判定
するものである。
の文字認識装置の作用について説明する。なお、ここで
は、海外の車両番号(英数字、文字列1段または2段)
を例にとって述べる。
が車両の奥に取り付けられるため、斜め上方から撮像す
るカメラの画像では、ナンバープレートの上端が欠損す
ることである。そして、ナンバープレート周囲の構造に
よって、欠損の状態は多様である。また、ナンバープレ
ート上のシールやバイクの場合運転者の服の一部で隠さ
れる場合もある(図2参照)。
より、各文字毎に切り出した1文字分の文字画像を読み
込む。この場合、文字切り出しは、従来の手法を用い
る。また、欠損量・欠損場所入力装置2により、その文
字のどこがどの程度欠損しているか(いないか)の情
報、すなわち文字の欠損の有無、欠損場所、欠損量に関
する情報を読み込む。
各文字について異なっていてもよい。また、欠損量、欠
損場所を正確に判断することは重要な技術課題である
が、本発明の範囲からは除外する。
部隠れの場合の専用ロジックや、シールの場合のシール
検知ロジック等、個別に特化した方法で判断することが
多い)で、欠損量、欠損場所は既知であることを前提と
する。
画像取り込み装置1で取り込まれた文字画像に対して、
各文字の各場所の局所的な情報に着目した局所特徴量を
計算する。
には、特徴量が文字の局所的な性質を表わす必要があ
る。「局所的な」性質とは、文字の一部の欠損により、
特徴量でも欠損相当量分だけが影響を受ける(10%欠
損なら、特徴量次元数の10%が正常文字から変化する
という意味)ような特徴量の性質のことである。最も典
型的な局所特徴量は、文字の2次元パターンそのもので
ある。
をメッシュ分割して各メッシュ中で頻度分布をとる特徴
量(加重方向指数ヒストグラム特徴といい、公知の特徴
量方式である)については、メッシュ分割の粗さに量子
化されるものの、局所特徴量と言える。
フーリエ変換した係数や、文字の高さ等、欠損により特
徴量全体が影響を受けるようなものである。一方、認識
辞書保存装置4には、局所特徴量計算装置3と同じ種類
の局所特徴量を用いて、あらかじめ欠損のない文字サン
プルデータのみを用いて計算された文字認識用の辞書を
各文字種毎に保存している。
のみを用いて製作するため、文字欠損による変形に対応
する細工は全く含まれていない。反面、欠損サンプルを
無理に覚えることによる正常文字の誤認識等の副作用も
ない。
法として統計的認識手法を主に用いる。しかしながら、
本発明の手法の中心は「辞書作成後の」特徴量の操作に
あるので、辞書の内容や形式の異なるニューラルネット
でも、議論の本質は同様に成り立つ。
合、文字認識用辞書は(a)各文字種類の平均特徴量、
(b)多数サンプルに関する平均からの分散値、(c)
分散の方向、である。
平均特徴量ベクトル、(b)共分散行列の固有値、
(c)共分散行列の固有ベクトル、である。ニューラル
ネットでは、辞書の内容は異なる。
ルネットでは必要ない場合でも、(a)各文字種類の平
均特徴量だけは追加で保存しておく必要がある。(b)
各文字種類の平均特徴量が、欠損部補填装置5で使用さ
れる。数学的に表記すると、
す。また、Ni は文字種iのサンプルデータ数である。
これら情報の使用方法は、類似度計算装置6のところで
説明する。
場所入力装置2からの情報と、局所特徴量計算装置3か
らの局所特徴量と、認識辞書保存装置4からの辞書(各
文字種の平均特徴量ベクトル)とを用いて、各文字種k
に対する類似度を計算するための、欠損部を補填した認
識用特徴量を作成する。
局所特徴量計算装置3からの局所特徴量
素を求める。
f1 〜fp (p<n)とする。 (2)認識辞書保存装置4からの辞書(文字種kの平均
特徴量ベクトル)を用いて、欠損部を補填した認識用特
徴量を作成する。具体的には、
は、各文字の隠れた部分には、マッチングする各文字種
の該当部分が存在している、という仮定に立った特徴量
ベクトルを生成することである。その概念を図3に示
す。次に、類似度計算装置6により、文字種kと、欠損
部補填装置5により計算された認識用特徴量
公知の手法である。通常の特徴量(局所的特徴量計算装
置3で求まる特徴量を使う場合)の代わりに、欠損部補
填装置5により計算された特徴量を、sの計算に影響な
く置き換えられる。ニューラルネットの場合には、
用いることが一般的であるが、
め、
を行なう。すなわち、文字認識では
装置は、1文字分の画像を取り込む文字画像取り込み装
置1と、文字の欠損の有無、欠損場所、欠損量に関する
情報を取り込む欠損量・欠損場所入力装置2と、文字画
像取り込み装置1により取り込まれた文字画像に対し
て、文字の各場所の局所的な情報に着目した局所特徴量
を計算する局所特徴量計算装置3と、文字認識用の辞書
を各文字種毎にあらかじめ保存する認識辞書保存装置4
と、欠損量・欠損場所入力装置2により取り込まれた情
報と、局所特徴量計算装置3により計算された局所特徴
量と、認識辞書保存装置4に保存されている辞書とを用
いて、各文字種に対する類似度を計算するための、欠損
部の特徴を補填した認識用特徴量を作成する欠損部補填
装置5と、欠損部補填装置5により作成された認識用特
徴量に対して、認識辞書保存装置4に保存されている辞
書を用いて、各文字種毎に類似度を計算する類似度計算
装置6と、類似度計算装置6により各文字種毎に計算さ
れた類似度から、文字画像取り込み装置1により取り込
まれた文字画像の文字種を判定する文字種判定装置7と
から構成したものである。
場合、欠損部分を補填することにより、前述した従来の
ように、欠損の種類や場所に関するあらゆるケースに対
応した文字認識用の辞書を持つ必要がないため、従来と
同じ辞書の大きさで、正常文字(欠損のない文字)に対
する認識精度を低下することなく、欠損文字に対しても
高精度で認識を行なうことが可能となる。また、認識手
法としては、統計的手法やニューラルネット等の従来手
法を、そのまま修正なしで使用することが可能である。
の全文字もしくは一部の文字について、部分が欠損した
文字の認識を行なう文字認識装置において、1文字分の
画像を取り込む文字画像取り込み手段と、文字の欠損の
有無、欠損場所、欠損量に関する情報を取り込む欠損量
・欠損場所入力手段と、文字画像取り込み手段により取
り込まれた文字画像に対して、文字の各場所の局所的な
情報に着目した局所特徴量を計算する局所特徴量計算手
段と、文字認識用の辞書を各文字種毎にあらかじめ保存
する認識辞書保存手段と、欠損量・欠損場所入力手段に
より取り込まれた情報と、局所特徴量計算手段により計
算された局所特徴量と、認識辞書保存手段に保存されて
いる辞書とを用いて、各文字種に対する類似度を計算す
るための、欠損部の特徴を補填した認識用特徴量を作成
する欠損部補填手段と、欠損部補填手段により作成され
た認識用特徴量に対して、認識辞書保存手段に保存され
ている辞書を用いて、各文字種毎に類似度を計算する類
似度計算手段と、類似度計算手段により各文字種毎に計
算された類似度から、文字画像取り込み手段により取り
込まれた文字画像の文字種を判定する文字種判定手段と
を備えるようにしたものである。
は、文字画像取り込み手段にて、1文字分の画像を取り
込み、欠損量・欠損場所入力手段にて、文字の欠損の有
無、欠損場所、欠損量に関する情報を取り込む。そし
て、局所特徴量計算手段にて、取り込まれた文字画像に
対して、文字の各場所の局所的な情報に着目した局所特
徴量を計算する。
情報と、計算された局所特徴量と、あらかじめ保存され
ている辞書とを用いて、各文字種に対する類似度を計算
するための、欠損部の特徴を補填した認識用特徴量を作
成する。そして、作成された認識用特徴量に対して、あ
らかじめ保存されている辞書を用いて、各文字種毎に類
似度を計算し、さらに文字種判定手段にて、各文字種毎
に計算された類似度から、取り込まれた文字画像の文字
種を判定する。
かる場合、欠損部分を補填することにより、前述した従
来のように、欠損の種類や場所に関するあらゆるケース
に対応した文字認識用の辞書を持つ必要がないため、従
来と同じ辞書の大きさで、正常文字(欠損のない文字)
に対する認識精度を低下することなく、欠損文字に対し
ても高精度で認識を行なうことが可能となる。また、認
識手法としては、統計的手法やニューラルネット等の従
来手法を、そのまま修正なしで使用することが可能であ
る。
す機能ブロック図。
象の一例である海外車両ナンバープレートの文字欠損を
説明するための図。
補填の作用を説明するための概念図。
を用いる場合の問題点を説明するための概念図。
る場合の問題点を説明するための概念図。
Claims (1)
- 【請求項1】 文字列の全文字もしくは一部の文字につ
いて、部分が欠損した文字の認識を行なう文字認識装置
において、 1文字分の画像を取り込む文字画像取り込み手段と、 文字の欠損の有無、欠損場所、欠損量に関する情報を取
り込む欠損量・欠損場所入力手段と、 前記文字画像取り込み手段により取り込まれた文字画像
に対して、文字の各場所の局所的な情報に着目した局所
特徴量を計算する局所特徴量計算手段と、 文字認識用の辞書を各文字種毎にあらかじめ保存する認
識辞書保存手段と、 前記欠損量・欠損場所入力手段により取り込まれた情報
と、前記局所特徴量計算手段により計算された局所特徴
量と、前記認識辞書保存手段に保存されている辞書とを
用いて、各文字種に対する類似度を計算するための、欠
損部の特徴を補填した認識用特徴量を作成する欠損部補
填手段と、 前記欠損部補填手段により作成された認識用特徴量に対
して、前記認識辞書保存手段に保存されている辞書を用
いて、各文字種毎に類似度を計算する類似度計算手段
と、 前記類似度計算手段により各文字種毎に計算された類似
度から、前記文字画像取り込み手段により取り込まれた
文字画像の文字種を判定する文字種判定手段と、 を備えて成ることを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26858497A JP3411796B2 (ja) | 1997-10-01 | 1997-10-01 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26858497A JP3411796B2 (ja) | 1997-10-01 | 1997-10-01 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11110486A true JPH11110486A (ja) | 1999-04-23 |
JP3411796B2 JP3411796B2 (ja) | 2003-06-03 |
Family
ID=17460567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26858497A Expired - Lifetime JP3411796B2 (ja) | 1997-10-01 | 1997-10-01 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3411796B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006126348A1 (ja) * | 2005-05-02 | 2006-11-30 | Calsonic Kansei Corp. | ナンバー認識装置及その認識方法 |
JP2014002497A (ja) * | 2012-06-18 | 2014-01-09 | Shindengen Electric Mfg Co Ltd | 電子機器の捺印シンボル検査装置、及びその方法 |
JP2020024640A (ja) * | 2018-08-08 | 2020-02-13 | シャープ株式会社 | 書物電子化装置および書物電子化方法 |
JP2021092999A (ja) * | 2019-12-11 | 2021-06-17 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置及び画像処理装置の制御方法 |
-
1997
- 1997-10-01 JP JP26858497A patent/JP3411796B2/ja not_active Expired - Lifetime
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006126348A1 (ja) * | 2005-05-02 | 2006-11-30 | Calsonic Kansei Corp. | ナンバー認識装置及その認識方法 |
JP2014002497A (ja) * | 2012-06-18 | 2014-01-09 | Shindengen Electric Mfg Co Ltd | 電子機器の捺印シンボル検査装置、及びその方法 |
JP2020024640A (ja) * | 2018-08-08 | 2020-02-13 | シャープ株式会社 | 書物電子化装置および書物電子化方法 |
JP2021092999A (ja) * | 2019-12-11 | 2021-06-17 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置及び画像処理装置の制御方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3411796B2 (ja) | 2003-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6636631B2 (en) | Optical character reading method and system for a document with ruled lines and its application | |
CN109740606B (zh) | 一种图像识别方法及装置 | |
US20110158535A1 (en) | Image processing apparatus and image processing method | |
TWI254891B (en) | Face image detection method, face image detection system, and face image detection program | |
CN106203539B (zh) | 识别集装箱箱号的方法和装置 | |
CN109740417B (zh) | 发票类型识别方法、装置、存储介质和计算机设备 | |
JP6393230B2 (ja) | オブジェクト検出方法及び画像検索システム | |
WO1996024114A2 (en) | Method and apparatus for separating foreground from background in images containing text | |
KR20150137752A (ko) | 문자 인식 방법 및 그 장치 | |
JP2010134957A (ja) | パターン認識方法 | |
CN111242899A (zh) | 基于图像的瑕疵检测方法及计算机可读存储介质 | |
CN111444907A (zh) | 文字识别的方法、装置、设备及存储介质 | |
CN118506067A (zh) | 一种用于电网识别的图像处理方法及系统 | |
CN114581928A (zh) | 一种表格识别方法及系统 | |
CN116596921B (zh) | 一种焚烧炉渣分选方法及系统 | |
CN109598712A (zh) | 塑料泡沫餐盒的质量检测方法、装置、服务器及存储介质 | |
JP3411796B2 (ja) | 文字認識装置 | |
JPH08255223A (ja) | 文字認識装置における類似文字判別方法 | |
Lakshmi et al. | Robust algorithm for Telugu word image retrieval and recognition | |
JP3708383B2 (ja) | パターン認識方法及びパターン認識装置 | |
Jian et al. | Key point location method for pedestrians in depth images based on deep learning | |
CN117788860A (zh) | 一种基于图像识别的图书封面污损智能检测方法 | |
JP4231375B2 (ja) | パターン認識装置、パターン認識方法、パターン認識プログラムおよびパターン認識プログラムを記録した記録媒体。 | |
Virajitha et al. | Simple and effective techniques for skew correction, slant correction and core-region detection for cursive word recognition | |
Patil et al. | Character recognition using 2D view and support vector Machine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20030225 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080320 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090320 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100320 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110320 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110320 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120320 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130320 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140320 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term |