JPH0218689A - 文字認識装置および文字認識方法 - Google Patents

文字認識装置および文字認識方法

Info

Publication number
JPH0218689A
JPH0218689A JP63169709A JP16970988A JPH0218689A JP H0218689 A JPH0218689 A JP H0218689A JP 63169709 A JP63169709 A JP 63169709A JP 16970988 A JP16970988 A JP 16970988A JP H0218689 A JPH0218689 A JP H0218689A
Authority
JP
Japan
Prior art keywords
character
similar
characters
file
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63169709A
Other languages
English (en)
Inventor
Kozo Tomono
伴野 浩三
Fumio Yoda
依田 文夫
Keiji Kobayashi
啓二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP63169709A priority Critical patent/JPH0218689A/ja
Publication of JPH0218689A publication Critical patent/JPH0218689A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業−1−の利用分野〕 この発明は、帳票などの記録媒体から読みとった文字の
認識を行う文字認識装置ならびに文字認識方法に関する
ものである。
〔従来の技術〕
従来、帳票などから文字を読みとって自動的に認識する
文字認識装置としては例えば特公昭53−46062号
公報に示されたようなものがあり、第4図にこのような
従来の文字認識装置のブロック図を示す。この第4図に
おいて(1)は帳票等に記録された文字を走査して光電
変換し画像情報としての入力文字パターンを得る読みと
り手段、(2)はその入力文字パターンを記憶する記憶
手段、 (2])は帳票等に記録される可能性のある文
字の標準字形を標準文字パターンとして登録した文字フ
ァイル(22)はこの文字ファイル(21)中の標準文
字パターンと上記人力文字パターンとを重ね合わせて両
者の整合の度合(これを類似度という)を求め、その類
似度が最大の標準文字パターンを抽出する抽出手段、 
(23)はこの抽出手段(22)の抽出した標準文字パ
ターンか所定条件を満足するか否かを判定し判定結果を
出力手段(5)に送出する判定手段である。
このような装置においては、読みとり手段(1)により
帳票]−の文字を読みとって画像情報としての入力文字
パターンを得、これを記憶手段(2)に記憶する。次に
抽出手段(22)はこの入力文字パターンと 文字ファ
イル(21)中の全標準文字パターンとの類似度を逐−
求め、最大類似度の標準文字/XHターンを抽出する。
ついて判定手段(23)は、その最大の類似度とその次
ぎに大きい類似度との間に所定値以1−の差かあるか等
の条件を調へ、その条件が満足されている場合にJ−記
抽出された最大類似度の標準文字パターンの文字コード
を出力手段(5)に送出し、また満足していなければ認
識不能を示す信号を出力手段(5)に送出する。このと
き、精度の高い文字認識を行うためには文字ファイル(
21)へは帳票に記録される可能性のある文字をすべて
登録しておき、その登録された全文字について入力文字
に対する類似度を調べる必要があった〔発明が解決しよ
うとする課題〕 以」−のような従来の文字認識装置にあっては。
例えば英数字、ひらがな、カタカナのほか漢字をも認識
するような認識すべき字数の多い場合2文字認識を高い
精度で行うためには帳票に記録される可能性が少しでも
ある文字を全て文字ファイルに登録しておき、その登録
された全文字と入力文字との類似度を逐一計算して文字
認識を行わねばならず、認識処理に時間がかかるという
問題点があった。
この発明はこのような問題点を解決するためになされた
もので、認識精度を低下させることなく高速に文字認識
の行える文字認識装置および文字認識方法を得ることを
目的とする。
〔課題を解決するための手段〕
この発明に係る文字認識装置は所定個の文字が登録され
た第1文字ファイルと、この第1文字ファイル中の文字
と異なる文字が登録された第2文字ファイルと、  l
−記憶1または第2文字ファイルの中から1人力された
文字と類似する文字をそれぞれ第1または第2類似文字
として抽出する抽出手段と、この抽出手段により抽出さ
れた類似文字に基づいて上記人力文字の判定を行う判定
手段と上記第1類似文字に予じめ付与された第2類似文
字抽出要否情報に基づき、上記抽出手段による上記第2
類似文字の抽出動作の実行・不実行を制御する制御手段
とを備えたものである。
また、この発明に係る文字認識方法は所定個の文字が登
録された第1文字ファイルと、この第1文字ファイル中
の文字と異なる文字が登録された第2文字ファイルを用
意し、−上記第1文字ファイルから、入力された文字を
第1類似文字として抽出した後、この抽出された第1類
似文字に予じめ付与された情報に基づき、」−記憶2文
字ファイルから」−記入力文字に類似した文字を第2の
類似文字として抽出する動作の要否を決定し“要”と決
定された場合のみ−1−記入力文字に類似した文字を第
2の類似文字として抽出し、上記第1および第2類似文
字に基ついて上記入力文字の判定を行うようにしたもの
である。
〔作用〕
この発明においては、第1文字ファイルから抽出された
第1類似文字に予じめ付与された情報に基づき、第2文
字ファイルからの第2類似文字の抽出動作要否が決定さ
れ “要”と決定された場合のみその第2類似文字が第
2文字ファイルから抽出され第1.第2類似文字に基づ
いて高精度で確実な入力文字の判定がなされるとともに
“否”と決定された場合にはL記憶1文字ファイルから
のみ類似文字を抽出して入力文字を判定することにより
、短時間の文字認識処理が行われる。
〔発明の実施例〕
第1図はこの発明の一実施例を示す文字認識装置のブロ
ック図であり、(1)〜(3)は上記従来例と同様のも
のである。(4)は所定個の文字2例えばひらがな、教
育漢字などの文字を画像情報の文字パターンとして登録
した第1文字ファイル、(5)はこの第1文字ファイル
(4)中の文字と異なる文字1例えば教育漢字以外の常
用漢字を文字パターンとして登録した第2文字ファイル
、(6)は上記第1文字ファイル(4)中の各文字に対
応して付与され、その各文字に字形の類似した文字が上
記第2文字ファイルに登録されているか否かを1または
0で示す情報を保持した情報テーブル、(7)は」−記
憶1文字ファイル(4)または第2文字ファイル(5)
から、入力文字に字形が類似した文字を第1または第2
の類似文字として抽出する抽出手段、(8)はこの抽出
手段(7)の類似文字抽出動作を制御する制御手段(9
)は上記抽出手段(7)の抽出した類似文字に基つき入
力文字の判定を行い、その判定結果を出力手段(3)に
送出する判定手段である。
このような構成の文字認識装置においては、第2図のフ
ローチャートに従って文字認識動作が行われる。まず帳
票」二の文字を読みとり手段(1)により読みとって入
力文字のパターンを得、記憶手段(2)に記憶する(ス
テップ(10乃。次に抽出手段(7)によりこの入力文
字に字形類似する文字を第1文字ファイル(4)から第
1類似文字として抽出する。即ち、第1文字ファイル(
4)中の全文字の文字パターンについて入力文字の文字
パターンとの類似度を逐−求め(ステップ(11))、
そのうち類似度最大でかつ所定条件を満足する文字を第
1類似文字C3として抽出する(ステップ(+2))の
である。
このときの類似度は2例えば入力文字パターンと第1文
字ファイル中の文字パターンを重ねあわせたときの整合
の度合により示されるもので、それぞれのパターンを、
白領域が−1,黒領域が1で示される2値行列P= [
p+、+]、 Q−[Q 、J]で表すとき次11PI
I・1lQ11X/ΣP+、+X、/ΣQIJNここで
分子は上記2つの行列の要素一致数2分母Nは行列の全
要素数である。なおP、Qはベクトル、P、Qはスカラ
ーを表す。
またステップ(12)の所定条件とは、最大類似度の文
字をC1,その次に類似度の大きい文字をCjとしそれ
ぞれの文字の類似度をSi、 Sjとしたとき次式で表
されるものである。
Si>TH,から s i −S j> T H2−−
−−−−(2)ここでTH,、TH,は所定の閾値であ
る。
次に制御手段(8)は情報テーブル(6)に保持され上
記第1類似文字Ciに対応して付与されている情報を参
照する。この情報は、“1”であればその第1類似文字
に字形の類似した文字が第2文字ファイル(5)に登録
されており、“O”であれば登録されていないことを示
すものである。従ってこの情報が“l”であれば第2文
字ファイル(5)中の文字も調べて精度よい文字認識を
行うべきでありまた“0”であれば第2文字ファイル(
5)中の文字まで調べる必要はないので、第1文字ファ
イル(4)のみ用いた文字認識を行い、処理時間の短縮
を図るべきである。従って制御手段(8)はこの情報に
より第2文字ファイルからの類似文字抽出動作の要否を
決定する(ステップ(+3))。ステップ(13)で“
要”と決定された時は、さらに入力文字と第2文字ファ
イル(5)中の全ての文字との類似度を求め(ステップ
(14))、入力文字に類似する文字を第2類似文字と
して抽出し2判定手段(9)は上記憶1、第2類似文字
に基づいて入力文字がとの文字であるか判定を行う。つ
まり第1.第2文字ファイル(4)、 (5)中の全文
字の中で類似度最大、かつ(2)式の条件を満足する文
字を人力文字として判定し、その文字の文字コートを出
力手段(3)に出力する(ステップ(15))。ここで
、類似度最大の文字が上記(2)式の条件を満足しない
場合には“認識不能”を示す信号を送出する。
また ステップ(13)で“否”と決定された時は判定
手段(9)は第1類似文字が入力文字であると判定しそ
の文字コードを出力手段(3)に送出する(ステップ(
16))。
従って、ステップ(13)において第2類似文字抽出動
作が“要”と決定された場合には第1.第2文字ファイ
ル(4)、 (5)を両方共用いた細かく正確な文字認
識がなされ、また“否”と決定された場合には第1文字
ファイル(4)のみを用いて精度に影響することな(処
理時間が短縮された文字認識が行われる。
第3図は入力文字“徴”(16)を認識する過程を示し
た説明図であり、この場合、第1文字ファイル(4)に
は“街”(17)、第2文字ファイル(5)には“徴”
 (1g)が登録されており、かつ情報テーブル(6)
において“街”(17)に対応して付与された情報は“
1”(19)が記憶保持されている。また」1記(2)
式のT H、、T H、はそれぞれT H、=0.6.
 T HO,1とする。
まず入力文字“徴”(16)が読みとられて記憶され、
この入力文字に対する第1文字ファイル(4)中の各文
字の類似度が求められ、その中で類似度最大かつ(2)
式を満足する文字“街”(17)が抽出される。次に情
報テーブル(6)を参照するとこの“街”(17)に対
応して“1”(19)が記憶されているのて制御手段(
8)は第2文字ファイル(5)からの検索を行い、この
第2文字ファイル(5)中の各文字について人力文字と
の類似度を求める。すると、このような第1.第2の文
字ファイル(4)、(5)の検索の結果2両文字ファイ
ルに登録された全ての文字の中で類似度最大の文字C1
は第2文字ファイル(5)に登録されていた“徴”(1
g)(類似度S i=0.9)その次に類似度の大きい
文字Cjは第1文字ファイル(4)に登録されていた“
街”(17)(類似度5j07)かそれぞれ該当する。
そしてこれらCi、 Cコの類似度Si、 Sjは(2
)式を満足することから“徴”(18)が認識結果(2
0)として出力手段(3)に出力されることになる。
帳票に使われる頻度の大きい文字が、上記のようなひら
がな、教育漢字といった高々1000文7程度モある場
合、第1文字ファイルにこれらの文字を登録しておき7
第2文字ファイルにはそれらの文字に類似し、帳票に記
録される可能性が少しでもある文字を登録しておくとい
うような文字ファイルのつくり方をすれば効率的な文字
認識処理が(I2) 可能になる。
なお上記実施例では、情報テーブル(6)に、第1文字
ファイル(4)中の各文字に対し2字形の類似した文字
が第2文字ファイル(5)に登録されているか否かを示
す情報を保持するようにしたが この情報はこれに限ら
ず、用途に応じて例えば字形類似のかわりに、音として
発音したときの音声パターンの類似を示すなと別の意味
をもつ情報としてもよい。また、この情報は上記実施例
のような情報テーブルに保持する方法とは別の方法で第
1文字ファイルの各文字に付与するようにしても同様の
効果がある。
また、上記実施例では第1類似文字を1文字抽出するも
のを示したが、これを複数文字抽出するようにして同様
の処理を行ってもよい。
さらに上記実施例では、各文字の文字パターン即ち文字
の全体的な字形が類似したものを抽出するものについて
説明したが2例えば文字の部分的な類似を調べたり、ま
た各文字の音声パターンの類似を調べて抽出するものに
適用しても同様の効果かある。
〔発明の効果〕
以」−のように、この発明によれば、第1文字ファイル
から抽出された第1類似文字に予じめ付与された情報に
基づき、第2文字ファイルからの第2類似文字の抽出動
作要否か決定され、 “要”と決定された場合には上記
第1および第2類似文字に基づいて高精度で確実な入力
文字の判定がなされ、また°“否”と決定された場合に
は第2文字ファイルから類似文字を抽出することなく」
1記第1類似文字のみから入力文字の判定がなされ短時
間の認識処理が行われるので、認識の精度を低下させる
ことなく高速に文字認識が行えるという効果がある。
【図面の簡単な説明】
第1図はこの発明の一実施例を示す文字認識装置を示す
プロ7り図、第2図はその動作を示すフローチャート、
第3図は文字認識の過程を示す説明図、第4図は従来の
文字認識装置のブロック図である。 図において、(4)は第1文字ファイル、(5)は第2
文字ファイル、(6)は情報テーブル、(7)は抽出手
段(8)は制御手段、り9)は判定手段を示す。 なお、各図中同一符号は同一または相当部分をボす。

Claims (2)

    【特許請求の範囲】
  1. (1)所定個の文字が登録された第1文字ファイルと、
    この第1文字ファイル中の文字と異なる文字が登録され
    た第2文字ファイルと、上記第1または第2文字ファイ
    ルの中から、入力された文字と類似する文字をそれぞれ
    第1または第2類似文字として抽出する抽出手段と、こ
    の抽出手段により抽出された類似文字に基づいて上記入
    力文字の判定を行う判定手段と、上記第1類似文字に予
    じめ付与された第2類似文字抽出要否情報に基づき上記
    抽出手段による上記第2類似文字の抽出動作の実行・不
    実行を制御する制御手段とを備えたことを特徴とする文
    字認識装置。
  2. (2)所定個の文字が登録された第1文字ファイルと、
    この第1文字ファイル中の文字と異なる文字が登録され
    た第2文字ファイルとを用意し、上記第1文字ファイル
    から、入力された文字を第1類似文字として抽出した後
    、この抽出された第1類似文字に予じめ付与された情報
    に基づき、上記第2文字ファイルから上記入力文字に類
    似した文字を第2の類似文字として抽出する動作の要否
    を決定し“要”と決定された場合のみ上記入力文字に類
    似した文字を第2の類似文字として抽出し、上記第1お
    よび第2類似文字に基づいて上記入力文字の判定を行う
    ようにしたことを特徴とする文字認識方法。
JP63169709A 1988-07-07 1988-07-07 文字認識装置および文字認識方法 Pending JPH0218689A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63169709A JPH0218689A (ja) 1988-07-07 1988-07-07 文字認識装置および文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63169709A JPH0218689A (ja) 1988-07-07 1988-07-07 文字認識装置および文字認識方法

Publications (1)

Publication Number Publication Date
JPH0218689A true JPH0218689A (ja) 1990-01-22

Family

ID=15891415

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63169709A Pending JPH0218689A (ja) 1988-07-07 1988-07-07 文字認識装置および文字認識方法

Country Status (1)

Country Link
JP (1) JPH0218689A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5581871A (en) * 1993-04-27 1996-12-10 Toyo Denso Kabushiki Kaisha Process for producing pulse generator

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5581871A (en) * 1993-04-27 1996-12-10 Toyo Denso Kabushiki Kaisha Process for producing pulse generator

Similar Documents

Publication Publication Date Title
JPH0520500A (ja) 文書認識装置
JP3727995B2 (ja) 文書処理方法及び装置
JPH0218689A (ja) 文字認識装置および文字認識方法
JPH0247788B2 (ja)
JP2746345B2 (ja) 文字認識の後処理方法
JPS59158482A (ja) 文字認識装置
JP2939945B2 (ja) ローマ字住所認識装置
JPS63188284A (ja) 文字読取装置
JPH0347554B2 (ja)
JPS63316288A (ja) 文字認識装置
JPS61133487A (ja) 文字認識装置
JPH06139277A (ja) 電子辞書装置
JPS6318483A (ja) 光学的情報入力装置用文字認識方法
JPH05114043A (ja) 光学式文字読取装置の読取制御方法
JPH03273361A (ja) 電子辞書
JPH0318987A (ja) 辞書登録方法
JPH01201789A (ja) 文字読取装置
JPH02136970A (ja) 英単語検索装置
JPS61251984A (ja) マルチフオント活字文字認識装置
JPH06149889A (ja) 電子ファイリングシステム
JPS62281090A (ja) パタ−ン情報認識方法
JPH0922441A (ja) 光学文字読取装置
JPS5935469B2 (ja) 複数の文字セツトの読取りに適した文字認識方式
JPH0636069A (ja) 文字認識装置
JPS6327992A (ja) 個人用辞書作成方法