JPH01277983A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPH01277983A
JPH01277983A JP63108641A JP10864188A JPH01277983A JP H01277983 A JPH01277983 A JP H01277983A JP 63108641 A JP63108641 A JP 63108641A JP 10864188 A JP10864188 A JP 10864188A JP H01277983 A JPH01277983 A JP H01277983A
Authority
JP
Japan
Prior art keywords
character
reading
candidate character
candidate
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63108641A
Other languages
English (en)
Inventor
Atsushi Tsukumo
津雲 淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63108641A priority Critical patent/JPH01277983A/ja
Publication of JPH01277983A publication Critical patent/JPH01277983A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は文字認識の最終的な読取り出力の決定方式に関
する。
(従来技術とその問題点) 情報処理ンステムの多様化に伴ないデータ入力方法が要
求されており、文字認識技術も有力なデータ人力方法と
して実用化されている。しかし現在の文字認識技術は、
文字の読取り性能、読取り対象字種、文字読取りを行な
う環境の制約等の点で、人間の文字読取り能力に比べて
はるかに劣っており、使いやすい文字認識装置を提供す
るためには、種々の解決しなければならない問題がある
文字認識装置は、すへての文字を正しく読取れることが
理想であるが、この理想を実現できる文字認識技術は現
在はまだ存在しない。そこで文字認識結果が正しい場合
と、誤った場合とが起こり、一般にはオペレーターが誤
った認識結果をさがして、修正するという作業が必要に
なる。もし誤認識の場合が頻繁に起こると、オペレータ
ーにとって誤認識の箇所をさがす作業の負担が非常に重
くなる。そのために、一般の文字認識装置では、文字読
取り結果の信頼性が低いと判断した場合には、読取りを
棄却したことを示すコードを出力する機能を持たせてい
る。読取り棄却の機能を付加すると、正しい読取り結果
が棄却されることも起こるために、読取り結果を修正す
る箇所がふえるという欠点が生じる反面、誤認識の箇所
をさがすという作業がはるかに軽減できるという利点が
生じる。現実にはこの欠点と利点とのトレードオフで、
どの程度の信頼性のときに、読取りを棄却すべきか否か
を決定する部分が設計される。読取りの棄却手段には、
文字認識処理に依存するが、主に以下の2種類に分類で
きる。第1の棄却手段は、文字認識処理の中の特徴抽出
処理で得られる入力文字パタンの特徴間を用いて棄却す
べきか否かを決定する。第2の棄却手段は、文字認識処
理の中の分類、識別処理で得られる入力文字パタンと各
読取対象文字との類似性或いは相違の度合を示す評価量
を用いて棄却すべきか否かを決定する。第1の棄却手段
は第2の棄却手段に比べて厳密な検査が行なえるが、そ
の反面、処理が複雑になり、同時に文字認識処理への依
存度が高いために棄却手段の更新が簡単に行なえないと
いう問題点がある。第2の棄却手段は、文字認識処理と
の依存度が高くないために、比較的簡単な処理で実現で
きるという利点を持っている。第2の棄却手段としては
、第1位候補文字の評価量D1と第2位候補文字の評価
量D2との比を信頼性の尺度とする方法、第1位候補文
字の評価量D1と第2位候補文字の評価量との差を信頼
性の尺度とする方法、第1位候補文字の評価量D1が評
価量の許容領域内に入っているか否かを閾値処理で求め
る方法等が考えられているが、それぞれ一長一短があり
、取りたてて目立った効果は得られていない。従って、
文字認識装置の開発時点で、大量のデータを使った認識
実験を行ない、認識結果の信頼性の尺度を実験的に定め
てから、最終的な読取り棄却処理の設計を決定すること
が一般的であった。実際に文字認識装置を運用する場合
には、開発時点で行なった認識実験とはやや異なる認識
傾向を示すこともあり得るために、文字認識結果の棄却
手段は容易に更新できることが、保守性の点から必要で
あるが、実験的に決定された設計では、保守性の点で柔
軟な対応ができないという問題点があった。
(問題点を解決するための手段) 本発明によると、個別の文字パタンを入力し、認識結果
として、決定された読取り文字コードまたは読取り棄却
を示すコードを出力する文字認識方式において、イメー
ジ情報としての文字パタンを入力し、前処理、特徴抽出
処理を行なって得られる特徴パタンと登録されている各
読取り対象文字の参照パタンとの間でベクトル演算によ
って評ai量を算出し、候補文字の順位付けを行ない、
上位から2個の候補文字コードと評価量と入力された文
字パタンとを示す信号を出力する文字分類部と、前記文
字分類部から出力される第1位候補文字の評価量D1と
第2位候補文字の評価MD2とで定まる2次元平面上の
点(D1,D2 )が、2次元平面上の区分線形関数ま
たは曲線を示す関数f (x、y)=0で定められる読
取り領域内に属するか否かで第1位候補文字と読取り文
字とするか、読取り棄却結果とするかを決定し、読取り
文字コードまたは読取り棄却を示すコードを出力する文
字判定部と、前記文字分類部から出力される候補文字コ
ードと評価量と入力されたパタンとを示す信号を一時的
に格納し、一時的に格納された各文字パタンに正解文字
コードを外部から回加する修正機構を有し、正解文字コ
ードと第1位と第2位の候補文字コードと評価量とを記
憶単位として格納する文字分類結果記憶部と、前記文字
分類結果記憶部から、格納されている正解文字コードと
第1位と第2位の候補文字コードと評価量とを読み込み
、正解文字コードと第1位候補文字コードとを比較する
ことによって分類結果が正解であるか否かを判定し、正
解であった場合の第1位候補文字の評価量D1と第2位
候補文字の評価量D2との組(D1,D2)を要素とす
る集合を第1のクラス、第1位候補文字が正解でない場
合の第1位候補文字の評価量D1と第2位候補文字の評
価量D2との組(D1,D2)を要素とする集合を第2
のクラスとし、第1のクラスの各要素と第2のクラスの
各要素とを2次元XI  y平面上の点として第1のク
ラスと第2のクラスの分布状態をディスプレイ上に表示
し、ポインティングデバイスによってディスプレイデバ
イス上に複数の点を指定する機構を有し、指定された複
数の点から第1のクラスと第2のクラスとを判別する区
分線形関数または曲数を示す関数f (x、7)=Qを
決定し、関数f (x、y)=Oを前記文字判定部の読
取り領域の境界を示す関数f (x、 Y) =0を示
す信号として前記文字判定部に送り、出す判定関数作成
部とを具備し、文字分類結果の第1位候補文字の評価量
と第2位候補文字の評価量との2次元的な分布から、第
1位候補文字を読取り結果として出力するか、読取り棄
却を読取り結果として出力するかを決定する判別関数を
、判別関数設計者が、容易に設計できることを特徴とす
る文字認識方式が実現できる。
(作用) 以下図面を用いて本発明の原理について説明する。
第2図は第1位候補文字の評価量D1と第2位候補文字
の評価量D2の分布の例と、文字読取り棄却のための理
想的な判別曲線f (x、  y) =0の例とを示す
図であり、Q印は第1位候補文字が正解文字と一致する
場合で、X印は第2位候補文字が正解文字と一致しない
場合を示している。またこの例において、評価量は文字
認識でよく適用されるユークリッド距離、市街区距離の
ように、正の値をとり、0に近い値をとるほど2つの文
字パタンの相違の度合いが少ないことを示す尺度とする
。また候補文字の順位は、評価量の少ない順に定めるこ
とにする。ぞのために、評価fitD、と評価量D2と
の間には、常に り、≦D2 という関係が成立する。
第2図において、 f (D+ 、D2 ) >0 のときに第1位候補文字を読取り結果として出力し、 f (Dl、D2 )≦O のときに読取り棄却を結果として出力すると高い精度の
文字読取り棄却の判定が行なえる。第3図(a)は評価
量D1と評価量D2の差を読取り棄却の判定に用いた場
合、第3図(b)は評価量D1と評価i D 2の比を
読取り棄却の判定に用いた場合を示す例である。第3図
(a)に示すように、差を用いた場合には D2−D、−〇〉O のときに第1位候補文字を読取り結果として出力し、 D2−D、−〇≦0 のときに読取り棄却を結果として出力することになるが
、この例では、文字読取り棄却の判定がうまく行なえて
いるとはいえない。第3図(b)に示すように比を用い
た場合には、 D2−θD+>0 のときに第1位候補文字を読取り結果として出力し、 D2−θD≦0 のときに読取り棄却を結果として出力することになるが
、この例では第3図(a)の例よりは高精度の文字読取
り棄却の判定がうまく行なえているが、第2図の例より
は劣っている。
このように評価ff1D、と評価量D2の分布に依存し
て、文字読取り棄却の判定を行なうことが、高精度の判
定を実現するためには、重要である。
しかし様々な場合において理想的な判定曲線f(x、Y
)=0を評価量D1と評価量D2の分布だけから自動的
に決定することは、現在のパタン認識技術にとっては困
難である。そこで、第4図に示すように評価量D1と評
価量D2の分布を第1位候補文字が正解であるか否かが
識別できるようにディスプレイデバイス上に表示し、判
定関数の設計者がポインティングデバイスによって、第
4図のPI、P2.P3.P4のようにディスプレイデ
バイス上に折線の関数を作成し、区分線形関数または近
似曲線で定まる関数f (x、y)=Oを理想的な判定
曲線f (x、Y)=Oのかわりに用いることで、高精
度の文字読取り棄却処理が実現でき、また判定関数f 
(x、y)=Oの更新が容易に行なえる。従って実際の
運用の場面での文字認識結果の傾向が、文字認識装置の
開発時点での読取り実験の傾向と異なっていても文字読
取り棄却手段の柔軟な更新を行なうことができ、文字認
識装置の効果的な運用を可能とし、かつ保守性を高める
ことができる。
(実施例) 第1図は本発明の構成の一実施例を示すプロ。
り図である。
文字分類部1は、入力文字パタンを信号11として読み
込み、読取り対象文字の中で最も類似していると判定さ
れた第1候補文字と、2番目に類似していると判定され
た第2候補文字の文字コードC1と02及び評価量D1
とD2及び入力文字パタンを信号12として出力するも
ので、通常の文字認識装置で適用されている技術によっ
て実現されるものである。
文字分類結果記憶部2は、前記文字分類部lから信号1
2として出力された第1位候補文字と第2位候補文字の
文字コードC4とC2及び評価量り1,D2および入力
文字パタンを一時的に格納し、一時的に格納された各文
字パタンに対して、修正機構を通じて、外部から正解文
字コードを付加し、正解文字コードC8と第1位候補文
字と第2位候補文字の文字コーPC,と02及び評価■
D、とD2とを記憶単位として格納すもるので、通常の
記憶手段と通常の光学的文字読取装置の修正手段によっ
て実現される。
判別関数作成部3は、前記文字分類結果記憶部2に格納
されている正解文字コードC8と第1候補文字と第2候
補文字の文字コードCIと02及び評価ff1D、とD
2及び入力文字パタンを信号13として読み込み、第1
候補文字コードCIが正解と文字コードC8と一致する
場合には第1のクラスAI、正解と一致しない場合には
第2のクラスA2に属するものとして分類し、第1のク
ラスA、に属する評価値D1と評価値D2の組を(D室
、D2)、第2のクラスA2に属する評価値D1と評価
値D2の組を(D′)ゝID’N’)としたとき、多数
の評価量の組(D1,D2)と(D。
、D2)とを第2図で示したように、異なった属性を持
つ二次元平面上の点として同時にディスプレイデバイス
に表示し、第4図を用いて説明したように、設計者がポ
インティングデバイスで複数個の点を指定することによ
って、文字読取り棄却の判別関数を示す情報を信号14
として出力するもので詳細は後述する。文字判定部4は
、前記判別関数作成部から信号14として出力された最
新の判別関数を文字読取り棄却の判別関数f(x。
y)とし、前記文字分類部1から信号12として出力さ
れた第1位候補文字と第2位候補文字の文字コードC8
とC2及び評価量D1とD2を読込み、もし判別関数が
f (D+ 、D2 )>Oを満たす場合には第1位候
補文字の文字コードCIを読取り結果信号10として出
力し、一方もし判別関数がf (D8.D2 )≦0を
満たす場合には文字読取り棄却を示すコードを読取り結
果信号10として出力するもので、通常の文字認識装置
で適用されている技術で実現できる。
第5図は前記判別関数作成部3の構成の例を示すブロッ
ク図である。
正解判定部31は、信号13として入力した情報のうち
、正解文字コードC8と、第1位候補文字コードC8と
を比較し、第1位候補文字コードC8が正解と一致して
いるか否かを判定し、一致している場合には、前記第1
のクラスA、に属することを示すフラッグ情報を、一致
しない場合には前記第2のクラスA2に属するかを示す
フラッグ情報を、2つの評価値D1とD2と信号301
として出力するもので、通常の情報機器につかわれてい
る技術によって容易に実現できる。判別分布情報記憶部
32は、前記正解判定部31から信号301として出力
されたクラスを示すフラッグ情報と2つの評価値D1と
D2とを格納する通常の記憶手段である。判別関数標本
指定部33は、前記判別分布情報記憶部から信号302
として多数の前記第1のクラスA+の評価値の組(Dl
D2)と多数の前記第2のクラスA2の評価の組(D1
,D2)を読み込み、パーソナル・コンピュータ等で使
用されているようなディスプレイデバイス上に2つのク
ラスAtとA2の各評価値の組(D1,D2)の第2図
で示されたような人間にとって識別可能な分布を表示し
、マウス等のポインティングデバイスを用いて判別関数
の設計者が、第4図に示されるような判別関数を定める
ためのx−y平面上の複数の点を指定できる機能を有し
、指定された複数の点の座標値を信号303として出力
するもので、通常の情報機器に使われている技術によっ
て容易に実現できる。判別関数算出部34は、前記判別
関数標本点指定部33から信号303として出力された
複数の点の座標値を入力して、区分線形関数または二次
関数、指数関数等の曲線関数の近似関数を算出し、文字
読取り棄却判別関数を示す情報を信号14として出力す
るもので、従来の情報機器、計算機器の技術で容易に実
現できる。
また文字分類部1の出力情報として2位以降の候補文字
の文字コードと評価値を付加することは容易に実現でき
る。また文字判定部4の出力情報として複数の候補文字
と文字パタンを付加することも容易に実現できる。
(発明の効果) 以上のように本発明によれば、文字分類結果の傾向を反
映した文字読取り棄却判別処理を実現することができ、
さらに判別処理を柔軟に更新することができるので、文
字認識装置の性能を引きだす効果的には運用性と高い保
守性によって、情報処理システムの入力装置の性能向上
に大きく役立つ。
【図面の簡単な説明】
評価値D1と第2位候補文字の評価値D2の分布と、判
別関数を用いた文字読取り棄却処理を説明するための図
、第3図(a)、(b)は従来の方法で文字読取り棄却
処理を行なった場合の例を示す図、第4図は二次元平面
上に複数の点を指定することによって文字読取り棄却判
別関数の近似関数が求められることを示す図、第5図は
前記判別関数作成部3の構成例を示す図である。 図において、1は文字分類部、2は文字分類結果記憶部
、3は判別関数作成部、4は文字判定部、31は正解判
定部、32は判別分布情報記憶部、33は判別関数標本
点指定部、34は判別関数算出部である。

Claims (1)

    【特許請求の範囲】
  1. 個別の文字パタンを入力し、認識結果として、決定され
    た読取り文字コードまたは読取り棄却を示すコードを出
    力する文字認識方式において、イメージ情報としての文
    字パタンを入力し、前処理、特徴抽出処理を行なって得
    られる特徴パタンと登録されている各読取り対象文字の
    参照パタンとの間でベクトル演算によって評価量を算出
    し、候補文字の順位付けを行ない、上位から2個の候補
    文字コードと評価量と入力された文字パタンとを示す信
    号を出力する文字分類部と、前記文字分類部から出力さ
    れる第1位候補文字の評価量D_1と第2位候補文字の
    評価量D_2とで定まる2次元平面上の点(D_1,D
    _2)が、2次元x,y平面上の区分線形関数または曲
    線を示す関数f(x,y)=0で定められる読取り領域
    内に属するか否かで第1位候補文字を読取り文字とする
    か、読取り棄却結果とするかを決定し、読取り文字コー
    ドまたは読取り棄却を示すコードを出力する文字判定部
    と、前記文字分類部から出力される候補文字コードと評
    価量と入力された文字パタンとを示す信号を一時的に格
    納し、一時的に格納された各文字パタンに正確文字コー
    ドを外部から付加する修正機構を有し、正解文字コード
    と第1位と第2位候補文字コードと評価量とを記憶単位
    として格納する文字分類結果記憶部と、前記文字分類結
    果記憶部から、格納されている正解文字コードと第1位
    と第2位の候補文字コードと評価量とを読み込み、正解
    文字コードと第1位候補文字コードとを比較することに
    よって分類結果が正解であるか否かを判定し、正解であ
    った場合の第1位候補文字の評価量D_1と第2位候補
    文字の評価量D_2との組(D_1,D_2)を要素と
    する集合を第1のクラス、第1位候補文字が正解でない
    場合の第1位候補文字の評価量D_1と第2位候補文字
    の評価量D_2との組(D_1,D_2)を要素とする
    集合を第2のクラスとし、第1のクラスの各要素と第2
    のクラスの各要素とを2次元x、y平面上の点として第
    1のクラスと第2のクラスの分布状態をディスプレイ上
    に表示し、ポインティングデバイスによってディスプレ
    イデバイス上に複数の点を指定する機構を有し、指定さ
    れた複数の点から第1のクラスと第2のクラスとを判別
    する区別線形関数または曲線を示す関数f(x、y)=
    0を決定し、関数f(x、y)=0を前記文字判定部の
    読取り領域の境界を示す関数f(x、y)=0を示す信
    号として前記文字判定部に送り出す判定関数作成部とを
    具備し、文字分類結果の第1位候補文字の評価量と第2
    位候補文字の評価量との2次元的な分布から、第1位候
    補文字を読取り結果として出力するか、読取り棄却を読
    取り結果として出力するかを決定する判別関数を、判別
    関数設計者が、容易に設計できることを特徴とする文字
    認識方式。
JP63108641A 1988-04-28 1988-04-28 文字認識方式 Pending JPH01277983A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63108641A JPH01277983A (ja) 1988-04-28 1988-04-28 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63108641A JPH01277983A (ja) 1988-04-28 1988-04-28 文字認識方式

Publications (1)

Publication Number Publication Date
JPH01277983A true JPH01277983A (ja) 1989-11-08

Family

ID=14489946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63108641A Pending JPH01277983A (ja) 1988-04-28 1988-04-28 文字認識方式

Country Status (1)

Country Link
JP (1) JPH01277983A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014115781A (ja) * 2012-12-07 2014-06-26 Hitachi Information & Telecommunication Engineering Ltd 文字認識装置及び方法、文字認識プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014115781A (ja) * 2012-12-07 2014-06-26 Hitachi Information & Telecommunication Engineering Ltd 文字認識装置及び方法、文字認識プログラム

Similar Documents

Publication Publication Date Title
US5555320A (en) Pattern recognition system with improved recognition rate using nonlinear transformation
US4607384A (en) Fingerprint classification arrangement
EP0114250B1 (en) Confusion grouping of strokes in pattern recognition method and system
US6564206B1 (en) Information search apparatus and method, and storage medium
US5467407A (en) Method and apparatus for recognizing cursive writing from sequential input information
US6876766B2 (en) Reshaping freehand drawn lines and shapes in an electronic document
US5020117A (en) Handwritten character string recognition system
KR100255736B1 (ko) 온라인 문자 인식 장치
US5133063A (en) Method and system for outputting program change effect information to a user
KR102092263B1 (ko) 일정한 처리 시간 내에 k개의 극값을 찾는 방법
JPS60204086A (ja) 物体識別装置
Sablatnig et al. Automatic reading of analog display instruments
CN101553825B (zh) 基于字典模式来识别输入模式的模式识别设备
US5105470A (en) Method and system for recognizing characters
US5177793A (en) Accurate recognition of input patterns
JPH01277983A (ja) 文字認識方式
CN115438129A (zh) 结构化数据的分类方法、装置及终端设备
JP6487100B1 (ja) 帳票処理装置及び帳票処理方法
JPS59197974A (ja) 文字認識装置
US20050090994A1 (en) Computing a residue fingerprint for a molecular structure
JP3466903B2 (ja) 文字認識用マルチテンプレート辞書作成方法
JP4261831B2 (ja) 文字認識処理方法、文字認識処理装置、文字認識プログラム
JP2001118073A (ja) パターン認識装置及び認識方法
KR960001102B1 (ko) 수서인식 시스템에서의 케이스 혼동을 해결하는 방법
JP2906743B2 (ja) 文字認識装置