JPH02186484A

JPH02186484A - 認識辞書の学習方式

Info

Publication number: JPH02186484A
Application number: JP1005823A
Authority: JP
Inventors: Michiyoshi Tachikawa; 道義立川; Takakuni Minewaki; 隆邦嶺脇
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1989-01-12
Filing date: 1989-01-12
Publication date: 1990-07-20

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は１文字認識システムにおける文字認識のだめの
辞書（認識辞書）の学習方式に関する。

〔従来の技術と発明が解決しようとする課題〕従来、文
字認識システムの認識辞書は、システム提供メーカにお
いて、大型計算機などを用いた専用の処理システムを使
用して作成し、これを標準辞書として文字！！！識シス
テムの利用者に提供している。

このようにして提供される標準的な認識辞書は、必ずし
も全ての文字認識システムの利用者に最適ではなく、シ
ばしば認識辞書の変更・修正あるいは専用辞書の作成が
必要となる。しかし５文字認識システムの利用者は、一
般に辞書作成のための専用処理システムを持たないため
、認識辞書の修正・変更や専用辞書の作成をシステム提
供メーカに依頼しなければならず、かなりの費用と時間
がかかり、認識辞書を頻繁に更新することは実際上不可
能であった。

本発明の目的は５文字認識システムにおいて、システム
利用者が簡単に認識辞書の修正・変更を行う方式を提供
することにある。

〔課題を解決するための手段〕

本発明は１文字Ｌ＆識システムにおいて、認ＷｔＮ果中
のリジェクト文字または誤認文字の修正時に。

リジェクト文字または誤認文字のパターンの特徴量と、
このリジェクト文字または誤認文字の正解文字に対応す
る認識辞書内あるいはフォント別特徴量ファイル内の特
徴量との合成によって新しい特徴量を生成し、この新し
い特徴量を認識辞書内の特徴量と入れ替えるか、または
認識辞書に追加することを特徴とするものである。

〔作　用〕

このように本発明によれば、リジェクト文字または誤認
文字の修正の際に１文字認識システム自体で認識辞書の
学習（修正・変更）を行うため、外部へ依頼したり専用
システムを使用せずに、したがって簡単・迅速に、かつ
格別の費用を要せずに５個々のシステム利用者に最適な
認識辞書を獲得し、認識率を向上させることが可能とな
る。

また、リジェクト文字または誤認文字のパターンから抽
出した特徴量をそのまま！！識辞書に追加したり、ある
いは、その特徴量で認識辞書を書き換えた場合、文字パ
ターンの変動がそのまま認識辞書に反映されてしまい、
−膜性のない認識辞書になる恐れがある。

これに対し、本発明によれば、認識辞書の特徴量と入れ
替えられる。または認識辞書に追加される特徴量は、リ
ジェクト文字または誤認文字のパターンの特徴量と、認
識辞書またはフォント別特徴景ファイルに格納されてい
る正解文字の特徴量との合成によって生成されるもので
あるから、適切な合成方法とすることにより文字パター
ンの変動を適度に吸収し、認識辞書の一般性を損なわな
い学習が可能である。

〔実施例〕以下、図面を用い本発明の詳細な説明する。

本発明の各実施例に係る文字認識システムは。

第１図に示すように、文字認識装置（ＯＣＲ）１とホス
トコンピュータ２とを接続してなる。ただし、文字認識
装置１とホストコンピュータ２とを物理的に一体化して
もよい。

文字認識装置１は認識対象の文書などの画像データを読
み取るスキャナー３、この画像データを蓄積し文字切出
し・正規化などの前処理を行う前処理部４．前処理後の
文字パターンの特徴量を抽出する特徴抽出部５、抽出さ
れた特徴量と認識辞書との比較照合を行うマツチング部
６．認識辞書を記憶する認識辞書メモリ７、文字認識装
置内の各部の制御およびホストコンピュータ２との通信
などを行う制御部８より構成されている。

ホストコンピュータ２はＣＰＵＩＱ、メインメモリ１１
、デイスプレィ１２．キーボーｇ１３、補助メモリ１４
より構成されている。メインメモリ１１には認識結果の
修正処理などの従来と同様の各種処理プログラム２０、
処理データなどが記憶される。この各種処理プログラム
２ｏに１本発明に係わる認識辞書の学習処理のためのプ
ログラムも含まれている。ホストコンピュータ２は補助
メモリ１４上に認識辞書２１を持っている。このＬ！！
識辞書２１がシステム立ち上げ時に文字認識装置ｌ内の
認識辞書メモリ７にロードされる。

ここまで説明したシステム構成は各実施例に共通である
。以下、各実施例について別々に説明する。

実施例１認識辞書２１は文字毎の文字コードと特徴量のほかに、
辞書作成に用いられたパターン数（またはフォント数）
を持っており、例えば第２図および第３図に示す構造の
ものである。なお、第２図の構造においては認識辞書全
体の作成に用いられたパターン数（またはフォント数）
Ｎを持ち、第３図の構造においては個々の文字毎に辞書
作成に用いられたパターン数（またはフォント数）Ｎａ
。

Ｎ　ｈ　＊　Ｎ　Ｑ　＋・・・を持っている。

次に、リジェクト文字または誤認文字の修正処理と認識
辞書の学習処理について説明する。

文字認識装置１において、スキャナー３によって入力さ
れた文書の文字パターンの特徴量を特徴抽出部５によっ
て抽出し、マツチング部６によって、この特徴量と認識
辞書メモリ７内の認識辞書との比較・照合を行い、距離
の小さい順に候補を選ぶ、各入力文字に対して最終的に
誤られた候補のデータ（文字コードまたはリジェクトコ
ード）は、認識結果として制御部８によりホストコンピ
ュータ２へ転送される。

ホストコンピュータ２においては、この認識結果をメイ
ンメモリ１１に一時的に記憶するとともに、デイスプレ
ィ１２の画面に表示させる。

第４（ａ）は画面表示の例であり、■印はリジェクト文
字、○印で囲んだ文字は誤認文字である。

オペレータはキーボード１３によってデイスプレィ１２
の画面上のリジェクト文字または誤認文字を指定し、そ
の正解文字のコードを入力するという対話的処理によっ
て、メインメモリ１１内のＰ！識結果の修正を行う、こ
の修正により画面表示も更新されるため、第４図（ａ）
の画面は修正後は第４図（ｂ）に示す画面になる。この
ような修正処理はＣＰＵｌ０によるプログラム処理であ
る。

ここまでの動作は従来システムと同様であるが。

本実施例のシステムにおいては、リジェクト文字または
誤認文字の修正と同時に認識辞書２１の学習処理（ＣＰ
ＵＩＯによるプログラム処理）も実行される。第５図は
この学習処理のフローチャートである。

一つのリジェクト文字または誤認文字の修正がなされる
と、このリジェクト文字または誤認文字のパターンから
抽出された特徴量の転送指令がＣＰＵｌ０より文字認識
装置１の制御部８へ出される。制御部８はこの指令に応
答して、その特徴量Ｆｏのデータを特徴抽出部５より受
は取ってホストコンピュータ２へ転送する。この特徴デ
ータはメインメモリ１１に格納される。これがステップ
■である。

次にＣＰＵ１．Ｏでは、リジェクト文字または誤認文字
の正解文字（オペレータにより指定された文字）に対応
する認識辞書２１内の特徴量Ｆおよびパターン数（また
はフォント数）Ｍを補助メモリ１４より読み込み、学習
後の特徴ＭＦ’　を次式により求める（ステップ■）。

Ｆ’＝（Ｆｏ＋ＭＸＦ）／（Ｌ＋Ｍ）　　　−−・ｃｉ
）（Ｍは第２図のＮまたは第３図のＮｉである）次にＣ
ＰＵｌ０は、学習後の特徴量Ｆ′　（これ迄の特徴量と
人力文字から抽出された特徴量とを合成した新しい特徴
量）を認識辞書２１に追加するか、あるいは前の特徴量
と入れ替える。これがステップ■である。

このようにして、一つの文字について認識辞書２１の学
習が終了する。

ここで、（１）式について説明する。リジェクト文字ま
たは誤認文字のパターンから抽出した特徴１（ＦＯ）を
新しい特徴ｆｆｌ　（Ｆ’　）としてそのまま用いた場
合は、認識辞書２１の一般性が損なわれる恐れが大きい
、抽出特徴１（Ｆｏ）と前の特徴ｊｉｌ　（Ｆ）との単
純平均によって新しい特徴量（Ｉ”’）を合成すれば、
そのような恐れは減るが。

それでもリジェクト文字または誤認文字のパターンの変
形が極端なときなどに、新しい特徴量（Ｆ′）が不適切
なものとなって認識辞書２１の一般性が失われる恐れが
かなりある。

これに対し、辞書作成に用いられたパターン数（または
フォント数）を導入した（１）式により合成された新し
い特徴Ｍ　（Ｆ’　）は、リジェクト文字または誤認文
字のパターンが極端に変形したときでも、その影響はパ
ターン数（またはフォント数）で平均化され緩和される
ため、上のようなＩｍ題の発生を避けることができる。

なお、認識辞書メモリ７はシステム立ち上げ時に書き換
えられるので、学習処理では認識辞書２１の書き換えだ
けが行われる。ただし、学習処理で！？（識辞丑メモリ
７を傅き換えてもよい。

実施例２この実施例においては、学習処理において新しい特徴量
Ｆ′を次式により求めることが実施例１と違う。

Ｆ’　＝　（Ｆ’ｏ＋ＲＸＦ）／　（Ｌ＋Ｒ）　　　−
（２）ここでＲ（≧０）は合成比率であって、キーボー
ド１３より指定されてメインメモリｌｌ上に記憶される
か、あるいは学習処理プログラム（２０）に予め設定さ
れる。

実施例１では、認識辞書作成に用いられたパターン数（
またはフォント数）で特徴量の平均化を行うので、上に
述べたように極端な変形パターンによる悪影響を避ける
ことができる。しかし反面、この平均化のために、辞書
作成に用いられたパターン数（またはフォント数）が大
きいと、リジェクト文字または誤認文字の特徴量が合成
後の新しい特徴音に充分反映しない恐れもある。

これに対し、この実施例２においては、合成比率Ｒを適
切に選べば、極端なパターン変形による過度な影響を避
け、かつ辞書作成に使用したパターン数（フォント数）
が大きくても、リジェクト文字または誤認文字の特徴量
を必要充分に反映させた新しい特徴量を合成できる。

なお、この実施例２においては、認識辞書２１にパター
ン数（またはフォント数）を持たせる必要はない。

実施例３ホストコンピュータ２は、認識辞書２１とは別に、フォ
ント別の特徴量ファイル２２を補助メモリ１４上に持っ
ている。この特徴量ファイル２２は、認識辞書２１の１
次辞書であり、例えば、各フォントの原稿を文字認識装
置１に入力し、各文字の特徴量を抽出させてホストコン
ピュータ２へ転送させ、ホストコンピュータ２において
、その特徴量をフォント別にファイル化することによっ
て作成される。当初の認ａ＋！！辞書２１は、特徴量フ
ァイル２２に格納されている特徴量を合成する（例えば
後述の（３）式のような平均をとる）ことによって作成
される。

この実施例においても、リジェクト文字または誤認文字
の修正時に認識辞書２１の学習処理が行われる。この学
習処理は前記各実施例と基本的に同じであるが、１次辞
書であるフォント別特徴斌ファイル２２を用い、次式に
よって新しい特徴量Ｆ′を合成することが違う。

Ｆ’　＝　（Ｆ’ｏ＋Ｆｉ＋・・・Ｆｎ）／　（ｎ＋１
）・・・（３）ここで、Ｆｏはリジェクト文字または誤認文字のパター
ンより抽出された特徴量、Ｆユ、Ｆ２．・・・Ｆｎはそ
の文字の正解文字に対する各フォント別特徴量ファイル
２２（ここではフォント種類がｎ）に格納されている特
徴量である。

なお、フォント別特徴址ファイル２２の選択情報をキー
ボード１３などから入力し、この選択情報によって指定
されたフォントの特徴量ファイル２２内の特徴量だけを
用いて（３）式に従って新しい特徴量を合成してもよい
、ただし、（３）式中のｎは選択した特徴量ファイル２
２の個数に応じて増減することになる。このようにすれ
ば、特徴量ファイル２２の選択ないし組合せによって、
１種類または複数種類の特定のフォントに対する認識率
を高めた認識辞書２１を得ることができる。

実施例４認識辞書２１の学習処理において、新しい特徴量Ｆ′を
次式に従って合成する。これ以外は実施例３と同様であ
る。

Ｆ’　＝　（Ｆｏ＋Ｒ／ｎＸΣＦｉ）／（１＋Ｒ）・・
・（４）ここで、Ｆｉはフォント（ｉ）の特徴量ファイル２２内
の特徴量である、またＲ（≧０）は実施例２と同様の合
成比率であり、キーボード１３などによって指定される
か、予めプログラム中に設定される。

この実施例は実施例２と同様の利点がある。

なお、この実施例においても、実施例３におけると同様
に認識辞ｌＦ２１の学習に用いるフォント別特徴量ファ
イル２２を選択情報によって選択してもよい。

〔発明の効果〕

以」二説明したように１本発明によれば、リジェクト文
字または誤認文字の修正時に認ｍ辞傅の学習が文字認識
システムにおいて行われるため、システム利用考は最適
な認識辞書を簡単・迅速に。

かつ格別の費用を要せずに獲得し、文字認識システムの
認識率を向上させることができる。

【図面の簡単な説明】

第１図は本発明の各実施例に係る文字認識システムの概
略構成図、第２図および第３図はそれぞれ認識辞書の構
造の説明図、第４図は認識結果の修正前後の画面表示の
例を示す図、第５図は認識辞書の学習処理の概略フロー
チャートである。１・・・文字認識装置Ｌ（ＯＣＲ）、２・・・ホストコンピュータ、　３・・・スキャナー５
・・・特徴抽出部、　　６・・・マツチング部。７・・・認識辞芹メモリ、　８・・・制御部、１０・・
・ＣＰＵ、　　１１・・・メインメモリ。１２・・・デイスプレィ、　　１３・・・キーボーＦ、
１４・・・補助メモリ、　２１・・・認識辞書、２２・
・・フォント別特８ｉ量ファイル。第１図７オ二Ｆ月オキｒｔ文１ヒフＴメレ第２図第３図蘂４図（ａ）（ト）Ｏ５１，け認良色第５図

Claims

【特許請求の範囲】

（１）文字認識システムにおいて、認識結果中のリジェ
クト文字または誤認文字の修正時に、リジェクト文字ま
たは誤認文字のパターンの特徴量と、このリジェクト文
字または誤認文字の正解文字に対応する認識辞書内の特
徴量との合成によって新しい特徴量を生成し、この新し
い特徴量を認識辞書内の特徴量と入れ替えるか、または
認識辞書に追加することを特徴とする認識辞書の学習方
式。
（２）リジェクト文字または誤認文字のパターンの特徴
量Ｆｏ、認識辞書内の正解文字に対する特徴量Ｆ、この
特徴量Ｆの作成または認識辞書内の全文字の特徴量の作
成に使用されたパターン数またはフォント数Ｍにり、新
しい特徴量Ｆ′を式Ｆ′＝（Ｆｏ＋Ｍ×Ｆ）／（１＋Ｍ）に従って合成することを特徴とする請求項（１）記載の
認識辞書の学習方式。
（３）リジェクト文字または誤認文字のパターンの特徴
量Ｆｏ、認識辞書内の正解文字に対する特徴量Ｆ、合成
比率Ｒより、新しい特徴量Ｆ′を式Ｆ′＝（Ｆｏ＋Ｒ×Ｆ）／（１＋Ｒ）に従って合成することを特徴とする請求項（１）記載の
認識辞書の学習方式。
（４）文字認識システムにおいて、認識結果中のリジェ
クト文字または誤認文字の修正時に、リジェクト文字ま
たは誤認文字のパターンの特徴量と、このリジェクト文
字または誤認文字の正解文字に対応するフォント別特徴
量ファイル内の特徴量との合成によって新しい特徴量を
生成し、この新しい特徴量を認識辞書内の特徴量と入れ
替えるか、または認識辞書に追加することを特徴とする
認識辞書の学習方式。
（５）リジェクト文字または誤認文字のパターンの特徴
量Ｆｏ、ｎ種のフォント別の特徴量ファイル内の正解文
字に対する特徴量Ｆｉより、新しい特徴量Ｆ′を式Ｆ′＝（Ｆｏ＋ΣＦｉ）／（ｎ＋１）に従って合成するこを特徴とする請求項（４）記載の認
識辞書の学習方式。
（６）リジェクト文字または誤認文字のパターンの特徴
量Ｆｏ、ｎ種のフォント別の特徴ファイル内の正解文字
に対する特徴量Ｆｉ、合成比率Ｒより、新しい特徴量Ｆ
′を式Ｆ′＝（Ｆｏ＋Ｒ／ｎ×ΣＦｉ）／（１＋Ｒ）に従って
合成することを特徴とする請求項（４）記載の認識辞書
の学習方式。
（７）複数のフォント別特徴量ファイルにより選択情報
に従って選択したフォント別特徴量ファイル内の特徴量
だけを新しい特徴量の合成に使用することを特徴とする
請求項（５）または（６）記載の認識辞書の学習方式。