JPH0576672B2

JPH0576672B2 -

Info

Publication number: JPH0576672B2
Application number: JP60247044A
Authority: JP
Inventors: Osamu Kunisaki; Toshihiro Hananoi
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1985-11-06
Filing date: 1985-11-06
Publication date: 1993-10-25
Also published as: JPS62107388A

Description

【発明の詳細な説明】〔発明の利用分野〕本発明はパターン認識装置に係り、特に不特定
多数の人の文字または音声を認識するとともに、
特定個人の特性に応じて認識精度を向上するに好
適なパターン認識装置に関する。

〔発明の背景〕

従来、音声認識や文字認識のための装置では、
認識用辞書すなわち各認識単位（音素、文字また
は更に細かく分類したカテゴリ）毎に設けた標準
パターンをいかに作成するかが、認識性能に関す
る重要なポイントであつた。特に不特定多数の音
声または文字（以後、説明は文字を対象として行
なう）を対象とするためには、標準パターンを追
加または修正することが不可欠であつた。また、
認識性能の向上を図るため、認識対象を特定の人
の字形に限定し、これを用いて使用者個人毎に標
準パターンを作成し、認識に用いることおよび認
識結果に基づいてこれを学習により修正すること
が知られている。これらの方法を分類すると、(1)
不特定筆記者用標準パターンの集合、すなわち汎
用辞書と、特定筆記用標準パターンの集合、すな
わち個人辞書との両者を用いて認識を行ない、最
終判定を行なう方式で、認識結果に基づいて個人
用辞書を修正する方式（特開昭59−17672号公
報）、(2)汎用辞書を用いて認識し、その結果に基
づいて更に学習を行つて汎用辞書に修正または追
加を加える方式（特開昭58−197578号公報）、(3)
汎用辞書と個人用辞書とを持ち、これら両者から
合成した認識用辞書を用いて認識を行ない、認識
結果に基づいて個人用辞書を修正する方式（特開
昭60−33680号公報）がある。

これらの方法のうち(2)および(3)の方式では、学
習する毎に個人用字形または変形字形が読めるよ
うになるが、逆に特定の個人の字形以外の字形に
対して認識性能が劣化し、不特定筆記者の字形が
読めなくなるといつた欠点があつた。このよう
に、特定個人の字形と不特定筆者の字形のいずれ
に対しても、認識性能を確保するためには、上記
(1)の方式のように、汎用辞書と個人用辞書とを併
用することが不可欠である。

ところで(1)の公知例では、個人用辞書は汎用辞
書と同じく、学習用文字パターンから作成した標
準パターンであり、漢字認識のように対象とする
文字カテゴリー数が2000字種以上の場合、辞書用
のメモリー量が大きくなるという欠点がある。こ
れに対処するためには、上記(3)の公知例のよう
に、個人用辞書として、汎用辞書に対する使用フ
ラグや文字カテゴリー書き換え情報など、コード
情報を用いることが知られている。しかしながら
文字カテゴリーの書き換えは、特開昭55−140976
号公報にあるように、認識対象標準パターンにカ
テゴリの優先順位情報を付加することと同じであ
るが、認識結果が得られる毎に変更すると、なか
なか収束せず、同一標準パターンに異なる優先順
位情報が付けられるような状況が生じる可能性が
あつた。

〔発明の目的〕

本発明の目的は、上記の問題点を解決し、不特
定筆者および特定筆者いずれの字形に対しても、
全体の認識性能を劣化することなく、特定の字形
に対する認識性能を逐次的に向上する手段を備え
たパターン認識装置を提供することにあり、辞書
容量の増加を押え、かつ学習における収束効率を
向上することを目的としている。

〔発明の概要〕

上記の目的を達成するため、本発明では汎用辞
書と個人用辞書を持ち、汎用辞書には字形から抽
出した標準パターンを採用し、個人用辞書には、
上記汎用辞書の標準パターン（各文字毎に複数存
在しても良く、以後これをマスクと呼ぶ）の順位
情報の書き換え規則を採用している。またこの書
き換え規則の登録・削除は、個々の書き換え規則
の正答率を基準として実施する。

以下、本発明の概要を説明する。第１図は本発
明の原理を説明するためのブロツク図である。

入力・前処理部１１にて認識対象のパターンに
変換され、まず汎用辞書１３を用いて認識部１２
において、標準パターンと入力パターンとの類似
性尺度を計算し、類似性の高い順に候補を並べた
候補マトリクスを該認識部１２から出力する。次
に、候補マトリクスの候補順位に関する書換え規
則の集合である個別辞書１５を用いて、結果編集
部１４において該当する書換え規則に従つて候補
マトリクスを書換え、結果の編集を行なう。この
結果を表示・修正部１６で表示し、オペレータに
よる修正を受付ける。オペレータによる修正の履
歴は、書換え規則毎にその正答率を書換え規則編
集部１７において管理しておき、一定の条件を満
足する書換え規則は個別辞書に登録する。一方、
正当率の低い書換え規則は個別辞書から削除す
る。この書換え規則の登録・削除などを書換え規
則編集部１７で行なう。また、オペレータによる
修正結果は、最終結結果として外部フアイル等１
８に出力される。

ここで書換え規則というのは、結果編集部１４
から出力される認識結果の誤り傾向を統計的に調
べて、例えば「聞」という文字を常に「間」と誤
認識する傾向にあることが判明したら、認識部１
２の出力の中で「間」が出力されたらそれを
「間」に修正しなさいという規則を作ることとし、
このような規則を書換え規則と云うのである。書
換え規則の様々な具体例は後述する。

第２図は、本発明のポイントである結果編集部
の動作原理を説明するためのものである。第２図
ａは認識結果の候補マトリクスの例であり、入力
が「新聞を読む」という５文字の場合、各入力文
字に対し、第１位乃至第４位の順位をもつ候補の
数が３，４，３，２，１の場合を示している。こ
の場合、第１位が最もそれらしいものである。第
２図ｂは同図ａのような候補マトリクスに対し
て、書換え規則を適用して結果の編集を行つた例
を示している。(i)のケースでは第１位に「新」が
来た場合には書換え規則は元と同一のものを出力
するという規則になつているので結果は不変であ
る。なお記号「＊」はその位置に任意の候補が来
ることを意味している。ケース(ii)では、個人の
「聞」の字形を汎用辞書を用いて認識すると、第
１位に「間」，第３位に「聞」が候補して挙がる
煩度が多いことに対処するための規則、つまりそ
の場合には、「聞」を「間」の前にもつてきて順
位を入れ換えなさいという書換え規則が登録して
ある場合で、結果として第１位に正解の「聞」が
上つてくる。ケース(iii)はケース(i)と似ているが、
第１位に「間」、第２位に「問」のとき、結果は
不変で良いという規則である。ケーース(i)では第
１位のみに着目しているが、このケース(iii)では第
２位までの順序に着目している点が異なつてい
る。ケース(iv)は、「を」が必ず「奈」となるケー
スに対処する規則、つまり、「奈」は「を」に修
正しないという書換え規則であり、第１位「奈」、
第２位「を」の順に候補が出現したら第１位を削
除して、以後の順序を繰り上げる。ケース(v)は、
第２位に似た文字が必ず候補として上るけれど
も、候補としてあり得ないものとして削除すると
いう書換え規則であり、例えば「講」が個人の用
途としては認識対象外の文字（これを外字とい
う）であり、汎用辞書の各標準パターンに選択フ
ラグを設け、フラグをオフした場合と同様の効果
をもたらす。ケース(vi)は、汎用辞書にない文字
（これを認識システムの外字と呼ぶ）を、個人の
用途のために登録して使用したい場合に有効な規
則であり、例えば「茗」が外字であり、これを登
録し、代りに「若」を外字に変更したい場合に用
いる。また「苦」を外字に変更したい場合で、第
１位には必ず「若」が候補として挙がる場合に
は、第２図ｂケース(vi)の例のように第１位「若」，
第２位「苦」のペアに対して規則を適用して
「茗」という結果を得る。

以上の説明で示したように、本発明では特定の
個人の字形に対し汎用辞書を用いた認識結果が、
その候補の順位に関し統計的に有意差の認められ
る傾向にあるならば、書換え規則として登録して
適用し、結果を編集してしまうものである。

一方、第３図は、本発明のもう１つのポイント
である書換え規則編集部の原理を説明するための
もので、処理の流れの例を示している。すなわ
ち、個別辞書の書換え規則によつて編集されれた
認識結果を表示し、オペレータの候補選択または
修正を受ける。得られた修正結果と編集結果の一
致／不一致の関係、および結果編集部における適
用規則の有無、新規作成規則の個別辞書登録済チ
エツクを経て、全規則の正答率を変更し、その後
閾値とチエツクすることによつて個別辞書への登
録または削除を行なう。

以上説明したように、本発明では、個人の字形
に対する認識性能の向上が、書換え規則という一
種の知識の登録・削除によつて実現でき、汎用的
である。また、オペレータによる修正の履歴に基
づいた登録・削除を行なうため、学習の収束効率
が向上される。更に、個別辞書を２種類以上に分
割し、１つ以上は特定の個人用として入れ替え可
能とし、もう１つを不特定筆者用の書換え規則の
集合として特徴の標準パターン整合では解決でき
ない特例処理を行なわせることが可能である。

〔発明の実施例〕

以下、本発明の実施例を図面を用いて説明す
る。第４図は、本発明の一実施例のブロツク図で
ある。全体の制御は、共通バス５００に接続され
た制御部１で行なう。帳票に書かれた文字は、観
測部１０にて光電変換され、２値化されて画像バ
ツフア２０に格納される。前処理部３０では、画
像バツフア２０の中の認識対象とする文字部分を
切出して大きさなどの正規化を行なつた後、再び
画像バツフア２０の別のエリアに格納する。認識
部４０では、画像バツフア２０に格納された１文
字毎のパターン形状に対して特徴抽出を行ない、
汎用辞書５０に格納された標準パターンとの整合
を行なう。整合結果は、整合尺度（例として類似
度）に従つて最も確らしいものの順に並べられ、
一定の単語または文字数分を集めて候補マトリク
スバツフア６０に格納される。結果編集部７０で
は、候補マトリクスバツフア６０の内容を順次と
り出し、個別辞書８０に格納された書換え規則が
適用できるか否かをチエツクし、適用可能な書換
え規則に従つて候補マトリクスバツフア６０の内
容を変更すると共に、適用した規則の履歴を正答
率記憶部１４０に格納する。単語照合部９０は、
候補マトリクスバツフア６０と単語辞書１００と
の照合を行なつて、最も確からしい単語から順に
並べて再び候補マトリクスバツフア６０に格納す
る。ここで単語照合部９０および単語辞書１００
が存在しない場合の構成でも、本発明の本質は不
変である。得られた結果を候補マトリクスバツフ
ア６０から取り出して、表示部１１０でオペレー
タに表示する。表示するものは、認識結果だけで
なく、切出した文字のパターンも同時に表示する
ことが考えられ、オペレータによる修正効率向上
に役立つことは言うまでもない。オペレータは表
示された内容をチエツクし、複数候補の中から選
択したり、正解を仮名漢字変換により入力したり
することを修正部１２０で行なう。修正部で修正
された結果は、最終結果フアイル２００に格納さ
れる。一方、書換え規則編集部１３０では、候補
マトリクスバツフア６０の内容と最終結果フアイ
ル２００の内容とを比較し、第３図で説明した手
順で書換え規則の正答率を再評価し、正答率の増
減が発生し、その結果を正答率記憶部１４０に格
納する。次にこの結果すなわち各規則の正答率を
予め設定してある閾値と比較し、正答率の高いも
のは個別辞書８０に登録し、正答率の低いものは
個別辞書８０から削除する。なお、個別辞書８０
への登録および削除は、書換え規則自体の書込
み、消去によつても良いが対応するフラグ（登録
フラグ）を用いても実現できる。また、個別辞書
８０の内容を複数のブロツクに分け、制御部１の
指示により、どの書換え規則のブロツクを使用す
るかを切替える方式をとることが考えられる。こ
れによれば例えば、汎用辞書５０では改善できな
い個別の字形の変形に対処して不特定筆者の字形
や特定筆者の字形の読取り性能の向上が実現でき
る。

以上の説明は文字を対象として行なつたが、音
声を対象とする場合も同様の考えで実現できる。

本実施例によれば、特定の個人の字形を対象と
した認識性能の向上が、本装置を使用する過程で
徐々に進歩し、また修正の履歴に従つて性能向上
を行なうため、一過性の雑音データに振られるこ
となく収束することができ、収束速度向上の効果
がある。更に、制御パラメータの変更で、個人用
の字形でなく、不特定筆者の字形を読取ることも
可能であり経済的である。また、外字の読取りも
同一の手続きで実現できるため、辞書作成の工数
が軽減できる効果がある。

〔発明の効果〕

本発明によれば、汎用辞書である標準パターン
と、個別辞書である書換え規則とを持つているた
め、特定個人の入力パターンに対する学習が可能
であると共に、不特定の入力パターンに対しても
認識性能を全体として低下させることなく性能を
保持できる効果がある。また個別辞書がコードデ
ータであるためその容量は少さく、経済的であ
る。更に、修正情報の履歴を用いた学習方式を採
用しているため、少量のノイズデータに振らされ
ることなく学習が収束する効果がある。

【図面の簡単な説明】

第１図は本発明の原理を説明するためのブロツ
ク図、第２図、第３図は第１図の動作原理の補足
説明用の説明図、第４図は本発明の一実施例のブ
ロツク図である。１……制御部、４０……認識部、５０……汎用
辞書、７０…結果編集部、８０………個別辞書、
１１０………表示部、１２０……修正部、１３０
……書換え規則編集部。

Claims

【特許請求の範囲】

１標準パターンを記憶した汎用辞書と、入力未
知パターンと前記汎用辞書から読出した標準パタ
ーンとを比較照合して認識候補パターンを出力す
る認識手段と、書換え規則を記憶した個別辞書
と、前記認識手段とから出力された候補パターン
の候補順序を前記個別辞書から読出した書換え規
則によつて修正し、編集し直して出力する第１の
編集手段と、該第１の編集手段から出力された候
補パターンを表示する表示手段と、表示された該
候補パターンから判断されるその誤認識の傾向を
示す情報を入力されて、前記個別辞書に記憶され
ている書換え規則を追加し、修正し、或いは削除
するために、書換え規則の編集を行なつて前記個
別辞書に入力する第２の編集手段とから成ること
を特徴とするパターン認識装置。