JPH03102581A

JPH03102581A - 認識結果判定装置

Info

Publication number: JPH03102581A
Application number: JP1241583A
Authority: JP
Inventors: Toru Ueda; 徹上田; Fumio Togawa; 外川　文雄
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1989-09-18
Filing date: 1989-09-18
Publication date: 1991-04-26
Anticipated expiration: 2014-05-17
Also published as: JP2892397B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】く産業上の利用分町〉この発明は、文字画像あるいは音？信号等の特徴量を入
力して、人力文字あるい（Ｊ人力＆声を認識する際に使
用される認識結果判定装置に関する。

く従来の技術〉従来、文字画像の特徴量を人力して、入力文字を認識す
る方法として次のような方法がある。この文字認識方法
は、第６図に示すように１行単位に切り出ざれた文字画
像データに基づいてその一端側から８×８の升目の領域
を抽出し、この領域を所定間隔で他端側に向かってソフ
トしてその領域の画像データの特徴量をニューラル・ネ
ソトワークの入力層に人力する。そして、ニューラル・
３じように｛吏用ざれる。

〈発明が解決しようとする課題〉」二記人力文字画像の特徴量をシフトしながらニコーラ
ル・ネソＩ・ワークに入力して入ノノ文字を認識する方
法、あるいは、入力音声信号の特徴パラメータの時系列
を次々ニューラル・ネソトワークに入力して人力音声を
認識する方法は、例えば文字部や音節部と境界部とを識
別するようなニコーラル・ネソトワークの学習が完全に
実施されおり、ニコーラル・ネソＩ・ワークにおける出
力値の演算が正確に実行されていれば、−１二述の手法
によって正しい認識結果を得ることができる。しかしな
がら、一般に、ニューラル・ネットワークの学習を完全
に実施することは困難である。したがって、次の１二う
に通常は満足な認識結果が得られないという問題がある
。

すなわち、第４図に示すように、入力文字ｒｉｎｊを認
識する際に、ニューラル・ネットワークに人力する画像
データの特徴量の領域を、領域■から領域■まて順次シ
フトして入力するとする。そのネソトワークは人力され
た領域の特徴量が属１′ろカテゴリ（例えば、アルファ
ヘット，数字および記号等）に応じた出力データを求め
、この出力データの時系列を出力するのてあろ。

その際に、例えば領域イにｊま文字ｒＤ−１の画像が完
全に含まれているが、領域口には文字「Ｄ」の他に文字
ＩＴＪの−・部も含まれている。したかって、完全な文
字［Ｄ−１を識別する上うに学習されているニコーラル
・ネノｌ・ワークは、領域イの特徴量を入力した際にお
ける文字「Ｄ」が割りイ」けられた出力ノードの出力値
の方が、領域口の特徴量を人力した際にお（ラる文字「
Ｄ」が割り｛ｔｔＪられた出力ノードの出力値よりも大
きな値を示４゛。したがって、ニクーラル・ネソトワー
クからの出力データの時系列から入力文宇を識別する場
合には、出力データの時系列において最大値を出力して
いる出力ノートからの出力値の極大値を求める必要があ
る。

−１ユ述の手法は、音声信号に基つく特徴パラメータの
時系列をニコーラル・ネソトヮークに次々に人力して、
入力音声を認識する場合においても同４場合、領域■の特徴量が人力された場合には文字［−１
４力司二しく認識される。同じように領域■の特徴量が
人力された場合には文字ｒｎＪが正しく認識されろ。と
ころが、領域■の特徴量が入力された場合には、文字「
ｉ」と文字ｒｎｌとの境界領域であるにも拘わらず文字
ｒｍＪてあると誤認識ざれてしまう場合がある。このよ
うな誤認識｛Ｊ１特徴量が人力された領域が文字画像に
おげろ文字領域であるか境界領域であるかに拘わらづ２
、領域■〜領域■まで総ての領域の特徴量を同じ条件で
処理しているから生じるのである。

そこで、この発明の１１的は、認識対象の時系列が入力
されて上記認識対象を認識する認識用の二ｊーラル・ネ
ットワークによる認識結果が正しいか否かを判定して、
正しい認識結果を出力できる認識結果判定装置を提供す
ることにある。

〈課題を解決するための手段〉上記目的を達威するため、第１の発明の認識結果判定装
置は、認識対象の時系列における」二記各認識対象間の
平均間隔に応じた時間間隔で興食性の値を示ずどｊ（に
、上記興蕾性の値の近傍においては抑制性の値を示ケウ
ェイト・ベク■・ルを格納するウエイＩ・格納部と、下
層における複数ノードから出力される出力ベクトルの時
系列を人力し、この入力された」一記下層の複数ノード
からの出力ベクｌ・ルの時系列の各値と上記ウェイ］・
格納部に格納されたウェイト・ベクトルの値とに基づい
て、上記下層における複数ノードからの出力ベクトルが
表す認識対象に対ずる認識結果が正しい認識結果である
か否かを判定するための判定用データを算出し、出力層
の各出力ノートから出力する判定用データ算出部と、」
一記判定用データ算出部から出力ざれる判定用データの
時系列に基づいて、上記下層における複数ノードからの
出力ベクトルが表す認識対象に対ずる認識結果が正しい
か否かを判定して、正しい認識結果を出カする出カ判定
部を備えたことを特徴としている。

また、第２の発明の認識結果判定装置は、上記第１の発
明の認識結果判定装置において、上記判定用データ算出
部によって判定用データを算出す７ータ算出部によって、ウェイト格納部に格納されたウエ
イ｝・・ヘクトルと」一記人ツノされた出力ヘクトルの
時系列とに基づいて、−Ｊ二記下層における複数ノード
からの出力ベクｌ・ルが表す認識対象に対する認識結果
が正しいか否かを判定するための判定用データが算出さ
れる。

その際に、上記ウェイト・ベクトルは、認識対象間の平
均間隔に応じた時間間隔で興蕾性の値を示すと共に、上
記興意性の値の近傍においては抑制性の値を示す上うに
設定ざれているので、認識対象に対応する判定用データ
は抑制されずに、認識対象間の境界部に対応ずる判定用
データのみが抑制されるのである。

そして、出力判定部によって、」二記判定用データ算出
部から出力される判定用データの時系列に基づいて、上
記下層にお；Ｊる複数ノードからの出力ベクトルが表す
認識対象に対ずる認識結果が正しいか否かが判定され、
認識対象とその境界部とを識別して正しい認識結果が出
力される。

また、第２の発明にＪ５いて、゛Ｆ１］定用データ算出
る際に、算出しようと十る判定用データに対応４゛ろ上
記下層に４３ける複数ノートからの出力ベクトルが表す
認識結果に応じて、上記ウェイト・ベク］・ルの値を所
定の規ｔｉｌ１に基づいて変更するウェイト制御部を備
えたことを特徴としていろ。

また、第３の発明の認識結果判定装置は、−１−記第１
の発明の認識結果判定装置において、」二記認識対象の
時系列に基づく特徴屯の時系列を人力し、上記入力した
特徴量の時系列に基づいて、認識しようとしている認識
対象と隣接ずろ認識対象との間の間隔を表す情報を求め
ろ入力監視部と、上記入力監視部によって求められた認
識対象と隣接ずる認識対象との間隔を表す情報を人力し
て、この人力された情報に応じてＬ記ウェイト・ベクト
ルの値を所定の規ｔｉｌ１に基づいて適応的に変更する
ウエイ１・制御部を備えたことを特徴としている。

く作用〉第１の発明において、判足用データ算出部に下層におけ
る複数ノードから出力される出力ベクトルの時系列が人
力されろ。モうずると、判定用デ８部に下層にお１′ｌる複数ノードから出力される出力ベ
クトルの時系列が人力ざれ、判定用データが算出されよ
うとする。その際に、ウェイト制御部によって、上記判
定用データ算出部が算出しようとしている判定用データ
に対応ずる上記下層における複数ノードからの出力ベク
｝・ルが表４−認識結果に応じて、上記ウェイト格納部
に格納されたウェイＩ・・ベクトルの値が所定の規朋に
基づいて変更される。そうすると、」一記判定用データ
算出部は、上記ウェイト制御部によって変更されたウェ
イト・ベクＩ・ルを用いて判定用データを算出する。そ
うすることによって、上記境界部に対応する判定用デー
タをより抑制することか可能となるのである。

そして、出力判定部によって、判定用データ算出部から
の判定用データの時系列に基づいて、上記Ｆ層における
複数ノートからの出力ヘクトルが表す認識対象に対ずる
認識結果か正しいか否がか判定されて、更に正しい認識
払果か出力される。

また、第３の発明において、」二記認識対象の時系列に
基づく特徴量の時系列が人力監視部に入力されると、こ
の入力された特徴量の時系列に．２ヨづいて、認識しよ
うとしている認識対象と隣接ずろ認識対象との間の間隔
を表す情報が求められる。

そして、ウェイト制御部によって、」一記入力監視部に
よって求められた認識対象と隣接４−る認識対象との間
隔を表す情報に応じて、上記ウエイ１・・ベク｝・ルの
値が所定の規則に基づいて変更される。

そうすると、判定用データ算出部は、上記ウェイト制御
部によって変更されたウェイト・ヘクｌ・ルを用いて判
定用データを作成ずる。

したがって、認識対象の時系列において−１１記各認識
対象間の間隔が絶えず変化しても、適応的に追従してウ
ェイト・ベクトルの値を変更でき、更にきめ細かな認識
処理を実行できる。

〈実施例〉以下、この発明を図示の実施例により詳細に説明する。

認識用ニコーラノ１戸ネゾ｝・ワークの入力層に、認識
対象のシフトされる領域の特徴量を人力する。

よって所定範囲の領域を抽出し、この領域を所定間隔で
シフトさせて領域内の特徴量を認識用ニコーラル・ネッ
トワーク２の入力層に入力する。認識用ニコーラル・ネ
ソトワーク２は、入力された上記領域内の特徴量および
内部に記憶しているウェイト・ベクトルに従ってその領
域の＊，￥ｍＢ２が属する文字を表す出力ベクトルを算
出する。そして、認識結果を表オ出ノノベクｌ・ルの時
系列を出力ずろ。

こうして、認識用ニコーラル・ネソトワーク２によって
出力ざれた出力ベクトルの時系列は第１１１１カバッフ
ァ３に格納ざれる。

判定用ニコーラル・ネットワーク４（」ウェイト格納部
７と判定用データ算出部８をｒｆオろ。この判定用デー
タ算出部８は、±．記第１出力バッファ３に格納された
認識用ニコーラル・ネッ１・ワーク２からの出力ベクＩ
・ルの時系列を読み込んて、読み込まれた出力ベクトル
の時系列どウエイ１・格納部７に格納されたウェイト・
ベクｌ・ルに従って、認識［Ｔｌニコーラル・ネソトワ
ーク２による認識結果がｒＦ−　Ｌ．いか否かを′Ｉ′
ｌｌ　足ずるための刊定用データそう−ｉ゛ろと、この
よ忍識１１１ニコーラル・ネノトワークの出力層から認
蟲♀占果を表す出力データの時系列が出力される。この
発明の認識結果判定装置は、１；記認識用ニコーラル・
ネッ１・ワークからの出力データの時系列を入力して招
識結果判定用のデータを生成し、この判定用データに基
づいて正しい認識結果を判定して最終的な認識結果を出
力するしのである。−１−記判定１１］データの生成｛
よニクーラル・ネッ１・ワークによりで実行されろ。以
下、この判定用データを！：Ｉ−．　Ｔ＆オろニューラ
ル・ネノ１・ワークを判定用ニューラル・ネッ１・１ノ
ークと言う。

第１図はこの発明の誌識結果判定装置におけろ−・実施
例のブロック図であろ３、本実施例（ｊ文字認識の場合
における認識１’ｉ！ｉ果ｊ′４］定装置であり、人力
提示部ｌは認識用ニューラル・ネッｌ−ワーク２に入力
する人力データを生成して入力する。この入力提示部Ｉ
にはスキャナ，行抽出部および領域抽出部等を含み、ス
キャナによって読み取った文字画像データから１行分の
画像データを抽出し、この１行の文字画像データに址づ
いて領域抽出部にを算出する。そして、この算出さ，Ｂ
１た判定Ｉｌｌデータの時系列を出力ノードから出力す
る。こうして、判定用ニコーラル・ネソトワーク４によ
ー〕て出力された判定用データの時系列は第２出力バッ
ファ５に格納されろ。出力判定部６｛」、第２出力バソ
ファ５に格納ざれた判定用ニコーラル・ネットワーク４
からの判定用データの時系列が所定の基準に合致してい
るか否かを判定して入力文字の最終的な認識結果を出力
する，、人力監視部９（よ、入力提示部１からの人力データの内
容に応じて、後に詳述する上うに判定用ニコーラル・ネ
ットワーク４のウェイト・ベクトルの値を変更４−ろ際
に参照さイ］ろテータを作成ずろ。ＣＰＵ（中央処理装
尚“）１０は、人力提示部１．認識用ニクーラル・ネッ
ｌ・ワーク２，ウエイ１・格納部７判定用データ算出部
８，第２出力ハッファ５．出力判定部６およひ人力藍視
部９を制御して、入力文字の認識動作を実行する。

第２図（上上記認識用ニコーラル・ネッｉ・ワーク２の
出力層から出力さ１１，ろ出力ベク１・ルの時系列の上
記判定用二，−ラル・ネッ１・ワーク４への人力状態の
−例を示４″図である。第２図に４３いて、矢印（で示
される４つのノード１１．，１２，１３４は、時刻ｔｔ
：；ｌ’；ける出力データを出力している認識用二：ｒ
−ラル・ネットワーク２の出力ノードを示ケ。以下同様
にして、矢印（ｔ−１）で示されろ４つのノード］　Ｉ
’，１　２’．＋　３’，＋　４’は、時刻（Ｃｌ．）
ｉこおｉＪる出ノノデー夕を出力してし）る認識用ニコ
ーラル・ネッ１・ワーク２の出力ノー１・を示し、矢印
（　ｔ　Ｉ１．）およびグ（印（１＋２）で示されるノ
ートも同様に時刻（　ｔ　４−　］）および時刻（Ｌ｛
２）にお（』ろ出力データを出力している出力ノードを
示している。ただし、認識用ニューラル・ネソトワーク
２の出力ノードは４つてあり、矢印（１−１），矢印（
０，矢印（ｔ＋１）および矢印（ｔ＋２）で示される各
４つのノードは、いずれも時刻（Ｌ−１−）．時刻（Ｌ
），時刻（１：＋ｉ）および時刻（ｔ＋２）に４３ける
出力ノードｉｆ．ｆ２．ｉ３　　１４を示している。す
なわち、第２図（」認識用ニューラル・ネットワーク２
の４つの出力ノードの時間的な変化を空間的な変化どし
て実現したものであ１；記認識用二二Ｉ−ラル・ネット
ワーク２の４つの出力ノートｌ　１．＋　２．１　３．
１　４は、夫々認識文字の例えばｒａ，，ＩＪｂ，．Ｉ
．ｒｃｊＪｄ　Ｊに割りイ”Ｉげらｉているど４−る。

そして、この出カノー１１１１．２１　３　，　Ｉ４カ
ラ時刻（　＋．　−　１．）　〜ｌｌｊｊ刻Ｌ〜時刻（
ｔ＋１．）ｌ．：おいて出力される出ノノ値（オなイっ
し、各時刻における認識結果）は、判定用ニコーラル・
ネソ｝・ワーク４の入カノードζこ入ヵざれる。この場
合、説明を簡単にするために、判定用ニコーラル・ネッ
トワーク４は認識用ニューラル・ネッｌ・ワーク２に直
接接続されていると考え、しかも認識用ニコーラル・ネ
ッＩ・ワーク２の出カノード１１．１２　　１３１４は
判定用ニューラル・ネゾ｝・ワーク４の入ノノノードを
兼用しているものと考える。そうすると、判定用ニュー
ラル・ネットワーク４は、夫々の入力ノートに入力され
た各時刻？こおｆナる値とウェイ１・格納郎７から読み
出した各時刻に対応した値のウェイト・ベクトルｗ（１
）とに基づいて、判定用データ算出部８で例えば式（１
）に従って判定用デー１５夕を算出し、各々の出力ノードに出力ずる。

ここで、式（＋．）は認識用ニコーラル・ネットワーク
２にお（ジる認識文字ｒｃｌｌが割り例｛Ｊられた出カ
ノード１４からの出力値０　１ｄ（ｔ）に対ずる判定用
データ、ケなイっち、判定用ニューラル・ネットワーク
４におζ１る認識文字「（１」が割り付ｉ′Ｊられた出
力ノードＩ５からの出力値０　２ｄ（ｔ）の算出式であ
る。

ｉ４０２ｄＱ）＝　　ΣＷ（ｉ）０　１（ｔ＋ｉ）＋＝］・・（１）但し、Ｗ（ｉ）　　時刻（ｔ＋ｉ）におけるウェイＩ・・ベク
トル。このウェイト・ベクトルは、時刻（ｔ＋ｉ）における認識用ニコーラル・ネットワーク２
の出力ベクトルＯ　］（ｔ＋ｉ）に基づいて判定用ニュ
ーラル・ネットワーク４の出力値０　２ｄ（ｔ）を算出する際のウェイ
ト・ベクトルである。そして、このウェイト・ベク１・ルの要素は１６認識用ニコーラル・ネッ｝・ワーク２の出力ノーＦ数だ
け存在し、各要素の値は総て等しい。

Ｏｌ（Ｌ＋ｉ）　　時刻（ｔト１）にわける認識用ニュ
ーラル・ネソｌ・ワーク２からの出力ベク］・ル。

Ｗ（１）・０１（Ｌ＋ｉ）ベクトルＷ（１）とベクトルＯ　Ｉ（ｔ＋　ｉ）との内
積。

Ｔ　定数。

Ｋ：正の定数。

ヒ述の式（１）は、認識用ニューラル・ネソ１・ワーク
２からの出力ベク１・ノレＯ　Ｉ（ｔ＋ｉ）の｛直にウ
エイ｝・・ベクトルＷ（ｉ）の値に応じた重み付けがな
されていることを表している。

そこで、第１の発明の認識枯果判定装置においては、出
力判定部６において文字部と境界部とを識別できるよう
に、認識用ニコーラル・ネットワーク２における入カノ
ードに入力される特徴員の領域が境界部であるような１
におけるウェイト・ベクトルＷ（ｉ）の値を抑制ヤＬの
ウェイト・ベクトル（ずなわち、負のウエイＩ・・ベク
１・ル）とする一方、文字部であるようなｉにおＩＪる
ウェイト・ベクトルＷ（１）の値を興禽性のウェイＩ・
・ベクトル（すなわち、正のウェイト・ベク１・ル）と
するのである。換ｆｔｌ“れば、ウェイト・ベク１−ル
Ｗ　（　ｉ　）を平均的な文字間隔（ずなわら、認識対
象の間隔）で興命性の値を有ずるように設定するのであ
る。

こうずることによって、判定用ニコーラル・ネッＩ・ワ
ーク４からの出力値は、境界部に４５いては抑制される
一方、文字部においては抑１ｉ１ｊされない。

したがって、境界部におｊ：ｌる認識用ニコーラル・ネ
ットワーク２のある出力ノーｌ・の出力値が大きくても
、判定用二，−ラル・ネソトヮーク４によってその値は
抑制されるので、文字部として誤認識されることから免
れるのである。

第３図は」二述のように構成ざれた認識結果判定装置に
よる認識結果判定動作および認識用ニコーラル・ネット
ワーク２による入力文字認識動作の大まかなフ［ノ−ヂ
ャートである。以下、第３図に従って入力文字認識動作
／認識結果判定動作の概１９式（１）によって判定用データが演算され、判定用デー
タの時系列が出力される。

ステップＳ５で、１−，記ステップＳ４において出力さ
れた判定用データの時系列が第２出力バソファ５に格納
される。

ステソブＳ６で、第２出力バッファ４に格納ざれた判定
用データの時系列が順次読み出され、出力判定部６によ
って、この判定用データの時系列に乱づいて人力文字が
最終的に認識されて認識結果が出力され、人力文字認識
動作／認識結果判定動作が終了する。

次に、認識結果判定装置による認識結果判定動作につい
て、入力文字「１ｎ」を認識する場合を例に具体的に説
明する。

第４図は認識用ニコーラル・ネッ１・ワーク２の入カノ
ードに入力される文字画像ｒ’ｉｎＪを示す。この文字
画像を認識用ニューラル・ネットワーク２に入力ケる際
には、文字画像から所定の大きさの領域を抽出し、その
領域を領域■から領域■まで順次ンフトしてその領域の
特徴量を人力する。そ略について述べる。

ステップＳ１て、人力堤示部１によって、」−述のよう
にして、認識用二コーラル・ネソ］・ワーク２の人カノ
ーｌ・に人力文字画像の仔意の領域の特徴量がその領域
を順次ンフ［・さＵながら入力される。

ステソブＳ２て、ｉｌ％識用二：ｒ−ラル・ネソトワー
ク２に４３いて、順次ノフ１・されて入力さＳ１た文才
一両像の特徴４１に』，（ついて認識処理か尖行され、
認識結果を表４′出力ベクＩ・ルの時系列が出力される
。

ステップ８３で、−ヒ記ステソプＳ２において出力ざれ
た出力ベク１・ルの時系列が第１出力バノファ３に格納
される。

ステソプＳ４で、第１出力バノファ３に洛納された認識
用ニューラル・ネノトヮーク２の出力ベクトルの時系列
の中から、認識用ニューラル・ネンｌ・ワーク２に上る
認識結果を判疋しようとする時刻（を中心として前後］
゛個の出力ベクトルを読み込む。そして、この読み込ま
れた時刻（Ｌ　′ｒ）〜時刻Ｌ〜時刻（ｔ＋Ｔ）に才５
（」ろ出力ベクトルに基づいての場合、領域■には［−
１」の文字画像が完全に入り、領域■にはｒｒｌの文字
画像が完全に入っており、共に文字部を構成していろ。

したがって、この文字画像「ｉｎ−１の場合に（よ、境
界部である領域■，領域■および領域■にお１：ｌる認
識用ニューラル・ネットワーク２からの出力ヘクトルの
値を抑制し、文字部てある領域■と領域■とにおける出
力ベク｝・ルの値を抑制しないようにウエイ１・・ベク
トルＷ（ｉ）を設定４〜ればよい。

そこて、ウェイト・ベクトルＷ（ｉ）を第５図に示す土
うに設定する６すなわち、本実施例にお（ラるウェイト
・ベクトルＷ（ｉ）は、（Ｒｉｌ移ｌが１　−３および
ｉ＝３において興奮性の値Ｗ　（−３）　一＝　Ｗ　（
３）　＝　０５を示すようになっている。こｔ＋．　ｔ
Ｊ：、例えば第４図にお（Ｊろ文字部である領域■を偏
移“０゛゜に当て嵌めろと、同しく文字部てあろ領域■
はイ粘１移゛３”に当て嵌まり、文字部に．ｌ３！ナる
ウＪ．イト・ベクトルＷ（】）の値が興奮｝生の値にｒ
−ｊるように設定ざれている。それと同時に、境界部に
お｛１るウエイ１・・ベクトノｌパＶ（ｉ）の値は゛０
′゜よノ，ζ」“−０．８”であり抑制性のｋになる上
うに設定されているのである。

まず、認識１ｉ１ニコーラル・ネッ｝・ワーク２の人カ
ノードに、第４図に示す文字画像の領域■から領域■ま
て順次シフトされた領域の特徴量が人力される。ここで
、認識用ニコーラル・ネットワーク２はｒｉｊ．ｌ−ｍ
ＪｒｎＪの３文字を識別１，て認識ずろものであるとず
ろ。したかー）て、認識用ニューラル・ネノｌ・ワーク
２の出力ノードは認識文字Ｆｉｌ「ｍｌ，ｌ’−ｎｌに
割り付ζづられている。その結果、第１表に示すような
出力ベク｝・ル０１．（ｔ）が得られる。

第Ｉ表表中におのる＊印は各領域における最大出力値を示す。

この場合、従来の方法に上れば、出力判定部６は例えば
閾値”０．７”以上の最人出力値を呈する出力ノードに
割り付けられた認識文字を認識２３一・方、各時刻における認識用ニコ、一ラノレ・ネソｌ
・ワーク２の出力ベクトルは第１表１′．り次のようこ
なる。

０　１（ｔ−２）＝　（１．０，０．２，０．２）、０
１−（ｔ−４）＝（０．Ｉ．，０．１０　２）、　　０
１（ｔ＋１）＝（０．２，０．１，０．８）、　　０１
（ｔト２）＝＝（０２　０．Ｉ．．Ｏ．Ｉ）また、時刻（にお（づる認識用一ニコーラノレ・ネ・ノ
ｌ・１ノーク２の出力ノート１ｍ」の出力値０１ｍ（ｔ
）！：！第１表より、０　１．ｍ（ｔ）＝　０　．　８
である。

したかって、判定用ニコーラル・ネ・ソト１ノーク４に
おける出力ノード丁ｍ」から出力される判定月１データ
０　２ｍＱ）は、式（１）上り次のよう（こ求めること
ができる。まず、式（１）の第１項は、１７２ ΣＷ（ｉ）・０１（Ｌ利）ｌ：ＩＷ（１）・Ｏ　（ｔ＋ｌ．）　＋　Ｗ　（２）・Ｏ　（
ｔ＋２）（−０．Ｐｔ，−０．８，−．０．８）・（Ｑ
．２，Ｏ．Ｉ．，［１．８）＋（０，０．０）・（０．
２．０．１．［）．ｌ．）（−０．８）Ｘ０．２＋　（
−０．８）ＸＯ．ｌ＋　（−０．８）Ｘ０．８０８８次に、式（１）の第２項は、結果とする場合には、第１表に従一）て認識結果の時系
列Ｉ−１ｍ−ｎ」が出力され、本来はｒｉｎ−ｊである
人力文字が（’ｉｍｎｊど誤認識されてしまうのである
。

そこで、以下に詳述４−るように、判定用ニコーラル・
ネッｌ・ワーク４によって各出力ヘクｌ・ル０１．（ｔ
）に対才ろ判定用データを算出し、この判定用データに
基づいて正しく人力文字を認識ずろのである。

以下、領域■（境界部）におけろ出力ノード「ｍｌの出
力値”　０　．　８　”と、領域■（文字部）における
出力ノート［ｎ−１の出力値゛゜０　８”とに対ずろ判
定用データの算出について、具体的に述べる。

ａ）領域■における出力ノード「ｍ」ここで、領域■の時刻か１となるから、領域■の時刻｛
Ｊ．（ｔ−．１．）、領域■の時刻（よ（１−２）、領
域■の時刻は０１１）、領域■の時刻は（ｔ＋２）とな
る。

したかって、判定用ニコーラル・ネゾ｝・ワーク４にお
Ｏるウェイト・ヘク］・ルＷ（１）は第５図より次のよ
うになる。

Ｗ（−２）＝　（０．０．０）、Ｗ（川）＝（−０．８
，−０．８．−０．８）、Ｗ’（］）＝（−０．８，−
０．８，．．．．．０．８）、Ｗ（２）＝（ＣＩ，０．
０）？４Ｗ（−１．）・○（ｔ−１）＋Ｗ（−２）・Ｏ　（ｔ−
２）（−０．８，−０．８，−０．８）・（０．］．．
，Ｏ．！．，０．２）＋（０，０．０）・（１．．０．
０．２，０．２）（−０．８）ＸＯ．ｌｌ−（−［）．
８）ＸＯ，ｌ＋（０．８）Ｘ０．２０．３２さらに、式（１）の第３項は、Ｋ　＝＝　１として、Ｋ
−０］ｍ（Ｌ）−１　ｘＯ．８＝０．８したがって、１二２０　２ｍ（ｔ）一　ΣＷ（ｉ）０１（ｔ＋ｉ）１：１０　　８８−０．３２　ｌ−０．８０４１））領域■にお｛１′ろ出力ノーＦ「ｎ　１ここで、
領域■の時刻が（となるから、領域■の時刻は０−１）
、領域■の時刻は（ｔ−２）、領域■の時刻は（ｔ−３
）、領域■の時刻（』０←１）となる。したがって、ウ
ェイト・ベク１・ルＷ（】）および認識用ニコーフル・
ネノ］・ワーク２の出力｛７ｉは次のようになＷ（−３
）＝（０．５，０．５，０．５）、Ｗ（−２）＝（０，
ｏ，ｏ）、Ｗ（−１．）−（−０．８，−０．８，−０
．８）、　Ｗ］．＝（−０．８，−０．８０８）０　１．（ｔ−３）＝　（１．０，０．２，０．２）、
０１（ｔ−２）＝（０．］．．．０．１０．２）、Ｏ　
］（ｔ−１）＝　（０．２，０．８，０．：’ｌ）、０
　１．．（ｔ＋１．）＝　（［１２　０．１　０．１．
）０　１ｎ（ｔ）　＝　０　．　８したがって、判定用ニューラル・ネ・ソトワーク４にお
ける出力ノード丁ｎ」から出力される判定用データ０　
２ｎ（ｔ）は、式（１）上りＫ＝１として次のように求
めることかできる。

１−１０　２ｎ（ｔ）一　Σ　Ｗ（ｉ）Ｏｆ（い１）ｉ＝１＝　（−０．８．−０８，−０．８）・（０．２，Ｏ．
Ｉ．，０．１．）−ｔ−　（−０．８，−０．８，−０
．８）・（０　．　２　，　０　．　８　，　０　．　
３）＋（０．５，０．５，０．５）・（１．［ｌ，０．
２，０．２）十０．８＝−０　．　３　２−０　．　３　４　−＋−　０　．
　８２７０　　１４以下同様にして、第１表に示した認識用ニコーラル・ネ
ソトワーク２の出力ベクトル０１（１）に応して、’ｌ
’．ｌｌ定用ニューラル・ネソｌ・ワータ４によって判
定用データが算出さ２１、’ｌ．！Ｉ定用データのベク
］・ルが第２表に示すように出力ざれる。第２表は、各
領域■〜■における出力ヘクｌ・ルの最大値に対ケろ判
定用データのみを表示している。

第２表この場合、第１表に示すように、認識用ニコーラル・ネ
ソトワーク２から出力される領域■に４３ける出力ノー
ド丁ｍ」の出力値と領域■におげる出力ノード［−ｎ１
の出力値と（．Ｌ同し値゜゛０　８”を１′．シている
。ところが、この同じ値“０　８”に対して判定用二：
ｒ−ラル・ネットワーク４によって得られた判定用デー
タは、文字部てある領域■にＪ３いては相２８？的に大きな値”０．１４”となる一方境界部てある領
域■においては相対的に小さい値“−０　４”となり、
夫々異なる値になる。

したがって、出力判定部６は例えば閾値”　ｏ　．　ｏ
　”以」二の最大出力値を呈する出力ノードに割り付け
られた認識文字を認識結果とする場合には、第２表に従
って認識結果の時系列「１−０１が出力される。

すなわち、入力文字「１ｎ」の画像データが入力された
場合に、文字部「１」お上び文字部ｒｎＪとそれらの境
界部とを識別して正しく人力文字を認識できるのである
。

上述のように、本実施例においては、シフ１・される領
域内の特徴量に基づいて、認識用ニコ−−ラル・ネッ｝
・ワーク２によって入力文字が認識される。そうすると
、平均的な文字間隔て■蕾仕の値を有するように設定さ
れたウエイ１・・ベクトルＷ（１）と認識用ニューラル
・ネットワーク２からの出力ベクｌ・ルの時系列とに基
づいて、判定用ニコーラル・ネットワーク４の判定用デ
ータ算出部８によって、式（１）に従って文字部と境界
部とをより正しく判定するための判定用データを算出す
る。

そして、この判定用データの時系列に基づいて出力判定
部６によって正しい文字以識結果を出力する。したが引
て、認識用ニコーラル・ネットワーク２による認識結果
が正しいか否かを判定して正しい認識結果を出力できろ
。

上記実施例における判定用データの算出アルゴリズムは
、例えば日本語文字を認識する際には膨大な計算量とな
る。そこで、計算量を少なくする方法として、各領域■
〜■にお｛プる杷識用ニューラル・ネッＩ・ワーク２の
出力ベクトルの最大出力値（第１表における＊印の付加
された出力値）のみを用いて判定川データを算出電る，
、この場合に得られる判定用データは第３表に示すよう
になる。

第３表この場合し、第２表と同様に文字部である領域■にＪ：
　ｔＪろ判定用データは抑制され４′゛にＩＱ界部であ
る領域■にお（−ｊろ判定用データか抑制ざれる。した
がって、出力判定郎６（Ｊ閾仏“０　０゜′より大きな
最人出力値を−宅４−る出力ノードに割りイマ］けられ
た認識文字を認識結果とするようにすると、第３表に従
一）て認識結果の時系列ｒｉ−ｎｌが出力される。

上記各実施例は、この発明を文字認識に使用した場合の
例であるが、音声認識に使用した場合にも同じような効
果が得られる。ずなわら、この場合にはウェイト・ベク
トルＷ（ｉ）の興蕾ヤ１：の間隔を平均音節長に設定す
るのである。こうずることによって、平均音節長に近い
間隔における特？ＦＩ．量に基つく認識用ニコーラル・
ネットワークの出力値は抑制ざれず、その間の区間にお
ける特徴量に基づく認識用ニコーラル・ネットワークの
出力値は抑制され、認識率を上げることができるのであ
る。

このことは、人間の丈際に音を聞き取る動作において、
ある音が聞こえる（すなわち、認識される）とその後の
短区間は認識に関ｔｊ．シないというマスク効果によく
似た現象であると言える。但し、音３１認識桔果に応じた、換言すれば、判別用ニコーラル・ネ
ントワーク４に対する人カベクトルに応じたＣＰＵＩＯ
の制御によって、ウェイト・ベク１・ルＷ（１）の値を
変更するのである。

ずなわら、時刻Ｌにおける人力ヘクトルのうち最大偵を
呈する要素を出力した認識用二：Ｉ−ラル・ネノトワー
ク２の出力ノー１・が割りイで］けられている文字が（
ずなイつら、認識用ニューラル・ネットワーク２の認識
結果力９文字幅の狭い「１」の場合には、例えば第５図
に示すｉ−Ｗ（ｉ）の関係を１軸に沿って縮小したｉ−
Ｗ（ｉ）関係を子Ｊずるウエイ１・・ベクトルＷ（１）
を用いろようにする。また、文字幅の広い［−ｍ」の場
合には、第５図に示ずｌ−Ｗ（ｉ）の関係を１袖に’／
（’ｔって伸長したｉ−Ｗ（ｉ）関係を有するウェイト
・ベクトルＷ（ｉ）を用いるようにするのである。

古なわち、七記第１の発明で述へた実施例の場合には、
領域■にお５１る出力ノー１’「ｍｌの出力値の算出の
際に用いるウェイト・ベクトルＷ（１）として、第５図
に示すｉ−Ｗ（ｉ）関係をｉ軸に沿って弓声詔識の場合
には、マスク効果の影饗度が時間的な前後に対して異な
るため、第５図に示すウェイト・ベクトルのｉ−Ｗ（ｉ
）関係を時間の正逆方向に対して非対象にすることによ
って、さらに認識率を高めろことかできる。

上記文字認識の場含の尖施例に１３いては、領域■にお
けろ出力ノード「ｍ−１の出力偵の算出の際にお｛Ｊる
ウ」．イト・ヘクトルＷ（１）と、領域■にわげる出力
ノー｝・丁ｎ−１の出力値の算出の際にお（ナるウエイ
］・・ベク｝・ル’Ａ’　（　ｉ　）と｛Ｊ、、ｉ−Ｗ
（ｉ）関係が同し（第５図に示す関係）であるウェイト
・ベクｌ・ルＷ（ｉ）を用いている。ところが、一般に
文字間隔は文字幅によって異なり、例えば［ｌ」は文字
幅が狭＜ｒｍＪｔユ文字Φ１゛３が広いのでｌ−ｉ１−
ｒｍ４の間隔とｒｍＪと次の文字との間隔とは異なる。

したがって、文字部ど境界部とを適確に判別するために
は興蕾性のウェイト・ベクトルの間隔を文字間隔に応じ
て変更する必要かある。

そこで、第２の発明の認識イ１１１果判疋装ρｌに７１
３いては、認識用ニコーラル・不ノ１・ワーク２に土る
３２き伸ばしたウエイ［・・ベクｌ・ルＷ（ｉ）を用いるの
である。このように、認識｝１］ニコーラル・ネソトワ
ーク２の認識結果に応じてウエイ１・・ベク］〜ルＷ（
］）を変更することによって、領域■における出カノー
ドＩ”’ｍｌの出力値算出の際に用いられろウェイト・
ベクトルＷ（１）のイ直か１ニリ小さくなり、よりノ←
きむ抑制効果が得られるのである。（７たがって、文字
幅の小さい文字や大きい文字の特性に合一・たように正
確に興奮と抑制の効果が得られ、さらに制度の高い文字
認識ができる。

上述のようなウェイト・ベクトルＷ（】）にお（」る興
蕾性の値の間隔の制御は、予め認識対象間の間隔を直接
求めて、この永めた認識対象間の間隔に応じて判定時に
適応的に実施４−るようにすれば、さらにきめ細かな認
識処理を尖行てきる。

そこで、第３の発明の認識結果判定装置においては、第
１因にＪ５（つる人力監視部９によって認識苅象の特徴
量に基づいて認識対象間の間隔を求め、人力監視部９か
らのデータに基づいてＣＰＬＪＩＯによー）てウエイＩ
・・ベクトルＷ（ｉ）の値を変更するものである。

以下、上述の入ノノ監視部９およびＣ　Ｐ　Ｌ．Ｊ　Ｉ
　Ｏによるウェイト・ベクトルＷ（１）の制御について
、音声認識の場合を例に具体的に説明４−る。入力監視
部９は、入力提示部１の音声分析部に音声信号か入力さ
れるど、Ａ／Ｉ）変換ざれて−・定のフレーム長でケプ
ストラム係数が求められ、入力監視部９に出力される。

そうすると、人力監視部９は、数フレーム離れたフレー
ム問のケブス１・ラム係数値（スペクトル変化）が極小
値を取るフレームの前後数フレーム区間の中から、連続
する類似フレーム（すなわち、上記極小値を取るフレー
ムとのケプストラノ，、係数値の差が閾値以下となるフ
レーム）の数を求め、その連続する類似フレームの数を
定常部区間長どする。そして、予め記憶している定常部
区間長と発声速度との対応表を参照して、上記求められ
た定常部区間長に基づいて平均発声速度を算出し、この
平均発声速度の逆数から平均音節長を求めるのである。

そうずると、ＣＰＵｌ．Ｏはウェイト格納部７か３５この発明における判定用データ算出アルゴリズムは、上
記各実施例にお＋１るアルゴリズムに限定されるもので
はない。

〈発明の効果〉以上より明らかなように、第１の発明の認識結果判定装
置は、ウェイト格納部．判定用データ算出部および出力
判定部を備えて、下層における複数ノードから出力され
る出力ヘクトルの時系列を上記判定用データ算出部に入
力し、上記ウェイト格納部に格納されたウェイト・ベク
トルを用いて、下層における複数ノートから出力される
出力ベクトルが表す認識結果が正しいか否かを判定する
ための判定用データを求め、この判定用データに基づい
て上記出力判定部によって上記認識結果が正しいか否か
を判定して正しい認識結果を出ノノするようにしたので
、下層によるソフトされる領域の特徴量に基づく認識結
果が正しいか否かを上記判定用データに基づいて判定す
ることができ、正しい認識結果を出力ずることができる
。

また、第２の発明の認識結果判定装置は、上記ら対応ず
るウエイ｝・・ヘクトルＷ（１）を読み出し、入力監視
部９からの平均音節長に基づいて、ト述のようにウエイ
１・・ベクトルＷ（ｉ）の興奮性の間隔を平均音節長に
変更するのである。こうずることにｊコって、発声速度
が変化しても適応的に追従してウェイト・ベクｌ・ルＷ
（１）の興奮性の間隔を平均音節長に制御することかて
き、きめ細かな音声認識処理を実施できるのである。

この発明における平均音節長算出のアルゴリズムは、本
実施例のアルゴリズムに限定されるものではない。

」二記各実施例においては、認識用ニコーラル・ネット
ワーク２と判定用ニューラル・ネソＩ・ワーク４とを異
なるニューラル・ネットワークによって構威している。

しかしながら、この発明はこれに限定されるものではな
く、一つのニコーラル・ネッ１・ワークによって構成し
、そのニコーラル・ネソトワークの下層部を認識用のニ
コーラル・ネットワークとし、上層部を判定用のニョー
ラル・ネットワークとしも差し支えない。

３６ウェイト格納部，判定用データ算出部および出力判定部
に加えてウェイト制御部を備えて、上記判定用データ算
出部が算出しようどしている判定用データに対応ずる下
層における複数ノードからの出力ベクトルが表す認識結
果に応じて、１二記ウェイト制御部によって上記ウエイ
Ｉ・・ベク１・ルの値を所定の規１’ｌｌ１に従って変
更ｌ−るようにしたので、認識対象間の境界部におげろ
上記Ｆ層における複数ノートからの出力値を更に抑制し
て上記判定用データを算出することが可能となる。した
がって、この発明の認識結果判定装置によれば、より正
しい認識結果を出力できる。

また、第３の発明の認識結果判定装置（Ｊ、」二記ウェ
イト格納部．！Ｐ１１定用デーク算出部および出力判定
部に加えて、入力監視部およびウェイト制御部を備えて
、上記入力監視部に上って認識対象と隣接する認識対象
との間隔を表す情報を求め、この情報に応じて上記ウェ
イト制御部によってウェイト・ベクトルの値を変更づー
るようにしたので、入力される認識対象間の間隔が絶え
ず変化しても適応的に追従してウェイト・ベクトルを変
更でき、更に正しい認識結果をＩＩｊ力できる。

【図面の簡単な説明】

第１図はこの発明の認識結果判定装置にお（：ｌろ一実
施例のブロック図、第２図は認識用ニクーラル・ネット
ワークからの出力ベク１・ル時系列の判定用ニューラル
・ネットワークへの入力状態の説明図、第３図は入力文
字認識動作および認識結果判定動作のフローヂャート、
第４図は認識用ニコーラル・ネッＩ・ワークに入力され
る特徴量の領域に対ずるソフトの説明図、第５図はウェ
イト・ヘクＩ・ルの値の一例を示す図、第６図は従来例
における文字画像データ入力の説明図である。１　人力提示部、２・・認識用ニコーラル・ネットワーク、３・・第Ｉ出
力バソファ・４・・判定用ニューラル・ネットワーク、５　第２出力
バッファ、　　　　６・・・出力判定部、７　ウェイト
格納部、８・判定用データ算出部、９・・・人力監視部
、　　　　　　１０−ＣＰＵ０３ｇ

Claims

【特許請求の範囲】

（１）認識対象の時系列における上記各認識対象間の平
均間隔に応じた時間間隔で興奮性の値を示すと共に、上
記興奮性の値の近傍においては抑制性の値を示すウェイ
ト・ベクトルを格納するウェイト格納部と、下層における複数ノードから出力される出力ベクトルの
時系列を入力し、この入力された上記下層の複数ノード
からの出力ベクトルの時系列の各値と上記ウェイト格納
部に格納されたウェイト・ベクトルの値とに基づいて、
上記下層における複数ノードからの出力ベクトルが表す
認識対象に対する認識結果が正しい認識結果であるか否
かを判定するための判定用データを算出し、出力層の各
出力ノードから出力する判定用データ算出部と、上記判
定用データ算出部から出力される判定用データの時系列
に基づいて、上記下層における複数ノードからの出力ベ
クトルが表す認識対象に対する認識結果が正しいか否か
を判定して、正しい認識結果を出力する出力判定部を備
えたことを特徴とする認識結果判定装置。
（２）請求項１に記載の認識結果判定装置において、上記判定用データ算出部によって判定用データを算出す
る際に、算出しようとする判定用データに対応する上記
下層における複数ノードからの出力ベクトルが表す認識
結果に応じて、上記ウェイト・ベクトルの値を所定の規
則に基づいて変更するウェイト制御部を備えたことを特
徴とする認識結果判定装置。
（３）請求項１に記載の認識結果判定装置において、上記認識対象の時系列に基づく特徴量の時系列を入力し
、上記入力した特徴量の時系列に基づいて、認識しよう
としている認識対象と隣接する認識対象との間の間隔を
表す情報を求める入力監視部と、上記入力監視部によって求められた認識対象と隣接する
認識対象との間隔を表す情報を入力して、この入力され
た情報に応じて上記ウェイト・ベクトルの値を所定の規
則に基づいて適応的に変更するウェイト制御部を備えた
ことを特徴とする認識結果判定装置。