JPS63186299A

JPS63186299A - 単語音声認識装置

Info

Publication number: JPS63186299A
Application number: JP62018079A
Authority: JP
Inventors: 教幸藤本
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1987-01-28
Filing date: 1987-01-28
Publication date: 1988-08-01
Anticipated expiration: 2012-03-12
Also published as: JP2589300B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔目　次〕概要産業上の利用分野従来の技術発明が解決しようとする問題点問題点を解決するための手段作用実施例 ■、実施例と第１図との対応関係 ■、実施例の構成 ■、実施例の動作（ｉ）単語音声の認識動作（１１）単語音声パターンの登録置換 ■、実施例のまとめ ■０発明の変形態様発明の効果〔概　要〕単語音声認識装置であって、所定の分類基準に従って複
数に分けられた単語音声の登録パラメータのそれぞれに
ついて、入力単語音声についての入力パラメータを照合
して、両パラメータ間で最小距離もしくは最大類似度と
なる単語音声を求めて、選択的に出力する。単語音声群
はある基準に従って分類されているので、当該基準に沿
った関係上にある単語音声の照合に要する時間が短縮さ
れる。分類されている単語音声は必要に応じて変更可能
であるので、変更後にあっても認識動作に要する時間が
短縮される。

〔産業上の利用分野〕

本発明は、単語音声認識装置に関し、特に、人が発声す
る言葉を自動認識する技術である音声認識を適応し、登
録されている音声パターンと照合して、発声された単語
に関する情報を得るようにした単語音声認識装置に関す
るものである。

〔従来の技術〕

従来から、このような音声認識に関しての研究が盛んで
あり、また、それを応用した音声認識装置も開発、実用
化されている。

このような音声Ｌｉ！！装置の参考文献として、１９８
３年１１月７日発行の「日経エレクトロニクス」の第１
７１頁〜第２０８頁「連続発声した単語音声を効率的に
認識する２段ＤＰマツチングＪが挙げられる。そこに紹
介されている音声認識装置における音声認識処理として
は、第３図に示すような流れとなっている。

図において、先ずマイクロホン４５１から入ってくる音
声は、分析部４５３によって分析され、その音声パター
ンの特徴を表す認識パラメータが抽出される。

このシステムにあっては、特定話者用の単語音声認識装
置であるとすると、切換スイッチ４５５を「登録」の側
に設定して、分析部４５３で抽出された音声パターンの
特徴を表す認識パラメータを、その特定話者用に標準パ
ターン部４５７に登録する。これにより、このシステム
によって認識動作を行なう前に、その特定話者の各認識
対象単語の分析結果が、標準パターンとして予め登録さ
れる。

実際に認識動作を行なうときには、切換スイッチ４５５
を「認識」側に設定しである。各認識対象単語の標準パ
ターン（標準パターン部４５７に登録済み）と、現入力
音声パターン（分析部４５３から得られる）の両バラシ
ータを比較して、最も近い（すなわち距離の小さい）認
識対象単語を選択する。つまり、パターンマツチング処
理を行なう。

ここで、パターンマツチング処理は、距離計算部４５９
により、分析部４５３から得られる現入力音声パターン
のパラメータと、既に標準パターン部４５７に登録され
ている各認識対象単語の標準パターンとの距離を演算す
る。また、最小値検出部４６１は、距離計算部４５９に
おける計算結果に基づいて、最も距離の小さい標準パタ
ーン認識対象単語を抽出して、「認識結果ｊとして出力
する。

なお、パターンマツチング処理方法としては、距離計算
手法の他に類似度計算手法も知られている。「距離の小
さい」ことと、「類似度の大きい」ことは等価である。

〔発明が解決しようとする問題点〕

このような従来方式にあっては、現入力音声パターンの
パラメータを、標準パターン部４５７に予め登録しであ
る認識対象単語の標準パターンと比較する際には、該標
準パターン部４５７に登録しである認識対象単語の全て
について比較する。

そのため、認識対象単語群の全てについて照合を行ない
、１位、２位、３位、・・・・・・を決定し、順番に「
認識結果」として出力していた。

しかしながら、標準パターン部４５７に予め登録しであ
る認識対象単語が少ないときには問題ないが、当該認識
対象単語が多いときには、それら認識対象単語の全てに
ついて比較しているので、「照合結果Ｊが得られるまで
に多大の時間がかかる。そのため、認識動作における応
答が遅くなってしまうという問題点があった。

通常、標準パターン部４５７については、その使用頻度
を考慮しないで単語登録は行なわれている。

いま、多項目入力につき、それらについて認識動作を行
なうものとする。

例えば、標準パターン部４５７に予め登録しである認識
対象単語群での単語数が１００００語であり、そのうち
使用頻度の高い単語は１０００語であるものとする。そ
の場合、第３図に示すようなシステムでの認識性能は、
使用頻度の高い１０００語についての「認識率」が９６
パーセント、また、１００００語の全てについての「認
識率」は７０パーセントであり、更に、１誘光たりの「
照合時間」は、０．５　ｍｓであるものとする。

その場合の実効認識率は、７０パーセントであり、また
、応答時間は５秒（＝０．５晒Ｘ１００ＯＯ語）である
。

このように、多項目入力として認識対象単語が多いとき
には、それの「認識結果」が得られるまでに多大の時間
がかかってしまうという問題点があった。

このような問題点を解決するものとして、本出願人は、
同日付けの特許願「単語音声認識装置」を提案した。こ
の装置は、所定の分類基準に従って複数に分けられた単
語音声の登録パラメータのそれぞれについて、入力単語
音声についての入力パラメータを照合して、両パラメー
タ間に一定の関係が成立する単語音声を求めて、選択信
号に応じて選択的に「認識結果」として出力するように
している。これにより、登録単語音声はある基準に従っ
て分類されているので、当該基準に沿った関係上にある
単語音声の照合に要する時間が短縮される。

しかしながら、かような装置にあっては、予め所定の分
類基準に従って複数の単語音声群に順位を付けて分けら
れている。そのため、第２順位。

第３順位、・・・・・・等、第１順位以外にグループ分
けされた登録単語については、その「認識結果」を得る
のに絶えず時間がかかってしまうという問題点がある。

本発明は、このような点にかんがみて創作されたもので
あり、実効認識率の向上を図ると共に、単語音声の照合
に要する時間が短縮された単語音声認識装置を提供する
ことを目的としている。

〔問題点を解決するための手段〕

第１図は、本発明の単語音声認識装置の原理ブロック図
である。

図において、複数の単語登録手段１１１Ａ、Ｂ。

Ｃ２・・・・・・のそれぞれには、所定の分類基準に従
って複数に分けられた単語音声の各パターンについてそ
の特徴を表すパラメータが登録されている。

照合手段１１７は入力単語音声のパターンについてその
特徴を表す人力パラメータ１１３を得、複数の単語登録
手段１１１Ａ、　Ｂ、　Ｃ，・・・・・・のそれぞれが
有する登録パラメータと照合し、距離もしくは類似度を
求めて、照合結果１１５Ａ、Ｂ。

Ｃ９・・・・・・として出力する。

格納手段１１９は、照合結果１１５Ａ、　Ｂ、　Ｃ。

・・・・・・の情報を格納する。

選択制御手段１２３は、１つの照合結果１１５Ａが得ら
れた段階で、距離最小もしくは類似度最大の単語を選び
、第１位の認識結果として出力する。ここで、単語登録
手段１１１Ａに含まれる単語を使用頻度の高い少数の単
語としておけば、音声入力から認識結果が得られるまで
の時間が短縮されると共に認識率も向上する。もし、第
１位として出力した認識結果が誤りであった場合に：よ
、使用者もしくは外部装置から次候補要求信号１２１が
発せられる。選択制御手段１２３は、次候補要求信号１
２１に応じて、格納手段１１９にその時点で格納されて
いる照合結果の中から、既に出力済みの単語を除いた上
で距離最小もしくは類似度最大の単語を選択し、認識結
果として出力すると共に、該出力された前記認識結果に
応じて登録順序判別信号１２５を発生する。

登録順序制御手段１２７は、登録順序判別信号１２５に
応じて、複数の単語登録手段１１１Ａ。

Ｂ、Ｃ，・・・・・・が有する各登録パラメータについ
て、必要に応じて順序換えを行なう従って、全体として、入力パラメータ１１３を複数に分
けられた単語音声の登録パラメータのそれぞれと照合し
、前記入力単語音声と一定の関係がある単語情報を求め
て選択的に出力すると共に、単語登録手段１１１Ａ、　
Ｂ、　Ｃ，・・・・・・が有する各単語の登録パラメー
タについて順序換えを行なえるように構成されている。

〔作　用〕

入力単語音声についての入力パラメータ１１３が与えら
れると、照合手段１１７は、複数の単語登録手段１１１
Ａ、　Ｂ、　　Ｃ，・・・・・・のそれぞれが有する登
録パラメータのそれぞれと照合し、距離もしくは類似度
を求めて、照合結果１１５Ａ、Ｂ。

Ｃ１・・・・・・として出力する。

これら照合結果１１５Ａ、Ｂ、Ｃ，・・・・・・で表さ
れる単語毎の距離もしくは類似度の情報が、格納手段１
１９に格納される。

選択制御手段１２３は、１つの照合結果１１５Ａが得ら
れた段階で、距離最小もしくは類似度最大の単語を選び
、第１位の認識結果として出力する。

単語登録手段１１１Ａに含まれる単語を使用頻度の高い
少数の単語としておけば、音声入力から認識結果が得ら
れるまでの時間が短縮されると共に、認識率も向上する
・もし、第１位として出力した認識結果が誤りであった場
合には、使用者もしくは外部装置から次候補要求信号１
２１が発せられる。選択制御手段１２３は、次候補要求
信号１２１に応じて、格納手段１１９にその時点で格納
されている照合結果の中から、既に出力済みの単語を除
いた上で距離最小もしくは類似度最大の単語を選択し、
認識結果として出力する。

また、登録順序判別信号１２５に応じて登録順序制御手
段１２７は、複数の単語登録手段１１１Ａ、Ｂ、Ｃ，・
・・・・・が有する各単語の登録パラメータについて、
必要に応じて順序換えを行なう。

本発明にあっては、複数の単語登録手段１１１Ａ、　Ｂ
、　Ｃ，・・・・・・には、所定の分類基準に従って分
けられた単語音声の登録パラメータがそれぞれあるので
、当該基準に沿った関係上にある単語音声の照合に要す
る時間が短縮され、また、複数の単語登録手段１１１Ａ
、Ｂ、Ｃ，・・・・・・が有する各単語の登録パラメー
タについて順序換えが可能であるので、順序換え後にお
ける認識動作も速くなる。

〔実施例〕

以下、図面に基づいて本発明の実施例について詳細に説
明する。

第２図は、本発明の一実施例における単語音声認識装置
の構成を示す。

■、　　　１と　１“との・Ｊ゛・　・ここで、本発明
の実施例と第１図との対応関係を示しておく。

単語登録手段１１１Ａ、　Ｂ、　Ｃ，・・・・・・は、
第１パターン登録部２１１Ａ、第２パターン登録部２１
１Ｂに相当する。

入力パラメータ１１３は、区間検出出力信号２１３にお
ける入力単語音声パターンの特徴を表す認識パラメータ
に相当する。

照合結果１１５Ａ、　Ｂ、　Ｃ，・・・・・・は、照合
結果出力信号２１５に相当する。

照合手段１１７は、第１照合部２１７Ａ、第２照合部２
１７Ｂ、判定部２１８に相当する。

格納手段１１９は、照合結果格納部２１９に相当する。

次候補要求信号１２１は、キーボード２４１から与えら
れる次候補要求信号に相当する。

選択制御手段１２３は、判定部２１８．制御部２２３に
相当する。

登録順序判別信号１２５は、制御部２２３からパターン
置換処理部２２７に与えられる登録順序判別信号に相当
する。

登録順序制御手段１２７は、パターン置換処理部２２７
に相当する。

ｎ列ｌ戊以上のような対応関係があるものとして、以下本発明の
実施例について説明する。

第２図に示す単語音声認識装置としては、特定話者用で
あるものとする。

マイクロホン２３１は、話者の音声を信号波形に変換す
るものであり、その波形信号は次のパラメータ抽出部２
３３に供給されるようになっている。このパラメータ抽
出部２３３は、それぞれ周波数帯域の異なるバンドパス
フィルタを複数個設けておき、一定間隔でサンプリング
するものである。

ここで、第１パターン登録部２１１Ａおよび第２パター
ン登録部２１１Ｂとして設けられている２つの標準パタ
ーン登録部には、当該特定話者についての音声パターン
の特徴を表す認識パラメータが、その特定話者用に登録
されている。その登録方法としては、その特定話者がマ
イクロホン２３１に向かって通常の発声状態で発声する
。その音声パターンの特徴を表す認識パラメータがパラ
メータ抽出部２３３によって抽出される。その抽出され
た音声パターンの特徴を表す認識パラメータが、当該特
定話者用に第１パターン登録部２１１Ａおよび第２パタ
ーン登録部２１１Ｅ３に登録される。かような登録動作
により、この単語音声認識装置によって認識動作を行な
う前に、その特定話者の各認識対象単語の分析結果が標
準パターンとして予め登録される。

ここで、第１パターン登録部２１１Ａおよび第２パター
ン登録部２１１Ｂの２つに登録単語を分ける基準は、当
該特定話者に対する認識対象単語の使用頻度に従ってい
る。例えば、全体として１００００語を登録するものと
して、その内の使用頻度の高い１０００語を第１パター
ン登録部２１１Ａに登録し、これに対して使用頻度の高
くない９０００語を第２パターン登録部２１１Ｂに登録
する。

この単語音声認識装置としては、パラメータ抽出部２３
３の後段に区間検出部２３５を設け、制’ｌＢ部２２３
の制御の下に所定の区間について、パラメータ抽出部２
３３で抽出されたパラメータを検出する。

この区間検出部２３５は、本来「音声」でない部分も音
声波形に含まれているので、パワー等により、一定区間
について区切って、「音声」の部分を取り出している。

その検出されたパラメータを表す区間検出出力信号２１
３が、第１照合部２１７Ａおよび第２照合部２１７Ｂに
共通に供給される。

この第１照合部２１７Ａには、第１パターン登録部２１
１Ａに登録されている各認識対象単語の標準パターンが
供給される。また、第２照合部２１７Ｂには、第２パタ
ーン登録部２１１Ｂに登録されている各認識対象単語の
標準パターンが供給されるようになっている。

第１照合部２１７Ａおよび第２照合部２１７Ｂは共に制
御部２２３の制御に基づいて、区間検出出力信号２１３
によって表される音声パターンの特徴を表す認識パラメ
ータが、第１パターン登録部２１１Ａに登録されている
各認識対象単語の標準パターンと、また、第２パターン
登録部２１１Ｂに登録されている各認識対象単語の標準
パターンとそれぞれ照合されて、単語毎に距離が求めら
れ、その照合結果を表す照合出力信号２１４Ａ。

照合出力信号２１４Ｂが出力されて判定部２１８に供給
される。

判定部２１８では、照合出力信号２１４Ａ、照合出力信
号２１４Ｂで表されるそれぞれの照合結果を受は取り、
そのまま照合結果出力信号２１５として、照合結果格納
部２１９に供給されて順次格納されるようになっている
。また、判定部２１８では、照合出力信号２１４人中の
距離最小の単語を選択した後、出力制御信号２１６を制
御部２２３に供給すると同時に、第１位の認識結果とし
て上記距離最小の単語を表す選択結果信号２２４が制御
部２２３に供給される。

キーボード２４１は、この単語音声認識装置を操作する
ための多数のキーが具わっており、その中には、照合結
果格納部２１９に「照合結果」として格納された複数の
認識対象単語を、任意に選択して制御部２２３が「認識
結果」として、利用装置（図示せず）に与えられるよう
にするための次候補要求キー（図示せず）が含まれてい
る。第１位の認識結果が誤りであった場合には、使用者
が、この次候補要求キーを押下することにより、制御部
２２３から判定部２１８に次候補要求信号が送られ、判
定部２１８では照合結果格納部２１９において、既に出
力済みの単語を除いた中から距離最小の単語を選択して
、選択結果信号２２４を制御部２２３に供給する。

制御部２２３の「認識結果」出力に応じて、それに該当
する単語に関する「登録順序判別信号」が発生され、そ
れに応じてパターン置換処理部２２７は、第１パターン
登録部２１１Ａ内の登録単語の順序変更、あるいは第２
パターン登録部２１１Ｂと第１パターン登録部２１１Ａ
との登録単語の交換を指示できるようになっている。

−町一芸考」杉囚机作上述した構成による実施例の動作について、以下説明す
る。

この単語音声認識装置が対象としている特定話者が、マ
イクロホン２３１の前で、「認識動作」を行なうために
、特定の単語を発声したものとする。

但し、「単語」は単音節のもの、また、それ以外のもの
も含むものとする。

（ｉ）゛′８五３声の切ｆ６壬マイクロホン２３１によって捕らえられた音声波形は、
パラメータ抽出部２３３によって、音声パターンの特徴
を表す１７３ｍパラメータが抽出される。その抽出され
た音声パターンの特徴を表す認識パラメータが区間検出
部２３５に供給され、区間検出部２３５において、時間
的にパワーの変化する特定の区間にてパラメータ検出さ
れ、その検出されたパラメータを表す区間検出出力信号
２１３が、第１照合部２１７Ａおよび第２照合部２１７
Ｂに共通に供給される。

制御部２２３から、第１照合部２１７Ａおよび第２照合
部２１７Ｂの照合動作を付勢するように制御信号が与え
られる。第１照合部２１７Ａは、第１パターン登録部２
１１Ａに登録されている「高使用頻度の単語」音声パタ
ーンと、区間検出出力信号２１３として導入された入力
単語音声パターンとを、それらの特徴を表すパラメータ
に基づいて比較する。第１パターン登録部２１１Ａの登
録単語は１０００語と少ないので、全部の登録単語につ
いての照合動作は速く、照合出力信号２１４Ａが第１照
合部２１７Ａから判定部２１８に供給される時間は短い
。

また、第２照合部２１７Ｂも同様にして、第２パターン
登録部２１１Ｂに登録されている「低使用頻度の単語」
単語音声パターンと、区間検出出力信号２１３として導
入された入力単語音声パターンとを照合する。ここで、
第２パターン登録部２１１Ｂの登録単語は９０００語と
多いので、その照合動作は遅い。従って、全てについて
の照合出力信号２１４Ｂが、第１照合部２１７Ｂから判
定部２１８に供給される時間は長い。

制御部２２３によって制御される判定部２１８は、照合
出力信号２１４Ａおよび照合出力信号２１４Ｂを受け、
照合結果出力信号２１５として、照合結果格納部２１９
に与えられる。但し、「低使用頻度の単語」について格
納の終了は遅い。

このとき、照合出力信号２１４Ａに対応した判別による
「高使用頻度の単語」に対する「照合結果」は、その「
距離」の小さい順に、第１位、第２位、第３位、・・・
・・・とじて、照合結果格納部２１９に格納される。

また、照合出力信号２１４Ｂに対応した「低使用頻度の
単語」に対する「照合結果Ｊも、その「距離」の小さい
順に、第１位、第２位、第３位。

・・・・・・とじて格納される。但し、「高使用頻度の
単語」に対するｒ照合結果ｊと、「低使用頻度の単語」
に対する「照合結果ｊとは、それぞれの順に従っている
。

判定部２１８からは出力制御信号２１６が制御部２２３
に与えられ、これにより、少なくとも最初の「照合結果
」が判定部２１８において得られるので、照合結果出力
信号２１５として照合結果格納部２１９に格納されたこ
とを通知することとなる。これを受けた制御部２２３は
、先ず、「高使用頻度の単語」に対する第１位の「照合
結果ｊを照合結果格納部２１９から取り出すべく、判定
部２１８に指令する。

判定部２１８は、「高使用頻度の単語」に対する第１位
のｒ照合結果ｊを格納単語情報信号２２２として照合結
果格納部２１９から求める。このようにして得た格納単
語情報信号２２２に応じて選択結果信号２２４として制
御部２２３に供給して、その次段に接続されるべき利用
装置（図示せず）に「認識結果」として出力する。

仮に、この出力された第１位の「照合結果」が特定話者
の意図した現発声単語でなければ、キーボード２４１に
具わっている次候補要求キーを操作する。その次候補要
求キーの操作までには、第２照合部２１７Ｂによっても
照合動作が終了しているので、照合結果格納部２１９に
は、「高使用頻度の単語」のみならず、「低使用頻度の
単語」についてもその「照合結果Ｊが照合結果格納部２
１９に格納されている。

従って、次候補要求キーが操作されれば、「高使用頻度
の単語」に対する第１位の「照合結果」を除外し、その
他の「高使用頻度の単語」および「低使用頻度の単語」
の中から、距離の小さい単語を判定部２１８は検索して
格納単語情報信号２２２として得て、選択結果信号２２
４として制御部２２３に供給する。つまり、第２位の「
認識結果、が、第１位の「照合結果」を除いて求められ
る。

但し、第２位の「認識結果」が、特定話者の意図した現
発声単語でなければ、再度次候補要求キーを操作するこ
とにより、第３位の「照合結果」を照合結果格納部２１
９から取り出して、「認識結果」が利用装置に出力され
る。

以下、同様にして、第４位、第５位、・・・・・・と、
キーボード２４１の次候補要求キーを操作することによ
って、任意に、照合結果格納部２１９に格納されている
「照合結果ｊを取り出して利用装置に出力することがで
きる。

このようにして、現に発声した特定話者の単語は、第１
パターン登録部２１１Ａに登録されていた「高使用頻度
の単語」に対して正しい「認識結果」が得られる確立が
高く且つその速度も速くなる。

つまり、現に発声した特定話者の単語音声は、第１パタ
ーン登録部２１１Ａに登録されている「高使用頻度の単
語」に対する照合結果、および、第２パターン登録部２
１１Ｂに登録されている「低使用頻度の単語」に対する
照合結果が共に、「認識結果１として出力可能である。

従って、第１パターン登録部２１１Ａに登録されている
「高使用頻度の単語」は１０００語と少なく、その全単
語の照合に要する時間は少ないので、この単語音声認識
装置での特定話者に対する単語音声認識は素早くできる
こととなる。

（ｉｉ）゛許：″“バ　−ンの一言５習いま、予め第１
パターン登録部２１１Ａに登録されている「高使用頻度
の単語」中に、現に発声された単語が「認識結果Ｊとし
て出力されれば、「登録順序判別信号」として、制御部
２２３はその結果をパターン置換処理部２２７に通知す
る。

この登録順序判別信号に従って、パターン置換処理部２
２７は、現「認識結果」が予め第１パターン登録部２１
１Ａに登録されている「高使用頻度の単語」に該当して
いたことを知る。パターン置換処理部２２７は、第１パ
ターン登録部２１１Ａに対して、現「認識結果」に該当
する登録単語を第１順位とするように、その登録されて
いる「高使用頻度の単語」の登録順序を変更すべきもの
として指示する。

このようにして、認識結果を得る度に、現「認識結果」
に該当する登録単語を第１順位とするように登録順序を
変更する。従って、次回の発音による認識結果を得る際
には、前回変更された登録順序に基づいて行なわれるの
で、単語の照合に要する時間が少なくなるので、この単
語音声認識装置での特定話者に対する単語音声認識は素
早くできることとなる。

また、現に発声した単語が「認識結果ｊとして出力され
たものは、第２パターン登録部２１１Ｂに予め登録され
ていた単語であったものとする。

その場合にあっても、制御部２２３はその結果を登録順
序判別信号としてパターン置換処理部２２７に通知する
。パターン置換処理部２２７は登録順序判別信号に従っ
て、現「認識結果」が予め第２パターン登録部２１１Ｂ
に登録されている「低使用頻度の単語」に該当していた
ことを知る。

パターン置換処理部２２７は、第２パターン登録部２１
１Ｂから、現「認識結果」に該当する登録単語を取り出
し、第１パターン登録部２１１Ａの第１順位となるよう
にそれを登録する。第１パターン登録部２１１Ａにそれ
まで登録されていた単語の順序を１つずつ繰り下げる。

つまり、「高使用頻度の単語」の登録順序を変更する。

但し、第１パターン登録部２１１Ａには新たに登録単語
が増えるので、該第１パターン登録部２１１Ａの格納容
量を上回るか否かを絶えず判定する必要がある。

仮に、第１パターン登録部２１１Ａへの格納に余裕があ
れば、そのまま第１順位に登録して、順序を変更すれば
よい。しかし、第１パターン登録部２１１Ａへの格納に
余裕がなければ、最後位順序の登録単語を第２パターン
登録部２１１Ｂに移行し、上述したようにして、第１パ
ターン登録部２１１Ａにおいて新たな順序で単語登録を
行なう。

その場合、第１パターン登録部２１１Ａから第２パター
ン登録部２１１Ｂに移行した登録単語は、第２パターン
登録部２１１Ｂにおいて第１順位として登録し、他の単
語は１つずつ繰り下げる。つまり、「高使用頻度の単語
」と共に、「低使用頻度の単語」にあってもその登録順
序が変更されることとなる。このような順序の変更は、
一度入力された単語が、短期間のうちに再び入力される
可能性が高い場合には非常に有効である。

■、　　　　の　とめこのように、予め利用頻度の相違に着目し、予め登録す
べき単語をグループ分けして、第１パターン登録部２１
１Ａおよび第２パターン登録部２１１Ｂの２つに登録し
ている。認識の対象となる区間検出出力信号２１３を照
合する際、それが使用頻度の高いものであれば、直ぐに
第１パターン登録部２１１Ａの登録単語との照合結果が
得られる。

つまり、はぼ第１パターン登録部２１１Ａに登録されて
いる単語との照合に要する時間だけで、「認識結果」が
得られるので、応答速度が速く且つ実効認識率が極めて
高くなる。当初、「低使用頻度の単語」として第２パタ
ーン登録部２１１Ｂに登録されているものであっても、
「変更ｊ後にあっては、その単語に関しては「高使用頻
度の単語」に該当することとなり、それ以降の照合動作
に要する時間は極めて短縮される。

ここで、従来との比較を示してお（。この単語音声認識
装置にあっても、その個々の認識性能は同じと仮定する
。つまり、使用頻度の高い１０００語および１００００
語の全てについてのそれぞれの「認識率」は９０パーセ
ントおよび７０パーセントであり、また、１誘光たりの
「照合時間」は、０．５　ｗａｓであるものとする。

この単語音声認識装置における実効認識率は、８１パー
セント（０，９Ｘｏ、９　＝０．８１）である。また、
応答時間は０．５秒（０，５３Ｘ１００Ｏ語）となる。

但し、この時間は第１照合部２１７Ａによって、第１パ
ターン登録部２１１Ａの登録単語との照合に要する処理
時間であり、キーボード２４１における次候補要求キー
を使用しなかった場合である。

このように、実効認識率の向上が図られ且つ単語情報の
照合に要する時間が短縮されることが理解できるであろ
う。特に、入力項目が多くなればなる程この効果は顕著
である。

■、１１１　　の　　・　ノ　ヒ　、なお、上述した本発明の実施例にあっては、第１照合部
２１７Ａおよび第２照合部２１７Ｂの２つを単語照合手
段として設けたが、これを１つの照合部としてもよい。

その場合、制御部２２３の制御によって第１パターン登
録部２１１Ａおよび第２パターン登録部２１１Ｂをそれ
ぞれ切り換えて、時間的にずれた形で、先ず第１パター
ン登録部２１１Ａに登録されている使用頻度の高い各認
識対象単語と照合する。続いて、第２パターン登録部２
１１Ｂに登録されている使用頻度の低い各認識対象単語
と照合するようにすればよい。「高使用頻度の単語」の
「照合結果」が得られ、次候補要求キーを操作している
間には、「低使用頻度の単語」の「照合結果」が得られ
ているので、何ら不都合はない。

また、上述実施例にあっては、１回の次候補要求キーの
操作までに、「低使用頻度の単語」についての照合が完
了しているものとしたが、必ずしも完了していなくても
よい。第２照合部２１７Ｂによる照合結果を順次光は入
れ、再度の次候補要求キー操作までに照合が終了してい
る範囲内の照合結果に基づいて、距離の小さいものを順
次「認識結果」とするようにすればよい。そのような例
は、「低使用頻度の単語」として定義した単語が極めて
多い場合に起こり得る。

上述した本発明実施例にあっては、第１パターン登録部
２１１Ａおよび第２パターン登録部２１１Ｂに予め登録
する各認識対象単語のグループ分けは、その使用頻度に
基づいて行なうものとじたが、これに限られることはな
い。単語音声認識装置の利用の実情に合わせて、登録単
語のグループ化は行なえばよい。このグループも３つ以
上としてもよく、３つ以上のパターン登録部を設けて登
録し、その全てについて照合するようにしてもよい。

このグループ分けの基準として、「使用頻度」の他にも
各種の基準が考えられる。例えば、「重要度」に基づき
、音声認識装置の使用態様に応じてグループ分けしても
よい。

但し、例えば「緊急停止ｊ等のような重要度の高い単語
はその使用頻度は低いが、「最重要度の単語」にグルー
プ化しておく必要がある。

上述した本発明の実施例にあっては、「認識結果」を求
めた後、パターン置換処理部２２７によって、第１照合
部２１７Ａ内での登録単語の順序換え、また、第２照合
部２１７Ｂの登録単語と第１照合部２１７Ａとの登録単
語との交換を行なうようにしていた。しかし、第１照合
部２１７Ａ内での登録単語の順序換えは必ずしも必要な
ものではない。また、第２照合部２１７Ｂの登録単語と
第１照合部２１７Ａとの登録単語との交換を行なうとき
でも、当該第２照合部２１７Ｂからの登録単語を第１照
合部２１７Ａに単語登録すべき順序は、第１照合部２１
７Ａ内で最後位順序としてもよく、必要に応じてその置
換順序を決定すればよい。

上述した実施例では距離計算手法を採用したが、本発明
はこれに限られるものではなく、類似度の大きいものを
求める類似度計算手法の採用が可能であることは明らか
である。

更に、「１．実施例と第１図との対応関係ｊにおいて、
第１図と本発明との対応関係を説明しておいたが、これ
に限られることはな（、各種の変形態様があることは当
業者であれば容易に推考できるであろう。

〔発明の効果〕

上述したように、本発明によれば、所定の分類基準に従
って複数に分けられた単語音声の特徴を表す登録パラメ
ータのそれぞれと、入力単語音声についての入力パラメ
ータとを照合し、両パラメータ間で最小距離もしくは最
大類似度となる単語音声にについての登録パラメータを
求めて当該単語音声での認識結果として得るようにする
ことにより、単語の分類基準に沿った関係上にある単語
音声の照合に要する時間が短縮され、且つ、その分類基
準に沿って単語音声の登録パラメータ群を分けることを
可能として、次回以降の認識結果を得るための照合に要
する時間が少なくなるので、実用的には極めて有用であ
る。

【図面の簡単な説明】

第１図は本発明の単語音声認識装置の原理ブロック図、第２図は本発明の一実施例による単語音声認識装置の構
成ブロック図、第３図は従来から行なわれている音声認識の処理を示す
構成図である。図において、１１１Ａ、Ｂ、Ｃ，・・・・・・は単語登録手段、１１
３は入力パラメータ、１１５Ａ、Ｂ、Ｃ，・・・・・・は照合結果、１１７は
照合手段、１１９は格納手段、１２１は次候補要求信号、１２３は選択制御手段、１２５は登録順序判別信号、１２７は登録順序制御手段、２１１Ａ、Ｂはパターン登録部、２１３は区間検出出力信号、２１４Ａ、Ｂは照合出力信号、２１５は照合結果出力信号、２１７Ａ、Ｂは照合部、２１８は判定部、２１９は照合結果格納部、２２２は格納単語情報信号、２２３は制御部、２２４は選択結果信号、２２７はパターン置換処理部、２３１はマイクロホン、２３３はパラメータ抽出部、２３５は区間検出部、２４１はキーボード、４５３は分析部、４５７は標準パターン部、４５９は距離計算部、４６１は最小値検出部である。第１図一一　　　　゛シ

Claims

【特許請求の範囲】

（１）所定の分類基準に従って複数に分けられた単語音
声の各パターンについてその特徴を表すパラメータが登
録されている複数の単語登録手段（１１１Ａ、Ｂ、Ｃ、
・・・・・・）と、入力単語音声のパターンについてその特徴を表す入力パ
ラメータ（１１３）を得、複数の単語登録手段（１１１
Ａ、Ｂ、Ｃ、・・・・・・）のそれぞれが有する前記登
録パラメータと照合し、距離もしくは類似度を求めて照
合結果（１１５Ａ、Ｂ、Ｃ、・・・・・・）として順次
出力する照合手段（１１７）と、照合結果（１１５Ａ、
Ｂ、Ｃ、・・・・・・）の情報を格納する格納手段（１
１９）と、最初は照合結果（１１５Ａ、Ｂ、Ｃ、・・・・・・）の
中から一番距離の小さい単語もしくは一番類似度の大き
い単語を選び第１位の認識結果とし、次候補要求信号（
１２１）があった場合には、格納手段（１１９）に格納
されている照合結果の情報から、既に認識結果として出
力済みの単語を除いた中で距離の一番小さいもしくは類
似度最大の単語を選択し、認識結果として出力すると共
に、該出力された前記認識結果に応じて登録順序判別信
号（１２５）を発生する選択制御手段（１２３）と、登
録順序判別信号（１２５）に応じて、複数の単語登録手
段（１１１Ａ、Ｂ、Ｃ、・・・・・・）が有する各登録
パラメータについて、必要に応じて順序換えを行なう登
録順序制御手段（１２７）と、を具えるように構成した
ことを特徴とする単語音声認識装置。
（２）照合手段（１１７）は、複数の単語登録手段（１
１１Ａ、Ｂ、Ｃ、・・・・・・）に対応した複数の照合
回路部から成っており、該複数の照合回路部は入力パラ
メータ（１１３）を共通的に受け、各照合回路部は、複
数の単語登録手段（１１１Ａ、Ｂ、Ｃ、・・・・・・）
のうち対応する単語登録手段が有する単語の前記登録パ
ラメータと照合して、前記照合結果を出力するように構
成したことを特徴とする特許請求の範囲第１項記載の単
語音声認識装置。
（３）照合手段（１１７）は、１つの照合回路部で成り
、複数の単語登録手段（１１１Ａ、Ｂ、Ｃ、・・・・・
・）を所定の順序で切り換えて、各単語登録手段が有す
る前記登録パラメータと照合して、照合結果（１１５Ａ
、Ｂ、Ｃ、・・・・・・）を順次出力するように構成し
たことを特徴とする特許請求の範囲第１項記載の単語音
声認識装置。
（４）前記単語音声のパラメータを、複数の単語登録手
段（１１１Ａ、Ｂ、Ｃ、・・・・・・）のいずれに登録
すべきかを決める前記所定の分類基準は、前記入力単語
音声として現れる単語の頻度であることを特徴とする特
許請求の範囲第１項記載の単語音声認識装置。
（５）前記単語音声のパラメータを、複数の単語登録手
段（１１１Ａ、Ｂ、Ｃ、・・・・・・）のいずれに登録
すべきかを決める前記所定の分類基準は、前記入力単語
音声として現れる単語の重要度であることを特徴とする
特許請求の範囲第１項記載の単語音声認識装置。
（６）前記登録順序判別信号（１２５）に応じて、登録
順序制御手段（１２７）が必要に応じて行なう順序換え
は、複数の単語登録手段（１１１Ａ、Ｂ、Ｃ、・・・・
・・）の相互間において、それぞれが有する前記単語音
声の登録パラメータの交換であることを特徴とする特許
請求の範囲第１項記載の単語音声認識装置。
（７）前記登録順序判別信号（１２５）に応じて、登録
順序制御手段（１２７）が必要に応じて行なう順序換え
は、複数の単語登録手段（１１１Ａ、Ｂ、Ｃ、・・・・
・・）のうち、最も頻度の高い単語音声の登録パラメー
タを有する単語登録手段において、その各単語音声の登
録パラメータの順序を変更するようにしたことを特徴と
する特許請求の範囲第１項記載の単語音声認識装置。