JPH09171395A

JPH09171395A - 音声認識装置

Info

Publication number: JPH09171395A
Application number: JP7331669A
Authority: JP
Inventors: Tadahiro Hoshino; 恭祐星野
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1995-12-20
Filing date: 1995-12-20
Publication date: 1997-06-30

Abstract

(57)【要約】【課題】アプリケーション間の切り換えを円滑に行う
ことができる音声認識装置を提供する。【解決手段】制御部１のＣＰＵ２はこれから実行する
アプリケーションに対応する識別情報を発生し、セレク
トコントロール部１５のレジスタに書き込む。セレクト
コントロール部１５はセレクト信号を出力する。このセ
レクト信号により、標準パターンメモリ７ａ〜７ｄ及び
認識結果変換テーブルメモリ８ａ〜８ｄの中から、これ
から実行するアプリケーションに対応するものを選択す
る。音声認識ＬＳＩ４は選択された標準パターンメモリ
中の標準パターンを用いて音声認識を行って認識結果を
出力し、ＣＰＵ２は、認識結果変換テーブルメモリから
認識結果に対応するコマンド等を読み出して実行する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、パーソナルコンピ
ュータ、各種システム等において音声を入力するために
用いられる音声認識装置に関する。

【０００２】

【従来の技術】従来より、入力された音声の特徴を分析
して認識する音声認識装置を用いて指示、データ等を入
力する装置が知られている。このような装置ではそれぞ
れの認識方法、認識できる語数、認識対象話者（特定又
は不特定）等の違いから、音声認識精度、装置の規模等
が異なっている。

【０００３】このような音声認識装置では、入力した音
声データの特徴量を抽出し、抽出した特徴量を音声認識
辞書中の音声パターンと比較して類似度を求め、この類
似度に基づいて認識結果を決定するようになっている。
この類似度の算出には、例えば動的計画法によりパター
ンマッチングであるＤＰ（Dynamic Programing：動的計
画法）マッチング法、ＨＭＭ法、ニューラルネットワー
ク法等が一般に用いられている。このような音声認識装
置は、計算機上のプログラムあるいは専用のハードウェ
アとして実現されていたが、近年では主要な機能をＬＳ
Ｉとして実現されるようになっており、装置の小型化、
軽量化が進んでいる。

【０００４】図２はこのような音声認識装置の構成を示
す図である。同図中において１は装置全体の制御を行う
制御部であり、ＣＰＵ２とメモリ３とを備えている。メ
モリ３はＣＰＵ２が実行する制御プログラム等を格納す
るＲＯＭと、データ等を記憶するための作業用のＲＡＭ
とからなる。また、４は音声認識ＬＳＩであり、マイク
１０を介して入力された音声信号の特徴量の抽出等を行
う音声分析部５と、予め標準パターンメモリ部７に保持
された標準パターンと比較して認識結果を決定する音声
認識部６とからなる。さらに、この音声認識装置は、音
声認識部６により得られた認識結果に対応するコマンド
等が記憶される認識結果変換テーブルメモリ８と、認識
結果等を表示する表示部９と、バス１１とを備えてい
る。このバス１１を介して制御部１、音声認識ＬＳＩ
４、認識結果変換テーブルメモリ８、表示部９が相互に
接続されている。

【０００５】このような構成の音声認識装置では、音声
分析、類似度の計算等の処理タイミングは、制御部１に
よって制御されるようになっており、音声認識を行う際
には、制御部１が音声認識ＬＳＩ４に音声認識の開始を
指示する。

【０００６】音声認識の開始が指示されると、音声分析
部５はマイク１０を介して入力された音声信号に帯域制
限等の前処理を施してアナログ／デジタル変換し、得ら
れた音声データに、公知のＬＰＣ（Linear Prediction
coefficients：線形予測係数）分析等を施して、ＬＰＣ
ケプストラム（Cepstrum）等の特徴量を抽出して音声認
識部６に供給する。

【０００７】このように特徴量が供給されると、音声認
識部６は上述のＤＰマッチング法、ＨＭＭ法、ニューラ
ルネットワーク法等により、音声分析部５から供給され
た特徴量と標準パターンメモリ部に記憶されている標準
パターンを比較して類似度を求め、この類似度に基づい
て認識結果を決定する。この認識結果はバス１１を介し
てＣＰＵ２に供給される。ＣＰＵ２は認識結果に基づい
て変換テーブルメモリ８を参照し、認識結果に対応する
コマンド等があれば、このコマンドに従って装置全体の
動作を制御する。このようなコマンドに応じて、ＣＰＵ
２は、例えば認識結果を表示部９に供給し、表示部９は
供給された認識結果を表示画面上に表示する。このよう
に表示部９の表示画面に表示された認識結果を見ること
により、ユーザは認識結果を確認することができる。例
えば音声入力した単語と認識結果が異なる場合、ユーザ
は、表示部９の表示画面に表示された認識結果を見るこ
とによって、音声認識が誤っていることを確認すること
ができ、必要なら再度音声入力を行うことができる。

【０００８】上述の標準パターンメモリ７に記憶されて
いる標準パターンを作成して登録する際には、予め音声
認識対象の単語を２〜３回程度発音し、その発音の各回
毎に音声認識ＬＳＩ４において、得られた音声データの
特徴量を抽出し、抽出した特徴量を標準パターンとして
標準パターンメモリ７に格納する。通常、音声入力から
標準パターンの作成、登録までの一連の動作は、連続し
た１つの動作として処理されるため、ユーザは、１つの
単語を音声入力すると、標準パターンが生成、登録され
るのを待って、次の単語の音声入力を行うようになって
いる。このように入力した単語にコマンド等を対応させ
るためには、図示しない入力手段によりコマンド等を入
力し、標準パターンとコマンド等を対応させて認識結果
変換テーブルメモリ８に記憶しておくようになってい
る。

【０００９】上述のような音声入力装置が複数のアプリ
ケーションに対応している場合、標準パターンメモリ７
あるいは認識結果変換テーブルメモリ８の容量が不足
し、各々のアプリケーションで用いる単語の標準パター
ン、コマンド等を全て登録することができなくなる場合
がある。

【００１０】このような場合には、各々のアプリケーシ
ョンにおいて用いられる単語の標準パターン、コマンド
等を全てメモリ３に記憶しておき、各々のアプリケーシ
ョンを実行する際に、各々のアプリケーションで使用す
る単語の標準パターン、コマンド等をメモリ３から読み
出して標準パターンメモリ７あるいは認識結果変換テー
ブルメモリ８に記憶するようになっている。

【００１１】

【発明が解決しようとする課題】従来の音声認識装置
は、上述のように構成されているため、アプリケーショ
ンの切り換えを行う際に、新たなアプリケーションに対
応する標準パターン及びコマンドをメモリ３から読み出
して標準パターンメモリ７、認識結果変換テーブルメモ
リ８の書き換えを行う必要があり、この書き換え時間に
よりアプリケーションの切り換えがスムーズに行われな
いことがある。この問題は、アプリケーションの切り換
え時に書き換える標準パターン、コマンド等が多い場
合、あるいはアプリケーションを頻繁に切り換える場合
等に特に顕著となる。

【００１２】また、この音声認識装置では、制御部１の
メモリ３に全ての単語の標準パターン、コマンド等を記
憶しておく構成としたため、これらの標準パターン、コ
マンド等の追加、変更等を行う際にメモリ管理等の処理
が煩雑となる問題がある。

【００１３】本発明は、上述のような問題点に鑑みてな
されたものであり、複数のアプリケーションをスムーズ
に切り換えることができ、メモリ管理が容易な音声認識
装置を提供することを目的とする。

【００１４】

【課題を解決するための手段】本発明に係る音声認識装
置は、複数のアプリケーション毎に別個に設けられ、各
々標準パターンを記憶する複数の標準パターンメモリ
と、実行中のアプリケーションを検出し、複数の標準パ
ターンメモリの中から、実行中のアプリケーションに対
応する標準パターンメモリを選択する選択手段と、選択
手段により選択された標準パターンメモリに記憶された
標準パターンと外部から入力される音声信号から抽出し
た特徴量と比較して認識結果を決定する音声認識処理手
段とを備える。

【００１５】また、さらに、各アプリケーションを実行
する際にアプリケーション内で指定され、実行中のアプ
リケーションを示す第１のアドレスと音声認識処理手段
が指定されているか否かを示す第２のアドレスとからな
る入出力アドレスを出力する制御手段を備える構成とし
てもよい。この場合は、選択手段が、制御手段からの第
１のアドレスをデコードして実行中のアプリケーション
に対応する標準パターンメモリを選択するデコード手段
を備える構成とする。

【００１６】また、本発明に係る音声認識装置は、複数
のアプリケーション毎に別個に設けられ、各アプリケー
ションで用いる標準パターンを記憶する複数の記憶領域
を有する物理的に単一の標準パターンメモリと、標準パ
ターンメモリ内の複数の記憶領域の中から、実行中のア
プリケーションに対応するものを選択する選択手段と、
選択手段により選択された標準パターンメモリに記憶さ
れた標準パターンと外部から入力される音声信号から抽
出した特徴量と比較して認識結果を決定する音声認識処
理手段とを備える。また、この音声認識装置は、各アプ
リケーションを実行する際に実行中のアプリケーション
内で指定され、実行中のアプリケーションを示す第１の
アドレスと、音声認識処理手段が指定されているか否か
を示す第２のアドレスとからなる入出力アドレスを出力
する制御手段とを備え、選択手段が、制御手段からの第
１のアドレスをデコードして実行中のアプリケーション
に対応する記憶領域を選択するデコード手段を備える。

【００１７】

【発明の実施の形態】図１は本発明の第１の実施形態に
係る音声認識装置の構成を示すブロック図である。な
お、この図１中では上述の従来の技術の説明で用いた図
２と同一又は対応する構成要素は同一の符号で示してい
る。同図中において、７ａ、７ｂ、７ｃ、７ｄは各々標
準パターンを記憶するための標準パターン記憶メモリで
あり、８ａ、８ｂ、８ｃ、８ｄは認識結果に応じたコマ
ンド等を記憶するための認識結果変換テーブルメモリで
あり、１５は実行するアプリケーションに応じて標準パ
ターン７ａ〜７ｄと認識結果変換テーブルメモリ８ａ〜
８ｄの選択を行うセレクトコントロール部である。ま
た、この音声認識装置は、ＣＰＵ２とメモリ３を備える
制御部１と、上述の図２と同様に音声分析部と音声認識
部とを備える音声認識ＬＳＩ４と、液晶パネル、発光ダ
イオードアレイ等の表示手段からなる表示部９と、マイ
ク１０と、バス１１等を有する。このような構成の音声
認識装置は、音声認識ＬＳＩ４を用いているため小型軽
量とすることができる。また、制御部１に外部の情報処
理装置等から制御コマンド等を入力する指示入力手段を
設けることにより、指示入力手段を介してＣＰＵ２に指
示を入力するだけで音声認識の開始指示、認識結果の読
み出し等を制御することができるため、パーソナルコン
ピュータ、電話回線を利用した各種システム、例えばオ
ーダエントリーシステム、緊急呼び出しシステム、予約
システム等において音声を入力する音声入力手段として
用いることが容易である。

【００１８】また、この音声認識装置では、複数のアプ
リケーションを切り換えて、認識可能な単語、音節等の
切り換え、あるいは認識結果に対するコマンド等の切り
換えを行うことができるようになっており、各々のアプ
リケーションが別個の標準パターンメモリ、認識結果変
換テーブルメモリを使用するようになっている。なお、
図１は第１から第４までの４つのアプリケーションの実
行が可能な構成を示している。この音声認識装置では、
各々のアプリケーションに対応して各々物理的に別個の
標準パターンメモリ、認識結果変換テーブルメモリを設
けており、第１のアプリケーションの実行時には、標準
パターンメモリ７ａ及び認識結果変換テーブルメモリ８
ａを使用し、第２〜第４のアプリケーションの実行時に
は、各々標準パターンメモリ７ｂ〜７ｄと認識結果変換
テーブルメモリ８ｂ〜８ｄを使用するようになってい
る。

【００１９】セレクトコントロール部１５は、ＣＰＵ２
から書き込み又は読み出しが可能なレジスタを備えてい
る。このレジスタは現在、実行しているアプリケーショ
ンに対応する識別情報を記憶するためのものであり、Ｃ
ＰＵ２がアプリケーションを切り換えるときに、その内
容が変更される。

【００２０】また、セレクトコントロール部１５は、レ
ジスタに記憶されている識別情報に基づいて標準パター
ンメモリ、認識結果変換テーブルモリの数に等しい数す
なわち図１に示す場合では４つのセレクト信号を発生す
る。これらのセレクト信号は、それぞれ標準パターンメ
モリ７ａ〜７ｄ、認識結果変換テーブルメモリ８ａ〜８
ｄに供給されている。

【００２１】このセレクト信号により、標準パターンメ
モリ７ａ〜７ｄ、認識結果変換テーブルメモリ８ａ〜８
ｄの内から、実行されているあるいは実行しようとする
アプリケーションに対応するものが選択されるようにな
っている。

【００２２】この音声認識装置では、ＣＰＵ２はアプリ
ケーションを実行する際に、セレクトコントロール部１
５のレジスタを参照し、現在選択されているアプリケー
ションを検出する。検出したアプリケーションがこれか
ら実行しようとするアプリケーションと異なる場合は、
これから実行しようとするアプリケーションに対応する
識別情報を発生してセレクトコントロール部１５のレジ
スタに書き込む。例えば第１のアプリケーションが選択
されており、標準パターンメモリ７ａ、認識結果変換テ
ーブルメモリ８ａが選択された状態で、第４のアプリケ
ーションの実行が指示されると、ＣＰＵ２は、第４のア
プリケーションに対応する識別情報をセレクトコントロ
ール部１５のレジスタに書き込む。

【００２３】レジスタの内容が変更されると、セレクト
コントロール部１５は新たに選択された第４のアプリケ
ーションに対応するセレクト信号を出力する。このセレ
クト信号により、標準パターンメモリ７ａ、認識結果変
換テーブルメモリ８ａに代えて、新たに標準パターンメ
モリ７ｄ、認識結果変換テーブルメモリ８ｄが選択され
る。

【００２４】ＣＰＵ２が第４のアプリケーションの実行
を開始すると、音声認識ＬＳＩ４は選択された標準パタ
ーンメモリ７ｄ中の標準パターンを用いて音声認識を行
い。ＣＰＵ２は、認識結果に対応するコマンド等を認識
結果変換テーブルメモリ８ｄから読み出し、読み出した
コマンド等に応じて装置の制御等を行う。

【００２５】この音声認識装置は、上述のように個々の
アプリケーションに対して別個に標準パターンメモリ及
び認識結果変換テーブルメモリを設け、アプリケーショ
ンの切り換え時に、新たなアプリケーションに対応する
標準パターンメモリ及び認識結果変換テーブルメモリを
選択する構成としたため、全てのアプリケーションの標
準パターン及びコマンド等を同一のメモリに記憶してお
く場合に比してメモリ管理を容易に行うことができ、ま
た、アプリケーションの切り換え時に標準パターンメモ
リ及び認識結果変換テーブルメモリの内容を書き換える
必要がないためアプリケーションの切り換えをスムーズ
に行うことができる。

【００２６】また、標準パターンメモリ及び認識結果変
換テーブルメモリを増設することにより、容易に実行可
能なアプリケーションの数を増加させることができ、ま
た、標準パターンメモリ及び認識結果変換テーブルを各
々１つとした場合に比して、アプリケーション当たりの
標準パターン、コマンド等を記憶する領域を広くするこ
とができるため、各アプリケーションにおいて認識可能
な単語、音節等を増加させることができる。従って、ア
プリケーション作成の自由度を向上させることができ
る。

【００２７】図３は発明の第２の実施形態に係る音声認
識装置の構成を示すブロック図である。なお、この図３
中では上述の図１と同一又は対応する構成要素は同一の
符号で示している。

【００２８】この音声認識装置は、上述の図１に示す音
声認識装置と同様に４つのアプリケーション毎に標準パ
ターンメモリ７ａ〜７ｄと認識結果変換テーブルメモリ
８ａ〜８ｄを設けている。上述の図１に示す音声認識装
置ではＣＰＵ２がセレクトコントロール部１５に実行す
るアプリケーションに対応する認識情報を書き込む構成
としていたが、この図３に示す音声認識装置はセレクト
コントロール回路１５の代わりに、ＣＰＵ２から供給さ
れるＩＯアドレスに基づいてデコード出力を出力するＩ
Ｏアドレスデコーダ２０を備えている。

【００２９】ＣＰＵ２からＩＯアドレスデコーダ２０に
供給されるＩＯアドレスは、例えばＡ１５（最上位ビッ
ト）、Ａ１４・・・Ａ１、Ａ０（最下位ビット）の１６
ビットであり、このＩＯアドレスデコーダ２０は、図４
にその詳細を示すように１６ビットのＩＯアドレスの上
位２ビット（Ａ１５、Ａ１４）をデコードして標準パタ
ーンメモリ７ａ〜７ｄと認識結果変換テーブルメモリ８
ａ〜８ｄの切り換えを行うデコーダ２１（デコード手
段）と、ＩＯアドレスの下位３ビット（Ａ２、Ａ１、Ａ
０）をデコードしてチップセレクト信号を形成するデコ
ーダ２２とを備えている。なお、ＩＯアドレスは、１６
ビットでなくともよく、この場合は、デコーダ２１、２
２ががデコードするビットを適宜変更する。

【００３０】デコーダ２１は、ＩＯアドレスの上位２ビ
ットが００、０１、１０、１１のときにそれぞれ選択さ
れる４つのデコード出力Ｄ０、Ｄ１、Ｄ２、Ｄ３を有し
ている。デコード出力Ｄ０は標準パターンメモリ７ａ及
び認識結果変換テーブルメモリ８ａに接続されており、
デコード出力Ｄ１は標準パターンメモリ７ｂ及び認識結
果変換テーブルメモリ８ｂに接続されており、デコード
出力Ｄ２は標準パターンメモリ７ｃ及び認識結果変換テ
ーブルメモリ８ｃに接続されており、デコード出力Ｄ３
は標準パターンメモリ７ｄ及び認識結果変換テーブルメ
モリ８ｄに接続されている。

【００３１】従って、ＩＯアドレスの上位２ビットが０
０のときは、標準パターンメモリ７ａ及び認識結果変換
テーブルメモリ８ａが選択され、ＩＯアドレスの上位２
ビットが０１、１０、１１のときは、それぞれ標準パタ
ーンメモリ７ｂ及び認識結果変換テーブルメモリ８ｂ、
標準パターンメモリ７ｃ及び認識結果変換テーブルメモ
リ８ｃ、標準パターンメモリ７ｄ及び認識結果変換テー
ブルメモリ８ｄが選択される。

【００３２】デコーダ２２の出力Ｄ０は図３に示す音声
認識ＬＳＩ４にチップセレクト信号として供給されてい
る。なお、この図４では説明の簡略化のために、デコー
ダ２２がＩＯアドレスの下位３ビットのみをデコードす
る場合について説明しているが、このままではＩＯアド
レスの下位３ビットが０００である場合（００００Ｈ、
０００８Ｈ、００１０Ｈ、００１８Ｈ・・・ＦＦＦ０
Ｈ、ＦＦＦ８Ｈ）において音声認識ＬＳＩ４が選択され
てしまい、音声認識ＬＳＩ４だけでＩＯアドレス空間の
８分の１を占めてしまうことになる。このため、他に多
くの機器等をＩＯアドレス空間上にマッピングするため
には、さらに多くのＩＯアドレスの下位ビット（例えば
下位１４ビットＡ１３〜Ａ０あるいは下位１２ビットＡ
１１〜Ａ０程度）をデコードすることが望ましい。

【００３３】上述のように、ＩＯアドレスの上位２ビッ
トを音声認識ＬＳＩ４のチップセレクト信号を形成する
デコーダ２２で使用しない場合、ＩＯアドレスの下位の
アドレスが音声認識ＬＳＩ４の下位のアドレスに合致し
ていれば、上位２ビットに無関係にチップセレクト信号
が形成されて音声認識ＬＳＩ４が選択されることにな
る。従って、例えばデコーダ２２がＩＯアドレスの下位
１４ビットをデコードする場合では、ＣＰＵ２からは図
５に示すようにＩＯアドレス空間上のＩＯアドレスが０
０００Ｈ、４０００Ｈ、８０００Ｈ、Ｃ０００Ｈの４箇
所に音声認識用ＬＳＩ４が存在するように見える。

【００３４】上述のように構成された音声認識装置で実
行される各アプリケーション中の音声認識ＬＳＩ４に対
する入出力命令では、指定されるＩＯアドレスの上位２
ビットがアプリケーションを識別するための識別ビット
として設定されている。すなわち、第１のアプリケーシ
ョン中の入出力命令ではＩＯアドレスの上位２ビットが
００とされており、第２、第３及び第４のアプリケーシ
ョン中の入出力命令中では、各々ＩＯアドレスの上位２
ビットが０１、１０、１１とされている。音声認識ＬＳ
Ｉ４のＩＯアドレスの残りのビットＡ１３〜Ａ０は全て
０であるから、第１、第２、第３及び第４のアプリケー
ション中の入出力命令では音声認識ＬＳＩ４のＩＯアド
レスがそれぞれ００００Ｈ、４０００Ｈ、８０００Ｈ、
Ｃ０００Ｈとされている。このようなＩＯアドレスは、
これらのアプリケーションのプログラムを作成する際に
設定される。

【００３５】上述のようにＩＯアドレスが設定されてい
ると、第１、第２、第３及び第４のアプリケーション中
の入出力命令を実行するときに、デコーダ２１によって
それぞれ標準パターンメモリ７ａ及び認識結果変換テー
ブルメモリ８ａ、標準パターンメモリ７ｂ及び認識結果
変換テーブルメモリ８ｂ、標準パターンメモリ７ｃ及び
認識結果変換テーブルメモリ８ｃ、標準パターンメモリ
７ｄ及び認識結果変換テーブルメモリ８ｄが選択され
る。従って、各々のアプリケーションを実行する際に、
各々のアプリケーションに対応した標準パターン、コマ
ンド等が記憶された標準パターンメモリ及び認識結果変
換テーブルが選択される。

【００３６】この音声認識装置では、上述のように各ア
プリケーション中の音声認識ＬＳＩ４に対する入出力命
令中のＩＯアドレスの上位２ビットがアプリケーション
毎に異なる値に設定されているため、この上位２ビット
をデコードするデコーダ２１によって各アプリケーショ
ンに対応する標準パターンメモリ及び認識結果変換テー
ブルが選択される。このため、アプリケーションの切り
換え時に、制御部が単に新たなアプリケーションの実行
を開始するだけで、他に別個の処理を必要とせずに標準
パターンメモリ及び認識結果変換テーブルの選択を行う
ことができる。従って、アプリケーションの切り換え時
に標準パターン等の書き換えを必要としないため、ＣＰ
Ｕ２の負荷を低減させてアプリケーションの切り換えを
スムーズに行うことができる。

【００３７】なお、上述の説明では、デコーダ２１がＩ
Ｏアドレスの上位２ビットをデコードして各々４つの標
準パターンメモリ及び認識結果変換テーブルの中から各
々１つを選択する構成としたが、例えば標準パターンメ
モリ及び認識結果変換テーブルを各々８つ設け、デコー
ダ２１がＩＯアドレスの上位３ビット（Ａ１５、Ａ１
４、Ａ１３）をデコードして標準パターンメモリ及び認
識結果変換テーブルメモリを選択する構成とする等、ア
プリケーションの数に対応させて適宜構成を変更するこ
ともできる。

【００３８】図６は本発明の第３の実施形態に係る音声
認識装置の構成を示すブロック図である。この図６中で
は、上述の図１、図３と同一又は対応する構成要素は同
一の符号で示されている。

【００３９】上述の図１、図３に示す音声認識装置で
は、各アプリケーションに対して別個の標準パターンメ
モリ７ａ〜７ｄ及び認識結果変換テーブルメモリ８ａ〜
８ｄを設けたが、この図６に示す音声認識装置では物理
的に単一の標準パターンメモリ７と認識結果変換テーブ
ルメモリ８を設けており、これらのメモリ７、８内に各
アプリケーション用の領域を有している。各アプリケー
ション用の領域は、音声認識ＬＳＩ４の能力、各アプリ
ケーションに必要とする標準パターンの数等によって必
要とされるサイズが異なる。以下、一例として各アプリ
ケーション毎に２５６バイトの領域を使用し、４つのア
プリケーションを切り換えて実行する場合について説明
する。

【００４０】これらの標準パターンメモリ、認識結果変
換テーブルメモリ内の各アプリケーション用の領域の選
択は、各アプリケーション内の音声認識ＬＳＩ４に対す
る入出力命令中のＩＯアドレスの上位２ビットを用いて
行うようになっている。

【００４１】この音声認識装置では、音声認識ＬＳＩ４
はＩＯアドレスの下位１４ビットのデコード出力から形
成されるチップセレクト信号により選択されるようにな
っている。従って、音声認識ＬＳＩ４はＩＯアドレスの
上位２ビットの内容によらず下位１４ビットが全て０で
あるときに選択されるため、ＣＰＵ２のＩＯアドレス空
間上では上述の図５に示す４箇所に音声認識ＬＳＩ４が
あるように見える。

【００４２】図７は標準パターンメモリ７に供給される
メモリアドレスを示す図である。標準パターンメモリ７
には、音声認識ＬＳＩ４からメモリアドレスの下位８ビ
ットＭＡ０〜ＭＡ７が供給される。このメモリアドレス
の下位８ビットによって各アプリケーションの領域内の
アドレスが指定される。また、この標準パターンメモリ
７には、ＩＯアドレスラッチ３０を介してＣＰＵ２のＩ
Ｏアドレスの上位２ビットがメモリアドレスの上位２ビ
ットＭＡ８、ＭＡ９として供給されるようになってい
る。このメモリアドレスの上位２ビットによって各アプ
リケーションに対応する領域が指定される。このＩＯア
ドレスラッチ３０は、音声認識ＬＳＩ４のチップセレク
ト信号に同期してＩＯアドレスの上位２ビットを保持す
るために、１度ある値を保持すると、この他のアプリケ
ーションが選択されるまで、同じ内容を保持する。

【００４３】この音声認識装置では、上述の第２の実施
形態に係る音声認識装置と同様に、各アプリケーション
中の音声認識ＬＳＩ４に対する入出力命令中のＩＯアド
レスの上位２ビットがアプリケーションを識別するため
の識別ビットとして設定されており、第１、第２、第３
及び第４のアプリケーション中の入出力命令中のＩＯア
ドレスがそれぞれ００００Ｈ、４０００Ｈ、８０００
Ｈ、Ｃ０００Ｈとなっている。従って、第１、第２、第
３及び第４のアプリケーション中の入出力命令中のＩＯ
アドレスの上位２ビットは、それぞれ００、０１、１
０、１１となり、図８に示すように標準パターンメモリ
７上のアドレス０００Ｈ〜０ＦＦＨの２５６バイト領域
が第１のアプリケーションに割り当てられ、アドレス１
００Ｈ〜１ＦＦＨ、２００Ｈ〜２ＦＦＨ、３００〜３Ｆ
ＦＨの各々２５６バイトの領域がそれぞれ第２、第３、
第４のアプリケーションに割り当てられる。

【００４４】また、認識結果変換テーブルメモリ８に
も、標準パターンメモリ７と同様に、例えばＣＰＵ２か
らのＩＯアドレスの下位８ビットが、メモリアドレスの
下位８ビットとして供給されており、ＩＯアドレスラッ
チ３０の出力がＩＯアドレスの上位２ビットとして供給
されている。従って、標準パターンメモリと同様に各ア
プリケーションに対して認識結果変換テーブルメモリ８
内の各々２５６バイトの領域が割り当てられる。

【００４５】なお、標準パターンメモリ内の各アプリケ
ーション毎の記憶領域と認識結果変換テーブルメモリ内
の各アプリケーション毎の記憶領域は上述のように同一
の大きさ（２５６バイト）とする必要はなく、各々異な
る大きさとしてもよい。

【００４６】このような構成の音声認識装置では、第
１、第２、第３及び第４のアプリケーションの内のいず
れかのアプリケーションを実行する際に、ＣＰＵ２が入
出力命令を実行すると、ＩＯアドレスラッチ３０がＣＰ
Ｕ２からのＩＯアドレスの上位２ビットを保持する。上
述のように各アプリケーション内の入出力命令中のＩＯ
アドレスは各アプリケーションに固有の値となっている
ため、同一のアプリケーションを実行している間は、Ｃ
ＰＵ２が入出力命令を実行し、ＩＯアドレスラッチ３０
が再度、ＩＯアドレスの上位２ビットの内容を保持した
場合においても、ＩＯアドレスラッチが保持する値は変
わらない。ＩＯアドレスラッチ３０が保持したＩＯアド
レスの上位２ビットは、メモリアドレスの上位２ビット
として標準パターンメモリ７及び認識結果変換テーブル
メモリ８に供給される。

【００４７】従って、あるアプリケーションを実行して
いる間は、標準パターンメモリ７及び認識結果変換テー
ブルメモリ８内の実行中のアプリケーションに対応する
領域が選択される。これにより、音声認識ＬＳＩ４では
選択されたアプリケーションに対応した標準パターンに
基づいて音声認識を行うことができ、ＣＰＵ２は選択さ
れたアプリケーションの認識結果変換テーブルを参照し
て、音声認識ＬＳＩ４の認識結果に対応するコマンドを
読み出し、外部の機器等の制御を行うことができる。

【００４８】また、アプリケーションが切り換えられる
とＩＯアドレスラッチ３０は、新たなアプリケーション
の入出力命令中のＩＯアドレスの上位２ビットを保持
し、ＩＯアドレスラッチ３０は保持したＩＯアドレスの
上位２ビットに基づいて、参照テーブルメモリ７及び認
識結果変換テーブル８内の新たに選択されたアプリケー
ションに対応する領域が選択される。

【００４９】この音声認識装置では、上述のようにアプ
リケーション毎に入出力命令中のＩＯアドレスの上位２
ビットを異ならせておくだけで、アプリケーションに実
行時に標準パターンメモリ７及び認識結果変換テーブル
メモリ８内の実行中のアプリケーションに対応する領域
を選択することができる。この選択はアプリケーション
の実行時に、ＩＯアドレスラッチ３０が、保持したＩＯ
アドレスの上位２ビットを標準パターンメモリ７及び認
識結果変換テーブルメモリ８に供給することにより自動
的に行われる。

【００５０】従って、ＣＰＵ２は実行中のアプリケーシ
ョンに対応して標準パターンメモリ７及び認識結果変換
テーブルメモリ８内の領域の選択を何等行う必要が無
く、アプリケーションの切り換え時のＣＰＵ２の負荷を
低減させることができる。さらに、アプリケーションの
切り換え時には、標準パターン等読み出す領域を切り換
えているだけであるから、標準パターン等のデータの書
き換えを行う必要がなく、アプリケーションの切り換え
をスムーズに行うことができる。

【００５１】また、この音声認識装置では、標準パター
ンメモリを１つとしたため、装置の小型化、軽量化を実
現することができる。

【００５２】さらに、各アプリケーションが使用する領
域は、メモリアドレスの上位２ビットによって自動的に
選択されるため、ＣＰＵ２は標準パターンメモリ７、認
識結果変換テーブルメモリ８内の各々のアプリケーショ
ンに対する領域の割り当てを制御する必要が無く、各ア
プリケーション毎に割り当てられた領域内の標準パター
ン、認識結果変換テーブルの管理のみを行えばよい。従
って、ＣＰＵ２のメモリ管理を容易にすることができ
る。

【００５３】

【発明の効果】本発明に係る音声認識装置では、選択手
段が複数の標準パターンメモリの中から、実行中のアプ
リケーションに対応するものを選択し、音声認識処理手
段が選択手段により選択された標準パターンメモリに記
憶された標準パターンと外部から入力される音声信号か
ら抽出した特徴量と比較して認識結果を決定するため、
アプリケーションを切り換える際に、選択手段が新たに
実行するアプリケーションに対応する標準パターンを選
択するため、アプリケーションの切り換え時に標準パタ
ーンの書き換え等を必要とせず、アプリケーションに切
り換えを円滑に行うことができる。また、各アプリケー
ション毎に別個の標準パターンメモリを備える構成とし
たため、各標準パターンメモリ内のメモリ管理のみを行
うだけでよいため、全てのアプリケーションの標準パタ
ーンを記憶したメモリから実行するアプリケーションに
おいて使用する標準パターンを読み出して単一の標準パ
ターンメモリの内容を書き換える場合に比較してメモリ
管理が容易となる。

【００５４】また、各アプリケーションの実行時に、実
行中のアプリケーションを示す第１のアドレスと、音声
認識処理手段が指定されているか否かを示す第２のアド
レスとからなる入出力アドレスを出力する制御手段を備
える構成とした場合では、アプリケーションを切り換え
る際に、新たなアプリケーション内で第１及び第２のア
ドレスが指定され、制御手段が指定された第１及び第２
のアドレスを出力すると、選択手段のデコード手段が新
たに指定された第１のアドレスをデコードし、新たに実
行されるアプリケーションに対応する標準パターンメモ
リを選択する。従って、この音声認識装置では、実行す
るアプリケーションを切り換えるだけで、他に何等の制
御を必要としないで、実行中のアプリケーションに対応
する標準パターンメモリが選択されるため、標準パター
ンメモリの切り換え処理の負荷を軽減することができ、
アプリケーションの切り換えをより円滑に行うことがで
きる。

【００５５】また、本発明に係る音声認識装置では、ア
プリケーションを切り換える際に、アプリケーションを
切り換える際に、新たなアプリケーション内で第１及び
第２のアドレスが指定され、制御手段が指定された第１
及び第２のアドレスを出力すると、選択手段のデコード
手段が新たに指定された第１のアドレスをデコードし、
標準パターンメモリ内に新たに実行されるアプリケーシ
ョンに対応する記憶領域を選択する。従って、実行する
アプリケーションを切り換える以外に、他に何等の制御
を必要としないで、標準パターンメモリ内の実行中のア
プリケーションに対応する記憶領域が選択されるため、
記憶領域の切り換えを容易に行うことができる。このた
め、アプリケーションの切り換えを円滑に行うことがで
きる。また、この音声認識装置では、標準パターンメモ
リを１つとしたため、機器の小型化、軽量化を実現する
ことができると共に、標準パターンメモリを１つとして
も各アプリケーションに対応する記憶領域の選択が自動
的に行われるため、アプリケーションの切り換え時に、
標準パターンの書き換え等の処理を必要とせず、アプリ
ケーションの切り換えを円滑に行うことができる。

【図面の簡単な説明】

【図１】本発明を適用した第１の実施形態に係る音声認
識装置の構成を示すブロック図である。

【図２】従来の音声認識装置の構成を示すブロック図で
ある。

【図３】本発明を適用した第２の実施形態に係る音声認
識装置の構成を示すブロック図である。

【図４】上記音声認識装置を構成するＩＯアドレスデコ
ーダの詳細な構成を示すブロック図である。

【図５】上記音声認識装置を構成する音声認識ＬＳＩの
ＣＰＵのＩＯアドレス空間上の配置を示すＩＯマップで
ある。

【図６】本発明を適用した第３の実施形態に係る音声認
識装置の構成を示すブロック図である。

【図７】上記音声認識装置を構成するＩＯアドレスラッ
チ部の構成を示す図である。

【図８】上記音声認識装置を構成する標準パターンメモ
リ内に設けられた各アプリケーションの標準パターンを
記憶する記憶領域を示すメモリマップである。

【符号の説明】

４音声認識ＬＳＩ、５音声分析部、６音声認識
部、７、７ａ、７ｂ、７ｃ、７ｄ標準パターンメモ
リ、８、８ａ、８ｂ、８ｃ、８ｄ認識結果変換テーブ
ルメモリ、１５セレクトコントロール部、２０ＩＯ
アドレスデコーダ、３０ＩＯアドレスラッチ部

Claims

【特許請求の範囲】

【請求項１】複数のアプリケーション毎に別個に設け
られ、各々標準パターンを記憶する物理的に複数の標準
パターンメモリと、実行中のアプリケーションを検出し、複数の標準パター
ンメモリの中から、検出したアプリケーションに対応す
る標準パターンメモリを選択する選択手段と、該選択手段により選択された標準パターンメモリに記憶
された標準パターンと外部から入力される音声信号から
抽出した特徴量と比較して認識結果を決定する音声認識
処理手段とを備えることを特徴とする音声認識装置。
【請求項２】さらに、上記各アプリケーションを実行
する際にアプリケーション内で指定され、実行中のアプ
リケーションを示す第１のアドレスと上記音声認識処理
手段が指定されているか否かを示す第２のアドレスとか
らなる入出力アドレスを出力する制御手段を備え、上記選択手段は、上記制御手段からの第１のアドレスを
デコードして実行中のアプリケーションに対応する標準
パターンメモリを選択するデコード手段を備えることを
特徴とする請求項１に記載の音声認識装置。
【請求項３】複数のアプリケーション毎に別個に設け
られ、各アプリケーションで用いる標準パターンを記憶
する複数の記憶領域を有する物理的に単一の標準パター
ンメモリと、上記標準パターンメモリ内の複数の記憶領域の中から、
実行中のアプリケーションに対応するものを選択する選
択手段と、該選択手段により選択された標準パターンメモリに記憶
された標準パターンと外部から入力される音声信号から
抽出した特徴量と比較して認識結果を決定する音声認識
処理手段と、上記各アプリケーションを実行する際にアプリケーショ
ン内で指定され、実行中のアプリケーションを示す第１
のアドレスと上記音声認識処理手段が指定されているか
否かを示す第２のアドレスとからなる入出力アドレスを
出力する制御手段とを備え、上記選択手段は、上記制御手段からの第１のアドレスを
デコードして実行中のアプリケーションに対応する記憶
領域を選択するデコード手段を備えることを特徴とする
音声認識装置。