JPH09171395A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH09171395A
JPH09171395A JP7331669A JP33166995A JPH09171395A JP H09171395 A JPH09171395 A JP H09171395A JP 7331669 A JP7331669 A JP 7331669A JP 33166995 A JP33166995 A JP 33166995A JP H09171395 A JPH09171395 A JP H09171395A
Authority
JP
Japan
Prior art keywords
application
standard pattern
address
voice recognition
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7331669A
Other languages
English (en)
Inventor
Tadahiro Hoshino
恭祐 星野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7331669A priority Critical patent/JPH09171395A/ja
Publication of JPH09171395A publication Critical patent/JPH09171395A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 アプリケーション間の切り換えを円滑に行う
ことができる音声認識装置を提供する。 【解決手段】 制御部1のCPU2はこれから実行する
アプリケーションに対応する識別情報を発生し、セレク
トコントロール部15のレジスタに書き込む。セレクト
コントロール部15はセレクト信号を出力する。このセ
レクト信号により、標準パターンメモリ7a〜7d及び
認識結果変換テーブルメモリ8a〜8dの中から、これ
から実行するアプリケーションに対応するものを選択す
る。音声認識LSI4は選択された標準パターンメモリ
中の標準パターンを用いて音声認識を行って認識結果を
出力し、CPU2は、認識結果変換テーブルメモリから
認識結果に対応するコマンド等を読み出して実行する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、パーソナルコンピ
ュータ、各種システム等において音声を入力するために
用いられる音声認識装置に関する。
【0002】
【従来の技術】従来より、入力された音声の特徴を分析
して認識する音声認識装置を用いて指示、データ等を入
力する装置が知られている。このような装置ではそれぞ
れの認識方法、認識できる語数、認識対象話者(特定又
は不特定)等の違いから、音声認識精度、装置の規模等
が異なっている。
【0003】このような音声認識装置では、入力した音
声データの特徴量を抽出し、抽出した特徴量を音声認識
辞書中の音声パターンと比較して類似度を求め、この類
似度に基づいて認識結果を決定するようになっている。
この類似度の算出には、例えば動的計画法によりパター
ンマッチングであるDP(Dynamic Programing:動的計
画法)マッチング法、HMM法、ニューラルネットワー
ク法等が一般に用いられている。このような音声認識装
置は、計算機上のプログラムあるいは専用のハードウェ
アとして実現されていたが、近年では主要な機能をLS
Iとして実現されるようになっており、装置の小型化、
軽量化が進んでいる。
【0004】図2はこのような音声認識装置の構成を示
す図である。同図中において1は装置全体の制御を行う
制御部であり、CPU2とメモリ3とを備えている。メ
モリ3はCPU2が実行する制御プログラム等を格納す
るROMと、データ等を記憶するための作業用のRAM
とからなる。また、4は音声認識LSIであり、マイク
10を介して入力された音声信号の特徴量の抽出等を行
う音声分析部5と、予め標準パターンメモリ部7に保持
された標準パターンと比較して認識結果を決定する音声
認識部6とからなる。さらに、この音声認識装置は、音
声認識部6により得られた認識結果に対応するコマンド
等が記憶される認識結果変換テーブルメモリ8と、認識
結果等を表示する表示部9と、バス11とを備えてい
る。このバス11を介して制御部1、音声認識LSI
4、認識結果変換テーブルメモリ8、表示部9が相互に
接続されている。
【0005】このような構成の音声認識装置では、音声
分析、類似度の計算等の処理タイミングは、制御部1に
よって制御されるようになっており、音声認識を行う際
には、制御部1が音声認識LSI4に音声認識の開始を
指示する。
【0006】音声認識の開始が指示されると、音声分析
部5はマイク10を介して入力された音声信号に帯域制
限等の前処理を施してアナログ/デジタル変換し、得ら
れた音声データに、公知のLPC(Linear Prediction
coefficients:線形予測係数)分析等を施して、LPC
ケプストラム(Cepstrum)等の特徴量を抽出して音声認
識部6に供給する。
【0007】このように特徴量が供給されると、音声認
識部6は上述のDPマッチング法、HMM法、ニューラ
ルネットワーク法等により、音声分析部5から供給され
た特徴量と標準パターンメモリ部に記憶されている標準
パターンを比較して類似度を求め、この類似度に基づい
て認識結果を決定する。この認識結果はバス11を介し
てCPU2に供給される。CPU2は認識結果に基づい
て変換テーブルメモリ8を参照し、認識結果に対応する
コマンド等があれば、このコマンドに従って装置全体の
動作を制御する。このようなコマンドに応じて、CPU
2は、例えば認識結果を表示部9に供給し、表示部9は
供給された認識結果を表示画面上に表示する。このよう
に表示部9の表示画面に表示された認識結果を見ること
により、ユーザは認識結果を確認することができる。例
えば音声入力した単語と認識結果が異なる場合、ユーザ
は、表示部9の表示画面に表示された認識結果を見るこ
とによって、音声認識が誤っていることを確認すること
ができ、必要なら再度音声入力を行うことができる。
【0008】上述の標準パターンメモリ7に記憶されて
いる標準パターンを作成して登録する際には、予め音声
認識対象の単語を2〜3回程度発音し、その発音の各回
毎に音声認識LSI4において、得られた音声データの
特徴量を抽出し、抽出した特徴量を標準パターンとして
標準パターンメモリ7に格納する。通常、音声入力から
標準パターンの作成、登録までの一連の動作は、連続し
た1つの動作として処理されるため、ユーザは、1つの
単語を音声入力すると、標準パターンが生成、登録され
るのを待って、次の単語の音声入力を行うようになって
いる。このように入力した単語にコマンド等を対応させ
るためには、図示しない入力手段によりコマンド等を入
力し、標準パターンとコマンド等を対応させて認識結果
変換テーブルメモリ8に記憶しておくようになってい
る。
【0009】上述のような音声入力装置が複数のアプリ
ケーションに対応している場合、標準パターンメモリ7
あるいは認識結果変換テーブルメモリ8の容量が不足
し、各々のアプリケーションで用いる単語の標準パター
ン、コマンド等を全て登録することができなくなる場合
がある。
【0010】このような場合には、各々のアプリケーシ
ョンにおいて用いられる単語の標準パターン、コマンド
等を全てメモリ3に記憶しておき、各々のアプリケーシ
ョンを実行する際に、各々のアプリケーションで使用す
る単語の標準パターン、コマンド等をメモリ3から読み
出して標準パターンメモリ7あるいは認識結果変換テー
ブルメモリ8に記憶するようになっている。
【0011】
【発明が解決しようとする課題】従来の音声認識装置
は、上述のように構成されているため、アプリケーショ
ンの切り換えを行う際に、新たなアプリケーションに対
応する標準パターン及びコマンドをメモリ3から読み出
して標準パターンメモリ7、認識結果変換テーブルメモ
リ8の書き換えを行う必要があり、この書き換え時間に
よりアプリケーションの切り換えがスムーズに行われな
いことがある。この問題は、アプリケーションの切り換
え時に書き換える標準パターン、コマンド等が多い場
合、あるいはアプリケーションを頻繁に切り換える場合
等に特に顕著となる。
【0012】また、この音声認識装置では、制御部1の
メモリ3に全ての単語の標準パターン、コマンド等を記
憶しておく構成としたため、これらの標準パターン、コ
マンド等の追加、変更等を行う際にメモリ管理等の処理
が煩雑となる問題がある。
【0013】本発明は、上述のような問題点に鑑みてな
されたものであり、複数のアプリケーションをスムーズ
に切り換えることができ、メモリ管理が容易な音声認識
装置を提供することを目的とする。
【0014】
【課題を解決するための手段】本発明に係る音声認識装
置は、複数のアプリケーション毎に別個に設けられ、各
々標準パターンを記憶する複数の標準パターンメモリ
と、実行中のアプリケーションを検出し、複数の標準パ
ターンメモリの中から、実行中のアプリケーションに対
応する標準パターンメモリを選択する選択手段と、選択
手段により選択された標準パターンメモリに記憶された
標準パターンと外部から入力される音声信号から抽出し
た特徴量と比較して認識結果を決定する音声認識処理手
段とを備える。
【0015】また、さらに、各アプリケーションを実行
する際にアプリケーション内で指定され、実行中のアプ
リケーションを示す第1のアドレスと音声認識処理手段
が指定されているか否かを示す第2のアドレスとからな
る入出力アドレスを出力する制御手段を備える構成とし
てもよい。この場合は、選択手段が、制御手段からの第
1のアドレスをデコードして実行中のアプリケーション
に対応する標準パターンメモリを選択するデコード手段
を備える構成とする。
【0016】また、本発明に係る音声認識装置は、複数
のアプリケーション毎に別個に設けられ、各アプリケー
ションで用いる標準パターンを記憶する複数の記憶領域
を有する物理的に単一の標準パターンメモリと、標準パ
ターンメモリ内の複数の記憶領域の中から、実行中のア
プリケーションに対応するものを選択する選択手段と、
選択手段により選択された標準パターンメモリに記憶さ
れた標準パターンと外部から入力される音声信号から抽
出した特徴量と比較して認識結果を決定する音声認識処
理手段とを備える。また、この音声認識装置は、各アプ
リケーションを実行する際に実行中のアプリケーション
内で指定され、実行中のアプリケーションを示す第1の
アドレスと、音声認識処理手段が指定されているか否か
を示す第2のアドレスとからなる入出力アドレスを出力
する制御手段とを備え、選択手段が、制御手段からの第
1のアドレスをデコードして実行中のアプリケーション
に対応する記憶領域を選択するデコード手段を備える。
【0017】
【発明の実施の形態】図1は本発明の第1の実施形態に
係る音声認識装置の構成を示すブロック図である。な
お、この図1中では上述の従来の技術の説明で用いた図
2と同一又は対応する構成要素は同一の符号で示してい
る。同図中において、7a、7b、7c、7dは各々標
準パターンを記憶するための標準パターン記憶メモリで
あり、8a、8b、8c、8dは認識結果に応じたコマ
ンド等を記憶するための認識結果変換テーブルメモリで
あり、15は実行するアプリケーションに応じて標準パ
ターン7a〜7dと認識結果変換テーブルメモリ8a〜
8dの選択を行うセレクトコントロール部である。ま
た、この音声認識装置は、CPU2とメモリ3を備える
制御部1と、上述の図2と同様に音声分析部と音声認識
部とを備える音声認識LSI4と、液晶パネル、発光ダ
イオードアレイ等の表示手段からなる表示部9と、マイ
ク10と、バス11等を有する。このような構成の音声
認識装置は、音声認識LSI4を用いているため小型軽
量とすることができる。また、制御部1に外部の情報処
理装置等から制御コマンド等を入力する指示入力手段を
設けることにより、指示入力手段を介してCPU2に指
示を入力するだけで音声認識の開始指示、認識結果の読
み出し等を制御することができるため、パーソナルコン
ピュータ、電話回線を利用した各種システム、例えばオ
ーダエントリーシステム、緊急呼び出しシステム、予約
システム等において音声を入力する音声入力手段として
用いることが容易である。
【0018】また、この音声認識装置では、複数のアプ
リケーションを切り換えて、認識可能な単語、音節等の
切り換え、あるいは認識結果に対するコマンド等の切り
換えを行うことができるようになっており、各々のアプ
リケーションが別個の標準パターンメモリ、認識結果変
換テーブルメモリを使用するようになっている。なお、
図1は第1から第4までの4つのアプリケーションの実
行が可能な構成を示している。この音声認識装置では、
各々のアプリケーションに対応して各々物理的に別個の
標準パターンメモリ、認識結果変換テーブルメモリを設
けており、第1のアプリケーションの実行時には、標準
パターンメモリ7a及び認識結果変換テーブルメモリ8
aを使用し、第2〜第4のアプリケーションの実行時に
は、各々標準パターンメモリ7b〜7dと認識結果変換
テーブルメモリ8b〜8dを使用するようになってい
る。
【0019】セレクトコントロール部15は、CPU2
から書き込み又は読み出しが可能なレジスタを備えてい
る。このレジスタは現在、実行しているアプリケーショ
ンに対応する識別情報を記憶するためのものであり、C
PU2がアプリケーションを切り換えるときに、その内
容が変更される。
【0020】また、セレクトコントロール部15は、レ
ジスタに記憶されている識別情報に基づいて標準パター
ンメモリ、認識結果変換テーブルモリの数に等しい数す
なわち図1に示す場合では4つのセレクト信号を発生す
る。これらのセレクト信号は、それぞれ標準パターンメ
モリ7a〜7d、認識結果変換テーブルメモリ8a〜8
dに供給されている。
【0021】このセレクト信号により、標準パターンメ
モリ7a〜7d、認識結果変換テーブルメモリ8a〜8
dの内から、実行されているあるいは実行しようとする
アプリケーションに対応するものが選択されるようにな
っている。
【0022】この音声認識装置では、CPU2はアプリ
ケーションを実行する際に、セレクトコントロール部1
5のレジスタを参照し、現在選択されているアプリケー
ションを検出する。検出したアプリケーションがこれか
ら実行しようとするアプリケーションと異なる場合は、
これから実行しようとするアプリケーションに対応する
識別情報を発生してセレクトコントロール部15のレジ
スタに書き込む。例えば第1のアプリケーションが選択
されており、標準パターンメモリ7a、認識結果変換テ
ーブルメモリ8aが選択された状態で、第4のアプリケ
ーションの実行が指示されると、CPU2は、第4のア
プリケーションに対応する識別情報をセレクトコントロ
ール部15のレジスタに書き込む。
【0023】レジスタの内容が変更されると、セレクト
コントロール部15は新たに選択された第4のアプリケ
ーションに対応するセレクト信号を出力する。このセレ
クト信号により、標準パターンメモリ7a、認識結果変
換テーブルメモリ8aに代えて、新たに標準パターンメ
モリ7d、認識結果変換テーブルメモリ8dが選択され
る。
【0024】CPU2が第4のアプリケーションの実行
を開始すると、音声認識LSI4は選択された標準パタ
ーンメモリ7d中の標準パターンを用いて音声認識を行
い。CPU2は、認識結果に対応するコマンド等を認識
結果変換テーブルメモリ8dから読み出し、読み出した
コマンド等に応じて装置の制御等を行う。
【0025】この音声認識装置は、上述のように個々の
アプリケーションに対して別個に標準パターンメモリ及
び認識結果変換テーブルメモリを設け、アプリケーショ
ンの切り換え時に、新たなアプリケーションに対応する
標準パターンメモリ及び認識結果変換テーブルメモリを
選択する構成としたため、全てのアプリケーションの標
準パターン及びコマンド等を同一のメモリに記憶してお
く場合に比してメモリ管理を容易に行うことができ、ま
た、アプリケーションの切り換え時に標準パターンメモ
リ及び認識結果変換テーブルメモリの内容を書き換える
必要がないためアプリケーションの切り換えをスムーズ
に行うことができる。
【0026】また、標準パターンメモリ及び認識結果変
換テーブルメモリを増設することにより、容易に実行可
能なアプリケーションの数を増加させることができ、ま
た、標準パターンメモリ及び認識結果変換テーブルを各
々1つとした場合に比して、アプリケーション当たりの
標準パターン、コマンド等を記憶する領域を広くするこ
とができるため、各アプリケーションにおいて認識可能
な単語、音節等を増加させることができる。従って、ア
プリケーション作成の自由度を向上させることができ
る。
【0027】図3は発明の第2の実施形態に係る音声認
識装置の構成を示すブロック図である。なお、この図3
中では上述の図1と同一又は対応する構成要素は同一の
符号で示している。
【0028】この音声認識装置は、上述の図1に示す音
声認識装置と同様に4つのアプリケーション毎に標準パ
ターンメモリ7a〜7dと認識結果変換テーブルメモリ
8a〜8dを設けている。上述の図1に示す音声認識装
置ではCPU2がセレクトコントロール部15に実行す
るアプリケーションに対応する認識情報を書き込む構成
としていたが、この図3に示す音声認識装置はセレクト
コントロール回路15の代わりに、CPU2から供給さ
れるIOアドレスに基づいてデコード出力を出力するI
Oアドレスデコーダ20を備えている。
【0029】CPU2からIOアドレスデコーダ20に
供給されるIOアドレスは、例えばA15(最上位ビッ
ト)、A14・・・A1、A0(最下位ビット)の16
ビットであり、このIOアドレスデコーダ20は、図4
にその詳細を示すように16ビットのIOアドレスの上
位2ビット(A15、A14)をデコードして標準パタ
ーンメモリ7a〜7dと認識結果変換テーブルメモリ8
a〜8dの切り換えを行うデコーダ21(デコード手
段)と、IOアドレスの下位3ビット(A2、A1、A
0)をデコードしてチップセレクト信号を形成するデコ
ーダ22とを備えている。なお、IOアドレスは、16
ビットでなくともよく、この場合は、デコーダ21、2
2ががデコードするビットを適宜変更する。
【0030】デコーダ21は、IOアドレスの上位2ビ
ットが00、01、10、11のときにそれぞれ選択さ
れる4つのデコード出力D0、D1、D2、D3を有し
ている。デコード出力D0は標準パターンメモリ7a及
び認識結果変換テーブルメモリ8aに接続されており、
デコード出力D1は標準パターンメモリ7b及び認識結
果変換テーブルメモリ8bに接続されており、デコード
出力D2は標準パターンメモリ7c及び認識結果変換テ
ーブルメモリ8cに接続されており、デコード出力D3
は標準パターンメモリ7d及び認識結果変換テーブルメ
モリ8dに接続されている。
【0031】従って、IOアドレスの上位2ビットが0
0のときは、標準パターンメモリ7a及び認識結果変換
テーブルメモリ8aが選択され、IOアドレスの上位2
ビットが01、10、11のときは、それぞれ標準パタ
ーンメモリ7b及び認識結果変換テーブルメモリ8b、
標準パターンメモリ7c及び認識結果変換テーブルメモ
リ8c、標準パターンメモリ7d及び認識結果変換テー
ブルメモリ8dが選択される。
【0032】デコーダ22の出力D0は図3に示す音声
認識LSI4にチップセレクト信号として供給されてい
る。なお、この図4では説明の簡略化のために、デコー
ダ22がIOアドレスの下位3ビットのみをデコードす
る場合について説明しているが、このままではIOアド
レスの下位3ビットが000である場合(0000H、
0008H、0010H、0018H・・・FFF0
H、FFF8H)において音声認識LSI4が選択され
てしまい、音声認識LSI4だけでIOアドレス空間の
8分の1を占めてしまうことになる。このため、他に多
くの機器等をIOアドレス空間上にマッピングするため
には、さらに多くのIOアドレスの下位ビット(例えば
下位14ビットA13〜A0あるいは下位12ビットA
11〜A0程度)をデコードすることが望ましい。
【0033】上述のように、IOアドレスの上位2ビッ
トを音声認識LSI4のチップセレクト信号を形成する
デコーダ22で使用しない場合、IOアドレスの下位の
アドレスが音声認識LSI4の下位のアドレスに合致し
ていれば、上位2ビットに無関係にチップセレクト信号
が形成されて音声認識LSI4が選択されることにな
る。従って、例えばデコーダ22がIOアドレスの下位
14ビットをデコードする場合では、CPU2からは図
5に示すようにIOアドレス空間上のIOアドレスが0
000H、4000H、8000H、C000Hの4箇
所に音声認識用LSI4が存在するように見える。
【0034】上述のように構成された音声認識装置で実
行される各アプリケーション中の音声認識LSI4に対
する入出力命令では、指定されるIOアドレスの上位2
ビットがアプリケーションを識別するための識別ビット
として設定されている。すなわち、第1のアプリケーシ
ョン中の入出力命令ではIOアドレスの上位2ビットが
00とされており、第2、第3及び第4のアプリケーシ
ョン中の入出力命令中では、各々IOアドレスの上位2
ビットが01、10、11とされている。音声認識LS
I4のIOアドレスの残りのビットA13〜A0は全て
0であるから、第1、第2、第3及び第4のアプリケー
ション中の入出力命令では音声認識LSI4のIOアド
レスがそれぞれ0000H、4000H、8000H、
C000Hとされている。このようなIOアドレスは、
これらのアプリケーションのプログラムを作成する際に
設定される。
【0035】上述のようにIOアドレスが設定されてい
ると、第1、第2、第3及び第4のアプリケーション中
の入出力命令を実行するときに、デコーダ21によって
それぞれ標準パターンメモリ7a及び認識結果変換テー
ブルメモリ8a、標準パターンメモリ7b及び認識結果
変換テーブルメモリ8b、標準パターンメモリ7c及び
認識結果変換テーブルメモリ8c、標準パターンメモリ
7d及び認識結果変換テーブルメモリ8dが選択され
る。従って、各々のアプリケーションを実行する際に、
各々のアプリケーションに対応した標準パターン、コマ
ンド等が記憶された標準パターンメモリ及び認識結果変
換テーブルが選択される。
【0036】この音声認識装置では、上述のように各ア
プリケーション中の音声認識LSI4に対する入出力命
令中のIOアドレスの上位2ビットがアプリケーション
毎に異なる値に設定されているため、この上位2ビット
をデコードするデコーダ21によって各アプリケーショ
ンに対応する標準パターンメモリ及び認識結果変換テー
ブルが選択される。このため、アプリケーションの切り
換え時に、制御部が単に新たなアプリケーションの実行
を開始するだけで、他に別個の処理を必要とせずに標準
パターンメモリ及び認識結果変換テーブルの選択を行う
ことができる。従って、アプリケーションの切り換え時
に標準パターン等の書き換えを必要としないため、CP
U2の負荷を低減させてアプリケーションの切り換えを
スムーズに行うことができる。
【0037】なお、上述の説明では、デコーダ21がI
Oアドレスの上位2ビットをデコードして各々4つの標
準パターンメモリ及び認識結果変換テーブルの中から各
々1つを選択する構成としたが、例えば標準パターンメ
モリ及び認識結果変換テーブルを各々8つ設け、デコー
ダ21がIOアドレスの上位3ビット(A15、A1
4、A13)をデコードして標準パターンメモリ及び認
識結果変換テーブルメモリを選択する構成とする等、ア
プリケーションの数に対応させて適宜構成を変更するこ
ともできる。
【0038】図6は本発明の第3の実施形態に係る音声
認識装置の構成を示すブロック図である。この図6中で
は、上述の図1、図3と同一又は対応する構成要素は同
一の符号で示されている。
【0039】上述の図1、図3に示す音声認識装置で
は、各アプリケーションに対して別個の標準パターンメ
モリ7a〜7d及び認識結果変換テーブルメモリ8a〜
8dを設けたが、この図6に示す音声認識装置では物理
的に単一の標準パターンメモリ7と認識結果変換テーブ
ルメモリ8を設けており、これらのメモリ7、8内に各
アプリケーション用の領域を有している。各アプリケー
ション用の領域は、音声認識LSI4の能力、各アプリ
ケーションに必要とする標準パターンの数等によって必
要とされるサイズが異なる。以下、一例として各アプリ
ケーション毎に256バイトの領域を使用し、4つのア
プリケーションを切り換えて実行する場合について説明
する。
【0040】これらの標準パターンメモリ、認識結果変
換テーブルメモリ内の各アプリケーション用の領域の選
択は、各アプリケーション内の音声認識LSI4に対す
る入出力命令中のIOアドレスの上位2ビットを用いて
行うようになっている。
【0041】この音声認識装置では、音声認識LSI4
はIOアドレスの下位14ビットのデコード出力から形
成されるチップセレクト信号により選択されるようにな
っている。従って、音声認識LSI4はIOアドレスの
上位2ビットの内容によらず下位14ビットが全て0で
あるときに選択されるため、CPU2のIOアドレス空
間上では上述の図5に示す4箇所に音声認識LSI4が
あるように見える。
【0042】図7は標準パターンメモリ7に供給される
メモリアドレスを示す図である。標準パターンメモリ7
には、音声認識LSI4からメモリアドレスの下位8ビ
ットMA0〜MA7が供給される。このメモリアドレス
の下位8ビットによって各アプリケーションの領域内の
アドレスが指定される。また、この標準パターンメモリ
7には、IOアドレスラッチ30を介してCPU2のI
Oアドレスの上位2ビットがメモリアドレスの上位2ビ
ットMA8、MA9として供給されるようになってい
る。このメモリアドレスの上位2ビットによって各アプ
リケーションに対応する領域が指定される。このIOア
ドレスラッチ30は、音声認識LSI4のチップセレク
ト信号に同期してIOアドレスの上位2ビットを保持す
るために、1度ある値を保持すると、この他のアプリケ
ーションが選択されるまで、同じ内容を保持する。
【0043】この音声認識装置では、上述の第2の実施
形態に係る音声認識装置と同様に、各アプリケーション
中の音声認識LSI4に対する入出力命令中のIOアド
レスの上位2ビットがアプリケーションを識別するため
の識別ビットとして設定されており、第1、第2、第3
及び第4のアプリケーション中の入出力命令中のIOア
ドレスがそれぞれ0000H、4000H、8000
H、C000Hとなっている。従って、第1、第2、第
3及び第4のアプリケーション中の入出力命令中のIO
アドレスの上位2ビットは、それぞれ00、01、1
0、11となり、図8に示すように標準パターンメモリ
7上のアドレス000H〜0FFHの256バイト領域
が第1のアプリケーションに割り当てられ、アドレス1
00H〜1FFH、200H〜2FFH、300〜3F
FHの各々256バイトの領域がそれぞれ第2、第3、
第4のアプリケーションに割り当てられる。
【0044】また、認識結果変換テーブルメモリ8に
も、標準パターンメモリ7と同様に、例えばCPU2か
らのIOアドレスの下位8ビットが、メモリアドレスの
下位8ビットとして供給されており、IOアドレスラッ
チ30の出力がIOアドレスの上位2ビットとして供給
されている。従って、標準パターンメモリと同様に各ア
プリケーションに対して認識結果変換テーブルメモリ8
内の各々256バイトの領域が割り当てられる。
【0045】なお、標準パターンメモリ内の各アプリケ
ーション毎の記憶領域と認識結果変換テーブルメモリ内
の各アプリケーション毎の記憶領域は上述のように同一
の大きさ(256バイト)とする必要はなく、各々異な
る大きさとしてもよい。
【0046】このような構成の音声認識装置では、第
1、第2、第3及び第4のアプリケーションの内のいず
れかのアプリケーションを実行する際に、CPU2が入
出力命令を実行すると、IOアドレスラッチ30がCP
U2からのIOアドレスの上位2ビットを保持する。上
述のように各アプリケーション内の入出力命令中のIO
アドレスは各アプリケーションに固有の値となっている
ため、同一のアプリケーションを実行している間は、C
PU2が入出力命令を実行し、IOアドレスラッチ30
が再度、IOアドレスの上位2ビットの内容を保持した
場合においても、IOアドレスラッチが保持する値は変
わらない。IOアドレスラッチ30が保持したIOアド
レスの上位2ビットは、メモリアドレスの上位2ビット
として標準パターンメモリ7及び認識結果変換テーブル
メモリ8に供給される。
【0047】従って、あるアプリケーションを実行して
いる間は、標準パターンメモリ7及び認識結果変換テー
ブルメモリ8内の実行中のアプリケーションに対応する
領域が選択される。これにより、音声認識LSI4では
選択されたアプリケーションに対応した標準パターンに
基づいて音声認識を行うことができ、CPU2は選択さ
れたアプリケーションの認識結果変換テーブルを参照し
て、音声認識LSI4の認識結果に対応するコマンドを
読み出し、外部の機器等の制御を行うことができる。
【0048】また、アプリケーションが切り換えられる
とIOアドレスラッチ30は、新たなアプリケーション
の入出力命令中のIOアドレスの上位2ビットを保持
し、IOアドレスラッチ30は保持したIOアドレスの
上位2ビットに基づいて、参照テーブルメモリ7及び認
識結果変換テーブル8内の新たに選択されたアプリケー
ションに対応する領域が選択される。
【0049】この音声認識装置では、上述のようにアプ
リケーション毎に入出力命令中のIOアドレスの上位2
ビットを異ならせておくだけで、アプリケーションに実
行時に標準パターンメモリ7及び認識結果変換テーブル
メモリ8内の実行中のアプリケーションに対応する領域
を選択することができる。この選択はアプリケーション
の実行時に、IOアドレスラッチ30が、保持したIO
アドレスの上位2ビットを標準パターンメモリ7及び認
識結果変換テーブルメモリ8に供給することにより自動
的に行われる。
【0050】従って、CPU2は実行中のアプリケーシ
ョンに対応して標準パターンメモリ7及び認識結果変換
テーブルメモリ8内の領域の選択を何等行う必要が無
く、アプリケーションの切り換え時のCPU2の負荷を
低減させることができる。さらに、アプリケーションの
切り換え時には、標準パターン等読み出す領域を切り換
えているだけであるから、標準パターン等のデータの書
き換えを行う必要がなく、アプリケーションの切り換え
をスムーズに行うことができる。
【0051】また、この音声認識装置では、標準パター
ンメモリを1つとしたため、装置の小型化、軽量化を実
現することができる。
【0052】さらに、各アプリケーションが使用する領
域は、メモリアドレスの上位2ビットによって自動的に
選択されるため、CPU2は標準パターンメモリ7、認
識結果変換テーブルメモリ8内の各々のアプリケーショ
ンに対する領域の割り当てを制御する必要が無く、各ア
プリケーション毎に割り当てられた領域内の標準パター
ン、認識結果変換テーブルの管理のみを行えばよい。従
って、CPU2のメモリ管理を容易にすることができ
る。
【0053】
【発明の効果】本発明に係る音声認識装置では、選択手
段が複数の標準パターンメモリの中から、実行中のアプ
リケーションに対応するものを選択し、音声認識処理手
段が選択手段により選択された標準パターンメモリに記
憶された標準パターンと外部から入力される音声信号か
ら抽出した特徴量と比較して認識結果を決定するため、
アプリケーションを切り換える際に、選択手段が新たに
実行するアプリケーションに対応する標準パターンを選
択するため、アプリケーションの切り換え時に標準パタ
ーンの書き換え等を必要とせず、アプリケーションに切
り換えを円滑に行うことができる。また、各アプリケー
ション毎に別個の標準パターンメモリを備える構成とし
たため、各標準パターンメモリ内のメモリ管理のみを行
うだけでよいため、全てのアプリケーションの標準パタ
ーンを記憶したメモリから実行するアプリケーションに
おいて使用する標準パターンを読み出して単一の標準パ
ターンメモリの内容を書き換える場合に比較してメモリ
管理が容易となる。
【0054】また、各アプリケーションの実行時に、実
行中のアプリケーションを示す第1のアドレスと、音声
認識処理手段が指定されているか否かを示す第2のアド
レスとからなる入出力アドレスを出力する制御手段を備
える構成とした場合では、アプリケーションを切り換え
る際に、新たなアプリケーション内で第1及び第2のア
ドレスが指定され、制御手段が指定された第1及び第2
のアドレスを出力すると、選択手段のデコード手段が新
たに指定された第1のアドレスをデコードし、新たに実
行されるアプリケーションに対応する標準パターンメモ
リを選択する。従って、この音声認識装置では、実行す
るアプリケーションを切り換えるだけで、他に何等の制
御を必要としないで、実行中のアプリケーションに対応
する標準パターンメモリが選択されるため、標準パター
ンメモリの切り換え処理の負荷を軽減することができ、
アプリケーションの切り換えをより円滑に行うことがで
きる。
【0055】また、本発明に係る音声認識装置では、ア
プリケーションを切り換える際に、アプリケーションを
切り換える際に、新たなアプリケーション内で第1及び
第2のアドレスが指定され、制御手段が指定された第1
及び第2のアドレスを出力すると、選択手段のデコード
手段が新たに指定された第1のアドレスをデコードし、
標準パターンメモリ内に新たに実行されるアプリケーシ
ョンに対応する記憶領域を選択する。従って、実行する
アプリケーションを切り換える以外に、他に何等の制御
を必要としないで、標準パターンメモリ内の実行中のア
プリケーションに対応する記憶領域が選択されるため、
記憶領域の切り換えを容易に行うことができる。このた
め、アプリケーションの切り換えを円滑に行うことがで
きる。また、この音声認識装置では、標準パターンメモ
リを1つとしたため、機器の小型化、軽量化を実現する
ことができると共に、標準パターンメモリを1つとして
も各アプリケーションに対応する記憶領域の選択が自動
的に行われるため、アプリケーションの切り換え時に、
標準パターンの書き換え等の処理を必要とせず、アプリ
ケーションの切り換えを円滑に行うことができる。
【図面の簡単な説明】
【図1】本発明を適用した第1の実施形態に係る音声認
識装置の構成を示すブロック図である。
【図2】従来の音声認識装置の構成を示すブロック図で
ある。
【図3】本発明を適用した第2の実施形態に係る音声認
識装置の構成を示すブロック図である。
【図4】上記音声認識装置を構成するIOアドレスデコ
ーダの詳細な構成を示すブロック図である。
【図5】上記音声認識装置を構成する音声認識LSIの
CPUのIOアドレス空間上の配置を示すIOマップで
ある。
【図6】本発明を適用した第3の実施形態に係る音声認
識装置の構成を示すブロック図である。
【図7】上記音声認識装置を構成するIOアドレスラッ
チ部の構成を示す図である。
【図8】上記音声認識装置を構成する標準パターンメモ
リ内に設けられた各アプリケーションの標準パターンを
記憶する記憶領域を示すメモリマップである。
【符号の説明】
4 音声認識LSI、5 音声分析部、6 音声認識
部、7、7a、7b、7c、7d 標準パターンメモ
リ、8、8a、8b、8c、8d 認識結果変換テーブ
ルメモリ、15 セレクトコントロール部、20 IO
アドレスデコーダ、30 IOアドレスラッチ部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 複数のアプリケーション毎に別個に設け
    られ、各々標準パターンを記憶する物理的に複数の標準
    パターンメモリと、 実行中のアプリケーションを検出し、複数の標準パター
    ンメモリの中から、検出したアプリケーションに対応す
    る標準パターンメモリを選択する選択手段と、 該選択手段により選択された標準パターンメモリに記憶
    された標準パターンと外部から入力される音声信号から
    抽出した特徴量と比較して認識結果を決定する音声認識
    処理手段とを備えることを特徴とする音声認識装置。
  2. 【請求項2】 さらに、上記各アプリケーションを実行
    する際にアプリケーション内で指定され、実行中のアプ
    リケーションを示す第1のアドレスと上記音声認識処理
    手段が指定されているか否かを示す第2のアドレスとか
    らなる入出力アドレスを出力する制御手段を備え、 上記選択手段は、上記制御手段からの第1のアドレスを
    デコードして実行中のアプリケーションに対応する標準
    パターンメモリを選択するデコード手段を備えることを
    特徴とする請求項1に記載の音声認識装置。
  3. 【請求項3】 複数のアプリケーション毎に別個に設け
    られ、各アプリケーションで用いる標準パターンを記憶
    する複数の記憶領域を有する物理的に単一の標準パター
    ンメモリと、 上記標準パターンメモリ内の複数の記憶領域の中から、
    実行中のアプリケーションに対応するものを選択する選
    択手段と、 該選択手段により選択された標準パターンメモリに記憶
    された標準パターンと外部から入力される音声信号から
    抽出した特徴量と比較して認識結果を決定する音声認識
    処理手段と、 上記各アプリケーションを実行する際にアプリケーショ
    ン内で指定され、実行中のアプリケーションを示す第1
    のアドレスと上記音声認識処理手段が指定されているか
    否かを示す第2のアドレスとからなる入出力アドレスを
    出力する制御手段とを備え、 上記選択手段は、上記制御手段からの第1のアドレスを
    デコードして実行中のアプリケーションに対応する記憶
    領域を選択するデコード手段を備えることを特徴とする
    音声認識装置。
JP7331669A 1995-12-20 1995-12-20 音声認識装置 Withdrawn JPH09171395A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7331669A JPH09171395A (ja) 1995-12-20 1995-12-20 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7331669A JPH09171395A (ja) 1995-12-20 1995-12-20 音声認識装置

Publications (1)

Publication Number Publication Date
JPH09171395A true JPH09171395A (ja) 1997-06-30

Family

ID=18246265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7331669A Withdrawn JPH09171395A (ja) 1995-12-20 1995-12-20 音声認識装置

Country Status (1)

Country Link
JP (1) JPH09171395A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099076A (ja) * 1998-09-25 2000-04-07 Fujitsu Ltd 音声認識を活用した実行環境設定装置及び方法
WO2007066433A1 (ja) * 2005-12-07 2007-06-14 Mitsubishi Electric Corporation 音声認識装置
WO2007138741A1 (ja) * 2006-05-26 2007-12-06 Nec Corporation 音声入力システム、対話型ロボット、音声入力方法、および、音声入力プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099076A (ja) * 1998-09-25 2000-04-07 Fujitsu Ltd 音声認識を活用した実行環境設定装置及び方法
WO2007066433A1 (ja) * 2005-12-07 2007-06-14 Mitsubishi Electric Corporation 音声認識装置
JPWO2007066433A1 (ja) * 2005-12-07 2009-05-14 三菱電機株式会社 音声認識装置
US8060368B2 (en) 2005-12-07 2011-11-15 Mitsubishi Electric Corporation Speech recognition apparatus
JP4846734B2 (ja) * 2005-12-07 2011-12-28 三菱電機株式会社 音声認識装置
WO2007138741A1 (ja) * 2006-05-26 2007-12-06 Nec Corporation 音声入力システム、対話型ロボット、音声入力方法、および、音声入力プログラム
US9135913B2 (en) 2006-05-26 2015-09-15 Nec Corporation Voice input system, interactive-type robot, voice input method, and voice input program

Similar Documents

Publication Publication Date Title
JP6570651B2 (ja) 音声対話装置および音声対話方法
US6347296B1 (en) Correcting speech recognition without first presenting alternatives
US6714223B2 (en) Interactive-type user interface device having root scenario
US6772412B2 (en) Data processing device equipped with a thread switching circuit
US20020123894A1 (en) Processing speech recognition errors in an embedded speech recognition system
JPS58195957A (ja) 音声によるプログラム実行方式
JP3278222B2 (ja) 情報処理方法及び装置
US20080177542A1 (en) Voice Recognition Program
JPS6146865B2 (ja)
EP3276616A1 (en) Speech recognition system, speech recognition device, speech recognition method, and control program
US6959279B1 (en) Text-to-speech conversion system on an integrated circuit
JP2002062891A (ja) 音素割当て方法
JP4503310B2 (ja) 電子機器制御装置
JPH09171395A (ja) 音声認識装置
EP0472193A2 (en) Translation device based on voice recognition and voice synthesis
JP2007193166A (ja) 対話装置、対話方法及びプログラム
JP2000250587A (ja) 音声認識装置及び音声認識翻訳装置
JP2022081790A (ja) 音声合成装置、音声合成方法、および音声合成プログラム
JPH07199989A (ja) 音声認識装置
JP4617494B2 (ja) 音声合成装置及び文字割当装置並びにコンピュータプログラム
JPS62124600A (ja) 音声認識装置
JP2685429B2 (ja) 音声認識装置
JP3402480B2 (ja) 文書朗読装置
KR20230006330A (ko) 전자 장치 및 이의 제어 방법
JPH07311591A (ja) 音声認識装置およびナビゲーションシステム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030304