JP2708566B2 - 音声認識制御装置 - Google Patents

音声認識制御装置

Info

Publication number
JP2708566B2
JP2708566B2 JP1229144A JP22914489A JP2708566B2 JP 2708566 B2 JP2708566 B2 JP 2708566B2 JP 1229144 A JP1229144 A JP 1229144A JP 22914489 A JP22914489 A JP 22914489A JP 2708566 B2 JP2708566 B2 JP 2708566B2
Authority
JP
Japan
Prior art keywords
voice
input
word
user
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1229144A
Other languages
English (en)
Other versions
JPH0392900A (ja
Inventor
哲夫 古谷
義注 太田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP1229144A priority Critical patent/JP2708566B2/ja
Publication of JPH0392900A publication Critical patent/JPH0392900A/ja
Application granted granted Critical
Publication of JP2708566B2 publication Critical patent/JP2708566B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は利用者の操作にもとずいて主装置の運転制御
を行う音声認識制御装置に係わり、特に利用者の発声入
力にもとずいて主装置の運転を行う音声認識制御装置に
関する。
〔従来の技術〕
従来の、利用者の音声入力にもとずき主装置の運転制
御を行う音声認識制御装置として、例えば特公平1−14
496号公報に記載の空調機の制御装置がある。
この制御装置は利用者があらかじめ所定の運転命令語
の音声を登録し、利用者が発声入力した音声と登録され
た音声データとを比較することにより、発声入力された
運転命令語を認識し、その運転命令語に対応する運転制
御を行う制御手段を有する。この装置は手動操作にもと
ずく制御手段も備え、音声入力と手動操作との切り替え
は、音声入力または手動操作によって行なわれる。
また他の例として、特公平1−23702号公報に記載の
空気調和機等の音声入力装置がある。これも利用者が発
声する運転命令語を認識し、これにもとずいて空調機の
運転制御を行うものである。ただし、周囲の雑音等によ
る誤動作を防ぐため、利用者の発声入力直前のボタン操
作により音声認識手段を動作させ、また音声認識手段の
動作、非動作の状態を表示し、利用者が適切なタイミン
グで発声入力ができるようにしている。
〔発明が解決しようとする課題〕
上記したように、前者の従来技術によれば、利用者は
空調機の制御手段として、音声入力または手動操作を自
由に選択することができる。
しかし、音声入力を選択した場合において、常時、音
声を入力しながら利用者の発声を検出することによる消
費電力の増加、音声入力手段、音声制御手段の演算処理
効率の低下、周囲の雑音等の誤認識による制御手段の誤
動作については配慮されていなかった。つまり、利用者
の発声入力を常時受け付けるために、音声入力手段は音
声を常時入力して音量の変化等から利用者の発声を検出
する方式となっている。このために、常時、音声入力手
段を動作させることにより消費電力が増加する。
また、常時、音声入力手段は入力音声信号を分析して
利用者の発声を検出する動作を行うため、時間平均の演
算処理量が増加する。つまり、他の演算処理を行う余裕
が少なくなり、演算処理効率が低下する。また、常時音
声を入力するため、利用者の運転命令語の発声以外の音
声を誤って利用者の発声入力として検出して運転命令語
と誤認識することにより、空調機が利用者の意図しない
誤動作を行う可能性がある。
また上記したように、後者の従来技術では前者の問題
点を解決すべく考案されたものである。
しかし、利用者が発声入力のさいにボタン操作を行う
ことによる使い勝手の低下が生じる。つまり、利用者が
所定のボタンを押すことにより音声認識部を動作させ、
利用者の発声入力程度の時間だけ音声の入力を行うこと
により上記の問題点を解決している。
しかし、利用者は発声入力の直前に必ず所定のボタン
を押さなければならず、これを失念して発声を行っても
音声は入力されず、所望の空調機の制御は行われない。
また利用者は上記ボタンの操作の直後、時間をおかずに
発声入力を行わなければならず、これを誤ると発声音声
が正しく入力されないことがあり、このため正しい認識
結果が得られず所望の空調機の制御が行われないことが
ある。つまり上記のような利用者の使い勝手の低下を避
けられない。
本発明の目的は、上記従来技術の問題点を解決し、利
用者の使い勝手がよく、かつ入力音声の誤認識による誤
動作や音声認識部の消費電力の増加、演算処理効率の低
下を生じない音声認識制御装置を提供することにある。
〔課題を解決するための手段〕
上記目的は以下の手段により達成することができる。
装置の操作器に音声入力部を設け、利用者は音声入力
部に向かって単語音声を発声入力する、まず、操作器ま
たは空調機本体には、入力音声信号の音量(つまり振幅
またはパワー)が所定値を越えたことを検出して、これ
を示す検出信号を出力する音量検出手段を設ける。そし
て、検出信号の入力により動作を開始する音声認識部を
設ける。音声認識部は音声信号を入力し、その特徴パラ
メータを抽出する。そして、特徴パラメータと、あらか
じめ登録した各単語音声の特徴パラメータの標準パター
ンとを比較演算して入力音声が表現する単語を認識し、
認識結果(つまり単語またはこれに対応する符号等)を
出力するものである。空調機本体の制御を行う制御部は
認識結果を入力し、これにもとずき空調機本体の制御を
行う。そして、前記標準パターンとする特徴パラメータ
も、音量検出手段からの検出信号により動作を開始する
特徴パラメータ抽出手段により抽出したものとする。
〔作用〕
音量検出手段は、入力音声信号の音量が所定値を越え
るとこれを示す検出信号を出力するので、利用者が音声
入力部に向かって単語音声を発声すると、入力音声信号
の音量は所定値を越え、これを示す検出信号が出力され
る。音声認識部は検出信号を入力するとその動作を開始
する。つまり、音声信号を入力してその特徴パラメータ
を抽出し、標準パターンとの比較演算を行う。つまり、
利用者が運転命令語を空調機の操作器に向かって発声入
力すると音声認識部が自動的に動作を開始し、運転命令
語の認識を行うので利用者は発声入力の際に特定のボタ
ン操作等を行う必要がない。
前記発声入力が行われない間は音声認識部は動作を行
わないので、常時、音声認識部を動作させて音声信号を
入力しながら音声入力を検出する方式に比べて、利用者
の発声入力が行われない間、音声認識部を動作させない
分だけ消費電力を低減でき、また、この間音声認識部の
演算処理装置に他の演算処理を行わせることができる。
そして、音量検出手段からの検出信号により起動され
る特徴パラメータ抽出手段により、単語音声の特徴パラ
メータを抽出して、これを音声認識の標準パラメータと
して登録している。よって、音声認識の際に、音量検出
手段が単語音声の先頭を検出するのに要する時間分だ
け、利用者の発声する単語音声の先頭部分が音声認識部
に入力されなくても、その音声信号の特徴パラメータと
比較演算を行う標準パターンも単語音声の先頭部分が同
じ時間分だけ欠けているものを用いているので、先頭部
分が欠けた単語音声と欠けていない単語音声との特徴パ
ラメータどうしが比較演算されることがなく、これによ
り認識誤り率が増加することがない。
〔実施例〕
以下、本発明による音声認識制御装置の一実施例とし
て空調機制御装置を第1図に示して説明する。
第1図において、音声認識部6はアナログ音声信号を
供給されてその特徴パラメータを演算抽出し、あらかじ
め登録した単語音声の特徴パラメータの標準パターンと
の比較演算を行って、音声信号がいずれの単語の音声で
あるかを識別して結果を出力するものである。これは、
例えば形名MN1263等の音声認識LSIや、形名μPD78214等
の汎用1チップ型マイクロプロセッサである。アナログ
音声信号はマイクロホン1より増幅器2を介して入力さ
れる。音量検出部5はアナログ音声信号を入力し、その
音声信号の音量例えば波形振幅やパワーが所定値を越え
ているか否かを検出し、これを示す検出信号を出力す
る。検出信号は音声認識部6に入力される。
キースイッチ3は利用者が空調機を操作するためのキ
ー入力を行う部分である。キー入力を示す信号はキーエ
ンコーダ4を介して制御部7に供給される。なお、操作
器18は利用者が空調機の操作のための入力を行う部分で
あり、空調機のリモコン等である。これはマイクロホン
1、増幅器2、キースイッチ3、キーエンコーダ4を含
む。空調機センサ13は空調機の室内機や室外機付近の温
度,湿度等を電気信号に変換するものである。そして、
電気信号はアナログ/ディジタル(A/D)変換器14、エ
ンコーダ15を介して制御部7に供給される。制御部7は
利用者の入力音声の認識結果、キー入力、および空調機
センサ13からの測定値にもとずいて、空調機機構部17の
動作を制御する部分である。これは例えば形名μPD7822
4等の汎用1チップ型マイクロプロセッサである。これ
は音声認識部6の動作の制御も行う。つまり、音声入力
等の動作を指示するコマンドを送信し、認識結果等の出
力情報を受信する。
空調機機構部17は空調機の室内機や室外機の空調動作
を行う部分であり、例えば圧縮機、送風ファン等であ
る。空調機駆動回路16は制御部7が出力する制御信号を
もとに空調機機構部17を動作させる電気信号を生成する
部分である。音声合成器8は符号化音声データを復号化
してアナログ音声信号を再生するものであり、音声信号
は増幅器9により増幅され、スピーカ10よって再生され
る。符号化音声データは音声合成器8の内部のメモリに
記録し、合成音声の番号を制御部7より入力すると、こ
れに対応する符号化音声データを復号化する。表示装置
12は文字等を画面表示するものであり、例えば液晶表示
パネル等である。これは制御装置7より出力される文字
コード等を、表示インタフェース回路11を介して供給さ
れて、これらをその画面に表示する。
ここで、音量検出器5の一具体例を第2図に示して説
明する。第2図(a)は音量検出器5の構成の一例を示
し、第2図(b)はその動作を示す。
第2図において、比較器5aは、入力したアナログ音声
信号と設定されたしきい値との大小関係を判定して、結
果を出力するものである。そして、上記のしきい値は、
例えば音声認識部6より第1のエンコーダ5cを介して与
えられる。入力音声信号と比較器5aの出力信号との関係
は第2図(b)に示すようになる。ただし、しきい値を
Thとする。パルスカウンタ5bはイネーブル信号が入力さ
れている期間だけパルス発生器5dの発生するパルス信号
の入力数をカウントし、カウント数がしきい値を越えた
か否かを示す検出信号を音声認識部6に出力する。しき
い値は例えば音声認識部6より第2のエンコーダ5eを介
して与えられる。また、パルスカウンタ5bは例えば音声
認識部6より第2のエンコーダ5eを介してリセットされ
る。このリセットは所定周期T毎に行われる。
上記イネーブル信号を比較器5aの出力信号とすれば、
第2図(b)に示すようにカウント数は出力信号のパル
ス幅の累積値に比例する。カウント数が所定値Nを越え
ると、検出信号は1となり、そうでない間は0となる。
つまり、所定周期T以内にカウント数がNを越えれば、
検出信号は1となる。つまり、パルス幅は入力音声波形
が所定値Thを越えた時間であるから、その累計値が所定
時間T以内に一定値を越えたことにより、入力音声の音
量が一定値を越えたものとし、これにより利用者の発声
入力の開始を検出する。ただし、第2図(b)に示すよ
うに、実際の利用者の発声入力の開始時点t1と発声入力
の検出時点t2との間に時間差が存在する。
なお、ここでは入力音声信号の振幅をもとに音量を検
出する例について説明したが、入力音声信号のパワーを
もとに音量を検出する場合は、入力音声信号のパワーを
リアルタイムで検出して出力するパワー検出器(図示せ
ず)を比較器5−aの前に挿入して入力音声信号のパワ
ーの一定しきい値との大小関係を比較する。
次に、音声認識部6の一例を第3図に示して説明す
る。
第3図において、演算部6dは、あらかじめ第1のメモ
リ6bに記録されたプログラムに従って、演算を行う部分
である。これは入力音声信号の特徴パラメータの抽出、
標準パラメータとの比較演算等を行う。第1のメモリ6b
はプログラム、データを半永久的に記録するものであ
り、汎用ROM(リードオンリメモリ)等である。第2の
メモリ6cはデータを一時的に記録する書き換え可能なメ
モリであり、汎用RAM等である。入出力部6aは外部のデ
ィジタル信号を演算部6dに入出力するインタフェースで
ある。これはA/D変換器を含む。入力音声信号はA/D端子
6eによりA/D変換器に入力され、ディジタル音声信号に
変換される。音量検出部5との検出信号等の入出力は、
入出力端子6gを用いて行われる。入出力部6aは演算部6d
の割込起動インタフェースを含み、音量検出部5からの
検出信号により演算部6dを起動することができる。ま
た、制御部7とのコマンド、データの送受信は通信端子
6hより行う。
次に、制御部7の一具体例を第4図に示して説明す
る。
第4図において、演算部7cは、あらかじめ第1のメモ
リ7aに記録されたプログラムに従って、演算を行う部分
である。第1のメモリ7aはプログラム、データを半永久
的に記録するものであり、汎用ROM等である。第2のメ
モリ7bはデータを一時的に記録する書き換え可能なメモ
リであり、例えば汎用RAM(ランダムアクセスメモリ)
等である。入出力部7dは外部のディジタル信号を演算部
7cに入出力するインタフェースである。音声認識部6と
のコマンド、データの送受信は通信端子7eより行う。
ここで、再び第1図に戻って説明する。まず、単語音
声の特徴パラメータの標準パターンを登録する場合にお
ける制御部7の動作を第5図のフローチャートを参照し
ながら説明する。
利用者がキースイッチ3の「登録」キーを押すことに
より、標準パターンの登録の動作を開始する。制御部7
は「登録」キーの押下げを示す信号を入力すると(ステ
ップS1)、例えば「『おんど』と言って下さい。」等
の、利用者の単語音声発声を促すガイダンスを表示また
は発声する。つまり、上記内容の文字列を表示装置12上
に表示するか、上記内容の音声を音声合成器8により再
生する(ステップS2)。そして、制御部7は、「入力」
コマンドを音声認識部6に送信する。音声認識部6はこ
れを受信して、音声の入力、特徴パラメータの抽出を行
う。ここで、利用者は「おんど」等と単語音声を発声す
る(ステップS3)。
音声認識部6からの終了信号を受信すると(ステップ
S4)、制御部7は「登録」コマンド、登録単語番号を音
声認識部6に送信する。音声認識部6はこれを受信し
て、抽出した特徴パラメータを単語音声の標準パターン
として登録する。つまり、音声認識部6の第2のメモリ
6−c上で、特徴パラメータを登録単語番号に対応する
アドレスに転送する(ステップS5)。そして、終了信号
を音声認識部6より受信すると(ステップS6)、制御部
7は他に登録する単語音声があれば、ガイダンスの表示
または発声に戻り、全単語音声の登録を完了すれば(ス
テップS7)登録の動作を終了する。
次に、音声認識部6の、制御部7からの各コマンドに
対応する動作を第6図のフローチャートを参照しながら
説明する。「入力」コマンドに対応する音声認識部6の
動作を第6図(a)に示す。
音声認識部6は制御部7より「入力」コマンドを受信
すると、音量検出器5からの検出信号(つまり、利用者
の発声入力の開始の検出を示す信号)の発生に対して待
機する。検出信号を入力すると(ステップQ1)、音声認
識部6は入力音声信号をA/D変換し、さらに、音声の特
徴パラメータをリアルタイムで抽出し、第2のメモリ6c
に記録する(ステップQ2)。入力音声の音量が下がり音
量検出部5からの検出信号が所定時間以上中断すると、
音声認識部6はこれを単語音声の終点を検出したものと
して(ステップQ3)、その時点での第2のメモリ上の特
徴パラメータの記録アドレスを単語終点アドレスとして
保持する(ステップQ4)。そして、終了信号を制御部7
に送信する。
また、「登録」コマンドに対応する音声認識部6の動
作を第6図(b)に示す。
音声認識部6は登録する単語音声の単語グループ番
号、グループ内の単語番号を制御部7より受信する。単
語グループとは、同時に認識の対象となる単語の集合で
ある。なお、その具体例については後に説明する(ステ
ップQ11)。そして、音声認識部6は、第2のメモリ6c
上で、抽出した特徴パラメータを、上記単語グループ番
号、単語番号に対応する標準パターンの登録領域に転送
する。つまり、転送元の先頭アドレスは抽出した特徴パ
ラメータの先頭に設定し、転送先の先頭アドレスは登録
領域の先頭に設定する(ステップQ12)。そして、音声
認識部6は特徴パラメータを順次転送し、一回の転送毎
に転送元、転送先のアドレスを一回の転送データ量分だ
け増加する(ステップQ13)。単語音声の終点まで特徴
パラメータを転送し、転送元アドレスが前記の単語終点
アドレスに一致すると(ステップQ14)、音声認識部6
は終了信号を制御部7に送信する(ステップQ15)。
次に、「整合」コマンドに対応する音声認識部6の動
作を第6図(c)に示す。
「整合」コマンドは「入力」コマンドにより抽出した
入力音声の特徴パラメータと、あらかじめ登録した単語
音声の特徴パラメータの標準パターンとの比較演算を音
声標識部6に指示するコマンドである。音声認識部6は
比較演算の結果をもとに、入力音声と特徴パラメータの
相違度が最も小さい標準パターンの単語の番号を入力音
声の認識結果として送信する。まず、認識の対象とする
単語グループの番号を制御部7より入力する。特徴パラ
メータの比較演算は入力パターンと、単語グループに属
する全単語の標準パターンとの間で行われる(ステップ
Q21)。そして、音声認識部6は入力パターン(つま
り、入力音声信号から抽出した特徴パラメータ)と、あ
らかじめ登録された単語音声の特徴パラメータの標準パ
ターンとの比較演算を行う。つまり、入力パターンと標
準パターンとの特徴パラメータどうしを先頭から順次比
較演算し、結果を累積加算していく。
まず、入力パターンと標準パターンとで比較演算を行
う特徴パラメータのアドレスを、各々のパターンの先頭
アドレスに初期設定する(ステップQ22)。そして、特
徴パラメータどうしを順次比較演算して結果を累積加算
し、比較演算を行うアドレスを増加していく(ステップ
Q23)。単語音声の終点まで特徴パラメータを比較し終
わり、比較演算を行うアドレスが単語終点アドレスに一
致すると(ステップQ24)、音声認識部6は累積加算値
を入力パターンと標準パターンとの相違度として保持す
る。
また、単語グループの全単語音声の標準パターンとの
比較演算を終了すると(ステップQ25)、保持している
相違度を比較し、最小の相違度を与える標準パターンの
単語の番号を制御部7に送信する(ステップQ26)。な
お、入力パターンと標準パターンとの単語音声時間長が
異なる場合にひ、単語音声時間の長い方のパターンを均
等に間引く等して両パターンの単語音声時間長を合わせ
て比較演算を行う。また、上記した相違度どうしを比較
する際に、単語音声時間当たりの相違度として比較す
る。
次に、利用者の発声する単語音声を認識して空調機の
制御を行う場合の制御部7の動作を第7図のフローチャ
ートを参照しながら説明する。
第7図において、制御部7は「入力」コマンドを音声
認識部6に送信しておき、利用者の発声入力を待機させ
る(ステップu1)。利用者が単語グループ1のいずれか
の単語音声の発声入力を行って音声認識部6からの終了
信号を受信すると(ステップu2)、制御部7は「整合」
コマンドおよび単語グループ番号1を音声認識部6に送
信する。単語グループ番号1に属する単語は「停止」、
「温度」、「風量」の3個であり、それぞれ単語グルー
プ内の単語番号を1,2,3とする。音声認識部6は利用者
の発声音声から抽出した特徴パラメータと、「停止」、
「温度」、「風量」の各単語音声の特徴パラメータの標
準パターンとの相違度を計算し、最小相違度を与える単
語の番号を認識結果とする(ステップu3)。
そして、音声認識部6からの終了信号および認識結果
を受信すると(ステップu4)、制御部7は認識結果が
「停止」であれば空調機を停止する(ステップu6)。
「停止」以外であれば制御部7は空調機が停止中の場合
(ステップu7)、内部に保持している前回に設定された
目標温度、風量で空調機の運転を開始する(ステップu
8)。そして、必要により運転状態を例えば「25℃、弱
風で冷房運転を行います。」のように表示または発声し
て利用者に知らせる(ステップu9)。そして、制御部7
は利用者に単語グループ番号2の単語(つまり、「高
く」または「低く」)の発声を促すガイダンスを表示ま
たは発声する(ステップu10)。そして、制御部7は
「入力」コマンドを音声認識部6に送信し、利用者の発
声入力を待機させる(ステップu11)。利用者は、設定
温度または風量を変更したい場合には「高く」または
「低く」と発声し、変更の必要がない場合には何も発声
しない。利用者の発声がなく、音声認識部6からの終了
信号を一定時間以内に受信しない場合(ステップu13)
には、制御部7は「入力」コマンドを送信し、再び音声
認識部6に単語グループ番号1の単語の発声入力を待機
させる(ステップu20)。
利用者が発声を行い、音声認識部6からの終了信号を
受信すると(ステップu12)、制御部7は「整合」コマ
ンドおよび単語グループ番号2を音声認識部6に送信す
る。単語グループ番号2に属する単語は「高く」、「低
く」の2個であり、それぞれ単語グループ内の単語番号
を1,2とする(ステップu14)。音声認識部6からの終了
信号および認識結果を受信すると(ステップu15)、制
御部7は認識結果が「高く」か「低く」かに従って(ス
テップu17)設定温度または風量を所定分上昇または下
降する(ステップu17,u18)。そして、制御部7は「入
力」コマンドを送信し再び音声認識部6に単語グループ
番号1の単語の発声入力を待機させる(ステップu2
0)。
本実施例によれば、音量検出部5により入力音声信号
の音量を検出することにより、利用者の発声入力の開始
を検出し、検出を示す検出信号により音声認識部6を起
動しているので、利用者が発声入力の直前に特定のキー
入力等を行わなくても音声認識部6を起動することがで
きる。
また、利用者が発声を行わない間は音声認識部6の動
作を停止して消費電力を低減するか、音声認識部6の演
算部6dに他の演算処理を行わせることができる。
また、利用者が意識的に操作器18のマイクロホン1に
向かって発声をしない限り音声認識部6は音声入力を行
わないので、音声認識部6が背景雑音等を誤って認識し
て意図しない空調機の制御が行われることがない。
また、音量検出部5により先頭を検出して入力した単
語音声から抽出した特徴パラメータを標準パターンとし
て登録しているので、音声認識時に音量検出部5が単語
音声の先頭を検出するのに要する時間分だけ、単語音声
の先頭部分が入力されなくても、標準パターンも同様に
先頭部分が入力されていない単語音声のものを用いてい
るので、先頭部分が欠落した入力パターンと欠落してい
ない標準パターンとを整合することにより認識率が低下
することがない。
次に、音量検出部5の比較器5aにおけるしきい値を可
変とすることにより、発声入力検出と特徴パラメータの
抽出とを兼用させる場合の一例について、第2図、第8
図を参照しながら説明する。ここでは、音声の特徴パラ
メータとして比較器5aの出力信号の統計的性質(例えば
一定時間内のパルス数やパルス幅の分類状況等)を用い
る。
音量検出器5の比較器5aにおける波形交差検出のしき
い値を最初、発声入力検出用の高い値Th1に設定する。
音量検出器5が利用者の発声入力を検出して検出信号を
出力すると、音声認識部6はこれを入力して音声信号の
入力を開始すると同時に、上記波形交差のしきい値を特
徴パラメータ抽出用の低い値Th2に変更する。以後、音
量検出器5のパルスカウンタ5bはパルスが1個生じる毎
に、パルス幅のカウント数を出力し、音声認識部6はこ
れを入力して統計処理して入力音声の特徴パラメータと
する。
本実施例では音量検出器5の機構を利用して入力音声
の特徴パラメータのもとになる情報を抽出し、音声認識
部6の演算部6dの、特徴パラメータ抽出のための演算量
を低減している。
また、音量検出部5により先頭を検出し、検出に要す
る時間分だけ先頭部分を欠落させた単語音声の特徴パラ
メータを認識の標準パターンとして登録する方法につい
て説明したが、入力した単語音声の先頭部分を上記時間
分だけ意図的に除外して特徴パラメータ抽出してこれを
標準パターンとして登録するか、単語音声から抽出した
特徴パラメータの先頭部分を上記時間相当分だけ除外し
て登録してもよい。
また入力パターンと標準パターンとの比較演算の際に
標準パターンの先頭部分を上記時間分だけ除外して比較
演算をしてもよい。
本発明は空調機以外にも、利用者の発声入力する単語
音声を認識した結果にものずいて制御を行う全ての装置
に適用できる。
〔発明の効果〕
以上説明したように、本発明によれば、入力音声信号
の音量変化により利用者の発声入力を自動的に検出して
音声認識部を起動しているので、利用者が発声入力の直
前に特定のキー入力等を行う事なく、利用者の発声入力
に合わせて音声認識部を起動することができる。よっ
て、利用者の使い勝手の向上を図ることができる。
また、音声認識部を常時動作させて利用者の発声入力
を検知する方式に比べて音声認識部の消費電力を低減す
るか、音声認識部の待機時に他の演算処理を行わせるこ
とができる。
さらに、発声入力の検出に要する時間分だけ単語音声
の先頭が入力されなくても、音声認識の標準パターンも
同様に単語音声の先頭が入力されていない単語音声のも
のを用いているので、発声音声の先頭部分の欠落により
音声の認識率が低下することがない。
【図面の簡単な説明】
第1図は本発明による音声認識制御装置の一実施例を示
すブロック図、第2図は音量検出部の一構成例を示す
図、第3図は音声認識部の一構成例を示す図、第4図は
制御部の一構成例を示す図、第5図は音声登録時の制御
部の動作の一例を示すフローチャート、第6図は音声認
識部の動作の一例を示すフローチャート、第7図は音声
認識時の制御部の動作の一例を示すフローチャート、第
8図は音量検出部の比較器のしきい値を可変として発声
入力検出と特徴パラメータ抽出とを兼用させる場合の一
例を示す図である。 1……マイクロホン、3……キースイッチ、4……キー
エンコーダ、5……音量検出部、6……音声認識部、7
……制御部、8……音声合成器、10……スピーカ、11…
…表示インタフェース、12……表示装置、13……空調機
センサ、14……A/D変換器、15……エンコーダ、16……
空調機駆動回路、17……空調機機構部、18……操作器、
5b……パルスカウンタ、5c……第1のデコーダ、5d……
パルス発生器、5e……第2のデコーダ、6b……第1のメ
モリ、6c……第2のメモリ、6d……演算部、7a……第1
のメモリ、7b……第2のメモリ、7c……演算部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】利用者の運転操作にもとずき装置の運転制
    御を行う音声認識制御装置において、利用者が発声する
    運転命令語の音声を入力する音声入力手段と、 該音声入力手段からの音声の音量より前記発声の開始を
    検出して検出信号を出力する音量検出手段と、 前記入力された音声の特徴量を標準パターンとして登録
    する登録手段と、 前記入力された音声の特徴量を抽出して前記登録された
    標準パターンと比較することにより、前記運転命令語を
    認識して認識結果の信号を出力する音声認識手段と、 前記認識結果にもとずいて、装置の運転制御を行う制御
    手段とを具備し、 前記登録手段は、前記音量検出手段が前記発声の開始を
    検出するための所要時間分だけ、前記運転命令語の音声
    の先頭部分を除外して登録することを特徴とする音声認
    識制御装置。
JP1229144A 1989-09-06 1989-09-06 音声認識制御装置 Expired - Lifetime JP2708566B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1229144A JP2708566B2 (ja) 1989-09-06 1989-09-06 音声認識制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1229144A JP2708566B2 (ja) 1989-09-06 1989-09-06 音声認識制御装置

Publications (2)

Publication Number Publication Date
JPH0392900A JPH0392900A (ja) 1991-04-18
JP2708566B2 true JP2708566B2 (ja) 1998-02-04

Family

ID=16887457

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1229144A Expired - Lifetime JP2708566B2 (ja) 1989-09-06 1989-09-06 音声認識制御装置

Country Status (1)

Country Link
JP (1) JP2708566B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101433506B1 (ko) * 2013-01-29 2014-08-22 엘에스산전 주식회사 고립어 음성 인식을 이용한 에너지 관리 시스템의 운전 방법

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4667082B2 (ja) * 2005-03-09 2011-04-06 キヤノン株式会社 音声認識方法
CN109708256B (zh) * 2018-12-06 2020-07-03 珠海格力电器股份有限公司 一种语音确定方法、装置、存储介质及空调

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5855990A (ja) * 1981-09-29 1983-04-02 株式会社東芝 音声認識装置
JPS61113100A (ja) * 1984-11-08 1986-05-30 ヤマハ株式会社 音声パラメ−タ検出装置
JPH06100919B2 (ja) * 1986-07-03 1994-12-12 松下電器産業株式会社 音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101433506B1 (ko) * 2013-01-29 2014-08-22 엘에스산전 주식회사 고립어 음성 인식을 이용한 에너지 관리 시스템의 운전 방법

Also Published As

Publication number Publication date
JPH0392900A (ja) 1991-04-18

Similar Documents

Publication Publication Date Title
US11011172B2 (en) Electronic device and voice recognition method thereof
JP4304952B2 (ja) 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム
JP4109414B2 (ja) 音声認識を用いた機器制御方法および音声認識を用いた機器制御システムならびに音声認識を用いた機器制御プログラムを記録した記録媒体
JP3284832B2 (ja) 音声認識対話処理方法および音声認識対話装置
US20030018479A1 (en) Electronic appliance capable of preventing malfunction in speech recognition and improving the speech recognition rate
EP0077194B1 (en) Speech recognition system
JPH0962293A (ja) 音声認識対話装置および音声認識対話処理方法
US20050182631A1 (en) Voice message recording and playing method using voice recognition
CN113593544A (zh) 设备的控制方法和装置、存储介质及电子装置
JP2708566B2 (ja) 音声認識制御装置
CN109271480B (zh) 一种语音搜题方法及电子设备
JPH03284589A (ja) エレベータの音声登録装置
JP2008268517A (ja) 音声認識機能付き操作器
JPH11143485A (ja) 音声認識方法及び音声認識装置
JP2003131695A (ja) 音声認識機器、音声認識機器制御装置、及び音声認識機器制御方法
CN112581950A (zh) 空调器的语音控制方法、装置及存储介质
KR100423495B1 (ko) 음성인식에 의한 휴대용 기기의 동작제어 장치 및 방법
JP3034872B2 (ja) 音声命令認識装置及び音声命令認識方法
KR20140118588A (ko) 음성녹음을 이용한 음성인식 제어시스템 및 그 제어방법
KR20150068010A (ko) 스마트 가전제품, 그 작동방법 및 스마트 가전제품을 이용한 음성인식 시스템
US11984119B2 (en) Electronic device and voice recognition method thereof
JPH0451299A (ja) 音声認識制御装置
CN1971662A (zh) 对存储在点读机中内容进行播放的控制方法
JP2634915B2 (ja) 空調機の制御装置
JP2000075896A (ja) 音声認識制御装置