JPS61246798A - 音声応答スイツチ - Google Patents
音声応答スイツチInfo
- Publication number
- JPS61246798A JPS61246798A JP60089373A JP8937385A JPS61246798A JP S61246798 A JPS61246798 A JP S61246798A JP 60089373 A JP60089373 A JP 60089373A JP 8937385 A JP8937385 A JP 8937385A JP S61246798 A JPS61246798 A JP S61246798A
- Authority
- JP
- Japan
- Prior art keywords
- circuit
- vector
- voice
- formant
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Electronic Switches (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
【技術分野1
本発明は音声応答スイッチ、さらに詳しくは、人の音声
を認識して作動する音声応答スイッチに関するものであ
る。
を認識して作動する音声応答スイッチに関するものであ
る。
[背景技術]
従来より音声応答スイッチとしては、第8図に示すよう
に、音声に相当する周波数帯域の入力信号を通過させる
フィルタ回路11と、フィルタ回路11の出力レベルを
検出するレベル検出回路12と、レベル検出回路12の
出力を予め設定された参照値と比較しレベル検出回路1
2の出力が参照値以上であるときに制御信号を出力する
制御回路13と、制御信号により開閉されるスイッチ要
素14とから構成されており、制御回路13への入力レ
ベルが参照値以上であるときにフィルタ回路11への入
力信号が音声信号であると判断するものが提供されてい
る。
に、音声に相当する周波数帯域の入力信号を通過させる
フィルタ回路11と、フィルタ回路11の出力レベルを
検出するレベル検出回路12と、レベル検出回路12の
出力を予め設定された参照値と比較しレベル検出回路1
2の出力が参照値以上であるときに制御信号を出力する
制御回路13と、制御信号により開閉されるスイッチ要
素14とから構成されており、制御回路13への入力レ
ベルが参照値以上であるときにフィルタ回路11への入
力信号が音声信号であると判断するものが提供されてい
る。
この回路構成においては、特定の周波数帯域のレベル判
定のみで音声であるかどうかを判別しているものである
から、フィルタ回路11を通過できる帯域の周波数成分
を持ちかつ参照値よりも高いレベルの入力信号であれば
音声ではない雑音であってもスイッチ要素14が作動す
ることになり、誤動作を生じるという問題がある。*た
音声が入力されている場合でも、それがスイッチ要素1
4を作動させる目的で発せられた音声であるかどうかに
かかわらずスイッチ要素14が作動するから、スイッチ
要素14の作動を希望しないときスイッチ要素14が作
動することがあるという不都合が生じるものである。
定のみで音声であるかどうかを判別しているものである
から、フィルタ回路11を通過できる帯域の周波数成分
を持ちかつ参照値よりも高いレベルの入力信号であれば
音声ではない雑音であってもスイッチ要素14が作動す
ることになり、誤動作を生じるという問題がある。*た
音声が入力されている場合でも、それがスイッチ要素1
4を作動させる目的で発せられた音声であるかどうかに
かかわらずスイッチ要素14が作動するから、スイッチ
要素14の作動を希望しないときスイッチ要素14が作
動することがあるという不都合が生じるものである。
このため、第9図に示すように、音声認識装置15を用
い、記憶部16に予め記憶された制御音声と入力信号と
を比較し、両者が一致したときにスイッチ要素3を開閉
させるものが考えられているが、不特定話者を対象とす
る場合には、音声認識のための演算処理に長い時間が必
要となり実時間でスイッチ要素14を制御することが困
難であるという問題があり、しかも現在の技術レベルで
は一般に認識率が低く誤動作しやすいという問題がある
。そして、認識率を高めるには情報量と計算量が多くな
るものであるから一層処理時間が遅れるという欠点があ
る。これに対して特定話者を対象とする場合には、使用
前に使用者自身の声を登録する必要があり、使用までの
作業が面倒である。また、会話のように音声を連続して
発生する場合に、発音器官が滑らかに運動して調音され
るものであるから、隣接する音素間において調音結合が
生じ、この調音結合により音素が変化することがある。
い、記憶部16に予め記憶された制御音声と入力信号と
を比較し、両者が一致したときにスイッチ要素3を開閉
させるものが考えられているが、不特定話者を対象とす
る場合には、音声認識のための演算処理に長い時間が必
要となり実時間でスイッチ要素14を制御することが困
難であるという問題があり、しかも現在の技術レベルで
は一般に認識率が低く誤動作しやすいという問題がある
。そして、認識率を高めるには情報量と計算量が多くな
るものであるから一層処理時間が遅れるという欠点があ
る。これに対して特定話者を対象とする場合には、使用
前に使用者自身の声を登録する必要があり、使用までの
作業が面倒である。また、会話のように音声を連続して
発生する場合に、発音器官が滑らかに運動して調音され
るものであるから、隣接する音素間において調音結合が
生じ、この調音結合により音素が変化することがある。
つまり、/+ta*;/と発音するときに発音器官は/
i/の発音と/&/の発音との中間音である/e/の発
音に対応した位置を通過するものであるから、通常の会
話程度の速度で発音すると、/i、e。
i/の発音と/&/の発音との中間音である/e/の発
音に対応した位置を通過するものであるから、通常の会
話程度の速度で発音すると、/i、e。
i/に近い音声となり、音声認識装置15では誤認が生
じるものである。
じるものである。
[発明の目的J
゛本発明は上述の点に鑑みて為されたものであって、そ
の主な目的とするところは、音声のうちの母音を特徴づ
けている優勢な周波数成分である複数のフォルマントを
神出し、各フォルマントを軸とするベクトル空間(また
は平面)におけるベクトルの移動によりスイッチ要素を
作動させるかどうかを判別するようにしたことにより、
実時間で動作可能で認識率が高く、しかも不特定話者を
対象として使用で終る音声応答イッチを提供することに
あり、他の目的とするところは、入力する音声の発生タ
イミングを指定することにより、音素間における調音の
結合を防止して入力音声の誤認識が生じないようにした
音声応答スイッチを提供することにある。
の主な目的とするところは、音声のうちの母音を特徴づ
けている優勢な周波数成分である複数のフォルマントを
神出し、各フォルマントを軸とするベクトル空間(また
は平面)におけるベクトルの移動によりスイッチ要素を
作動させるかどうかを判別するようにしたことにより、
実時間で動作可能で認識率が高く、しかも不特定話者を
対象として使用で終る音声応答イッチを提供することに
あり、他の目的とするところは、入力する音声の発生タ
イミングを指定することにより、音素間における調音の
結合を防止して入力音声の誤認識が生じないようにした
音声応答スイッチを提供することにある。
[発明の開示]
第5図は母音のスペクトルの一例を示すものであって、
母音を特徴づける優勢な周波数成分、すなわち、スペク
トルのピーク部分の周波数成分がフォルマントと呼ばれ
る。一般に母音には複数のフォルマントが存在し、周波
数の低いほうから順に第17オルマン)Fl、12フォ
ルマントF2、第3フォルマントF3%・・・・・・と
呼ばれる。これらのフォルマントのうち第17オルマン
)FIとM27オルマン)F2との寄与率がもっとも高
く、第17オルマン)F、とM27オルマン)F2.1
用いればかなり高い確度で母音を決定で終るものである
。
母音を特徴づける優勢な周波数成分、すなわち、スペク
トルのピーク部分の周波数成分がフォルマントと呼ばれ
る。一般に母音には複数のフォルマントが存在し、周波
数の低いほうから順に第17オルマン)Fl、12フォ
ルマントF2、第3フォルマントF3%・・・・・・と
呼ばれる。これらのフォルマントのうち第17オルマン
)FIとM27オルマン)F2との寄与率がもっとも高
く、第17オルマン)F、とM27オルマン)F2.1
用いればかなり高い確度で母音を決定で終るものである
。
ここで第1フォルマントFIを横軸にとり、第27オル
マン)F2を縦軸にとったF、−F2ベクトル平面上で
日本語の母音/a// i//u//e/10/を示す
と、各母音は第4図の破線で示す範囲で表わされる。フ
ォルマントは各個人の声道長などによりかなり変動する
ものであって、F、−F2平面上である程度の広がりを
もって表わされるものであり、各母音を表わす範囲同士
がかなりの部分で重複するものであるが、一般に同一環
境で同一人物の発した5母音のフォルマントはF+Fz
平面上において略5角形となり、環境が変化したり、発
話者が変わっても5母音の相対的位置関係、すなわちこ
の5角形の形状は保持されたままで平行移動することが
知られている。したがって、母音が変化したときの相対
位置、すなわち変化ベクトルは環境や発話者がかわって
も略一定になる。つまり、母音/a/のベクトル成分を
(800Hz、1800H2)とし母音10/のベクト
ル成分を(500Hzy 1000 Hz)とすると、
/a/から10/への変化ベクトルの成分は(−300
Hz、−800Hz)となり、変化ベクトルの成分は環
境や発話者が異なっていても略一定になるのである。し
かして、本発明においては、複数の母音を連続させて制
御音声を構成し、各母音間での変化ベクトルを監視する
ことによって入力信号が予め設定された制御音声と一致
するかどうかを判定し、入力信号が制御音声と一致する
とスイッチ要素を開閉する音声応答スイッチを開示する
。なお、以下の説明においては、第1フォルマントF、
と第2フォルマントF2とを使用して音声の認識を行な
っているが、さらに認識率を高めるために、第3フォル
マントF、をベクトルの第3成分としで用いてもよく、
一般にF1F’2 Fsベクトル空間上で各母音を表わ
せば、各母音間の重複部号が除去されるものであるから
、検出確度が一層向上するものである。
マン)F2を縦軸にとったF、−F2ベクトル平面上で
日本語の母音/a// i//u//e/10/を示す
と、各母音は第4図の破線で示す範囲で表わされる。フ
ォルマントは各個人の声道長などによりかなり変動する
ものであって、F、−F2平面上である程度の広がりを
もって表わされるものであり、各母音を表わす範囲同士
がかなりの部分で重複するものであるが、一般に同一環
境で同一人物の発した5母音のフォルマントはF+Fz
平面上において略5角形となり、環境が変化したり、発
話者が変わっても5母音の相対的位置関係、すなわちこ
の5角形の形状は保持されたままで平行移動することが
知られている。したがって、母音が変化したときの相対
位置、すなわち変化ベクトルは環境や発話者がかわって
も略一定になる。つまり、母音/a/のベクトル成分を
(800Hz、1800H2)とし母音10/のベクト
ル成分を(500Hzy 1000 Hz)とすると、
/a/から10/への変化ベクトルの成分は(−300
Hz、−800Hz)となり、変化ベクトルの成分は環
境や発話者が異なっていても略一定になるのである。し
かして、本発明においては、複数の母音を連続させて制
御音声を構成し、各母音間での変化ベクトルを監視する
ことによって入力信号が予め設定された制御音声と一致
するかどうかを判定し、入力信号が制御音声と一致する
とスイッチ要素を開閉する音声応答スイッチを開示する
。なお、以下の説明においては、第1フォルマントF、
と第2フォルマントF2とを使用して音声の認識を行な
っているが、さらに認識率を高めるために、第3フォル
マントF、をベクトルの第3成分としで用いてもよく、
一般にF1F’2 Fsベクトル空間上で各母音を表わ
せば、各母音間の重複部号が除去されるものであるから
、検出確度が一層向上するものである。
(実施例)
第1図に示すように、音声信号はフォルマント抽出回路
1に入力され第1フォルマントF、と第2フォルマント
F2とが抽出される。フォルマント抽出回路1の出力は
制御音声判別回路2に入力され、入力信号が予め設定さ
れた制御音声と一致したと判断されると制御信号が出力
されるようになっている。制御音声判別回路2の出力は
スイッチ要素3に入力され、スイッチ要素3に制御信号
が入力されるとスイッチ要素3が開閉される。フォルマ
ント抽出回路1への入力部には第6図に示すようなタイ
ミング指示手段としてのタイミング設定回路4が設けら
れている。タイミング設定回路4はマイクロフォン5よ
り入力される音声の発生タイミングを設定する発振回路
41と、マイクロフォン5とフォルマント抽出回路2と
の間に挿入され発振回路41の出力に同期して開閉され
るスイッチ回路42と、発振回路41の出力に同期して
点滅する発光ダイオード43を備えた点滅回路44とか
ら構成される。ここで発光ダイオード43は発振回路4
1の出力に対応して点滅するものであり、発光ダイオー
ド43が点灯すると同時にスイッチ回路42が閉成し、
第7図(b)に示すように発光ダイオード43が次に点
灯するまでの所定の期間スイッチ回路42は閉成した状
態に保たれるのである。
1に入力され第1フォルマントF、と第2フォルマント
F2とが抽出される。フォルマント抽出回路1の出力は
制御音声判別回路2に入力され、入力信号が予め設定さ
れた制御音声と一致したと判断されると制御信号が出力
されるようになっている。制御音声判別回路2の出力は
スイッチ要素3に入力され、スイッチ要素3に制御信号
が入力されるとスイッチ要素3が開閉される。フォルマ
ント抽出回路1への入力部には第6図に示すようなタイ
ミング指示手段としてのタイミング設定回路4が設けら
れている。タイミング設定回路4はマイクロフォン5よ
り入力される音声の発生タイミングを設定する発振回路
41と、マイクロフォン5とフォルマント抽出回路2と
の間に挿入され発振回路41の出力に同期して開閉され
るスイッチ回路42と、発振回路41の出力に同期して
点滅する発光ダイオード43を備えた点滅回路44とか
ら構成される。ここで発光ダイオード43は発振回路4
1の出力に対応して点滅するものであり、発光ダイオー
ド43が点灯すると同時にスイッチ回路42が閉成し、
第7図(b)に示すように発光ダイオード43が次に点
灯するまでの所定の期間スイッチ回路42は閉成した状
態に保たれるのである。
第2図にフォルマント抽出回路1の一例を示す。
フォルマント抽出回路1はそれぞれ200Hzの帯域中
を有し通過周波数が互いに異なる多数の帯域フィルタ1
1.〜llnよりなる帯域フィルタ群と、各帯域フィル
タ11.〜llnの出力信号をデジタル信号に変換する
アナログ/デジタル変換回路12と、各帯域フィルタ1
11〜llnの出力レベル値からフォルマントを検出す
るマイクロプロセッサ等からなる演算回路13とから構
成される。
を有し通過周波数が互いに異なる多数の帯域フィルタ1
1.〜llnよりなる帯域フィルタ群と、各帯域フィル
タ11.〜llnの出力信号をデジタル信号に変換する
アナログ/デジタル変換回路12と、各帯域フィルタ1
11〜llnの出力レベル値からフォルマントを検出す
るマイクロプロセッサ等からなる演算回路13とから構
成される。
帯域フィルタ11.〜11nはそれぞれθ〜200Hz
、 200−400 Hz、 400〜600 Hz。
、 200−400 Hz、 400〜600 Hz。
・・・・・−12200〜2400Hz、・・・・・・
と通過周波数帯域が互いに異なるとともに、全帯域フィ
ルタ11、〜llnを合わせると音声帯域の全周波数が
通過できるように設定されている。演算回路13J!第
17オルマン) F、、!:12フォルマントF2とを
検出するとともに、入力音声が変化したかどうかを判定
する音韻変化信号を出力する。なお、フォルマントの抽
出は回路構成によってハード的に行なっているが、線形
予測法などのソフト的な手法を用いて行なってもよい。
と通過周波数帯域が互いに異なるとともに、全帯域フィ
ルタ11、〜llnを合わせると音声帯域の全周波数が
通過できるように設定されている。演算回路13J!第
17オルマン) F、、!:12フォルマントF2とを
検出するとともに、入力音声が変化したかどうかを判定
する音韻変化信号を出力する。なお、フォルマントの抽
出は回路構成によってハード的に行なっているが、線形
予測法などのソフト的な手法を用いて行なってもよい。
第3図は制御音声判別回路2の一例を示すものであって
、制御音声判別回路2は、音韻変化信号が入力されると
第1フォルマントF、と第2フォルマントF2とを成分
とするベクトルを記憶する第1ベクトル保持回路22と
、音韻変化信号が入力されると第1ベクトル保持回路2
2に記憶されていたベクトルを記憶する第2ベクトル保
持回路23と、第1ベクトル保持回路22に記憶された
ベクトルから第2ベクトル保持回路23に記憶されたベ
クトルを減算することにより変化ベクトルを算出する変
化ベクトル算出回路24と、スイッチ要素3を駆動すべ
務制御音声における隣接した音頷開の嚢化ベクトルが所
定の順序で記憶された記憶部25と、変化ベクトル算出
回路24の出力値と記憶部25に記憶された設定値とを
比較して入力された音声信号の変化ベクトルが記憶部2
5に記憶された変化ベクトルの設定範囲内であるときに
一致信号を出力する比較判定回路26と、一致信号が入
力されるとスイッチ要素3を開閉するための制御信号を
出力する制御信号発生回路27とから構成される。記憶
部25においては設定された制御音声の隣接する音韻間
の変化ベクトルがある程度の誤差を許容する形で記憶さ
れている。
、制御音声判別回路2は、音韻変化信号が入力されると
第1フォルマントF、と第2フォルマントF2とを成分
とするベクトルを記憶する第1ベクトル保持回路22と
、音韻変化信号が入力されると第1ベクトル保持回路2
2に記憶されていたベクトルを記憶する第2ベクトル保
持回路23と、第1ベクトル保持回路22に記憶された
ベクトルから第2ベクトル保持回路23に記憶されたベ
クトルを減算することにより変化ベクトルを算出する変
化ベクトル算出回路24と、スイッチ要素3を駆動すべ
務制御音声における隣接した音頷開の嚢化ベクトルが所
定の順序で記憶された記憶部25と、変化ベクトル算出
回路24の出力値と記憶部25に記憶された設定値とを
比較して入力された音声信号の変化ベクトルが記憶部2
5に記憶された変化ベクトルの設定範囲内であるときに
一致信号を出力する比較判定回路26と、一致信号が入
力されるとスイッチ要素3を開閉するための制御信号を
出力する制御信号発生回路27とから構成される。記憶
部25においては設定された制御音声の隣接する音韻間
の変化ベクトルがある程度の誤差を許容する形で記憶さ
れている。
すなわち、個人差や環境の差による変化ベクトルの1%
差を考慮して変化ベクトルの許容誤差範囲が設定されて
いるのであって、例えば、/a/から10/への変化ベ
クトルの範囲として(300±a、Hzs800±ff
2Hz)が設定されているのであり、”I、α2の値を
適宜設定することにより感度が調節されるようになって
いる。しかして、制御音声判別回路2では音韻変化信号
が制御音声判別回路2に入力されるたびに入力された音
声信号の変化ベクトルが記憶部25に記憶された変化ベ
クトルの許容誤差範囲内であるかどうかが判定され、入
力された音声信号の各音韻間の変化ベクトルが記憶部2
5に記憶された制御音声の変化ベクトルの設定範囲内で
あると判定されると、比較判定回路26から一致信号が
出力されるのである。なお、制御音声判別回路2の記憶
部25を除く部分に関してはマイクロプロセッサ20を
用いて構成することができる。
差を考慮して変化ベクトルの許容誤差範囲が設定されて
いるのであって、例えば、/a/から10/への変化ベ
クトルの範囲として(300±a、Hzs800±ff
2Hz)が設定されているのであり、”I、α2の値を
適宜設定することにより感度が調節されるようになって
いる。しかして、制御音声判別回路2では音韻変化信号
が制御音声判別回路2に入力されるたびに入力された音
声信号の変化ベクトルが記憶部25に記憶された変化ベ
クトルの許容誤差範囲内であるかどうかが判定され、入
力された音声信号の各音韻間の変化ベクトルが記憶部2
5に記憶された制御音声の変化ベクトルの設定範囲内で
あると判定されると、比較判定回路26から一致信号が
出力されるのである。なお、制御音声判別回路2の記憶
部25を除く部分に関してはマイクロプロセッサ20を
用いて構成することができる。
(動作)
以下、動作を説明する。まずスイッチ要素3を開閉させ
るには、制御音声をマイクロフォン5を通じて入力する
ことが必要であって、制御音声を入力するにあたっては
、タイミング設定回路4の発光ダイオード43の点滅に
合わせて発音を行なうようにする。これによって、各音
素を句切って発音することができ、調音結合が生じない
のである。マイクロフォン5からの音声入力がフォルマ
ント抽出回路1に入力されると、フォルマント抽出回路
1では各入力信号のF、−F2平面上でのベクトル成分
をそれぞれ抽出するとともに、音韻の変化時点でそれぞ
れ音韻変化信号を発生する。制御音声判別回路2では、
第1音声が入力された時点でまず第1音声のベクトル成
分を第1ベクトル保持回路22に記憶する0次に第2音
声が入力され音韻変化信号が得られると、第1ベクトル
保持回路22に記憶されていた第1音声のベクトル成分
が第2ベクトル保持回路23に入力されるとともに、第
1ベクトル保持回路22には第2音声のベクトル成分が
記憶される。このとき変化ベクトル算出回路24では第
2ベクトル保持回路23に記憶されたベクトル成分と第
1ベクトル保持回路22に記憶されたベクトル成分との
変化量から変化ベクトルの成分が算出される。ここで記
憶部25に記憶された設定範囲と変化ベクトル算出回路
24の出力値としての変化ベクトルの成分とが比較され
、変化ベクトルが記憶部25に記憶された設定範囲内で
あるかどうかが判断される。次に第3音声が入力される
と、第1ベクトル保持回路22に記憶されていた第2音
声のベクトル成分が第2ベクトル保持回路23に入力さ
れるとともに、第3音声のベクトル成分が第1ベクトル
保持回路22に記憶され、変化ベクトル算出回路24で
は第2ベクトル保持回路23に記憶された第2音声から
第1ベクトル保持回路22に記憶された第3音声への変
化ベクトルの成分が算出される。この変化ベクトルは比
較判定回路26において記憶部25に記憶された2番目
の変化ベクトルの設定範囲と比較され、変化ベクトル算
出回路24の出力値が記憶部25に記憶された変化ベク
トルの設定範囲内であるかどうかが判断される。以上の
ようにして入力信号が停止するまで同様の動作を繰り返
し、入力されるすべての音韻に対する音声信号の変化ベ
クトルが記憶部25に記憶された設定範囲内であるとき
に、判定回路26から一致信号が出力され、制御信号発
生回路27では一致信号を受けて制御信号を出力するの
である。制御信号はスイッチ要素3に入力されスイッチ
要素3が開閉される。入力信号が記憶部25に設定され
た設定範囲とは異なるときにスイッチ要素3が以前の状
態を保つのは言うまでもない。
るには、制御音声をマイクロフォン5を通じて入力する
ことが必要であって、制御音声を入力するにあたっては
、タイミング設定回路4の発光ダイオード43の点滅に
合わせて発音を行なうようにする。これによって、各音
素を句切って発音することができ、調音結合が生じない
のである。マイクロフォン5からの音声入力がフォルマ
ント抽出回路1に入力されると、フォルマント抽出回路
1では各入力信号のF、−F2平面上でのベクトル成分
をそれぞれ抽出するとともに、音韻の変化時点でそれぞ
れ音韻変化信号を発生する。制御音声判別回路2では、
第1音声が入力された時点でまず第1音声のベクトル成
分を第1ベクトル保持回路22に記憶する0次に第2音
声が入力され音韻変化信号が得られると、第1ベクトル
保持回路22に記憶されていた第1音声のベクトル成分
が第2ベクトル保持回路23に入力されるとともに、第
1ベクトル保持回路22には第2音声のベクトル成分が
記憶される。このとき変化ベクトル算出回路24では第
2ベクトル保持回路23に記憶されたベクトル成分と第
1ベクトル保持回路22に記憶されたベクトル成分との
変化量から変化ベクトルの成分が算出される。ここで記
憶部25に記憶された設定範囲と変化ベクトル算出回路
24の出力値としての変化ベクトルの成分とが比較され
、変化ベクトルが記憶部25に記憶された設定範囲内で
あるかどうかが判断される。次に第3音声が入力される
と、第1ベクトル保持回路22に記憶されていた第2音
声のベクトル成分が第2ベクトル保持回路23に入力さ
れるとともに、第3音声のベクトル成分が第1ベクトル
保持回路22に記憶され、変化ベクトル算出回路24で
は第2ベクトル保持回路23に記憶された第2音声から
第1ベクトル保持回路22に記憶された第3音声への変
化ベクトルの成分が算出される。この変化ベクトルは比
較判定回路26において記憶部25に記憶された2番目
の変化ベクトルの設定範囲と比較され、変化ベクトル算
出回路24の出力値が記憶部25に記憶された変化ベク
トルの設定範囲内であるかどうかが判断される。以上の
ようにして入力信号が停止するまで同様の動作を繰り返
し、入力されるすべての音韻に対する音声信号の変化ベ
クトルが記憶部25に記憶された設定範囲内であるとき
に、判定回路26から一致信号が出力され、制御信号発
生回路27では一致信号を受けて制御信号を出力するの
である。制御信号はスイッチ要素3に入力されスイッチ
要素3が開閉される。入力信号が記憶部25に設定され
た設定範囲とは異なるときにスイッチ要素3が以前の状
態を保つのは言うまでもない。
制御音声は2音以上の連続する母音から構成されており
、例えば/、atOte/となっている。この場合に記
憶部25には八/から10/、10/から/e/への変
化ベクトルとしてそれぞれ(300±ff1Hz、80
0±ff2Hz)、(120±(I sHz* 120
0±a4Hz)の値が記憶される。ここでa1〜a、は
適宜設定され、その設定値により音声の認識率が調節さ
れるのである。
、例えば/、atOte/となっている。この場合に記
憶部25には八/から10/、10/から/e/への変
化ベクトルとしてそれぞれ(300±ff1Hz、80
0±ff2Hz)、(120±(I sHz* 120
0±a4Hz)の値が記憶される。ここでa1〜a、は
適宜設定され、その設定値により音声の認識率が調節さ
れるのである。
上述の実施例において3母音を検出したときにスイッチ
要素3を開閉するようにしていたが、3母音に限定され
るものではない。また母音を検出するために第1フォル
マントF1と第27オルマン)F2とをベクトル成分と
して2次元空間でのベクトルを用いたが、第37オルマ
ン)Fz以上の高次フォルマントもベクトル成分として
用いることにより3次元以上の多次元空間でのベクトル
を用いて母音の判定を行なうようにしてもよい。
要素3を開閉するようにしていたが、3母音に限定され
るものではない。また母音を検出するために第1フォル
マントF1と第27オルマン)F2とをベクトル成分と
して2次元空間でのベクトルを用いたが、第37オルマ
ン)Fz以上の高次フォルマントもベクトル成分として
用いることにより3次元以上の多次元空間でのベクトル
を用いて母音の判定を行なうようにしてもよい。
さらに、上述の実施例ではフォルマント抽出回路1と制
御音声判別回路2とにそれぞれマイクロプロセッサを用
いた例を示したが、両回路1,2のマイクロプロセッサ
を共有化して1つにしてもよ塾1゜ [発明の効果] 本発明は上述のように、入力される音声信号から少なく
とも第1フォルマントと第2フォルマントとを抽出する
フォルマント抽出回路と、連続する母音から構成された
制御音声の各母音間のフォルマントの変化が所定の順序
でありかつ変化量が所定範囲内であるときに制御信号を
出力する制御音声判別回路と、制御信号により開閉され
るスイッチ要素と、入力する音声の発生タイミングを指
示するタイミング指示手段とを具備しているので、音声
のうちの母音を特徴づけている優勢な周波数成分である
フォルマントを抽出し、複数のフォルマントにより形成
されたベクトル空間における音声ベクトルの移動により
スイッチ要素を作動させるかどうかを判別するようにし
た結果、母音のフォルマントの変化のみを検出すればよ
く、計算量が少なくかつ音声の認識を確実に行なうこと
ができるものであり、実時間での動作が可能で認識率が
高いという利点を有する。また、フォルマントの変化分
で音声を認識するから、不特定話者に対して動作可能で
あるという利点を有するものである。
御音声判別回路2とにそれぞれマイクロプロセッサを用
いた例を示したが、両回路1,2のマイクロプロセッサ
を共有化して1つにしてもよ塾1゜ [発明の効果] 本発明は上述のように、入力される音声信号から少なく
とも第1フォルマントと第2フォルマントとを抽出する
フォルマント抽出回路と、連続する母音から構成された
制御音声の各母音間のフォルマントの変化が所定の順序
でありかつ変化量が所定範囲内であるときに制御信号を
出力する制御音声判別回路と、制御信号により開閉され
るスイッチ要素と、入力する音声の発生タイミングを指
示するタイミング指示手段とを具備しているので、音声
のうちの母音を特徴づけている優勢な周波数成分である
フォルマントを抽出し、複数のフォルマントにより形成
されたベクトル空間における音声ベクトルの移動により
スイッチ要素を作動させるかどうかを判別するようにし
た結果、母音のフォルマントの変化のみを検出すればよ
く、計算量が少なくかつ音声の認識を確実に行なうこと
ができるものであり、実時間での動作が可能で認識率が
高いという利点を有する。また、フォルマントの変化分
で音声を認識するから、不特定話者に対して動作可能で
あるという利点を有するものである。
しかも、タイミング設定指示を備えていることにより、
入力する音声の発生タイミングを指定することにより、
音素間における調音の結合を防止できるという利点を有
するものであり、認識率が一層高まるという利点を有す
るものである。
入力する音声の発生タイミングを指定することにより、
音素間における調音の結合を防止できるという利点を有
するものであり、認識率が一層高まるという利点を有す
るものである。
第1図は本発明の一実施例を示すブロック図、第2図は
同上に使用するフォルマント抽出回路を示すブロック図
、第3図は同上に使用する制御音声判別回路を示すブロ
ック図、第4図はF、−F2図の一例を示す動作説明図
、第5図は母音の周波数特性の一例を示す動作説明図、
第6図は同上に使用するタイミング設定回路の概略構成
図、第7図は同上に使用するタイミング設定回路の動作
説明図、第8図は従来例を示すブロック図、第9図は他
の従来例を示すブロック図である。 1はフォルマント抽出回路、2は制御音声判別回路、3
はスイッチ要素、4はタイミング設定回路である。 代理人 弁理士 石 1)長 七 □110ρ
同上に使用するフォルマント抽出回路を示すブロック図
、第3図は同上に使用する制御音声判別回路を示すブロ
ック図、第4図はF、−F2図の一例を示す動作説明図
、第5図は母音の周波数特性の一例を示す動作説明図、
第6図は同上に使用するタイミング設定回路の概略構成
図、第7図は同上に使用するタイミング設定回路の動作
説明図、第8図は従来例を示すブロック図、第9図は他
の従来例を示すブロック図である。 1はフォルマント抽出回路、2は制御音声判別回路、3
はスイッチ要素、4はタイミング設定回路である。 代理人 弁理士 石 1)長 七 □110ρ
Claims (1)
- (1)入力される音声信号から少なくとも第1フォルマ
ントと第2フォルマントとを抽出するフォルマント抽出
回路と、連続する母音から構成された制御音声の各母音
間のフォルマントの変化が所定の順序でありかつ変化量
が所定範囲内であるときに制御信号を出力する制御音声
判別回路と、制御信号により開閉されるスイッチ要素と
、入力する音声の発生タイミングを指示するタイミング
指示手段とを具備して成ることを特徴とする音声応答ス
イッチ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60089373A JPS61246798A (ja) | 1985-04-24 | 1985-04-24 | 音声応答スイツチ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60089373A JPS61246798A (ja) | 1985-04-24 | 1985-04-24 | 音声応答スイツチ |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS61246798A true JPS61246798A (ja) | 1986-11-04 |
JPH0562758B2 JPH0562758B2 (ja) | 1993-09-09 |
Family
ID=13968887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60089373A Granted JPS61246798A (ja) | 1985-04-24 | 1985-04-24 | 音声応答スイツチ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61246798A (ja) |
-
1985
- 1985-04-24 JP JP60089373A patent/JPS61246798A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPH0562758B2 (ja) | 1993-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hansen et al. | Speech under stress: Analysis, modeling and recognition | |
Yegnanarayana et al. | Epoch-based analysis of speech signals | |
Childers et al. | Gender recognition from speech. Part II: Fine analysis | |
US7529670B1 (en) | Automatic speech recognition system for people with speech-affecting disabilities | |
US20050171774A1 (en) | Features and techniques for speaker authentication | |
Christiansen et al. | Detecting and locating key words in continuous speech using linear predictive coding | |
US20180137880A1 (en) | Phonation Style Detection | |
Kadiri et al. | Extraction and utilization of excitation information of speech: A review | |
Sahoo et al. | MFCC feature with optimized frequency range: An essential step for emotion recognition | |
JP3523382B2 (ja) | 音声認識装置及び音声認識方法 | |
JP2002297199A (ja) | 合成音声判別方法と装置及び音声合成装置 | |
JPS61246798A (ja) | 音声応答スイツチ | |
JPS58181099A (ja) | 音声識別装置 | |
JPH0475520B2 (ja) | ||
JP3588929B2 (ja) | 音声認識装置 | |
JPS61246797A (ja) | 音声応答スイツチ | |
JPS61246800A (ja) | 音声応答スイツチ | |
Waardenburg et al. | The automatic recognition of stop consonants using hidden Markov models | |
Inbanila et al. | Investigation of Speech Synthesis, Speech Processing Techniques and Challenges for Enhancements | |
Sivaraman et al. | Analysis of coarticulated speech using estimated articulatory trajectories. | |
JP2655903B2 (ja) | 音声認識装置 | |
Deshpande et al. | Ingressiveness on Glottal Closure Instants: An Empirical Study | |
JPH0562757B2 (ja) | ||
JPS61246799A (ja) | 音声応答スイツチ | |
Mohanty et al. | Whispered Speech Emotion Recognition with Gender Detection using BiLSTM and DCNN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |