JPH0562757B2 - - Google Patents
Info
- Publication number
- JPH0562757B2 JPH0562757B2 JP60089371A JP8937185A JPH0562757B2 JP H0562757 B2 JPH0562757 B2 JP H0562757B2 JP 60089371 A JP60089371 A JP 60089371A JP 8937185 A JP8937185 A JP 8937185A JP H0562757 B2 JPH0562757 B2 JP H0562757B2
- Authority
- JP
- Japan
- Prior art keywords
- formant
- circuit
- vector
- voice
- change
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000008859 change Effects 0.000 claims description 37
- 238000000605 extraction Methods 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 4
- 239000013598 vector Substances 0.000 description 59
- 238000010586 diagram Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 4
- 238000000034 method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 230000007257 malfunction Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Landscapes
- Electronic Switches (AREA)
Description
【発明の詳細な説明】
[技術分野]
本発明は音声応答スイツチ、さらに詳しくは、
人の音声を認識して作動する音声応答スイツチに
関するものである。
人の音声を認識して作動する音声応答スイツチに
関するものである。
[背景技術]
従来より音声応答スイツチとしては、第6図に
示すように、音声に相当する周波数帯域の入力信
号を通過させるフイルタ回路11と、フイルタ回
路11の出力レベルを検出するレベル検出回路1
2と、レベル検出回路12の出力を予め設定され
た参照値と比較しレベル検出回路12の出力が参
照値以上であるときに制御信号を出力する制御回
路13と、制御信号により閉成されるスイツチ要
素14とから構成されており、制御回路13への
入力レベルが参照値以上であるときにフイルタ回
路11への入力信号が音声信号であると判断する
ようになつたものが提供されている。
示すように、音声に相当する周波数帯域の入力信
号を通過させるフイルタ回路11と、フイルタ回
路11の出力レベルを検出するレベル検出回路1
2と、レベル検出回路12の出力を予め設定され
た参照値と比較しレベル検出回路12の出力が参
照値以上であるときに制御信号を出力する制御回
路13と、制御信号により閉成されるスイツチ要
素14とから構成されており、制御回路13への
入力レベルが参照値以上であるときにフイルタ回
路11への入力信号が音声信号であると判断する
ようになつたものが提供されている。
この回路構成においては、特定の周波数帯域の
レベル判定のみで音声であるかどうかを判別して
いるものであるから、フイルタ回路11を通過で
きる帯域の周波数成分を持ちかつ参照値よりも高
いレベルの入力信号であれば音声ではない雑音で
あつてもスイツチ要素14が作動することにな
り、誤動作を生じるという問題がある。また音声
が入力されている場合でも、それがスイツチ要素
14を作動させる目的で発せられた音声であるか
どうかにかかわらずスイツチ要素14が作動する
から、スイツチ要素14の作動を希望しないとき
スイツチ要素14が作動することがあるという不
都合が生じるものである。
レベル判定のみで音声であるかどうかを判別して
いるものであるから、フイルタ回路11を通過で
きる帯域の周波数成分を持ちかつ参照値よりも高
いレベルの入力信号であれば音声ではない雑音で
あつてもスイツチ要素14が作動することにな
り、誤動作を生じるという問題がある。また音声
が入力されている場合でも、それがスイツチ要素
14を作動させる目的で発せられた音声であるか
どうかにかかわらずスイツチ要素14が作動する
から、スイツチ要素14の作動を希望しないとき
スイツチ要素14が作動することがあるという不
都合が生じるものである。
このため、第7図に示すように、音声認識装置
15を用い、記憶部16に記憶された制御音声と
入力音声とを比較し、両者が一致したときにスイ
ツチ要素3を開閉させるものが考えられている
が、不特定話者を対象とする場合には、音声認識
のための演算処理に長い時間が必要となり実時間
でスイツチ要素14を制御することが困難である
という問題があり、しかも現在の技術レベルでは
一般に認識率が低く誤動作しやすいという問題が
ある。そして、認識率を高めるには情報量と計算
量が多くなるものであるから一層処理時間が遅れ
るという欠点がある。これに対して特定話者を対
象とする場合には、予め使用者が自分の声を登録
する必要があり、使用までの作業が面倒である。
15を用い、記憶部16に記憶された制御音声と
入力音声とを比較し、両者が一致したときにスイ
ツチ要素3を開閉させるものが考えられている
が、不特定話者を対象とする場合には、音声認識
のための演算処理に長い時間が必要となり実時間
でスイツチ要素14を制御することが困難である
という問題があり、しかも現在の技術レベルでは
一般に認識率が低く誤動作しやすいという問題が
ある。そして、認識率を高めるには情報量と計算
量が多くなるものであるから一層処理時間が遅れ
るという欠点がある。これに対して特定話者を対
象とする場合には、予め使用者が自分の声を登録
する必要があり、使用までの作業が面倒である。
[発明の目的]
本発明は上述の点に鑑みて為されたものであつ
て、その主な目的とするところは、音声のうちの
母音を特徴づけている優勢な周波数成分であるフ
オルマントを抽出し、複数のフオルマントにより
形成されたベクトル空間における音声ベクトルの
移動によりスイツチ要素を作動させるかどうかを
判別するようにして、実時間で動作可能で認識率
が高く、しかも不特定話者用を対象とした音声応
答スイツチを提供することにある。
て、その主な目的とするところは、音声のうちの
母音を特徴づけている優勢な周波数成分であるフ
オルマントを抽出し、複数のフオルマントにより
形成されたベクトル空間における音声ベクトルの
移動によりスイツチ要素を作動させるかどうかを
判別するようにして、実時間で動作可能で認識率
が高く、しかも不特定話者用を対象とした音声応
答スイツチを提供することにある。
[発明の開示]
第5図は母音のスペクトルの一例を示すもので
あつて、母音を特徴づける優勢な周波数成分、す
なわち、スペクトルのピーク部分の周波数成分が
フオルマントと呼ばれる。母音には普通複数のフ
オルマントが存在し、周波数の低いほうから順に
第1フオルマントF1、第2フオルマントF2、第
3図フオルマントF3、……と呼ばれる。これら
のフオルマントのうち第1フオルマントF1、と
第2フオルマントF2との寄与率がもつとも高く、
第1フオルマントF1と第2フオルマントF2とを
用いればかなり高い確度で母音を決定できるもの
である。
あつて、母音を特徴づける優勢な周波数成分、す
なわち、スペクトルのピーク部分の周波数成分が
フオルマントと呼ばれる。母音には普通複数のフ
オルマントが存在し、周波数の低いほうから順に
第1フオルマントF1、第2フオルマントF2、第
3図フオルマントF3、……と呼ばれる。これら
のフオルマントのうち第1フオルマントF1、と
第2フオルマントF2との寄与率がもつとも高く、
第1フオルマントF1と第2フオルマントF2とを
用いればかなり高い確度で母音を決定できるもの
である。
ここで第1フオルマントF1を横軸にとり、第
2フオルマントF2を縦軸にとつたF1−F2図上に
日本語の母音である/a//i//u//e//
o/をベクトルとして示すと、各母音は第4図の
破線で示す範囲で表わされる。フオルマントは各
個人によりかなり変動するものであつて、各母音
を表わす範囲はかなりの部分で重複するものであ
るが、一般に同一環境で同一人物の発した5母音
のフオルマントはF1−F2図上において略5角形
となり、環境が変化したり、発話者が代わつても
5母音の相対的位置関係、すなわちこの5角形の
形状を保持したままで平行移動することが知られ
ている。したがつて、母音が変化したときの相対
位置、すなわち変化ベクトルは環境や発話者がか
わつても略一定になる。つまり、母音/a/の成
分を(800Hz,1800Hz)とし、母音/o/の成分
を(500Hz,1000Hz)とすると、/a/から/
o/への変化ベクトルの成分は(−300Hz,−800
Hz)となり、変化ベクトルの成分は環境や発話者
が異なつていても略一定になるのである。しかし
て、本発明においては、複数の母音を入力して母
音の変化ベクトルが検出されるとスイツチ要素が
作動する音声応答スイツチを開示する。なお、以
下の説明においては、第1フオルマントF1と第
2フオルマントF2とを使用して音声の認識を行
なつているが、さらに認識率を高めるために、第
3フオルマントF3を用いてもよい。この場合第
3フオルマントF3を第3軸としてF1−F2−F3空
間上での各母音のフオルマントを表わすことによ
り、重複部分を形成せずに空間上で各母音のフオ
ルマントを表わすことができるものである。
2フオルマントF2を縦軸にとつたF1−F2図上に
日本語の母音である/a//i//u//e//
o/をベクトルとして示すと、各母音は第4図の
破線で示す範囲で表わされる。フオルマントは各
個人によりかなり変動するものであつて、各母音
を表わす範囲はかなりの部分で重複するものであ
るが、一般に同一環境で同一人物の発した5母音
のフオルマントはF1−F2図上において略5角形
となり、環境が変化したり、発話者が代わつても
5母音の相対的位置関係、すなわちこの5角形の
形状を保持したままで平行移動することが知られ
ている。したがつて、母音が変化したときの相対
位置、すなわち変化ベクトルは環境や発話者がか
わつても略一定になる。つまり、母音/a/の成
分を(800Hz,1800Hz)とし、母音/o/の成分
を(500Hz,1000Hz)とすると、/a/から/
o/への変化ベクトルの成分は(−300Hz,−800
Hz)となり、変化ベクトルの成分は環境や発話者
が異なつていても略一定になるのである。しかし
て、本発明においては、複数の母音を入力して母
音の変化ベクトルが検出されるとスイツチ要素が
作動する音声応答スイツチを開示する。なお、以
下の説明においては、第1フオルマントF1と第
2フオルマントF2とを使用して音声の認識を行
なつているが、さらに認識率を高めるために、第
3フオルマントF3を用いてもよい。この場合第
3フオルマントF3を第3軸としてF1−F2−F3空
間上での各母音のフオルマントを表わすことによ
り、重複部分を形成せずに空間上で各母音のフオ
ルマントを表わすことができるものである。
(実施例)
第1図に示すように、入力信号はフオルマント
抽出回路1に入力され第1フオルマントF1と第
2フオルマントF2とが抽出される。フオルマン
ト抽出回路1の出力は制御音声判別回路2に入力
され、予め設定された制御音声と一致すると制御
信号が出力されるようになつている。制御音声判
別回路2の出力はスイツチ要素3に入力され、ス
イツチ要素3に制御信号が入力されるとスイツチ
要素3が開閉される。
抽出回路1に入力され第1フオルマントF1と第
2フオルマントF2とが抽出される。フオルマン
ト抽出回路1の出力は制御音声判別回路2に入力
され、予め設定された制御音声と一致すると制御
信号が出力されるようになつている。制御音声判
別回路2の出力はスイツチ要素3に入力され、ス
イツチ要素3に制御信号が入力されるとスイツチ
要素3が開閉される。
第2図にフオルマント抽出回路1の一例を示
す。フオルマント抽出回路1はそれぞれ200Hzの
帯域巾を有し通過周波数が互いに異なる多数の帯
域フィルタ群111〜11oと、各帯域フィルタ1
11〜11oの出力信号をデジタル信号に変換する
アナログ/デジタル変換回路12と、各帯域フィ
ルタ111〜11oの出力レベル値からフオルマン
トを検出するマイクロプロセツサよりなる演算回
路13とから構成される。帯域フィルタ111〜
11oはそれぞれ0〜200Hz、200〜400Hz、400〜
600Hz、……、2200〜2400Hz、と通過周波数帯域
が互いに異なるとともに、全帯域フィルタ111
〜11oによつて音声帯域の全周波数が含まれる
ように設定されている。演算回路13は第1フオ
ルマントF1と第2フオルマントF2とを検出する
とともに、入力音声が変化したかどうかを判定す
る音韻変化信号を出力する。なお、フオルマント
の検出は回路構成によつてハード的に行なつてい
るが、線形予測法などのソフト的な手法を用いて
行なつてもよい。
す。フオルマント抽出回路1はそれぞれ200Hzの
帯域巾を有し通過周波数が互いに異なる多数の帯
域フィルタ群111〜11oと、各帯域フィルタ1
11〜11oの出力信号をデジタル信号に変換する
アナログ/デジタル変換回路12と、各帯域フィ
ルタ111〜11oの出力レベル値からフオルマン
トを検出するマイクロプロセツサよりなる演算回
路13とから構成される。帯域フィルタ111〜
11oはそれぞれ0〜200Hz、200〜400Hz、400〜
600Hz、……、2200〜2400Hz、と通過周波数帯域
が互いに異なるとともに、全帯域フィルタ111
〜11oによつて音声帯域の全周波数が含まれる
ように設定されている。演算回路13は第1フオ
ルマントF1と第2フオルマントF2とを検出する
とともに、入力音声が変化したかどうかを判定す
る音韻変化信号を出力する。なお、フオルマント
の検出は回路構成によつてハード的に行なつてい
るが、線形予測法などのソフト的な手法を用いて
行なつてもよい。
第3図は制御音声判別回路2の一例を示すもの
であつて、制御音声判別回路2は、音韻変化信号
が入力されるとフオルマントを記憶する第1ベク
トル保持回路22と、音韻変化信号が入力される
と第1ベクトル保持回路22に記憶されていたフ
オルマントを記憶する第2ベクトル保持回路23
と、第1ベクトル保持回路22に記憶されたフオ
ルマントから第2ベクトル保持回路23に記憶さ
れたフオルマントを減算することにより変化ベク
トルを算出する変化ベクトル算出回路24と、任
意の3母音を所定の順序で並べたときの各2母音
間での変化ベクトルの範囲が記憶された記憶部2
5と、変化ベクトル算出回路24の出力値と記憶
部25に記憶された設定値とを比較して変化ベク
トル算出回路24の出力値が記憶部25に格納さ
れた設定範囲内であるときに一致信号を出力する
比較判定回路26と、一致信号が連続して入力さ
れると制御信号を出力する制御信号発生回路27
とから構成される。制御音声判別回路2では音韻
変化信号が制御音声判別回路2に入力されるたび
に入力信号の変化ベクトルが記憶部25に記憶さ
れた設定範囲に属するかどうかが判定される。そ
して入力信号の各音韻間の変化ベクトルが記憶部
25に記憶された制御音声の変化ベクトルの設定
範囲内であると判定されると、比較判定回路26
から一致信号が出力されるのである。なお、制御
音声判別回路2の記憶部25を除く部分に関して
はマイクロプロセツサ20を用いて構成される。
であつて、制御音声判別回路2は、音韻変化信号
が入力されるとフオルマントを記憶する第1ベク
トル保持回路22と、音韻変化信号が入力される
と第1ベクトル保持回路22に記憶されていたフ
オルマントを記憶する第2ベクトル保持回路23
と、第1ベクトル保持回路22に記憶されたフオ
ルマントから第2ベクトル保持回路23に記憶さ
れたフオルマントを減算することにより変化ベク
トルを算出する変化ベクトル算出回路24と、任
意の3母音を所定の順序で並べたときの各2母音
間での変化ベクトルの範囲が記憶された記憶部2
5と、変化ベクトル算出回路24の出力値と記憶
部25に記憶された設定値とを比較して変化ベク
トル算出回路24の出力値が記憶部25に格納さ
れた設定範囲内であるときに一致信号を出力する
比較判定回路26と、一致信号が連続して入力さ
れると制御信号を出力する制御信号発生回路27
とから構成される。制御音声判別回路2では音韻
変化信号が制御音声判別回路2に入力されるたび
に入力信号の変化ベクトルが記憶部25に記憶さ
れた設定範囲に属するかどうかが判定される。そ
して入力信号の各音韻間の変化ベクトルが記憶部
25に記憶された制御音声の変化ベクトルの設定
範囲内であると判定されると、比較判定回路26
から一致信号が出力されるのである。なお、制御
音声判別回路2の記憶部25を除く部分に関して
はマイクロプロセツサ20を用いて構成される。
(動作)
以下、動作を説明する。例えば、制御信号を出
力するように設定された制御音声が3母音/
a//o//e/を順に並べて構成されていると
し、記憶部25には/a/から/o/への変化ベ
クトルの範囲として(300±α1Hz、800±α2
Hz)、/o/から/e/への変化ベクトルの範囲
として(120±α3Hz、1200±α4Hz)が設定されて
いるものとする。ここでα1〜α4の値を適宜設定す
ることにより感度が調節される。さて、いま母
音/a//o//e/が第1音声、第2音声、第
3音声として連続して入力されたものとすると、
フオルマント抽出回路1では各音声のF1−F2平
面上でのベクトル成分がそれぞれ検出されるとと
もに、母音の変化時点でそれぞれ音韻変化信号が
発生する。制御音声判別回路2では、第1音声が
入力された時点でまず第1音声のベクトル成分を
第1ベクトル保持回路22に記憶する。次に第2
音声が入力され音韻変化信号が得られると、第1
ベクトル保持回路22に記憶されていた第1音声
のベクトル成分が第2ベクトル保持回路23に入
力されるとともに、第1ベクトル保持回路22に
は第2音声のベクトル成分が記憶される。このと
き変化ベクトル算出回路24では第2ベクトル保
持回路23に記憶されたベクトル成分と第1ベク
トル保持回路22に記憶されたベクトル成分との
変化量から変化ベクトルの成分が算出される。記
憶部25には/a/から/o/への変化ベクトル
の成分として(300±α1Hz、800±α2Hz)が記憶さ
れているから、比較判定回路26では変化ベクト
ル算出回路24の出力が記憶部25に記憶された
この設定範囲内にあるかどうかが比較され、変化
ベクトル算出回路24の出力値が記憶部25の設
定範囲内であると判定されると、入力信号が/
a/から/o/に変化したものと判定されるので
ある。次に第3音声が入力されると、第1ベクト
ル保持回路22に記憶されていた第2音声のベク
トル成分が第2ベクトル保持回路23に入力され
るとともに、第3音声のベクトル成分が第1ベク
トル保持回路22に記憶され、変化ベクトル算出
回路24では第2ベクトル保持回路23に記憶さ
れた第2音声から第1ベクトル保持回路22に記
憶された第3音声への変化ベクトルの成分が算出
される。記憶部25には/o/から/e/への変
化ベクトルの成分として(120±α3,1200±α4Hz)
が記憶されているから、比較判定回路26ではこ
の設定範囲と変化ベクトル算出回路24の出力値
とが比較され、変化ベクトル算出回路24の出力
値が記憶部25の設定範囲内であると判定される
と、入力信号が/o/から/e/に変化したこと
を認識するのである。以上のようにして/a/か
ら/o/への変化と/o/から/e/への変化が
連続して検出されると、比較判定回路26では一
致信号を出力し、制御信号発生回路27では一致
信号を受けて制御信号を出力するのである。制御
信号はスイツチ要素3に入力されスイツチ要素3
が開閉されるのである。入力信号が記憶部25に
設定された設定範囲とは異なるときにはスイツチ
要素3はそれまでの状態を保つ。
力するように設定された制御音声が3母音/
a//o//e/を順に並べて構成されていると
し、記憶部25には/a/から/o/への変化ベ
クトルの範囲として(300±α1Hz、800±α2
Hz)、/o/から/e/への変化ベクトルの範囲
として(120±α3Hz、1200±α4Hz)が設定されて
いるものとする。ここでα1〜α4の値を適宜設定す
ることにより感度が調節される。さて、いま母
音/a//o//e/が第1音声、第2音声、第
3音声として連続して入力されたものとすると、
フオルマント抽出回路1では各音声のF1−F2平
面上でのベクトル成分がそれぞれ検出されるとと
もに、母音の変化時点でそれぞれ音韻変化信号が
発生する。制御音声判別回路2では、第1音声が
入力された時点でまず第1音声のベクトル成分を
第1ベクトル保持回路22に記憶する。次に第2
音声が入力され音韻変化信号が得られると、第1
ベクトル保持回路22に記憶されていた第1音声
のベクトル成分が第2ベクトル保持回路23に入
力されるとともに、第1ベクトル保持回路22に
は第2音声のベクトル成分が記憶される。このと
き変化ベクトル算出回路24では第2ベクトル保
持回路23に記憶されたベクトル成分と第1ベク
トル保持回路22に記憶されたベクトル成分との
変化量から変化ベクトルの成分が算出される。記
憶部25には/a/から/o/への変化ベクトル
の成分として(300±α1Hz、800±α2Hz)が記憶さ
れているから、比較判定回路26では変化ベクト
ル算出回路24の出力が記憶部25に記憶された
この設定範囲内にあるかどうかが比較され、変化
ベクトル算出回路24の出力値が記憶部25の設
定範囲内であると判定されると、入力信号が/
a/から/o/に変化したものと判定されるので
ある。次に第3音声が入力されると、第1ベクト
ル保持回路22に記憶されていた第2音声のベク
トル成分が第2ベクトル保持回路23に入力され
るとともに、第3音声のベクトル成分が第1ベク
トル保持回路22に記憶され、変化ベクトル算出
回路24では第2ベクトル保持回路23に記憶さ
れた第2音声から第1ベクトル保持回路22に記
憶された第3音声への変化ベクトルの成分が算出
される。記憶部25には/o/から/e/への変
化ベクトルの成分として(120±α3,1200±α4Hz)
が記憶されているから、比較判定回路26ではこ
の設定範囲と変化ベクトル算出回路24の出力値
とが比較され、変化ベクトル算出回路24の出力
値が記憶部25の設定範囲内であると判定される
と、入力信号が/o/から/e/に変化したこと
を認識するのである。以上のようにして/a/か
ら/o/への変化と/o/から/e/への変化が
連続して検出されると、比較判定回路26では一
致信号を出力し、制御信号発生回路27では一致
信号を受けて制御信号を出力するのである。制御
信号はスイツチ要素3に入力されスイツチ要素3
が開閉されるのである。入力信号が記憶部25に
設定された設定範囲とは異なるときにはスイツチ
要素3はそれまでの状態を保つ。
上述の実施例において連続した3母音を検出し
たときにスイツチ要素3を開閉するようになつて
いたが、3母音に限定されるものではない。また
母音を検出するために第1フオルマントF1と第
2フオルマントF2とをベクトル成分として2次
元空間でのベクトルを用いたが、第3フオルマン
トF3以上の高次フオルマントもベクトル成分と
して用いることにより3次元以上の多次元空間で
のベクトルを用いて母音の判定を行なうようにし
てもよい。さらに、上述の実施例ではフオルマン
ト抽出回路1と制御音声判別回路2とにそれぞれ
マイクロプロセツサを用いた例を示したが、両回
路1,2のマイクロプロセツサを共有化して1つ
にしてもよい。
たときにスイツチ要素3を開閉するようになつて
いたが、3母音に限定されるものではない。また
母音を検出するために第1フオルマントF1と第
2フオルマントF2とをベクトル成分として2次
元空間でのベクトルを用いたが、第3フオルマン
トF3以上の高次フオルマントもベクトル成分と
して用いることにより3次元以上の多次元空間で
のベクトルを用いて母音の判定を行なうようにし
てもよい。さらに、上述の実施例ではフオルマン
ト抽出回路1と制御音声判別回路2とにそれぞれ
マイクロプロセツサを用いた例を示したが、両回
路1,2のマイクロプロセツサを共有化して1つ
にしてもよい。
[考案の効果]
本発明は上述のように、入力音声から少なくと
も第1フオルマントと第2フオルマントとを抽出
するフオルマント抽出回路と、2音以上の連続す
る母音から構成された制御音声の各母音間のフオ
ルマントの変化分が所定の設定範囲内であるとき
に制御信号を出力する制御音声判別回路と、制御
信号により開閉されるスイツチ要素とから構成さ
れているので、音声のうちの母音を特徴づけてい
る優勢な周波数成分であるフオルマントを抽出
し、複数のフオルマントにより形成されたベクト
ル空間における音声ベクトルの移動によりスイツ
チ要素を作動させるかどうかを判別するようにし
た結果、母音のフオルマントの変化のみを検出す
ればよく、計算量が少なくかつ音声の認識を確実
に行なうことができるものであり、実時間での動
作が可能で認識率が高いという利点を有する。ま
た、フオルマントの変化分で音声を認識するか
ら、不特定話者に対して動作可能であるという利
点を有するものである。
も第1フオルマントと第2フオルマントとを抽出
するフオルマント抽出回路と、2音以上の連続す
る母音から構成された制御音声の各母音間のフオ
ルマントの変化分が所定の設定範囲内であるとき
に制御信号を出力する制御音声判別回路と、制御
信号により開閉されるスイツチ要素とから構成さ
れているので、音声のうちの母音を特徴づけてい
る優勢な周波数成分であるフオルマントを抽出
し、複数のフオルマントにより形成されたベクト
ル空間における音声ベクトルの移動によりスイツ
チ要素を作動させるかどうかを判別するようにし
た結果、母音のフオルマントの変化のみを検出す
ればよく、計算量が少なくかつ音声の認識を確実
に行なうことができるものであり、実時間での動
作が可能で認識率が高いという利点を有する。ま
た、フオルマントの変化分で音声を認識するか
ら、不特定話者に対して動作可能であるという利
点を有するものである。
第1図は本発明の一実施例を示すブロツク図、
第2図は同上に使用するフオルマント抽出回路を
示すブロツク図、第3図は同上に使用する制御音
声判別回路を示すブロツク図、第4図はF1−F2
図の一例を示す動作説明図、第5図は母音の周波
数特性の一例を示す動作説明図、第6図は従来例
を示すブロツク図、第7図は他の従来例を示すブ
ロツク図である。 1はフオルマント抽出回路、2は制御音声判別
回路、3はスイツチ要素である。
第2図は同上に使用するフオルマント抽出回路を
示すブロツク図、第3図は同上に使用する制御音
声判別回路を示すブロツク図、第4図はF1−F2
図の一例を示す動作説明図、第5図は母音の周波
数特性の一例を示す動作説明図、第6図は従来例
を示すブロツク図、第7図は他の従来例を示すブ
ロツク図である。 1はフオルマント抽出回路、2は制御音声判別
回路、3はスイツチ要素である。
Claims (1)
- 1 入力音声から少なくとも第1フオルマントと
第2フオルマントとを抽出するフオルマント抽出
回路と、2音以上の連続する母音から構成された
制御音声の各母音間のフオルマントの変化分が所
定の設定範囲内であるときに制御信号を出力する
制御音声判別回路と、制御信号により開閉される
スイツチ要素とから構成されたことを特徴とする
音声応答スイツチ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60089371A JPS61246796A (ja) | 1985-04-24 | 1985-04-24 | 音声応答スイツチ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60089371A JPS61246796A (ja) | 1985-04-24 | 1985-04-24 | 音声応答スイツチ |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS61246796A JPS61246796A (ja) | 1986-11-04 |
JPH0562757B2 true JPH0562757B2 (ja) | 1993-09-09 |
Family
ID=13968833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60089371A Granted JPS61246796A (ja) | 1985-04-24 | 1985-04-24 | 音声応答スイツチ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61246796A (ja) |
-
1985
- 1985-04-24 JP JP60089371A patent/JPS61246796A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS61246796A (ja) | 1986-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4718096A (en) | Speech recognition system | |
Christiansen et al. | Detecting and locating key words in continuous speech using linear predictive coding | |
JPH06332492A (ja) | 音声検出方法および検出装置 | |
GB2346999A (en) | Communication device for endpointing speech utterances | |
Cole et al. | Feature-based speaker-independent recognition of isolated English letters | |
Jaafar et al. | Automatic syllables segmentation for frog identification system | |
JPH0431898A (ja) | 音声雑音分離装置 | |
Chou et al. | A hybrid neural network based on the duplex model of pitch perception for singing melody extraction | |
JP2001000007U (ja) | 音声認識装置 | |
JPH0562757B2 (ja) | ||
JP2797861B2 (ja) | 音声検出方法および音声検出装置 | |
JPS58181099A (ja) | 音声識別装置 | |
Nilsson et al. | Human whistle detection and frequency estimation | |
JPS61246800A (ja) | 音声応答スイツチ | |
JPS63186298A (ja) | 単語音声認識装置 | |
JPH0774960B2 (ja) | テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム | |
CA1216944A (en) | Speech recognition system | |
JP2825272B2 (ja) | エレベータ装置 | |
Bach et al. | Detecting novel objects in acoustic scenes through classifier incongruence | |
JPS61246799A (ja) | 音声応答スイツチ | |
JPS61246797A (ja) | 音声応答スイツチ | |
JPH0562758B2 (ja) | ||
JP2989231B2 (ja) | 音声認識装置 | |
JPH03200298A (ja) | 音声制御装置 | |
JPS5914769B2 (ja) | 音声機器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |