JPH0562757B2 - - Google Patents

Info

Publication number
JPH0562757B2
JPH0562757B2 JP60089371A JP8937185A JPH0562757B2 JP H0562757 B2 JPH0562757 B2 JP H0562757B2 JP 60089371 A JP60089371 A JP 60089371A JP 8937185 A JP8937185 A JP 8937185A JP H0562757 B2 JPH0562757 B2 JP H0562757B2
Authority
JP
Japan
Prior art keywords
formant
circuit
vector
voice
change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60089371A
Other languages
English (en)
Other versions
JPS61246796A (ja
Inventor
Hiroaki Takeyama
Hitoshi Fukagawa
Kyotaka Takehara
Yasukazu Kinekawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP60089371A priority Critical patent/JPS61246796A/ja
Publication of JPS61246796A publication Critical patent/JPS61246796A/ja
Publication of JPH0562757B2 publication Critical patent/JPH0562757B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Electronic Switches (AREA)

Description

【発明の詳細な説明】 [技術分野] 本発明は音声応答スイツチ、さらに詳しくは、
人の音声を認識して作動する音声応答スイツチに
関するものである。
[背景技術] 従来より音声応答スイツチとしては、第6図に
示すように、音声に相当する周波数帯域の入力信
号を通過させるフイルタ回路11と、フイルタ回
路11の出力レベルを検出するレベル検出回路1
2と、レベル検出回路12の出力を予め設定され
た参照値と比較しレベル検出回路12の出力が参
照値以上であるときに制御信号を出力する制御回
路13と、制御信号により閉成されるスイツチ要
素14とから構成されており、制御回路13への
入力レベルが参照値以上であるときにフイルタ回
路11への入力信号が音声信号であると判断する
ようになつたものが提供されている。
この回路構成においては、特定の周波数帯域の
レベル判定のみで音声であるかどうかを判別して
いるものであるから、フイルタ回路11を通過で
きる帯域の周波数成分を持ちかつ参照値よりも高
いレベルの入力信号であれば音声ではない雑音で
あつてもスイツチ要素14が作動することにな
り、誤動作を生じるという問題がある。また音声
が入力されている場合でも、それがスイツチ要素
14を作動させる目的で発せられた音声であるか
どうかにかかわらずスイツチ要素14が作動する
から、スイツチ要素14の作動を希望しないとき
スイツチ要素14が作動することがあるという不
都合が生じるものである。
このため、第7図に示すように、音声認識装置
15を用い、記憶部16に記憶された制御音声と
入力音声とを比較し、両者が一致したときにスイ
ツチ要素3を開閉させるものが考えられている
が、不特定話者を対象とする場合には、音声認識
のための演算処理に長い時間が必要となり実時間
でスイツチ要素14を制御することが困難である
という問題があり、しかも現在の技術レベルでは
一般に認識率が低く誤動作しやすいという問題が
ある。そして、認識率を高めるには情報量と計算
量が多くなるものであるから一層処理時間が遅れ
るという欠点がある。これに対して特定話者を対
象とする場合には、予め使用者が自分の声を登録
する必要があり、使用までの作業が面倒である。
[発明の目的] 本発明は上述の点に鑑みて為されたものであつ
て、その主な目的とするところは、音声のうちの
母音を特徴づけている優勢な周波数成分であるフ
オルマントを抽出し、複数のフオルマントにより
形成されたベクトル空間における音声ベクトルの
移動によりスイツチ要素を作動させるかどうかを
判別するようにして、実時間で動作可能で認識率
が高く、しかも不特定話者用を対象とした音声応
答スイツチを提供することにある。
[発明の開示] 第5図は母音のスペクトルの一例を示すもので
あつて、母音を特徴づける優勢な周波数成分、す
なわち、スペクトルのピーク部分の周波数成分が
フオルマントと呼ばれる。母音には普通複数のフ
オルマントが存在し、周波数の低いほうから順に
第1フオルマントF1、第2フオルマントF2、第
3図フオルマントF3、……と呼ばれる。これら
のフオルマントのうち第1フオルマントF1、と
第2フオルマントF2との寄与率がもつとも高く、
第1フオルマントF1と第2フオルマントF2とを
用いればかなり高い確度で母音を決定できるもの
である。
ここで第1フオルマントF1を横軸にとり、第
2フオルマントF2を縦軸にとつたF1−F2図上に
日本語の母音である/a//i//u//e//
o/をベクトルとして示すと、各母音は第4図の
破線で示す範囲で表わされる。フオルマントは各
個人によりかなり変動するものであつて、各母音
を表わす範囲はかなりの部分で重複するものであ
るが、一般に同一環境で同一人物の発した5母音
のフオルマントはF1−F2図上において略5角形
となり、環境が変化したり、発話者が代わつても
5母音の相対的位置関係、すなわちこの5角形の
形状を保持したままで平行移動することが知られ
ている。したがつて、母音が変化したときの相対
位置、すなわち変化ベクトルは環境や発話者がか
わつても略一定になる。つまり、母音/a/の成
分を(800Hz,1800Hz)とし、母音/o/の成分
を(500Hz,1000Hz)とすると、/a/から/
o/への変化ベクトルの成分は(−300Hz,−800
Hz)となり、変化ベクトルの成分は環境や発話者
が異なつていても略一定になるのである。しかし
て、本発明においては、複数の母音を入力して母
音の変化ベクトルが検出されるとスイツチ要素が
作動する音声応答スイツチを開示する。なお、以
下の説明においては、第1フオルマントF1と第
2フオルマントF2とを使用して音声の認識を行
なつているが、さらに認識率を高めるために、第
3フオルマントF3を用いてもよい。この場合第
3フオルマントF3を第3軸としてF1−F2−F3
間上での各母音のフオルマントを表わすことによ
り、重複部分を形成せずに空間上で各母音のフオ
ルマントを表わすことができるものである。
(実施例) 第1図に示すように、入力信号はフオルマント
抽出回路1に入力され第1フオルマントF1と第
2フオルマントF2とが抽出される。フオルマン
ト抽出回路1の出力は制御音声判別回路2に入力
され、予め設定された制御音声と一致すると制御
信号が出力されるようになつている。制御音声判
別回路2の出力はスイツチ要素3に入力され、ス
イツチ要素3に制御信号が入力されるとスイツチ
要素3が開閉される。
第2図にフオルマント抽出回路1の一例を示
す。フオルマント抽出回路1はそれぞれ200Hzの
帯域巾を有し通過周波数が互いに異なる多数の帯
域フィルタ群111〜11oと、各帯域フィルタ1
1〜11oの出力信号をデジタル信号に変換する
アナログ/デジタル変換回路12と、各帯域フィ
ルタ111〜11oの出力レベル値からフオルマン
トを検出するマイクロプロセツサよりなる演算回
路13とから構成される。帯域フィルタ111
11oはそれぞれ0〜200Hz、200〜400Hz、400〜
600Hz、……、2200〜2400Hz、と通過周波数帯域
が互いに異なるとともに、全帯域フィルタ111
〜11oによつて音声帯域の全周波数が含まれる
ように設定されている。演算回路13は第1フオ
ルマントF1と第2フオルマントF2とを検出する
とともに、入力音声が変化したかどうかを判定す
る音韻変化信号を出力する。なお、フオルマント
の検出は回路構成によつてハード的に行なつてい
るが、線形予測法などのソフト的な手法を用いて
行なつてもよい。
第3図は制御音声判別回路2の一例を示すもの
であつて、制御音声判別回路2は、音韻変化信号
が入力されるとフオルマントを記憶する第1ベク
トル保持回路22と、音韻変化信号が入力される
と第1ベクトル保持回路22に記憶されていたフ
オルマントを記憶する第2ベクトル保持回路23
と、第1ベクトル保持回路22に記憶されたフオ
ルマントから第2ベクトル保持回路23に記憶さ
れたフオルマントを減算することにより変化ベク
トルを算出する変化ベクトル算出回路24と、任
意の3母音を所定の順序で並べたときの各2母音
間での変化ベクトルの範囲が記憶された記憶部2
5と、変化ベクトル算出回路24の出力値と記憶
部25に記憶された設定値とを比較して変化ベク
トル算出回路24の出力値が記憶部25に格納さ
れた設定範囲内であるときに一致信号を出力する
比較判定回路26と、一致信号が連続して入力さ
れると制御信号を出力する制御信号発生回路27
とから構成される。制御音声判別回路2では音韻
変化信号が制御音声判別回路2に入力されるたび
に入力信号の変化ベクトルが記憶部25に記憶さ
れた設定範囲に属するかどうかが判定される。そ
して入力信号の各音韻間の変化ベクトルが記憶部
25に記憶された制御音声の変化ベクトルの設定
範囲内であると判定されると、比較判定回路26
から一致信号が出力されるのである。なお、制御
音声判別回路2の記憶部25を除く部分に関して
はマイクロプロセツサ20を用いて構成される。
(動作) 以下、動作を説明する。例えば、制御信号を出
力するように設定された制御音声が3母音/
a//o//e/を順に並べて構成されていると
し、記憶部25には/a/から/o/への変化ベ
クトルの範囲として(300±α1Hz、800±α2
Hz)、/o/から/e/への変化ベクトルの範囲
として(120±α3Hz、1200±α4Hz)が設定されて
いるものとする。ここでα1〜α4の値を適宜設定す
ることにより感度が調節される。さて、いま母
音/a//o//e/が第1音声、第2音声、第
3音声として連続して入力されたものとすると、
フオルマント抽出回路1では各音声のF1−F2
面上でのベクトル成分がそれぞれ検出されるとと
もに、母音の変化時点でそれぞれ音韻変化信号が
発生する。制御音声判別回路2では、第1音声が
入力された時点でまず第1音声のベクトル成分を
第1ベクトル保持回路22に記憶する。次に第2
音声が入力され音韻変化信号が得られると、第1
ベクトル保持回路22に記憶されていた第1音声
のベクトル成分が第2ベクトル保持回路23に入
力されるとともに、第1ベクトル保持回路22に
は第2音声のベクトル成分が記憶される。このと
き変化ベクトル算出回路24では第2ベクトル保
持回路23に記憶されたベクトル成分と第1ベク
トル保持回路22に記憶されたベクトル成分との
変化量から変化ベクトルの成分が算出される。記
憶部25には/a/から/o/への変化ベクトル
の成分として(300±α1Hz、800±α2Hz)が記憶さ
れているから、比較判定回路26では変化ベクト
ル算出回路24の出力が記憶部25に記憶された
この設定範囲内にあるかどうかが比較され、変化
ベクトル算出回路24の出力値が記憶部25の設
定範囲内であると判定されると、入力信号が/
a/から/o/に変化したものと判定されるので
ある。次に第3音声が入力されると、第1ベクト
ル保持回路22に記憶されていた第2音声のベク
トル成分が第2ベクトル保持回路23に入力され
るとともに、第3音声のベクトル成分が第1ベク
トル保持回路22に記憶され、変化ベクトル算出
回路24では第2ベクトル保持回路23に記憶さ
れた第2音声から第1ベクトル保持回路22に記
憶された第3音声への変化ベクトルの成分が算出
される。記憶部25には/o/から/e/への変
化ベクトルの成分として(120±α3,1200±α4Hz)
が記憶されているから、比較判定回路26ではこ
の設定範囲と変化ベクトル算出回路24の出力値
とが比較され、変化ベクトル算出回路24の出力
値が記憶部25の設定範囲内であると判定される
と、入力信号が/o/から/e/に変化したこと
を認識するのである。以上のようにして/a/か
ら/o/への変化と/o/から/e/への変化が
連続して検出されると、比較判定回路26では一
致信号を出力し、制御信号発生回路27では一致
信号を受けて制御信号を出力するのである。制御
信号はスイツチ要素3に入力されスイツチ要素3
が開閉されるのである。入力信号が記憶部25に
設定された設定範囲とは異なるときにはスイツチ
要素3はそれまでの状態を保つ。
上述の実施例において連続した3母音を検出し
たときにスイツチ要素3を開閉するようになつて
いたが、3母音に限定されるものではない。また
母音を検出するために第1フオルマントF1と第
2フオルマントF2とをベクトル成分として2次
元空間でのベクトルを用いたが、第3フオルマン
トF3以上の高次フオルマントもベクトル成分と
して用いることにより3次元以上の多次元空間で
のベクトルを用いて母音の判定を行なうようにし
てもよい。さらに、上述の実施例ではフオルマン
ト抽出回路1と制御音声判別回路2とにそれぞれ
マイクロプロセツサを用いた例を示したが、両回
路1,2のマイクロプロセツサを共有化して1つ
にしてもよい。
[考案の効果] 本発明は上述のように、入力音声から少なくと
も第1フオルマントと第2フオルマントとを抽出
するフオルマント抽出回路と、2音以上の連続す
る母音から構成された制御音声の各母音間のフオ
ルマントの変化分が所定の設定範囲内であるとき
に制御信号を出力する制御音声判別回路と、制御
信号により開閉されるスイツチ要素とから構成さ
れているので、音声のうちの母音を特徴づけてい
る優勢な周波数成分であるフオルマントを抽出
し、複数のフオルマントにより形成されたベクト
ル空間における音声ベクトルの移動によりスイツ
チ要素を作動させるかどうかを判別するようにし
た結果、母音のフオルマントの変化のみを検出す
ればよく、計算量が少なくかつ音声の認識を確実
に行なうことができるものであり、実時間での動
作が可能で認識率が高いという利点を有する。ま
た、フオルマントの変化分で音声を認識するか
ら、不特定話者に対して動作可能であるという利
点を有するものである。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロツク図、
第2図は同上に使用するフオルマント抽出回路を
示すブロツク図、第3図は同上に使用する制御音
声判別回路を示すブロツク図、第4図はF1−F2
図の一例を示す動作説明図、第5図は母音の周波
数特性の一例を示す動作説明図、第6図は従来例
を示すブロツク図、第7図は他の従来例を示すブ
ロツク図である。 1はフオルマント抽出回路、2は制御音声判別
回路、3はスイツチ要素である。

Claims (1)

    【特許請求の範囲】
  1. 1 入力音声から少なくとも第1フオルマントと
    第2フオルマントとを抽出するフオルマント抽出
    回路と、2音以上の連続する母音から構成された
    制御音声の各母音間のフオルマントの変化分が所
    定の設定範囲内であるときに制御信号を出力する
    制御音声判別回路と、制御信号により開閉される
    スイツチ要素とから構成されたことを特徴とする
    音声応答スイツチ。
JP60089371A 1985-04-24 1985-04-24 音声応答スイツチ Granted JPS61246796A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60089371A JPS61246796A (ja) 1985-04-24 1985-04-24 音声応答スイツチ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60089371A JPS61246796A (ja) 1985-04-24 1985-04-24 音声応答スイツチ

Publications (2)

Publication Number Publication Date
JPS61246796A JPS61246796A (ja) 1986-11-04
JPH0562757B2 true JPH0562757B2 (ja) 1993-09-09

Family

ID=13968833

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60089371A Granted JPS61246796A (ja) 1985-04-24 1985-04-24 音声応答スイツチ

Country Status (1)

Country Link
JP (1) JPS61246796A (ja)

Also Published As

Publication number Publication date
JPS61246796A (ja) 1986-11-04

Similar Documents

Publication Publication Date Title
US4718096A (en) Speech recognition system
Christiansen et al. Detecting and locating key words in continuous speech using linear predictive coding
JPH06332492A (ja) 音声検出方法および検出装置
GB2346999A (en) Communication device for endpointing speech utterances
Cole et al. Feature-based speaker-independent recognition of isolated English letters
Jaafar et al. Automatic syllables segmentation for frog identification system
JPH0431898A (ja) 音声雑音分離装置
Chou et al. A hybrid neural network based on the duplex model of pitch perception for singing melody extraction
JP2001000007U (ja) 音声認識装置
JPH0562757B2 (ja)
JP2797861B2 (ja) 音声検出方法および音声検出装置
JPS58181099A (ja) 音声識別装置
Nilsson et al. Human whistle detection and frequency estimation
JPS61246800A (ja) 音声応答スイツチ
JPS63186298A (ja) 単語音声認識装置
JPH0774960B2 (ja) テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
CA1216944A (en) Speech recognition system
JP2825272B2 (ja) エレベータ装置
Bach et al. Detecting novel objects in acoustic scenes through classifier incongruence
JPS61246799A (ja) 音声応答スイツチ
JPS61246797A (ja) 音声応答スイツチ
JPH0562758B2 (ja)
JP2989231B2 (ja) 音声認識装置
JPH03200298A (ja) 音声制御装置
JPS5914769B2 (ja) 音声機器

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term