JPH0562757B2

JPH0562757B2 -

Info

Publication number: JPH0562757B2
Application number: JP60089371A
Authority: JP
Inventors: Hiroaki Takeyama; Hitoshi Fukagawa; Kyotaka Takehara; Yasukazu Kinekawa
Original assignee: Matsushita Electric Works Ltd
Current assignee: Panasonic Electric Works Co Ltd
Priority date: 1985-04-24
Filing date: 1985-04-24
Publication date: 1993-09-09
Also published as: JPS61246796A

Description

【発明の詳細な説明】［技術分野］本発明は音声応答スイツチ、さらに詳しくは、
人の音声を認識して作動する音声応答スイツチに
関するものである。

［背景技術］従来より音声応答スイツチとしては、第６図に
示すように、音声に相当する周波数帯域の入力信
号を通過させるフイルタ回路１１と、フイルタ回
路１１の出力レベルを検出するレベル検出回路１
２と、レベル検出回路１２の出力を予め設定され
た参照値と比較しレベル検出回路１２の出力が参
照値以上であるときに制御信号を出力する制御回
路１３と、制御信号により閉成されるスイツチ要
素１４とから構成されており、制御回路１３への
入力レベルが参照値以上であるときにフイルタ回
路１１への入力信号が音声信号であると判断する
ようになつたものが提供されている。

この回路構成においては、特定の周波数帯域の
レベル判定のみで音声であるかどうかを判別して
いるものであるから、フイルタ回路１１を通過で
きる帯域の周波数成分を持ちかつ参照値よりも高
いレベルの入力信号であれば音声ではない雑音で
あつてもスイツチ要素１４が作動することにな
り、誤動作を生じるという問題がある。また音声
が入力されている場合でも、それがスイツチ要素
１４を作動させる目的で発せられた音声であるか
どうかにかかわらずスイツチ要素１４が作動する
から、スイツチ要素１４の作動を希望しないとき
スイツチ要素１４が作動することがあるという不
都合が生じるものである。

このため、第７図に示すように、音声認識装置
１５を用い、記憶部１６に記憶された制御音声と
入力音声とを比較し、両者が一致したときにスイ
ツチ要素３を開閉させるものが考えられている
が、不特定話者を対象とする場合には、音声認識
のための演算処理に長い時間が必要となり実時間
でスイツチ要素１４を制御することが困難である
という問題があり、しかも現在の技術レベルでは
一般に認識率が低く誤動作しやすいという問題が
ある。そして、認識率を高めるには情報量と計算
量が多くなるものであるから一層処理時間が遅れ
るという欠点がある。これに対して特定話者を対
象とする場合には、予め使用者が自分の声を登録
する必要があり、使用までの作業が面倒である。

［発明の目的］本発明は上述の点に鑑みて為されたものであつ
て、その主な目的とするところは、音声のうちの
母音を特徴づけている優勢な周波数成分であるフ
オルマントを抽出し、複数のフオルマントにより
形成されたベクトル空間における音声ベクトルの
移動によりスイツチ要素を作動させるかどうかを
判別するようにして、実時間で動作可能で認識率
が高く、しかも不特定話者用を対象とした音声応
答スイツチを提供することにある。

［発明の開示］第５図は母音のスペクトルの一例を示すもので
あつて、母音を特徴づける優勢な周波数成分、す
なわち、スペクトルのピーク部分の周波数成分が
フオルマントと呼ばれる。母音には普通複数のフ
オルマントが存在し、周波数の低いほうから順に
第１フオルマントF₁、第２フオルマントF₂、第
３図フオルマントF₃、……と呼ばれる。これら
のフオルマントのうち第１フオルマントF₁、と
第２フオルマントF₂との寄与率がもつとも高く、
第１フオルマントF₁と第２フオルマントF₂とを
用いればかなり高い確度で母音を決定できるもの
である。

ここで第１フオルマントF₁を横軸にとり、第
２フオルマントF₂を縦軸にとつたF₁−F₂図上に
日本語の母音である／ａ／／ｉ／／ｕ／／ｅ／／
ｏ／をベクトルとして示すと、各母音は第４図の
破線で示す範囲で表わされる。フオルマントは各
個人によりかなり変動するものであつて、各母音
を表わす範囲はかなりの部分で重複するものであ
るが、一般に同一環境で同一人物の発した５母音
のフオルマントはF₁−F₂図上において略５角形
となり、環境が変化したり、発話者が代わつても
５母音の相対的位置関係、すなわちこの５角形の
形状を保持したままで平行移動することが知られ
ている。したがつて、母音が変化したときの相対
位置、すなわち変化ベクトルは環境や発話者がか
わつても略一定になる。つまり、母音／ａ／の成
分を（800Hz，1800Hz）とし、母音／ｏ／の成分
を（500Hz，1000Hz）とすると、／ａ／から／
ｏ／への変化ベクトルの成分は（−300Hz，−800
Hz）となり、変化ベクトルの成分は環境や発話者
が異なつていても略一定になるのである。しかし
て、本発明においては、複数の母音を入力して母
音の変化ベクトルが検出されるとスイツチ要素が
作動する音声応答スイツチを開示する。なお、以
下の説明においては、第１フオルマントF₁と第
２フオルマントF₂とを使用して音声の認識を行
なつているが、さらに認識率を高めるために、第
３フオルマントF₃を用いてもよい。この場合第
３フオルマントF₃を第３軸としてF₁−F₂−F₃空
間上での各母音のフオルマントを表わすことによ
り、重複部分を形成せずに空間上で各母音のフオ
ルマントを表わすことができるものである。

（実施例）第１図に示すように、入力信号はフオルマント
抽出回路１に入力され第１フオルマントF₁と第
２フオルマントF₂とが抽出される。フオルマン
ト抽出回路１の出力は制御音声判別回路２に入力
され、予め設定された制御音声と一致すると制御
信号が出力されるようになつている。制御音声判
別回路２の出力はスイツチ要素３に入力され、ス
イツチ要素３に制御信号が入力されるとスイツチ
要素３が開閉される。

第２図にフオルマント抽出回路１の一例を示
す。フオルマント抽出回路１はそれぞれ200Hzの
帯域巾を有し通過周波数が互いに異なる多数の帯
域フィルタ群１１₁〜１１_oと、各帯域フィルタ１
１₁〜１１_oの出力信号をデジタル信号に変換する
アナログ／デジタル変換回路１２と、各帯域フィ
ルタ１１₁〜１１_oの出力レベル値からフオルマン
トを検出するマイクロプロセツサよりなる演算回
路１３とから構成される。帯域フィルタ１１₁〜
１１_oはそれぞれ０〜200Hz、200〜400Hz、400〜
600Hz、……、2200〜2400Hz、と通過周波数帯域
が互いに異なるとともに、全帯域フィルタ１１₁
〜１１_oによつて音声帯域の全周波数が含まれる
ように設定されている。演算回路１３は第１フオ
ルマントF₁と第２フオルマントF₂とを検出する
とともに、入力音声が変化したかどうかを判定す
る音韻変化信号を出力する。なお、フオルマント
の検出は回路構成によつてハード的に行なつてい
るが、線形予測法などのソフト的な手法を用いて
行なつてもよい。

第３図は制御音声判別回路２の一例を示すもの
であつて、制御音声判別回路２は、音韻変化信号
が入力されるとフオルマントを記憶する第１ベク
トル保持回路２２と、音韻変化信号が入力される
と第１ベクトル保持回路２２に記憶されていたフ
オルマントを記憶する第２ベクトル保持回路２３
と、第１ベクトル保持回路２２に記憶されたフオ
ルマントから第２ベクトル保持回路２３に記憶さ
れたフオルマントを減算することにより変化ベク
トルを算出する変化ベクトル算出回路２４と、任
意の３母音を所定の順序で並べたときの各２母音
間での変化ベクトルの範囲が記憶された記憶部２
５と、変化ベクトル算出回路２４の出力値と記憶
部２５に記憶された設定値とを比較して変化ベク
トル算出回路２４の出力値が記憶部２５に格納さ
れた設定範囲内であるときに一致信号を出力する
比較判定回路２６と、一致信号が連続して入力さ
れると制御信号を出力する制御信号発生回路２７
とから構成される。制御音声判別回路２では音韻
変化信号が制御音声判別回路２に入力されるたび
に入力信号の変化ベクトルが記憶部２５に記憶さ
れた設定範囲に属するかどうかが判定される。そ
して入力信号の各音韻間の変化ベクトルが記憶部
２５に記憶された制御音声の変化ベクトルの設定
範囲内であると判定されると、比較判定回路２６
から一致信号が出力されるのである。なお、制御
音声判別回路２の記憶部２５を除く部分に関して
はマイクロプロセツサ２０を用いて構成される。

（動作）以下、動作を説明する。例えば、制御信号を出
力するように設定された制御音声が３母音／
ａ／／ｏ／／ｅ／を順に並べて構成されていると
し、記憶部２５には／ａ／から／ｏ／への変化ベ
クトルの範囲として（300±α₁Hz、800±α₂
Hz）、／ｏ／から／ｅ／への変化ベクトルの範囲
として（120±α₃Hz、1200±α₄Hz）が設定されて
いるものとする。ここでα₁〜α₄の値を適宜設定す
ることにより感度が調節される。さて、いま母
音／ａ／／ｏ／／ｅ／が第１音声、第２音声、第
３音声として連続して入力されたものとすると、
フオルマント抽出回路１では各音声のF₁−F₂平
面上でのベクトル成分がそれぞれ検出されるとと
もに、母音の変化時点でそれぞれ音韻変化信号が
発生する。制御音声判別回路２では、第１音声が
入力された時点でまず第１音声のベクトル成分を
第１ベクトル保持回路２２に記憶する。次に第２
音声が入力され音韻変化信号が得られると、第１
ベクトル保持回路２２に記憶されていた第１音声
のベクトル成分が第２ベクトル保持回路２３に入
力されるとともに、第１ベクトル保持回路２２に
は第２音声のベクトル成分が記憶される。このと
き変化ベクトル算出回路２４では第２ベクトル保
持回路２３に記憶されたベクトル成分と第１ベク
トル保持回路２２に記憶されたベクトル成分との
変化量から変化ベクトルの成分が算出される。記
憶部２５には／ａ／から／ｏ／への変化ベクトル
の成分として（300±α₁Hz、800±α₂Hz）が記憶さ
れているから、比較判定回路２６では変化ベクト
ル算出回路２４の出力が記憶部２５に記憶された
この設定範囲内にあるかどうかが比較され、変化
ベクトル算出回路２４の出力値が記憶部２５の設
定範囲内であると判定されると、入力信号が／
ａ／から／ｏ／に変化したものと判定されるので
ある。次に第３音声が入力されると、第１ベクト
ル保持回路２２に記憶されていた第２音声のベク
トル成分が第２ベクトル保持回路２３に入力され
るとともに、第３音声のベクトル成分が第１ベク
トル保持回路２２に記憶され、変化ベクトル算出
回路２４では第２ベクトル保持回路２３に記憶さ
れた第２音声から第１ベクトル保持回路２２に記
憶された第３音声への変化ベクトルの成分が算出
される。記憶部２５には／ｏ／から／ｅ／への変
化ベクトルの成分として（120±α₃，1200±α₄Hz）
が記憶されているから、比較判定回路２６ではこ
の設定範囲と変化ベクトル算出回路２４の出力値
とが比較され、変化ベクトル算出回路２４の出力
値が記憶部２５の設定範囲内であると判定される
と、入力信号が／ｏ／から／ｅ／に変化したこと
を認識するのである。以上のようにして／ａ／か
ら／ｏ／への変化と／ｏ／から／ｅ／への変化が
連続して検出されると、比較判定回路２６では一
致信号を出力し、制御信号発生回路２７では一致
信号を受けて制御信号を出力するのである。制御
信号はスイツチ要素３に入力されスイツチ要素３
が開閉されるのである。入力信号が記憶部２５に
設定された設定範囲とは異なるときにはスイツチ
要素３はそれまでの状態を保つ。

上述の実施例において連続した３母音を検出し
たときにスイツチ要素３を開閉するようになつて
いたが、３母音に限定されるものではない。また
母音を検出するために第１フオルマントF₁と第
２フオルマントF₂とをベクトル成分として２次
元空間でのベクトルを用いたが、第３フオルマン
トF₃以上の高次フオルマントもベクトル成分と
して用いることにより３次元以上の多次元空間で
のベクトルを用いて母音の判定を行なうようにし
てもよい。さらに、上述の実施例ではフオルマン
ト抽出回路１と制御音声判別回路２とにそれぞれ
マイクロプロセツサを用いた例を示したが、両回
路１，２のマイクロプロセツサを共有化して１つ
にしてもよい。

［考案の効果］本発明は上述のように、入力音声から少なくと
も第１フオルマントと第２フオルマントとを抽出
するフオルマント抽出回路と、２音以上の連続す
る母音から構成された制御音声の各母音間のフオ
ルマントの変化分が所定の設定範囲内であるとき
に制御信号を出力する制御音声判別回路と、制御
信号により開閉されるスイツチ要素とから構成さ
れているので、音声のうちの母音を特徴づけてい
る優勢な周波数成分であるフオルマントを抽出
し、複数のフオルマントにより形成されたベクト
ル空間における音声ベクトルの移動によりスイツ
チ要素を作動させるかどうかを判別するようにし
た結果、母音のフオルマントの変化のみを検出す
ればよく、計算量が少なくかつ音声の認識を確実
に行なうことができるものであり、実時間での動
作が可能で認識率が高いという利点を有する。ま
た、フオルマントの変化分で音声を認識するか
ら、不特定話者に対して動作可能であるという利
点を有するものである。

【図面の簡単な説明】

第１図は本発明の一実施例を示すブロツク図、
第２図は同上に使用するフオルマント抽出回路を
示すブロツク図、第３図は同上に使用する制御音
声判別回路を示すブロツク図、第４図はF₁−F₂
図の一例を示す動作説明図、第５図は母音の周波
数特性の一例を示す動作説明図、第６図は従来例
を示すブロツク図、第７図は他の従来例を示すブ
ロツク図である。１はフオルマント抽出回路、２は制御音声判別
回路、３はスイツチ要素である。

Claims

【特許請求の範囲】

１入力音声から少なくとも第１フオルマントと
第２フオルマントとを抽出するフオルマント抽出
回路と、２音以上の連続する母音から構成された
制御音声の各母音間のフオルマントの変化分が所
定の設定範囲内であるときに制御信号を出力する
制御音声判別回路と、制御信号により開閉される
スイツチ要素とから構成されたことを特徴とする
音声応答スイツチ。