JPS61246800A - 音声応答スイツチ - Google Patents

音声応答スイツチ

Info

Publication number
JPS61246800A
JPS61246800A JP8937585A JP8937585A JPS61246800A JP S61246800 A JPS61246800 A JP S61246800A JP 8937585 A JP8937585 A JP 8937585A JP 8937585 A JP8937585 A JP 8937585A JP S61246800 A JPS61246800 A JP S61246800A
Authority
JP
Japan
Prior art keywords
circuit
input
control
vector
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8937585A
Other languages
English (en)
Inventor
博昭 竹山
仁 深川
清隆 竹原
安一 杵川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP8937585A priority Critical patent/JPS61246800A/ja
Publication of JPS61246800A publication Critical patent/JPS61246800A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [技術分野J 本発明は音声応答スイッチ、さらに詳しくは、人の音声
を認識して作動する音声応答スイッチに関するものであ
る。
[背景技術1 従来上り音声応答スイッチとしては、第7図に示すよう
に、音声に相当する周波数帯域の入力信号を通過させる
フィルタ回路11と、フィルタ回路11の出力レベルを
検出するレベル検出回路12と、レベル検出回路12の
出力を予め設定された参照値と比較しレベル検出回路1
2の出力が参照値以上であるときに制御信号を出力する
制御回路13と、制御信号により開閉されるスイッチ要
素14とから構成されており、制御回路13への入力レ
ベルが参照値以上であるときにフィルタ回路11への入
力信号が音声信号であると判断するものが提供されてい
る。
この回路構成においては、特定の周波数帯域のレベル判
定のみで音声であるかどうかを判別しているものである
から、フィルタ回路11を通過できる帯域の周波数成分
を持ちかつ参照値よりも高いレベルの入力信号であれば
音声ではない雑音であってもスイッチ要素14が作動す
ることになり、誤動作を生じるという問題がある。また
音声が入力されている場合でも、それがスイッチ要素1
4を作動させる目的で発せられた音声であるかどうかに
かかわらずスイッチ要素14が作動するから、スイッチ
要素14の作動を希望しないときスイッチ要素14が作
動することがあるという不都合が生じるものである。
このため、第8図に示すように、音声認識装置15を眉
い、記憶部16に予め記憶された制御音声と入力信号と
を比較し、両者が一致したときにスイッチ要素3を開閉
させるものが考えられているが、不特定話者を対象とす
る場合には、音声認識のための演算処理に長い時間が必
要となり実時間でスイッチ要素14を制御することが困
難であるという問題があり、しかも現在の技術レベルで
は一般に認識率が低く誤動作しやすいという問題がある
。そして、認識率を高めるには情報量と計算量が多(な
るものであるから−要処理時間が遅れるという欠点があ
る。これに対して特定話者を対象とする場合には、使用
前に使用者自身の声を登録する必要があり、使用までの
作業が面倒である。*た、音声認識装置15を用いると
制御音声が入力するかどうかにかかわらず、入力信号が
音声であるかどうかを常時判定させる必要があり、電力
消費が大きくなるという問題があり、また、入力レベル
が所定値以上のときにのみ動作させるようにすると、一
般に入力レベルの小さい子音では動作しないことがあっ
た。
[発明の目的1 本発明は上述の点に鑑みて為されたものであって、その
主な目的とするところは、音声のうちの母音を特徴づけ
ている優勢な周波数成分である複数のフォルマントを抽
出し、各フォルマントを軸とするベクトル空間(または
平面)におけるベクトルの移動によりスイッチ要素を作
動させるかどうかを判別するようにしたことにより、実
時間で動作可能で認識率が高く、しかも不特定話者を対
象として使用できる音声応答スイッチを提供することに
あり、他の目的とするところは、入力信号が所定レベル
以上であるときのみに入力信号が制御音声であるかどう
かを判断するようにし、しかも音声入力があれば必ず制
御音声かどうかの判定が行なわれるようにした音声応答
スイッチを提供することにある。
[発明の開示] 第5図は母音のスペクトルの一例を示すものであって、
母音を特徴づける優勢な周波数成分、すなわち、スペク
トルのピーク部分の周波数成分がフォルマントと呼ばれ
る。一般に母音には複数の7tルマントが存在し、周波
数の低いほうから順にdi7オルマン)F、、12フォ
ルマントF2、第37tルマン)F、、・旧・・と呼ば
れる。これらのフォルマントのウチIJIi1フォルマ
ントFIと第2フォルマントF2との寄与率がもっとも
高く、第17オルマン) F + トtl’−27オル
マン)F、とを用いればかなり高い確度で母音を決定で
きるものである。
ここで第1フォルマントF、を横軸にとり、第2フォル
マントF1を縦紬にとったF、−F2ベクトル平面上で
日本語の母音/a// i//u//e//o/を示す
と、各母音は第4図の破線で示す範囲で表わされる。フ
ォルマントは各個人の声道長などによりかなり変動する
ものであって、F、−F、平面上である程度の広がりを
もって表わされるものであり、各母音を表わす範囲同士
がかなりの部分で重複するものであるが、一般に同一環
境で同一人物の発した5母音のフォルマントはF I−
F 2平面上において略5角形となり、環境が変化した
り、発話者が変わっても5母音の相対的位置関係、すな
わちこの5角形の形状は保持された*まで平行移動する
ことが知られでいる。したがって、母音が変化したとき
の相対位置、すなわち変化ベクトルは環境や発話者がか
わっても略一定になる。つまり、母音/a/のベクトル
成分を(800Hz、1800H2)とし母音/o/の
ベクトル成分を(500Hz、 1000 Hz)とす
ると、/a/から/o/への変化ベクトルの成分は(−
300Hz、  800Hz)となり、変化ベクトルの
成分は環境や発話者が異なっていても略一定になるので
ある。しかして、本発明においては、複数の母音を連続
させて制御音声を構成し、各母音間での変化ベクトルを
監視することによって入力信号が予め設定された制御音
声と一致するかどうかを判定し、入力信号が制御音声と
一致するとスイッチ要素を開閉する音声応答スイッチを
開示する。なお、以下の説明においては、第1フォルマ
ントF、と第27オルマン) F z ト* 使用して
音声の認識を行なっているが、さらに認識率を高めるた
めに、第37オルマン)F3をベクトルの第3成分とし
て用いてもよく、一般にF1F2F3ベクトル空間上で
各母音を表わせば、各母音間の重複部分が除去されるも
のであるから、検出確度が一層向上するものである。
(実施例) 第1図に示すように、音声信号はフォルマント抽出回路
1に入力され11フォルマントF1と第27オルマン)
F2とが抽出される。フォルマント抽出回路1の出力は
制御音声判別回路2に入力され、入力信号が予め設定さ
れた制御音声と一致したと判断されると制御信号が出力
されるようになっている。制御音声判別回路2の出力は
スイッチ要素3に入力され、スイッチ要素3に制御信号
が入力されるとスイッチ要素3が開閉される。フォルマ
ント抽出回路1への入力部には第6図に示すようにレベ
ル検出回路4と入力制御回路5とが設けられる。レベル
検出回路4はマイクロ7オン6から入力され増巾回路7
によって増巾された音声信号を整流平滑化する整流平滑
回路41と、整流平滑回路41の出力電圧と分圧抵抗4
2,43に回路41の出力電圧が参照電圧以上であると
出力を“H“とするコンパレータ回路44とから構成さ
れる。したがって1.入力された音声信号のレベルが所
定値以上であるとレベル検出回路4の出力は“H“とな
るのである、入力制御回路5は増巾回路7とフォルマン
ト抽出回路1との間に挿入されたアナログスイッチ52
と、アナログスイッチ52のデート端子に出力端が接続
されレベル検出回路4の出力によってトリ〃がかけられ
る729574回路51とから構成される。ワンシ、ッ
ト回路51はレベル検出回路4の出力が”H“となると
、その立ち上がりから所定時間1Jのパルスを出力する
のであり、このパルスが出力されている期間においてア
ナログスイッチ52をオン状態とするようになっている
。しかるに、マイクロ7オン6から入力された音声が所
定値以上のレベルであれば、その音声が入力されてから
所定時間だけアナログスイッチ52がオン状態となり、
音声信号をフォルマント抽出回路1に入力するのである
。ここで、アナログスイッチ52はフォルマント抽出回
路1の入力部にのみ設けているが、フォルマント抽出回
路1や制御音声判定回路3の給電部にもスイッチング素
子を設けることにより、制御音声が入力されてから後段
が作動するようにすれば、消費電力を押さえることがで
終るものである。
第2図にフォルマント抽出回路1の一例を示す。
フォルマント抽出回路1はそれぞれ200 Hzの帯域
中を有し通過周波数が互いに異なる多数の帯域フィルタ
11.〜11nよりなる帯域フィルタ群と、各帯域フィ
ルタ111〜11nの出力信号をデジタル信号に変換す
るアナログ/デジタル変換回路12と、各帯域フィルタ
111〜11nの出力レベル値から7?ルマントを検出
するマイクロプロセッサ等からなる演算回路13とから
構成される。
帯域フィルタ11.〜11nはそれぞれ0〜200Hz
、200−400Hz、400〜600Hz。
・・・・・・、2200〜2400Hz、・・・・・・
と通過周波数帯域が互いに異なるとともに、全帯域フィ
ルタ111〜11nを合わせると音声帯域の全周波数が
通過で終るように設定されている。演4!x、g4路1
3は第1フォルマントF、、!−第2フォルマントP、
とを検出するとともに、入力音声が変化したがどうかを
判定する音韻変化信号を出力する。なお、フォルマント
の抽出は回路構成によってハード的に行なっているが、
線形予測法などのソフト的な手法を用いて行なってもよ
い。
第3図は制御音声判別回路2の一例を示すものであって
、制御音声判別回路2は、音韻変化信号が入力されると
第1フォルマントF、と第2フォルマントF、とを成分
とするベクトルを記憶する第1ベクトル保持回路22と
、音韻変化信号が入力されると第1ベクトル保持回路2
2に記憶されていたベクトルを記憶する第2ベクトル保
持回路23と、第1ベクトル保持回路22に記憶された
ベクトルから第2ベクトル保持回路23に記憶されたベ
クトルを減算することにより変化ベクトルを算出する変
化ベクトル算出回路24と、スイッチ要素3を駆動すべ
き制御音声における隣接した音韻間の変化ベクトルが所
定の順序で記憶された記憶部25と、変化ベクトル算出
回路24の出力値と記憶部25に記憶された設定値とを
比較して入力された音声信号の変化ベクトルが記憶部2
5に記憶された変化ベクトルの設定範囲内であるときに
一致信号を出力する比較判定回路26と、一致信号が入
力されるとスイッチ要素3を開閉するための制御信号を
出力する制御信号発生回路27とから構成される。記憶
部25においては設定された制御音声の隣接する音韻間
の変化ベクトルがある程度の誤差を許容する形で記憶さ
れている。
すなわち、個人差や環境の差による変化ベク)ルの誤差
を考慮して変化ベクトルの許容誤差範囲が設定されてい
るのであって、例えば、/a/から/o/への変化ベク
トルの範囲として(300±α1 Hz 5800±α
2 Hz )が設定されているのであり、al、a2の
値を適宜設定することにより感度が調節されるようにな
っている。しかして、制御音声判別回路2では音韻変化
信号が制御音声判別回路2に入力されるたびに入力され
た音声信号の変化ベクトルが記憶部25に記憶された変
化ベクトルの許容誤差範囲内であるかどうかが判定され
、入力された音声信号の各音韻間の変化ベクトルが記憶
部25に記憶された制御音声の変化ベクトルの設定範囲
内であると判定されると、比較判定回路26から一致信
号が出力されるのである。なお、制御音声判別回路2の
記憶部25を除く部分に関してはマイクロプロセッサ2
0を用いて構成することができる。
(動作) 以下、動作を説明する。制御音声は始音を/a/または
/o/とじており、複数の母音を連結して構成されてい
る。これは、母音のなかでも/&/と/o/とは他の母
音に比較してレベルが高いからであって、制御音声を入
力するときに第1音声のレベルを十分に大きくとり、第
1音声で所定時間アナログスイッ″チ52がオン状態と
なるようにし、制御音声が頭切れすることなく完全に通
過で塾るようにしているのである。ここでワンシ鱈ット
回路51で設定されるパルスの時間中は制御音声が十分
−に通過できる程度に選定される。マイクロフォン5か
らの音声入力が7すルマント抽出回路1に入力されると
、フォルマント抽出回路1では各入力信号のPIF2平
面上でのベクトル成分をそれぞれ抽出するとともに、音
韻の変化時点でそれぞれ音韻変化信号を発生する。制御
音声判別回路2では、第1音声が入力された時点でまず
第1音声のベクトル成分を第1ベクトル保持回路22に
記憶する。次に第2音声が入力され音韻変化信号が得ら
れると、第1ベクトル保持回路22に記憶されていた@
i音声のベクトル成分が第2ベクトル保持回路23に入
力されるとともに、第1ベクトル保持回路22には第2
音声のベクトル成分が記憶される。このとき変化ベクト
ル算出回路24では第2ベクトル保持回路23に記憶さ
れたベクトル成分と第1ベクトル保持回路22に記憶さ
れたベクトル成分との変化量から変化ベクトルの成分が
算出される。ここで記憶部25に記憶された設定範囲と
変化ベクトル算出回路24の出力値としての変化ベクト
ルの成分とが比較され、変化ベクトルが記憶部25に記
憶された設定範囲内であるかどうかが判断される0次に
第3音声が入力されると、第1ベクトル保持回路22に
記憶されていた第2音声のベクトル成分が第2ベクトル
保持回路23に入力されるとともに、第3音声のベクト
ル成分が第1ベクトル保持回路22に記憶され、変化ベ
クトル算出回路24では12ベクトル保持回路23に記
憶された第2音声から!@1ベクトル保持回路22に記
憶された第3音声への変化ベクトルの成分が算出される
。この変化ベクトルは比較判定回路26において記憶部
25に記憶された2番目の変化ベクトルの設定範囲と比
較され、変化ベクトル算出回路24の出力値が記憶部2
5に記憶された変化ベクトルの設定範囲内であるかどう
かが判断される0以上のようにして入力信号が停止する
まで同様の動作を繰り返し、入力されるすべての音韻に
対する音声信号の変化ベクトルが記憶部25に記憶され
た設定範囲内であるときに、判定回路26から一致信号
が出力され、制御信号発生回路27では一致信号を受け
て制御信号を出力するのである。制御信号はスイッチ要
素3に入力されスイッチ要素3が開閉される。入力信号
が記憶部25に設定された設定範囲とは異なるときにス
イッチ要素3が以前の状態を保つのは言うまでもない。
制御音声は2音以上の連続する母音から構成されており
、例えば/awoke/となっでいる。この場合に記憶
部25には/a/から/o/、/o/から/e/への変
化ベクトルとしてそれぞれ(300±α、Hz、800
±ff、Hz)、(120±’*Hz*1200±α4
Hz)の値が記憶される。ここでa、〜a4は適宜設定
され、その設定値により音声の認識率が調節されるので
ある。
上述の実施例において3母音を検出したときにスイッチ
要素3を開閉するようにしていたが、3“母音に限定さ
れるものではない、*た母音を検出するために第17オ
ルマン)F+と第27tルマントF、とをベクトル成分
として2次元空間でのベクトルを用いたが、第37オル
マン)Fs以上の高次7tルマントもベクトル成分とし
て用いることにより3*元以上の多次元空間でのベクト
ルを用いて母音の判定を行なうようにしてもよい。
さらに、上述の実施例ではフォルマント抽出回路1と制
御音声判別回路2とにそれぞれマイク四プロセッサを用
いた例を示したが、両回路1,2のマイクロプロセッサ
を共有化して1つにしてもよい。
[発明の効果1 本発明は上述のように、入力される音声信号の入力レベ
ルが所定値以上であるかどうかを検出するレベル検出回
路と、音声信号の入力レベルが所定値以上となると所定
時間だけ音声信号を通過可能とする入力制御回路と、入
力制御回路を通過した音声信号から少なくとも第1フォ
ルマントと第2フォルマントとを抽出するフォルマント
抽出回路と・連続する母音から構成された制御音声の各
母音間のフォルマントの変化が所定の順序でありかつ変
化量が所定範囲内であるときに制御信号を出力する制御
音声判別回路と、制御信号により開閉されるスイッチ要
素とを具備し、制御音声は母音へ/と/o/どのうちの
いずれか一方を始音としているので、音声のうちの母音
を特徴づけている優勢な周波数成分であるフォルマント
を抽出し、複数のフォルマントにより形成されたベクト
ル空間における音声ベクトルの移動によりスイッチ要素
を作動させるかどうかを判別するようにした結果、母音
のフォルマントの変化分のみを検出すれば不特定話者に
対して音声の認識が行なえるものであり、計算量が少な
くかつ音声の認識率が高いものであり、実時間での動作
が可能であるという利点を有する。また、入力される音
声信号の入力レベルが所定値以上であるかどうかを検出
するレベル検出回路と、音声信号の入力レベルが所定値
以上となると所定時間だけ音声信号を通過可能とする入
力制御回路とを備えているので、入力信号のレベルが所
定値以上のときにのみフォルマント抽出回路以降の回路
に音声信号が入力されるのであり、レベルの小さい雑音
による誤動作が防止できるという利点がある。さらに、
制御音声の始音を振幅レベルの大きい/a/と/o/と
のうちのいずれか一方としているので、レベル検出回路
の設定レベルを比較的大きく設定することができるもの
であり、雑音によって動作することが防止できるととも
に、始音で動作せずに制御音声に頭切れが生じることも
なく、確実な動作が行なえるものである。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、#I12
図は同上に使用するフォルマント抽出回路を示すブロッ
ク図、第3図は同上に使用する制御音声判別回路を示す
ブロック図、第4図はF + −F 2図の一例を示す
動作説明図、第5図は母音の周波数特性の一例を示す動
作説明図、第6図は同上に使用するレベル検出回路と入
力制御回路とを示すブロック図、第7図は従来例を示す
ブロック図、第8図は他の従来例を示すブロック図であ
る。 1はフォルマント抽出回路、2は制御音声判別回路、3
はスイッチ要素、4はレベル検出回路、5は入力制御回
路である。 代理人 弁理士 石 1)長 七 第1図 第2図 第611

Claims (1)

    【特許請求の範囲】
  1. (1)入力される音声信号の入力レベルが所定値以上で
    あるかどうかを検出するレベル検出回路と、音声信号の
    入力レベルが所定値以上となると所定時間だけ音声信号
    を通過可能とする入力制御回路と、入力制御回路を通過
    した音声信号から少なくとも第1フォルマントと第2フ
    ォルマントとを抽出するフォルマント抽出回路と、連続
    する母音から構成された制御音声の各母音間のフォルマ
    ントの変化が所定の順序でありかつ変化量が所定範囲内
    であるときに制御信号を出力する制御音声判別回路と、
    制御信号により開閉されるスイッチ要素とを具備し、制
    御音声は母音/a/と/o/とのうちのいずれか一方を
    始音とすることを特徴とする音声応答スイッチ。
JP8937585A 1985-04-24 1985-04-24 音声応答スイツチ Pending JPS61246800A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8937585A JPS61246800A (ja) 1985-04-24 1985-04-24 音声応答スイツチ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8937585A JPS61246800A (ja) 1985-04-24 1985-04-24 音声応答スイツチ

Publications (1)

Publication Number Publication Date
JPS61246800A true JPS61246800A (ja) 1986-11-04

Family

ID=13968937

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8937585A Pending JPS61246800A (ja) 1985-04-24 1985-04-24 音声応答スイツチ

Country Status (1)

Country Link
JP (1) JPS61246800A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0297998A (ja) * 1988-10-05 1990-04-10 Sekisui Chem Co Ltd 音声判定方式
JPH02205899A (ja) * 1989-02-03 1990-08-15 Sekisui Chem Co Ltd 音声判定方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0297998A (ja) * 1988-10-05 1990-04-10 Sekisui Chem Co Ltd 音声判定方式
JPH02205899A (ja) * 1989-02-03 1990-08-15 Sekisui Chem Co Ltd 音声判定方式

Similar Documents

Publication Publication Date Title
JP3180655B2 (ja) パターンマッチングによる単語音声認識方法及びその方法を実施する装置
JPS6147440B2 (ja)
US4718096A (en) Speech recognition system
Ying et al. A probabilistic approach to AMDF pitch detection
JPS60200300A (ja) 音声の始端・終端検出装置
JPS61246800A (ja) 音声応答スイツチ
JP3523382B2 (ja) 音声認識装置及び音声認識方法
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
CA1216944A (en) Speech recognition system
JPS61246797A (ja) 音声応答スイツチ
JPS60129796A (ja) 音声入力装置
JPS61246796A (ja) 音声応答スイツチ
JPS61246799A (ja) 音声応答スイツチ
KR100246617B1 (ko) 연속 피치 정보를 이용한 음성 검출 방법
JP4595124B2 (ja) 音声信号と非音声信号の判別装置及び方法
JPH05210397A (ja) 音声認識装置
JPS59149400A (ja) 音声入力装置
JPS61260299A (ja) 音声認識装置
JPH0562758B2 (ja)
JPS6370298A (ja) 促音認識装置
JPH0343639B2 (ja)
JPS63110495A (ja) 音声入力装置
JPH0640274B2 (ja) 音声認識装置
JPH0316038B2 (ja)
JPS61116400A (ja) 音声情報処理装置