JPH0562758B2 - - Google Patents

Info

Publication number
JPH0562758B2
JPH0562758B2 JP60089373A JP8937385A JPH0562758B2 JP H0562758 B2 JPH0562758 B2 JP H0562758B2 JP 60089373 A JP60089373 A JP 60089373A JP 8937385 A JP8937385 A JP 8937385A JP H0562758 B2 JPH0562758 B2 JP H0562758B2
Authority
JP
Japan
Prior art keywords
circuit
vector
voice
input
formant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60089373A
Other languages
English (en)
Other versions
JPS61246798A (ja
Inventor
Hiroaki Takeyama
Hitoshi Fukagawa
Kyotaka Takehara
Yasukazu Kinekawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP60089373A priority Critical patent/JPS61246798A/ja
Publication of JPS61246798A publication Critical patent/JPS61246798A/ja
Publication of JPH0562758B2 publication Critical patent/JPH0562758B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Electronic Switches (AREA)

Description

【発明の詳細な説明】 [技術分野] 本発明は音声応答スイツチ、さらに詳しくは、
人の音声を認識して作動する音声応答スイツチに
関するものである。
[背景技術] 従来より音声応答スイツチとしては、第8図に
示すように、音声に相当する周波数帯域の入力信
号を通過させるフイルタ回路11と、フイルタ回
路11の出力レベルを検出するレベル検出回路1
2と、レベル検出回路12の出力を予め設定され
た参照値と比較しレベル検出回路12の出力が参
照値以上であるときに制御信号を出力する制御回
路13と、制御信号により開閉されるスイツチ要
素14とから構成されており、制御回路13への
入力レベルが参照値以上であるときにフイルタ回
路11への入力信号が音声信号であると判断する
ものが提供されている。
この回路構成においては、特定の周波数帯域の
レベル判定のみで音声であるかどうかを判別して
いるものであるから、フイルタ回路11を通過で
きる帯域の周波数成分を持ちかつ参照値よりも高
いレベルの入力信号であれば音声ではない雑音で
あつてもスイツチ要素14が作動することにな
り、誤動作を生じるという問題がある。また音声
が入力されている場合でも、それがスイツチ要素
14を作動させる目的で発せられた音声であるか
どうかにかかわらずスイツチ要素14が作動する
から、スイツチ要素14の作動を希望しないとき
スイツチ要素14が作動することがあるという不
都合が生じるものである。
このため、第9図に示すように、音声認識装置
15を用い、記憶部16に予め記憶された制御音
声と入力音声とを比較し、両者が一致したときに
スイツチ要素3を開閉させるものが考えられてい
るが、不特定話者を対象とする場合には、音声認
識のための演算処理に長い時間が必要となり実時
間でスイツチ要素14を制御することが困難であ
るという問題があり、しかも現在の技術レベルで
は一般に認識率が低く誤動作しやすいという問題
がある。そして、認識率を高めるには情報量と計
算量が多くなるものであるから一層処理時間が遅
れるという欠点がある。これに対して特定話者を
対象とする場合には、使用前に使用者自身の声を
登録する必要があり、使用までの作業が面倒であ
る。また、会話のように音声を連続して発生する
場合に、発音器官が滑らかに運動して調音される
ものであるから、隣接する音素間において調音結
合が生じ、この調音結合により音素が変化するこ
とがある。つまり、/i,a,i/と発音すると
きに発音器官は/i/の発音と/a/の発音との
中間音である/e/の発音に対応した位置を通過
するものであるから、通常の会話程度の速度で発
音すると、/i,e,i/に近い音声となり、音
声認識装置15では誤認が生じるものである。
[発明の目的] 本発明は上述の点に鑑みて為されたものであつ
て、その主な目的とするところは、音声のうちの
母音を特徴づけている優勢な周波数成分である複
数のフオルマントを抽出し、各フオルマントを軸
とするベクトル空間(または平面)におけるベク
トルの移動によりスイツチ要素を作動させるかど
うかを判別するようにしたことにより、実時間で
動作可能で認識率が高く、しかも不特定話者を対
象として使用できる音声応答スイツチを提供する
ことにあり、他の目的とするところは、入力する
音声の発生タイミングを指定することにより、音
素間における調音の結合を防止して入力音声の誤
認識が生じないようにした音声応答スイツチを提
供することにある。
[発明の開示] 第5図は母音のスペクトルの一例を示すもので
あつて、母音を特徴づける優秀な周波数成分、す
なわち、スペクトルのピーク部分の周波数成分が
フオルマントと呼ばれる。一般に母音には複数の
フオルマントが存在し、周波数の低いほうから順
に第1フオルマントF1、第2フオルマントF2
第3フオルマントF3、……と呼ばれる。これら
のフオルマントのうち第1フオルマントF1と第
2フオルマントF2との寄与率がもつとも高く、
第1フオルマントF1と第2フオルマントF2とを
用いればかなり高い確度で母音を決定できるもの
である。
ここで第1フオルマントF1を横軸にとり、第
2フオルマントF2を縦軸にとつたF1−F2ベクト
ル平面上で日本語の母音/a//i/u//
e//o/を示すと、各母音は第4図の破線で示
す範囲で表わされる。フオルマントは各個人の声
道長などによりかなり変動するものであつて、
F1−F2平面上である程度の広がりをもつて表わ
されるものであり、各母音を表わす範囲同士がか
なりの部分で重複するものであるが、一般に同一
環境で同一人物の発した5母音のフオルマントは
F1−F2平面上において略5角形となり、環境が
変化したり、発話者が変わつても5母音の相対的
位置関係、すなわちこの5角形の形状は保持され
たままで平行移動することが知られている。した
がつて、母音が変化したときの相対位置、すなわ
ち変化ベクトルは環境や発話者がかわつても略一
定になる。つまり、母音/a/のベクトル成分を
(800Hz,1800Hz)とし母音/o/のベクトル成分
を(500Hz,1000Hz)とすると、/a/から/
o/への変化ベクトルの成分は(−300Hz,−800
Hz)となり、変化ベクトルの成分は環境や発話者
が異なつていても略一定になるのである。しかし
て、本発明においては、複数の母音を連続させて
制御音声を構成し、各音間での変化ベクトルを監
視することによつえ入力信号が予め設定された制
御音声と一致するかどうかを判定し、入力信号が
制御音声と一致するとスイツチ要素を開閉する音
声応答スイツチを開示する。なお、以下の説明に
おいては、第1フオルマントF1と第2フオルマ
ントF2とを使用して音声の認識を行なつている
が、さらに認識率を高めるために、第3フオルマ
ントF3をベクトルの第3成分として用いてもよ
く、一般にF1−F2−F3ベクトル空間上で各母音
を表わせば、各母音間の重複部分が除去されるも
のであるから、検出確度が一層向上するものであ
る。
(実施例) 第1図に示すように、音声信号はフオルマント
抽出回路1に入力され第1フオルマントF1と第
2フオルマントF2とが抽出される。フオルマン
ト抽出回路1の出力は制御音声判別回路2に入力
され、入力信号が予め設定された制御音声と一致
したと判断されると制御信号が出力されるように
なつている。制御音声判別回路2の出力はスイツ
チ要素3に入力され、スイツチ要素3に制御信号
が入力されるとスイツチ要素3が開閉される。フ
オルマント抽出回路1への入力部には第6図に示
すようなタイミング指示手段としてのタイミング
設定回路4が設けられている。タイミング設定回
路4はマイクロフオン5より入力される音声の発
生タイミングを設定する発振回路41と、マイク
ロフオン5とフオルマント抽出回路2との間に挿
入され発振回路41の出力に同期して開閉される
スイツチ回路42と、発振回路41の出力に同期
して点滅する発光ダイオード43を備えた点滅回
路44とから構成される。ここで発光ダイオード
43は発振回路41の出力に対応して点滅するも
のであり、発光ダイオード43が点灯すると同時
にスイツチ回路42が閉成し、第7図bに示すよ
うに発光ダイオード43が次に点灯するまでの所
定の期間スイツチ回路42は閉成した状態に保た
れるのである。
第2図にフオルマント抽出回路1の一例を示
す。フオルマント抽出回路1はそれぞれ200Hzの
帯域巾を有し通過周波数が互いに異なる多数の帯
域フィルタ群111〜11oよりなる帯域フィルタ
群と、各帯域フィルタ111〜11oの出力信号を
デジタル信号に変換するアナログ/デジタル変換
回路12と、各帯域フィルタ111〜11oの出力
レベル値からフオルマントを検出するマイクロプ
ロセツサ等からなる演算回路13とから構成され
る。帯域フィルタ111〜11oはそれぞれ0〜
200Hz、200〜400Hz、400〜600Hz、……、2200〜
2400Hz、……と通過周波数帯域が互いに異なると
ともに、全帯域フィルタ111〜11oを合わせる
と音声帯域の全周波数が通過できるように設定さ
れている。演算回路13は第1フオルマントF1
と第2フオルマントF2とを検出するとともに、
入力音声が変化したかどうかを判定する音韻変化
信号を出力する。なお、フオルマントの抽出は回
路構成によつてハード的に行なつているが、線形
予測法などのソフト的な手法を用いて行なつても
よい。
第3図は制御音声判別回路2の一例を示すもの
であつて、制御音声判別回路2は、音韻変化信号
が入力されると第1フオルマントF1と第2フオ
ルマントF2とを成分とするベクトルを記憶する
第1ベクトル保持回路22と、音韻変化信号が入
力されると第1ベクトル保持回路22に記憶され
ていたベクトルを記憶する第2ベクトル保持回路
23と、第1ベクトル保持回路22に記憶された
ベクトルから第2ベクトル保持回路23に記憶さ
れたベクトルを減算することにより変化ベクトル
を算出する変化ベクトル算出回路24と、スイツ
チ要素3を駆動すべき制御音声における隣接した
音韻間の変化ベクトルが所定の順序で記憶された
記憶部25と、変化ベクトル算出回路24の出力
値と記憶部25に記憶された設定値とを比較して
入力された音声信号の変化ベクトルが記憶部25
に記憶された変化ベクトルの設定範囲内であると
きに一致信号を出力する比較判定回路26と、一
致信号が入力されるとスイツチ要素3を開閉する
ための制御信号を出力する制御信号発生回路27
とから構成される。記憶部25においては設定さ
れた制御音声の隣接する音韻間の変化ベクトルが
ある程度の誤差を許容する形で記憶されている。
すなわち、個人差や環境の差によつ変化ベクトル
の誤差を考慮して変化ベクトルの許容誤差範囲が
設定されているのであつて、例えば、/a/か
ら/o/への変化ベクトルの範囲として(300±
α1Hz、800±α2Hz)が設定されているのであり、
α1、α2の値を適宜設定することにより感度が調節
されるようになつている。しかして、制御音声判
別回路2では音韻変化信号が制御音声判別回路2
に入力されるたびに入力された音声信号の変化ベ
クトルが記憶部25に記憶された変化ベクトルの
許容誤差範囲内であるかどうかが判定され、入力
された音声信号の各音韻間の変化ベクトルが記憶
部25に記憶された制御音声の変化ベクトルの設
定範囲内であると判定されると、比較判定回路2
6から一致信号が出力されるのである。なお、制
御音声判別回路2の記憶部25を除く部分に関し
てはマイクロプロセツサ20を用いて構成するこ
とができる。
(動作) 以下、動作を説明する。まずスイツチ要素3を
開閉させるには、制御音声をマイクロフオン5を
通じて入力することが必要であつて、制御音声を
入力するにあたつては、タイミング設定回路4の
発光ダイオード43の点滅に合わせて発音を行な
うようにする。これによつて、各音素を句切つて
発音することができ、調音結合が生じないのであ
る。マイクロフオン5からの音声入力がフオルマ
ント抽出回路1に入力されると、フオルマント抽
出回路1では各入力信号のF1−F2平面上でのベ
クトル成分をそれぞれ抽出するとともに、音韻の
変化時点でそれぞれ音韻変化信号を発生する。制
御音声判別回路2では、第1音声が入力された時
点でまず第1音声のベクトル成分を第1ベクトル
保持回路22に記憶する。次に第2音声が入力さ
れ音韻変化信号が得られると、第1ベクトル保持
回路22に記憶されていた第1音声のベクトル成
分が第2ベクトル保持回路23に入力されるとと
もに、第1ベクトル保持回路22には第2音声の
ベクトル成分が記憶される。このとき変化ベクト
ル算出回路24では第2ベクトル保持回路23に
記憶されたベクトル成分と第1ベクトル保持回路
22に記憶されたベクトル成分との変化量から変
化ベクトルの成分が算出される。ここで記憶部2
5に記憶された設定範囲と変化ベクトル算出回路
24の出力値としての変化ベクトルの成分とが比
較され、変化ベクトルが記憶部25に記憶された
設定範囲内であるかどうかが判断される。次に第
3音声が入力されると、第1ベクトル保持回路2
2に記憶されていた第2音声のベクトル成分が第
2ベクトル保持回路23に入力されるとともに、
第3音声のベクトル成分が第1ベクトル保持回路
22に記憶され、変化ベクトル算出回路24では
第2ベクトル保持回路23に記憶された第2音声
から第1ベクトル保持回路22に記憶された第3
音声への変化ベクトルの成分が算出される。この
変化ベクトルは比較判定回路26において記憶部
25に記憶された2番目の変化ベクトルの設定範
囲と比較され、変化ベクトル算出回路24の出力
値が記憶部25に記憶された変化ベクトルの設定
範囲内であるかどうかが判断される。以上のよう
にして入力信号が停止するまで同様の動作を繰返
し、入力されるすべての音韻に対する音声信号の
変化ベクトルが記憶部25に記憶された設定範囲
内であるときに、判定回路26から一致信号が出
力され、制御信号発生回路27では一致信号を受
けて制御信号を出力するのである。制御信号はス
イツチ要素3に入力されスイツチ要素3が開閉さ
れる。入力信号が記憶部25に設定された設定範
囲とは異なるときにスイツチ要素3が以前の状態
を保つのは言うまでもない。
制御音声は2音以上の連続する母音から構成さ
れており、例えば/a,o,e/となつている。
この場合に記憶部25には/a/から/o/、/
o/から/e/への変化ベクトルとしてそれぞれ
(300±a1Hz、800±a2Hz)、(120±a3Hz、1200±a4
Hz)の値が記憶される。ここでa1〜a4は適宜設定
され、その設定値により音声の認識率が調節され
るものである。
上述の実施例において3母音を検出したときにス
イツチ要素3を開閉するようにしていたが、3母
音に限定されるものではない。また母音を検出す
るために第1フオルマントF1と第2フオルマン
トF2とをベクトル成分として2次元空間でのベ
クトルを用いたが、第3フオルマントF3以上の
高次フオルマントもベクトル成分として用いるこ
とにより3次元以上の多次元空間でのベクトルを
用いて母音の判定を行なうようにしてもよい。さ
らに、上述の実施例ではフオルマント抽出回路1
と制御音声判別回路2とにそれぞれマイクロプロ
セツサを用いた例を示したが、両回路1,2のマ
イクロプロセツサを共有化して1つにしてもよ
い。
[発明の効果] 本発明は上述のように、入力される音声信号か
ら少なくとも第1フオルマントと第2フオルマン
トとを抽出するフオルマント抽出回路と、連続す
る母音から構成された制御音声の各母音間のフオ
ルマントの変化が所定の順序でありかつ変化量が
所定範囲内であるときに制御信号を出力する制御
音声判別回路と、制御信号により開閉されるスイ
ツチ要素と、入力する音声の発生タイミングを指
示するタイミング指示手段とを具備しているの
で、音声のうちの母音を特徴づけている優勢な周
波数成分であるフオルマントを抽出し、複数のフ
オルマントにより形成されたベクトル空間におけ
る音声ベクトルの移動によりスイツチ要素を作動
させるかどうかを判別するようにした結果、母音
のフオルマントの変化のみを検出すればよく、計
算量が少なくかつ音声の認識を確実に行なうこと
ができるものであり、実時間での動作が可能で認
識率が高いという利点を有する。また、フオルマ
ントの変化分で音声を認識するから、不特定話者
に対して動作可能であるという利点を有するもの
である。しかも、タイミイング設定指示を備えて
いることにより、入力する音声の発生タイミング
を指定することにより、音素間における調音の結
合を防止できるという利点を有するものであり、
認識率が一層高まるという利点を有するものであ
る。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロツク図、
第2図は同上に使用するフオルマント抽出回路を
示すブロツク図、第3図は同上に使用する制御音
声判別回路を示すブロツク図、第4図はF1−F2
図の一例を示す動作説明図、第5図は母音の周波
数特性の一例を示す動作説明図、第6図は同上に
使用するタイミング設定回路の概略構成図、第7
図は同上に使用するタイミング設定回路の動作説
明図、第8図は従来例を示すブロツク図、第9図
は他の従来例を示すブロツク図である。 1はフオルマント抽出回路、2は制御音声判別
回路、3はスイツチ要素、4はタイミング設定回
路である。

Claims (1)

    【特許請求の範囲】
  1. 1 入力される音声信号から少なくとも第1フオ
    ルマントと第2フオルマントとを抽出するフオル
    マント抽出回路と、連続する母音から構成された
    制御音声の各母音間のフオルマントの変化が所定
    の順序でありかつ変化量が所定範囲内であるとき
    に制御信号を出力する制御音声判別回路と、制御
    信号により開閉されるスイツチ要素と、入力する
    音声の発生タイミングを指示するタイミング指示
    手段とを具備して成ることを特徴とする音声応答
    スイツチ。
JP60089373A 1985-04-24 1985-04-24 音声応答スイツチ Granted JPS61246798A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60089373A JPS61246798A (ja) 1985-04-24 1985-04-24 音声応答スイツチ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60089373A JPS61246798A (ja) 1985-04-24 1985-04-24 音声応答スイツチ

Publications (2)

Publication Number Publication Date
JPS61246798A JPS61246798A (ja) 1986-11-04
JPH0562758B2 true JPH0562758B2 (ja) 1993-09-09

Family

ID=13968887

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60089373A Granted JPS61246798A (ja) 1985-04-24 1985-04-24 音声応答スイツチ

Country Status (1)

Country Link
JP (1) JPS61246798A (ja)

Also Published As

Publication number Publication date
JPS61246798A (ja) 1986-11-04

Similar Documents

Publication Publication Date Title
JP3180655B2 (ja) パターンマッチングによる単語音声認識方法及びその方法を実施する装置
US7529670B1 (en) Automatic speech recognition system for people with speech-affecting disabilities
US3463885A (en) Speech and sound display system
US20050171774A1 (en) Features and techniques for speaker authentication
JPH0792988A (ja) 音声検出装置と映像切り替え装置
JP2001000007U (ja) 音声認識装置
Singh et al. Formant manipulations in voice disguise by mimicry
JPS60200300A (ja) 音声の始端・終端検出装置
JPH0562758B2 (ja)
Sahoo et al. MFCC feature with optimized frequency range: An essential step for emotion recognition
Grant Speech recognition techniques
JPS5939760B2 (ja) 音声認識装置
JPH0950288A (ja) 音声認識装置及び音声認識方法
JPS58181099A (ja) 音声識別装置
JPH0774960B2 (ja) テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
JPH0475520B2 (ja)
JPS61246800A (ja) 音声応答スイツチ
KR20080061901A (ko) 로봇의 입출력 장치에 의한 효율적인 음성인식 방법 및시스템
JPS61246797A (ja) 音声応答スイツチ
JPH0562757B2 (ja)
Bapineedu Analysis of Lombard effect speech and its application in speaker verification for imposter detection
JPS6131478B2 (ja)
Scarr Word-recognition machine
Ruinskiy et al. A multistage algorithm for fricative spotting
JPS6245560B2 (ja)

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term