JPS61246796A - Voice response switch - Google Patents

Voice response switch

Info

Publication number
JPS61246796A
JPS61246796A JP60089371A JP8937185A JPS61246796A JP S61246796 A JPS61246796 A JP S61246796A JP 60089371 A JP60089371 A JP 60089371A JP 8937185 A JP8937185 A JP 8937185A JP S61246796 A JPS61246796 A JP S61246796A
Authority
JP
Japan
Prior art keywords
formant
circuit
voice
vector
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60089371A
Other languages
Japanese (ja)
Other versions
JPH0562757B2 (en
Inventor
博昭 竹山
仁 深川
清隆 竹原
安一 杵川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP60089371A priority Critical patent/JPS61246796A/en
Publication of JPS61246796A publication Critical patent/JPS61246796A/en
Publication of JPH0562757B2 publication Critical patent/JPH0562757B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Electronic Switches (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 [技術分野J 本発明は音声応答スイッチ、さらに詳しくは、人の音声
を認識して作動する音声応答スイッチに関するものであ
る。
DETAILED DESCRIPTION OF THE INVENTION [Technical Field J] The present invention relates to a voice response switch, and more particularly to a voice response switch that operates by recognizing human voice.

[背景技術J 従来上り音声応答スイッチとしては、第6図に示すよう
に、音声に相当する周波数帯域の人カイロ号を通過させ
るフィルタ回路11と、フィルタ回路11の出力レベル
を検出するレベル検出回路12と、レベル検出回路12
の出力を予め設定された参照値と比較しレベル検出回路
12の出力が参照値以上であるときに制御信号を出力す
る制御回路13と、制御信号により閉成されるスイッチ
要素14とから構成されており、制御回路13への入力
レベルが参照値以上であるときにフィルタ回路11への
入力信号が音声信号であると判断するようになったもの
が提供されている。
[Background Art J] As shown in FIG. 6, a conventional upstream voice response switch includes a filter circuit 11 that passes a human body signal in a frequency band corresponding to voice, and a level detection circuit that detects the output level of the filter circuit 11. 12 and level detection circuit 12
The control circuit 13 compares the output of the level detection circuit 12 with a preset reference value and outputs a control signal when the output of the level detection circuit 12 is equal to or higher than the reference value, and a switch element 14 that is closed by the control signal. A device is provided in which it is determined that the input signal to the filter circuit 11 is an audio signal when the input level to the control circuit 13 is equal to or higher than a reference value.

この回路構成においては、特定の周波数帯域のレベル判
定のみで音声であるかどうかを判別しているものである
から、フィルタ回路11を通過できる帯域の周波数成分
を持ちかつ参照値よりも高いレベルの入力信号であれば
音声ではない雑音であってもスイッチ要素14が作動す
ることになり、誤動作を生じるという問題がある。また
音声が入力されている場合でも、それがスイッチ要素1
4を作動させる目的で発せられた音声であるかどうかに
かかわらずスイッチ要素14が作動するから、スイッチ
要素14の作動を希望しないときスイッチ要素14が作
動することがあるという不都合が生じるものである。
In this circuit configuration, it is determined whether or not it is a voice only by determining the level of a specific frequency band. If it is an input signal, the switch element 14 will be activated even if it is a noise that is not a voice, resulting in a problem of malfunction. Also, even if audio is input, it will be switched to switch element 1.
Since the switch element 14 is actuated regardless of whether the sound is emitted for the purpose of actuating the switch element 4, there is an inconvenience that the switch element 14 may be actuated when the switch element 14 is not desired to be actuated. .

このため、第7図に示すように、音声認識装置15を用
い、記憶部16に記憶された制御音声と入力音声とを比
較し、両者が一致したときにスイッチ要素3を開閉させ
るものが考えられているが、不特定話者を対象とする場
合には、音声認識のための演算処理に長い時間が必要と
なり実時間でスイッチ要素14を制御することが困難で
あるという問題があり、しかも現在の技術レベルでは一
般に認識率が低く誤動作しやすいという問題がある。
For this reason, as shown in FIG. 7, one idea is to use a voice recognition device 15 to compare the control voice stored in the storage unit 16 with the input voice, and to open or close the switch element 3 when the two match. However, when targeting unspecified speakers, there is a problem that a long time is required for arithmetic processing for voice recognition, making it difficult to control the switch element 14 in real time. The problem with the current level of technology is that the recognition rate is generally low and malfunctions are likely to occur.

そして、ga率を高めるには情報量と計算量が多くなる
ものであるから一層処理時間が遅れるという大魚がある
。これに対して特定話者を対象とする場合には、予め使
用者が自分の声を登録する必要があり、使用までの作業
が面倒である。
Another big problem is that increasing the GA rate requires an increase in the amount of information and calculations, which further delays processing time. On the other hand, when targeting a specific speaker, the user needs to register his/her own voice in advance, which makes the process of using the system cumbersome.

[発明の目的] 本発明は上述の点に鑑みて為されたものであって、その
主な目的とするところは、音声のうちの母音を特徴づけ
ている優勢な周波数成分であるフォルマントを抽出し、
複数の7tルマントにより形成されたベクトル空間にお
ける音声ベクトルの移動によりスイッチ要素を作動させ
るかどうかを判別するようにして、実時間で動作可能で
認識率が高(、しかも不特定話者用を対象とした音声応
答スイッチを提供することにある。
[Object of the Invention] The present invention has been made in view of the above points, and its main purpose is to extract formants, which are dominant frequency components that characterize vowels in speech. death,
The system determines whether or not to activate a switch element based on the movement of the speech vector in a vector space formed by multiple 7t speech vectors, which can operate in real time and has a high recognition rate (and can be used by any specific speaker). The purpose of the present invention is to provide a voice-responsive switch.

[発明の開示l 第5図は母音のスペクトルの一例を示すものであって、
母音を特徴づける優勢な周波数成分、すなわち、スペク
トルのピーク部分の周波数成分がフォルマントと呼ばれ
る。母音には普通複数のフォルマントが存在し、周波数
の低いほうから順に第17オルマン)F、、J27オル
マン)F2.13フォルマントF 3 、・・・・・・
と呼ばれる。これらの7オlレマントのうち第17オル
マン) F、 と#27オルマン)F2との寄与率がも
っとも高く、第1フォルマントFIと@27オルマン)
F2とを用いレバかなり高い確度で母音を決定できるも
のである。
[Disclosure of the Invention I Figure 5 shows an example of a vowel spectrum,
The dominant frequency component that characterizes a vowel, that is, the frequency component at the peak of the spectrum, is called a formant. Vowels usually have multiple formants, starting with the lowest frequency (17th orman) F,, J27 orman) F2, 13th formant F 3, etc.
It is called. Among these 7 oremans, the contribution rate of the 17th orman) F, and #27 orman) F2 is the highest, and the 1st formant FI and @27 orman)
F2 can be used to determine vowels with a fairly high degree of accuracy.

ここで第1フォルマントF1を横軸にとり、第2フォル
マントF2を縦軸にとったPIF2図上に日本語の母音
である/a// i//u//e/10/をベクトルと
して示すと、各母音は第4図の破線で示す範囲で表わさ
れる。フォルマントは各個人によりかなり変動するもの
であって、各母音を表わす範囲はかなりの部分で重複す
るものであるが、一般に同一環境で同一人物の発した5
母音のフォルマントはPIF2図上において略5角形と
なり、環境が変化したり、発話者が代わっても5母音の
相対的位置関係、すなわちこの5角形の形状を保持した
ままで平行移動することが知られている。したがって、
母音が変化したときの相対位置、すなわち変化ベクトル
は環境や発話者がかわっても略一定になる。つまり、母
音/a/の成分を(800Hze1800Hz)とし、
母音10/の成分を(500Hz。
Here, if the Japanese vowel /a//i//u//e/10/ is shown as a vector on the PIF2 diagram with the first formant F1 on the horizontal axis and the second formant F2 on the vertical axis, , each vowel is represented by the range shown by the broken line in FIG. Formants vary considerably depending on each individual, and the ranges representing each vowel overlap to a large extent, but in general, the five vowels uttered by the same person in the same environment
The formants of vowels are approximately pentagonal on the PIF2 diagram, and it is known that even if the environment changes or the speaker changes, the relative positional relationship of the five vowels, that is, the pentagonal shape, will be maintained and will move in parallel. It is being therefore,
The relative position when a vowel changes, that is, the change vector, remains approximately constant even if the environment or speaker changes. In other words, the vowel /a/ component is (800Hz 1800Hz),
The component of vowel 10/ (500Hz.

1000 Hz)とすると、/a/から10/への変化
ベクトルの成分は(−300Hz、−800Hz)とな
り、変化ベクトルの成分は環境や発話者が異なっていて
も略一定になるのである。しかして、本発明においては
、複数の母音を入力して母音の変化ベクトルが検出され
るとスイッチ要素が作動する音声応答スイッチを開示す
る。なお、以下の説明においては、第1フォルマントF
1と第2フォルマントF2とを使用して音声の認識を行
なっているが、さらに認識率を高めるために、第3フォ
ルマントF、を用いてもよい。この場合第3フォルマン
トF、を第3輪としてF + −F z  F 3空間
上での各母音のフォルマントを表わすことにより、重複
部分を形成せずに空間上で各母音のフォルマントを表わ
すことができるものである。
1000 Hz), the components of the change vector from /a/ to 10/ are (-300Hz, -800Hz), and the components of the change vector remain approximately constant even if the environment or speaker is different. Accordingly, the present invention discloses a voice response switch in which a switch element is activated when a plurality of vowels are input and a vowel change vector is detected. In addition, in the following explanation, the first formant F
1 and the second formant F2 are used to perform voice recognition, but the third formant F may also be used to further increase the recognition rate. In this case, by representing the formant of each vowel on the F + -F z F 3 space using the third formant F as the third wheel, it is possible to represent the formant of each vowel on the space without forming overlapping parts. It is possible.

(実施例) 第1図に示すように、入力信号はフォルマント抽出回路
1に入力され第17オルマン) F lと第2フォルマ
ントF2とが抽出される。フォルマント抽出回路1の出
力は制御音声判別回路2に入力され、予め設定された制
御音声と一致すると制御信号が出力されるようになって
いる。制御音声判別回路2の出力はスイッチ要素3に入
力され、スイッチ要素3に制御信号が入力されるとスイ
ッチ要素3が開閉される。
(Embodiment) As shown in FIG. 1, an input signal is input to a formant extraction circuit 1, and a 17th Orman F1 and a second formant F2 are extracted. The output of the formant extraction circuit 1 is input to a control voice discrimination circuit 2, and when it matches a preset control voice, a control signal is output. The output of the control voice discrimination circuit 2 is input to the switch element 3, and when a control signal is input to the switch element 3, the switch element 3 is opened or closed.

第2図にフォルマント抽出回路1の一例を示す。FIG. 2 shows an example of the formant extraction circuit 1.

フォルマント抽出回路1はそれぞれ200 Hzの帯域
中を有し通過周波数が互いに異なる多数の帯域フィルタ
群11.〜11nと、各帯域フィルタ11、〜llnの
出力信号をデジタル信号に変換するアナログ/デジタル
変換回路12と、各帯域フィルタ11.〜tinの出力
レベル値からフォルマントヲ検出するマイクロプロセッ
サよりなる演算回路13とから構成される。帯域フィル
タ111〜finはそれぞ・れO−200Hz、  2
00−400Hz、 400〜600 Hz、−122
00−2400Hz、・・・・・・と通過周波数帯域が
互いに異なるとともに、全帯域フィルタ11.−fin
によって音声帯域の全周波数が含まれるように設定され
ている。演算回路13は第1フォルマントFIと第27
オルマン)F2とを検出するとともに、入力音声が変化
したかどうかを判定する音韻変化信号を出力する。なお
、フォルマントの検出は回路構成によってハード的に行
なっているが、線形予測法などのソフト的な手法を用い
て行なってもよい。
The formant extraction circuit 1 includes a large number of band filter groups 11, each having a band of 200 Hz and having different pass frequencies. ~lln, each bandpass filter 11, an analog/digital conversion circuit 12 that converts the output signal of ~lln into a digital signal, and each bandpass filter 11. . . . an arithmetic circuit 13 consisting of a microprocessor that detects formants from the output level values of .about.tin. The bandpass filters 111 to fin each have a frequency of O-200Hz, 2
00-400Hz, 400-600Hz, -122
00-2400Hz, . -fin
It is set to include all frequencies in the audio band. The arithmetic circuit 13 has the first formant FI and the 27th formant FI.
Olman) F2 and outputs a phoneme change signal for determining whether the input voice has changed. Note that formant detection is performed using hardware using a circuit configuration, but it may also be performed using a software method such as a linear prediction method.

第3図は制御音声判別回路2の一例を示すものであって
、制御音声判別回路2は、音韻変化信号が入力されると
フォルマントを記憶する第1ベクトル保持回路22と、
音韻変化信号が入力されると第1ベクトル保持回路22
に記憶されていたフォルマントを記憶する第2ベクトル
保持回路23と、第1ペクシル保持回路22に記憶され
たフォルマントから第2ベクトル保持回路23に記憶さ
れた7tルマントを減算することにより変化ベクトルを
算出する変化ベクトル算出回路24と、任意の3母音を
所定の順序で並べたときの各2母音間での変化ベクトル
の範囲が記憶された記憶部25と、変化ベクトル算出回
路24の出力値と記憶部25に記憶された設定値とを比
較して変化ベクトル算出回路24の出力値が記憶部25
に格納された設定範囲内であるときに一致信号を出力す
る比較判定回路26と、一致信号が連続して入力される
と制御信号を出力する制御信号発生回路27とから構成
される。制御音声判別回路2では音韻変化信号が制御音
声判別回路2に入力されるたびに入力信号の変化ベクト
ルが記憶部25に記憶された設定範囲に属するかどうか
が判定される。そして入力信号の各音韻間の変化ベクト
ルが記憶部25に記憶された制御音声の変化ベクトルの
設定範囲内であると判定されると、比較判定回路26か
ら一致信号が出力されるのである。なお、制御音声判別
回路2の記憶部25を除く部分に関してはマイクロプロ
セッサ20を用いて構成される。
FIG. 3 shows an example of the control speech discrimination circuit 2, which includes a first vector holding circuit 22 that stores formants when a phoneme change signal is input;
When the phoneme change signal is input, the first vector holding circuit 22
A change vector is calculated by subtracting the 7t formant stored in the second vector holding circuit 23 from the formant stored in the first pexyl holding circuit 22. a change vector calculation circuit 24, a storage unit 25 that stores the range of change vectors between each two vowels when three arbitrary vowels are arranged in a predetermined order, and an output value and storage of the change vector calculation circuit 24. The output value of the change vector calculation circuit 24 is compared with the setting value stored in the storage unit 25.
The comparison determination circuit 26 outputs a match signal when the match signal is within a set range stored in the 1, and the control signal generating circuit 27 outputs a control signal when the match signal is continuously input. The control speech discrimination circuit 2 determines whether the change vector of the input signal belongs to the set range stored in the storage section 25 each time a phoneme change signal is input to the control speech discrimination circuit 2. When it is determined that the change vector between each phoneme of the input signal is within the set range of the change vector of the control voice stored in the storage section 25, a match signal is output from the comparison determination circuit 26. Note that the parts of the control voice discriminating circuit 2 except for the storage section 25 are configured using a microprocessor 20.

(動作) 以下、動作を説明する0例えば、制御信号を出力するよ
うに設定された制御音声が3母音/a/10//e/を
順に並べて構成されているとし、記憶部25には/、/
から10/への変化ベクトルの範囲として(300±α
、Hz、800±QmHz)、10/がら/e/への変
化ベクトルの範囲として(120±Q 3 HZ w1
200±α、 Hz)が設定されているものとする。
(Operation) The operation will be explained below.0 For example, assume that a control voice set to output a control signal is composed of three vowels /a/10//e/ arranged in order, and the storage unit 25 stores / ,/
As the range of change vector from to 10/(300±α
, Hz, 800±QmHz), as the range of the change vector to 10/gara/e/(120±Q 3 Hz w1
200±α, Hz) is set.

ここでa1〜a、の値を適宜設定することにより感度が
調節される。さて、いま母音/a/10//e/が第1
音声、Iji2音声、第3音声と゛して連続して入力さ
れたものとすると、フォルマント抽出回路1では各音声
のF + −F 2平面上でのベクトル成分がそれぞれ
検出されるとともに、母音の変化時点でそれぞれ音韻変
化信号が発生する。制御音声判別回路2では、第1音声
が入力された時点でまず第1音声のべりFル成分を第1
ベクトル保持回路22に記憶する0次に第2音声が入力
され音韻変化信号が得られると、第1ベクトル保持回路
22に記憶されていた第1音声のベクトル成分が第2ベ
クトル保持回路23に入力されるとともに、第1ベクト
ル保持回路22には第2音声のベクトル成分が記憶され
る。このとき変化ベクトル算出回路24では第2ベクト
ル保持回路23に記憶されたベクトル成分と第1ベクト
ル保持回路22に記憶されたベクトル成分との変化量か
ら変化ベクトルの成分が算出される。記憶部25には/
a/から10/への変化ベクトルの成分として(300
±CI 、 Hz、 800±ff2Hz)が記憶され
ているから、比較判定回路26では変化ベクトル算出回
路24の出力が記憶部25に記憶されたこの設定範囲内
にあるかどうかが比較され、変化ベクトル算出回路24
の出力値が記憶部25の設定範囲内であると判定される
と、入力信号が八/から10/に変化したものと判断さ
れるのである0次に第3音声が入力されると、第1ベク
トル保持回路22に記憶されていた第2音声のベクトル
成分が第2ベクトル保持回路23に入力されるとともに
、第3音声のベクトル成分が#1ベクトル保持回路22
に記憶され、変化ベクトル算出回路24では第2ベクト
ル保持回路23に記憶された第2音声から第1ベクトル
保持回路22に記憶された第3音声への変化ベクトルの
成分が算出される。記憶部25には10/から/e/へ
の変化ベクトルの成分として(120±α、。
Here, the sensitivity is adjusted by appropriately setting the values of a1 to a. Now, the vowel /a/10//e/ is the first
Assuming that voice, Iji2 voice, and 3rd voice are input consecutively, the formant extraction circuit 1 detects the vector components of each voice on the F + -F2 plane, and also detects changes in vowels. A phonological change signal is generated at each point in time. At the time when the first voice is input, the control voice discriminating circuit 2 first converts the slip F component of the first voice into the first voice.
When the zero-order second voice stored in the vector holding circuit 22 is input and a phoneme change signal is obtained, the vector component of the first voice stored in the first vector holding circuit 22 is input to the second vector holding circuit 23. At the same time, the vector component of the second voice is stored in the first vector holding circuit 22. At this time, the change vector calculation circuit 24 calculates the component of the change vector from the amount of change between the vector component stored in the second vector holding circuit 23 and the vector component stored in the first vector holding circuit 22. The storage unit 25 has /
As a component of the change vector from a/ to 10/ (300
±CI, Hz, 800±ff2Hz) is stored, so the comparison/judgment circuit 26 compares whether the output of the change vector calculation circuit 24 is within this setting range stored in the storage section 25, and calculates the change vector. Calculation circuit 24
If it is determined that the output value of is within the setting range of the storage unit 25, it is determined that the input signal has changed from 8/ to 10/. The vector component of the second voice stored in the #1 vector holding circuit 22 is input to the second vector holding circuit 23, and the vector component of the third voice is input to the #1 vector holding circuit 22.
The change vector calculation circuit 24 calculates the component of the change vector from the second voice stored in the second vector holding circuit 23 to the third voice stored in the first vector holding circuit 22. The storage unit 25 stores (120±α,) as a component of the change vector from 10/ to /e/.

1200±a4)が記憶されているから、比較判定回路
26ではこの設定範囲と変化ベクトル算出回路24の出
力値とが比較され、変化ベクトル算出回路24の出力値
が記憶部25の設定範囲内であると判定されると、入力
信号が10/から/e/に変化したことを認識するので
ある。以上のようにして/a/から10/への変化と1
0/から/e/への変化が連続して検出されると、比較
判定回路26では一致信号を出力し、制御信号発生回路
27では一致信号を受けて制御信号を出力するのである
。制御信号はスイッチ要素3に入力されスイッチ要素3
が開閉されるのである。入力信号が記憶部25に設定さ
れた設定範囲とは異なるときにはスイッチ要素3はそれ
までの状態を保つ。
1200±a4) is stored, the comparison/judgment circuit 26 compares this setting range with the output value of the change vector calculation circuit 24, and determines whether the output value of the change vector calculation circuit 24 is within the setting range of the storage section 25. If it is determined that there is, it is recognized that the input signal has changed from 10/ to /e/. As mentioned above, the change from /a/ to 10/ and 1
When a change from 0/ to /e/ is detected continuously, the comparison/judgment circuit 26 outputs a coincidence signal, and the control signal generation circuit 27 receives the coincidence signal and outputs a control signal. The control signal is input to the switch element 3 and the control signal is input to the switch element 3.
is opened and closed. When the input signal differs from the setting range set in the storage section 25, the switch element 3 maintains its previous state.

上述の実施例において連続した3母音を検出したときに
スイッチ要素3を開閉するようになっていたが、3母音
に限定されるものではない。また母音を検出するために
第1フォルマントF1と第2フォルマントF2とをベク
トル成分として2次元空間でのベクトルを用いたが、第
37オルマン)Fs以上の高次フォルマントもベクトル
成分として用いることにより3次元以上の多次元空間で
のベクトルを用いて母音の判定を行なうようにしてもよ
い、さらに、上述の実施例ではフォルマント抽出回路1
と制御音声判別回路2とにそれぞれマイクロプロセッサ
を用いた例を示したが、両回路1,2のマイクロプロセ
ッサを共有化して1つにしてもよい。
In the above embodiment, the switch element 3 is opened and closed when three consecutive vowels are detected, but the present invention is not limited to three vowels. In addition, in order to detect a vowel, a vector in a two-dimensional space was used with the first formant F1 and the second formant F2 as vector components. Vowels may be determined using vectors in a multidimensional space of more than 3 dimensions.Furthermore, in the above embodiment, the formant extraction circuit 1
Although an example has been shown in which microprocessors are used for each of the circuits 1 and 2, the microprocessors for both circuits 1 and 2 may be shared and integrated into one.

[発明の効果] 本発明は上述のように、入力音声から少なくとも第1フ
ォルマントと第2フォルマントとを抽出するフォルマン
ト抽出回路と、2音以上の連続する母音から構成された
制御音声の各母音間のフォルマントの変化分が所定の設
定範囲内であるときに制御信号を出力する制御音声判別
回路と、制御信号により開閉されるスイッチ要素とから
構成されているので、音声のうちの母音を特徴づけてい
る優勢な周波数成分であるフォルマントを抽出し、複数
のフォルマントにより形成されたベクトル空間における
音声ベクトルの移動によりスイッチ要素を作動させるか
どうかを判別するようにした結果、母音のフォルマント
の変化のみを検出すればよく、計算量が少なくかつ音声
の認識を確実に行なうことができるものであり、実時間
での動作が可能で認識率が高いという利点を有する。ま
た、フォルマントの変化分で音声を認識するから、不特
定話者に対して動作可能であるという利点を有するもの
である。
[Effects of the Invention] As described above, the present invention includes a formant extraction circuit that extracts at least a first formant and a second formant from input speech, and a formant extraction circuit that extracts at least a first formant and a second formant from an input speech, and a formant extraction circuit that extracts at least a first formant and a second formant from an input speech, and a It consists of a control speech discrimination circuit that outputs a control signal when the change in formant is within a predetermined setting range, and a switch element that is opened and closed by the control signal, so it can characterize vowels in speech. By extracting the formant, which is the dominant frequency component of the vowel, and determining whether to activate the switch element by moving the speech vector in the vector space formed by multiple formants, we can detect only the change in the formant of the vowel. It only needs to be detected, the amount of calculation is small, and speech recognition can be performed reliably, and it has the advantage of being able to operate in real time and having a high recognition rate. Furthermore, since speech is recognized based on changes in formants, it has the advantage of being operable for unspecified speakers.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例を示すブロック図、第2図は
同上に使用するフォルマント抽出回路を示すブロック図
、第3図は同上に使用する制御音声判別回路を示すブロ
ック図、第4図はPIF2図の一例を示す動作説明図、
第5図は母音の周波数特性の一例を示す動作説明図、第
6図は従来例を示すブロック図、第7図は他の従来例を
示すブロック図である。 1はフォルマント抽出回路、2は制御音声判別血路、3
はスイッチ要素である。
FIG. 1 is a block diagram showing an embodiment of the present invention, FIG. 2 is a block diagram showing a formant extraction circuit used in the above, FIG. 3 is a block diagram showing a control speech discrimination circuit used in the same, and FIG. The figure is an operation explanatory diagram showing an example of PIF2 diagram,
FIG. 5 is an operation explanatory diagram showing an example of vowel frequency characteristics, FIG. 6 is a block diagram showing a conventional example, and FIG. 7 is a block diagram showing another conventional example. 1 is a formant extraction circuit, 2 is a control voice discrimination circuit, and 3 is a formant extraction circuit.
is a switch element.

Claims (1)

【特許請求の範囲】[Claims] (1)入力音声から少なくとも第1フォルマントと第2
フォルマントとを抽出するフォルマント抽出回路と、2
音以上の連続する母音から構成された制御音声の各母音
間のフォルマントの変化分が所定の設定範囲内であると
きに制御信号を出力する制御音声判別回路と、制御信号
により開閉されるスイッチ要素とから構成されたことを
特徴とする音声応答スイッチ。
(1) At least the first formant and the second formant from the input voice
a formant extraction circuit that extracts a formant;
A control voice discrimination circuit that outputs a control signal when the change in formant between each vowel of a control voice composed of continuous vowels of more than one vowel is within a predetermined setting range, and a switch element that is opened and closed by the control signal. A voice response switch comprising:
JP60089371A 1985-04-24 1985-04-24 Voice response switch Granted JPS61246796A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60089371A JPS61246796A (en) 1985-04-24 1985-04-24 Voice response switch

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60089371A JPS61246796A (en) 1985-04-24 1985-04-24 Voice response switch

Publications (2)

Publication Number Publication Date
JPS61246796A true JPS61246796A (en) 1986-11-04
JPH0562757B2 JPH0562757B2 (en) 1993-09-09

Family

ID=13968833

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60089371A Granted JPS61246796A (en) 1985-04-24 1985-04-24 Voice response switch

Country Status (1)

Country Link
JP (1) JPS61246796A (en)

Also Published As

Publication number Publication date
JPH0562757B2 (en) 1993-09-09

Similar Documents

Publication Publication Date Title
JP4272050B2 (en) Audio comparison using characterization based on auditory events
JP3886024B2 (en) Voice recognition apparatus and information processing apparatus using the same
US4718096A (en) Speech recognition system
WO2020065257A1 (en) Sound event detection
Jaafar et al. Automatic syllables segmentation for frog identification system
JPH0431898A (en) Voice/noise separating device
JPS61246796A (en) Voice response switch
JPS61246800A (en) Voice response switch
JPS61246799A (en) Voice response switch
JPS58181099A (en) Voice identifier
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JPS63186298A (en) Word voice recognition equipment
JPH01255000A (en) Apparatus and method for selectively adding noise to template to be used in voice recognition system
JPS61246797A (en) Voice response switch
EP0126420A1 (en) A speech recognition system
JPS6148897A (en) Voice recognition equipment
KR100246617B1 (en) Speech detection method using the continuous pitch information
JP2989231B2 (en) Voice recognition device
CN117198298A (en) Ultrasonic-assisted voiceprint identity recognition method and system
JPS61246798A (en) Voice response switch
JP3515143B2 (en) Pattern registration device
JPS59124389A (en) Word voice recognition system
JPH0316038B2 (en)
JPH01244497A (en) Sound section detection circuit
JPH03200298A (en) Voice controller

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term