JPS5945160B2 - Voice identification method - Google Patents

Voice identification method

Info

Publication number
JPS5945160B2
JPS5945160B2 JP1714377A JP1714377A JPS5945160B2 JP S5945160 B2 JPS5945160 B2 JP S5945160B2 JP 1714377 A JP1714377 A JP 1714377A JP 1714377 A JP1714377 A JP 1714377A JP S5945160 B2 JPS5945160 B2 JP S5945160B2
Authority
JP
Japan
Prior art keywords
pulse
circuit
syllable
representative value
latch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP1714377A
Other languages
Japanese (ja)
Other versions
JPS53102603A (en
Inventor
煕康 舟久保
正孝 芝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP1714377A priority Critical patent/JPS5945160B2/en
Priority to US05/877,394 priority patent/US4178472A/en
Priority to NL7801789A priority patent/NL7801789A/en
Priority to DE19782806920 priority patent/DE2806920A1/en
Priority to FR7804744A priority patent/FR2381369A1/en
Priority to GB6753/78A priority patent/GB1594412A/en
Publication of JPS53102603A publication Critical patent/JPS53102603A/en
Publication of JPS5945160B2 publication Critical patent/JPS5945160B2/en
Expired legal-status Critical Current

Links

Description

【発明の詳細な説明】 この発明は音声信号をコード化することによつて動力義
手やマニピュレータ等の機械装置または電子装置差制御
するための音声識別方法に関するものである。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a voice identification method for differentially controlling mechanical or electronic devices such as powered prosthetic hands and manipulators by encoding voice signals.

従来におけるこの種の方法としては、発呼者からの種々
なる音声信号を夫々周波数分析し、夫々の音声信号をパ
ターンとして記障し、次回発呼者から発声された音声信
号を同じく周波数分析して上記したパターンと比較し、
如何なる音声信号であるか否かを判別するものであつた
Conventionally, this type of method analyzes the frequency of various voice signals from the caller, records each voice signal as a pattern, and then analyzes the frequency of the voice signal uttered by the caller the next time. and compared with the above pattern,
The purpose was to determine what kind of audio signal it is.

しかしこの方法によるものにあつて(大発呼者の音声信
号が、印こよつてあるいは時間によつて異なること、す
なわち各音節の間隔が違つたりあるいは発音が違つたり
してパターン比較が非常に困難であつた。また装置も大
型のものとなりコスト的にも高いものとなつた。この発
明は叙上の点に鑑みて成されたもので、その第1の目的
は、気管外壁にマイクを設け、通常の発声あるいはハミ
ングであつても情報を確認することが可能である音声識
別方法を提供するにある。
However, with this method (the voice signals of large callers vary depending on the sign or time, i.e., the intervals between each syllable are different or the pronunciation is different), it is difficult to compare patterns. In addition, the device was large and the cost was high.This invention was made in view of the above points, and its first purpose was to attach a microphone to the outer wall of the trachea. An object of the present invention is to provide a voice identification method that allows information to be confirmed even in normal vocalization or humming.

この発明の第2の目的は、音節の数と、この音節の高低
変化パターンを類別することによつて識別するので、高
い認識率を得ることができる音声識別方法を提供するに
ある。
A second object of the present invention is to provide a speech identification method that can obtain a high recognition rate because the identification is performed by classifying the number of syllables and the pitch change pattern of the syllables.

次にこの発明の一実施例を図面と共に説明する。Next, one embodiment of the present invention will be described with reference to the drawings.

第1図は全体のブロック図である。Aは音声検出回路に
して、発呼者よりの音声信号をパルス信号に変換する回
路であつて、1は音声発呼者の気管外壁に設けたマイク
、2は50〜250Hzを通過させるフィルタで、音声
振動の基本周波数であり、発声時の音階を表わすパラメ
ータであるピッチ成分を抽出する。なおこのフィルタ2
は増幅器をも包含している。3はフィルタ2で抽出され
たサイン波を矩形波に変換すると共にヒステリシス特性
により、さらにピッチ成分以外の波を除去するシユミツ
トトリガ回路である。
FIG. 1 is an overall block diagram. A is a voice detection circuit that converts the voice signal from the caller into a pulse signal, 1 is a microphone installed on the outer wall of the voice caller's trachea, and 2 is a filter that passes 50 to 250 Hz. , the pitch component, which is the fundamental frequency of voice vibration and is a parameter representing the scale at the time of vocalization, is extracted. Note that this filter 2
also includes amplifiers. Reference numeral 3 denotes a Schmitt trigger circuit that converts the sine wave extracted by the filter 2 into a rectangular wave and further removes waves other than pitch components using hysteresis characteristics.

Bは選択されたクロックにより、シユミツトトリガ回路
3より出力される矩形波の周期を測定するためのカウン
ト回路にして、4はシユミツトトリガ回路3よりのパル
ス信号の入力制御と、クロツクの選択制御を行うゲート
回路、5は上記音声検出回路Aよりの信号の間クロツク
パルス発生回路6よりのクロツクパルスを夫々計数する
カウンタ、6は例えば10KHzと300Hzのクロツ
クパルスを発信するクロツクパルス発生回路である。
B is a count circuit for measuring the period of the rectangular wave output from the Schmitt Trigger circuit 3 using a selected clock, and 4 is a gate for controlling the input of the pulse signal from the Schmitt trigger circuit 3 and controlling the selection of the clock. The circuit 5 is a counter that counts the clock pulses from the clock pulse generating circuit 6 during the signal from the audio detection circuit A, and the numeral 6 is a clock pulse generating circuit that generates clock pulses of, for example, 10 KHz and 300 Hz.

Cは上記カウント回路Bよりの各クロツクパルス数を記
憶し、中間値である代表値を決定する代表値決定回路に
して、7は各クロツクパルス数を記憶するラツチ回路、
8は各ラツチ回路7よりのクロツク数を比較し、中間値
である代表値を決定する比較器である。Dは各音節毎の
代表値を記憶し、各音節の高低を検出する変化判定回路
にして、9は各音節毎の代表値を記憶するラツチ回路、
10は各ラツチ回路9よりのクロツク数を比較し、クロ
ツク数の変イLすなわち音節の高低を検出する比較器で
ある。
C is a representative value determining circuit that stores each clock pulse number from the counting circuit B and determines a representative value that is an intermediate value; 7 is a latch circuit that stores each clock pulse number;
A comparator 8 compares the number of clocks from each latch circuit 7 and determines a representative value which is an intermediate value. D is a change determination circuit that stores the representative value of each syllable and detects the pitch of each syllable; 9 is a latch circuit that stores the representative value of each syllable;
Reference numeral 10 denotes a comparator which compares the number of clocks from each latch circuit 9 and detects a change L in the number of clocks, that is, the height of a syllable.

Eは前記した代表値決定回路Cのラツチ回路7よりの出
力で音節の区切れを検出する音節区切れ処理回路にして
、11はラツチ回路7よりの出力と了じめ定められた値
とを比較する比較器である。Fは上記A−Eの各プロツ
クに対しパルス信号を与えシーケンス制御するシステム
制御部であも次に詳細を第2図以下に基いてタイミング
チヤート図と共に説明する。今第7図における音声入力
包絡線のように、3つの音節(例えば「つ」 「か」
「め」)を発呼者が発声したとすると、マイク1におい
てこの情報を気管外壁(喉仏の真下であつて比較的高周
波成分や、声道特性の影響の少ない部分)でキャツチし
、50〜250Hzを通過させるフイルタ2でピツチ成
分を抽出すると共に増幅する。
E is a syllable break processing circuit that detects syllable breaks using the output from the latch circuit 7 of the representative value determining circuit C, and 11 is a syllable break processing circuit that detects syllable breaks using the output from the latch circuit 7 of the representative value determination circuit C. It is a comparator for comparison. Reference numeral F denotes a system control section which applies pulse signals to each of the above-mentioned programs A to E to perform sequence control.The details will be explained below with reference to FIG. 2 and timing charts. As shown in the speech input envelope in Figure 7, three syllables (for example, ``tsu'' and ``ka'')
When the caller utters "me"), microphone 1 captures this information on the outer wall of the trachea (the part directly below the Adam's apple and is relatively unaffected by high-frequency components and vocal tract characteristics), and captures this information from 50 to A filter 2 that passes 250 Hz extracts the pitch component and amplifies it.

抽出したサイン波を次段のシユミツトトリガ回路3で矩
形波に変喚する。尚上記フイルタ2は発呼者が女性の場
合、高周波側にずらす必要がある。また上記矩形波はシ
ユミツトトリガ回路3のもつヒステリシス特性により、
さらにピツチ成分以外の波は除去される。この矩形波が
a波形である。ここで第7図について全体のシーケンス
を説明する。
The extracted sine wave is transformed into a rectangular wave by the Schmitt trigger circuit 3 at the next stage. Note that if the caller is a woman, the filter 2 needs to be shifted to the high frequency side. Also, the above rectangular wave is generated due to the hysteresis characteristic of the Schmitt trigger circuit 3.
Furthermore, waves other than the pitch component are removed. This rectangular wave is the a waveform. The entire sequence will now be explained with reference to FIG.

まずO〕は入力待サイクルで、全ての回路をりセツトし
、初期の状態にする。1,C51,(9)は各音節の立
上り部分で不安定である部分のパルス信号(本実施例で
は第1番目のパルス)を除去する初期周期除去サイクル
である。
First, O] is an input waiting cycle, in which all circuits are reset to their initial states. 1, C51, (9) is an initial period removal cycle that removes the unstable portion of the pulse signal (in this embodiment, the first pulse) at the rising edge of each syllable.

〔匂,(6),〔10〕は各音節における得ようとする
パルス信号を決定するサイクルで、本実施例では各音節
の2パルス目から4パルス目までの3つのパルス信号を
測定している。3,〔71,〔11〕は上記各3つのパ
ルス信号から代表的な1つのパルスを決定するサイクル
で、本実施例では中間値のものを検出しているが、平均
瓢最小二乗値,最大値、最小値、大きい方からn番目な
どというように適当に選択できる。
[Oi, (6), [10] is a cycle that determines the pulse signal to be obtained in each syllable, and in this example, three pulse signals from the 2nd pulse to the 4th pulse of each syllable are measured. There is. 3, [71, [11] are cycles for determining one representative pulse from each of the above three pulse signals, and in this example, the intermediate value is detected, but the average value, the least squares value, the maximum Value, minimum value, nth largest value, etc. can be selected as appropriate.

すなわち各音節における3つのパルス信号から同じ条件
の下で1つのパルス信号を検出すれば良い。〔4),8
,〔12〕は各音節の区切れを判定するサイクルである
。〔13〕は上記3つの代表値パルス信号の高低パター
ンを決定するサイクルで、このパターンによつて発呼者
からの情報を判断し、例えば義手が「つかむ」動作を開
始するものである。なおこのパターンによつて義手を制
御するのみではなく、他の応用例として、工作機械制御
、タイプ制御、帳簿整理、ドアの開閉制御等がある。そ
して上記が1つの情報によつてシーケンス制御するサイ
クルであつて、〔0′〕の入力待サイクルの後、再び情
報判断を行うものである。以上のサイクルをさらに詳細
に説明する。
That is, it is sufficient to detect one pulse signal from three pulse signals in each syllable under the same conditions. [4),8
, [12] is a cycle for determining the break between each syllable. [13] is a cycle for determining the high-low pattern of the three representative value pulse signals, and based on this pattern, information from the caller is determined and, for example, a prosthetic hand starts a "grabbing" action. In addition to controlling prosthetic hands using this pattern, other applications include machine tool control, type control, bookkeeping, and door opening/closing control. The above is a cycle in which sequence control is performed using one piece of information, and after the [0'] input waiting cycle, information judgment is performed again. The above cycle will be explained in more detail.

今電源スイツチを投入すると、パワーオンリセツト回路
12aよりりセツトパルスが0R回路12bを介して4
ビツトカウンタ12cに印加さへ該カウンタ12cをり
セツトすると共に回路制御部12dもりセツトする。
When the power switch is turned on now, a set pulse is output from the power-on reset circuit 12a through the 0R circuit 12b.
The voltage applied to the bit counter 12c resets the counter 12c and also resets the circuit control section 12d.

すなわち4ビツトカウンタ12cは上記した13のサイ
クルを順次指示するもので、上記りセツトパルスによつ
て6の状態となる。そして先ずりセツトされた回路制御
部12dは一度に第8図の如くC,d,e,j,j′,
j〃,0,c/′,♂,lのパルス信号を送出する。上
記パルスcは第2図におけるゲート回路4のフリツプフ
ロツプ回路4aのりセツト入力端に入力され出力端Qよ
り出力を出している。これは回路全体がセツト状態にな
るまで音声入力を遮断するためである。すなわち出力端
Q側より出力が送出されないためにAND回路4bは閉
じシユミツトトリガ回路3よりのパルス(以下音声パル
ス信号という)を通過させない。またパルスdは8ビツ
トカウンタ5をりセツトしたり、フリツプフロツプ回路
4cをりセツトし、音声パルス信号が入力されれば出力
端Qより出力を出し、後述する10KHzまたは300
HzのクロツクをAND回路4dを介してカウンタ5に
入力する状態にする。さらにパルスeはフリツプフロツ
プ回路4eをセツトし出力端Qより出力を出し10KH
zのクロツクパルス発生回路6aよりのクロツクパルス
を通過させるためのAND回路4fを待機状態とする。
ここで、AND回路4dが待機状態であることによりク
ロツクパルス発生回路6aよりの10KHzのクロツク
パルスはAND回路4f10R回路4gを介して8ビツ
トカウンタ5に入力され、該カウンタ5は計数している
。またパルスJ,j′,Jl,l及び0,0′,cl′
は8ビツトラツチ群7a,7b,7c,7d及び9a,
9b,9cをクリアーし待機状態とする。次に回路制御
部12dはパルスbを送出するので、フリツプフロツプ
回路4aはセツトされ出力端Qより出力が出てAND回
路4bとフリツプフロツプ回路4cf)D端に印加され
る。
That is, the 4-bit counter 12c sequentially instructs the above-mentioned 13 cycles, and is brought into state 6 by the above-mentioned set pulse. Then, the circuit control section 12d that has been set first controls C, d, e, j, j',
Send out pulse signals of j〃, 0, c/', ♂, l. The pulse c is inputted to the input terminal of the flip-flop circuit 4a of the gate circuit 4 in FIG. 2, and outputted from the output terminal Q. This is to cut off audio input until the entire circuit is in the set state. That is, since no output is sent from the output terminal Q side, the AND circuit 4b is closed and does not allow the pulse (hereinafter referred to as an audio pulse signal) from the output trigger circuit 3 to pass therethrough. In addition, the pulse d resets the 8-bit counter 5 or the flip-flop circuit 4c, and when an audio pulse signal is input, output is output from the output terminal Q, and the frequency of 10KHz or 300kHz, which will be described later, is output.
The Hz clock is input to the counter 5 via the AND circuit 4d. Furthermore, the pulse e sets the flip-flop circuit 4e and outputs an output from the output terminal Q at 10KH.
The AND circuit 4f for passing the clock pulse from the clock pulse generating circuit 6a of clock z is placed in a standby state.
Here, since the AND circuit 4d is in a standby state, the 10 KHz clock pulse from the clock pulse generating circuit 6a is input to the 8-bit counter 5 via the AND circuit 4f10R circuit 4g, and the counter 5 is counting. Also pulses J, j', Jl, l and 0,0', cl'
are 8 bit latch groups 7a, 7b, 7c, 7d and 9a,
9b and 9c are cleared to enter the standby state. Next, the circuit control section 12d sends out a pulse b, so the flip-flop circuit 4a is set and an output is output from the output terminal Q and applied to the AND circuit 4b and the flip-flop circuit 4cf) and the D terminal.

そしてこの状態で音声パルス信号の第1パルスaがAN
D回路4bに入力されると、該パルスaは通過されフリ
ツプフロツプ回路4c(7)T端子に印加される。ここ
でパルスの立上り部分において出力端はQ側に換わるた
めgなるパルスが送出される(第9図)。またこれと同
時にインクリメントパルスが4ビツトカウンタ12cに
加えられ、Oサイクルから1サイクルへと進む。そして
再びパルスdが回路制御部12dから送出され8ビツト
カウンタ5はりセツトされる。またフリツプフロツプ回
路4cもりセツトされ、出力端はQ側に換わる。従つて
8ビツトカウンタ5は再び計数するが、この第1パルス
は除去するため、第2パルスの立上りでパルスgが出て
も8ビツトカウンタ5の出力を次段に送出することなく
第2のパルスdによつてりセツトする。そして第2のパ
ルスが入力されてから後、すなわち立上り時間経過の後
出力端は再びQとなるので、8ビツトカウンタ5は10
KHzのクロツクパルスを計数始めも また4ビツトカ
ウンタ12cに回路制御部12dよりインクリメントパ
ルスが印加され、1サイクルから2サイクルへと進へ次
に音声の第3パルスが入力され、その立上りで第3パル
スgが発生すると、回路飢御部12dからiなるパルス
が送出され、第3図におけるラツチ7a(7)StrO
be端に入力される。
In this state, the first pulse a of the audio pulse signal is AN
When input to the D circuit 4b, the pulse a is passed through and applied to the T terminal of the flip-flop circuit 4c (7). At this point, at the rising edge of the pulse, the output terminal switches to the Q side, so a pulse of g is sent out (FIG. 9). At the same time, an increment pulse is applied to the 4-bit counter 12c, and the cycle progresses from the O cycle to the 1 cycle. Then, the pulse d is again sent out from the circuit control section 12d and the 8-bit counter 5 is reset. The flip-flop circuit 4c is also reset, and the output terminal is switched to the Q side. Therefore, the 8-bit counter 5 counts again, but since this first pulse is removed, even if pulse g is generated at the rising edge of the second pulse, the output of the 8-bit counter 5 is not sent to the next stage and is counted again. Reset by pulse d. Then, after the second pulse is input, that is, after the rise time has elapsed, the output terminal becomes Q again, so the 8-bit counter 5 becomes 10.
At the beginning of counting KHz clock pulses, an increment pulse is applied to the 4-bit counter 12c from the circuit control unit 12d, and the third pulse of the audio is inputted as the cycle progresses from the 1st cycle to the 2nd cycle. When g occurs, a pulse i is sent from the circuit starvation section 12d, and the latch 7a (7) StrO in FIG.
It is input to the be end.

従つて8ビツトカウンタ5よりの計数信号は該ラツチ7
aに記憶される。さらにパルスiなる信号に次いでパル
スdが送出されるので、再び8ビツトカウンタ5はりセ
ツトされると同時に計数を開始し、次の第4音声パルス
が発生するまで計数を続ける。そして第4音声パルスの
立上りで第4パルスgが発生し、従つてパルスilが発
生し、以下同様な動作によつて第3音声パルスに対応す
るクロツクパルス数がラツチ7bに、第4音声パルスに
対応するクロツクパルス数がラツチ7cに夫々記憶され
る。次いで生じる第5のパルスdによつてインクリメン
トパルスが出て2サイクルから3サイクルへと進む。こ
の第3サイクルにおいて第2サイクルで得られたラツチ
群7a,7b,7cの出力(今仮にA,B,Cとし、そ
の中間値を決定する。
Therefore, the count signal from the 8-bit counter 5 is applied to the latch 7.
It is stored in a. Further, since the pulse d is sent out after the pulse i, counting starts at the same time as the 8-bit counter 5 is reset again, and counting continues until the next fourth audio pulse is generated. Then, at the rising edge of the fourth audio pulse, a fourth pulse g is generated, and accordingly a pulse il is generated, and by the same operation, the number of clock pulses corresponding to the third audio pulse is set in the latch 7b, and the number of clock pulses corresponding to the third audio pulse is set to the latch 7b. The corresponding number of clock pulses is stored in each latch 7c. The fifth pulse d which then occurs causes an incremental pulse to proceed from the second cycle to the third cycle. In this third cycle, the outputs (temporarily A, B, and C) of the latch groups 7a, 7b, and 7c obtained in the second cycle are determined, and their intermediate values are determined.

これは8ビツトの比較器群8aにおいて、別表の1で示
す比較を行う。すなわちA,B,Cの何れかの出力が回
路匍御部12dよりのパルスmによつてゲートが開放さ
れるデータマルチプレクサ8bより送出されると共に同
じく回路制御部12dよりのパルスnによつて8ビツト
ラツチ9aに記憶される。またパルスnと同時にパルス
fも送出されるので、第2図においてフリツプフロツプ
回路4eがりセツトさ八出力端Q側に切換えられるので
、300Hzクロツクパルス発生器6bよりの300H
zクロツクパルスがAND回路4h,0R回路4g,.
AND回路4dを介して8ビツトカウンタ5に印加され
る。
This is performed in the 8-bit comparator group 8a as shown in Table 1 of the appendix. That is, any one of the outputs A, B, and C is sent out from the data multiplexer 8b whose gate is opened by the pulse m from the circuit control section 12d, and the output from the data multiplexer 8b is also output by the pulse n from the circuit control section 12d. It is stored in the bit latch 9a. Furthermore, since pulse f is also sent out at the same time as pulse n, the flip-flop circuit 4e in FIG.
The z clock pulse is sent to AND circuit 4h, 0R circuit 4g, .
The signal is applied to an 8-bit counter 5 via an AND circuit 4d.

そしてパルスmの後に回路宙u御部12dよりインクリ
メントパルスが4ビツトカウンタ12cに印加され3サ
イクルから4サイクルへと進αこの第4サイクルは各音
節間の区切れを検出するものであるが、上記したと同様
にパルスd毎に8ビツトカウンタ5は300Hzのクロ
ツクパルスを計数し、回路制御部12dよりのパルスk
毎にラツチ7dに記憶すると共に比較回路11aの一つ
の入力端に送出される。
After the pulse m, an increment pulse is applied from the circuit controller 12d to the 4-bit counter 12c, and the cycle progresses from the 3rd cycle to the 4th cycle α.This fourth cycle is for detecting the break between each syllable. Similarly to the above, the 8-bit counter 5 counts 300 Hz clock pulses for each pulse d, and receives the pulse k from the circuit control section 12d.
Each signal is stored in the latch 7d and sent to one input terminal of the comparator circuit 11a.

この比較回路11aの他の入力端には音節の区切れとし
て適当であるところの信号が印加されている。ここでラ
ツチ7dからの出力をA、比較基準出力をBとし、比較
回路11aはA≧Bの時、すなわちラツチ7dからの出
力が、予じめ音節の区切れとして適当であると定めた出
力より大きい時は音節区切パルスsを、また逆のA<B
の時は有声パルスtを送出する。なお11b,11cは
回路制御部12dよりのタイミングパルスrによつて上
記sまたはtの信号を得るためのAND回路である。そ
して比較回路11aよりの出力が有声パルスtである場
合に(人音節区切パルスsが表われるまで、上記動作を
繰返し行い、次の音節の第1パルスを検出し、該パルス
sが表われた場合、4ビツトカウンタ12cからパルス
E,l,j,j′,jlが送出される。従つて第2図の
フリツプフロツプ回路4eはセツトされ10KHzクロ
ツクパルス発生回路6aに切換えら八以後8ビツトカウ
ンタ5は10KHzのクロツクパルスを計数する。また
第3図のラツチ群7a〜7dはクリアーされる。そして
第2音節における第1のパルスdが送出された時にイン
クリメントパルスが4ビツトカウンタ12cに印加され
4サイクルから5サイクルへと進む。以下5サイクルか
ら12サイクルまでは上記した動作と同様なので、説明
は省略する.なお第4図のラツチ9bには第2音節の中
間値が、ラツチ9cには第3音節の中間値が記憶される
ものである。
A signal suitable for dividing syllables is applied to the other input terminal of this comparison circuit 11a. Here, the output from the latch 7d is set as A, and the comparison reference output is set as B, and when A≧B, the comparison circuit 11a outputs the output from the latch 7d, which is predetermined to be suitable for dividing syllables. When it is larger, the syllable break pulse s is used, and vice versa A<B
When , a voiced pulse t is sent out. Note that 11b and 11c are AND circuits for obtaining the above-mentioned signal s or t using the timing pulse r from the circuit control section 12d. When the output from the comparator circuit 11a is the voiced pulse t, the above operation is repeated until the syllable dividing pulse s appears, the first pulse of the next syllable is detected, and the pulse s is detected. In this case, pulses E, l, j, j', and jl are sent out from the 4-bit counter 12c.Therefore, the flip-flop circuit 4e in FIG. The 10 KHz clock pulses are counted.Also, the latches 7a-7d in FIG. Proceed to the 5th cycle.The operations from the 5th cycle to the 12th cycle are the same as those described above, so the explanation will be omitted.In addition, the latch 9b in Fig. 4 has the intermediate value of the second syllable, and the latch 9c has the middle value of the 3rd syllable. The intermediate value of is stored.

さらに第3音節における音節区切パルスであるhを検出
した時には、単語の終りとして、回路制御部12dより
パルンcを送出し、音声信号の入力を遮断する。ここで
各ラツチ群9a〜9cの出力は上位4ビツトを加算器1
0a〜10cに入力し、元の8ビツトと加算し、各音節
の中間値に幅をもたせている。
Furthermore, when h, which is a syllable dividing pulse in the third syllable, is detected, the circuit control unit 12d sends a pulse c as the end of the word, and cuts off the input of the audio signal. Here, the output of each latch group 9a to 9c is added to the adder 1 by adding the upper 4 bits.
It is input to 0a to 10c and added to the original 8 bits, giving a range to the intermediate value of each syllable.

すなわち音声には変化があるので、ラツチ9aと9bと
が等音であつたとしても必ずしも一致しないためである
。このため発声において高低がある場合には一音以上の
差をつけることが必要である。そして第1比較器群10
dでラツチ9aからの信号(1)と加算器10aからの
信号(2)及びラツチ9bからの信号0〕と加算器10
bからの信号(4)とを比較し、また第2比較器群10
eでラツチ9bからの信号1と加算器10bからの信号
(2)及びラツチ9cからの信号3と加算器10cから
の信号4とを比較する.その結果は別表の2に示す如き
2ビツトデータの出力を送出する。例えば3音節から成
る単語において高低が第12A図のように変つた場合1
1,01の出力を出し、第12B図のように変つた場合
10,11の出力を出す。この組合せは全部で9通りで
ある。ここで回路制御部12dからのパルスpによつて
4ビツトラツチ10fに記憶し、制御器、例えば義手に
おける「つかむ」ためのモータを制御する。さらに作業
が終了した後、回路宙u御部12dより4ビツトラツチ
10fをクリアーするパルス信号qを送出し、次いでパ
ルスE,l,j,j′,Jl,O,O′,olを送出し
、初期の状態に戻るものである。なお上記実施例では3
音節より成る単語の認識について説明したが、2音節お
よび1音節の認識も容易である。
That is, since there are changes in voice, even if the latches 9a and 9b are equal sounds, they do not necessarily match. For this reason, if there is a difference in pitch in vocalization, it is necessary to create a difference of one or more notes. and the first comparator group 10
At d, the signal (1) from the latch 9a, the signal (2) from the adder 10a, and the signal 0 from the latch 9b] and the adder 10
b and the second comparator group 10.
At e, signal 1 from latch 9b is compared with signal (2) from adder 10b, and signal 3 from latch 9c and signal 4 from adder 10c are compared. As a result, 2-bit data output as shown in Table 2 is sent out. For example, if the pitch changes in a word consisting of three syllables as shown in Figure 12A, 1
Outputs of 1 and 01 are output, and when the output changes as shown in FIG. 12B, outputs of 10 and 11 are output. There are a total of nine combinations. Here, the pulse p from the circuit control section 12d is stored in the 4-bit latch 10f, and controls a controller, for example, a motor for "grasping" in a prosthetic hand. Furthermore, after the work is completed, the circuit controller 12d sends out a pulse signal q to clear the 4-bit latch 10f, and then sends out pulses E, l, j, j', Jl, O, O', ol, It returns to the initial state. In the above example, 3
Although recognition of words consisting of syllables has been described, recognition of two and one syllables is also easy.

以下第13図と共に説明する。今1音節だけ入力される
と、上記したと同様第3サイクルまで進行し、代表値が
決定されると共にラツチ9aに保持さべまた300Hz
クロツクパルス発生回路6bに切換えられ、8ビツトカ
ウンタ5は300Hzのクロツクパルスを計数する。こ
こで第2音節が表われないので、8ビツトカウンタ5は
オーバフローしてパルスhを送出し、回路制御部12d
よりパルスCが送出されフリツプフロツプ回路4aをり
セツトして入力を閉じる。その後直ちにパルスqが送出
されて4ビツトラツチ10fをクリアーされると共にパ
ルスU,vが回路僧u御部12dより送出される。従つ
てインパータ回路10g,10hで反転されて、比較器
群10d,10eよりの出力をAND回路10i,10
jでストツプさせる。これによつて4ビツトラツチ10
fよりパルスpが入力されると終了を示す第12C図の
如く00,00の出力を出す。次に2音節が入力されて
、3音節目が入力されない場合は、上記した第7サイク
ルまでが進行する。すなわちラツチ9a,9bに夫々第
1音節と第2音節との代表値が保持され、8ビツトカウ
ンタ5は300Hzのクロツクパルスを計数する。ここ
で第3音節が表われないので、8ビツトカウンタ5はオ
ーバフローしてパルスhが送出され、従つてパルスcに
よつてフリツプフロツプ回路4aがりセツトされる。そ
して4ビツトラツチ10fがパルスqによつてクリアー
されると共に回路制御部12dよりパルスvのみが送出
される。これによりパルスpが入力されるとAND回路
101より比較器群10dの出力のみが4ビツトラツチ
10fに入力される。この入力は例えば第12D図に示
す如く11,00である。なお3音節以上の場合であつ
ても、上記した原理を応用することによつて認識可能と
なる。
This will be explained below with reference to FIG. If only one syllable is input now, the process will proceed to the third cycle as described above, and the representative value will be determined and held in the latch 9a.
The clock pulse generation circuit 6b is switched, and the 8-bit counter 5 counts 300 Hz clock pulses. Since the second syllable does not appear here, the 8-bit counter 5 overflows and sends out the pulse h, and the circuit controller 12d
A pulse C is sent out to reset the flip-flop circuit 4a and close the input. Immediately thereafter, pulse q is sent out to clear the 4-bit latch 10f, and pulses U and v are sent out from the circuit controller 12d. Therefore, the inverter circuits 10g and 10h invert the outputs, and the outputs from the comparator groups 10d and 10e are sent to AND circuits 10i and 10.
Press j to stop. This results in a 4-bit latch 10
When a pulse p is input from f, outputs of 00,00 are output as shown in FIG. 12C indicating the end. Next, if the second syllable is input and the third syllable is not input, the process continues up to the seventh cycle described above. That is, the representative values of the first and second syllables are held in the latches 9a and 9b, respectively, and the 8-bit counter 5 counts 300 Hz clock pulses. Since the third syllable does not appear here, the 8-bit counter 5 overflows and pulse h is sent out, so that flip-flop circuit 4a is reset by pulse c. Then, the 4-bit latch 10f is cleared by the pulse q, and only the pulse v is sent out from the circuit control section 12d. As a result, when pulse p is input, only the output of comparator group 10d is input from AND circuit 101 to 4-bit latch 10f. This input is, for example, 11,00 as shown in Figure 12D. Note that even in the case of three or more syllables, recognition is possible by applying the above-described principle.

また上記実施例において判別処理をマイクロコンピユー
タによつて行えることも勿論可能である。さらに変化判
定の分類を3つに限定(実施例で 2は前段の音節に対
して上つたか、下つたかあるいは同じか)せず、変化判
定回路Dを変更することにより、上下の変化を細分化す
ることもできる。この発明は上記したように、雑音の少
ない気管外壁にマイクを取付け、発声される音声をモー
ラ毎に区切つて検出し、かつ音声として安定していない
初期数周期の波形を除外すると共に残りの数周期をピツ
クアツプしてその中から代表値を決定し、このように得
られた複数の代表値の高低変化よりパターンを類別して
制御機器を制御するものであるから、高い認識率を得る
ことができると共に音声としては通常の発生であつても
ハミングであつても情報確認が可能である等の効果を有
するものである。
Furthermore, it is of course possible that the discrimination processing in the above embodiments can be performed by a microcomputer. Furthermore, instead of limiting the classification of change judgment to three (in the example, 2 indicates whether the syllable is above, below, or the same as the previous syllable), by changing the change judgment circuit D, it is possible to detect vertical changes. It can also be subdivided. As described above, this invention attaches a microphone to the outer wall of the trachea where there is little noise, detects the voice uttered by dividing it into moras, and excludes the waveform of the initial few cycles that are not stable as voice, and detects the voice that is not stable as voice. Since the method picks up the period, determines a representative value from among them, and controls the control equipment by classifying patterns based on the height changes of the multiple representative values obtained in this way, it is possible to obtain a high recognition rate. In addition, it has the effect that information can be confirmed even if the sound is normal or humming.

【図面の簡単な説明】[Brief explanation of drawings]

図はこの発明に係る音声識別方法に使用する装置の一実
施例を示し、第1図は全体のプロツク図、第2図はカウ
ンタ回路部の回路図、第3図は代表値決定回路部の回路
図、第4図は変化判定回路部の回路図、第5図は音節区
切れ処理回路部の回路図、第6図はシステム制御部の回
路図、第7〜11図はタイミングチヤート図、第12A
−D図は音節の変化を示す線図、第13図は上記第4図
の他の実施例を示す回路図である。
The figures show an embodiment of the apparatus used in the voice identification method according to the present invention, in which Fig. 1 is an overall block diagram, Fig. 2 is a circuit diagram of the counter circuit section, and Fig. 3 is a circuit diagram of the representative value determining circuit section. 4 is a circuit diagram of the change determination circuit section, FIG. 5 is a circuit diagram of the syllable break processing circuit section, FIG. 6 is a circuit diagram of the system control section, and FIGS. 7 to 11 are timing chart diagrams. 12th A
-D is a diagram showing changes in syllables, and FIG. 13 is a circuit diagram showing another embodiment of FIG. 4.

Claims (1)

【特許請求の範囲】[Claims] 1 音節毎に区切つて発生される音を気管外壁において
マイクで検出する手段と、該各区間の音の初期数周期を
除外する手段と、前記音節の区切れを判別する手段と、
該区切られた前記除外された残りの数周期の測定値より
代表値を決定する手段と、前記区切られた時点より所定
の時間内にマイクよりの検出信号が有するか否かを判別
する手段と、該判別時間内に検出信号が存在しない場合
、前記代表値にてパターン類別し、検出信号が存在する
場合、前記したと同様な手段で代表値を求め、以降検出
信号が存在し得る間は前記と同様な手段で代表値を決定
し、かつ夫々前の代表値と比較し音の高低を判定してパ
ターン類別する手段とを備えて成る音声識別方法。
1. A means for detecting the sound generated by dividing each syllable with a microphone on the outer wall of the trachea, a means for excluding the initial few cycles of the sound in each section, and a means for determining the division of the syllable.
means for determining a representative value from the measured values of the remaining several periods separated and excluded; and means for determining whether or not there is a detection signal from the microphone within a predetermined time from the time of the separation. , If there is no detection signal within the discrimination time, the pattern is classified based on the representative value, and if a detection signal is present, the representative value is obtained by the same means as described above, and thereafter, while the detection signal may exist, the pattern is classified using the representative value. A voice identification method comprising means for determining a representative value by the same means as described above, comparing each representative value with the previous representative value to determine the pitch of the sound, and classifying the pattern.
JP1714377A 1977-02-21 1977-02-21 Voice identification method Expired JPS5945160B2 (en)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP1714377A JPS5945160B2 (en) 1977-02-21 1977-02-21 Voice identification method
US05/877,394 US4178472A (en) 1977-02-21 1978-02-13 Voiced instruction identification system
NL7801789A NL7801789A (en) 1977-02-21 1978-02-16 VOICE IDENTIFIER.
DE19782806920 DE2806920A1 (en) 1977-02-21 1978-02-17 VOICE IDENTIFICATION SYSTEM
FR7804744A FR2381369A1 (en) 1977-02-21 1978-02-20 VOICE IDENTIFICATION SYSTEM
GB6753/78A GB1594412A (en) 1977-02-21 1978-02-21 Voiced instruction identification system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1714377A JPS5945160B2 (en) 1977-02-21 1977-02-21 Voice identification method

Publications (2)

Publication Number Publication Date
JPS53102603A JPS53102603A (en) 1978-09-07
JPS5945160B2 true JPS5945160B2 (en) 1984-11-05

Family

ID=11935769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1714377A Expired JPS5945160B2 (en) 1977-02-21 1977-02-21 Voice identification method

Country Status (1)

Country Link
JP (1) JPS5945160B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0524631Y2 (en) * 1987-04-28 1993-06-22

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0524631Y2 (en) * 1987-04-28 1993-06-22

Also Published As

Publication number Publication date
JPS53102603A (en) 1978-09-07

Similar Documents

Publication Publication Date Title
Weintraub A theory and computational model of auditory monaural sound separation
CA1216673A (en) Text to speech system
US4284846A (en) System and method for sound recognition
US3940565A (en) Time domain speech recognition system
JPS6147440B2 (en)
JPH0121519B2 (en)
WO1990011593A1 (en) Method and apparatus for speech analysis
US4178472A (en) Voiced instruction identification system
Howard Peak‐picking fundamental period estimation for hearing prostheses
JPS5945160B2 (en) Voice identification method
CN113316816A (en) Frequency extraction method using DJ transform
US4276445A (en) Speech analysis apparatus
JP2004341340A (en) Speaker recognition device
JPH0261760B2 (en)
US20060149539A1 (en) Method for separating a sound frame into sinusoidal components and residual noise
Funada A method for the extraction of spectral peaks and its application to fundamental frequency estimation of speech signals
KR0180651B1 (en) Voice recognition device
JPS6129520B2 (en)
SU1781701A1 (en) Method of separation of speech and nonstationary noise signals
Guang-Yan et al. Correction of distortion mask speech based on parameter estimation of AR model
Atal et al. Decomposing speech into formants: A new look at an old problem
Schauer Very low frequency characteristics of speech
Wen et al. Separation of impulsive acoustical events
JPS61246800A (en) Voice response switch
Shigenaga et al. Articulatory movements by time optimal control