JPS6177100A - Voice section detecting circuit - Google Patents

Voice section detecting circuit

Info

Publication number
JPS6177100A
JPS6177100A JP59199212A JP19921284A JPS6177100A JP S6177100 A JPS6177100 A JP S6177100A JP 59199212 A JP59199212 A JP 59199212A JP 19921284 A JP19921284 A JP 19921284A JP S6177100 A JPS6177100 A JP S6177100A
Authority
JP
Japan
Prior art keywords
voice
voice section
section
threshold
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59199212A
Other languages
Japanese (ja)
Other versions
JPH0573034B2 (en
Inventor
河本 俊毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59199212A priority Critical patent/JPS6177100A/en
Publication of JPS6177100A publication Critical patent/JPS6177100A/en
Publication of JPH0573034B2 publication Critical patent/JPH0573034B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 投亙分互 本発明は、音声認識装置における音声区間検出回路に関
する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a speech interval detection circuit in a speech recognition device.

従」U支遁− 一般に音声認識装置において入力音声の信号対雑音比が
良好な音声を対像とする場合には音声の存在する区間を
抽出することは比較的容易なことである。しかし、音声
認m装置が実際に使用されるような環境においては種々
の騒音を含み、騒音と重畳された形で音声が入力される
。この時の騒音は時々刻々と変化するので固定的な閾値
を設けておいて音声区間を切出す方法では安定な音声区
間の検出は困難であり、誤認識の一因となる。このよう
な固定閾値による切出しによると高騒音下では本来音声
区間であるべき所の前後に騒音が付加して切出されるこ
とになる。
In general, when a speech recognition device uses speech with a good signal-to-noise ratio as an input speech, it is relatively easy to extract a section where speech exists. However, the environment in which the voice recognition device is actually used includes various kinds of noise, and the voice is input in a form superimposed on the noise. Since the noise at this time changes from moment to moment, it is difficult to detect a stable voice section by setting a fixed threshold value and cutting out the voice section, which may cause misrecognition. When clipping is performed using such a fixed threshold value, under high noise conditions, noise is added before and after what should normally be a voice section and is clipped.

1−一煎 本発明は、上述のごとき問題点を解決するためになされ
たもので、特に、周囲の定常騒音レベルの大小にかかわ
りなく安定な音声区間検出を行ない、安定した認識率を
確保することを目的としてなされたものである。
1-1 The present invention has been made in order to solve the above-mentioned problems, and in particular, to perform stable speech segment detection regardless of the level of ambient steady noise to ensure a stable recognition rate. It was done for that purpose.

請−a 本発明は、上記目的を達成するため、音声信号パワーを
抽出し、その無音区間内で閾値を設定して音声区間を切
出す音声区間検出装置において。
Request-a In order to achieve the above object, the present invention provides a voice section detection device that extracts voice signal power and sets a threshold value within the silent section to cut out the voice section.

音声の終端から所定時間(t秒)経過した時点に発生す
るパルス及び音声の始端から所定時間(S秒)経過した
時点に発生するパルスを用いてその時のノイズレベルを
サンプルしてホールドするサンプルホールド手段を有し
、そのホールド値を音声区間切出しの閾値として音声区
間を検出することを特徴としたものである。以下、本発
明の実施例に基づいて説明する。
Sample hold that samples and holds the noise level at that time using a pulse that occurs when a predetermined time (t seconds) has elapsed from the end of the voice and a pulse that occurs after a predetermined time (S seconds) has elapsed from the start of the voice. The present invention is characterized in that it has a means for detecting a voice section and uses the hold value as a threshold for cutting out a voice section. Hereinafter, the present invention will be explained based on examples.

本発明は、音声区間の終端から所定時間(t秒)だけ経
過した時点でのノイズレベル及び音声区間の始端から所
定時間(S秒)だけ経過した時点でのノイズレベルをホ
ールドしてそれを音声区間検出のための閾とするもので
ある。前記tは、促音を持つ単語では無音区間が200
〜400+ns存在する事に基いており、これ以下で次
の音声が入力されれば1前後する音声は一単語として処
理される様な配慮から決定される。又、発声中に環境騒
音のレベルが上がると終端を検出することが出来ない場
合があるので、始端からS秒経過しても終端を検出出来
ない場合は強制的にその時点を音声区間の終端とし、そ
の時のノイズレベルをホールドする。
The present invention holds the noise level at the time when a predetermined time (t seconds) has elapsed from the end of the voice section and the noise level at the time when a predetermined time (S seconds) has elapsed from the start of the voice section, and converts the noise level into a voice. This is used as a threshold for section detection. The above t is 200 silent intervals for words with consonants.
This is based on the fact that ~400+ns exists, and the decision is made with the consideration that if the next voice is inputted after this time, the voice that is around 1 will be processed as one word. Also, if the level of environmental noise increases during vocalization, it may not be possible to detect the end, so if the end cannot be detected even after S seconds have passed from the start, that point will be forced to be the end of the voice section. and hold the noise level at that time.

第1図は、本発明による音声区間検出回路の一実施例を
説明するための電気的ブロック線図、第2図は、タイム
チャートで、第1図において、1は入力端、2は検波回
路、3は平滑回路、4はサンプルホールド回路、5はレ
ベル比較回路、6は音声区間弁別回路、7は出力端であ
る。また、第2図において、(Q)は入力信号の平均信
号レベルの例を示し、T1.T2は閾値の切り換わり時
点を示す。(b)は(0)の閾値で検出した音声区間信
号、(c)は(b)の音声区間信号の立下がりからt秒
後に区間信号がロウの時に発生する音声区間終端パルス
、(d)は(b)の音声区間信号の立上がりからS秒以
内に(c)の終端パルスが発生しなかった場合に発生す
るパルスで、この(C)と(d)のパルスによってサン
プルホールドが動き閾値が切り換わる。
FIG. 1 is an electrical block diagram for explaining an embodiment of the voice section detection circuit according to the present invention, and FIG. 2 is a time chart. In FIG. 1, 1 is an input terminal, and 2 is a detection circuit. , 3 is a smoothing circuit, 4 is a sample hold circuit, 5 is a level comparison circuit, 6 is a voice section discrimination circuit, and 7 is an output terminal. Further, in FIG. 2, (Q) shows an example of the average signal level of the input signal, and T1. T2 indicates the switching point of the threshold value. (b) is the voice section signal detected using the threshold of (0), (c) is the voice section end pulse that occurs when the section signal is low t seconds after the fall of the voice section signal in (b), (d) is a pulse that occurs when the terminal pulse in (c) does not occur within S seconds from the rise of the voice section signal in (b), and the sample hold moves due to the pulses in (C) and (d), and the threshold value is set. Switch.

第1図において、入力端1からの入力信号は、検波回路
2、平滑回路3を通して平均信号レベルが検出され、サ
ンプルホールド回路4及びレベル比較回路5に入力され
る。このレベル比較回路5からの出力信号が音声区間弁
別回路6に入力され。
In FIG. 1, the average signal level of an input signal from an input terminal 1 is detected through a detection circuit 2 and a smoothing circuit 3, and is input to a sample hold circuit 4 and a level comparison circuit 5. The output signal from this level comparison circuit 5 is input to a voice section discrimination circuit 6.

ここで発生する音声区間終端パルス及び終端が検出でき
ない場合は始端からS秒後に発生するパルスがサンプル
ホールド回路4に入力され、その時の信号レベルがホー
ルドされる。このホールドされた値と平均信号レベルと
がレベル比較回路5で比1咬され音声区間信号段7に出
力される。なお、以上は音声終端パルス及び終端検出が
できない場合に発生ずるパルスが発生した時のノイズレ
ベルをそのまま次の閾値とする方式であるが、より安定
に動作させるため、この閾値にある固定値を加えたもの
を音声区間検出の閾値とする方式も考えられる。
If the voice section end pulse generated here and the end cannot be detected, the pulse generated S seconds after the start end is input to the sample hold circuit 4, and the signal level at that time is held. This held value and the average signal level are compared by one in the level comparison circuit 5 and outputted to the voice section signal stage 7. Note that the above method uses the noise level at the time when the audio end pulse and the pulse that occurs when the end cannot be detected as the next threshold, but in order to operate more stably, a fixed value for this threshold can be set. A method may also be considered in which the added value is used as a threshold for voice section detection.

第3図は、上記方式の一実施例を示す電気的ブロック線
図で、この実施例は前記の閾値にある固定値を加えたも
のを音声区間検出の閾値とするもので、図中、8は基準
電圧源、9は加算器で、その他第1図と同様の作用をす
る部分には第1図の場合と同一の参照番号が付しである
。而して、この実施例は、基準電圧源8と加算器9を有
し、加算器9において、サンプルホールド回路4の出力
に基準電圧源8からの一定しベル電圧Vsが加算され、
この加算された値がレベル比較回路5の新しい閾値とな
るものである。
FIG. 3 is an electrical block diagram showing an embodiment of the above method. In this embodiment, the threshold value for voice section detection is the sum of the above threshold value and a fixed value. 1 is a reference voltage source, 9 is an adder, and other parts having the same functions as in FIG. 1 are given the same reference numerals as in FIG. Thus, this embodiment has a reference voltage source 8 and an adder 9, and the adder 9 adds a constant bell voltage Vs from the reference voltage source 8 to the output of the sample and hold circuit 4.
This added value becomes the new threshold value of the level comparison circuit 5.

羞−一困 以上の説明から明らかなように、本発明によると最適な
閾値を求めて区間信号を検出することが可能となる。
As is clear from the above description, according to the present invention, it is possible to detect an interval signal by determining an optimal threshold value.

【図面の簡単な説明】 第1図は1本発明の一実施例を説明するための電気的ブ
ロック線図、第2図は、タイムチャート。 第3図は1本発明の他の実施例を示す電気的ブロック線
図である。 1・・・入力端、2・・・検波回路、3・・・平滑回路
、4・・サンプルホールド回路、5・・・レベル比較回
路、6・・・音声区間弁別回路、7・・・出力端、8・
・・基準電圧、9・・・加算器。 if凶 第 2 図 第3図
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is an electrical block diagram for explaining an embodiment of the present invention, and FIG. 2 is a time chart. FIG. 3 is an electrical block diagram showing another embodiment of the present invention. 1... Input end, 2... Detection circuit, 3... Smoothing circuit, 4... Sample hold circuit, 5... Level comparison circuit, 6... Voice section discrimination circuit, 7... Output Edge, 8・
...Reference voltage, 9...Adder. If bad Figure 2 Figure 3

Claims (2)

【特許請求の範囲】[Claims] (1)、音声信号パワーを抽出し、その無音区間内で閾
値を設定して音声区間を切出す音声区間検出装置におい
て、音声の終端から所定時間(t秒)経過した時点に発
生するパルス及び音声の始端から所定時間(s秒)経過
した時点に発生するパルスを用いてその時のノイズレベ
ルをサンプルしてホールドするサンプルホールド手段を
有し、そのホールド値を音声区間切出しの閾値として音
声区間を検出することを特徴とする音声区間検出回路。
(1) In a voice section detection device that extracts the voice signal power and sets a threshold value within the silent section to cut out the voice section, a pulse and a It has a sample hold means that samples and holds the noise level at that time using a pulse generated at the time when a predetermined time (s seconds) has elapsed from the start of the voice, and uses the hold value as a threshold for cutting out the voice section to separate the voice section. A voice section detection circuit characterized by detecting.
(2)、前記閾値にある固定値を加算する手段を有し、
その値を音声区間切出しの閾値として音声区間を検出す
ることを特徴とする特許請求の範囲第(1)項に記載の
音声区間検出回路。
(2), comprising means for adding a fixed value to the threshold;
The speech section detection circuit according to claim 1, wherein the speech section is detected using the value as a threshold for cutting out the speech section.
JP59199212A 1984-09-21 1984-09-21 Voice section detecting circuit Granted JPS6177100A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59199212A JPS6177100A (en) 1984-09-21 1984-09-21 Voice section detecting circuit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59199212A JPS6177100A (en) 1984-09-21 1984-09-21 Voice section detecting circuit

Publications (2)

Publication Number Publication Date
JPS6177100A true JPS6177100A (en) 1986-04-19
JPH0573034B2 JPH0573034B2 (en) 1993-10-13

Family

ID=16403994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59199212A Granted JPS6177100A (en) 1984-09-21 1984-09-21 Voice section detecting circuit

Country Status (1)

Country Link
JP (1) JPS6177100A (en)

Also Published As

Publication number Publication date
JPH0573034B2 (en) 1993-10-13

Similar Documents

Publication Publication Date Title
JPS6245730B2 (en)
US3377428A (en) Voiced sound detector circuits and systems
JPS6177100A (en) Voice section detecting circuit
JPH0311139B2 (en)
JPS60216400A (en) Voice section detecting circuit
JPS59228300A (en) Voice section detecting system
JPS61177499A (en) Voice section detecting system
JPS59228299A (en) Voice section detecting system
JPS607497A (en) Voice recognition equipment
JPS59124399A (en) Voice recognition equipment
JP2712176B2 (en) Voice detection device
JPS61259296A (en) Voice section detection system
JPS59231600A (en) Voice section detecting system
JPS60101598A (en) Voice section detector
JPS60217400A (en) Binary coding apparatus for voice spectrum
JP3033537B2 (en) Voice detector
JPS5834986B2 (en) Adaptive voice detection circuit
JPS60191300A (en) Voice section detecting circuit
JPS61140999A (en) Voice section detection system
JPS6267598A (en) Voice section detection system
JPS62237498A (en) Voice section detecting method
JPS63127296A (en) Voice section detection system
JPH03233600A (en) Voice segmenting method and voice recognition device
Wu et al. Adaptive pitch detection algorithm for noisy signals
KR940012369A (en) Address guide defect presence or absence control device

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term