JPS60216399A - Voice section detecting circuit for voice recognition equipment - Google Patents

Voice section detecting circuit for voice recognition equipment

Info

Publication number
JPS60216399A
JPS60216399A JP59073536A JP7353684A JPS60216399A JP S60216399 A JPS60216399 A JP S60216399A JP 59073536 A JP59073536 A JP 59073536A JP 7353684 A JP7353684 A JP 7353684A JP S60216399 A JPS60216399 A JP S60216399A
Authority
JP
Japan
Prior art keywords
level
speech
signal
section
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59073536A
Other languages
Japanese (ja)
Inventor
安田 晴剛
中谷 奉文
河本 俊毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59073536A priority Critical patent/JPS60216399A/en
Publication of JPS60216399A publication Critical patent/JPS60216399A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 筑4分1 本発明は、音声認識装置における音声区間検出回路に関
する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a speech section detection circuit in a speech recognition device.

従米用先 一般に、入力音声の信号対雑音比が良好な音声を対象と
する場合には音声の存在する区間を抽出することは比較
的容易なことである。しかし、音声認識装置が実際に使
用されるような環境においては種々の騒音を含み騒音と
重畳された形で音声が入力される。この時の騒音は時々
刻々と変化するので、固定的な閾値を設けておいて音声
区間を切り出す方法では安定な音声区間の検出は困難で
あり、誤認識の一因となる。このような固定閾値による
切り出しでは音声の語頭及び語尾及び無声子音のような
パワーの低い部分がカッi〜される事になる。また、高
騒音下では本来音声区間であるべき所の前後に騒音が付
加して切り出される事になる。
Generally speaking, when the target is input speech with a good signal-to-noise ratio, it is relatively easy to extract the section where speech exists. However, in an environment in which a speech recognition device is actually used, speech is input in a form that includes various noises and is superimposed on the noise. Since the noise at this time changes from moment to moment, it is difficult to detect stable voice sections by setting a fixed threshold value and cutting out voice sections, and this becomes a cause of misrecognition. When clipping is performed using such a fixed threshold, low-power parts such as the beginning and end of speech and voiceless consonants are cut out. Furthermore, under high noise conditions, noise will be added and cut out before and after what should originally be a voice section.

■−−〕狂 本発明は、−に述のごとき実情に鑑みてなされたもので
、特に、周囲の定常騒音レベルの大小にがかわりなく安
定な音声区間の検出を行ない、安定した認識率を確保す
ることのできる音声区間検出回路を提供することを目的
としてなされたものである。
■--] The present invention was made in view of the actual situation mentioned in -.In particular, it detects stable speech sections regardless of the level of ambient steady noise, and achieves a stable recognition rate. This was done with the purpose of providing a voice section detection circuit that can ensure the following.

碧−一一戊 本発明の構成13ついて、以下、実施例に基づいて説明
する。
Configuration 13 of the present invention will be described below based on examples.

本発明の特徴とする所は、あらかじめ設定されたノイズ
に影響を受けない高いレベルの始端信号から一定周期で
遅延された過去の信号と比較し、その差が一定しベル以
」二あるかどうかを検出し、−室以上あれば更にその一
回前のサンプルと比較し、もって、最も低い閾値をめて
それを最適閾値とし、かつ、遅延サンプル数を最低とし
て音声区間を検出することにある。
The feature of the present invention is to compare a preset high-level starting signal that is not affected by noise with a past signal that is delayed at a certain period, and determine whether the difference is constant and is greater than or equal to 2. is detected, and if it is greater than or equal to - room, it is further compared with the previous sample, and then the lowest threshold is determined, which is used as the optimal threshold, and the number of delayed samples is determined to be the minimum to detect the voice section. .

第1図は、本発明の動作原理を説明するためのタイムチ
ャートで、(a)において、Aは音声パワー信号、Bは
最適域値、n、n−1,n−2・・・はサンプル点を示
し、(b)はクロックパルス、(e)は音声区間信号を
示し、あらかじめ設定されたn点での始端値から(n−
1)点でのサンプル値と比較し、設定値以上の差がある
時は更に(n−2)点でのサンプル値と比較する。差が
設定値以上の時は更に(’n−3)点と比較し、同様に
(n−4)点と比較する。而して、例えば(n −3)
と(n−4)点との比較において設定値以下となると、
(n −3)点のレベルを最適閾値として音声パワー信
号の区間検出を行う。この様にすれば最適な閾値がまる
と共に最小の遅延数を得る事ができる。
FIG. 1 is a time chart for explaining the operating principle of the present invention. In (a), A is the audio power signal, B is the optimal threshold, and n, n-1, n-2, etc. are samples. (b) shows the clock pulse, (e) shows the voice section signal, and (n-
1) Compare with the sample value at point, and if there is a difference greater than a set value, further compare with the sample value at point (n-2). When the difference is greater than the set value, it is further compared with point ('n-3) and similarly with point (n-4). For example, (n −3)
If it becomes less than the set value in comparison with point (n-4),
Section detection of the audio power signal is performed using the level at point (n-3) as an optimal threshold. In this way, the optimal threshold value can be set and the minimum number of delays can be obtained.

第2図は、本発明による音声区間検出回路の一実施例を
示す図で、図中、1はバンドパスフィルタ(B P F
)、2は整流回路、3はローパスフィル=3− タ(’LPF)、4 nは0点コンパレータ、4 n 
−1はn−1点コンパレータ、4n−2はn−2点コン
パレータ、5はサンプルホールド回路、6は立下りエツ
ジ検出回路、7は閾値サンプルボールド回路、8は区1
?nコンパレータ、9はローパスフィルタ(L P F
)で、入力された音声信号は、BPFl、ll流回路2
.LPF3を通して第1図にAにて示す様な音声パワー
信号に変換され、0点コンパレータ4nと遅延ブロック
六方切換スイッチSnに入力される。初期状態において
は切換スイッチSn、5n−1,・旧・・はすべでON
になっており、クロックパルスによって順次サンプルポ
ール回路5で遅延される。0点コンパレータ4nにおい
ては、まず、最初のn点音声パワー信号と任意のレベル
とを比較し、その区間信号の始点を検出する。次に(n
 −1)点コンパレータにおいて、n点と(n−1)点
との値を比較し、その差分値が一定しベル以」二であれ
ば出方はi−レベルとなる。
FIG. 2 is a diagram showing an embodiment of the voice section detection circuit according to the present invention. In the figure, 1 is a band pass filter (B P F
), 2 is a rectifier circuit, 3 is a low-pass filter ('LPF), 4 n is a 0-point comparator, 4 n
-1 is n-1 point comparator, 4n-2 is n-2 point comparator, 5 is sample hold circuit, 6 is falling edge detection circuit, 7 is threshold sample bold circuit, 8 is section 1
? n comparator, 9 is a low pass filter (L P F
), the input audio signal is sent to the BPFi, ll flow circuit 2.
.. It is converted into an audio power signal as shown by A in FIG. 1 through the LPF 3, and is input to a 0-point comparator 4n and a delay block hexagonal changeover switch Sn. In the initial state, selector switches Sn, 5n-1, old... are all ON.
The signal is sequentially delayed by the sample pole circuit 5 according to the clock pulse. The 0-point comparator 4n first compares the first n-point audio power signal with an arbitrary level to detect the starting point of the section signal. Then (n
-1) In the point comparator, the values of point n and point (n-1) are compared, and if the difference value is constant and is less than or equal to Bell, the output becomes i-level.

第3図は、n−]点以下のコンパレータの構成を示す図
で、コンパレータ10.にょって入カ信4− 号■と■のレベル差をとり、コンパレータ102によっ
てその差信号◎と任意のレベル■とを比較する様になっ
ており、設定された任意のレベル以下であれば出力がロ
ーレベルとなる。この様なコンパレータを用いて(n−
1)点と(n −2)点。
FIG. 3 is a diagram showing the configuration of a comparator for points below n-], in which comparator 10. The level difference between input signals No. 4-■ and ■ is taken, and the difference signal ◎ is compared with an arbitrary level ■ by the comparator 102. If it is below the set arbitrary level, Output becomes low level. Using such a comparator (n-
1) point and (n -2) point.

(n−2)点と(n −3)点・・・・・・を比較し、
各々の出力とその1回あとのコンパレータとの出力の排
他的論理和をとり、その変化サンプル点を検出する。
Compare point (n-2) and point (n-3)...
The exclusive OR of each output and the output of the comparator one time after it is taken, and the change sample point is detected.

この変化サンプル点が最適閾値を得るサンプル点となる
This change sample point becomes the sample point from which the optimal threshold value is obtained.

上述のようにして得られた変化サンプル点において、遅
延サンプルホールドの切り換えスイッチを切り換え、閾
値サンプルホールドと区間コンパレータに入力する。又
、先の排他的論理和信号の各出力の総論埋積をめその立
ち下がりエッヂを検出し、そのパルスで先の遅延サンプ
ルの値をサンプルホールドして最適閾値とし、それと先
の切り換えスイッチで切り換えられたすでに固定遅延量
となっている遅延音声パワー信号とを区間コンパレータ
で比較し、音声区間信号を得る。又、先の遅延音声パワ
ー信号は離散的値となっているので、L P Fを通し
て’F ?i’)化すれが遅延音声パワー信号として用
いる事がIjr能であり、この様にして遅延音声パワー
信シ)と最適音声区間信号を得る事ができる。
At the change sample point obtained as described above, the delay sample and hold changeover switch is switched and input to the threshold sample and hold and the interval comparator. Also, detect the falling edge of each output of the previous exclusive OR signal, sample and hold the value of the previous delayed sample with that pulse, set it as the optimal threshold, and use it with the previous changeover switch. A section comparator compares the switched delayed voice power signal, which has already reached a fixed delay amount, to obtain a voice section signal. Also, since the delayed audio power signal is a discrete value, 'F?' is passed through LPF. It is possible to use the signal i') as the delayed voice power signal, and in this way, the delayed voice power signal (i') and the optimal voice section signal can be obtained.

勿−−−( 以上の説明から明らかなように1本発明によると、最適
な閾値をめて区間信号を検出する事が可能となり、しか
も、遅延量を自動的に最小にすることができる。
(As is clear from the above description, according to the present invention, it is possible to detect a section signal by setting an optimal threshold value, and moreover, it is possible to automatically minimize the amount of delay.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は、本発明の動作原理を説明するための図、第2
図は、本発明による音声区間検出回路の一実施例を説明
するための図、第3図は、n−1点以下のコンパレータ
の詳細図である。 1・・・バンドパスフィルタ(BPF)、2・・・整流
回路、3・・・ローパスフィルタ(LPF)、4n・・
・11点コンパレータ、4n−1・・・n−1点コンパ
レータ、4n−2・・・n−2点コンパレータ、5・・
・サンプルホールド回路、6・・・立下りエツジ検出回
路、7・・・7− 閾値サンプルホールド回路、8・・・区間コンパレータ
、9・・・ローパスフィルタ(LPF)、101,10
2・・・コンパレータ。 −8=
Figure 1 is a diagram for explaining the operating principle of the present invention, Figure 2 is a diagram for explaining the operating principle of the present invention.
The figure is a diagram for explaining one embodiment of the voice section detection circuit according to the present invention, and FIG. 3 is a detailed diagram of a comparator having n-1 points or less. 1... Band pass filter (BPF), 2... Rectifier circuit, 3... Low pass filter (LPF), 4n...
・11 point comparator, 4n-1... n-1 point comparator, 4n-2... n-2 point comparator, 5...
- Sample hold circuit, 6... Falling edge detection circuit, 7... 7- Threshold sample hold circuit, 8... Section comparator, 9... Low pass filter (LPF), 101, 10
2...Comparator. −8=

Claims (3)

【特許請求の範囲】[Claims] (1)、入力された音声信号を音声パワー信号に変換す
る手段を有する音声認識装置において、音声区間検出部
のあらかじめ設定されたスレシホールドレベルから区間
信号が発生する手段と、その時点から過去n回の遅延ブ
ロックと該スレシホールドレベルと(n−1)のレベル
を比較する手段と、(n−1)のレベルと(n −2)
、 (n −2)のレベルと(n −3)、・・・・・
・と1回まで比較する手段とを有することを特徴とする
音声区間検出回路。
(1) In a speech recognition device having a means for converting an input speech signal into a speech power signal, a means for generating a section signal from a preset threshold level of a speech section detection section, and means for comparing the n-time delay block and the threshold level with the level of (n-1); and the level of (n-1) with the level of (n-2).
, (n -2) level and (n -3),...
. A voice section detection circuit characterized in that it has a means for comparing up to once.
(2)、前記遅延ブロックの遅延量が可変で、かつ、自
動的に最小となることを特徴とする特許請求の範囲第(
1)項に記載の音声区間検出回路。
(2) The delay amount of the delay block is variable and is automatically minimized.
1) The voice section detection circuit described in item 1).
(3)、入力された音声信号を音声パワー信号に変換す
る手段を有する音声認識装置において、音声区間検出部
のあらかじめ設定されたスレシホールドレベルより前記
音声パワーが大きくなった時点から順次該スレシホール
ドレベルと過去1回前とのレベル差が所定値より大きい
か否かを判断する回路を有し、小されれば過去1回前と
過去2回前とのレベル差の比較をし、以下、同様の比較
をくり返して最適な区間検出レベルを自動的に検出する
ようにしたことを特徴とする音声区間検出回路。
(3) In a speech recognition device having means for converting an input speech signal into a speech power signal, the speech section detecting section sequentially detects the corresponding thread from a point in time when the speech power becomes larger than a preset threshold level. It has a circuit that determines whether the level difference between the hold level and the previous one in the past is larger than a predetermined value, and if it is smaller, it compares the level difference between the previous one and the previous two times, Hereinafter, a voice section detection circuit is characterized in that the optimum section detection level is automatically detected by repeating similar comparisons.
JP59073536A 1984-04-12 1984-04-12 Voice section detecting circuit for voice recognition equipment Pending JPS60216399A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59073536A JPS60216399A (en) 1984-04-12 1984-04-12 Voice section detecting circuit for voice recognition equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59073536A JPS60216399A (en) 1984-04-12 1984-04-12 Voice section detecting circuit for voice recognition equipment

Publications (1)

Publication Number Publication Date
JPS60216399A true JPS60216399A (en) 1985-10-29

Family

ID=13521046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59073536A Pending JPS60216399A (en) 1984-04-12 1984-04-12 Voice section detecting circuit for voice recognition equipment

Country Status (1)

Country Link
JP (1) JPS60216399A (en)

Similar Documents

Publication Publication Date Title
US6480823B1 (en) Speech detection for noisy conditions
US20080262856A1 (en) Method and system for enabling audio speed conversion
JP3402748B2 (en) Pitch period extraction device for audio signal
US4541110A (en) Circuit for automatic selection between speech and music sound signals
US8917886B2 (en) Method of distortion-free signal compression
JPS60216399A (en) Voice section detecting circuit for voice recognition equipment
US5058168A (en) Overflow speech detecting apparatus for speech recognition
US6281934B1 (en) Data slicing device and data slicing method for extracting data from a signal
JP3357742B2 (en) Speech speed converter
US20060077844A1 (en) Voice recording and playing equipment
US20090048696A1 (en) Digital audio processing
JPH06222794A (en) Voice speed conversion method
JPS60101598A (en) Voice section detector
JPH0673079B2 (en) Voice section detection circuit
JPS61140999A (en) Voice section detection system
JPS6395500A (en) Voice detection circuit
JPH04251299A (en) Speech section detecting means
JPS59228300A (en) Voice section detecting system
JPS59231600A (en) Voice section detecting system
JPS6333799A (en) Friction property detector
JPS58147265A (en) Digital signal deciding method
JPH035594B2 (en)
JPS61259296A (en) Voice section detection system
JPS63155200A (en) Pitch detection
JPH0394300A (en) Voice detector