JPS63281200A - Voice section detecting system - Google Patents

Voice section detecting system

Info

Publication number
JPS63281200A
JPS63281200A JP62115990A JP11599087A JPS63281200A JP S63281200 A JPS63281200 A JP S63281200A JP 62115990 A JP62115990 A JP 62115990A JP 11599087 A JP11599087 A JP 11599087A JP S63281200 A JPS63281200 A JP S63281200A
Authority
JP
Japan
Prior art keywords
threshold
sound
lpc
signal
average power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62115990A
Other languages
Japanese (ja)
Inventor
孝夫 鈴木
白木 裕一
庄司 保夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP62115990A priority Critical patent/JPS63281200A/en
Publication of JPS63281200A publication Critical patent/JPS63281200A/en
Pending legal-status Critical Current

Links

Landscapes

  • Selective Calling Equipment (AREA)
  • Alarm Systems (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、ディジタル通信分野のディジタル音声挿入シ
ステム、或いは音声パケットシステムにおける音声区間
の検出方式に関するものである。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a method for detecting a voice section in a digital voice insertion system or a voice packet system in the field of digital communications.

(従来の技術) 従来、音声区間検出方式に適用される音声検出器として
は第2図に示すものが知られている。第2図によれば、
入力端子1に入力された入力サンプル信号Aのうち、母
音等の比較的振幅の大きい信号AIは、振幅検出部2に
入力され、摩擦性子音による信号A2は、DC抑圧回路
4でオフセットを取り除かれた後、一定値aを加えその
符号ビットを取り出したものが零交差検出部3に入力さ
れる。振幅検出部2では、比較回路2aで信号Alの絶
対値と所定値θとの大小の比較をなし、その結果により
カウンタ2bを増減させ、このカウンタ2bのカウンタ
値が閾値THvより大きくなると、閾値回路2Cから出
力αVを高レベル「1」でOR回路5に出力する。一方
、零交差検出部3では、OR回路3aにて入力した符号
ビットと1サンプル前の符号ビットとの一致を判別し、
この結果が一致、不一致かによりカウンタ3bを増減さ
せる。このことは、入力が(−a)を横切る回数を数え
ることと等価であり、カウンタ3bのカウンタ値が閾値
THzより大きくなると、閾値回路2Cから出力α2を
高レベル「1」でOR回路5に出力する。このOR回路
5から閾値回路2C及び3Cからの出力αV及びα2と
の論理和αがハングオーバ制御回路6に入力され、ハン
グオーバ制御回路6にてOR回路5の出力αが高レベル
「1」から低レベル「0」になったとしても、一定時間
高レベル「1」を出力し続けるハングオーバ時間が付加
されて、出力端子7から出力αoutとして出力する。
(Prior Art) Conventionally, the one shown in FIG. 2 is known as a speech detector applied to the speech section detection method. According to Figure 2,
Among the input sample signals A input to the input terminal 1, a signal AI having a relatively large amplitude such as a vowel is input to the amplitude detection section 2, and a signal A2 due to a fricative consonant is subjected to offset removal by a DC suppression circuit 4. After that, a constant value a is added and the sign bit is extracted and input to the zero crossing detection section 3. In the amplitude detection section 2, a comparator circuit 2a compares the absolute value of the signal Al with a predetermined value θ, increases or decreases a counter 2b according to the result, and when the counter value of the counter 2b becomes larger than the threshold value THv, the threshold value The output αV from the circuit 2C is outputted to the OR circuit 5 at a high level "1". On the other hand, the zero crossing detection section 3 determines whether the sign bit inputted by the OR circuit 3a matches the sign bit one sample before, and
The counter 3b is increased or decreased depending on whether the result matches or does not match. This is equivalent to counting the number of times the input crosses (-a), and when the counter value of the counter 3b becomes larger than the threshold THz, the output α2 from the threshold circuit 2C is sent to the OR circuit 5 at a high level "1". Output. The logical sum α of the outputs αV and α2 from the threshold circuits 2C and 3C is input from the OR circuit 5 to the hangover control circuit 6, and the hangover control circuit 6 changes the output α of the OR circuit 5 from high level "1" to low level. Even if the level becomes "0", a hangover time is added in which the high level "1" is continued to be output for a certain period of time, and the output is output from the output terminal 7 as the output αout.

このαoutが高レベル「1」である間は有音であり、
低レベル「0」であれば無音である(昭和51年度電子
通信学会総合全国大会、1753  r零交差頻度を利
用した音声検出の一方式」荒関 卓、落合和雄)。
While this αout is at a high level “1”, there is a sound,
If the low level is "0", there is no sound (1975 General National Conference of the Institute of Electronics and Communication Engineers, 1753 "A method of sound detection using r zero crossing frequency" by Takashi Araseki and Kazuo Ochiai).

(発明が解決しようとする問題点) しかしながら、上記構成によれば、零交差回数は、入力
サンプル信号Aが一定値(−a)を横切る回数を数えて
いるので、正確な入力サンプル列もスペクトル分布の推
定とはならない。即ち、回線雑音と音声信号とが同じ零
交差数を持ったとしても、聴感上では有意なスペクトル
分布の違いが生じる可能性があり、音声区間の切り出し
が不正確になるという間通点があった。更に、音声区間
検出に零交差情報を用いているので、ハングオーバ時間
を大きく短縮することができず、このため全通話時間に
占める有音部分の割合いが高くなってしまい、ディジタ
ル音声挿入システム或いは音声パケットシステムの様に
、無音部分に他の音声やデータを伝送することにより伝
送路の有効利用を図るシステムにおいては、より一層の
効率化が期待できないという問題点があった。
(Problem to be Solved by the Invention) However, according to the above configuration, the number of zero crossings is counted as the number of times the input sample signal A crosses a certain value (-a), so the accurate input sample sequence is also It is not an estimation of the distribution. In other words, even if the line noise and the voice signal have the same number of zero crossings, there is a possibility that there will be a significant difference in the spectral distribution perceptually, and there will be a point where the extraction of the voice section will become inaccurate. Ta. Furthermore, since zero-crossing information is used to detect voice sections, it is not possible to significantly reduce hangover time, and as a result, the proportion of voiced sections in the total call time increases, making it difficult to use digital voice insertion systems or In a system such as a voice packet system that attempts to utilize the transmission path effectively by transmitting other voice or data during silent portions, there is a problem in that further efficiency cannot be expected.

本発明の目的は、上記問題点に鑑み、ハングオーバ時間
の短縮化が図れるとともに、的確に音声区間を検出でき
る音声区間検出方式を提供することにある。
SUMMARY OF THE INVENTION In view of the above-mentioned problems, an object of the present invention is to provide a voice section detection method that can shorten hangover time and accurately detect voice sections.

(問題点を解決するための手段) 本発明は、上記目的を達成するために、入力サンプル信
号の回線雑音と音声信号との識別をなし、音声信号を検
出する音声区間検出方式において、入力サンプル信号を
所定のフレーム長に区切り、各フレームのLPC分析を
なし、各フレームの平均パラとLPC係数を算出する分
析手段と、前記LPC係数と予め設定した標準ベクトル
とのLPC距離と予め設定した閾値との比較をなし、L
PC距離が該閾値よりも大きいならば有音と判定する第
1の判定手段と、前記平均パワと予め設定した閾値との
比較をなし、平均パワが該閾値よりも大きいならば有音
と判定する第2の判定手段と、前記平均バラと所定範囲
で更新可能な適応パワ閾値との比較をなし、平均パワが
該適応パワ閾値よりも大きいならば有音と判定する第3
の判定手段と、前記第1.第2及び第3の判定手段によ
る判定結果に基づいて音声信号の有音・無音の判定をな
すとともに、有音及び無音の各フレーム数を計数する第
4の判定手段と、前記第4の判定手段からの指示により
、適応パワ閾値を算出し、これを更新する更新手段とを
備え、前記更新手段は、連続する無音フレーム数が予め
設定した指定数に達するか、前記第1及び第2の判定手
段による判定が無音であり、かつ前記第3の判定手段に
より有音と判定されたフレームが連続しその数が前記指
定数に達した時に適応パワ閾値を更新するようになした
ことを特徴とする。
(Means for Solving the Problems) In order to achieve the above object, the present invention distinguishes the line noise of the input sample signal from the voice signal, and detects the voice signal by detecting the line noise of the input sample signal. an analysis means that divides the signal into predetermined frame lengths, performs LPC analysis on each frame, and calculates the average para and LPC coefficient of each frame; and the LPC distance between the LPC coefficient and a preset standard vector and a preset threshold value. Compare with L
a first determination means that determines that there is a sound if the PC distance is greater than the threshold; and a first determination means that compares the average power with a preset threshold, and determines that there is a sound if the average power is greater than the threshold; and a third determining means that compares the average variation with an adaptive power threshold that can be updated within a predetermined range, and determines that there is a sound if the average power is larger than the adaptive power threshold.
determining means; and the first determining means. a fourth determining means that determines whether the audio signal is voiced or silent based on the determination results of the second and third determining means, and counts the number of frames of voiced and silent frames; updating means for calculating and updating an adaptive power threshold based on an instruction from the means; The adaptive power threshold is updated when consecutive frames are determined to be silent by the determining means and are determined to be sound by the third determining means and the number reaches the specified number. shall be.

(作 用) 本発明によれば、分析手段により入力サンプル信号を所
定長のフレームに区切り、このフレームのLPC分析を
行なって平均バラとLPC係数を算出し、第1の判定手
段は、このLPC係数と予め設定しである標準ベクトル
とのLPC距離と予め設定した閾値との大小の比較を行
ないLPC距離に基づく有音・無音の判定を行う。第2
の判定手段はフレームの平均パワと予め設定した閾値と
の大小の比較を行い、フレームの平均パワに基づく有音
・無音の判定を行ない、更に、第3の判定手段では、フ
レームの平均バラと更新手段よりの適応パワ閾値との大
小の比較を行い、適応パワ閾値に基づく有音・無音の判
定を行う。ここで、第4の判定手段が以上の第1.第2
及び第3の判定手段の各々の判定結果を統合して音声信
号の有音・無音の判定を行ない音声が検出される。
(Function) According to the present invention, the analysis means divides the input sample signal into frames of a predetermined length, performs LPC analysis on the frames to calculate the average variation and the LPC coefficient, and the first determination means divides the input sample signal into frames of a predetermined length. A comparison is made between the LPC distance between the coefficient and a preset standard vector and a preset threshold value to determine whether there is a sound or no sound based on the LPC distance. Second
The third determination means compares the average power of the frame with a preset threshold value, and determines whether there is a sound or no voice based on the average power of the frame. A comparison is made with the adaptive power threshold from the updating means, and a determination is made as to whether there is a sound or not based on the adaptive power threshold. Here, the fourth determination means is the first determination means described above. Second
The determination results of the third determining means are integrated to determine whether the audio signal is voiced or not, and the voice is detected.

また、第4の判定手段は、有音及び無音の各フレーム数
を計数して、連続する無音フレーム数が予め設定した指
定数に達するか、前記第1及び第2の判定手段による判
定が無音であり、かつ前記第3の判定手段により有音と
判定されたフレームが連続し、その数が前記指定数に達
した時に更新手段に適応パワ閾値の更新を指示し、これ
により更新手段により、適応パワ閾値の算出、更新が行
なわれる。
The fourth determining means counts the number of frames with sound and without sound, and determines whether the number of consecutive silent frames reaches a preset specified number or whether the first and second determining means determine that there is no sound. and when the number of consecutive frames determined to be sound by the third determining means reaches the specified number, the updating means is instructed to update the adaptive power threshold, whereby the updating means: The adaptive power threshold is calculated and updated.

(実施例) 第1図は、本発明による音声区間検出方式が適用される
音声検出器の一実施例を示すブロック図である。図中、
1は入力端子、7は出力端子、10はLPC分析部、1
1はLPC距離算出部、12は標準ベクトルメモリ、1
3,14.16は比較部、15は適応パワ閾値更新部、
17は有音・無音判定部、18はハングオーバ時間付加
部である。
(Embodiment) FIG. 1 is a block diagram showing an embodiment of a speech detector to which the speech section detection method according to the present invention is applied. In the figure,
1 is an input terminal, 7 is an output terminal, 10 is an LPC analysis section, 1
1 is an LPC distance calculation unit, 12 is a standard vector memory, 1
3, 14.16 is a comparison unit, 15 is an adaptive power threshold update unit,
Reference numeral 17 represents a sound/non-speech determination unit, and 18 represents a hangover time addition unit.

LPC分析部10は、入力サンプル信号Aを入力して所
定のフレーム長に区切りLPC分析を行ないLPC分析
フレームの自己相関係数R1及びLPC係数kiを算出
し、自己相関係数行列IR及びLPC係数ベクトル1に
として、LPC距離算出部11に送出するとともに、第
0次の自己相関係数ROをLPC分析フレームの平均パ
ワとして、比較部14.16及び適応パワ閾値更新部1
5に送出する。
The LPC analysis unit 10 inputs the input sample signal A, divides it into predetermined frame lengths, performs LPC analysis, calculates the autocorrelation coefficient R1 and LPC coefficient ki of the LPC analysis frame, and calculates the autocorrelation coefficient matrix IR and the LPC coefficient. The vector 1 is sent to the LPC distance calculation unit 11, and the 0th order autocorrelation coefficient RO is set as the average power of the LPC analysis frame to the comparison unit 14.16 and the adaptive power threshold updating unit 1.
Send to 5.

LPC距離算出部11は、LPC分析部10からの自己
相関係数行列IR,LPC係数ベクトル1k及び標準ベ
クトルメモリ12に格納しである標準LPC係数ベクト
ル1bとから下記(1)式に従いLPC距離りを算出し
、その結果を比較部13に送出する。
The LPC distance calculation unit 11 calculates the LPC distance from the autocorrelation coefficient matrix IR from the LPC analysis unit 10, the LPC coefficient vector 1k, and the standard LPC coefficient vector 1b stored in the standard vector memory 12 according to the following formula (1). is calculated and the result is sent to the comparison section 13.

(lk−1b)・IRI・ (lk −1b ”) t
D −(1) lk  ・IR−Ikt 但し、lk−(1,kl 、に2 、  ・・・、kp
)lb−(1,bl 、b2 、・・・、bp)IR−
(Rlj) Rlj−R11−j  l  (t、  j−0+  
・・・、  p)Σ    x (n)  ・ x (
n+1)R1−□ 尚、NはLPC分析フレームのサンプル数、X(1)は
入力信号のサンプル値、pはLPC分析の分析次数、R
1はLPC分析フレームの第1次の自己相関係数、kl
は第1次のLPC係数、blは第1次の標準LPC係数
、nはLPC分析フレームの番号、tはベクトルの転置
を示す記号である。(上記(1)式は、昭和58年4月
15日、■コロナ社より発行の「音声のディジタル信号
処理(下)JP269−P271、の式9−21参照、
著者り、 R,Rablner 、 R,W、 5ch
af’er s訳者:鈴木久喜)。
(lk-1b)・IRI・(lk-1b ”) t
D-(1) lk ・IR-Ikt However, lk-(1, kl, 2, ..., kp
)lb-(1,bl,b2,...,bp)IR-
(Rlj) Rlj−R11−j l (t, j−0+
..., p) Σ x (n) ・ x (
n+1)R1-□ Note that N is the number of samples in the LPC analysis frame, X(1) is the sample value of the input signal, p is the analysis order of LPC analysis, and R
1 is the first-order autocorrelation coefficient of the LPC analysis frame, kl
is the first-order LPC coefficient, bl is the first-order standard LPC coefficient, n is the number of the LPC analysis frame, and t is a symbol indicating vector transposition. (For formula (1) above, refer to formula 9-21 of "Sound Digital Signal Processing (Part 2) JP269-P271," published by Corona Publishing, April 15, 1980.
Author: R, Rablner, R, W, 5ch
af'er s Translator: Hisaki Suzuki).

標準ベクトルメモリー2には、前記標準LPC係数ベク
トル1bが格納されており、この標準LPC係数ベクト
ル1bは、回線雑音を白色雑音とし、この白色雑音の実
測データから決定したものである。
The standard LPC coefficient vector 1b is stored in the standard vector memory 2, and this standard LPC coefficient vector 1b is determined from actual measurement data of white noise as line noise.

比較部13は、LPC距離算出部11からのLPC距離
りと閾値Dthとの比較をなし、下記(2)式に従い、
LPC距離りが閾値Dthよりも大きい場合は、LPC
距離りに基づく有音、無音の判定信号VDを有音を示す
高レベル「1」とし、LPC距離が閾値pthと等しい
か或いは小さい場合は、判定信号VDを無音を示す低レ
ベル「0」として有音・無音判定部17に送出する。
The comparison unit 13 compares the LPC distance from the LPC distance calculation unit 11 with the threshold value Dth, and according to the following formula (2),
If the LPC distance is greater than the threshold Dth, the LPC
The determination signal VD of whether there is a sound or no sound based on the distance is set to a high level "1" indicating the presence of sound, and when the LPC distance is equal to or smaller than the threshold value pth, the determination signal VD is set to a low level "0" indicating no sound. The signal is sent to the sound/silence determining section 17.

VD −1(D>Dth)      (2)0 (D
≦D th) 尚、閾値D−thは、LPC距離りがLPC係数ベクト
ル1k及び標準LPC係数ベクトル1bとがもつスペク
トル包絡の形が類似しておれば小さな値をもち、相違し
ておれば大きな値をもつ傾向があり、従って、LPC距
離りが大きいならば、入力フレームは白色的信号ではな
く有色性の信号、即ち音声信号として判断でき、このス
ペクトル分布の違いを利用して音声信号を検出するため
にLPC距離りに対して設けられたものである。
VD −1(D>Dth) (2)0 (D
≦D th) The threshold D-th has a small value if the spectral envelope shapes of the LPC coefficient vector 1k and the standard LPC coefficient vector 1b are similar in LPC distance, and has a large value if they are different. Therefore, if the LPC distance is large, the input frame can be determined as a colored signal, that is, an audio signal, rather than a white signal, and the audio signal can be detected using this difference in spectral distribution. This is provided for the LPC distance in order to

比較部14は、LPC分析部10からのLPC分析フレ
ームの平均パワ、即ち、第0次の自己相関係数ROと第
1の閾値p thi及び第2の閾値Pth2との比較を
なし、下記(3)式に従い、自己相関係数ROが閾値p
 thtよりも大きい場合は、LPC分析フレームの平
均パワに基づく有音、無音の判定信号Vpを有音を示す
高レベル「1」とし、自己相関係数ROが第1の閾値P
 thlと等しいか小さく、かつ第2の閾値P th2
よりも大きいか等しい場合は、検出信号Vpを無音を示
す低L/ベルrOJとし、更に、自己相関係数ROが閾
値Pth2より小さい場合は、検出信号Vpを同じく無
音を示す低レベル「−1」として有音・無音判定部17
に送出する。
The comparison unit 14 compares the average power of the LPC analysis frame from the LPC analysis unit 10, that is, the 0th order autocorrelation coefficient RO, with the first threshold p thi and the second threshold Pth2, and calculates the following ( 3) According to formula, the autocorrelation coefficient RO is set to the threshold p
If it is larger than tht, the sound/non-sound determination signal Vp based on the average power of the LPC analysis frame is set to a high level "1" indicating sound, and the autocorrelation coefficient RO is set to the first threshold P.
equal to or smaller than thl, and second threshold P th2
If the autocorrelation coefficient RO is smaller than the threshold value Pth2, the detection signal Vp is set to a low level "-1" indicating silence. ” as the sound/non-sound determination unit 17.
Send to.

1 (RO>Pthl) Vp −0(Pthl ≧RO≧Pth2 )   (
3)−1(Pth2 >RO) (但し、pthl > Pth2 ) 適応パワ閾値更新部15は前記LPC分析フレームの平
均パワである第0次の自己相関係数ROを入力するとと
もに、有音・無音判定部17から送出されてくる制御信
号CAPの指示により下記(4)式に従って、後述する
条件により連続するMAP個のLPC分析フレームの平
均レベルに基づき適応パワ閾値PAPを算出、更新し、
この適応パワ閾値PAPを比較部16に送出する。また
適応パワ閾値PAPの可変範囲は、前記閾値P thl
以下かつP th2以上であり、閾値P thlより大
きくなった時は閾値P thlの値に、閾値P th2
より小さくなった時は、閾値P th2の値に保持する
1 (RO>Pthl) Vp -0 (Pthl ≧RO≧Pth2) (
3)-1(Pth2 > RO) (However, pthl > Pth2) The adaptive power threshold updating unit 15 inputs the 0th order autocorrelation coefficient RO which is the average power of the LPC analysis frame, and also inputs the 0th order autocorrelation coefficient RO which is the average power of the LPC analysis frame, and According to the following equation (4) according to the instruction of the control signal CAP sent from the determination unit 17, the adaptive power threshold PAP is calculated and updated based on the average level of consecutive MAP LPC analysis frames according to the conditions described later,
This adaptive power threshold PAP is sent to the comparator 16. Further, the variable range of the adaptive power threshold PAP is the threshold P thl
When the value is less than or equal to P th2 and greater than the threshold P thl, the value is set to the value of the threshold P thl, and the threshold P th2 is set to the value of the threshold P thl.
When it becomes smaller, it is held at the value of threshold P th2.

l    NAP P AP−M APX  −Σ D R0(S)  (
4)NAP    S−1 但し、MAPは定数、NAPは後述するカウンタで計数
する予め設定しである連続するフレームの指定数、D 
R0(S)は連続するMAP個のLPC分析フレームの
平均パワを示す。
l NAP P AP-M APX -Σ D R0(S) (
4) NAP S-1 However, MAP is a constant, NAP is a preset specified number of consecutive frames counted by a counter described later, and D
R0(S) indicates the average power of consecutive MAP LPC analysis frames.

比較部16は、適応パワ閾値PAPとLPC分析フレー
ムの平均パワである第0次の自己相関係数ROとを入力
して両者の比較をなし、下記(5)式に従い、自己相関
係数ROが適応パワ閾値PAPよりも大きい場合は、適
応パワ閾値に基づく判定信号VAPを有音を宗す高レベ
ル「1」とし、また自己相関係数ROが適応パワ閾値P
APよりも等しいか小さい場合は、判定信号VAPを無
音を示す低レベル「0」と、L、て有音・無音判定部1
7に送出する。
The comparison unit 16 inputs the adaptive power threshold PAP and the 0th order autocorrelation coefficient RO, which is the average power of the LPC analysis frame, and compares the two, and calculates the autocorrelation coefficient RO according to the following equation (5). is larger than the adaptive power threshold PAP, the judgment signal VAP based on the adaptive power threshold is set to a high level "1" indicating a sound, and the autocorrelation coefficient RO is set to a high level "1" that indicates a sound.
If it is equal to or smaller than AP, the determination signal VAP is set to a low level "0" indicating silence, and the sound/silence determination unit 1
Send on 7.

VAP −1(RO>PAP)       (5)0
 (RO≦P AP) (但し、P thl ≧PAP≧Pth2)有音・無音
判定部17は、比較部13からのLPC距HDに基づく
判定信号VD、比較部14からのLPCフレームの平均
パワに基づく判定信号■P及び比較部16からの適応パ
ワ閾値PAPに基づく判定信号VAPを入力して、下記
(6)式に従い、判定信号VD 、 VP 、 VAP
の和が0より大きい場合は、有音と判定して有音・無音
判定信号Vを高レベル「1」とし、また判定信号VD、
VP、VAPの和がrOJかrOJより小さい場合は、
無音と判定して有音・無音判定信号Vを低レベルrOJ
としてハングオーバ時間付加部18に送出する。
VAP -1 (RO>PAP) (5) 0
(RO≦P AP) (However, P thl ≧PAP≧Pth2) The voice/silence determination unit 17 uses the determination signal VD based on the LPC distance HD from the comparison unit 13 and the average power of the LPC frame from the comparison unit 14. By inputting the judgment signal ■P based on the judgment signal P and the judgment signal VAP based on the adaptive power threshold PAP from the comparator 16, the judgment signals VD, VP, VAP are calculated according to the following equation (6).
If the sum is greater than 0, it is determined that there is a sound, and the sound/silence determination signal V is set to a high level "1", and the determination signal VD,
If the sum of VP and VAP is rOJ or smaller than rOJ,
It is determined that there is no sound and the sound/no-sound judgment signal V is set to a low level rOJ.
It is sent to the hangover time addition unit 18 as a hangover time adding unit 18.

V−1(VD +VP +VAP>0)  (8)0 
(VD +VP +VAP≦0) 更に、適応パワ閾値更新部15が適応パワ閾値PAPを
算出するための条件を設定するカウンタ17aを有し、
有音・無音判定信号Vによって無音と判定されたLPC
分析フレームが連続して生じる限り、このLPC分析フ
レームの数をカウンタ17aで予め指定したNAP個ず
つ計数し、もし判定信号VD、VPとの和が「0」より
大きいLPC分析フレームが生じたならば、その時点で
カウンタ値NCを「0」に戻す。一方、判定信号VD、
VPの和が「0」か「0」より小さく、判定信号VAP
が高レベル「1」であるフレームが生じれば、カウンタ
値NCを「1」とし、この状態が続く限りNAP個ずつ
計数してカウンタ17aを歩進させる。
V-1(VD +VP +VAP>0) (8)0
(VD +VP +VAP≦0) Furthermore, the adaptive power threshold updating unit 15 has a counter 17a for setting conditions for calculating the adaptive power threshold PAP,
LPC determined to be silent by sound/silence determination signal V
As long as analysis frames occur continuously, the number of LPC analysis frames is counted in units of NAP specified in advance by the counter 17a, and if an LPC analysis frame whose sum of judgment signals VD and VP is larger than "0" occurs, For example, at that point, the counter value NC is returned to "0". On the other hand, the judgment signal VD,
If the sum of VP is "0" or less than "0", the judgment signal VAP
If a frame with a high level "1" occurs, the counter value NC is set to "1", and as long as this state continues, the counter 17a is incremented by counting NAP pieces.

このようにして、カウンタ17aのカウンタ値NCが予
め指定した数値NAPと等しくなった時、即チ、判定信
号VD 、 VP 、 VAP(7)和が「0」か、「
0」より小さいLPC分析フレームが連続してNAP個
生じたか、或いは検出信号VD、VPの和が「0」か、
「0」より小さく、かつ検出信号VAPが有音を示す高
レベル「1」のLPC分析フレームが連続してNAP個
生じた場合、制御信号CAPを適応パワ閾値更新部15
に送出して、カウンタ値NCを「0」に戻す。
In this way, when the counter value NC of the counter 17a becomes equal to the predetermined value NAP, it is immediately determined whether the sum of the judgment signals VD, VP, and VAP (7) is "0" or "
Whether NAP consecutive LPC analysis frames smaller than "0" have occurred, or whether the sum of detection signals VD and VP is "0",
If NAP consecutive LPC analysis frames are smaller than "0" and have a high level "1" in which the detection signal VAP indicates sound, the control signal CAP is changed to the adaptive power threshold updating unit 15.
and returns the counter value NC to "0".

ハングオーバ時間付加部18は、有音・無音判定部17
からの有音・無音の判定信号Vを入力し、判定信号Vが
有音を示す高レベル「1」ならばハングオーバ時間を付
加して最終的な有音・無音の判定信号V outを出力
端子7から出力する。
The hangover time adding section 18 includes the sound/silence determining section 17.
If the judgment signal V is a high level "1" indicating the presence of sound, a hangover time is added and the final judgment signal V out is output from the terminal. Output from 7.

第3図(a) 、(b) 、 (c)は、LPC分析フ
レームの平均パワ、適応パワ閾値P AP、有音・無音
の判定信号Vとカウンタ17aの動作との関係を説明す
るための説明図である。第3図(a)は、入力サンプル
信号AのLPC分析フレームの平均パワの時間変化と、
適応パワ閾値PAPの時間変化を示しており、ここで、
X区間は音声信号区間、Y区間は回線雑音区間、Y′区
間は一時的に平均パワが大きく上昇した回線雑音区間を
示す。第3図(b)は同図(a)に対応する、有音・無
音の判定信号Vの出力結果を示し、同図(c)は、同じ
く同図(a)図に対応する判定信号VD 、 VP 、
 VAPと適応パワ閾値PAPの算出に用いたカウンタ
17aのカウンタ値NCを示している。尚、NAPは6
を指定したものである。
3(a), (b), and (c) are diagrams for explaining the relationship between the average power of the LPC analysis frame, the adaptive power threshold PAP, the voice/silence determination signal V, and the operation of the counter 17a. It is an explanatory diagram. FIG. 3(a) shows the temporal change in the average power of the LPC analysis frame of input sample signal A,
It shows the time change of the adaptive power threshold PAP, where:
The X section is a voice signal section, the Y section is a line noise section, and the Y' section is a line noise section where the average power temporarily increases significantly. FIG. 3(b) shows the output result of the sound/silence determination signal V corresponding to FIG. 3(a), and FIG. 3(c) shows the output result of the determination signal VD corresponding to FIG. 3(a). , VP ,
The counter value NC of the counter 17a used to calculate VAP and adaptive power threshold PAP is shown. In addition, NAP is 6
is specified.

ここで、以上の構成による動作を第4図(a)。Here, the operation of the above configuration is shown in FIG. 4(a).

(b)の流れ図により説明する。This will be explained using the flowchart in (b).

まず、LPC分析部10は入力端子1から入力した入力
サンプル信号Aを所定のフレーム長に区切り(S 1)
 、LPC分析を行いLPC分析フレームの自己相関係
数行列IR及びLPC係数ベクトル1kを算出して(S
2) 、LPC距離算出部11に送出するとともにLP
C分析フレームの平均パワを示す第0次の自己相関係数
ROを比較部14゜16及び適応パワ閾値更新部15に
送出する。LPC距離算出部11は、自己相関係数行列
IR,LPC係数ベクトル1k及び標準ベクトルメモリ
12に格納しである標準LPC係数ベクトルlbとから
LPC距離りを(1)式に従って算出して、その結果を
比較部13に送出する(S3)。比較部13は(2)式
に従い、LPC距離りと閾値Dthとの大小の比較をな
しくS4) 、LPC距HDが閾値Dthよりも大きい
場合は、判定信号VDを高レベル「1」としくS5) 
、LPC距離りが閾値と等しいか、小さい場合は判定信
号VDを低レベル「0」として(S6)有音・無音判定
部 17に送出する。また、比較部14はLPC分析フ
レームの平均パワを示す第0次の自己相関係数ROと第
1の閾値P thlとの大小の比較をなしくS7)、自
己相関係数ROが第1の閾値P thLよりも大きい場
合は、判定信号vPを高レベル「1」としくS8)、自
己相関係数ROが第1の閾値P thlよりも小さい場
合は、第2の閾値P th2との大小の比較をなしくS
9)、自己相関係数ROが第2の閾値Pth2よりも大
きいか等しい場合は、判定信号VPを低レベル「0」と
しくS 10) 、自己相関係数ROが第2の閾値P 
th2よりも小さい場合は判定信号vpを「−1」とし
て(Sll)有音・無音判定部17に送出する。更に、
比較部16は(5)式に従い適応パワ閾値PAP(初期
値はPthl)と自己相関係数ROとの大小の比較をな
しくS 12)、自己相関係数ROが適応パワ閾値PA
Pより大きい場合は、判定信号VAPを高レベル「1」
としくS 13) 、自己相関係数ROが適応パワ閾値
PAPと等しいか小さい場合は、判定信号VAPを低レ
ベル「0」として(S14)有音・無音判定部17に送
出する。
First, the LPC analysis unit 10 divides the input sample signal A input from the input terminal 1 into predetermined frame lengths (S1).
, LPC analysis is performed to calculate the autocorrelation coefficient matrix IR and LPC coefficient vector 1k of the LPC analysis frame (S
2) Sends it to the LPC distance calculation unit 11 and LP
The zero-th order autocorrelation coefficient RO indicating the average power of the C analysis frame is sent to the comparison unit 14 16 and the adaptive power threshold updating unit 15 . The LPC distance calculation unit 11 calculates the LPC distance from the autocorrelation coefficient matrix IR, the LPC coefficient vector 1k, and the standard LPC coefficient vector lb stored in the standard vector memory 12 according to equation (1), and calculates the result. is sent to the comparison unit 13 (S3). The comparator 13 does not compare the LPC distance with the threshold value Dth according to equation (2) (S4), and sets the determination signal VD to a high level "1" if the LPC distance HD is greater than the threshold value Dth. S5)
, LPC distance is equal to or smaller than the threshold value, the determination signal VD is set to a low level "0" (S6) and sent to the sound/silence determination section 17. In addition, the comparison unit 14 does not compare the magnitude of the 0th order autocorrelation coefficient RO indicating the average power of the LPC analysis frame with the first threshold value Pthl (S7), so that the autocorrelation coefficient RO indicates the average power of the LPC analysis frame. If the autocorrelation coefficient RO is smaller than the first threshold P thl, the determination signal vP is set to a high level "1" (S8), and if the autocorrelation coefficient RO is smaller than the first threshold P thl, it is set to the second threshold P th2. No comparison between S
9) If the autocorrelation coefficient RO is greater than or equal to the second threshold Pth2, the determination signal VP is set to a low level "0". 10) The autocorrelation coefficient RO is set to the second threshold Pth2.
If it is smaller than th2, the determination signal vp is set to "-1" (Sll) and sent to the voice/silence determination section 17. Furthermore,
The comparison unit 16 eliminates the magnitude comparison between the adaptive power threshold PAP (initial value is Pthl) and the autocorrelation coefficient RO according to equation (5).
If it is larger than P, the judgment signal VAP is set to high level "1".
If the autocorrelation coefficient RO is equal to or smaller than the adaptive power threshold PAP (S13), the determination signal VAP is set to a low level "0" (S14) and sent to the voice/silence determination section 17.

を音・無音判定部17は、判定信号VD、VP。The sound/silence determining section 17 receives determination signals VD and VP.

VAPを入力しく6)式に従い判定信号VD、VP。Input VAP and generate judgment signals VD and VP according to equation 6).

VAPの和と0との比較をなしくS 15) 、この和
が「0」と等しいか或いは小さい場合は、有音・無音の
判定信号Vを低レベル「0」として(S16)カウンタ
17aのカウンタ値NCに1を加算する(SL?)、一
方、判定信号、VD、VP。
The sum of VAP and 0 are not compared (S15), and if this sum is equal to or smaller than "0", the sound/silence determination signal V is set to a low level "0" (S16) and the counter 17a is 1 is added to the counter value NC (SL?), while the judgment signals VD and VP.

VAPの和が「0」より大きい場合は、判定信号Vを高
レベル「1」としく818) 、判定信号VDとvPと
の和と「0」との比較をなしくS 19)、この和が0
より大きい場合はカウンタ17aのカウンタ値NCを「
0」に戻す(S 20)。判定信号VDとVPとの和が
rOJに等しいか小さい場合、一つ前のLPC分析フレ
ームが有音であったか無音であったかの判別をなしく5
21)、無音であったら、カウンタ値NCを「1」とし
く522)、有音であったならばカウンタ値NGに「1
」を加算する(S 23)。以上の判定を行なった後、
現在のLPC分析フレームの有音・無音の判定信号vの
レベルを次のLPC分析フレームがS21で参照できる
様に記憶する(S24)とともに、連続するNAP個の
LPC分析フレームの各々の平均パワも記憶しくS 2
5) 、カウンタ値NCと指定値NAPとの一致、不一
致を判定する(S26)。
If the sum of VAP is greater than "0", the judgment signal V is set to a high level "1" 818), and the sum of judgment signals VD and vP is not compared with "0" (S 19), and this sum is is 0
If it is larger than that, set the counter value NC of the counter 17a to "
0" (S20). If the sum of the judgment signals VD and VP is equal to or smaller than rOJ, it is not possible to determine whether the previous LPC analysis frame was a sound or a soundless frame.5
21), if there is no sound, set the counter value NC to "1" 522), and if there is sound, set the counter value NG to "1".
” is added (S23). After making the above judgments,
The level of the sound/silence determination signal v of the current LPC analysis frame is stored so that the next LPC analysis frame can refer to it in S21 (S24), and the average power of each of the consecutive NAP LPC analysis frames is also stored. Remember S 2
5) It is determined whether the counter value NC and the designated value NAP match or do not match (S26).

カウンタ値NGと指定値NAPとが一致したならば、制
御信号CAPを高レベル「1」にすることにより、適応
パワ閾値更新部15で(4)式に従い適応パワマ゛り値
PAPが算出される(S27)。一方、カウンタ値NC
が指定値NAPに達していなければ、制御信号CAPを
低レベルrOJとし、有音・無音判定信号Vが、有音を
示す高レベル「1」であれば、ハングオーバ時間付加部
18でハングオーバ時間が付加されて(82g)出力端
子7から最終的な有音・無音判定信号V outが出力
される。以上の動作が81〜528まで順次繰り返され
ることになる。
If the counter value NG and the specified value NAP match, the adaptive power threshold updating unit 15 calculates the adaptive power difference value PAP according to equation (4) by setting the control signal CAP to a high level "1". (S27). On the other hand, counter value NC
has not reached the designated value NAP, the control signal CAP is set to a low level rOJ, and if the sound/no-sound determination signal V is a high level "1" indicating the presence of sound, the hangover time addition unit 18 sets the hangover time to The output terminal 7 outputs the final sound/non-sound determination signal V out (82g). The above operations are repeated sequentially from 81 to 528.

本実施例によれば、音声信号のパワは大きな範囲で変化
するが、回線雑音はある一定のパワ領域であることを利
用して、音声信号のみが存在するパワ領域と、回線雑音
と音声信号が混在する領域と、回線雑音のみが存在する
領域に分割して、音声信号のみが存在する領域での音声
信号の検出は平均パワが所定閾値P thlより大きい
場合に検出し、一方、回線雑音と音声信号とが混在する
領域では、LPC距離りによるスペクトル分布上の違い
による検出と及び適応パワ閾値PAPとにより検出とを
併用する様になしたので、回線雑音による誤動作の影響
を少なくし、かつ適切な音声区間を検出できる。
According to this embodiment, the power of the voice signal varies over a large range, but line noise is within a certain power range. A voice signal is detected in a region where only a voice signal is present when the average power is greater than a predetermined threshold P thl; In areas where audio and audio signals coexist, detection based on differences in spectral distribution due to LPC distance and detection using adaptive power threshold PAP are used together, reducing the influence of malfunctions due to line noise. In addition, it is possible to detect appropriate speech intervals.

(発明の効果) 以上説明したように本発明によれば、回線雑音と音声信
号との識別として、LPC係数と標準ベクトルとのLP
C距離と予め設定した閾値との比較をすることでスペク
トル分布上の違いによるを音・無音の判定ができるとと
もに、連続する無音フレーム数が予め設定された指定数
に達するか、LPC距離に基づく判定と、平均パワに基
づく判定が無音であり、かつ適応パワ閾値に基づく判定
が有音である連続フレームが前記指定数に達した時にこ
の適応パワ閾値を所定範囲で更新するようにしたので、
回線雑音レベルを正しく推定した適応パワ閾値とフレー
ムの平均パワとの比較をすることで有音・無音の判定が
できる。従って、回線雑音による誤動作を最小限にする
ことができ、かつ的確に音声区間の検出ができるので、
ハングオーバ時間を大幅に短縮できる利点がある。
(Effects of the Invention) As explained above, according to the present invention, in order to distinguish between line noise and voice signals, LP coefficients and standard vectors are
By comparing the C distance with a preset threshold, it is possible to determine whether there is sound or silence based on the difference in spectral distribution, and whether the number of consecutive silent frames reaches a preset specified number is determined based on the LPC distance. When the number of consecutive frames in which the determination based on the average power is silent and the determination based on the adaptive power threshold reaches the specified number, the adaptive power threshold is updated within a predetermined range.
Speech/silence can be determined by comparing the adaptive power threshold that correctly estimates the line noise level with the average power of the frame. Therefore, malfunctions caused by line noise can be minimized, and voice sections can be detected accurately.
This has the advantage of greatly reducing hangover time.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明による音声区間検出方式が適用される音
声検出器の一実施例を示すブロック図、第2図は従来の
音声区間検出方式が適用された音声検出器を示すブロッ
ク図、第3図(a) 、 (b) 、(c)は、LPC
フレーム平均パワ、適応パワ閾値、有音・無音の判定信
号とカウンタの動作との関係を説明するための説明図、
第4図(ac 、(b)は、本発明による動作を説明す
るための流れ図である。 図中、1・・・入力端子、7・・・出力端子、10・・
・LPC分析部、11・・・LPC距離算出部、12・
・・標準ベクトルメモリ、13,14.16・・・比較
部、15・・・適応パワ閾値更新部、17・・・有音・
無音判定部、18・・・ハングオーバ時間付加部。
FIG. 1 is a block diagram showing an embodiment of a speech detector to which the speech interval detection method according to the present invention is applied; FIG. 2 is a block diagram showing an embodiment of a speech detector to which the conventional speech interval detection method is applied; Figures 3 (a), (b), and (c) are LPC
An explanatory diagram for explaining the relationship between frame average power, adaptive power threshold, voice/silence determination signal, and counter operation;
FIG. 4(ac, b) is a flowchart for explaining the operation according to the present invention. In the figure, 1...input terminal, 7...output terminal, 10...
・LPC analysis section, 11...LPC distance calculation section, 12.
... Standard vector memory, 13, 14. 16... Comparison unit, 15... Adaptive power threshold update unit, 17... Sound
Silence determination section, 18... Hangover time addition section.

Claims (1)

【特許請求の範囲】 入力サンプル信号の回線雑音と音声信号との識別をなし
、音声信号を検出する音声区間検出方式において、 入力サンプル信号を所定のフレーム長に区切り、各フレ
ームの線形予測(以下、LPCと称す)分析をなし、各
フレームの平均パワとLPC係数を算出する分析手段と
、 前記LPC係数と予め設定した標準ベクトルとのLPC
距離と予め設定した閾値との比較をなし、LPC距離が
該閾値よりも大きいならば有音と判定する第1の判定手
段と、 前記平均パワと予め設定した閾値との比較をなし、平均
パワが該閾値よりも大きいならば有音と判定する第2の
判定手段と、 前記平均パワと所定範囲で更新可能な適応パワ閾値との
比較をなし、平均パワが該適応パワ閾値よりも大きいな
らば有音と判定する第3の判定手段と、 前記第1、第2及び第3の判定手段による判定結果に基
づいて音声信号の有音・無音の判定をなすとともに、有
音及び無音の各フレーム数を計数する第4の判定手段と
、 前記第4の判定手段からの指示により、適応パワ閾値を
算出し、これを更新する更新手段とを備え、 前記更新手段は、連続する無音フレーム数が予め設定し
た指定数に達するか、前記第1及び第2の判定手段によ
る判定が無音であり、かつ前記第3の判定手段により有
音と判定されたフレームが連続しその数が前記指定数に
達した時に適応パワ閾値を更新するようになした ことを特徴とする音声区間検出方式。
[Claims] In a voice section detection method that distinguishes between line noise and voice signals in an input sample signal and detects the voice signal, the input sample signal is divided into predetermined frame lengths, and each frame is linearly predicted (hereinafter referred to as , LPC) for calculating the average power and LPC coefficient of each frame; and LPC of the LPC coefficient and a preset standard vector.
a first determination means that compares the distance with a preset threshold and determines that there is a sound if the LPC distance is greater than the threshold; and a first determination means that compares the average power with a preset threshold and determines the average power. a second determination means that determines that there is a sound if the average power is greater than the threshold, and a second determination means that compares the average power with an adaptive power threshold that can be updated within a predetermined range, and if the average power is greater than the adaptive power threshold; a third determining means for determining whether there is a sound if the audio signal is present; a fourth determining means for counting the number of frames; and an updating means for calculating and updating an adaptive power threshold based on an instruction from the fourth determining means, the updating means configured to count the number of consecutive silent frames. reaches a specified number set in advance, or the number of consecutive frames in which the first and second determining means determine that there is no sound, and the third determining means determines that there is sound reaches the specified number. A speech interval detection method characterized in that an adaptive power threshold is updated when the threshold value is reached.
JP62115990A 1987-05-14 1987-05-14 Voice section detecting system Pending JPS63281200A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62115990A JPS63281200A (en) 1987-05-14 1987-05-14 Voice section detecting system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62115990A JPS63281200A (en) 1987-05-14 1987-05-14 Voice section detecting system

Publications (1)

Publication Number Publication Date
JPS63281200A true JPS63281200A (en) 1988-11-17

Family

ID=14676134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62115990A Pending JPS63281200A (en) 1987-05-14 1987-05-14 Voice section detecting system

Country Status (1)

Country Link
JP (1) JPS63281200A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03144700A (en) * 1989-10-18 1991-06-20 American Teleph & Telegr Co <Att> Intelligence coding of audible signal and sequence demodulation of coded signal
JP2005215204A (en) * 2004-01-28 2005-08-11 Ntt Docomo Inc Device and method for judging voiced or unvoiced
JP2009122710A (en) * 1998-08-21 2009-06-04 Panasonic Corp Parameter extracting device and parameter extracting method
US8442817B2 (en) 2003-12-25 2013-05-14 Ntt Docomo, Inc. Apparatus and method for voice activity detection
JP2013109381A (en) * 2008-12-30 2013-06-06 Huawei Technologies Co Ltd Signal compression method and device
JP2017151455A (en) * 2012-08-31 2017-08-31 テレフオンアクチーボラゲット エルエム エリクソン(パブル) Method and device for voice activity detection

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03144700A (en) * 1989-10-18 1991-06-20 American Teleph & Telegr Co <Att> Intelligence coding of audible signal and sequence demodulation of coded signal
JP2009122710A (en) * 1998-08-21 2009-06-04 Panasonic Corp Parameter extracting device and parameter extracting method
JP4527175B2 (en) * 1998-08-21 2010-08-18 パナソニック株式会社 Spectral parameter smoothing apparatus and spectral parameter smoothing method
US8442817B2 (en) 2003-12-25 2013-05-14 Ntt Docomo, Inc. Apparatus and method for voice activity detection
JP2005215204A (en) * 2004-01-28 2005-08-11 Ntt Docomo Inc Device and method for judging voiced or unvoiced
JP4601970B2 (en) * 2004-01-28 2010-12-22 株式会社エヌ・ティ・ティ・ドコモ Sound / silence determination device and sound / silence determination method
JP2013109381A (en) * 2008-12-30 2013-06-06 Huawei Technologies Co Ltd Signal compression method and device
JP2017151455A (en) * 2012-08-31 2017-08-31 テレフオンアクチーボラゲット エルエム エリクソン(パブル) Method and device for voice activity detection
US10607633B2 (en) 2012-08-31 2020-03-31 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for voice activity detection
US11417354B2 (en) 2012-08-31 2022-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for voice activity detection
US11900962B2 (en) 2012-08-31 2024-02-13 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for voice activity detection

Similar Documents

Publication Publication Date Title
KR940024660A (en) Voice recognition device
JP3297346B2 (en) Voice detection device
JPH06332492A (en) Method and device for voice detection
KR20050039454A (en) Pitch detection method and apparatus
US6865529B2 (en) Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor
JPH04182700A (en) Voice recognizer
WO2001031638A1 (en) Handling variable delay in objective speech quality assessment
JPH10105187A (en) Signal segmentalization method basing cluster constitution
JPS63281200A (en) Voice section detecting system
KR102188620B1 (en) Sinusoidal interpolation across missing data
WO2003107326A1 (en) Speech recognizing method and device thereof
US8306828B2 (en) Method and apparatus for audio signal expansion and compression
US20010029447A1 (en) Method of estimating the pitch of a speech signal using previous estimates, use of the method, and a device adapted therefor
JP2656069B2 (en) Voice detection device
JP3034279B2 (en) Sound detection device and sound detection method
JPS60129796A (en) Sillable boundary detection system
JP2666296B2 (en) Voice recognition device
JPH03114100A (en) Voice section detecting device
JPH03290700A (en) Sound detector
JPS63237100A (en) Voice detector
KR940005047B1 (en) Detector of voice transfer section
JP2001083978A (en) Speech recognition device
JPS59124397A (en) Non-voice section detecting circuit
JPS59149400A (en) Syllable boundary selection system
Alias et al. A novel acoustic fingerprint method for audio signal pattern detection