JPH05113797A - Voice/musical-sound discriminating circuit - Google Patents

Voice/musical-sound discriminating circuit

Info

Publication number
JPH05113797A
JPH05113797A JP3272814A JP27281491A JPH05113797A JP H05113797 A JPH05113797 A JP H05113797A JP 3272814 A JP3272814 A JP 3272814A JP 27281491 A JP27281491 A JP 27281491A JP H05113797 A JPH05113797 A JP H05113797A
Authority
JP
Japan
Prior art keywords
threshold value
signal
voice
autocorrelation coefficient
musical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3272814A
Other languages
Japanese (ja)
Other versions
JP3074046B2 (en
Inventor
Kenji Horiguchi
健治 堀口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP03272814A priority Critical patent/JP3074046B2/en
Publication of JPH05113797A publication Critical patent/JPH05113797A/en
Application granted granted Critical
Publication of JP3074046B2 publication Critical patent/JP3074046B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PURPOSE:To efficiently discriminate with high quality both a voice signal and a musical-sound signal from a digitalized input signal. CONSTITUTION:The self-correlation coefficient R(t) of an input signal is obtained by a self-correlation coefficient calculating means 2. A first threshold value judging integrating means 10 integrates the number of occurrence of the values R(t) greater than a positive threshold value PK1. A second threshold value judging integrating means 20 integrates the number of occurrence of the values of R(t) less than a negative threshold value PK2. An integration frequency judging means 30 judges whether or not the threshold values of the means 10, 20 exceed respective threshold values. A counting discriminating means 40 counts the continuity within a given interval with regard to the result judged by the means 30 and carries out the discrimination between a voice signal and a musical-sound signal.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、人間がしゃべる音声信
号と楽器による楽音信号とを識別する音声・楽音識別回
路に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice / musical tone discrimination circuit for discriminating between a voice signal spoken by a human and a musical tone signal generated by a musical instrument.

【0002】[0002]

【従来の技術】従来、このような分野の技術としては、
例えば次のような文献に記載されるものがあった。文
献;昭和62年電子情報通信学会情報・システム部門全
国大会講演論文集380 細田等「DCME過負荷保護
用データ識別方式の一検討」P.2−111 従来、前記文献に記載されているように、衛星等を利用
した国際通信の分野で、DSI(data discrimination
algorithm )技術とADPCM(adaptive pulse-code
modulation)技術を融合したディジタル回線多重化装置
(以下、DCMEという)が注目されている。このDC
MEにおいて、伝送路チャネルが過負荷状態になったと
き、伝送路の割り当てビット(通常、4ビット)を1ビ
ット削減し、通話の締め出しを解消する手法が用いられ
ているが、ボイスバンドデータ(voicebanddata)からな
るモデム信号を伝送しているチャネルを1ビット削減す
ると、伝送特性が劣化する。そのため、ADPCMの入
力信号がボイスバンドデータかどうかを識別する必要が
ある。そこで、前記文献の技術では、DCME過負荷保
護用データ識別アルゴリズムを用い、入力信号が音声信
号か、ボイスバンドデータであるかを識別するようにし
ている。
2. Description of the Related Art Conventionally, as a technique in such a field,
For example, some documents were described in the following documents. References: 1987 IEICE Information and Systems Division National Convention Proceedings 380 Hosoda et al. "A Study on Data Identification Method for DCME Overload Protection" P. 2-111 Conventionally, as described in the above document, in the field of international communication using satellites, etc., DSI (data discrimination
algorithm) technology and ADPCM (adaptive pulse-code)
A digital line multiplexer (hereinafter referred to as "DCME"), which is a combination of modulation technologies, has been receiving attention. This DC
In the ME, when the transmission channel is overloaded, a method of reducing the allocated bit (usually 4 bits) of the transmission channel by 1 bit and eliminating the lockout of the call is used. If the number of channels for transmitting a modem signal composed of voice band data) is reduced by 1 bit, the transmission characteristics deteriorate. Therefore, it is necessary to identify whether the input signal of ADPCM is voice band data. Therefore, in the technique of the above document, the data identification algorithm for DCME overload protection is used to identify whether the input signal is a voice signal or voice band data.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、従来の
音声信号とモデム信号(voicebanddata)を識別する方法
を用いて、音声と楽音を識別するための音声・楽音識別
回路を構成すると、次のような課題があった。
However, if a voice / musical tone discrimination circuit for discriminating between a voice and a musical tone is constructed by using the conventional method for discriminating between a voice signal and a modem signal (voiceband data), the following is obtained. There were challenges.

【0004】ここで、楽音(musical tone)とは人間が
しゃべる音声信号と分離できる音をいう。音声信号は、
会話を実現するための意志伝達の手段であって、ある程
度の品質を確保できればよい音である。音声は人間の声
道から発生され、主にホルマントによってスペクトル特
性が与えられる。又、楽音は音楽的に豊かな感じを与え
るものをいい、該楽音は振動が周期的であり、かつ高調
波の振動数が正数比を形成している特徴を有する。これ
らの一例として、図2に音声信号の時系列波形図、図3
に楽音信号の時系列波形図をそれぞれ示す。図3の楽音
信号はオーケストラによる波形図である。図2及び図3
の各波形図の下に描かれた波形図は、上の図の部分拡大
図である。
Here, a musical tone means a sound that can be separated from a voice signal spoken by humans. The audio signal is
It is a means of communication for realizing conversation, and it is a sound that can ensure a certain level of quality. Speech is generated from the human vocal tract and is given spectral characteristics mainly by the formants. Further, the musical tone is a musical tone that gives a rich musical feeling, and the musical tone has a characteristic that vibrations are periodic and harmonic frequencies form a positive ratio. As an example of these, FIG. 2 is a time-series waveform diagram of an audio signal, and FIG.
The time-series waveform charts of the musical tone signals are shown in each. The tone signal of FIG. 3 is a waveform diagram by the orchestra. 2 and 3
The waveform charts drawn under the respective waveform charts are the enlarged views of the above figures.

【0005】このような音声信号と楽音信号とを識別す
る場合、両者の信号の性質が違い過ぎるため、音声信号
と楽音信号とを区別し、音声信号は該音声信号に応じた
帯域の品質を確保して明瞭度及び了解度を向上させ、さ
らに楽音信号は該楽音信号に応じた広い帯域で扱うこと
によって品質の高い効率的な音声・楽音識別回路を提供
することが困難であった。
When distinguishing such a voice signal and a tone signal, since the characteristics of the two signals are too different, the voice signal and the tone signal are distinguished from each other, and the voice signal has a band quality corresponding to the voice signal. It has been difficult to provide a high-quality and efficient voice / musical sound discrimination circuit by ensuring the intelligibility and improving the intelligibility and handling the musical sound signal in a wide band corresponding to the musical sound signal.

【0006】本発明は、前記従来技術が持っていた課題
して、音声信号と楽音信号とを区別し、該音声信号の明
瞭度及び了解度を向上させると共に、品質の高い効率的
な楽音信号を識別することが困難な点について解決した
音声・楽音識別回路を提供するものである。
The present invention has the problems that the above-mentioned prior art has, and distinguishes a voice signal from a musical tone signal, improves the intelligibility and the intelligibility of the voice signal, and also provides a high-quality and efficient musical tone signal. The present invention provides a speech / tone identification circuit that solves the problem of difficulty in identifying.

【0007】[0007]

【課題を解決するための手段】本発明は、前記課題を解
決するために、ディジタル化された入力信号から音声信
号と楽音信号とを識別する音声・楽音識別回路におい
て、前記入力信号の自己相関係数を求める自己相関係数
演算手段と、前記自己相関係数が正の閾値より大きい値
の発生する回数を積算する第1の閾値判定積算手段と、
前記自己相関係数が負の閾値より小さい値の発生する回
数を積算する第2の閾値判定積算手段と、前記第1及び
第2の閾値判定積算手段の積算値が閾値を越えているか
否かを判定する積算回数判定手段と、前記積算回数判定
手段の判定結果に対する一定区間の連続性を計数して音
声信号又は楽音信号を識別する計数識別手段とを、備え
ている。
In order to solve the above problems, the present invention provides a voice / tone identification circuit for identifying a voice signal and a tone signal from a digitized input signal. Autocorrelation coefficient calculation means for obtaining the number of relations, and first threshold value judgment integration means for integrating the number of times that the autocorrelation coefficient has a value larger than a positive threshold value,
Whether or not the integrated value of the second threshold value judgment integrating means for integrating the number of times that the autocorrelation coefficient is smaller than the negative threshold value and the integrated value of the first and second threshold value judgment integrating means exceed the threshold value And a counting and identifying means for identifying a voice signal or a musical tone signal by counting the continuity of a certain section with respect to the determination result of the integrating number determining means.

【0008】[0008]

【作用】本発明によれば、以上のように音声・楽音識別
回路を構成したので、ディジタル化された信号が入力さ
れると、自己相関係数演算手段では、自己相関係数を求
めて第1,第2の閾値判定積算手段へ送る。第1の閾値
判定積算手段では、自己相関係数が正の閾値より大きい
か否かを判定し、該正の閾値より大きい値の発生する回
数をカウントする。同様に、第2の閾値判定積算手段
は、自己相関係数が負の閾値よりも小さいか否かを判定
し、その小さい値の発生する回数をカウントする。
According to the present invention, since the voice / tone discrimination circuit is constructed as described above, when the digitized signal is input, the autocorrelation coefficient calculating means obtains the autocorrelation coefficient and the 1, sent to the second threshold judgment integrating means. The first threshold value judgment integrating means judges whether or not the autocorrelation coefficient is larger than a positive threshold value, and counts the number of times a value larger than the positive threshold value is generated. Similarly, the second threshold value judgment integrating means judges whether or not the autocorrelation coefficient is smaller than the negative threshold value, and counts the number of times the small value occurs.

【0009】積算回数判定手段は、第1,第2の閾値判
定積算手段の2つの積算値がそれぞれ閾値を越えている
か否か、あるいはその2つの積算値の和が閾値を越えて
いるか否か等を判定し、その判定結果を計数識別手段へ
送る。計数識別手段は、積算回数判定手段で発生した回
数の連続性をカウントし、音声信号と楽音信号の識別を
行う。従って、前記課題を解決できるのである。
The integrated number determination means determines whether or not the two integrated values of the first and second threshold value determining and integrating means respectively exceed the threshold value, or whether the sum of the two integrated values exceeds the threshold value. Etc. and sends the result of the judgment to the counting and identifying means. The count identifying means counts the continuity of the number of times generated by the integrated number determining means, and distinguishes between the voice signal and the musical tone signal. Therefore, the above problem can be solved.

【0010】[0010]

【実施例】図1は、本発明の第1の実施例を示す音声・
楽音識別回路の機能ブロック図である。この音声・楽音
識別回路は、ディジタル化された入力信号Xiのパワー
を計算して有音か無音かを判定するパワー計算手段1
と、該パワー計算手段1の有音判定に基づき該入力信号
Xiから自己相関係数R(t)を演算する自己相関係数
演算手段2とを備えている。自己相関係数演算手段2の
出力側には、第1及び第2の閾値判定積算手段10,2
0が接続されている。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 shows a voice / audio system according to a first embodiment of the present invention.
It is a functional block diagram of a musical sound identification circuit. This voice / musical sound discrimination circuit calculates the power of the digitized input signal Xi to determine whether there is voice or no voice.
And an autocorrelation coefficient calculating means 2 for calculating an autocorrelation coefficient R (t) from the input signal Xi based on the presence judgment of the power calculating means 1. On the output side of the autocorrelation coefficient computing means 2, first and second threshold value judgment integrating means 10, 2 are provided.
0 is connected.

【0011】第1の閾値判定積算手段10は、自己相関
係数R(t)が正の閾値PK1より大きい値の発生する
回数を積算する機能を有し、自己相関係数R(t)を正
の閾値PK1と比較して該自己相関係数R(t)が大き
いときに出力する閾値判定手段11と、該閾値判定手段
11の出力の回数を積算(カウント)して積算値M1を
出力する判定回数積算手段12とで、構成されている。
同様に、第2の閾値判定積算手段20は、自己相関係数
R(t)が負の閾値PK2より小さい値の発生する回数
を積算する機能を有し、該自己相関係数R(t)を負の
閾値PK2と比較して該自己相関係数R(t)が小さい
ときに出力する閾値判定手段21と、該閾値判定手段2
1の出力の回数を積算して積算値M2を出力する判定回
数積算手段22とで、構成されている。
The first threshold judgment integrating means 10 has a function of integrating the number of times that the autocorrelation coefficient R (t) is larger than the positive threshold value PK1, and the autocorrelation coefficient R (t) is calculated. The threshold value determining means 11 that outputs when the autocorrelation coefficient R (t) is larger than the positive threshold value PK1 and the number of outputs of the threshold value determining means 11 are integrated (counted) and the integrated value M1 is output. And the determination number integration means 12 for performing the determination.
Similarly, the second threshold judgment integrating means 20 has a function of integrating the number of times the autocorrelation coefficient R (t) is smaller than the negative threshold PK2, and the autocorrelation coefficient R (t). Is compared with a negative threshold value PK2 to output when the autocorrelation coefficient R (t) is small, and the threshold value determining means 2
The determination number integration means 22 that integrates the number of times of output of 1 and outputs the integrated value M2.

【0012】第1,第2の閾値判定積算手段10,20
の出力側には積算回数判定手段30が接続され、その出
力側に計数識別手段40が接続されている。積算回数判
定手段30は、積算値M1,M2が閾値K1,K2を越
えているか否かを判定し、M1>K1及びM2<K2の
条件が成り立ったときにその回数の判定結果を出力する
機能を有している。
First and second threshold value judgment integrating means 10, 20
The cumulative number judging means 30 is connected to the output side of, and the count identifying means 40 is connected to the output side thereof. The integrated number determination means 30 determines whether or not the integrated values M1 and M2 exceed the thresholds K1 and K2, and outputs the determination result of the number of times when the conditions of M1> K1 and M2 <K2 are satisfied. have.

【0013】計数識別手段40は、積算回数判定手段3
0で発生した回数の連続性をカウントする機能を有し、
お互いのカウントアップ条件(CNT1,CNT2)が
他のリセットR1,R2に入力するように接続された2
つのカウンター41,42と、積算回数判定手段30の
出力を反転するインバータ43と、カウンタ41のキャ
リヤCR1でリセットされ、カウンタ42のキャリヤC
R2でリセットされて正相出力端子及び逆相出力端子か
ら楽音信号Y1又は音声信号Y2を出力するフリップフ
ロップ(以下、FFという)44とで、構成されてい
る。
The count identifying means 40 is a cumulative number judging means 3
It has a function to count the continuity of the number of occurrences of 0,
Two count-up conditions (CNT1, CNT2) are connected so that they are input to other resets R1, R2.
Two counters 41 and 42, an inverter 43 that inverts the output of the integration number determination means 30, and a carrier CR1 of the counter 41 to reset the carrier C of the counter 42.
The flip-flop (hereinafter referred to as FF) 44 is reset by R2 and outputs the tone signal Y1 or the audio signal Y2 from the positive-phase output terminal and the negative-phase output terminal.

【0014】次に、図4及び図5を参照しつつ、図1の
動作を説明する。図4は図1の動作フローチャートであ
り、S1〜S17は各処理ステップを表わす。又、図5
は図1の自己相関係数R(t)を示す図であり、この図
では出力が最大1に正規化されている。
Next, the operation of FIG. 1 will be described with reference to FIGS. 4 and 5. FIG. 4 is an operation flowchart of FIG. 1, and S1 to S17 represent processing steps. Also, FIG.
2 is a diagram showing the autocorrelation coefficient R (t) of FIG. 1, in which the output is normalized to a maximum of 1. FIG.

【0015】図4において、図1の音声・楽音識別回路
の動作が開始すると、ディジタル化された入力信号Xi
は、ステップS1において図示しないメモリにブロック
単位(フレーム単位)で格納される。メモリに格納され
たブロック単位の入力信号Xiは、パワー計算手段1及
び自己相関係数演算手段2に入力される。パワー計算手
段1では、ステップS2において入力信号Xiのパワー
の計算を行い、ステップS3で、信号パワーが閾値Pt
hより大きいか否かを判定し、信号パワーが閾値Pth
より大きいときには有音と見なし、自己相関係数演算手
段2に計算の指示を出す。それ以外は無音と見なし、こ
のブロック区間では音声信号と楽音信号の識別を行わな
いで動作を終了する。
In FIG. 4, when the operation of the voice / tone discrimination circuit of FIG. 1 starts, the digitized input signal Xi
Are stored in a memory (not shown) in block units (frame units) in step S1. The block-by-block input signal Xi stored in the memory is input to the power calculation means 1 and the autocorrelation coefficient calculation means 2. The power calculation means 1 calculates the power of the input signal Xi in step S2, and the signal power is the threshold Pt in step S3.
It is determined whether the signal power is larger than h, and the signal power is the threshold Pth.
When it is larger, it is considered as voiced and an instruction for calculation is issued to the autocorrelation coefficient calculation means 2. Other than that, it is considered to be silent, and the operation is ended in this block section without distinguishing between the voice signal and the tone signal.

【0016】自己相関係数演算手段2では、ステップS
4において次式の演算式により、自己相関係数R(t)
を算出する。
In the autocorrelation coefficient calculation means 2, step S
4, the autocorrelation coefficient R (t) is calculated by the following equation.
To calculate.

【0017】[0017]

【数1】 [Equation 1]

【0018】算出された自己相関係数R(t)は、図5
に示すような波形となり、第1,第2の閾値判定積算手
段10,20へ送られる。
The calculated autocorrelation coefficient R (t) is shown in FIG.
The waveform is as shown in (1) and is sent to the first and second threshold value judgment integrating means 10, 20.

【0019】図4のステップS5において、判定回数積
算手段12,22の積算値M1,M2を0に初期化す
る。ステップS6を介してステップS7で、閾値判定手
段11によって自己相関係数R(t)が正の閾値PK1
と比較され、該正の閾値PK1よりも自己相関係数R
(t)が大きいときに、判定回数積算手段12へ出力さ
れる。判定回数積算手段12では、ステップS8でカウ
ントアップしていく。一方、閾値判定手段21では、ス
テップS9において自己相関係数R(t)と負の閾値P
K2とを比較し、該自己相関係数R(t)が負の閾値P
K2より小さいときに、判定回数積算手段22へ出力す
る。判定回数積算手段22は、ステップS10でカウン
トアップする。これらの判定回数の積算は、ステップS
6を介してブロック内の信号数Nだけ繰り返される。
In step S5 of FIG. 4, the integrated values M1 and M2 of the determination number integration means 12 and 22 are initialized to zero. In step S7 through step S6, the threshold value determination means 11 sets the threshold value PK1 for which the autocorrelation coefficient R (t) is positive.
Is compared with the positive threshold PK1 and the autocorrelation coefficient R
When (t) is large, it is output to the judgment number integrating means 12. The determination count integration means 12 counts up in step S8. On the other hand, in the threshold value judging means 21, the autocorrelation coefficient R (t) and the negative threshold value P in step S9.
K2 and the autocorrelation coefficient R (t) is a negative threshold P
When it is smaller than K2, it is output to the judgment number integrating means 22. The determination count integration means 22 counts up in step S10. These judgment counts are integrated in step S
Repeated through 6 for the number of signals N in the block.

【0020】判定回数積算手段12,22の積算値M
1,M2は、積算回数判定手段30へ送られる。積算回
数判定手段30では、1ブロック終了時にステップS1
1で、M1>K1及びM2<K2の条件が成立するか否
かを判定し、その判定結果を計数識別手段40内のカウ
ンタ41に与えると共に、インバータ43で反転してカ
ウンタ42へ与える。ステップS11でM1>K1及び
M2<K2の条件が成立したときには、ステップS12
でカウンタ41がカウントアップし、そのリセットR1
によってカウンタ42が0にリセットされる。逆に、ス
テップS11でM1>K1及びM2<K2の条件が成立
しないときには、ステップS13で、カウンタ42がカ
ウントアップし、そのリセットR2によってカウンタ4
1が0にリセットされる。
Integrated value M of the judgment number integrating means 12, 22
1 and M2 are sent to the integrated number determination means 30. In the cumulative number determination means 30, at the end of one block, step S1
At 1, it is determined whether or not the conditions of M1> K1 and M2 <K2 are satisfied, and the determination result is given to the counter 41 in the count identifying means 40 and also inverted by the inverter 43 and given to the counter 42. When the conditions of M1> K1 and M2 <K2 are satisfied in step S11, step S12
Then, the counter 41 counts up and is reset R1
Causes the counter 42 to be reset to zero. Conversely, when the conditions of M1> K1 and M2 <K2 are not satisfied in step S11, the counter 42 counts up in step S13, and the counter 4 is reset by the reset R2.
1 is reset to 0.

【0021】カウンタ41,42は、それぞれ決められ
た回数だけカウントすると、オーバフローとしてキャリ
ヤCR1,CR2を出力する。このカウンタ41,42
では、通常2〜4程度の積算回数判定手段30で発生し
た回数の連続性をカウントする。即ち、カウンタ41
は、積算回数判定手段30での判定が真のときカウント
アップし、カウントオーバーフローでキャリヤCR1を
出力してFF44をセットし、ステップS14において
該FF44の正相出力で楽音信号Y1と判定する。同様
に、カウンタ42は、積算回数判定手段30での判定が
偽のときにカウントアップし、カウントオーバーフロー
でFF44をリセットし、ステップS16,S17にお
いて該FF44の逆相出力で音声信号Y2と判定する。
The counters 41 and 42 output the carriers CR1 and CR2 as overflows when they have counted a predetermined number of times. This counter 41, 42
Then, the continuity of the number of times generated by the integrated number determination means 30 which is usually about 2 to 4 is counted. That is, the counter 41
Counts up when the determination by the integration number determination means 30 is true, outputs the carrier CR1 due to the count overflow, sets the FF 44, and determines the tone signal Y1 by the positive phase output of the FF 44 in step S14. Similarly, the counter 42 counts up when the determination by the number-of-accumulations determination means 30 is false, resets the FF 44 due to a count overflow, and determines in step S16 and S17 that the audio signal Y2 is the reverse phase output of the FF 44. ..

【0022】このようにして1ブロック内の識別処理が
終了すると、次のブロックの識別処理が行われる。以上
のように、本実施例では、自己相関係数R(t)が正の
閾値PK1より大きい値の発生する回数をカウントする
と共に、負の閾値PK2より小さい値の発生する回数を
カウントし、その正と負のカウント値が閾値を越えてい
るか否かを積算回数判定手段30で判定するようにした
ので、楽音信号Y1と音声信号Y2を明確に検出でき
る。しかも、楽音信号Y1と音声信号Y2の識別も、例
えば3〜4ブロック時間と短時間で識別することができ
る。さらに、演算量も少なくてよいため、回路規模を小
さくできる。
When the identification process within one block is completed in this way, the identification process for the next block is performed. As described above, in the present embodiment, the number of times the value of the autocorrelation coefficient R (t) is larger than the positive threshold value PK1 is counted, and the number of times the value is smaller than the negative threshold value PK2 is counted. Since the integration number determination means 30 determines whether or not the positive and negative count values exceed the threshold value, the musical tone signal Y1 and the voice signal Y2 can be clearly detected. Moreover, the tone signal Y1 and the voice signal Y2 can be identified in a short time, for example, 3 to 4 block time. Furthermore, since the amount of calculation is small, the circuit scale can be reduced.

【0023】図6は、本発明の第2の実施例を示す音声
・楽音識別回路の機能ブロック図であり、図1中の要素
と共通の要素には共通の符号が付されている。
FIG. 6 is a functional block diagram of a voice / tone identification circuit showing a second embodiment of the present invention. Elements common to those in FIG. 1 are designated by common reference numerals.

【0024】この音声・楽音識別回路では、図1の積算
回数判定手段30に代えて、構成の異なる積算回数判定
手段30Aを設けている。積算回数判定手段30Aで
は、正と負の2つの判定回数積算手段12,22の積算
値M1,M2の和が閾値Kを越えているか否かを判定
し、M1+M2>Kのときに出力が真となるように機能
し、それによって第1の実施例と同様の作用、効果が得
られる。
In this voice / musical sound discrimination circuit, an integrated number judging means 30A having a different structure is provided in place of the integrated number judging means 30 of FIG. The cumulative number judging means 30A judges whether or not the sum of the cumulative values M1 and M2 of the positive and negative judging frequency cumulative means 12 and 22 exceeds a threshold value K, and when M1 + M2> K, the output is true. So that the same action and effect as those of the first embodiment can be obtained.

【0025】なお、本発明は上記実施例に限定されず、
種々の変形が可能である。その変形例としては、例えば
次のようなものがある。 (a) 図1及び図6の計数識別手段40は、他の回路
構成を用いて構成してもよい。 (b) 図1及び図6の回路は、集積回路等を用いた個
別回路で構成したり、あるいはディジタル・シグナル・
プロセッサ(DSP)等を用いたプログラム制御により
実行してもよい。プログラム制御で実行する場合、個別
回路に比べて回路規模を縮小できる。
The present invention is not limited to the above embodiment,
Various modifications are possible. Examples of such modifications include the following. (A) The count identifying means 40 of FIGS. 1 and 6 may be configured using other circuit configurations. (B) The circuits shown in FIGS. 1 and 6 may be composed of individual circuits using integrated circuits or the like, or may be digital signal
You may perform by program control using a processor (DSP) etc. When executed by program control, the circuit scale can be reduced as compared with an individual circuit.

【0026】[0026]

【発明の効果】以上詳細に説明したように、本発明によ
れば、入力信号の自己相関係数を求め、該自己相関係数
が正の閾値よりも大きい値の発生する回数を積算すると
共に、負の閾値より小さい値の発生する回数を積算し、
それらの積算値が閾値を越えているか否かを判定し、該
判定結果が一定区間連続することにより、音声又は楽音
を識別するようにしている。そのため、音声信号と楽音
信号とを明確に区別し、該音声信号はその音声信号に応
じた帯域の品質を確保することによって明瞭度及び了解
度が向上し、さらに楽音信号はその楽音信号に応じた広
い帯域で扱うことによって品質の高い効率的な識別処理
が可能となる。
As described in detail above, according to the present invention, the autocorrelation coefficient of an input signal is obtained, and the number of times that the autocorrelation coefficient has a value larger than a positive threshold value is integrated and , Accumulate the number of times a value smaller than the negative threshold is generated,
It is determined whether or not the integrated value exceeds a threshold value, and a voice or a musical sound is identified by the determination result being continuous for a certain period. Therefore, by clearly distinguishing the audio signal from the musical sound signal, and by ensuring the quality of the band corresponding to the audio signal, the clarity and intelligibility are improved, and the musical sound signal corresponds to the musical sound signal. By handling a wide band, high-quality and efficient identification processing is possible.

【0027】さらに、識別処理を短時間で行うことがで
きると共に、演算量も少なくてよいため、回路規模の小
型化が可能となる。従って、ディジタル信号で音声信号
及び楽音信号を処理する種々の信号処理装置等に適用で
きる。
Furthermore, since the identification process can be performed in a short time and the amount of calculation can be small, the circuit scale can be reduced. Therefore, the present invention can be applied to various signal processing devices that process voice signals and tone signals with digital signals.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1の実施例を示す音声・楽音識別回
路の機能ブロック図である。
FIG. 1 is a functional block diagram of a voice / tone identification circuit according to a first embodiment of the present invention.

【図2】音声信号の時系列波形図である。FIG. 2 is a time-series waveform diagram of an audio signal.

【図3】楽音信号の時系列波形図である。FIG. 3 is a time-series waveform chart of a musical tone signal.

【図4】図1の動作フローチャートである。FIG. 4 is an operation flowchart of FIG.

【図5】図1の自己相関係数を示す波形図である。5 is a waveform chart showing the autocorrelation coefficient of FIG. 1. FIG.

【図6】本発明の第2の実施例を示す音声・楽音識別回
路の機能ブロックである。
FIG. 6 is a functional block of a voice / tone identification circuit showing a second embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 パワー計算手段 2 自己相関係数演算手段 10,20 第1,第2の閾値判定積算手段 11,21 閾値判定手段 12,22 判定回数積算手段 30,30A 積算回数判定手段 40 計数識別手段 DESCRIPTION OF SYMBOLS 1 Power calculation means 2 Autocorrelation coefficient calculation means 10, 20 1st, 2nd threshold value judgment integration means 11, 21 Threshold value judgment means 12, 22 Determination frequency integration means 30, 30A Integration frequency determination means 40 Count identification means

【手続補正書】[Procedure amendment]

【提出日】平成3年12月26日[Submission date] December 26, 1991

【手続補正1】[Procedure Amendment 1]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0002[Name of item to be corrected] 0002

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0002】[0002]

【従来の技術】従来、このような分野の技術としては、
例えば次のような文献に記載されるものがあった。 文献;昭和62年電子情報通信学会情報・システム部門
全国大会講演論文集380 細田等「DCME過負荷保
護用データ識別方式の一検討」P.2−111 従来、前記文献に記載されているように、衛星等を利用
した国際通信の分野で、DSI(Digital Speech Intep
olation )技術とADPCM(adaptive diffe rential
pulse-code modulation )技術を融合したディジタル回
線多重化装置(以下、DCMEという)が注目されてい
る。このDCMEにおいて、伝送路チャネルが過負荷状
態になったとき、伝送路の割り当てビット(通常、4ビ
ット)を1ビット削減し、通話の締め出しを解消する手
法が用いられているが、ボイスバンドデータ(voiceban
ddata)からなるモデム信号を伝送しているチャネルを1
ビット削減すると、伝送特性が劣化する。そのため、A
DPCMの入力信号がボイスバンドデータかどうかを識
別する必要がある。そこで、前記文献の技術では、DC
ME過負荷保護用データ識別アルゴリズムを用い、入力
信号が音声信号か、ボイスバンドデータであるかを識別
するようにしている。
2. Description of the Related Art Conventionally, as a technique in such a field,
For example, some documents were described in the following documents. References: 1987 IEICE Information and Systems Division National Convention Proceedings 380 Hosoda et al. "A Study on Data Identification Method for DCME Overload Protection" P. 2-111 Conventionally, as described in the above-mentioned document, in the field of international communication using satellites, etc., DSI ( Digital Speech Intep
olation) technology and ADPCM (adaptive diffe rential
A digital line multiplexer (hereinafter, referred to as DCME) that fuses pulse-code modulation) technology is drawing attention. In this DCME, when the transmission path channel is overloaded, a method of reducing the allocated bit (usually 4 bits) of the transmission path by 1 bit and eliminating the lockout of the call is used. (Voiceban
1 for the channel transmitting the modem signal composed of ddata)
If the number of bits is reduced, the transmission characteristics deteriorate. Therefore, A
It is necessary to identify whether the input signal of the DPCM is voice band data. Therefore, in the technique of the above document, DC
The ME overload protection data identification algorithm is used to identify whether the input signal is a voice signal or voice band data.

【手続補正2】[Procedure Amendment 2]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0012[Correction target item name] 0012

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0012】第1,第2の閾値判定積算手段10,20
の出力側には積算回数判定手段30が接続され、その出
力側に計数識別手段40が接続されている。積算回数判
定手段30は、積算値M1,M2が閾値K1,K2を越
えているか否かを判定し、M1>K1かつM2>K2
条件が成り立ったときにその回数の判定結果を出力する
機能を有している。
First and second threshold value judgment integrating means 10, 20
The cumulative number judging means 30 is connected to the output side of, and the count identifying means 40 is connected to the output side thereof. The integrated number determination means 30 determines whether or not the integrated values M1 and M2 exceed the thresholds K1 and K2, and outputs the determination result of the number of times when the conditions of M1> K1 and M2> K2 are satisfied. have.

【手続補正3】[Procedure 3]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0020[Correction target item name] 0020

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0020】判定回数積算手段12,22の積算値M
1,M2は、積算回数判定手段30へ送られる。積算回
数判定手段30では、1ブロック終了時にステップS1
1で、M1>K1かつM2>K2の条件が成立するか否
かを判定し、その判定結果を計数識別手段40内のカウ
ンタ41に与えると共に、インバータ43で反転してカ
ウンタ42へ与える。ステップS11でM1>K1かつ
M2>K2の条件が成立したときには、ステップS12
でカウンタ41がカウントアップし、そのリセットR1
によってカウンタ42が0にリセットされる。逆に、ス
テップS11でM1>K1かつM2>K2の条件が成立
しないときには、ステップS13で、カウンタ42がカ
ウントアップし、そのリセットR2によってカウンタ4
1が0にリセットされる。
Integrated value M of the judgment number integrating means 12, 22
1 and M2 are sent to the integrated number determination means 30. In the cumulative number determination means 30, at the end of one block, step S1
At 1, it is determined whether or not the conditions of M1> K1 and M2> K2 are satisfied, and the determination result is given to the counter 41 in the count identifying means 40 and inverted by the inverter 43 to be given to the counter 42. In step S11, M1> K1 and
When the condition of M2> K2 is satisfied, step S12
Then, the counter 41 counts up and is reset R1
Causes the counter 42 to be reset to zero. Conversely, when the conditions of M1> K1 and M2> K2 are not satisfied in step S11, the counter 42 counts up in step S13, and the counter 4 is reset by the reset R2.
1 is reset to 0.

【手続補正4】[Procedure amendment 4]

【補正対象書類名】図面[Document name to be corrected] Drawing

【補正対象項目名】図1[Name of item to be corrected] Figure 1

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【図1】 [Figure 1]

【手続補正5】[Procedure Amendment 5]

【補正対象書類名】図面[Document name to be corrected] Drawing

【補正対象項目名】図4[Name of item to be corrected] Fig. 4

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【図4】 [Figure 4]

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 ディジタル化された入力信号の自己相関
係数を求める自己相関係数演算手段と、 前記自己相関係数が正の閾値より大きい値の発生する回
数を積算する第1の閾値判定積算手段と、 前記自己相関係数が負の閾値より小さい値の発生する回
数を積算する第2の閾値判定積算手段と、 前記第1及び第2の閾値判定積算手段の積算値が閾値を
越えているか否かを判定する積算回数判定手段と、 前記積算回数判定手段の判定結果に対する一定区間の連
続性を計数して音声信号又は楽音信号を識別する計数識
別手段とを、 備えたことを特徴とする音声・楽音識別回路。
1. An autocorrelation coefficient calculating means for obtaining an autocorrelation coefficient of a digitized input signal, and a first threshold value judgment for integrating the number of times the autocorrelation coefficient has a value larger than a positive threshold value. Accumulating means, second threshold value judging and accumulating means for accumulating the number of times that the autocorrelation coefficient is smaller than a negative threshold value, and integrated values of the first and second threshold value judging and accumulating means exceed a threshold value. And a count identifying unit that identifies the audio signal or the musical tone signal by counting the continuity of a certain section with respect to the determination result of the integrating number determining unit. Voice / musical sound discrimination circuit.
JP03272814A 1991-10-21 1991-10-21 Voice / music sound identification circuit Expired - Fee Related JP3074046B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03272814A JP3074046B2 (en) 1991-10-21 1991-10-21 Voice / music sound identification circuit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03272814A JP3074046B2 (en) 1991-10-21 1991-10-21 Voice / music sound identification circuit

Publications (2)

Publication Number Publication Date
JPH05113797A true JPH05113797A (en) 1993-05-07
JP3074046B2 JP3074046B2 (en) 2000-08-07

Family

ID=17519128

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03272814A Expired - Fee Related JP3074046B2 (en) 1991-10-21 1991-10-21 Voice / music sound identification circuit

Country Status (1)

Country Link
JP (1) JP3074046B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7467088B2 (en) 2003-08-15 2008-12-16 Kabushiki Kaisha Toshiba Closed caption control apparatus and method therefor
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US8195472B2 (en) 2001-04-13 2012-06-05 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US8195472B2 (en) 2001-04-13 2012-06-05 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US8488800B2 (en) 2001-04-13 2013-07-16 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US8842844B2 (en) 2001-04-13 2014-09-23 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US9165562B1 (en) 2001-04-13 2015-10-20 Dolby Laboratories Licensing Corporation Processing audio signals with adaptive time or frequency resolution
US10134409B2 (en) 2001-04-13 2018-11-20 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7467088B2 (en) 2003-08-15 2008-12-16 Kabushiki Kaisha Toshiba Closed caption control apparatus and method therefor
US7925509B2 (en) 2003-08-15 2011-04-12 Kabushiki Kaisha Toshiba Closed caption control apparatus and method therefor

Also Published As

Publication number Publication date
JP3074046B2 (en) 2000-08-07

Similar Documents

Publication Publication Date Title
KR101122838B1 (en) Method and apparatus for separating sound-source signal and method and device for detecting pitch
US4959865A (en) A method for indicating the presence of speech in an audio signal
JP4307557B2 (en) Voice activity detector
Lee et al. A study of on-off characteristics of conversational speech
Petr et al. Priority discarding of speech in integrated packet networks
EP1956589B1 (en) Estimating own-voice activity in a hearing-instrument system from direct-to-reverberant ratio
US20020120440A1 (en) Method and apparatus for improved voice activity detection in a packet voice network
EP1229520A2 (en) Silence insertion descriptor (sid) frame detection with human auditory perception compensation
JP2006189907A (en) Method of detecting voice activity of signal and voice signal coder including device for implementing method
JP2004272052A (en) Voice section detecting device
JPH08265457A (en) Signal discrimination circuit
US8150703B2 (en) Method and apparatus for reducing access delay in discontinuous transmission packet telephony systems
EP0239809A2 (en) Audio frequency signal identification apparatus
US7970121B2 (en) Tone, modulated tone, and saturated tone detection in a voice activity detection device
WO2005119649A1 (en) System and method for babble noise detection
JPH07319498A (en) Pitch cycle extracting device for voice signal
JPH05113797A (en) Voice/musical-sound discriminating circuit
JP2000353000A (en) Device and method for processing sound signal phase information
JPH05183523A (en) Voice/music sound identification circuit
US6850616B2 (en) Frequency error detection methods and systems using the same
JP2010026323A (en) Speech speed detection device
JP3298188B2 (en) Voice detection method
JP3195700B2 (en) Voice analyzer
JPH05183522A (en) Voice/music sound identification circuit
JPH08202394A (en) Voice detector

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000523

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090602

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees