JPH07240782A - Handset - Google Patents

Handset

Info

Publication number
JPH07240782A
JPH07240782A JP3001894A JP3001894A JPH07240782A JP H07240782 A JPH07240782 A JP H07240782A JP 3001894 A JP3001894 A JP 3001894A JP 3001894 A JP3001894 A JP 3001894A JP H07240782 A JPH07240782 A JP H07240782A
Authority
JP
Japan
Prior art keywords
level
voice
noise
background noise
noise level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3001894A
Other languages
Japanese (ja)
Inventor
Keiichi Katayanagi
恵一 片柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP3001894A priority Critical patent/JPH07240782A/en
Publication of JPH07240782A publication Critical patent/JPH07240782A/en
Withdrawn legal-status Critical Current

Links

Abstract

PURPOSE:To increase the clearness of a receiving voice by suppressing a sidetone from a transmission side to a reception side at a place where a high ambient background noise exists. CONSTITUTION:A transmission audio signal obtained from a microphone 1 for transmission via an A/D converter 2 is sent to an adder 14 on the reception side as the sidetone via a variable gain amplifier 7, and it is added on a receiving voice. A background noise level in the transmission audio signal is detected by a background noise level detector 6. A sidetone level can be controlled by controlling the gain of the variable gain amplifier 7 corresponding to a detected background noise level.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、音声を送受信するため
の送受話装置に関し、特に、送話音声入力の一部を受話
側に送るような送受話装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a transmitting / receiving device for transmitting / receiving voice, and more particularly to a transmitting / receiving device for transmitting a part of transmitted voice input to a receiving side.

【0002】[0002]

【従来の技術】一般に電話機においては、送話器側の音
声信号を所定のレベルで受話器側に戻し、通常の自由空
間で音声を発する場合と同様に、耳に音声を戻して聞か
せることで、適正な音量で発話できるようにしている。
このように発声者の発した音声の内の当人の耳に戻る分
を側音と呼んでいる。
2. Description of the Related Art Generally, in a telephone, it is possible to return the voice signal from the transmitter side to the handset side at a predetermined level and return the voice to the ear, as in the case where the voice is emitted in a normal free space. , So that they can speak at an appropriate volume.
The part of the voice uttered by the speaker that returns to the person's ear is called a sidetone.

【0003】すなわち、一般に送話者は、耳に戻る側音
のレベルが低いと発声レベルを高めるように、逆に側音
レベルが高いと発声レベルを低めるように発声してお
り、耳で確認しながら発声レベルを調整している。
That is, in general, the speaker speaks so as to raise the vocalization level when the sidetone returning to the ear is low, and conversely lowers the vocalization level when the sidetone level is high, which is confirmed by the ear. While adjusting the vocalization level.

【0004】[0004]

【発明が解決しようとする課題】ところで、通常の電話
機におけるこの側音のレベルは、ある一定の固定レベル
となっているため、周囲雑音が大きい場合には、送話器
のマイクから混入した雑音が側音として受話器側に戻
り、受話音声の聞き取りの明瞭度が低下するという欠点
がある。
By the way, since the level of this sidetone in an ordinary telephone is a certain fixed level, when ambient noise is large, noise mixed from the microphone of the transmitter is generated. Is returned to the receiver side as sidetone, and the intelligibility of the received voice is deteriorated.

【0005】特に、携帯用電話機の場合には、屋外で使
用することが多いため、周囲雑音の大きい環境下で使用
することも少なくない。こちらから発信する場合には雑
音の少ない場所を選べても、相手からの着信は場所を選
ばないため、騒音の大きい場所でも応答せざるを得ない
ことも多い。
In particular, a portable telephone is often used outdoors, so that it is often used in an environment with large ambient noise. When making a call from here, even if you can select a place with less noise, the call from the other party does not choose a place, so there is often no choice but to answer even in a noisy place.

【0006】本発明は、このような実情に鑑みてなされ
たものであり、周囲の背景雑音が大きい場所では側音を
抑えて、受話音声の明瞭度を向上できるような送受話装
置の提供を目的とする。
The present invention has been made in view of the above circumstances, and provides a transmitter / receiver device capable of suppressing sidetones in a place where surrounding background noise is large and improving the clarity of the received voice. To aim.

【0007】また、本発明の他の目的は、少ない演算量
ながら高精度、高信頼度で背景雑音を検出し、側音レベ
ル調整が行えるような送受話装置を提供することであ
る。
Another object of the present invention is to provide a transmitter / receiver device capable of detecting background noise with high accuracy and high reliability and adjusting sidetone level with a small amount of calculation.

【0008】[0008]

【課題を解決するための手段】本発明に係る音声信号送
受信装置は、上記課題を解決するために、送話音声を電
気信号の送話音声信号に変換し信号処理して送信し、受
信された信号を信号処理して受話音声信号とした後に受
話音声に変換する送受話装置において、上記送話音声信
号が入力される可変利得増幅手段と、この可変利得増幅
手段からの出力を上記受話音声信号に側音として加算す
る加算手段と、送話側の背景雑音レベルを検出する背景
雑音レベル検出手段とを有し、この背景雑音レベル検出
手段からの検出出力に応じて上記可変利得増幅手段の利
得を制御している。
In order to solve the above-mentioned problems, a voice signal transmitting / receiving apparatus according to the present invention converts a transmission voice into a transmission voice signal of an electric signal, performs signal processing, transmits, and receives. In a transmitter / receiver for converting the received signal into a received voice signal and then converting the received signal into a received voice signal, a variable gain amplifying means to which the transmitted voice signal is inputted, and an output from the variable gain amplifying means are received voice signals. And a background noise level detecting means for detecting the background noise level on the transmitting side. The variable gain amplifying means has a background noise level detecting means for detecting the background noise level on the transmitting side. It controls the gain.

【0009】また、上記送話音声信号を圧縮符号化する
音声符号化手段を設け、上記背景雑音レベル検出手段
は、上記音声符号化手段の符号化処理の際に求められる
パラメータを用いて背景雑音レベル検出を行うようにす
ることが挙げられる。また、上記背景雑音レベル検出手
段は、雑音レベルを少なくとも1つの閾値を用いて複数
のレベル範囲に区分し、これらの複数のレベル範囲に応
じて上記可変利得増幅手段の利得を段階的に切換制御す
ることが挙げられる。
Further, a voice encoding means for compressing and encoding the transmitted voice signal is provided, and the background noise level detecting means uses the parameters obtained during the encoding processing of the voice encoding means for the background noise. One example is to perform level detection. Further, the background noise level detecting means divides the noise level into a plurality of level ranges using at least one threshold value, and controls the gain of the variable gain amplifying means stepwise according to the plurality of level ranges. There are things to do.

【0010】この場合、上記検出された背景雑音レベル
が大きいときには上記可変利得増幅手段の利得を下げて
側音レベルを下げ、背景雑音レベルが小さいときには上
記可変利得増幅手段の利得を上げて側音レベルを上げる
ように制御する。
In this case, when the detected background noise level is high, the gain of the variable gain amplifying means is lowered to lower the sidetone level, and when the background noise level is low, the gain of the variable gain amplifying means is raised to increase the sidetone. Control to raise the level.

【0011】さらに、上記背景雑音レベル検出手段を、
上記音声符号化手段で得られる分析パラメータを用いて
雑音区間を検出する雑音区間検出手段と、上記雑音区間
検出手段で検出された雑音区間の雑音レベルを検出する
雑音レベル検出手段とで構成し、上記雑音レベル検出手
段で検出された雑音レベルに応じて、上記可変利得増幅
手段の利得を制御することが挙げられる。
Further, the background noise level detecting means is
A noise section detecting means for detecting a noise section using the analysis parameter obtained by the speech encoding means, and a noise level detecting means for detecting a noise level of the noise section detected by the noise section detecting means, The gain of the variable gain amplifying means may be controlled according to the noise level detected by the noise level detecting means.

【0012】この場合、上記雑音区間検出手段として
は、入力音声信号の1フレームにつき上記分析パラメー
タとして1次の線形予測符号化係数を用い、該1次の線
形予測符号化係数が所定のしきい値よりも小さいときに
は該1フレームを雑音区間とするものを用いることが挙
げられる。
In this case, the noise interval detecting means uses a linear predictive coding coefficient of the first order as the analysis parameter for one frame of the input speech signal, and the linear predictive coding coefficient of the primary order is a predetermined threshold. When it is smaller than the value, it is possible to use one in which the one frame is a noise section.

【0013】また、上記雑音区間検出手段としては、入
力音声信号の1フレームにつき分析パラメータとしてピ
ッチ成分の強弱を示すピッチゲインを用い、該ピッチゲ
インが所定の範囲内にあるときに該1フレームを雑音区
間とするものや、上記分析パラメータとしてピッチ周波
数を用い、入力音声信号の1フレームの該ピッチ周波数
成分が0であるときに該1フレームを雑音区間とするも
のや、上記分析パラメータとしてフレームパワーを用
い、入力音声信号の1フレームの該フレームパワーが所
定のしきい値よりも小さいときに該1フレームを雑音区
間とするものを用いるようにしてもよい。また、上記雑
音区間検出手段は、現在のフレームと過去のフレームで
のフレームパワーの変化量が所定のしきい値を越えたと
きには、現在のフレームを雑音区間としていても、該現
在のフレームを音声区間とするようなものを用いてもよ
く、また、複数連続フレームの上記分析パラメータの値
を考慮して、雑音区間の検出を行うようなものを用いて
もよい。
As the noise section detecting means, a pitch gain indicating the strength of the pitch component is used as an analysis parameter for one frame of the input speech signal, and when the pitch gain is within a predetermined range, the one frame is detected. A noise interval, a pitch frequency is used as the analysis parameter, and when the pitch frequency component of one frame of the input speech signal is 0, the one frame is used as the noise interval, and the frame power is used as the analysis parameter. It is also possible to use the one that uses the one frame as a noise section when the frame power of the one frame of the input audio signal is smaller than a predetermined threshold value. Further, the noise section detecting means, when the amount of change in frame power between the current frame and the past frame exceeds a predetermined threshold value, outputs the current frame as a voice even if the current frame is the noise section. A section may be used, or a section for detecting a noise section may be used in consideration of the values of the analysis parameters of a plurality of consecutive frames.

【0014】さらに、上記検出された雑音レベルに応じ
て、受話側での受話音量を制御するようにして、背景雑
音レベル検出手段を側音レベル制御と受話音量制御の双
方に兼用させることが挙げられる。
Furthermore, the background noise level detecting means may be used for both the sidetone level control and the reception volume control by controlling the reception volume on the reception side according to the detected noise level. To be

【0015】[0015]

【作用】背景雑音レベルに応じて可変利得増幅手段の利
得を制御することにより、側音レベルを制御しているた
め、周囲雑音が大きい場所での側音を抑えて受話側に混
入する雑音を抑えることができる。
Since the sidetone level is controlled by controlling the gain of the variable gain amplifying means according to the background noise level, the sidetone in a place where the ambient noise is large is suppressed and the noise mixed into the receiving side is suppressed. Can be suppressed.

【0016】ここで、送受話装置が音声符号化手段を備
えている場合に、この音声符号化の際に計算されるパラ
メータを用いて背景雑音レベル検出を行うことにより、
計算を省略でき、少ない演算量でも高精度、高信頼度の
雑音レベル検出が行える。
Here, in the case where the transmitter / receiver device is provided with the voice encoding means, the background noise level is detected by using the parameters calculated in the voice encoding,
The calculation can be omitted, and the noise level can be detected with high accuracy and high reliability even with a small amount of calculation.

【0017】[0017]

【実施例】以下、本発明に係る送受話装置の好ましい実
施例について、図面を参照しながら説明する。図1は、
本発明に係る送受話装置の基本的な実施例の概略構成を
示すブロック回路図である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENT A preferred embodiment of a transmitter / receiver device according to the present invention will be described below with reference to the drawings. Figure 1
It is a block circuit diagram which shows the schematic structure of the basic Example of the transmitting / receiving apparatus which concerns on this invention.

【0018】この図1において、送話用マイクロフォン
1で電気信号とされた入力音声信号は、アナログ/ディ
ジタル(A/D)変換器2によりディジタル信号とされ
て、音声データ圧縮用のエンコーダ、すなわち音声符号
化器3に供給される。この音声符号化器3で情報圧縮、
符号化が施された音声データは、送信処理回路4に送ら
れて送信のための信号処理が施された後、出力端子5よ
り取り出されて、電話回線あるいはアンテナ等を介して
送出される。
In FIG. 1, an input voice signal converted into an electric signal by a microphone 1 for transmission is converted into a digital signal by an analog / digital (A / D) converter 2, and an encoder for compressing voice data, that is, It is supplied to the voice encoder 3. This voice encoder 3 compresses information,
The encoded voice data is sent to the transmission processing circuit 4, subjected to signal processing for transmission, taken out from the output terminal 5, and sent out via a telephone line or an antenna.

【0019】背景雑音レベル検出器6においては、例え
ば音声符号化器3における符号化処理の際に計算された
各パラメータを用いて、背景雑音レベルを検出し、この
検出レベルに応じて可変利得アンプ7を制御し、側音と
して受話側に加える送話音声の利得を可変制御する。こ
の可変利得アンプ7は、A/D変換器2からの出力をデ
ィジタル的に可変利得制御して、受話側の加算器14に
送っている。なお、背景雑音レベル検出器6は、A/D
変換器2からのあるいはA/D変換前の音声信号に基づ
いて、背景雑音レベルを検出するものを用いてもよい。
また、可変利得アンプ7は、ゲインが1以下の可変減衰
器であってもよい。
In the background noise level detector 6, for example, the background noise level is detected by using each parameter calculated at the time of the encoding processing in the speech encoder 3, and the variable gain amplifier is detected according to the detected level. 7 is controlled to variably control the gain of the transmitted voice added to the receiving side as a side tone. The variable gain amplifier 7 digitally controls the variable gain of the output from the A / D converter 2 and sends it to the adder 14 on the receiving side. The background noise level detector 6 is an A / D
A device that detects the background noise level based on the audio signal from the converter 2 or before the A / D conversion may be used.
The variable gain amplifier 7 may be a variable attenuator having a gain of 1 or less.

【0020】受話側の構成としては、伝送路あるいはア
ンテナを介して受信された信号が入力端子11を介して
受信処理回路12に供給され、受信処理が施されて、音
声復号化器13に送られる。この音声復号化器13にて
送話側の音声符号化器3における符号化処理の逆の処理
が施された後、加算器14に送られて、可変利得アンプ
14からの上記側音とディジタル的に加算される。加算
器14からの出力は、ディジタル/アナログ(D/A)
変換器15に送られてアナログ信号に変換され、アンプ
16を介してスピーカ17に送られている。
The receiving side has a structure in which a signal received via a transmission line or an antenna is supplied to a reception processing circuit 12 via an input terminal 11, subjected to a reception process, and sent to a speech decoder 13. To be The voice decoder 13 performs the reverse process of the encoding process in the voice encoder 3 on the transmitting side, and then sends it to the adder 14 to output the side tone and the digital signal from the variable gain amplifier 14. Will be added. The output from the adder 14 is a digital / analog (D / A)
It is sent to the converter 15, converted into an analog signal, and sent to the speaker 17 via the amplifier 16.

【0021】なお、送話側のA/D変換前のアナログ音
声信号をアナログの可変利得アンプを介して送話側に送
る場合には、送話側のD/A変換後のアナログ音声信号
に対してアナログ的に加算を行うようにすればよい。
When the analog voice signal before A / D conversion on the transmitting side is sent to the transmitting side via the analog variable gain amplifier, the analog voice signal after D / A conversion on the transmitting side is converted to the analog voice signal. On the other hand, it suffices to perform addition in an analog manner.

【0022】このような構成において、背景雑音レベル
検出器6は、マイクロフォン1により収音された信号の
内の雑音区間での信号レベルを検出し、この検出された
背景雑音レベルが大きいときには可変利得アンプ7のゲ
インを下げて側音のレベルを下げる。逆に、背景雑音レ
ベルが小さいときには、可変利得アンプ7のゲインを上
げて側音のレベルを上げる。すなわち、背景雑音の大き
いうるさい場所では、側音経路を通して受話側に混入す
る雑音を抑えて、明瞭度を上げる。また、一般に送話者
は、耳に戻る側音のレベルが低いと発声レベルを高める
ように、逆に側音レベルが高いと発声レベルを低めるよ
うに発声することから、うるさい場所で側音レベルを下
げることにより送話者の発声レベルが上がり、逆に静か
な場所で側音レベルを上げることにより送話者の発声レ
ベルが相対的に下がる。これにより、音声と周囲雑音と
のSN比が良好にとれるようになる。
In such a structure, the background noise level detector 6 detects the signal level in the noise section of the signal picked up by the microphone 1, and when the detected background noise level is large, the variable gain is detected. The gain of the amplifier 7 is lowered to lower the sidetone level. On the contrary, when the background noise level is low, the gain of the variable gain amplifier 7 is increased to increase the sidetone level. That is, in a noisy place where the background noise is large, the noise mixed into the receiving side through the sidetone path is suppressed and the intelligibility is increased. Also, in general, the speaker speaks to raise the vocalization level when the sidetone returning to the ear is low, and conversely lowers the vocalization level when the sidetone level is high. Lowering raises the speaking level of the speaker, and conversely raising the sidetone level in a quiet place lowers the speaking level of the speaker relatively. As a result, a good SN ratio between the voice and the ambient noise can be obtained.

【0023】このような側音レベルの制御は、アナログ
的にあるいは無段階的に行わせてもよいが、いくつかの
ゲインを予め設定しておき、上記検出した背景雑音レベ
ルをいくつかの閾値で弁別して段階的に側音レベルを切
り換えるようにしてもよい。例えば、2種類の背景雑音
レベルの閾値th1 、th2 を定めておき、背景雑音レベル
検出器6で検出した背景雑音レベルAが各閾値th1 、th
2 より大きいか小さいかによって、側音レベルすなわち
アンプ7のゲインを3種類の大きさG1 、G2、G3
切換制御する。具体的には、上記各閾値の大小関係をth
1 >th2 とし、各ゲインの大小関係をG1 <G2 <G3
とするとき、 A>th1 のとき、ゲインG1 (側音レベル小) th1 ≧A≧th2 のとき、ゲインG2 (側音レベル中) th2 >A のとき、ゲインG3 (側音レベル大) のように切換制御すればよい。
Such side tone level control may be performed in an analog or stepless manner, but some gains are preset and the detected background noise level is set to some threshold value. Alternatively, the sidetone level may be switched stepwise by discriminating. For example, two types of background noise level thresholds th1 and th2 are defined, and the background noise level A detected by the background noise level detector 6 is set to the respective thresholds th1 and th2.
Depending on whether it is larger or smaller than 2, the side tone level, that is, the gain of the amplifier 7 is controlled to be switched to three kinds of sizes G 1 , G 2 and G 3 . Specifically, the magnitude relationship between the above thresholds is
1> th2, and the magnitude relationship of each gain is G 1 <G 2 <G 3
, When A> th1, gain G 1 (sidetone level is small) th1 ≧ A ≧ th2, gain G 2 (sidetone level) When th2> A, gain G 3 (sidetone level is large) ), The switching control may be performed.

【0024】ところで、上記背景雑音レベル検出器6に
おける信号レベル検出は、マイクロフォンで収音された
信号の内の音声を発している区間以外の雑音区間にて行
うことが必要とされ、この雑音区間と音声区間とを正確
に区別することが必要とされる。この雑音区間と音声区
間とを区別する方法としては、例えば、信号に含まれて
いる基本周期やピッチ等を検出したり、信号波形のゼロ
クロスの頻度を見たり、周波数成分の分布を見たりする
こと等やこれらを併用することが知られている。これら
の手法は、簡便である反面、精度が低い。また、精度を
向上するためのアルゴリズムも提案されており、例え
ば、長時間の平均的な線形予測符号化(LPC)係数を
用いて、入力信号に逆フィルタリングを施し、その残差
レベルをモニタする方法等が知られているが、演算量が
多くなる。
By the way, the signal level detection in the background noise level detector 6 is required to be performed in a noise section other than the section in which the voice is picked up in the signal picked up by the microphone. It is necessary to accurately distinguish between the voice section and the voice section. As a method of distinguishing between the noise section and the voice section, for example, the fundamental period or pitch included in the signal is detected, the frequency of zero cross of the signal waveform is checked, or the distribution of frequency components is checked. It is known to use these things together and these. Although these methods are simple, they have low accuracy. An algorithm for improving accuracy has also been proposed. For example, a long-term average linear predictive coding (LPC) coefficient is used to perform inverse filtering on an input signal and monitor its residual level. Methods are known, but the amount of calculation is large.

【0025】ここで、図1に示すように、背景雑音レベ
ル検出器6での雑音区間検出やレベル検出の際に、音声
符号化器3における符号化処理の際に計算された各パラ
メータを流用するようにすれば、背景雑音レベル検出の
ためだけの計算を大幅に省略でき、少ない演算量ながら
高精度、高信頼度を実現できる。音声符号化器3は、デ
ィジタル信号処理により音声信号を高能率で圧縮するも
のであり、具体的には例えば、ベクトル和励起リニア予
測(VSELP:Vector Sum Excited LinearPredictio
n)等のコード励起リニア予測(CELP:Code Exited
Linear Prediction )エンコーダを用いることがで
き、このエンコード処理の際と分析パラメータを、上記
背景雑音レベル検出処理、特に雑音区間検出処理に用い
ることができる。
Here, as shown in FIG. 1, when the background noise level detector 6 detects a noise section or a level, the parameters calculated in the encoding process in the speech encoder 3 are used. By doing so, the calculation only for detecting the background noise level can be largely omitted, and high accuracy and high reliability can be realized with a small amount of calculation. The speech coder 3 compresses a speech signal with high efficiency by digital signal processing, and specifically, for example, vector sum excitation linear prediction (VSELP).
n) etc. code excitation linear prediction (CELP: Code Exited)
A Linear Prediction) encoder can be used, and the encoding parameter and the analysis parameter can be used for the background noise level detection processing, particularly the noise section detection processing.

【0026】このVSELPについては、例えば、モト
ローラ・インコーポレーテッドによる特表平2−502
135号公報に「改良されたベクトル励起源を有するデ
ィジタル音声コーダ」の技術として開示されており、ま
た、「ベクトル和励起リニア予測」(VECTOR SUM EXCIT
ED LINEAR PREDICITION (VSELP):SPEECH CODING AT8 K
BPS :Ira A. Gerson and Jasiuk: Paper presented at
the Int. Conf. onAcoustics, Speech and Signal Pro
cessing -April 1990 )の文献にも記載されている。
This VSELP is disclosed in, for example, Tokuhyo 2-502 by Motorola Incorporated.
It is disclosed in Japanese Patent Publication No. 135 as a technique of "a digital speech coder having an improved vector excitation source", and also "vector sum excitation linear prediction" (VECTOR SUM EXCIT
ED LINEAR PREDICITION (VSELP): SPEECH CODING AT8 K
BPS: Ira A. Gerson and Jasiuk: Paper presented at
the Int. Conf. on Acoustics, Speech and Signal Pro
cessing-April 1990).

【0027】上記VSELPを用いて音声を高能率で圧
縮するディジタル信号処理による音声符号化装置として
のVSELPエンコーダは、入力された音声信号から音
声のフレームパワー、反射係数及び線形予測係数、ピッ
チ周波数、コードブック、ピッチ及びコードブックのゲ
イン等のパラメータを分析し、この分析パラメータを用
いて、音声を符号化している。このような音声を高能率
で圧縮するディジタル信号処理による音声符号化装置で
ある上記VSELPエンコーダは、携帯用電話装置に多
く適用されている。
A VSELP encoder as a voice encoding device by digital signal processing for compressing voice with high efficiency by using the above VSELP, a frame power, a reflection coefficient and a linear prediction coefficient, a pitch frequency of a voice from an input voice signal, Parameters such as the codebook, pitch, and gain of the codebook are analyzed, and the speech is encoded using the analyzed parameters. The VSELP encoder, which is a voice encoding device by digital signal processing for compressing such voice with high efficiency, is often applied to portable telephone devices.

【0028】このようなVSELPエンコーダの分析パ
ラメータを用いた背景雑音レベル検出器6での雑音区間
検出においては、入力音声信号の1フレームにつき上記
分析パラメータとして1次の線形予測符号化係数を用
い、該1次の線形予測符号化係数が所定のしきい値より
も小さいときに該1フレームを雑音区間とするような処
理を行えばよい。
In the noise section detection in the background noise level detector 6 using the analysis parameter of the VSELP encoder, a linear predictive coding coefficient of the first order is used as the analysis parameter for one frame of the input speech signal. When the primary linear predictive coding coefficient is smaller than a predetermined threshold value, the processing may be performed such that the one frame is a noise section.

【0029】また、入力音声信号の1フレームにつき上
記分析パラメータとしてピッチ成分の強弱を示すピッチ
ゲインを用い、該ピッチゲインが所定の範囲内にあると
きに該1フレームを雑音区間としてもよい。また、上記
分析パラメータとしてピッチ周波数を用い、入力音声信
号の1フレームの該ピッチ周波数成分が0であるときに
該1フレームを雑音区間としてもよい。また、上記分析
パラメータとしてフレームパワーを用い、入力音声信号
の1フレームの該フレームパワーが所定の閾値よりも小
さいときに該1フレームを雑音区間としてもよい。さら
に、現在のフレームと過去のフレームでのフレームパワ
ーの変化量が所定のしきい値を越えたときには、現在の
フレームを雑音区間としていても、該現在のフレームを
音声区間とするようにしてもよい。
It is also possible to use a pitch gain indicating the strength of the pitch component as the above-mentioned analysis parameter for one frame of the input voice signal, and to set the one frame as a noise section when the pitch gain is within a predetermined range. Further, the pitch frequency may be used as the analysis parameter, and when the pitch frequency component of one frame of the input speech signal is 0, the one frame may be used as the noise section. Further, frame power may be used as the analysis parameter, and when the frame power of one frame of the input audio signal is smaller than a predetermined threshold, the one frame may be used as a noise section. Furthermore, when the amount of change in frame power between the current frame and the past frame exceeds a predetermined threshold, even if the current frame is the noise section, the current frame may be the speech section. Good.

【0030】次に、本件出願人が先に特願平5−182
138号の明細書及び図面において開示したような音声
信号送受信装置に本発明を適用することもでき、この場
合の一例を図2に示している。
Next, the applicant of the present invention first filed Japanese Patent Application No. 5-182.
The present invention can also be applied to an audio signal transmitting / receiving apparatus as disclosed in the specification and drawings of No. 138, and an example of this case is shown in FIG.

【0031】すなわち、この図2に示す実施例において
は、上述したようなVSELPエンコーダ23と、この
VSELPエンコーダ23で得られる分析パラメータを
用いて背景雑音区間を検出する雑音区間検出回路24
と、この雑音区間検出回路24で検出された雑音区間の
信号レベルを検出する雑音レベル検出回路25と、この
雑音レベル検出回路25で検出された雑音レベルに応じ
て上記側音レベル及び受話音量を制御するマイクロコン
ピュータ26とを有して構成されている。この図2の雑
音区間検出回路24と雑音レベル検出回路25とが、上
記図1の背景雑音レベル検出器6に相当する。
That is, in the embodiment shown in FIG. 2, the VSELP encoder 23 as described above and the noise section detection circuit 24 for detecting the background noise section by using the analysis parameter obtained by the VSELP encoder 23.
And a noise level detection circuit 25 for detecting the signal level of the noise section detected by the noise section detection circuit 24, and the sidetone level and the reception volume according to the noise level detected by the noise level detection circuit 25. And a microcomputer 26 for controlling. The noise section detection circuit 24 and the noise level detection circuit 25 in FIG. 2 correspond to the background noise level detector 6 in FIG.

【0032】上記VSELPエンコーダ23を用いた音
声符号化方法としては、アナリシスバイシンセス(Anal
ysis by synthesis )によるコードブックサーチによ
り、低ビットレートによる高品質音声伝送を実現してい
る。また、VSELPを用いた音声符号化方法を適用し
た音声符号化装置(音声コーダ)においては、入力音声
信号の特性を形成するピッチ等をコードブックに記憶さ
れたコードベクトルを選択することで励起させて音声を
符号化している。この符号化の際に用いるピッチ周波数
等のパラメータには、フレームパワー、反射係数及び線
形予測係数、コードブック、ピッチ及びコードブックの
ゲイン等がある。
As a voice encoding method using the VSELP encoder 23, an analysis bisynthesis (Anal
A codebook search based on ysis by synthesis) enables high-quality voice transmission at a low bit rate. Further, in a speech coder (speech coder) to which a speech coding method using VSELP is applied, the pitch forming the characteristics of an input speech signal is excited by selecting a code vector stored in a codebook. Voice is encoded. Parameters such as pitch frequency used in this encoding include frame power, reflection coefficient and linear prediction coefficient, codebook, pitch and gain of codebook.

【0033】本実施例においては、これらの分析パラメ
ータの内、フレームパワーR0 、ピッチ成分の強弱を示
すピッチゲインP0 、1次の線形予測符号化係数α1
びピッチ周波数に関するラグLAG を、背景雑音レベル検
出のための雑音区間検出に利用している。例えばフレー
ムパワーR0 を利用するのは、音声レベルと雑音レベル
が同じになることはほとんどないためであり、ピッチゲ
インP0 を利用するのは、周囲雑音がほぼランダムであ
るとすれば、この周囲雑音はピッチをほとんど持たない
と考えられるためである。
In the present embodiment, among these analysis parameters, the frame power R 0 , the pitch gain P 0 indicating the strength of the pitch component, the linear predictive coding coefficient α 1 of the first order, and the lag LAG concerning the pitch frequency are: It is used for noise interval detection for background noise level detection. For example, the frame power R 0 is used because the voice level and the noise level rarely become the same, and the pitch gain P 0 is used if the ambient noise is almost random. This is because ambient noise is considered to have almost no pitch.

【0034】また、1次の線形予測符号化係数α1 を用
いるのは、このα1 が大か小かで、周波数の高域成分が
強いかあるいは低域成分が強いかを判定できるからであ
る。通常、背景雑音は、周波数の高域成分に集中してお
り、上記1次の線形予測符号化係数α1 から背景雑音を
検出できる。この1次の線形予測符号化係数α1 は、直
接型の高次のFIRフィルタを2次のFIRフィルタの
カスケードに分解したときの逆関数Z-1の係数の和であ
る。したがって、零点が0<θ<π/2の範囲にある
時、1次の線形予測符号化係数α1 は大きくなる。よっ
て、このα1 が所定のしきい値より大きいときは、低域
にエネルギーの集中した信号ということになり、所定の
しきい値より小さいときは、高域にエネルギーの集中し
た信号ということになる。
The linear predictive coding coefficient α 1 is used because it is possible to judge whether α 1 is large or small and whether the high frequency component or the low frequency component is strong. is there. Usually, the background noise is concentrated in the high frequency component of the frequency, and the background noise can be detected from the first-order linear predictive coding coefficient α 1 . The first-order linear predictive coding coefficient α 1 is the sum of the coefficients of the inverse function Z −1 when the direct type high-order FIR filter is decomposed into a cascade of second-order FIR filters. Therefore, when the zero point is in the range of 0 <θ <π / 2, the linear prediction coding coefficient α 1 of the first order becomes large. Therefore, when this α 1 is larger than a predetermined threshold value, it means that the signal has energy concentrated in the low range, and when it is smaller than the predetermined threshold value, it means that the signal has energy concentrated in the high range. Become.

【0035】ここで、θと周波数との関係について説明
する。サンプリング周波数をfとすると、0〜f/2の
周波数がディジタルフィルタ等のディジタルシステムに
おいて、0〜πに相当する。例えば、サンプリング周波
数fを8KHzとすると、(0〜4KHz)は(0〜π)に
相当し、よって、π/2=2KHzとなる。したがって、
θが小さいほど周波数成分が低域になる。また、θが小
さくなれば、α1 は大きくなるので、α1 と所定のしき
い値との関係を調べることで低域成分が強いのか高域成
分が強いのかが分かる。
Here, the relationship between θ and frequency will be described. When the sampling frequency is f, frequencies 0 to f / 2 correspond to 0 to π in a digital system such as a digital filter. For example, if the sampling frequency f is 8 KHz, (0 to 4 KHz) corresponds to (0 to π), and thus π / 2 = 2 KHz. Therefore,
The smaller θ is, the lower the frequency component is. Further, as θ becomes smaller, α 1 becomes larger. Therefore, by examining the relationship between α 1 and a predetermined threshold value, it is possible to know whether the low frequency component is strong or the high frequency component is strong.

【0036】次に、上記雑音区間検出回路24は、上記
VSELPエンコーダ23から上記分析パラメータすな
わちフレームパワーR0 、ピッチ成分の強弱を示すピッ
チゲインP0 、1次の線形予測符号化係数α1 及びピッ
チ周波数に関するラグLAG を受け取り、雑音区間を検出
する。これは、携帯電話装置が小型化されていく現在、
ディジタル信号処理(DSP)装置やメモリの大きさが
制限されており、演算量を増やすのを避けるためにも有
効である。
Next, the noise section detection circuit 24 receives from the VSELP encoder 23 the analysis parameter, that is, the frame power R 0 , the pitch gain P 0 indicating the strength of the pitch component, the linear predictive coding coefficient α 1 and Receive the lag LAG related to the pitch frequency and detect the noise interval. This is because, as mobile phone devices continue to shrink in size,
The size of the digital signal processing (DSP) device and the memory is limited, and it is effective for avoiding an increase in the amount of calculation.

【0037】上記雑音レベル検出回路25は、上記雑音
区間検出回路24で検出された雑音区間の音声レベルす
なわち送話用音声レベルを検出する。ここで、検出され
る送話用音声レベルは、上記雑音区間検出回路24の上
記分析パラメータを用いた判定により最終的に雑音区間
とされたフレームのフレームパワーR0 の値としてもよ
い。ただし、検出ミスの可能性があるので、このフレー
ムパワーR0 を後述するように例えば5タップの最小値
フィルタ等に入力する。
The noise level detection circuit 25 detects the voice level in the noise section detected by the noise section detection circuit 24, that is, the voice level for transmission. Here, the detected voice level for transmission may be the value of the frame power R 0 of the frame finally determined as the noise section by the determination using the analysis parameter of the noise section detection circuit 24. However, since there is a possibility of detection error, this frame power R 0 is input to, for example, a 5-tap minimum value filter as described later.

【0038】上記マイクロコンピュータ26は、上記雑
音区間検出回路24での雑音区間検出と上記雑音レベル
検出回路25での雑音レベル検出のタイミングを制御す
ると共に、該雑音レベルに応じて側音レベル及び再生音
声の音量を制御する。
The microcomputer 26 controls the timing of the noise section detection in the noise section detection circuit 24 and the noise level detection in the noise level detection circuit 25, and the side tone level and reproduction according to the noise level. Control the volume of voice.

【0039】このような本実施例は、以下に説明するよ
うに全体的に構成されている。すなわち、送話用マイク
ロフォン21で電気信号とされた入力音声信号は、アナ
ログ/ディジタル(A/D)変換器22によりディジタ
ル信号とされて、VSELPエンコーダ23に供給され
る。このVSELPエンコーダ23は、ディジタル信号
とされた入力信号を分析し、圧縮し、符号化を行う。こ
の際、入力音声信号のフレームパワー、反射係数及び線
形予測係数、ピッチ周波数、コードブック、ピッチ及び
コードブックのゲイン等の分析パラメータを用いてい
る。
The present embodiment as described above is entirely constructed as described below. That is, the input voice signal converted into an electric signal by the transmission microphone 21 is converted into a digital signal by the analog / digital (A / D) converter 22 and supplied to the VSELP encoder 23. The VSELP encoder 23 analyzes the input signal that has been converted into a digital signal, compresses it, and encodes it. At this time, analysis parameters such as the frame power of the input audio signal, the reflection coefficient and the linear prediction coefficient, the pitch frequency, the codebook, the pitch and the gain of the codebook are used.

【0040】上記VSELPエンコーダ23で情報圧
縮、符号化が施されたデータは、ベースバンド信号処理
回路27に供給され、同期信号の付加、フレーミング、
誤り訂正符号等を付加される。そして、ベースバンド信
号処理回路27からの出力データは、RF送受信回路2
8に供給され、必要な周波数に変調されてアンテナ29
から送信される。
The data compressed and encoded by the VSELP encoder 23 is supplied to the baseband signal processing circuit 27, where a sync signal is added, framing, and the like.
An error correction code or the like is added. The output data from the baseband signal processing circuit 27 is the RF transmission / reception circuit 2
The antenna 29 is supplied to the antenna 8 and modulated to the required frequency.
Sent from.

【0041】ここで、上記VSELPエンコーダ23が
用いた分析パラメータの内、上述したように、フレーム
パワーR0 、ピッチ成分の強弱を示すピッチゲイン
0 、1次の線形予測符号化係数α1 及びピッチ周波数
に関するラグLAG は、上記雑音区間検出回路24に供給
される。この雑音区間検出回路24は、上記フレームパ
ワーR0 、ピッチ成分の強弱を示すピッチゲインP0
1次の線形予測符号化係数α1 及びピッチ周波数に関す
るラグLAG を用いて、雑音区間の検出を行う。この雑音
区間検出回路24で最終的に雑音区間であるとされたフ
レームに関する情報(フラグ情報)は、上記雑音レベル
検出回路25に供給される。
Here, of the analysis parameters used by the VSELP encoder 23, as described above, the frame power R 0 , the pitch gain P 0 indicating the strength of the pitch component, the linear predictive coding coefficient α 1 and The lag LAG relating to the pitch frequency is supplied to the noise section detection circuit 24. The noise section detection circuit 24 uses the frame power R 0 , the pitch gain P 0 indicating the strength of the pitch component,
The noise interval is detected using the first-order linear predictive coding coefficient α 1 and the lag LAG regarding the pitch frequency. Information (flag information) regarding the frame finally determined to be the noise section by the noise section detection circuit 24 is supplied to the noise level detection circuit 25.

【0042】上記雑音レベル検出回路25には、上記A
/D変換器22からのディジタル入力信号も供給されて
おり、上記フラグ情報に応じて雑音区間の信号レベルを
検出する。この場合の信号レベルは、上述したようにフ
レームパワーR0 としてもよい。
The noise level detection circuit 25 has the A
The digital input signal from the / D converter 22 is also supplied, and the signal level in the noise section is detected according to the flag information. The signal level in this case may be the frame power R 0 as described above.

【0043】上記雑音レベル検出回路25で検出された
雑音レベルデータは、制御部であるマイクロコンピュー
タ26に供給される。この雑音レベルデータに基づい
て、マイクロコンピュータ26は、後述するように、受
話音量制御用の可変利得アンプ33の利得、及び側音レ
ベル制御用の可変利得アンプ38の利得をそれぞれ可変
制御している。
The noise level data detected by the noise level detection circuit 25 is supplied to the microcomputer 26 which is a control unit. Based on this noise level data, the microcomputer 26 variably controls the gain of the variable gain amplifier 33 for controlling the reception sound volume and the gain of the variable gain amplifier 38 for controlling the sidetone level, as will be described later. .

【0044】上記受話音量とは、本実施例の携帯電話装
置に送信されてきた通話相手からの信号をスピーカ34
で再生するときの音量である。また、上記側音レベルと
は、上記送話側のA/D変換器22から受話側の加算器
31に送られる信号のレベルである。
The above-mentioned listening volume is the speaker 34 which is the signal from the other party transmitted to the portable telephone device of this embodiment.
This is the volume when playing with. The sidetone level is the level of the signal sent from the A / D converter 22 on the transmitting side to the adder 31 on the receiving side.

【0045】受話側の構成について説明すると、アンテ
ナ29により受信され、RF送受信回路28によりベー
スバンドに復調された相手側からの入力音声信号は、ベ
ースバンド信号処理回路27に供給され、所定の信号処
理が施される。このベースバンド信号処理回路27から
の信号は、VSELPデコーダ30に供給される。この
VSELPデコーダ30は、上記送信側のVSELPエ
ンコーダ23における音声圧縮符号化処理に対して逆の
処理となる復号化処理を行って、ディジタル音声信号を
出力する。VSELPデコーダ30からの受話音声信号
は、加算器31を介してディジタル/アナログ(D/
A)変換器32に供給され、アナログ音声信号に変換さ
れる。
Explaining the structure of the receiving side, the input voice signal from the other side received by the antenna 29 and demodulated to the baseband by the RF transmission / reception circuit 28 is supplied to the baseband signal processing circuit 27, and a predetermined signal is supplied. Processing is performed. The signal from the baseband signal processing circuit 27 is supplied to the VSELP decoder 30. The VSELP decoder 30 performs a decoding process that is the reverse process of the voice compression encoding process in the VSELP encoder 23 on the transmission side, and outputs a digital voice signal. The received voice signal from the VSELP decoder 30 is sent to the digital / analog (D / A / D) via the adder 31.
A) It is supplied to the converter 32 and converted into an analog audio signal.

【0046】上記加算器31には、送話側のA/D変換
器22からの送話音声信号が可変利得アンプ38を介し
ていわゆる側音として供給されており、この可変利得ア
ンプ38は、マイクロコンピュータ26により、上記背
景雑音検出レベルに応じて利得制御されるようになって
いる。
The transmitting voice signal from the transmitting side A / D converter 22 is supplied to the adder 31 as a so-called side tone through the variable gain amplifier 38. The microcomputer 26 controls the gain according to the background noise detection level.

【0047】なお、上記VSELPデコーダ30からの
デコードされた音声信号を受信側レベル検出回路(図示
せず)に供給して、受信側音声のレベル検出を行い、現
在受話音声(相手側からの入力音声信号)があるか否か
を判定し、この検出情報を上記マイクロコンピュータ2
6に供給するようにしてもよい。この受話側音声レベル
検出情報は、後述するように、背景雑音区間検出のため
の一情報として用いることができる。
The decoded voice signal from the VSELP decoder 30 is supplied to a receiving side level detecting circuit (not shown) to detect the level of the receiving side voice, and the currently received voice (input from the other side) Audio signal), and the detected information is used as the microcomputer 2
6 may be supplied. This receiving side voice level detection information can be used as one piece of information for background noise section detection, as described later.

【0048】上記D/A変換器32からのアナログ音声
信号は、可変利得アンプ33に供給される。この可変利
得アンプ33の利得は、上述したように上記マイクロコ
ンピュータ26により可変されているので、スピーカ3
4から発せられる再生音量である受話音量は、背景雑音
に応じて、マイクロコンピュータ26により制御される
ことになる。
The analog audio signal from the D / A converter 32 is supplied to the variable gain amplifier 33. Since the gain of the variable gain amplifier 33 is changed by the microcomputer 26 as described above, the speaker 3
The received sound volume, which is the reproduction volume emitted from No. 4, is controlled by the microcomputer 26 according to the background noise.

【0049】なお、このマイクロコンピュータ26に
は、表示装置35、電源回路36及びキーボード37が
接続されている。表示装置35は、この本実施例である
携帯電話装置が使用可能であるか、キーボード37で使
用者が押圧したキースイッチが何であるか等を表示す
る。
A display device 35, a power supply circuit 36 and a keyboard 37 are connected to the microcomputer 26. The display device 35 displays whether the mobile phone device according to the present embodiment can be used, what the key switch pressed by the user on the keyboard 37 is, and the like.

【0050】次に、このような図2の構成における雑音
区間検出回路24での雑音区間検出動作及び雑音レベル
検出回路25での雑音レベルの検出動作について、以下
説明する。
Next, the noise section detecting operation in the noise section detecting circuit 24 and the noise level detecting operation in the noise level detecting circuit 25 in the configuration of FIG. 2 will be described below.

【0051】先ず、雑音レベルの検出は、上記雑音区間
検出回路24で検出された雑音区間内で行うことが条件
となる。この雑音区間を検出するタイミングは、上述し
たように上記マイクロコンピュータ26で制御される。
この雑音区間の検出は、上記雑音レベル検出回路25で
の雑音レベルの検出を補助するためのものである。すな
わち該当するフレームが有声音である音声かあるいは雑
音であるかを判定し、雑音であるという判定であれば雑
音レベルの検出が可能となる。当然のことながら、より
精度の高い雑音レベルの検出は、雑音のみが存在する時
に行うのが良いのは明らかである。したがって、本実施
例では、送話音声入力が無いときに送話用マイクロフォ
ン21に入力される音声レベルを送話用音声レベル検出
手段でもある雑音レベル検出回路25に検出させてい
る。
First, the noise level must be detected within the noise section detected by the noise section detection circuit 24. The timing for detecting this noise section is controlled by the microcomputer 26 as described above.
The detection of the noise section is to assist the detection of the noise level in the noise level detection circuit 25. That is, it is determined whether the corresponding frame is voiced voice or noise, and if it is determined that the frame is noise, the noise level can be detected. Of course, it is clear that more accurate noise level detection should be done when only noise is present. Therefore, in this embodiment, the noise level detecting circuit 25, which is also the transmitting voice level detecting means, detects the voice level input to the transmitting microphone 21 when there is no transmitting voice input.

【0052】先ず、雑音レベルの初期値として例えば使
用者が設定した音量レベルに対して−20dBを設定す
る。この初期設定値に対して後述するように検出された
雑音レベルが大きいと判断された時には、受信部での再
生音量レベルを上昇させる。
First, for example, -20 dB is set as the initial value of the noise level with respect to the volume level set by the user. When it is determined that the detected noise level is high with respect to this initial setting value, the reproduction volume level at the receiving unit is increased.

【0053】雑音レベルは、フレーム毎の入力音声が背
景雑音区間であれば、上述したように検出しやすい。こ
のため、本実施例では、送信部の送信通話用電源がオン
とされた直後、送信部の着信信号の待機状態及び通話中
であって受信部の音声レベルが所定値以上のときに入力
される音声を背景雑音とし、この間のフレームの雑音レ
ベルを検出している。
The noise level is easy to detect as described above if the input voice for each frame is in the background noise section. Therefore, in this embodiment, immediately after the transmission call power supply of the transmission unit is turned on, the input signal is input when the transmission unit is in the standby state for incoming signals and during the call and the voice level of the reception unit is equal to or higher than a predetermined value. The background noise is used as the background noise, and the noise level of the frame during this period is detected.

【0054】ここで、送信部の送信通話電源がオンとさ
れることは、使用者が本実施例の携帯電話装置の使用を
開始する意思表示である。このとき、本実施例は、通
常、内部の各回路の自己診断を行い、次に、使用者がア
ンテナ29を張ると、基地局との接続を確認した上でス
タンバイ状態に入る。これらの一連の動作を経て初めて
使用者からの入力あるいは入力音声を受けるので、使用
者がこの間に音声を発することはない。したがって、こ
の一連の動作の最中に上記送話用マイクロフォン21を
使用して音声レベルを検出すれば、検出された音声レベ
ルは周囲のノイズレベルすなわち背景雑音レベルであ
る。なお、同様に、通話開始直前で使用者が発振操作を
した最中又は直後も背景雑音レベルの検出が可能であ
る。
Here, the fact that the transmission call power supply of the transmission unit is turned on is an indication that the user is willing to start using the portable telephone device of this embodiment. At this time, in this embodiment, normally, the internal circuits are self-diagnosed, and then, when the user puts the antenna 29 on, the connection with the base station is confirmed and then the standby state is entered. Since the input or the input voice from the user is not received until the series of operations described above, the user does not make a voice during this period. Therefore, if the voice level is detected using the microphone 21 for transmitting during this series of operations, the detected voice level is the ambient noise level, that is, the background noise level. Similarly, it is possible to detect the background noise level immediately before the start of the call, during or immediately after the user performs the oscillation operation.

【0055】また、送信部の着信信号の待機状態とは、
受話部の電源をオンにして、相手側からの通話信号の着
信を待ち受けている状態である。この状態のときには、
当然のことながら通話中ではないので、使用者の送話音
声が無いと考えられる。そこで、この待ち受け状態に、
送話用マイクロフォン21を用いて周囲の音量レベルを
測定すれば、背景雑音レベルを検出できる。なお、この
測定は、適当な間隔で行い平均化してもよい。
The standby state of the incoming signal of the transmitter is
This is a state in which the power of the earpiece is turned on and waiting for an incoming call signal from the other party. In this state,
As a matter of course, since it is not in a call, it is considered that there is no voice transmitted by the user. So, in this standby state,
The background noise level can be detected by measuring the ambient volume level using the microphone 21 for transmission. The measurement may be performed at appropriate intervals and averaged.

【0056】以上により、送信部の送信通話電源がオン
とされた直後及び送信部の着信信号の待機状態で背景雑
音レベルが推定でき、それに応じた音声処理によって通
話がスタートできるが、その後の背景雑音レベルの変化
に対しては、通話中もダイナミックに追従することが好
ましい。そこで、本実施例では、通話中での受信部の音
声レベルに応じても背景雑音レベルの検出を行ってい
る。
As described above, the background noise level can be estimated immediately after the transmission call power supply of the transmission unit is turned on and in the standby state of the incoming signal of the transmission unit, and the call can be started by the voice processing according to the background noise level. It is preferable to dynamically follow a change in noise level even during a call. Therefore, in this embodiment, the background noise level is also detected according to the voice level of the receiving unit during a call.

【0057】この通話中での受信部の音声レベルに応じ
た雑音レベルの検出は、上述したように受話側のVSE
LPエンコーダ23で用いられる分析パラメータにより
雑音区間を検出してから行うのが好ましい。
The detection of the noise level according to the voice level of the receiving unit during this call is performed by the VSE on the receiving side as described above.
It is preferable to carry out after the noise section is detected by the analysis parameter used in the LP encoder 23.

【0058】例えば、フレームパワーR0 をモニタしそ
のレベルがある基準のレベル以上であるときや、相手が
話しているときを利用して雑音レベルを検出すること等
により、より確実に雑音の検出ができるので、相手が話
しているときの再生音量をリアルタイムで制御でき、よ
り快適な通話品質が実現できる。
For example, noise can be detected more reliably by monitoring the frame power R 0 and detecting the noise level when the level is above a certain reference level or when the other party is talking. As a result, you can control the playback volume when the other party is talking in real time, and you can achieve more comfortable call quality.

【0059】このように本実施例では、送信部の送信通
話用電源がオンとされた直後、送信部の着信信号の待機
状態及び通話中であって送信部の音声がないときに、上
記マイクロコンピュータ26が上記雑音区間検出回路2
4及び上記雑音レベル検出回路25の検出タイミングを
制御している。
As described above, in this embodiment, immediately after the transmission call power supply of the transmission unit is turned on, when the transmission unit is in the standby state for incoming signals and during a call and there is no voice from the transmission unit, The computer 26 uses the noise section detection circuit 2
4 and the detection timing of the noise level detection circuit 25 are controlled.

【0060】次に、上記雑音区間検出回路24での雑音
区間検出動作について、図3及び図4に示すフローチャ
ートを参照しながら説明する。
Next, the noise section detection operation in the noise section detection circuit 24 will be described with reference to the flow charts shown in FIGS.

【0061】先ず、図3のフローチャートの動作が開始
されると、最初のステップS1では、上記VSELPエ
ンコーダ3からフレームパワーR0 、ピッチ成分の強弱
を示すピッチゲインP0 、1次の線形予測符号化係数α
1 及びピッチ周波数に関するラグLAG を受け取る。
First, when the operation of the flowchart of FIG. 3 is started, in the first step S1, the frame power R 0 from the VSELP encoder 3 and the pitch gain P 0 indicating the strength of the pitch component, and the linear prediction code of the first order are shown. Conversion factor α
Receive lag LAG for 1 and pitch frequency.

【0062】本実施例においては、上記ステップS1で
供給された各分析パラメータを用いた以下の各ステップ
での判別を基本的に3フレームで行うことにしている。
これは、1フレームだけで背景雑音の判別を行うと誤り
が多くなるためである。そして、3フレームに渡り各パ
ラメータの範囲を見ながら、雑音区間を判別したら、ノ
イズフラグを“1”とし、そうでなければ“0”にセッ
トする。3フレームの内訳は、現在のフレームと1、2
フレーム前までのフレームである。
In the present embodiment, the determination in each of the following steps using each analysis parameter supplied in step S1 is basically performed in 3 frames.
This is because if the background noise is discriminated using only one frame, errors will increase. Then, when the noise section is determined while looking at the range of each parameter over three frames, the noise flag is set to "1", and otherwise set to "0". The breakdown of 3 frames is the current frame and 1, 2
It is a frame before the frame.

【0063】このような連続した3フレームを通しての
分析パラメータによる判別を以下の各ステップで行う。
Discrimination by such analysis parameters through three consecutive frames is performed in the following steps.

【0064】先ず、ステップS2では、入力音声のフレ
ームパワーR0 が3フレーム連続して所定のしきい値R
0th より小さいか否かを判別する。ここで、YESと判
別するとステップS3に進み、NO、すなわちR0 が3
フレーム連続してR0th 以上であると判別するとステッ
プS9に進む。この所定のしきい値R0th は、それ以上
のレベルをノイズではなく、音声と見なす値である。す
なわち、このステップS2は、信号レベルのチェックで
ある。
First, in step S2, the frame power R 0 of the input voice is a predetermined threshold value R for three consecutive frames.
It is determined whether it is smaller than 0th . Here, if YES is determined, the process proceeds to step S3, and NO, that is, R 0 is 3
If it is determined that the number of frames is continuously R 0th or more, the process proceeds to step S9. The predetermined threshold value R 0th is a value at which a level higher than that is regarded as voice, not noise. That is, this step S2 is a signal level check.

【0065】ステップS3では、入力音声の1次の線形
予測符号化(LPC)係数α1 が3フレーム連続して所
定のしきい値αthより小さいか否かを判別する。ここで
YES(α1 が3フレーム連続してαthより小さい)と
判別するとステップS4に進み、NO(α1 が3フレー
ム連続してαth以上である)と判別するとステップS9
に進む。この所定のしきい値αthは、雑音を分析したと
きにはほとんど表れることのない値になっている。すな
わち、このステップS3は、音声スペクトルの傾きのチ
ェックである。
In step S3, it is determined whether or not the primary linear predictive coding (LPC) coefficient α 1 of the input speech is smaller than a predetermined threshold value α th for three consecutive frames. If YES (α 1 is smaller than α th for 3 consecutive frames) is determined, the process proceeds to step S4. If NO (α 1 is equal to or greater than α th for 3 consecutive frames) is determined, step S9.
Proceed to. This predetermined threshold value α th is a value that hardly appears when noise is analyzed. That is, this step S3 is a check of the inclination of the voice spectrum.

【0066】ステップS4では、現在の入力音声のフレ
ームのフレームパワーR0 の値が“5”より小さいか否
かを判別する。ここで、YES(R0 が5より小さい)
と判別すると、ステップS5に進み、NO(R0 が5以
上である)と判別すると、ステップS6に進む。ここ
で、“5”をしきい値としたのは、フレームパワーR0
が“5”より大である場合のフレームは有声音である確
率が高いためである。
In step S4, it is determined whether or not the value of the frame power R 0 of the frame of the current input voice is smaller than "5". Here, YES (R 0 is smaller than 5)
If it is determined to be NO, the process proceeds to step S5, and if NO (R 0 is 5 or more) is determined, the process proceeds to step S6. Here, “5” is used as the threshold because the frame power R 0
This is because there is a high probability that the frame is voiced when the value of is larger than “5”.

【0067】ステップS5では、入力音声信号のピッチ
ゲインP0 の値が3フレーム連続して0.9より小さ
く、かつ現在のピッチゲインP0 が0.7より大きいか
否かを判別する。ここで、YES(ピッチゲインP0
値が3フレーム連続して0.9より小さく、かつ現在の
ピッチゲインP0 が0.7より大きい)と判別すると、
ステップ8に進み、NO(ピッチゲインP0 の値が3フ
レーム連続して0.9以上、また現在のピッチゲインP
0 が0.7以下である)と判別すると、ステップS9に
進む。上記ステップS3から上記ステップS5までは、
ピッチ成分の強弱のチェックである。
In step S5, it is determined whether or not the value of the pitch gain P 0 of the input audio signal is smaller than 0.9 for three consecutive frames and the current pitch gain P 0 is larger than 0.7. Here, YES (the value of the pitch gain P 0 is smaller than 0.9 for three consecutive frames, and the current pitch gain P 0 is greater than 0.7) When determining that,
The process proceeds to step 8 and NO (the value of the pitch gain P 0 is 0.9 or more for three consecutive frames, and the current pitch gain P 0
If 0 is 0.7 or less), the process proceeds to step S9. From step S3 to step S5,
This is a check of the strength of the pitch component.

【0068】ステップS6では、上記ステップS4での
判別結果(NO:R0 が5以上である)を受けて、その
フレームパワーR0 が5以上20未満であるか否かを判
別する。ここでYES(R0 が5以上20未満である)
と判別するとステップS7に進み、NO(R0 が5以上
20未満でない)と判別するとステップS9に進む。
In step S6, on the basis of the determination result (NO: R 0 is 5 or more) in step S4, it is determined whether or not the frame power R 0 is 5 or more and less than 20. YES here (R 0 is 5 or more and less than 20)
If it is determined to be NO, the process proceeds to step S7. If it is determined to be NO (R 0 is not less than 5 and less than 20), the process proceeds to step S9.

【0069】ステップS7では、入力音声信号のピッチ
ゲインP0 の値が3フレーム連続して0.85より小さ
く、かつ現在のピッチゲインP0 が0.65より大きい
か否かを判別する。ここで、YES(ピッチゲインP0
の値が3フレーム連続して0.85より小さく、かつ現
在のピッチゲインP0 が0.65より大きい)と判別す
ると、ステップ8に進み、NO(ピッチゲインP0 の値
が3フレーム連続して0.85以上、また現在のピッチ
ゲインP0 が0.65以下である)と判別すると、ステ
ップS9に進む。
In step S7, it is determined whether or not the value of the pitch gain P 0 of the input audio signal is smaller than 0.85 for three consecutive frames and the current pitch gain P 0 is larger than 0.65. Here, YES (pitch gain P 0
If it is determined that the value of is less than 0.85 for 3 consecutive frames and the current pitch gain P 0 is larger than 0.65, the process proceeds to step 8 and NO (the value of the pitch gain P 0 continues for 3 frames). Is 0.85 or more, and the current pitch gain P 0 is 0.65 or less), the process proceeds to step S9.

【0070】ステップS8では、上記ステップS5又は
上記ステップS7でのYESの判別結果を受けて、ノイ
ズフラグを“1”とする。ノイズフラグを“1”とする
ことは、そのフレームを雑音とすることである。
In step S8, the noise flag is set to "1" in response to the YES determination result in step S5 or step S7. Setting the noise flag to "1" means that the frame is noise.

【0071】ステップS9では、上記ステップS2、上
記ステップS3、上記ステップS5、上記ステップS6
及び上記ステップS7での判別がNOとされた場合に、
ノイズフラグを“0”とし、該当フレームを音声である
とする。
In step S9, step S2, step S3, step S5, step S6.
And if the determination in step S7 is NO,
It is assumed that the noise flag is "0" and the corresponding frame is voice.

【0072】次に、図4のフローチャートに移る。ステ
ップS10では、入力音声信号のピッチラグLAG が0で
あるか否かの判別を行う。ここでYESと判別した場
合、すなわちピッチ周波数を表すLAG が0の場合は、音
声である確率はほとんどないので、そのフレームを雑音
とする。すなわち、ステップS11に進みノイズフラグ
を“1”とする。ここでNO(LAG が0でない)と判別
するとステップS12に進む。
Next, the flow chart of FIG. 4 is entered. In step S10, it is determined whether or not the pitch lag LAG of the input audio signal is 0. If YES is determined here, that is, if LAG representing the pitch frequency is 0, there is almost no probability of being a voice, and the frame is set as noise. That is, the process proceeds to step S11 and the noise flag is set to "1". If NO (LAG is not 0) is determined here, the process proceeds to step S12.

【0073】ステップS12では、フレームパワーR0
が2以下であるか否かを判別する。ここで、YES(R
0 が2以下である)と判別するとステップS13に進
み、NO(R0 が2より大きい)と判別するとステップ
S14に進む。このステップS12は、フレームパワー
0 がかなり小さいか否かを判別しており、YESと判
定すると次のステップS13でノイズフラグを“1”と
し、そのフレームを雑音としている。
In step S12, the frame power R 0
Is determined to be 2 or less. Here, YES (R
If 0 is 2 or less), the process proceeds to step S13, and if NO (R 0 is greater than 2) is determined, the process proceeds to step S14. In this step S12, it is determined whether or not the frame power R 0 is considerably small. If YES is determined, the noise flag is set to "1" in the next step S13, and the frame is regarded as noise.

【0074】ステップS13では、上記ステップS11
と同様にそのフレームを雑音とすべく、ノイズフラグを
“1”とする。
In step S13, the above step S11 is performed.
Similarly, in order to make the frame noise, the noise flag is set to "1".

【0075】ステップS14では、現在のフレームのフ
レームパワーR0 から1つ前のフレームパワーR0 を減
算し、その絶対値が3を越えるか否かを判別する。現在
のフレームと1つ前のフレームでのフレームパワーR0
の変化が急に大きくなるときには、そのフレームを音声
フレームとするためである。すなわち、このステップS
14でYES(現在のフレームと1つ前のフレームのフ
レームパワーR0 の変化が急激に大きくなった)と判定
するとステップS16に進み、ノイズフラグを“0”と
し、そのフレームを音声フレームとする。また、ここ
で、NO(現在のフレームと1つ前のフレームのフレー
ムパワーR0 の変化が急激に大きくならない)と判別す
ると、ステップS15に進む。
In step S14, the previous frame power R 0 is subtracted from the frame power R 0 of the current frame, and it is determined whether or not the absolute value thereof exceeds 3. Frame power R 0 in the current frame and the previous frame
This is because, when the change in No. becomes suddenly large, that frame is set as a voice frame. That is, this step S
If YES is determined in 14 (the change in the frame power R 0 between the current frame and the frame immediately before) is rapidly increased, the process proceeds to step S16, the noise flag is set to "0", and the frame is set as a voice frame. . If it is determined to be NO (the change in the frame power R 0 of the current frame and the frame immediately before the current frame does not suddenly increase), the process proceeds to step S15.

【0076】ステップS15では、現在のフレームのフ
レームパワーR0 から2つ前のフレームパワーR0 を減
算し、その絶対値が3を越えるか否かを判別する。現在
のフレームと2つ前のフレームでのフレームパワーR0
の変化が急に大きくなるときには、そのフレームを音声
フレームとするためである。すなわち、このステップS
15でYES(現在のフレームと2つ前のフレームのフ
レームパワーR0 の変化が急激に大きくなった)と判定
するとステップS16に進み、ノイズフラグを“0”と
し、そのフレームを音声フレームとする。また、ここ
で、NO(現在のフレームと2つ前のフレームのフレー
ムパワーR0 の変化が急激に大きくならない)と判別す
ると、ステップS17に進む。
[0076] In step S15, by subtracting the frame power R 0 of the two before the frame power R 0 of the current frame, and determines whether the absolute value exceeds 3. Frame power R 0 for the current frame and the frame two frames before
This is because, when the change in No. becomes suddenly large, that frame is set as a voice frame. That is, this step S
When YES is determined in 15 (the change in the frame power R 0 of the current frame and the frame two frames before) is increased, the process proceeds to step S16, the noise flag is set to “0”, and the frame is set as the audio frame. . If it is determined to be NO (the change in the frame power R 0 of the current frame and the frame two frames before the current frame does not suddenly increase), the process proceeds to step S17.

【0077】ステップS17では、最終的にノイズフラ
グを“0”又は“1”と決定し、そのフラグ情報を上記
雑音レベル検出回路25に供給する。
In step S17, the noise flag is finally determined to be "0" or "1", and the flag information is supplied to the noise level detection circuit 25.

【0078】以上、図3及び図4に示したフローチャー
トによる雑音区間検出回路24での動作により得られた
フラグ情報に応じて、上記雑音レベル検出回路25は、
雑音区間の音声レベルを検出する。
As described above, according to the flag information obtained by the operation of the noise section detection circuit 24 according to the flowcharts shown in FIGS. 3 and 4, the noise level detection circuit 25 is
The voice level in the noise section is detected.

【0079】ところで、上記雑音区間検出回路24での
雑音区間検出では、完全に音声区間と雑音区間とを区別
することはできず、また、音声を誤って雑音として検出
してしまうことが起こりえる。この検出誤りは、ほとん
どが音声の子音部で起きる。背景雑音が子音部と略々同
じくらいのレベルで混入している場合は、誤検出しても
報告される雑音レベルが変わらないので問題ないが、そ
うでない場合、特に雑音がほとんど混入していないよう
な場合では、レベルが場合によっては、20〜30dBも
違うため、かなり問題になってくる。そこで、本実施例
では、誤検出した場合でもそのまま検出した雑音区間の
雑音レベルを用いるのではなく、平滑化などにより誤検
出の影響が少なくなるようにした。
By the way, in the noise section detection by the noise section detection circuit 24, it is impossible to completely distinguish the speech section from the noise section, and it is possible that the speech is erroneously detected as noise. . This detection error mostly occurs in the consonant part of the voice. If the background noise is mixed at about the same level as the consonant part, there is no problem because the reported noise level does not change even if it is erroneously detected, but if not, there is almost no noise. In such a case, the level may be 20 to 30 dB different depending on the case, which is a serious problem. Therefore, in the present embodiment, even if an erroneous detection is made, the noise level of the detected noise section is not used as it is, but the influence of the erroneous detection is reduced by smoothing or the like.

【0080】このような平滑化等の手段により誤検出の
影響を少なくした雑音レベルの検出について、図5を参
照しながら説明する。
Noise level detection in which the influence of erroneous detection is reduced by such smoothing means will be described with reference to FIG.

【0081】図5において、入力端子40には、上記A
/D変換器22からのディジタル入力信号が供給され
る。また、入力端子41には、上記雑音区間検出回路2
4からのフラグ情報がディジタルシグナルプロセッサ
(DSP)で構成される雑音レベル検出回路25の雑音
レベル決定部25aに入力されるように供給される。こ
の雑音レベル決定部25aには、入力端子42からのフ
レームパワーR0 も供給されている。すなわち、この雑
音レベル決定部25aは、雑音区間検出回路24からの
フラグ情報又はフレームパワーR0 を基に入力音声信号
の雑音レベルを決定している。具体的には、図4に示し
たフローチャートのステップS17において、最終的に
ノイズフラグが“1”とされたときのフレームパワーR
0 の値を背景雑音レベルと見なしている。
In FIG. 5, the input terminal 40 has the above-mentioned A
A digital input signal from the / D converter 22 is supplied. The noise section detection circuit 2 is connected to the input terminal 41.
The flag information from No. 4 is supplied so as to be input to the noise level determination unit 25a of the noise level detection circuit 25 composed of a digital signal processor (DSP). The frame power R 0 from the input terminal 42 is also supplied to the noise level determination unit 25a. That is, the noise level determination unit 25a determines the noise level of the input audio signal based on the flag information or the frame power R 0 from the noise section detection circuit 24. Specifically, in step S17 of the flowchart shown in FIG. 4, the frame power R when the noise flag is finally set to "1"
A value of 0 is considered the background noise level.

【0082】このとき、検出ミスの可能性があるので、
このR0 の値を例えば5タップの最小値フィルタ25b
に入力する。このR0 は、背景雑音と認められた時のみ
入力する。この最小値フィルタ25bの出力は、マイク
ロコンピュータ26等の制御用CPUに適当な周期(例
えば100msec 毎)で入力する。ここで、最小値フィ
ルタ25bの出力が更新されていないときは、前の値を
繰り返し使用する。この最小値フィルタ25bは、後述
するメディアンフィルタのようにタップ中の真ん中の値
を出力するものではなく、最小値を出力する。同じタッ
プ数の場合、連続した4フレームまでの検出誤りに対応
できる。また、それ以上の誤りについても、最小値を報
告レベルとするため、影響をなるべく少なくできる。
At this time, since there is a possibility of detection error,
The value of R 0 is , for example, a 5-tap minimum value filter 25b
To enter. This R 0 is input only when it is recognized as background noise. The output of the minimum value filter 25b is input to the control CPU such as the microcomputer 26 at an appropriate cycle (for example, every 100 msec). Here, when the output of the minimum value filter 25b is not updated, the previous value is repeatedly used. The minimum value filter 25b does not output the middle value in the tap unlike the median filter described later, but outputs the minimum value. When the number of taps is the same, it is possible to cope with detection errors in up to four consecutive frames. Also, for errors larger than that, the minimum value is set as the reporting level, so the influence can be minimized.

【0083】上記マイクロコンピュータ26では、入力
された信号レベルR0 の信頼度をより向上するために、
該信号レベルR0 を更に25タップのメディアンフィル
タ26aに入力させている。このメディアンフィルタ2
6aは、検出誤りが続いてもレベルの報告を誤りにくい
ようにする。このフィルタリングは、フィルタのタップ
中の値を小さい順に並べ変え、その中の中間値を出力す
るものである。5タップのメディアンフィルタは、連続
した2フレームまでは検出誤りがおきても、報告レベル
を間違えることはない。
In the microcomputer 26, in order to further improve the reliability of the input signal level R 0 ,
The signal level R 0 is further input to the 25-tap median filter 26a. This median filter 2
6a makes it difficult to report the level even if the detection error continues. This filtering rearranges the values in the taps of the filter in ascending order and outputs the intermediate value among them. The 5-tap median filter does not make a mistake in the reporting level even if a detection error occurs up to two consecutive frames.

【0084】上記メディアンフィルタ26aの出力信号
は、ボリューム位置調整部26bに供給される。このボ
リューム位置調整部26bは、上記メディアンフィルタ
26aの出力信号を基に、上記可変利得アンプ33や3
8の利得を可変制御する。このようにして、上記マイコ
ン26は、再生音量である受話音量を制御する。具体的
には、使用者の設定したボリューム位置を中心(基点)
として、音量の増減をコントロールするものである。ま
た、使用者がボリュームを調節した直前の雑音レベルを
記憶しておき、そのレベルと現在の背景雑音レベルの変
化分に基づき出力音量を増減してもよい。
The output signal of the median filter 26a is supplied to the volume position adjusting section 26b. The volume position adjusting unit 26b uses the variable gain amplifiers 33 and 3 based on the output signal of the median filter 26a.
The gain of 8 is variably controlled. In this way, the microcomputer 26 controls the reception volume, which is the reproduction volume. Specifically, center the volume position set by the user (base point)
The control is to increase or decrease the volume. Alternatively, the noise level immediately before the user has adjusted the volume may be stored, and the output volume may be increased or decreased based on the change in the level and the current background noise level.

【0085】なお、ここで、用いられるフィルタとして
は、検出した背景雑音レベルの平滑化を行う1次のロー
パスフィルタ等の平滑化フィルタでもよい。ローパスフ
ィルタの度合いによっては、検出を誤ってレベルが急に
変化しても追従が遅くなるためレベル差を小さくでき
る。
The filter used here may be a smoothing filter such as a primary low-pass filter for smoothing the detected background noise level. Depending on the degree of the low-pass filter, even if the detection is mistaken and the level suddenly changes, the tracking is slowed down, and thus the level difference can be reduced.

【0086】このようにすれば、雑音レベルを誤検出し
た場合でも、誤検出の影響を少なくできる。
By doing so, even if the noise level is erroneously detected, the influence of the erroneous detection can be reduced.

【0087】マイクロコンピュータ26による側音レベ
ル制御は、上述した図1に示す実施例と同様である。す
なわち、検出された背景雑音レベルが大きいときには、
可変利得アンプ38のゲインを下げて側音のレベルを下
げ、逆に、背景雑音レベルが小さいときには、可変利得
アンプ38のゲインを上げて側音のレベルを上げる。こ
のゲイン制御は、アナログ的に行わせても、段階的に行
わせてもよい。
The side tone level control by the microcomputer 26 is similar to that of the embodiment shown in FIG. That is, when the detected background noise level is high,
When the background noise level is low, the gain of the variable gain amplifier 38 is increased to raise the sidetone level. This gain control may be performed in analog or stepwise.

【0088】また、マイクロコンピュータ26による受
話音量制御については、検出された背景雑音レベルが大
きいときに可変利得アンプ33のゲインを上げて受話音
量を増大させ、背景雑音レベルが小さいときに可変利得
アンプ33のゲインを下げて受話音量を減少させてい
る。このゲイン制御も、アナログ的に行わせても、段階
的に行わせてもよい。また、受話音量をコントロールす
る際、通常は、初期設定された音量を背景雑音に応じて
変化させるが、もし、使用者が音量ボリュームを手動で
変えた場合は、その音量を基に背景雑音のレベルに応じ
て受話音量をコントロールするようにすればよい。
As for the reception volume control by the microcomputer 26, when the detected background noise level is high, the gain of the variable gain amplifier 33 is increased to increase the reception volume, and when the background noise level is low, the variable gain amplifier is increased. The gain of 33 is lowered to reduce the reception volume. This gain control may also be performed in analog or stepwise manner. Also, when controlling the listening volume, usually the default volume is changed according to the background noise, but if the user changes the volume manually, the background noise of the volume is changed based on the volume. The listening volume may be controlled according to the level.

【0089】このような背景雑音レベルに応じた受話音
量制御を行うことにより、背景雑音の影響に左右されな
い明瞭度の高い受話音を供給できる。また、受話音量を
上げると人間は話す音量を上げる傾向にあるので、送信
音の明瞭度を上げることもできる。
By performing the reception volume control according to the background noise level as described above, it is possible to supply a reception sound with high intelligibility that is not influenced by the background noise. Further, when the listening volume is increased, a person tends to increase the speaking volume, and thus the clarity of the transmitted sound can be increased.

【0090】以上より、本実施例の携帯電話装置は、V
SELPエンコーダで用いられている分析パラメータを
使用して雑音区間検出を行うので、少ない演算量ながら
高精度、高信頼度で背景雑音を検出でき、該背景雑音に
応じて、上記側音レベル及び再生音量の双方をコントロ
ールしているため、個別に雑音検出する必要がなく、回
路構成を簡略化でき、明瞭度の高い受話音声を得ること
ができる。
From the above, the portable telephone device of this embodiment is
Since the noise parameter detection is performed using the analysis parameter used in the SELP encoder, it is possible to detect the background noise with high accuracy and high reliability while using a small amount of calculation, and according to the background noise, the sidetone level and the reproduction are reproduced. Since both the sound volume is controlled, it is not necessary to individually detect noise, the circuit configuration can be simplified, and the received voice with high intelligibility can be obtained.

【0091】なお、本発明は、上記実施例にのみ限定さ
れるものではなく、例えば、背景雑音レベル検出は、送
話用マイクロフォンからのアナログ音声信号を用いて行
ってもよく、またアナログの側音を送話側のアナログ音
声信号に加算するようにしてもよい。背景雑音レベル検
出処理を音声符号化器での処理とは独立に行うようにし
てもよい。音声符号化処理の際のパラメータを用いて雑
音区間検出を行う場合に、分析パラメータを1つだけ用
いることも可能である。また、複数の連続したフレーム
を考慮するのではなく、1フレームのみで検出してもよ
い。雑音区間の検出動作の流れも上記フローチャートに
示したものに限定されるものでないことはいうまでもな
い。
The present invention is not limited to the above-mentioned embodiment, and for example, the background noise level detection may be carried out by using an analog voice signal from the microphone for transmission, or the analog side. The sound may be added to the analog voice signal on the transmitting side. The background noise level detection processing may be performed independently of the processing in the voice encoder. It is also possible to use only one analysis parameter when performing noise interval detection using the parameters used in the voice encoding process. Further, instead of considering a plurality of consecutive frames, detection may be performed with only one frame. It goes without saying that the flow of the noise section detection operation is not limited to that shown in the above flowchart.

【0092】[0092]

【発明の効果】本発明に係る送受話装置によれば、送話
音声信号を側音として受話側に送る経路中に挿入された
可変利得増幅手段を、送話側の背景雑音レベル検出出力
に応じて利得制御して、側音レベルを制御しているた
め、周囲雑音が大きい場所での側音を抑えて受話側に混
入する雑音を抑えることができる。
According to the transmitter / receiver device of the present invention, the variable gain amplifying means inserted in the route for transmitting the transmitted voice signal as the side tone to the receiver side is used as the background noise level detection output of the transmitter side. Since the gain control is performed accordingly to control the sidetone level, it is possible to suppress the sidetone in a place where the ambient noise is large and suppress the noise mixed into the receiving side.

【0093】すなわち、周囲の背景雑音の大きい場所で
は、側音経路を通して受話側に混入する雑音を抑えて、
明瞭度を上げることができる。また、一般に送話者は、
耳に戻る側音のレベルが低いと発声レベルを高めるよう
に、逆に側音レベルが高いと発声レベルを低めるように
発声することから、うるさい場所で側音レベルを下げる
ことにより送話者の発声レベルが上がり、逆に静かな場
所で側音レベルを上げることにより送話者の発声レベル
が相対的に下がる。これにより、音声と周囲雑音とのS
N比が良好にとれるようになる。
That is, in a place where the background noise is large in the surroundings, the noise mixed in the receiving side through the sidetone path is suppressed,
The clarity can be increased. Generally speaking,
When the level of the sidetone returning to the ear is low, the vocalization level is increased. Conversely, when the sidetone level is high, the vocalization is decreased, so by lowering the sidetone level in a noisy place, The voicing level rises, and conversely, by raising the sidetone level in a quiet place, the voicing level of the speaker decreases relatively. As a result, S of the voice and the ambient noise
A good N ratio can be obtained.

【0094】また、上記送話音声信号を圧縮符号化する
音声符号化手段を設け、音声符号化処理の際に求められ
るパラメータを用いて背景雑音レベル検出を行うように
することにより、背景雑音レベル検出のための計算を一
部省略でき、少ない演算量でも高精度、高信頼度の雑音
レベル検出が行える。
Further, the background noise level is detected by providing a voice coding means for compressing and coding the transmitted voice signal and performing the background noise level detection by using the parameter obtained in the voice coding process. Part of the calculation for detection can be omitted, and highly accurate and reliable noise level detection can be performed with a small amount of calculation.

【0095】さらに、背景雑音レベルを検出して受話音
量を制御するような送受話装置に本発明を適用する場合
には、1つの背景雑音レベル検出手段を、受話音量制御
用と側音レベル制御用とで兼用することができ、回路構
成や演算量を削減することができる。
Further, when the present invention is applied to a transmitter / receiver device which detects the background noise level and controls the reception volume, one background noise level detecting means is provided for the reception volume control and the sidetone level control. It can be used for both purposes, and the circuit configuration and the amount of calculation can be reduced.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明に係る送受話装置の基本的な実施例の要
部回路構成を示すブロック回路図である。
FIG. 1 is a block circuit diagram showing a main circuit configuration of a basic embodiment of a transmitter / receiver device according to the present invention.

【図2】本発明に係る送受話装置のより具体的な実施例
の回路構成を示すブロック回路図である。
FIG. 2 is a block circuit diagram showing a circuit configuration of a more specific embodiment of the transmitter / receiver device according to the present invention.

【図3】図2に示した実施例における背景雑音レベル検
出のための雑音区間検出動作を説明するためのフローチ
ャートである。
FIG. 3 is a flow chart for explaining a noise section detection operation for background noise level detection in the embodiment shown in FIG.

【図4】図1に示した実施例における背景雑音レベル検
出のための雑音区間検出動作を説明するためのフローチ
ャートである。
FIG. 4 is a flowchart for explaining a noise section detection operation for background noise level detection in the embodiment shown in FIG.

【図5】背景雑音レベルを誤差の影響から防ぐための手
段を説明するための図である。
FIG. 5 is a diagram for explaining a means for preventing a background noise level from being affected by an error.

【符号の説明】[Explanation of symbols]

1、21 送話用マイクロフォン 2、22 アナログ/ディジタル(A/D)変換器 3 音声符号化器 4 送信処理回路 6 背景雑音レベル検出器 7、33、38 可変利得アンプ 12 受信処理回路 13 音声復号化器 14、31 加算器 15、32 ディジタル/アナログ(D/A)変換器 17、34 スピーカ 23 VSELPエンコーダ 24 雑音区間検出回路 25 雑音レベル検出回路 26 マイクロコンピュータ 27 ベースバンド信号処理回路 28 RF送受信回路 29 アンテナ 30 VSELPデコーダ 1, 21 Microphone for transmission 2, 22 Analog / digital (A / D) converter 3 Speech encoder 4 Transmission processing circuit 6 Background noise level detector 7, 33, 38 Variable gain amplifier 12 Reception processing circuit 13 Speech decoding Converter 14, 31 adder 15, 32 digital / analog (D / A) converter 17, 34 speaker 23 VSELP encoder 24 noise section detection circuit 25 noise level detection circuit 26 microcomputer 27 baseband signal processing circuit 28 RF transmission / reception circuit 29 antenna 30 VSELP decoder

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 送話音声を電気信号の送話音声信号に変
換し信号処理して送信し、受信された信号を信号処理し
て受話音声信号とした後に受話音声に変換する送受話装
置において、 上記送話音声信号が入力される可変利得増幅手段と、 この可変利得増幅手段からの出力を上記受話音声信号に
加算する加算手段と、 送話側の背景雑音レベルを検出する背景雑音レベル検出
手段とを有し、 この背景雑音レベル検出手段からの検出出力に応じて上
記可変利得増幅手段の利得を制御することを特徴とする
送受話装置。
1. A transmission / reception apparatus for converting a transmission voice into a transmission voice signal of an electric signal, performing signal processing and transmitting, converting the received signal into a reception voice signal, and then converting into a reception voice. Variable gain amplifying means to which the transmitted voice signal is input, adding means for adding the output from the variable gain amplifying means to the received voice signal, and background noise level detection for detecting the background noise level on the transmitting side. And a means for controlling the gain of the variable gain amplifying means according to the detection output from the background noise level detecting means.
【請求項2】 上記送話音声信号を圧縮符号化する音声
符号化手段を設け、 上記背景雑音レベル検出手段は、上記音声符号化手段の
符号化処理の際に求められるパラメータを用いて背景雑
音レベル検出を行うことを特徴とする請求項1記載の送
受話装置。
2. A voice encoding means for compressing and encoding the transmitted voice signal is provided, and the background noise level detecting means uses background noise by using a parameter obtained during the encoding process of the voice encoding means. The transmitter / receiver device according to claim 1, wherein level detection is performed.
【請求項3】 上記背景雑音レベル検出手段は、雑音レ
ベルを少なくとも1つの閾値を用いて複数のレベル範囲
に区分し、これらの複数のレベル範囲に応じて上記可変
利得増幅手段の利得を段階的に切換制御することを特徴
とする請求項1又は2記載の送受話装置。
3. The background noise level detecting means divides the noise level into a plurality of level ranges by using at least one threshold value, and the gain of the variable gain amplifying means is stepwise according to the plurality of level ranges. 3. The transmitter / receiver device according to claim 1, wherein the transmission / reception device is controlled by switching to.
JP3001894A 1994-02-28 1994-02-28 Handset Withdrawn JPH07240782A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3001894A JPH07240782A (en) 1994-02-28 1994-02-28 Handset

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3001894A JPH07240782A (en) 1994-02-28 1994-02-28 Handset

Publications (1)

Publication Number Publication Date
JPH07240782A true JPH07240782A (en) 1995-09-12

Family

ID=12292111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3001894A Withdrawn JPH07240782A (en) 1994-02-28 1994-02-28 Handset

Country Status (1)

Country Link
JP (1) JPH07240782A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999011047A1 (en) * 1997-08-21 1999-03-04 Northern Telecom Limited Method and apparatus for listener sidetone control
WO2003103253A1 (en) * 2002-05-31 2003-12-11 三菱電機株式会社 Transmitter-receiver
US7003024B2 (en) 2000-12-01 2006-02-21 Hitachi, Ltd. Semiconductor device
US8379884B2 (en) 2008-01-17 2013-02-19 Funai Electric Co., Ltd. Sound signal transmitter-receiver
JP2017519444A (en) * 2014-06-13 2017-07-13 ボーズ・コーポレーションBose Corporation Self-speech feedback in communication headsets

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999011047A1 (en) * 1997-08-21 1999-03-04 Northern Telecom Limited Method and apparatus for listener sidetone control
US7003024B2 (en) 2000-12-01 2006-02-21 Hitachi, Ltd. Semiconductor device
WO2003103253A1 (en) * 2002-05-31 2003-12-11 三菱電機株式会社 Transmitter-receiver
US8379884B2 (en) 2008-01-17 2013-02-19 Funai Electric Co., Ltd. Sound signal transmitter-receiver
JP2017519444A (en) * 2014-06-13 2017-07-13 ボーズ・コーポレーションBose Corporation Self-speech feedback in communication headsets

Similar Documents

Publication Publication Date Title
JP3685812B2 (en) Audio signal transmitter / receiver
US6223154B1 (en) Using vocoded parameters in a staggered average to provide speakerphone operation based on enhanced speech activity thresholds
US5687285A (en) Noise reducing method, noise reducing apparatus and telephone set
US6122531A (en) Method for selectively including leading fricative sounds in a portable communication device operated in a speakerphone mode
US6584441B1 (en) Adaptive postfilter
JP3224132B2 (en) Voice activity detector
KR100343776B1 (en) Apparatus and method for volume control of the ring signal and/or input speech following the background noise pressure level in digital telephone
EP1554717B1 (en) Preprocessing of digital audio data for mobile audio codecs
US6424942B1 (en) Methods and arrangements in a telecommunications system
US7386327B2 (en) Apparatus and method for controlling noise in a mobile communication terminal
JP2005253097A (en) Speech signal transmitting and receiving apparatus
JPH08130513A (en) Voice coding and decoding system
EP3682446B1 (en) Temporal offset estimation
JPH07240782A (en) Handset
JPH11338499A (en) Noise canceller
JPH098891A (en) Radio telephone set
WO2003103253A1 (en) Transmitter-receiver
JPH0950298A (en) Voice coding device and voice decoding device
JP3896654B2 (en) Audio signal section detection method and apparatus
JP2002006898A (en) Method and device for noise reduction
JPH0946268A (en) Digital sound communication equipment
JP3936370B2 (en) Speech decoding apparatus and method
JPH0713593A (en) Speech processing system
JPH07115403A (en) Circuit for encoding and decoding silent section information
JP3817562B2 (en) Speech decoding apparatus and method

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20010508