JPH10105198A - Speech encoding device - Google Patents

Speech encoding device

Info

Publication number
JPH10105198A
JPH10105198A JP8261094A JP26109496A JPH10105198A JP H10105198 A JPH10105198 A JP H10105198A JP 8261094 A JP8261094 A JP 8261094A JP 26109496 A JP26109496 A JP 26109496A JP H10105198 A JPH10105198 A JP H10105198A
Authority
JP
Japan
Prior art keywords
level
input
speech
value
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8261094A
Other languages
Japanese (ja)
Inventor
Hisami Kanbayashi
久美 神林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP8261094A priority Critical patent/JPH10105198A/en
Publication of JPH10105198A publication Critical patent/JPH10105198A/en
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide the speech encoding device which can perform efficient input speech level control making good use of existent software and hardware resources for a high-compressibility speech encoding process. SOLUTION: An input speech control means 21 performs a block flooding process for a digital speech signal inputted from a digital speech signal input device 1 to calculate scheduling bits, which are stored in a shift register 25. After quantization, encoding is carried out. A level detection part 26 detects whether or not a frame having a maximum frame energy code calculated by a frame energy quantizing means 22 is inputted successively more than a specific number of times on the basis of control information stored in a control information storage part 27. When the level detection part detects the successive high- level input state, the shift register 25 subtracts '1' from the value of the stored scaling bits.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は音声符号化装置に関
し、特に入力レベル調整機能を有する音声符号化装置に
関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech coding apparatus, and more particularly to a speech coding apparatus having an input level adjusting function.

【0002】[0002]

【従来の技術】従来、この種の音声符号化装置において
は、符号化処理の前段階で専用ハードウェアを追加する
ことで、音声符号化のアルゴリズムとは関係なく、入力
音声のレベル調整を実現している。
2. Description of the Related Art Conventionally, in this type of speech coding apparatus, level adjustment of input speech has been realized by adding dedicated hardware before the encoding process, regardless of the speech coding algorithm. doing.

【0003】入力音声のレベル調整としては、図9に示
すように、アナログ/デジタル変換の際に、レベル調整
のためのしきい値を所定の値に調整することができるよ
うにした音声信号用のレベル調整システムがある。この
レベル調整システムはアナログ音声信号入力手段7と、
入力音声信号レベル調整装置8と、ディジタル音声信号
出力手段9とを備えている。
As shown in FIG. 9, for adjusting the level of an input audio signal, a threshold value for adjusting an audio signal is adjusted to a predetermined value at the time of analog / digital conversion. There is a level adjustment system. This level adjustment system comprises an analog audio signal input means 7;
An input audio signal level adjusting device 8 and digital audio signal output means 9 are provided.

【0004】入力音声信号レベル調整装置8は入力信号
を調整する可変利得増幅器81と、可変利得増幅器81
への制御電圧を発生する応答・減衰タイミング発生器8
2と、応答・減衰タイミング発生器82のトリガ出力を
発生するピーク値検出比較器83と、ピーク値検出比較
器83のしきい値を超える信号の持続時間を測定するし
きい値復帰タイマ84と、入力信号に対する電力利得を
増幅する駆動増幅器85とを備えている。
The input audio signal level adjusting device 8 includes a variable gain amplifier 81 for adjusting an input signal, and a variable gain amplifier 81.
And decay timing generator 8 for generating control voltage to
2, a peak value detection comparator 83 for generating a trigger output of the response / decay timing generator 82, and a threshold value recovery timer 84 for measuring the duration of a signal exceeding the threshold value of the peak value detection comparator 83. And a drive amplifier 85 for amplifying the power gain with respect to the input signal.

【0005】上記のレベル調整システムにおいて、ピー
ク値検出比較器83はしきい値復帰タイマ84によっ
て、最初は高しきい値状態に設定される。信号レベルと
入力信号のピーク値とが増大すると、ピーク値検出比較
器83は応答・減衰タイミング発生器82に対してトリ
ガパルスを出力し始める。
In the above level adjustment system, the peak value detection comparator 83 is initially set to the high threshold state by the threshold value recovery timer 84. When the signal level and the peak value of the input signal increase, the peak value detection comparator 83 starts outputting a trigger pulse to the response / decay timing generator 82.

【0006】同時に、しきい値復帰タイマ84はピーク
値検出比較器83のしきい値を超える信号の持続時間の
測定を始め、予め選択されている時間にわたって増力さ
れた出力のレベルがピーク値検出比較器83のしきい値
を超えたことをしきい値復帰タイマ84が検出すると、
ピーク値検出比較器83の圧縮しきい値は低レベルに切
替えられる。
At the same time, the threshold recovery timer 84 begins measuring the duration of the signal exceeding the threshold of the peak value detection comparator 83, and the level of the output, which has been boosted over a preselected period of time, is used to detect the peak value. When the threshold value recovery timer 84 detects that the threshold value of the comparator 83 has been exceeded,
The compression threshold value of the peak value detection comparator 83 is switched to a low level.

【0007】ピーク値検出比較器83のしきい値は連続
信号がなくなるまで低レベルにとどまる。この時点で回
路は正常動作状態に復帰する。この技術については、特
開平2−278945号公報に開示されている。
[0007] The threshold value of the peak value detection comparator 83 remains at a low level until there is no continuous signal. At this point, the circuit returns to a normal operating state. This technique is disclosed in JP-A-2-278945.

【0008】上記のレベル調整システムを高圧縮率音声
符号化装置に反映させた例を図10に示す。図10にお
いて、高圧縮率音声符号化装置はアナログ音声信号入力
手段11と、上記のレベ調整システムに相当する入力音
声信号レベル調整装置8と、ディジタル音声信号入力手
段12と、音声符号化装置13と、ディジタル符号化音
声信号出力手段14とを備えている。
FIG. 10 shows an example in which the above-described level adjustment system is applied to a high-compression-rate speech coding apparatus. In FIG. 10, a high-compression-rate audio encoding device includes an analog audio signal input unit 11, an input audio signal level adjusting device 8 corresponding to the above-described level adjustment system, a digital audio signal input unit 12, and an audio encoding device 13. And digitally encoded audio signal output means 14.

【0009】アナログ音声信号入力手段11によって入
力されたアナログ音声信号は入力音声信号レベル調整装
置8によって入力レベルが調整された後、ディジタル音
声信号入力手段12から音声符号化装置13に入力され
る。このアナログ音声信号は音声符号化装置13にて任
意の高圧縮率音声符号化処理が施された後、ディジタル
符号化音声信号出力手段14から出力される。
The analog audio signal input by the analog audio signal input means 11 is input to the audio encoding device 13 from the digital audio signal input means 12 after the input level is adjusted by the input audio signal level adjusting device 8. This analog audio signal is subjected to arbitrary high compression rate audio encoding processing in the audio encoding device 13 and then output from the digitally encoded audio signal output means 14.

【0010】また、他の入力音声のレベル調整として
は、図11に示すように、ディジタル音声信号を所定の
レベルに調整して出力するための入力音声レベル調整制
御方式がある。この入力音声レベル調整制御方式による
システムの構成はディジタル音声信号入力手段15と、
入力音声信号レベル調整装置16と、ディジタル音声信
号出力手段17とを備えている。
As another level adjustment of input audio, there is an input audio level adjustment control method for adjusting a digital audio signal to a predetermined level and outputting the same as shown in FIG. The system configuration based on the input audio level adjustment control system includes a digital audio signal input unit 15 and
An input audio signal level adjusting device 16 and digital audio signal output means 17 are provided.

【0011】入力音声信号レベル調整装置16はディジ
タル音声信号のレベルを増幅する増幅回路161と、デ
ィジタル音声信号の平均レベルを検出するレベル検出回
路162と、この増幅回路161の利得を設定する利得
設定部164と、ディジタル音声信号の平均レベルとい
き値設定レジスタ165に設定されたいき値とを比較す
る比較回路163とを備える。
The input audio signal level adjusting device 16 includes an amplifier circuit 161 for amplifying the level of the digital audio signal, a level detection circuit 162 for detecting the average level of the digital audio signal, and a gain setting for setting the gain of the amplifier circuit 161. And a comparator 163 for comparing the average level of the digital audio signal with the threshold set in the threshold setting register 165.

【0012】このシステムにおいて、利得設定部164
は比較回路163による比較結果に基づいて利得を設定
し、所定のレベルとなるようにディジタル音声信号を増
幅回路161によって増幅する。
In this system, the gain setting section 164
Sets the gain based on the comparison result by the comparison circuit 163, and amplifies the digital audio signal by the amplification circuit 161 so as to have a predetermined level.

【0013】また、増幅回路161から出力されるディ
ジタル音声信号の平均レベルをレベル検出回路162に
よって検出し、かついき値設定レジスタ165に設定す
るいき値を順次更新する。
The average level of the digital audio signal output from the amplification circuit 161 is detected by the level detection circuit 162, and the threshold set in the threshold setting register 165 is sequentially updated.

【0014】その値と平均レベル検出回路162による
平均レベルとを比較回路163で比較し、平均レベルが
いき値を超える回数の大小判定によって増幅回路161
の利得を設定する。
The value and the average level detected by the average level detection circuit 162 are compared by a comparison circuit 163, and the amplification circuit 161 is determined based on the number of times the average level exceeds the threshold.
Set the gain of

【0015】また、増幅回路161から出力されるディ
ジタル音声信号の平均レベルをレベル検出回路162に
よって検出し、かついき値設定レジスタ165に設定す
るいき値を固定し、その値と平均レベル検出回路162
による平均レベルとを比較回路163で比較し、平均レ
ベルがいき値を超える回数が所定数となるように、増幅
回路161の利得を設定する。この技術については、特
開平4−127758号公報に開示されている。
The average level of the digital audio signal output from the amplifying circuit 161 is detected by a level detecting circuit 162, and a threshold value set in a threshold value setting register 165 is fixed.
The comparison circuit 163 compares the average level with the average level according to the above, and sets the gain of the amplification circuit 161 so that the number of times the average level exceeds the threshold value becomes a predetermined number. This technique is disclosed in Japanese Patent Application Laid-Open No. 4-127758.

【0016】上記のシステムを高圧縮率音声符号化装置
に反映させた例を図12に示す。図12において、高圧
縮率音声符号化装置はディジタル音声信号入力手段18
と、上記のシステムに相当する入力音声信号レベル調整
装置16と、音声符号化装置19と、ディジタル符号化
音声信号出力手段20とを備えている。
FIG. 12 shows an example in which the above system is applied to a high-compression-rate speech coding apparatus. In FIG. 12, a high-compression-ratio speech coding apparatus includes digital speech signal input means 18.
And an input audio signal level adjusting device 16 corresponding to the above system, an audio encoding device 19, and digitally encoded audio signal output means 20.

【0017】ディジタル音声信号入力手段18から入力
されたディジタル音声信号は入力音声信号レベル調整装
置16によって入力レベルが調整された後、音声符号化
装置19に入力される。ディジタル音声信号は音声符号
化装置19において任意の高圧縮率音声符号化処理を施
された後、ディジタル符号化音声信号出力手段20から
出力される。
The digital audio signal input from the digital audio signal input means 18 is input to the audio encoding device 19 after the input level is adjusted by the input audio signal level adjusting device 16. The digital audio signal is subjected to an arbitrary high compression rate audio encoding process in the audio encoding device 19, and then output from the digital encoded audio signal output means 20.

【0018】[0018]

【発明が解決しようとする課題】ディジタル携帯電話等
のように高圧縮率音声符号化を行う音声符号化装置にと
っては装置の小型化・低消費電力化と同時に、符号化理
論にマッチした符号化音声品質の向上が重要な課題であ
る。特に、高圧縮率音声符号化においては、入力音声の
レベルが符号化の限度を超えて高い場合、符号化音声の
品質が著しく劣化する。
SUMMARY OF THE INVENTION For a speech coding apparatus such as a digital cellular phone which performs speech coding at a high compression rate, the coding is matched with the coding theory while the size and power consumption of the apparatus are reduced. Improving voice quality is an important issue. In particular, in high-compression-rate audio coding, if the level of the input audio is higher than the limit of the encoding, the quality of the encoded audio is significantly deteriorated.

【0019】しかしながら、上述した従来の技術では、
入力音声のレベル調整方法において音声符号化処理プロ
グラムの処理内容を利用していないので、音声符号化方
法にマッチした方法で符号化音声の品質向上を図ること
はできない。
However, in the above-mentioned conventional technology,
Since the processing content of the audio encoding processing program is not used in the input audio level adjustment method, the quality of the encoded audio cannot be improved by a method that matches the audio encoding method.

【0020】また、上述した従来の技術では、入力音声
のレベル調整方法において音声符号化装置に入力制御処
理用のハードウェアを新たに追加して実現する構成とな
っているので、装置の小型化及び低消費電力化を図るこ
とができない。
Further, in the above-mentioned conventional technique, the input audio level adjusting method is configured to newly realize hardware for input control processing in the audio encoding apparatus, so that the apparatus can be downsized. In addition, power consumption cannot be reduced.

【0021】そこで、本発明の目的は上記の問題点を解
消し、高圧縮率音声符号化処理として既存のソフトウェ
ア及びハードウェア資源を利用した効率的な入力音声レ
ベル制御を行うことができる音声符号化装置を提供する
ことにある。
Therefore, an object of the present invention is to solve the above-mentioned problems and to provide a speech codec capable of performing efficient input speech level control using existing software and hardware resources as speech processing at a high compression rate. To provide a chemical conversion device.

【0022】[0022]

【課題を解決するための手段】本発明による音声符号化
装置は、入力音声データを高圧縮率音声符号化処理によ
って符号化する音声符号化装置であって、前記高圧縮率
音声符号化処理中に算出されかつ前記入力音声データの
分析フレーム単位の電力パワーを示すフレームエネルギ
コードを監視する監視手段と、前記監視手段の監視結果
を基に前記高圧縮率音声符号化処理において前記入力音
声データのレベル制御を行う手段とを備えている。
According to the present invention, there is provided an audio encoding apparatus for encoding input audio data by high-compression-rate audio encoding processing. Monitoring means for monitoring a frame energy code which is calculated and indicates the power of the input audio data in analysis frame units; and a high compression rate audio encoding process based on the monitoring result of the monitoring means. Means for performing level control.

【0023】上記の如く、本発明の音声符号化装置では
既存の音声符号化処理プログラム中で算出されるパラメ
ータを利用し、ソフトウェアによって入力音声レベル制
御を実現している。より具体的には、音声符号化処理プ
ログラム中でフレームエネルギを計算して量子化するフ
レームエネルギ量子化手段の算出結果であるフレームエ
ネルギコード(以下、R0コードとする)をレベル調整
手段で監視し、その監視結果に基づいて入力音声スケー
リングビット値を増減したり、入力音声データをシフト
することで入力音声データのレベル制御を行っている。
As described above, in the speech coding apparatus of the present invention, the input speech level control is realized by software using the parameters calculated in the existing speech coding processing program. More specifically, a frame energy code (hereinafter, referred to as an R0 code), which is a calculation result of a frame energy quantizing unit that calculates and quantizes frame energy in a speech encoding processing program, is monitored by a level adjusting unit. The level of the input audio data is controlled by increasing or decreasing the input audio scaling bit value or shifting the input audio data based on the monitoring result.

【0024】また、入力音声レベル制御を、既存の音声
符号化処理プログラム及びハードウェアを利用して実現
する。より具体的には、フレームエネルギ量子化手段の
算出結果であるR0コードをレベル調整手段で監視し、
その監視結果に基づいて入力音声データの次データに対
してアナログレベルでのレベル調整を行うことで入力音
声データのレベル制御を行っている。
The input audio level control is realized by using an existing audio coding processing program and hardware. More specifically, the R0 code, which is the calculation result of the frame energy quantization means, is monitored by the level adjustment means,
Based on the monitoring result, the level control of the input audio data is performed by adjusting the level of the next data of the input audio data at the analog level.

【0025】レベル調整手段では高圧縮率音声符号化処
理プログラム中で生成されるR0コードの最大値の連続
状態を監視しており、音声の連続的な高レベル入力状態
を示す指標としてR0コードの最大値が連続する時、レ
ベル調整手段が高圧縮率音声符号化処理プログラム内部
または音声入力手段であるハードウェアへの外部コマン
ド発行の形でレベル調整を行う。これによって、既存の
ソフトウェアプログラムを利用した効率的な入力音声レ
ベル制御を行うことが可能となる。
The level adjusting means monitors the continuous state of the maximum value of the R0 code generated in the high-compression-rate audio encoding processing program, and uses the R0 code as an index indicating the continuous high-level input state of the audio. When the maximum value is continuous, the level adjusting means adjusts the level in the form of an external command issued to the high-compression-rate audio encoding processing program or to hardware as audio input means. This makes it possible to perform efficient input audio level control using an existing software program.

【0026】[0026]

【発明の実施の形態】次に、本発明の実施例について図
面を参照して説明する。図1は本発明の一実施例の構成
を示すブロック図である。図において、本発明の一実施
例によるレベル調整システムはディジタル音声信号入力
手段1と、VSELP(VectorSum Exci
ted Linear Prediction)等の高
圧縮率音声符号化を実現する音声符号化装置2と、伝送
路誤り符号化手段(図示せず)への入力となるディジタ
ル符号化音声信号出力手段3とを含んで構成されてい
る。
Next, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing the configuration of one embodiment of the present invention. In the figure, a level adjustment system according to an embodiment of the present invention includes a digital audio signal input means 1 and a VSELP (Vector Sum Exci).
and a digital coded voice signal output means 3 which is an input to a transmission path error coding means (not shown), which realizes a high compression rate voice coding such as ted Linear Prediction. It is configured.

【0027】音声符号化装置2は入力音声制御手段21
と、フレームエネルギ量子化手段22と、線形予測分析
・ピッチ抽出・音源コードブック探索・ゲイン量子化等
の処理を行う音声処理手段23と、コードマルチプレク
サ24と、シフトレジスタ25と、レベル検出部26
と、制御情報記憶部27とを備えている。
The speech encoding device 2 has input speech control means 21
, A frame energy quantization means 22, a speech processing means 23 for performing processes such as linear prediction analysis, pitch extraction, sound source codebook search, and gain quantization, a code multiplexer 24, a shift register 25, and a level detection section 26.
And a control information storage unit 27.

【0028】入力音声制御手段21はディジタル音声信
号入力装置1から入力されたディジタル音声信号に対し
てブロックフローディング処理を行い、音声処理の単位
である1フレーム(=160サンプル)のデータ毎のス
ケーリング(正規化)ビットを算出する。
The input voice control means 21 performs block loading processing on the digital voice signal input from the digital voice signal input device 1, and performs scaling for each data of one frame (= 160 samples) as a unit of voice processing. Calculate (normalized) bits.

【0029】ここで、ブロックフローディング処理とは
データメモリや乗算器の入力データのビット幅以上のビ
ット精度を持ち、例えば音声信号に代表されるような互
いにダイナミックレンジが相関を持ってまとまった数値
データ群に対して共通のスケール値(ブロックスケール
値)で正規化し、メモリに退避したりあるいは乗算器の
入力に使用する際に数値データの演算精度を保つ処理を
いう。
Here, the block loading processing is a numerical value having a bit precision equal to or greater than the bit width of input data of a data memory or a multiplier and having a dynamic range correlated with each other as represented by, for example, an audio signal. This is a process of normalizing a data group by a common scale value (block scale value) and keeping the calculation accuracy of numerical data when saving the data in a memory or using it for an input of a multiplier.

【0030】入力音声制御手段21は算出したスケーリ
ングビットをシフトレジスタ25に格納する。シフトレ
ジスタ25に格納されたスケーリングビットはフレーム
エネルギ量子化手段22及び音声処理手段23において
利用される。
The input voice control means 21 stores the calculated scaling bits in the shift register 25. The scaling bits stored in the shift register 25 are used in the frame energy quantization means 22 and the audio processing means 23.

【0031】フレームエネルギ量子化手段22は入力音
声データのフレーム毎の電力パワー(=フレームエネル
ギ)を計算し、量子化した後に符号化する。すなわち、
エネルギ値R(0)は、 R(0)={[φ(0,0)+φ(NP ,NP )]/2
(NA −NP )} という式から求められる。ここで、φ(j,k)は共分
散(自己相関)行列を示しており、NA はサンプル数
を、NP は予測の次数を夫々示している。
The frame energy quantization means 22 calculates the power (= frame energy) of the input voice data for each frame, and quantizes and then encodes. That is,
The energy value R (0) is given by: R (0) = {[φ (0,0) + φ (NP, NP)] / 2
(NA-NP)}. Here, φ (j, k) indicates a covariance (autocorrelation) matrix, NA indicates the number of samples, and NP indicates the order of prediction.

【0032】フレームエネルギ量子化手段22では上記
の式によって求められたエネルギ値R(0)をフルスケ
ールRmaxを基準として次式のように変換する(フル
スケールRmaxは最大サンプル振幅の二乗と定義す
る)。すなわち、 RdB=10log10[R(0)/Rmax という式でRdBを算出し、このRdBを32レベルに量子
化してフレームエネルギコード(以下、R0コードとす
る)を得る。
The frame energy quantizing means 22 converts the energy value R (0) obtained by the above equation into the following equation based on the full scale Rmax (the full scale Rmax is defined as the square of the maximum sample amplitude). ). That is, RdB is calculated by the following equation: RdB = 10 log 10 [R (0) / Rmax], and this RdB is quantized to 32 levels to obtain a frame energy code (hereinafter referred to as an R0 code).

【0033】尚、上記のフレームエネルギ量子化手段2
2によるフレームエネルギの算出動作は「デジタル方式
自動車電話システム標準規格 RCR STD−27D
第1分冊」(財団法人 電波システム開発センター
刊、平成7年6月27日改訂、p.594〜604)に
詳述されている。
The above frame energy quantization means 2
2 for calculating the frame energy is described in “Digital Car Phone System Standard RCR STD-27D
1st Volume "(published by the Radio System Development Center, revised on June 27, 1995, pp. 594 to 604).

【0034】音声処理手段23はVSELP等の高圧縮
率音声符号化の音声処理の中心である線形予測分析、ピ
ッチ抽出、音源コードブック探索、ゲイン量子化の一連
の処理を行う。
The voice processing means 23 performs a series of processes such as linear prediction analysis, pitch extraction, sound source codebook search, and gain quantization, which are the core of voice processing of high compression rate voice coding such as VSELP.

【0035】コードマルチプレクサ24はフレームエネ
ルギ量子化手段22及び音声処理手段23各々の出力で
ある符号を統合し、誤り訂正処理等の入力データとなる
符号化音声データを形成する。
The code multiplexer 24 integrates the codes output from the frame energy quantizing means 22 and the sound processing means 23 to form coded sound data as input data for error correction processing and the like.

【0036】シフトレジスタ25は入力音声制御手段2
1で算出されたスケーリングビットを格納する。また、
シフトレジスタ25はレべル検出部26において連続す
る高レベル入力を検出した場合、格納しているスケーリ
ングビットの値から「1」を減ずる。フレームエネルギ
量子化手段22及び音声処理手段23ではこの再格納し
たスケーリングビット値を演算に使用する。
The shift register 25 is provided for the input voice control means 2
The scaling bit calculated in step 1 is stored. Also,
When the level detection unit 26 detects a continuous high level input, the shift register 25 subtracts “1” from the stored scaling bit value. The frame energy quantizing unit 22 and the audio processing unit 23 use the restored scaling bit value for calculation.

【0037】レベル検出部26はR0コードが最大値
(=31)であるようなフレームが所定の回数以上に連
続的に入力されていることを検出する。レベル検出部2
6が連続的な高レベル入力状態を検出した場合、シフト
レジスタ25は格納しているスケーリングビットの値か
ら「1」を減ずる。
The level detecting section 26 detects that a frame whose R0 code has the maximum value (= 31) is continuously input more than a predetermined number of times. Level detector 2
When 6 detects a continuous high level input state, the shift register 25 subtracts "1" from the stored scaling bit value.

【0038】制御情報記憶部27はレベル検出部26に
よる制御情報(レベル制御中/レベル非制御中)を記憶
する。これらの情報はレベル検出部26で検出された入
力レベルの変化がレベル制御を引き起こすものであるか
否かの判定に用いられる。
The control information storage section 27 stores control information (during level control / during level non-control) by the level detection section 26. These pieces of information are used to determine whether or not the change in the input level detected by the level detection section 26 causes level control.

【0039】図2は図1の音声符号化装置2の動作を示
すフローチャートである。これら図1及び図2を参照し
て、音声符号化装置2の動作について説明する。まず、
ディジタル音声信号入力手段1から与えられた入力信号
は入力音声制御手段21に供給される。
FIG. 2 is a flowchart showing the operation of the speech coding apparatus 2 of FIG. The operation of the speech encoding device 2 will be described with reference to FIGS. First,
The input signal given from the digital audio signal input means 1 is supplied to the input audio control means 21.

【0040】入力音声制御手段21はこの入力信号に対
してブロックフローティング処理(入力音声データ群を
まとめて正規化するスケーリングビットを算出するこ
と)を行い、算出したスケーリングビットをシフトレジ
スタ25に格納する(図2ステップS1)。
The input voice control means 21 performs block floating processing (calculation of scaling bits for collectively normalizing the input voice data group) on the input signal, and stores the calculated scaling bits in the shift register 25. (Step S1 in FIG. 2).

【0041】フレームエネルギ量子化手段22は入力音
声のフレームエネルギを算出し、量子化して0から31
までの32レベルのR0コードに符号化する(図2ステ
ップS2)。
The frame energy quantizing means 22 calculates the frame energy of the input voice, quantizes the frame energy from 0 to 31.
(Step S2 in FIG. 2).

【0042】レベル検出部26は制御情報記憶部27で
記憶している制御情報(制御状態フラグFlag)の値
を識別する(図2ステップS3)。すなわち、制御情報
記憶部27の制御情報は現在の状態がレベル制御中であ
る場合にFlag=1、レベル制御中でない場合にFl
ag=0となっている。尚、このFlagの初期値は0
とする。
The level detector 26 identifies the value of the control information (control state flag) stored in the control information storage 27 (step S3 in FIG. 2). That is, the control information in the control information storage unit 27 is Flag = 1 when the current state is under level control, and FL1 when the current state is not under level control.
ag = 0. The initial value of this Flag is 0.
And

【0043】レベル検出部26はFlagの値が1ある
いは0であっても、引き続いてR0コードの値が最大値
の31であるかどうかを判定する(図2ステップS4,
S10)。
The level detector 26 determines whether the value of the R0 code is the maximum value 31 even if the value of the flag is 1 or 0 (step S4 in FIG. 2).
S10).

【0044】レベル検出部26はステップS4において
R0コードの値が最大値の31に満たない場合、R0カ
ウンタの値をクリアする(図2ステップS5)。尚、R
0カウンタの初期値は0に設定されている。
When the value of the R0 code is less than the maximum value of 31 in step S4, the level detector 26 clears the value of the R0 counter (step S5 in FIG. 2). Note that R
The initial value of the 0 counter is set to 0.

【0045】また、レベル検出部26はステップS4に
おいてR0コードの値が最大値の31であった場合、R
0カウンタの値をインクリメントし(図2ステップS
6)、R0カウンタの値が所定値Xh以上になったかど
うかを判定する(図2ステップS7)。ここで、所定値
Xhは入力音声が定常的に高レベルであることを検出す
るためのR0コードのスレッショルド値である。
If the value of the R0 code is the maximum value of 31 in step S4,
The value of the 0 counter is incremented (step S in FIG. 2).
6) It is determined whether the value of the R0 counter is equal to or greater than a predetermined value Xh (step S7 in FIG. 2). Here, the predetermined value Xh is a threshold value of the R0 code for detecting that the input voice is constantly at a high level.

【0046】レベル検出部26はR0カウンタの値が所
定値Xh以上になると、Flagの値を1に設定し(図
2ステップS8)、レベル調整機能を作動させる。すな
わち、レベル検出部26はシフトレジスタ25に格納さ
れているスケーリングビットの値を1デクリメント(−
1)する(図2ステップS9)。デクリメントしてシフ
トレジスタ25に再格納されたスケーリングビットは音
声処理手段23において用いられるので、結果的に入力
音声レベルを抑制した音声処理が行われる。
When the value of the R0 counter exceeds a predetermined value Xh, the level detection unit 26 sets the value of Flag to 1 (step S8 in FIG. 2) and activates the level adjustment function. That is, the level detector 26 decrements the value of the scaling bit stored in the shift register 25 by 1 (−
1) Do (Step S9 in FIG. 2). Since the scaling bits that have been decremented and re-stored in the shift register 25 are used in the audio processing means 23, as a result, audio processing in which the input audio level is suppressed is performed.

【0047】高レベル入力が連続して制御状態フラグF
lagが1になった後、R0コードの値がさらに連続し
て31を示すと、レベル検出部26はR0カウンタの値
を所定値Xhに保ち(図2ステップS11)、レベル調
整を続行する(図2ステップS9)。
The control state flag F is continuously output at a high level.
After the lag becomes 1, if the value of the R0 code further continuously indicates 31, the level detector 26 keeps the value of the R0 counter at the predetermined value Xh (step S11 in FIG. 2) and continues the level adjustment (step S11 in FIG. 2). FIG. 2 step S9).

【0048】一方、レベル検出部26はステップS10
において制御状態フラグFlagが1の状態でR0コー
ドが最大値31未満になったことを検出すると、R0カ
ウンタの値を1デクリメントし(図2ステップS1
2)、所定値Xlと比較する(図2ステップS13)。
所定値XIは入力音声が定常的に低レベルであることを
検出するためのR0コードのスレッショルド値である。
On the other hand, the level detector 26 determines in step S10
When it is detected that the R0 code is less than the maximum value 31 while the control state flag Flag is 1, the value of the R0 counter is decremented by 1 (step S1 in FIG. 2).
2) Compare with a predetermined value Xl (step S13 in FIG. 2).
The predetermined value XI is a threshold value of the R0 code for detecting that the input voice is constantly at a low level.

【0049】レベル検出部26はR0カウンタの値が所
定値Xl以上である場合、そのままレべル調整を続行す
る(図2ステップS9)。また、レベル検出部26はス
テップS13において低レベル入力が連続し、R0カウ
ンタの値が所定値Xl未満になったことを検出すると、
Flagの値を0に設定してR0カウンタをクリアす
る。この状態になると、レベル検出部26はレベル調整
機能を停止させ、レベル調整を行わない。
When the value of the R0 counter is equal to or larger than the predetermined value X1, the level detector 26 continues the level adjustment (step S9 in FIG. 2). When the level detection unit 26 detects in step S13 that the low level input has continued and the value of the R0 counter has become less than the predetermined value Xl,
The value of Flag is set to 0, and the R0 counter is cleared. In this state, the level detection unit 26 stops the level adjustment function and does not perform the level adjustment.

【0050】上記のように、高圧縮率音声符号化処理の
中で算出されるR0コードを用いてレベル検出部26で
連続的な高レベル入力状態を判定し、その結果を同じく
音声符号化処理の中で用いられるスケーリングビットに
反映させることによって、既存のプログラムを利用した
効率的な入力音声レベル制御を行うことができる。ま
た、従来の入力制御処理用のハードウェアが不要となる
ので、装置の小型化及び低消費電力化を図ることができ
る。
As described above, the continuous high-level input state is determined by the level detection unit 26 using the R0 code calculated in the high-compression-rate audio encoding process, and the result is similarly used in the audio encoding process. By reflecting the result on the scaling bits used in the above, efficient input voice level control using an existing program can be performed. In addition, since conventional input control processing hardware is not required, the size and power consumption of the device can be reduced.

【0051】図3は本発明の一実施例によるレベル制御
の動作を説明するための図である。これら図1〜図3を
参照して、本発明の一実施例によるレベル制御の動作を
詳細に説明する。尚、所定値Xh,Xlはその値を任意
に設定することが可能となっている。
FIG. 3 is a diagram for explaining the level control operation according to one embodiment of the present invention. The operation of the level control according to the embodiment of the present invention will be described in detail with reference to FIGS. The predetermined values Xh and Xl can be set arbitrarily.

【0052】図3の(1)以前では入力音声フレームの
レベルがR0コードの31未満であり、このときの処理
は図2のステップS3→S4→S5というルートであ
る。続いて、図3の(1)においては、R0コードが最
大値の31であるようなフレームの連続的な入力が開始
される。この場合の処理は図2のステップS3→S4→
S6→S7というルートである。
Before (1) in FIG. 3, the level of the input voice frame is less than 31 of the R0 code, and the processing at this time is a route of steps S3 → S4 → S5 in FIG. Subsequently, in (1) of FIG. 3, continuous input of frames in which the R0 code is the maximum value of 31 is started. The process in this case is performed in steps S3 → S4 → FIG.
The route is S6 → S7.

【0053】図3の(2)はR0カウンタの値が所定値
Xhに達する前にR0コードが再び31未満になった状
態を示す。このときの処理は再び図2のステップS3→
S4→S5というルートに戻る。
FIG. 3 (2) shows a state in which the R0 code becomes less than 31 again before the value of the R0 counter reaches the predetermined value Xh. The process at this time is performed again in step S3 in FIG.
Return to the route of S4 → S5.

【0054】図3の(3)は連続的な高レベル入力によ
り、R0カウンタの値が所定値Xhに達したことを示
す。このときの処理は図2のステップS3→S4→S6
→S7→S8→S9というルートに進む。すなわち、F
lagを1に設定し、レベル制御機能として、シフトレ
ジスタ25に格納されている現フレームのスケーリング
ビットを1デクリメントする。この後はステップS3→
S10→S11→S9というルートで処理が続行され
る。
FIG. 3 (3) shows that the value of the R0 counter has reached the predetermined value Xh due to the continuous high level input. The processing at this time is performed in steps S3 → S4 → S6 in FIG.
Go to the route of → S7 → S8 → S9. That is, F
lag is set to 1 and the scaling bit of the current frame stored in the shift register 25 is decremented by 1 as a level control function. After this, step S3 →
The processing is continued along the route of S10 → S11 → S9.

【0055】図3の(4)は連続的な高レベル入力状態
において一時的にR0コードが31未満になった場合を
示す。このときの処理は図2のステップS10→S12
→S13→S9というルートで実行される。
FIG. 3D shows a case where the R0 code temporarily becomes less than 31 in a continuous high level input state. The process at this time is performed in steps S10 → S12 in FIG.
It is executed in the route of → S13 → S9.

【0056】図3の(5)はR0カウンタの値が所定値
Xlに達する前にR0コードが再び31になった状態を
示す。このときの処理は再び図2のステップS3→S1
0→S11→S9というルートに戻る。
FIG. 3 (5) shows a state in which the R0 code becomes 31 again before the value of the R0 counter reaches the predetermined value X1. The process at this time is performed again in step S3 → S1 in FIG.
Return to the route of 0 → S11 → S9.

【0057】図3の(6)は連続的な低レベル入力によ
り、R0カウンタの値が所定値Xlに達したことを示
す。このときの処理は図2のステップS3→S10→S
12→S13→S14→S15というルートに進む。す
なわち、Flagを0に設定し、レベル制御機能を行わ
ない。この後、ステップS3→S4→S5というルート
で処理が続行される。
FIG. 3 (6) shows that the value of the R0 counter has reached the predetermined value Xl due to the continuous low level input. The process at this time is performed in steps S3 → S10 → S in FIG.
It goes to the route of 12 → S13 → S14 → S15. That is, Flag is set to 0, and the level control function is not performed. Thereafter, the processing is continued along the route of steps S3 → S4 → S5.

【0058】図4は本発明の他の実施例の構成を示すブ
ロック図である。図において、本発明の他の実施例によ
るレベル調整システムはディジタル音声信号入力手段1
と、音声符号化装置4と、ディジタル符号化音声信号出
力手段3とを含んで構成されている。
FIG. 4 is a block diagram showing the configuration of another embodiment of the present invention. In the figure, a level adjustment system according to another embodiment of the present invention is a digital audio signal input means 1.
, A voice coding device 4 and a digitally coded voice signal output means 3.

【0059】音声符号化装置4は入力音声制御手段41
と、フレームエネルギ量子化手段42と、音声処理手段
43と、コードマルチプレクサ44と、シフトレジスタ
45と、レベル検出部46と、制御情報記憶部47とを
備えている。
The speech encoding device 4 is provided with an input speech control means 41.
, A frame energy quantizing unit 42, an audio processing unit 43, a code multiplexer 44, a shift register 45, a level detecting unit 46, and a control information storage unit 47.

【0060】上記の構成において、音声符号化装置4で
はレベル検出部46が入力音声制御手段41を直接制御
する以外は、上記の図1に示す音声符号化装置2と同様
の構成となっており、その動作も同様である。
In the above configuration, the speech encoding apparatus 4 has the same configuration as that of the speech encoding apparatus 2 shown in FIG. 1 except that the level detection unit 46 directly controls the input speech control means 41. The operation is the same.

【0061】レベル検出部46はR0コードが最大値
(=31)であるようなフレームが所定の回数以上に連
続的に入力されていることを検出する。レベル検出部4
6は連続的な高レベル入力状態を検出した場合、入力音
声制御手段41において分析フレームの次のフレームの
入力データ群を左に1ビットシフトすることによってレ
ベル調整を行う。
The level detecting section 46 detects that a frame in which the R0 code has the maximum value (= 31) is continuously input more than a predetermined number of times. Level detector 4
When a continuous high-level input state is detected, the input voice control means 41 performs level adjustment by shifting the input data group of the frame next to the analysis frame by one bit to the left.

【0062】図5は図4の音声符号化装置4の動作を示
すフローチャートである。これら図4及び図5を参照し
て、音声符号化装置4の動作について説明する。尚、図
5においてステップS21〜S24及びS38,S39
で示されるディジタル音声信号入力手段1、音声符号化
装置4、ディジタル符号化音声信号出力手段3各々にお
ける動作は、図1に示すディジタル音声信号入力手段
1、音声符号化装置2、ディジタル符号化音声信号出力
手段3各々における動作(図2のステップS1〜S4及
びS16,S17で示される動作)と同一であるので、
その説明は省略する。
FIG. 5 is a flowchart showing the operation of the speech coding apparatus 4 of FIG. The operation of the speech encoding device 4 will be described with reference to FIGS. In FIG. 5, steps S21 to S24 and S38 and S39 are performed.
The operation of each of the digital voice signal input means 1, voice coder 4 and digital coded voice signal output means 3 shown in FIG. Since the operation in each of the signal output means 3 (the operation shown in steps S1 to S4 and S16 and S17 in FIG. 2) is the same,
The description is omitted.

【0063】レベル検出部46はステップS24におい
てR0コードが最大値の31に満たない場合、R0hカ
ウンタの値をクリアする(図5ステップS25)。尚、
R0hカウンタは高レベル入力のフレーム数をカウント
するためのカウンタであり、初期値は0とする。
When the R0 code is less than the maximum value of 31 in step S24, the level detector 46 clears the value of the R0h counter (step S25 in FIG. 5). still,
The R0h counter is a counter for counting the number of high-level input frames, and its initial value is 0.

【0064】レベル検出部46はステップS24におい
てR0コードの値が最大値の31であった場合、R0h
カウンタの値をインクリメント(+1)し(図5ステッ
プS26)、R0hカウンタの値が所定値Xh以上にな
ったかどうかを判定する(図5ステップS27)。所定
値Xhは入力音声が定常的に高レベルであることを検出
するためのR0コードのスレッショルド値である。
If the value of the R0 code is the maximum value of 31 in step S24, the level detector 46 sets
The value of the counter is incremented (+1) (step S26 in FIG. 5), and it is determined whether or not the value of the R0h counter is equal to or more than a predetermined value Xh (step S27 in FIG. 5). The predetermined value Xh is a threshold value of the R0 code for detecting that the input voice is constantly at a high level.

【0065】レベル検出部46はR0hカウンタの値が
所定値Xh以上になった場合、Flagの値を1に設定
し(図5ステップS28)、R0hカウンタの値をクリ
アする(図5ステップS29)。続いて、レベル検出部
46はステップS36においてFlagの値を判定する
ことによってレベル調整機能を作動する。
When the value of the R0h counter is equal to or more than the predetermined value Xh, the level detector 46 sets the value of Flag to 1 (step S28 in FIG. 5) and clears the value of the R0h counter (step S29 in FIG. 5). . Subsequently, the level detector 46 activates the level adjustment function by determining the value of Flag in step S36.

【0066】本発明の一実施例ではシフトレジスタ25
の値をデクリメントすることで、レベル調整を行ってい
る。これに対し、本発明の他の実施例では入力音声制御
手段41にレベル検出部46の判定結果をフィードバッ
クし、分析フレームの次のフレームの入力データ群を右
に1ビットシフトすることによってレベル調整を行って
いる(図5ステップS37)。
In one embodiment of the present invention, the shift register 25
The level is adjusted by decrementing the value of. On the other hand, in another embodiment of the present invention, the determination result of the level detection section 46 is fed back to the input voice control means 41, and the input data group of the frame next to the analysis frame is shifted by one bit to the right to adjust the level. (Step S37 in FIG. 5).

【0067】レベル検出部46は高レベル入力が連続し
て制御状態フラグFlagが1になった後、R0コード
の値が所定値R0 Lowであることを検出する(図5
ステップS30)。所定値R0 Lowは入力音声が低
レベルであることを認識するための任意のR0コードの
値である。
The level detector 46 detects that the value of the R0 code is a predetermined value R0 Low after the control state flag Flag is set to 1 after the high level input continues (FIG. 5).
Step S30). The predetermined value R0 Low is an arbitrary R0 code value for recognizing that the input voice is at a low level.

【0068】レベル検出部46は連続的な高レベル入力
状態(Flag=1)に続く低レベル入力により、R0
コード<R0 Lowであったとき(図5ステップS3
0)、R0lカウンタの値をインクリメントし(ステッ
プB12)、R0lカウンタの値が所定値Xl以上かど
うかを判定する(図5ステップS33)。所定値Xlは
入力音声信号が定常的に低レベルであることを検出する
ためのR0コードのスレッショルド値である。
The level detector 46 outputs R0 by a low level input following a continuous high level input state (Flag = 1).
When code <R0 Low (step S3 in FIG. 5)
0), the value of the R01 counter is incremented (step B12), and it is determined whether the value of the R01 counter is equal to or more than a predetermined value X1 (step S33 in FIG. 5). The predetermined value Xl is a threshold value of the R0 code for detecting that the input audio signal is constantly at a low level.

【0069】レベル検出部46はR0lカウンタの値が
所定値Xl以上である場合、Flagの値を0に設定し
(図5ステップS34)、R0lカウンタの値をクリア
する(図5ステップS35)。続いて、レベル検出部4
6はステップS36においてFlagの値を判定するこ
とによってレベル調整機能を停止する。
When the value of the R01 counter is equal to or larger than the predetermined value X1, the level detector 46 sets the value of the Flag to 0 (step S34 in FIG. 5) and clears the value of the R01 counter (step S35 in FIG. 5). Subsequently, the level detector 4
6 stops the level adjustment function by determining the value of Flag in step S36.

【0070】上述したように、本発明の他の実施例では
R0コードを用いるという本発明の一実施例の効果に加
え、シフトレジスタ45を介することなく入力音声デー
タに対して直接的にレベル調整を行うという構成上、既
存のプログラム構成をそのまま利用し、そのプログラム
構成に一部条件分岐のルーチンを加えるだけで、効率的
な入力音声レベル制御を行うことができる。
As described above, in another embodiment of the present invention, in addition to the effect of the embodiment of the present invention in which the R0 code is used, the level of the input audio data is directly adjusted without using the shift register 45. In this configuration, efficient input voice level control can be performed only by using an existing program configuration as it is and adding only a conditional branching routine to the program configuration.

【0071】図6は本発明の他の実施例によるレベル制
御の動作を説明するための図である。これら図4〜図6
を参照して、本発明の他の実施例によるレベル制御の動
作を詳細に説明する。図6においてはR0コード、制御
状態フラグFlag、R0hカウンタの値及びR0lカ
ウンタの値の時間推移の様子を示している。図5及び図
6中のR0 Low及び所定値Xh,Xlの値は、任意
に設定することが可能である。また、図6の(11)か
ら(16)のタイミングは図3に示す(1)から(6)
のタイミングに相当する。
FIG. 6 is a diagram for explaining an operation of level control according to another embodiment of the present invention. These FIGS. 4 to 6
The operation of the level control according to another embodiment of the present invention will be described in detail with reference to FIG. FIG. 6 shows how the R0 code, the control state flag Flag, the value of the R0h counter, and the value of the R01 counter change over time. The values of R0 Low and the predetermined values Xh and Xl in FIGS. 5 and 6 can be set arbitrarily. The timings (11) to (16) in FIG. 6 are shown in (1) to (6) in FIG.
Timing.

【0072】図6が図3と異なる点はレベル調整がどの
分析フレームに対して行われるかという点及び連続的な
高レベル入力状態における低レベル入力の検出方法の2
点である。その他の詳細な内容は本発明の一実施例と同
様であるので、その説明は省略する。
FIG. 6 is different from FIG. 3 in that the level adjustment is performed for which analysis frame and the method 2 for detecting the low level input in the continuous high level input state.
Is a point. The other details are the same as those of the embodiment of the present invention, and the description thereof is omitted.

【0073】まず、レベル調整の対象フレームについ
て、本発明の一実施例では図3の「レべル調整」を現フ
レームに対して行う。それに対し、本発明の他の実施例
では図6の「レベル調整」を次フレームに対して行って
いる(図5ステップS37)。
First, for a frame to be subjected to level adjustment, in one embodiment of the present invention, "level adjustment" in FIG. 3 is performed on the current frame. On the other hand, in another embodiment of the present invention, the “level adjustment” in FIG. 6 is performed for the next frame (step S37 in FIG. 5).

【0074】また、連続的高レベル入力状態における低
レベル入力の検出方法について、本発明の一実施例では
高レベル入力(R0コード=31)のフレーム数をカウ
ントするR0カウンタの値に対して状態を判定するため
の所定値Xh,Xlが設けられている。それに対し、本
発明の他の実施例では高レベル入力(R0コード=3
1)のフレーム数をカウントするR0hカウンタの値に
対して定常的状態を判別するための所定値Xhを設け、
また低レベル入力(R0コード=R0 Low)のフレ
ーム数をカウントするR0lカウンタの値に対して定常
的状態を判別するための所定値Xlを設けている。
In a method of detecting a low-level input in a continuous high-level input state, in one embodiment of the present invention, the state of the R0 counter for counting the number of frames of the high-level input (R0 code = 31) is determined according to the state. There are provided predetermined values Xh and Xl for judging. On the other hand, in another embodiment of the present invention, the high level input (R0 code = 3)
A predetermined value Xh for determining a steady state is provided for the value of the R0h counter for counting the number of frames in 1),
In addition, a predetermined value Xl for determining a steady state is provided for a value of an R01 counter for counting the number of frames of a low-level input (R0 code = R0 Low).

【0075】図7は本発明の別の実施例の構成を示すブ
ロック図である。図において、本発明の別の実施例によ
るレベル調整システムはディジタル音声信号入力手段5
と、音声符号化装置6と、ディジタル符号化音声信号出
力手段3とを含んで構成されている。
FIG. 7 is a block diagram showing the configuration of another embodiment of the present invention. In the figure, a level adjustment system according to another embodiment of the present invention includes digital audio signal input means 5.
, An audio encoding device 6 and digitally encoded audio signal output means 3.

【0076】音声符号化装置6は入力音声制御手段61
と、フレームエネルギ量子化手段62と、音声処理手段
63と、コードマルチプレクサ64と、シフトレジスタ
65と、レベル検出部66と、制御情報記憶部67とを
備えている。
The speech encoding device 6 includes an input speech control means 61
, A frame energy quantizing unit 62, an audio processing unit 63, a code multiplexer 64, a shift register 65, a level detecting unit 66, and a control information storing unit 67.

【0077】上記の構成において、音声符号化装置6で
はレベル検出部66がディジタル音声信号入力手段5を
直接制御する以外は、上記の図4に示す音声符号化装置
4と同様の構成となっており、その動作も同様である。
尚、本発明の別の実施例ではディジタル音声信号入力手
段5が外部コマンド制御等によるレベル調整手段(図示
せず)を備えているものとする。
In the above configuration, the configuration of the speech encoding apparatus 6 is the same as that of the speech encoding apparatus 4 shown in FIG. 4 except that the level detecting section 66 directly controls the digital speech signal input means 5. The operation is the same.
In another embodiment of the present invention, it is assumed that the digital audio signal input means 5 has a level adjusting means (not shown) by external command control or the like.

【0078】レベル検出部66はR0コードが最大値
(=31)であるようなフレームが所定の回数以上に連
続的に入力されているかどうかを判定する。レベル検出
部66は連続的な高レベル入力状態を検出した場合、デ
ィジタル音声信号入力手段5に含まれるレベル調整手段
を直接制御することによってレベル調整を行う。
The level detecting section 66 determines whether or not a frame in which the R0 code has the maximum value (= 31) is continuously input more than a predetermined number of times. When detecting a continuous high-level input state, the level detection unit 66 performs level adjustment by directly controlling the level adjustment unit included in the digital audio signal input unit 5.

【0079】図8は図7の音声符号化装置6の動作を示
すフローチャートである。これら図7及び図8を参照し
て、音声符号化装置6の動作について説明する。尚、図
8においてステップS57を除く部分で示されるディジ
タル音声信号入力手段5、音声符号化装置6、ディジタ
ル符号化音声信号出力手段3各々の動作は、本発明の他
の実施例のディジタル音声信号入力手段1、音声符号化
装置4、ディジタル符号化音声信号出力手段3各々の動
作と同一であるため、その説明は省略する。
FIG. 8 is a flowchart showing the operation of the speech encoding device 6 of FIG. The operation of the speech encoding device 6 will be described with reference to FIGS. The operations of the digital audio signal input means 5, the audio encoding device 6, and the digitally encoded audio signal output means 3 shown in FIG. 8 except for step S57 are the same as those of the digital audio signal of the other embodiment of the present invention. The operations are the same as those of the input means 1, the voice coding device 4, and the digitally coded voice signal output means 3, and the description thereof will be omitted.

【0080】本発明の一実施例では連続的な高レベル入
力を認識した場合、レベル調整機能としてシフトレジス
タ25の値を1デクリメントしている(図2ステップS
9)。また、本発明の他の実施例ではこのような場合、
入力音声制御手段41にその結果をフィードバックし、
分析フレームの次のフレームの入力データ群を右に1ビ
ットシフトすることによってレベル調整を行っている
(図5ステップS37)。
In the embodiment of the present invention, when a continuous high level input is recognized, the value of the shift register 25 is decremented by 1 as a level adjusting function (step S in FIG. 2).
9). Further, in another embodiment of the present invention, in such a case,
The result is fed back to the input voice control means 41,
The level adjustment is performed by shifting the input data group of the frame next to the analysis frame to the right by one bit (step S37 in FIG. 5).

【0081】これに対し、本発明の別の実施例ではディ
ジタル音声信号入力手段5の外部コマンドにその結果を
フィードバックし、分析フレームの次のフレームに対し
てアナログレベルでの入力音声レベル調整を行っている
(図8ステップS57)。
On the other hand, in another embodiment of the present invention, the result is fed back to an external command of the digital audio signal input means 5, and the input audio level is adjusted at the analog level for the next frame of the analysis frame. (Step S57 in FIG. 8).

【0082】上述したように、本発明の別の実施例では
R0コードを用いるという本発明の一実施例の効果に加
え、ディジタル音声信号入力手段5の外部コマンド制御
等によるレベル調整手段をR0コードと連携させて利用
することによって、ハードウェアの機能を有効的に活用
し、かつ既存のプログラム構成をそのまま用いて符号化
の性能を劣化させることなく、効率的な入力音声レベル
制御を行うことができる。
As described above, in another embodiment of the present invention, in addition to the effect of the embodiment of the present invention in which the R0 code is used, the level adjusting means by external command control or the like of the digital audio signal input means 5 is used. By using this function in conjunction with, it is possible to effectively utilize the hardware functions and to perform efficient input audio level control without deteriorating the coding performance using the existing program configuration as it is. it can.

【0083】この本発明の別の実施例によるレベル制御
の動作については、図6をそのまま使用して説明するこ
とができる。すなわち、本発明の別の実施例によるレベ
ル制御の動作についての詳細な内容は本発明の他の実施
例と同じであるので、その説明は省略する。
The operation of the level control according to another embodiment of the present invention can be described with reference to FIG. That is, the detailed contents of the operation of the level control according to another embodiment of the present invention are the same as those of the other embodiments of the present invention, and the description thereof will be omitted.

【0084】本発明の一実施例では図3の「レベル調
整」を現フレームに対して行っている。これに対して、
本発明の別の実施例では図6の「レベル調整」を次フレ
ームに対して行っている(図8ステップS57)。その
際、レベル調整の方法はディジタル音声信号入力手段5
の外部コマンド入力によるレベル調整の機能及び構成に
依存する。
In one embodiment of the present invention, "level adjustment" in FIG. 3 is performed on the current frame. On the contrary,
In another embodiment of the present invention, "level adjustment" in FIG. 6 is performed on the next frame (step S57 in FIG. 8). At this time, the level adjustment method is the digital audio signal input means 5.
Depends on the function and configuration of level adjustment by input of an external command.

【0085】このように、ソフトウェアプログラムで実
行される高圧縮率音声符号化処理の中で算出されるR0
コードを入力レベル制御用のパラメータとして用い、R
0 コードを監視することで連続的な高レベル入力状態を
判定し、その結果を同じく音声符号化処理の中で用いら
れるスケーリングビットに反映させることによって、入
力レベルを監視するための手段を音声符号化装置の外部
に別途設けることなく、既存のソフトウェアプログラム
を利用した効率的な入力音声レベル制御を行うことがで
きる。よって、従来の入力制御処理用のハードウェアが
不要となるので、装置の小型化及び低消費電力化を図る
ことができる。
As described above, R0 calculated in the high-compression-rate speech encoding process executed by the software program
Using the code as a parameter for input level control,
By monitoring the 0 code, a continuous high-level input state is determined, and the result is reflected in the scaling bits used in the voice coding process, thereby providing a means for monitoring the input level to the voice code. It is possible to perform efficient input sound level control using an existing software program without separately providing the same outside the coding device. This eliminates the need for conventional hardware for input control processing, thereby reducing the size and power consumption of the device.

【0086】また、R0 コードを監視することで連続的
な高レベル入力状態を判定し、その結果に基づいて、シ
フトレジスタ45を介することなく、入力音声データに
対して直接的にレベル調整を行うという構成をとること
によって、スケーリングビット算出を含む既存のプログ
ラム構成に、条件分岐のルーチンを追加することで効率
的な入力音声レベル制御を行うことができる。
Also, by monitoring the R0 code, a continuous high level input state is determined, and based on the result, the level is directly adjusted for the input audio data without passing through the shift register 45. With this configuration, it is possible to perform efficient input voice level control by adding a conditional branch routine to an existing program configuration including scaling bit calculation.

【0087】さらに、R0 コードを監視することで連続
的な高レベル入力状態を判定し、その結果に基づいて、
ディジタル音声信号入力手段5の外部コマンド制御等に
よるレベル調整手段をR0 コードと連携させて利用する
ことによって、ハードウェアの機能を有効的に活用し、
かつ既存のプログラム構成をそのまま用いて、符号化の
性能を劣化させることなく効率的な入力音声レベル制御
を行うことができる。
Further, a continuous high-level input state is determined by monitoring the R0 code, and based on the result,
By using the level adjustment means by external command control or the like of the digital audio signal input means 5 in cooperation with the R0 code, the hardware functions can be effectively utilized,
In addition, it is possible to perform efficient input audio level control without deteriorating the encoding performance using the existing program configuration as it is.

【0088】[0088]

【発明の効果】以上説明したように本発明によれば、入
力音声データを高圧縮率音声符号化処理によって符号化
する音声符号化装置において、高圧縮率音声符号化処理
中に算出されかつ入力音声データの分析フレーム単位の
電力パワーを示すフレームエネルギコードを監視し、そ
の監視結果を基に高圧縮率音声符号化処理において入力
音声データのレベル制御を行うことによって、高圧縮率
音声符号化処理として既存のソフトウェア及びハードウ
ェア資源を利用した効率的な入力音声レベル制御を行う
ことができるという効果がある。
As described above, according to the present invention, in a speech encoding apparatus for encoding input speech data by high-compression-rate speech encoding processing, the speech data is calculated during the high-compression-rate speech encoding processing and input. Analysis of audio data The frame energy code indicating the power of each frame is monitored, and based on the monitoring result, the level control of the input audio data is performed in the high-compression-rate audio encoding processing, whereby the high-compression-rate audio encoding processing is performed. As a result, there is an effect that efficient input voice level control can be performed using existing software and hardware resources.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例の構成を示すブロック図であ
る。
FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention.

【図2】図1の音声符号化装置の動作を示すフローチャ
ートである。
FIG. 2 is a flowchart illustrating an operation of the speech encoding device in FIG. 1;

【図3】本発明の一実施例によるレベル制御の動作を説
明するための図である。
FIG. 3 is a diagram for explaining an operation of level control according to one embodiment of the present invention.

【図4】本発明の他の実施例の構成を示すブロック図で
ある。
FIG. 4 is a block diagram showing a configuration of another embodiment of the present invention.

【図5】図4の音声符号化装置の動作を示すフローチャ
ートである。
FIG. 5 is a flowchart showing an operation of the speech encoding device in FIG. 4;

【図6】本発明の他の実施例によるレベル制御の動作を
説明するための図である。
FIG. 6 is a diagram for explaining an operation of level control according to another embodiment of the present invention.

【図7】本発明の別の実施例の構成を示すブロック図で
ある。
FIG. 7 is a block diagram showing a configuration of another embodiment of the present invention.

【図8】図7の音声符号化装置の動作を示すフローチャ
ートである。
FIG. 8 is a flowchart showing an operation of the speech encoding device in FIG. 7;

【図9】従来例の構成の一例を示すブロック図である。FIG. 9 is a block diagram showing an example of a configuration of a conventional example.

【図10】図9のレベル調整システムを高圧縮率音声符
号化装置に反映させた例を示す図である。
FIG. 10 is a diagram showing an example in which the level adjustment system of FIG. 9 is applied to a high-compression-rate audio encoding device.

【図11】従来例の構成の他の例を示すブロック図であ
る。
FIG. 11 is a block diagram showing another example of the configuration of the conventional example.

【図12】図11のシステムを高圧縮率音声符号化装置
に反映させた例を示す図である。
FIG. 12 is a diagram showing an example in which the system of FIG. 11 is reflected on a high-compression-rate audio encoding device.

【符号の説明】[Explanation of symbols]

1,5 ディジタル音声信号入力手段 2,4,6 音声符号化装置 3 ディジタル符号化音声信号出力手段 21,41,61 入力音声制御手段 22,42,62 フレームエネルギ量子化手段 23,43,63 音声処理手段 24,44,64 コードマルチプレクサ 25,45,65 シフトレジスタ 26,46,66 レベル検出部 27,47,67 制御情報記憶部 1,5 Digital audio signal input means 2,4,6 Audio encoding device 3 Digitally encoded audio signal output means 21,41,61 Input audio control means 22,42,62 Frame energy quantization means 23,43,63 Audio Processing means 24, 44, 64 Code multiplexer 25, 45, 65 Shift register 26, 46, 66 Level detector 27, 47, 67 Control information storage

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 入力音声データを高圧縮率音声符号化処
理によって符号化する音声符号化装置であって、前記高
圧縮率音声符号化処理中に算出されかつ前記入力音声デ
ータの分析フレーム単位の電力パワーを示すフレームエ
ネルギコードを監視する監視手段と、前記監視手段の監
視結果を基に前記高圧縮率音声符号化処理において前記
入力音声データのレベル制御を行う手段とを有すること
を特徴とする音声符号化装置。
1. An audio encoding apparatus for encoding input audio data by a high-compression-rate audio encoding process, comprising: Monitoring means for monitoring a frame energy code indicating electric power; and means for controlling the level of the input audio data in the high-compression-rate audio encoding process based on the monitoring result of the monitoring means. Audio coding device.
【請求項2】 前記レベル制御を行う手段は、前記監視
手段の監視結果に基づいて前記高圧縮率音声符号化処理
で使用する入力音声スケーリングビット値を増減するこ
とで前記入力音声データのレベル制御を行うようにした
ことを特徴とする請求項1記載の音声符号化装置。
2. The level control unit according to claim 1, wherein the level control unit controls the level of the input voice data by increasing or decreasing an input voice scaling bit value used in the high compression rate voice coding process based on a monitoring result of the monitoring unit. 2. The speech encoding device according to claim 1, wherein
【請求項3】 前記レベル制御を行う手段は、前記監視
手段の監視結果に基づいて前記入力音声データをシフト
することで前記入力音声データのレベル制御を行うよう
にしたこと特徴とする請求項1記載の音声符号化装置。
3. The level control unit according to claim 1, wherein the level control unit controls the level of the input audio data by shifting the input audio data based on a monitoring result of the monitoring unit. A speech encoding device according to claim 1.
【請求項4】 前記レベル制御を行う手段は、前記監視
手段の監視結果に基づいて前記入力音声データの次デー
タに対するアナログレベルでのレベル調整を指示するコ
マンドに反映サセルことで前記入力音声データのレベル
制御を行うようにしたことを特徴とする請求項1記載の
音声符号化装置。
4. A means for performing the level control, wherein the input sound data is reflected by a command for instructing a level adjustment at an analog level with respect to the next data of the input sound data on the basis of a monitoring result of the monitoring means. 2. The speech encoding apparatus according to claim 1, wherein level control is performed.
【請求項5】 前記レベル制御を行う手段は、前記監視
手段で前記フレームエネルギコードが予め設定された第
1の所定値以上及び予め設定された第2の所定値以下が
予め設定された一定期間連続した時に前記入力音声デー
タのレベル制御を行うようにしたこと特徴とする請求項
1から請求項4のいずれか記載の音声符号化装置。
5. The level control unit, wherein the frame energy code is set to be equal to or more than a first predetermined value and equal to or less than a second predetermined value by the monitoring unit. 5. The speech encoding apparatus according to claim 1, wherein a level control of the input speech data is performed when the speech data is continuous.
JP8261094A 1996-10-02 1996-10-02 Speech encoding device Pending JPH10105198A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8261094A JPH10105198A (en) 1996-10-02 1996-10-02 Speech encoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8261094A JPH10105198A (en) 1996-10-02 1996-10-02 Speech encoding device

Publications (1)

Publication Number Publication Date
JPH10105198A true JPH10105198A (en) 1998-04-24

Family

ID=17357008

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8261094A Pending JPH10105198A (en) 1996-10-02 1996-10-02 Speech encoding device

Country Status (1)

Country Link
JP (1) JPH10105198A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109791772A (en) * 2016-09-27 2019-05-21 松下知识产权经营株式会社 Audio-signal processing apparatus, audio signal processing method and control program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109791772A (en) * 2016-09-27 2019-05-21 松下知识产权经营株式会社 Audio-signal processing apparatus, audio signal processing method and control program
CN109791772B (en) * 2016-09-27 2023-07-04 松下知识产权经营株式会社 Sound signal processing device, sound signal processing method, and recording medium

Similar Documents

Publication Publication Date Title
US6199035B1 (en) Pitch-lag estimation in speech coding
US7499853B2 (en) Speech decoder and code error compensation method
CA2154911C (en) Speech coding device
KR100334202B1 (en) Asic
EP1340223B1 (en) Method and apparatus for robust speech classification
US6272459B1 (en) Voice signal coding apparatus
CA2061830C (en) Speech coding system
EP0747879B1 (en) Voice signal coding system
EP1159739B1 (en) Method and apparatus for eighth-rate random number generation for speech coders
US5802487A (en) Encoding and decoding apparatus of LSP (line spectrum pair) parameters
US6629070B1 (en) Voice activity detection using the degree of energy variation among multiple adjacent pairs of subframes
US5802109A (en) Speech encoding communication system
JPH10105198A (en) Speech encoding device
EP0694907A2 (en) Speech coder
EP0723257B1 (en) Voice signal transmission system using spectral parameter and voice parameter encoding apparatus and decoding apparatus used for the voice signal transmission system
JPH0888525A (en) Automatic gain controller by detection of silent tone
JP2772598B2 (en) Audio coding device
JPH0522153A (en) Voice coding circuit
KR0138878B1 (en) Method for reducing the pitch detection time of vocoder
JPH05323996A (en) Sound/silence decision method
JPH0483300A (en) Noise suppression type voice detector
JPH09185396A (en) Speech encoding device
JPH05289698A (en) Voice encoding method
KR0180824B1 (en) Adaptive differential pulse code modulation
JPH07334195A (en) Device for encoding sub-frame length variable voice