JP2762938B2 - Audio coding device - Google Patents

Audio coding device

Info

Publication number
JP2762938B2
JP2762938B2 JP6293666A JP29366694A JP2762938B2 JP 2762938 B2 JP2762938 B2 JP 2762938B2 JP 6293666 A JP6293666 A JP 6293666A JP 29366694 A JP29366694 A JP 29366694A JP 2762938 B2 JP2762938 B2 JP 2762938B2
Authority
JP
Japan
Prior art keywords
output
signal
index
vox
mode information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP6293666A
Other languages
Japanese (ja)
Other versions
JPH08139688A (en
Inventor
英雄 佐野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP6293666A priority Critical patent/JP2762938B2/en
Publication of JPH08139688A publication Critical patent/JPH08139688A/en
Application granted granted Critical
Publication of JP2762938B2 publication Critical patent/JP2762938B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、音声符号化装置に関
し、特にディジタル移動通信方式の自動車電話システム
で使用される音声符号化装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech coding apparatus, and more particularly to a speech coding apparatus used in a digital mobile communication type mobile telephone system.

【0002】[0002]

【従来の技術】従来のディジタル移動通信方式の自動車
電話システムで使用する音声符号化装置は、図2に示す
ように、音声信号を入力し、電力インデックスと電力値
を出力する電力量子化器2と、音声信号を入力し、LP
C(Linear Predictive Coefficient)とLSP(Line
Spectrum Pair)を出力するLPC分析器5と、音声信
号を入力し、音声信号に対する線形予測逆フィルタを施
し、LPC予測残差信号の自己相関から複数のラグ候補
を出力するピッチ分析器6と、音声信号とLSP量子化
器4から出力される予測残差利得を入力して、音声の有
音・無音検出を行い、有音状態または無音状態を示すV
OX MODE情報(「VOXモード情報」という)を
出力する有音無音検出器3を並列に備えている。
2. Description of the Related Art As shown in FIG. 2, a speech encoding apparatus used in a conventional digital mobile communication type mobile telephone system has a power quantizer 2 for inputting a speech signal and outputting a power index and a power value. And input the audio signal, LP
C (Linear Predictive Coefficient) and LSP (Line
An LPC analyzer 5 that outputs a spectrum pair, a pitch analyzer 6 that receives an audio signal, performs a linear prediction inverse filter on the audio signal, and outputs a plurality of lag candidates from the autocorrelation of the LPC prediction residual signal. The voice signal and the prediction residual gain output from the LSP quantizer 4 are input, and voice / non-voice detection of voice is performed.
A sound / silence detector 3 that outputs OX MODE information (referred to as “VOX mode information”) is provided in parallel.

【0003】そして、上記音声符号化装置は、LPC分
析器5から出力されたLSPを入力して量子化し、量子
化LSPから量子化LPCに変換し、LSPインデック
スと量子化LPCと予測誤差利得を出力するLSP量子
化器4と、LPCを入力し聴覚重み付けを行うためのフ
ィルタ係数を算出し、さらに、音声信号を入力し、聴覚
重み付け音声信号を出力する聴覚重み付けフィルタ7
と、量子化LPCと零信号を入力し、零入力応答信号を
出力する聴覚重み付け合成フィルタ9と、聴覚重み付け
合成フィルタ9の出力信号から零入力応答信号を減算す
る減算器10とを備えている。
[0003] The speech coding apparatus inputs and quantizes the LSP output from the LPC analyzer 5, converts the quantized LSP into a quantized LPC, and calculates the LSP index, the quantized LPC, and the prediction error gain. An LSP quantizer 4 for outputting, and a filter coefficient for inputting LPC and calculating a filter coefficient for performing auditory weighting, further inputting an audio signal, and outputting an auditory weighting audio signal 7
A perceptual weighting / synthesizing filter 9 that inputs a quantized LPC and a zero signal and outputs a zero-input response signal, and a subtractor 10 that subtracts the zero-input response signal from the output signal of the perceptual weighting / combining filter 9. .

【0004】さらに、上記音声符号化装置は、減算器1
0の出力信号と量子化LPCとラグ候補を入力し、各々
のラグ候補に対して重み付け合成した信号と、聴覚重み
付けされた音声信号から零入力応答出力信号を減算した
音声信号との相互相関を求め、これを最大にする適応符
号ベクトル信号を検索し、適応符号帳インデックスと適
応符号ベクトル信号を出力する適応符号帳検索器11
と、減算器10の出力信号と量子化LPCと適応符号ベ
クトル信号を入力し、各々の雑音符号ベクトルに対して
適応符号ベクトル信号と直交化処理を行い重み付け合成
した信号と、聴覚重み付けされた音声信号から零入力応
答出力信号を減算した音声信号との相互相関を求め、こ
れを最大にする雑音符号ベクトル信号を検索し、雑音符
号帳インデックスと雑音符号ベクトル信号を出力する雑
音符号帳検索器12と、減算器10の出力信号と適応符
号ベクトル信号と雑音符号ベクトル信号と電力値と予測
残差利得を入力し、減算器10の出力信号と、利得を剰
算した雑音符号ベクトル信号と適応ベクトル信号の加算
値との誤差が最小になる利得符号帳を検索し、利得符号
帳インデックスを出力する利得符号帳検索器13と、V
OX(Voice OperatedTransmitter)の固有パターンデ
ータを出力するVOXユニークワード発生器14と、電
力インデックスと、適応符号帳インデックスと、雑音符
号帳インデックスと、利得符号帳インデックスと、LS
PインデックスとVOXユニークワードと、VOXモー
ド情報を入力し、決められたフォーマットに変換し、符
号化データを出力するデータ送出部15とを備えてい
る。
Further, the above-mentioned speech coding apparatus comprises a subtractor 1
0, a quantized LPC, and a lag candidate, and a cross-correlation between a signal obtained by weighting and synthesizing each lag candidate and an audio signal obtained by subtracting a zero-input response output signal from an auditory-weighted audio signal. An adaptive codebook searcher 11 that finds an adaptive codebook signal that maximizes this and outputs an adaptive codebook index and an adaptive codevector signal
And an output signal of the subtracter 10, a quantized LPC, and an adaptive code vector signal, and a signal obtained by subjecting each noise code vector to an adaptive code vector signal and orthogonalization processing to perform weighting synthesis, and a perceptually weighted speech A cross-correlation with a speech signal obtained by subtracting a zero-input response output signal from a signal is searched, a noise code vector signal which maximizes the cross-correlation is searched, and a random code book searcher 12 which outputs a random code book index and a random code vector signal And the output signal of the subtracter 10, the adaptive code vector signal, the noise code vector signal, the power value, and the prediction residual gain, and the output signal of the subtracter 10, the noise code vector signal obtained by adding the gain, and the adaptive vector A gain codebook searcher 13 that searches for a gain codebook that minimizes an error from the sum of the signals and outputs a gain codebook index;
A VOX unique word generator 14 for outputting unique pattern data of OX (Voice Operated Transmitter), a power index, an adaptive codebook index, a noise codebook index, a gain codebook index, and LS
The data transmission unit 15 receives a P index, a VOX unique word, and VOX mode information, converts the input data into a predetermined format, and outputs encoded data.

【0005】移動局は、上り音声が無音区間の場合、符
号化インデックス送信の中止と開始を表すユニークワー
ドを送出し、パワーアンプの出力を止め、消費電力を抑
えている。上り音声の有音無音判定は、有音無音検出器
3が行う。
[0005] When the uplink voice is a silent section, the mobile station transmits a unique word indicating stop and start of the transmission of the encoded index, stops the output of the power amplifier, and suppresses power consumption. The presence / absence determination of the upstream voice is performed by the presence / absence detector 3.

【0006】有音無音検出器3は、音声信号の電力値が
所定の閾値「1」以下(例えば−45dBm)、または
予測残差利得が所定の閾値「2」以上(例えば0.4)
の場合は無音状態とし、この条件を満たさない場合は有
音状態とする。
The sound / non-speech detector 3 has a power value of the audio signal equal to or less than a predetermined threshold "1" (for example, -45 dBm), or a prediction residual gain equal to or more than a predetermined threshold "2" (for example, 0.4).
In the case of (1), a silent state is set. If this condition is not satisfied, a sound state is set.

【0007】有音無音検出器3は、有音状態が連続して
いる場合を状態「0」とし、有音状態から無音状態に変
化する場合を状態「1」とし、更に無音状態が続く場合
は状態「2」、状態「3」、…、状態「25」と状態の
数が増える。無音状態から有音状態になる場合は状態
「−1」とする。
The sound / silence detector 3 sets a state “0” when the sound state is continuous, a state “1” when the state changes from the sound state to the silence state, and further sets a state “1” when the silence state continues. , The number of states increases to state “2”, state “3”,..., State “25”. When the state changes from the silent state to the sound state, the state is set to “−1”.

【0008】有音無音検出器3は、この状態の数をVO
Xモード情報として出力する。
The sound / silence detector 3 determines the number of states as VO
Output as X mode information.

【0009】また、状態「25」の次も無音状態の場合
は、状態「1」に戻る。これは、ある間隔で移動局の周
囲雑音の情報を基地局に送出するためである。
If the state following the state "25" is also a silent state, the state returns to the state "1". This is to transmit information on the ambient noise of the mobile station to the base station at certain intervals.

【0010】データ送出部15は、VOXモード情報が
状態「0」または状態「2以」上の場合に、符号化イン
デックス(電力インデックス、適応符号帳インデック
ス、雑音符号帳インデックス、利得符号帳インデック
ス、LSPインデックス)を予め規定されたデータフォ
ーマットで出力する。
[0010] When the VOX mode information is in the state "0" or in the state "2 or more", the data transmitting section 15 performs coding index (power index, adaptive codebook index, noise codebook index, gain codebook index, LSP index) in a data format defined in advance.

【0011】また、データ送出部15は、VOXモード
情報が状態「1」の場合には、符号化インデックス送信
の中止を伝えるユニークワード(「ポストアンブル」と
いう)を予め規定されたデータフォーマットで出力し、
状態「−1」の場合は符号化インデックス送信の開始を
伝えるユニークワード(「プリアンブル」という)を予
め規定されたデータフォーマットで出力する。
When the VOX mode information is in the state "1", the data transmitting section 15 outputs a unique word ("postamble") for notifying the stop of the transmission of the encoded index in a predetermined data format. And
In the case of the state "-1", a unique word (referred to as "preamble") for transmitting the start of encoding index transmission is output in a data format defined in advance.

【0012】基地局の復号化器は、VOXユニークワー
ドを監視することにより、移動局が符号化インデックス
送信中か、無音区間における符号化インデックス送信停
止中かを判断し、停止中の場合には背景雑音を生成す
る。背景雑音は、周期的に送信されるポストアンブルに
続く符号化インデックスを初期値として生成される。
The decoder of the base station monitors the VOX unique word to determine whether the mobile station is transmitting the coded index or the coded index transmission in the silent section is stopped. Generate background noise. Background noise is generated with a coding index following a periodically transmitted postamble as an initial value.

【0013】[0013]

【発明が解決しようとする課題】この従来の音声符号化
装置では、上り音声が無音の場合にユニークワードを送
出し、基地局へ符号化インデックスの送信を停止する。
但し、無音状態が連続する場合は、周期的に符号化イン
デックスを周囲雑音の情報として基地局に送信する。
In the conventional speech coding apparatus, a unique word is transmitted when the upstream speech is silent, and the transmission of the coding index to the base station is stopped.
However, when the silent state continues, the coding index is periodically transmitted to the base station as information on the ambient noise.

【0014】基地局の音声符号化装置は、この周囲雑音
の情報を基地に背景雑音を生成する。
[0014] The speech coding apparatus of the base station generates background noise using the information of the ambient noise at the base.

【0015】このため、周期的に変化する背景雑音は、
通常の雑音を符号化、復号化した音とは異なり、非常に
違和感のある音になるという問題がある。
Therefore, the background noise that changes periodically is
There is a problem that unlike a sound obtained by encoding and decoding ordinary noise, the sound becomes very uncomfortable.

【0016】本発明はこのような問題点に鑑みてなされ
たものであって、本発明の目的は、ディジタル移動通信
方式の自動車電話システムで使用する音声符号化装置に
おいて、移動局のVOX(またはVAD:Voice Activi
ty Detect)処理における無音検出時に送信される背景
雑音の周期的音調変化によって生じる違和感を低減する
音声符号化装置を提供することにある。
SUMMARY OF THE INVENTION The present invention has been made in view of the above-mentioned problems, and an object of the present invention is to provide a voice coder used in a digital mobile communication type mobile telephone system, and a mobile station VOX (or VOX). VAD: Voice Activi
It is an object of the present invention to provide a speech encoding device that reduces discomfort caused by a periodic tone change of background noise transmitted when silence is detected in ty Detect processing.

【0017】[0017]

【課題を解決するための手段】前記目的を達成するた
め、本発明の音声符号化装置は、音声信号を入力し、前
記音声信号の電力値を算出して量子化し、電力インデッ
クスと量子化した電力値を出力する電力量子化器と、前
記音声信号を入力し、LPC(Linear Predictive Coef
ficient)を算出して出力し、且つ前記LPCからLS
P(Line SpectrumPair)に変換して出力するLPC分
析器と、前記音声信号を入力し、線形予測逆フィルタを
施し、LPC予測残差信号の自己相関から複数のラグ候
補を出力するピッチ分析器と、前記音声信号とLSP量
子化器から出力される予測残差利得を入力して、音声の
有無・無音検出を行い、有音状態または無音状態を示す
VOXモード情報を出力する有音無音検出器と、を並列
形態に備え、前記LSPを入力して量子化し、量子化L
SPから量子化LPCに変換し、LSPインデックスと
前記量子化LPCと前記予測誤差利得を出力する前記L
SP量子化器と、前記LPCを入力し聴覚重み付けを行
うためのフィルタ係数を算出し、且つ、前記音声信号を
入力し、聴覚重み付け音声信号を出力する聴覚重み付け
フィルタと、前記量子化LPCと零信号を入力し、零入
力応答信号を出力する聴覚重み付け合成フィルタと、前
記聴覚重み付けフィルタの出力信号から前記零入力応答
信号を減算する減算器と、前記減算器の出力信号と前記
量子化LPCと前記ラグ候補を入力し、各々のラグ候補
に対して重み付け合成した信号と、聴覚重み付けされた
音声信号から零入力応答出力信号を減算した音声信号と
の相互相関を求め、これを最大にする適応符号ベクトル
信号を検索し、適応符号帳インデックスと適応符号ベク
トル信号を出力する適応符号帳検索器と、前記減算器の
出力信号と前記量子化LPCと前記適応符号ベクトル信
号を入力し、各々の雑音符号ベクトルに対して前記適応
符号ベクトル信号と直交化処理を行い重み付け合成した
信号と、前記聴覚重み付けされた音声信号から前記零入
力応答出力信号を減算した音声信号との相互相関を求
め、相互相関を最大にする雑音符号ベクトル信号を検索
し、前記雑音符号帳インデックスと雑音符号ベクトル信
号を出力する雑音符号帳検索器と、前記減算器の出力信
号と前記適応符号ベクトル信号と前記雑音符号ベクトル
信号と前記電力値と前記予測残差利得を入力し、前記減
算器の出力信号と、利得を剰算した前記雑音符号ベクト
ル信号と前記適応符号ベクトル信号の加算値との誤差が
最小になる利得符号帳を検索し、利得符号帳インデック
スを出力する利得符号帳検索器と、VOXの固有パター
ンデータを出力するVOXユニークワード発生器と、前
記電力インデックスと、前記適応符号帳インデックス
と、前記雑音符号帳インデックスと、前記利得符号帳イ
ンデックスと、前記LSPインデックスと、前記VOX
ユニークワード発生器から出力されるVOXユニークワ
ードと、前記VOXモード情報とを入力して予め定めら
れたフォーマットに変換し、符号化データを出力するデ
ータ送出部と、を備えることを特徴とするものである。
In order to achieve the above object, a speech coding apparatus according to the present invention receives a speech signal, calculates and quantizes a power value of the speech signal, and quantizes the power value with a power index. A power quantizer for outputting a power value, and an input of the audio signal, the LPC (Linear Predictive Coef)
ficient) is calculated and output, and LS is calculated from the LPC.
An LPC analyzer that converts and outputs a P (Line Spectrum Pair), a pitch analyzer that receives the audio signal, performs a linear prediction inverse filter, and outputs a plurality of lag candidates from the autocorrelation of the LPC prediction residual signal. A speech / silence detector which inputs the speech signal and a prediction residual gain output from an LSP quantizer, detects presence / absence of speech / silence, and outputs VOX mode information indicating a speech state or a silence state. , And LSP are input and quantized to obtain a quantized L
The L which converts an SP into a quantized LPC and outputs an LSP index, the quantized LPC, and the prediction error gain
An SP quantizer, a perceptual weighting filter for inputting the LPC and calculating a filter coefficient for performing perceptual weighting, and receiving the voice signal and outputting a perceptually weighted voice signal; A perceptual weighting synthesis filter that inputs a signal and outputs a zero-input response signal, a subtractor that subtracts the zero-input response signal from an output signal of the perceptual weighting filter, an output signal of the subtractor, the quantized LPC, The lag candidates are input, and a cross-correlation between a signal obtained by weighting and synthesizing each lag candidate and an audio signal obtained by subtracting a zero-input response output signal from an auditory-weighted audio signal is determined. An adaptive codebook searcher for searching a code vector signal and outputting an adaptive codebook index and an adaptive code vector signal; an output signal of the subtractor and the quantity The adaptive LPC and the adaptive code vector signal are input, the adaptive code vector signal is subjected to orthogonalization processing to each noise code vector and weighted and synthesized, and the zero input response output is obtained from the auditory weighted speech signal. A noise codebook searcher that calculates a cross-correlation with a speech signal obtained by subtracting the signal, searches for a noise code vector signal that maximizes the cross-correlation, and outputs the noise codebook index and the noise code vector signal, and the subtractor The output signal of the adaptive code vector signal, the noise code vector signal, the power value and the prediction residual gain are input, the output signal of the subtracter, the noise code vector signal obtained by adding gain, and the adaptive A gain codebook searcher that searches for a gain codebook that minimizes an error from the sum of the code vector signals and outputs a gain codebook index; And VOX unique word generator for outputting a unique pattern data of X, and the power index, and the adaptive codebook index, and the random codebook index, and the gain codebook index, and the LSP index, the VOX
A VOX unique word output from a unique word generator and the VOX mode information, and a data transmission unit that converts the VOX mode information into a predetermined format and outputs encoded data. It is.

【0018】本発明の音声符号化装置においては、好ま
しくは、前記音声信号を入力し、高域周波数成分を抑圧
して出力するLPF(低域通過フィルタ)を備え、前記
聴覚重み付けフィルタが、前記音声信号と前記LPFの
出力信号のいずれか一方を前記有音無音検出器から出力
されるVOXモード情報に基づき切替え入力し、聴覚重
み付け音声信号を出力することを特徴とする。
In the speech coding apparatus of the present invention, it is preferable that the speech coding apparatus include an LPF (low-pass filter) that receives the speech signal and suppresses and outputs a high-frequency component. One of an audio signal and an output signal of the LPF is switched and input based on VOX mode information output from the sound / silence detector, and an auditory weighted audio signal is output.

【0019】本発明の音声符号化装置においては、好ま
しくは、前記電力量子化器が、前記有音無音検出器から
出力されるVOXモード情報を入力し、該VOXモード
情報が無音状態中の場合において、長時間平均をとった
電力値から求められた電力インデックスを出力すること
を特徴とする。
In the speech coding apparatus according to the present invention, preferably, the power quantizer inputs VOX mode information output from the voiced / silent detector, and the VOX mode information is in a silent state. Is characterized by outputting a power index obtained from a power value averaged over a long period of time.

【0020】本発明の音声符号化装置においては、好ま
しくは、前記LPC分析器が、前記有音無音検出器から
出力されるVOXモード情報を入力し、該VOXモード
情報が無音状態中の場合において、LPCを固有の値に
制御して出力し、前記LSP量子化器が、前記有音無音
検出器から出力されるVOXモード情報を入力し、該V
OXモード情報が無音状態中の場合において、LPCの
固有の値にした場合の量子化LSPインデックスと量子
化LPCを出力することを特徴とする。
In the speech coding apparatus of the present invention, preferably, the LPC analyzer inputs VOX mode information output from the voiced / silent detector, and the VOX mode information is in a silent state. , LPC to a unique value, and outputs the same. The LSP quantizer inputs VOX mode information output from the voiced / silent detector,
When the OX mode information is in a silent state, a quantized LSP index and a quantized LPC when the value is a unique value of the LPC are output.

【0021】本発明の音声符号化装置においては、好ま
しくは、前記適応符号帳検索器が、有音無音検出器から
出力されるVOXモード情報を入力し、該VOXモード
情報が無音状態中の場合において、前記適応符号帳イン
デックスを固有の値に制御して出力することを特徴とす
る。
In the speech coding apparatus of the present invention, preferably, the adaptive codebook searcher inputs VOX mode information output from a voiced / silence detector, and the VOX mode information is in a silent state. Wherein the adaptive codebook index is controlled to a unique value and output.

【0022】さらに、本発明の音声符号化装置において
は、好ましくは、前記適応符号帳検索器が、前記有音無
音検出器から出力されるVOXモード情報を入力し、該
VOXモード情報が無音状態中の場合において、前記適
応符号帳インデックスを固有の値に制御し、検索処理を
行わないように制御することを特徴とする。
Further, in the speech coding apparatus according to the present invention, preferably, the adaptive codebook searcher inputs VOX mode information output from the voiced / silence detector, and the VOX mode information is in a silent state. In the middle case, the adaptive codebook index is controlled to a unique value, and control is performed so that search processing is not performed.

【0023】そして、本発明の音声符号化装置は、好ま
しい態様として、音声信号を入力し所定の高域周波数成
分を減衰させるLPF(低域通過フィルタ)と、前記音
声信号と前記音声信号のLPFの出力のいずれか一方
を、有音無音検出器から出力されるVOXモード情報に
より切替え入力し聴覚重み付け音声信号を出力する聴覚
重み付けフィルタと、前記有音無音検出器から出力され
るVOXモード情報を入力し、該VOXモード情報が無
音状態の場合に、長時間平均をとった電力値から求めた
電力インデックスを出力する電力量子化器と、前記有音
無音検出器から出力されるVOXモード情報を入力し、
該VOXモード情報が無音状態中の場合に、LPCを固
有の値に制御して出力するLPC分析器と、前記有音無
音検出器から出力されるVOXモード情報を入力し、該
VOXモード情報が無音状態中の場合に、LPCを固有
の値にした場合の量子化LSPインデックスと量子化L
PCを出力するLSP量子化器と、前記音声信号を入力
し、線形予測逆フィルタを施し、LPC予測残差信号の
自己相関から複数のラグ候補を出力するピッチ分析器
と、前記有音無音検出器から出力されるVOXモード情
報を入力し、該VOXモード情報が無音状態中の場合
に、適応符号帳インデックスを固有の値に制御し、検索
処理を行わない様に制御した適応符号帳検索器と、雑音
符号ベクトル信号を検索し、雑音符号帳インデックスと
雑音符号ベクトル信号を出力する雑音符号帳検索器と、
利得符号帳インデックスを出力する利得符号帳検索器
と、VOXの固有パターンデータを出力するVOXユニ
ークワード発生器と、前記電力インデックスと、前記適
応符号帳インデックスと、前記雑音符号帳インデックス
と、前記利得符号帳インデックスと、前記LSPインデ
ックスと、前記VOXユニークワード発生器から出力さ
れるVOXユニークワードと、前記VOXモード情報を
入力し、予め定められたフォーマットに変換して符号化
データを出力するデータ送出部と、を少なくとも含むこ
とを特徴とするものである。
In a preferred embodiment, the speech encoding apparatus according to the present invention includes an LPF (low-pass filter) for inputting a speech signal and attenuating a predetermined high frequency component, and an LPF for the speech signal and the speech signal. And a perceptual weighting filter that switches and inputs one of the outputs according to VOX mode information output from the voiced / silent detector and outputs a perceptually weighted audio signal, and a VOX mode information output from the voiced / silent detector. When the VOX mode information is in a silent state, a power quantizer that outputs a power index obtained from a power value averaged for a long time and a VOX mode information that is output from the voiced / silent detector. type in,
When the VOX mode information is in a silent state, an LPC analyzer that controls and outputs LPC to a unique value and VOX mode information output from the sound / silence detector are input, and the VOX mode information is In a silent state, a quantized LSP index and a quantized L when LPC is set to a unique value
An LSP quantizer that outputs a PC, a pitch analyzer that receives the audio signal, performs a linear prediction inverse filter, and outputs a plurality of lag candidates from the autocorrelation of the LPC prediction residual signal, and the voiced / silent detection Codebook searcher which inputs VOX mode information output from the device and controls the adaptive codebook index to a unique value when the VOX mode information is in a silent state, so as not to perform a search process. A random codebook searcher that searches for a random codebook signal and outputs a random codebook index and a random code vector signal;
A gain codebook searcher for outputting a gain codebook index, a VOX unique word generator for outputting VOX unique pattern data, the power index, the adaptive codebook index, the noise codebook index, and the gain Data transmission for inputting a codebook index, the LSP index, a VOX unique word output from the VOX unique word generator, and the VOX mode information, converting the VOX mode information into a predetermined format, and outputting encoded data. And at least a part.

【0024】[0024]

【発明の原理】本発明においては、音声信号を入力し、
高域周波数成分を抑圧して出力するLPF(Low Pass F
ilter)と、音声信号とLPFの出力信号の一方を有音
無音検出器から出力されるVOXモード情報により切り
替えて入力し、聴覚重み付け音声信号を出力する聴覚重
み付けフィルタと、VOXモード情報を入力し、VOX
モード情報が無音状態中の場合において、長時間平均を
とった電力値から求められた電力インデックスを出力す
る電力量子化器と、VOXモード情報を入力し、VOX
モード情報が無音状態中の場合において、LPCを固有
の値に制御して出力するLPC分析器と、VOXモード
情報が無音状態中の場合には、LPCを固有の値にした
場合の量子化LSPインデックスと量子化LPCを出力
するLSP量子化器と、VOXモード情報を入力し、V
OXモード情報が無音状態中の場合において、適応符号
帳インデックスを固有の値に制御して検索処理を行わな
い様に制御した適応符号帳検索器を備え、基地局の復号
化器から出力される背景雑音の周期的音調変化によって
生じる違和感を低減するものである。
The principle of the present invention is as follows.
LPF (Low Pass F) that suppresses and outputs high frequency components
ilter), one of the audio signal and the output signal of the LPF is switched and input according to the VOX mode information output from the soundless / silent detector, and an auditory weighting filter for outputting an auditory weighting audio signal, and the VOX mode information are input. , VOX
When the mode information is in a silent state, a power quantizer that outputs a power index obtained from a power value averaged over a long period of time and VOX mode information are input, and VOX mode information is input.
When the mode information is in the silent state, the LPC analyzer controls and outputs the LPC to a unique value, and when the VOX mode information is in the silent state, the LPC analyzer uses the LPC as the unique value. An LSP quantizer for outputting an index and a quantized LPC, and VOX mode information,
When the OX mode information is in a silent state, an adaptive codebook searcher that controls the adaptive codebook index to a unique value so as not to perform a search process is provided, and is output from a decoder of the base station. This is to reduce the discomfort caused by the periodic tone change of the background noise.

【0025】また、本発明によれば、聴覚重み付けフィ
ルタに入力される音声信号にLPFをかけることは、合
成音声の聴覚的品質を高めるために使用される適応スペ
クトル・ポストフィルタにおいて、背景雑音の周波数強
調を抑制する。
Further, according to the present invention, applying an LPF to the audio signal input to the auditory weighting filter can reduce background noise in an adaptive spectral postfilter used to enhance the auditory quality of synthesized speech. Suppress frequency emphasis.

【0026】[0026]

【実施例】図面を参照して、本発明の実施例を以下に説
明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0027】図1は、本発明の音声符号化装置の一実施
例の構成を示すブロック図である。
FIG. 1 is a block diagram showing the configuration of an embodiment of the speech encoding apparatus according to the present invention.

【0028】図1を参照して、入力端子1から音声信号
を入力される。電力量子化器2は、入力端子1から音声
信号を入力し、その電力値を求め、学習によってあらか
じめ用意された電力符号帳から最良に近似する量子化さ
れた電力値のインデックスを検索し、電力インデックス
として出力する。
Referring to FIG. 1, an audio signal is input from input terminal 1. The power quantizer 2 receives an audio signal from the input terminal 1, finds the power value, searches the power codebook prepared in advance by learning for the index of the best approximated quantized power value, and Output as an index.

【0029】電力量子化器2は、復号器と同一動作を行
うため、検索した電力インデックスをもとに量子化され
た電力値(以下、この量子化された電力値のことを「R
MS」という)を出力する。
Since the power quantizer 2 performs the same operation as the decoder, the power value quantized based on the searched power index (hereinafter, this quantized power value is referred to as “R
MS ”).

【0030】そして、電力量子化器2は、特に有音無音
検出器3から入力されるVOX MODE情報(「VO
Xモード情報」という)が無音状態中の場合には、無音
区間において長時間平均を取った電力値を求め、電力符
号帳から最良に近似する量子化された電力値のインデッ
クスを検索して電力インデックスとして出力する。
The power quantizer 2 outputs the VOX MODE information (“VO_MODE”), which is input particularly from the sound / silence detector 3.
When the “X mode information” is in a silent state, a power value averaged over a long period of time in a silent section is obtained, an index of a quantized power value that is best approximated from a power codebook is searched, and the power is calculated. Output as an index.

【0031】このように長時間平均を取ることにより、
基地局の復号器で生成される背景雑音の電力レベルが、
突発的な雑音による急激なレベル変動を起こすことを抑
制する。
By taking an average over a long period of time,
The power level of the background noise generated by the base station decoder is
Suppresses sudden level fluctuation due to sudden noise.

【0032】有音無音検出器3は、入力端子1から音声
信号を入力し、LSP量子化器4から出力される予測残
差利得を入力して、音声の有音・無音検出を行い、有音
状態または無音状態を示すVOXモード情報を出力す
る。
The sound / silence detector 3 receives a speech signal from the input terminal 1, inputs a prediction residual gain output from the LSP quantizer 4, performs speech / silence detection of the speech, and It outputs VOX mode information indicating a sound state or a silence state.

【0033】VOXモード情報は、有音状態が連続して
いる場合を状態「0」とし、有音状態から無音状態に変
化する場合を状態「1」とし、更に無音状態が続く場合
は状態「2」、状態「3」、…、状態「25」と状態の
数が増え、更に状態「25」の次も無音状態の場合に
は、状態「1」に戻り、無音状態から有音状態になる場
合は状態「−1」を出力する。
The VOX mode information is defined as a state "0" when the sound state is continuous, a state "1" when the state changes from the sound state to the silent state, and a state "1" when the silent state continues. When the number of states increases to "2", state "3",..., State "25", and the state following the state "25" is a silent state, the state returns to the state "1" and the state changes from the silent state to the sound state. If so, the state "-1" is output.

【0034】有音無音検出器3における有音/無音状態
の判定は、例えば、音声信号の電力値が所定の閾値
「1」以下(例えば−45dBm)または予測残差利得
が所定の閾値「2」以上(例えば0.2)の場合には無
音状態とし、この条件を満たさない場合は有音状態とす
る。
The sound / non-speech state of the sound / silence detector 3 is determined, for example, when the power value of the audio signal is equal to or less than a predetermined threshold “1” (for example, −45 dBm) or when the prediction residual gain is equal to or smaller than the predetermined threshold “2” If it is equal to or more than 0.2 (for example, 0.2), the sound state is set. If this condition is not satisfied, the sound state is set.

【0035】LPC分析器5は、入力端子1から音声信
号を入力し、自己相関法または共分散法によりLPCを
求め、さらにLPCからLSPへとパラメータ変更し、
LPCとLSPを出力する。
The LPC analyzer 5 inputs a voice signal from the input terminal 1, finds an LPC by an autocorrelation method or a covariance method, and further changes parameters from LPC to LSP.
Outputs LPC and LSP.

【0036】LPC分析器5は、特に、有音無音検出器
3から入力するVOXモード情報が無音状態中の場合に
は、LPCを固有の値(例えば、LPCを使用した合成
フィルタの伝達関数が1となるような値にする)を出力
する。LSPは、予測残差利得を求めるので、出力デー
タの置き換えは行わない。
In particular, when the VOX mode information input from the sound / silence detector 3 is in a silent state, the LPC analyzer 5 sets the LPC to a unique value (for example, the transfer function of a synthesis filter using the LPC is 1) is output. Since the LSP calculates the prediction residual gain, it does not replace the output data.

【0037】ピッチ分析器6は、入力端子1から音声信
号を入力し、線形予測逆フィルタを施し、LPC予測差
信号の自己相関から複数のラグ候補を出力する。
The pitch analyzer 6 receives a speech signal from the input terminal 1, performs a linear prediction inverse filter, and outputs a plurality of lag candidates from the autocorrelation of the LPC prediction difference signal.

【0038】LSP量子化器4は、LPC分析器5から
出力されたLSPを入力して量子化し、量子化LSPか
ら量子化LPCに変換し、LSPインデックスと量子化
LPCと予測誤差利得を出力する。
The LSP quantizer 4 inputs and quantizes the LSP output from the LPC analyzer 5, converts the quantized LSP into a quantized LPC, and outputs an LSP index, a quantized LPC, and a prediction error gain. .

【0039】聴覚重み付けフィルタ7は、LPC分析器
5から出力されるLPCを入力して聴覚重み付けフィル
タ係数を算出する。
The hearing weighting filter 7 receives the LPC output from the LPC analyzer 5 and calculates a hearing weighting filter coefficient.

【0040】さらに、聴覚重み付けフィルタ7は、有音
無音検出器3から入力されるVOXモード情報が無音状
態中の場合には、音声信号の所定の高域周波数成分を阻
止減衰するLPF(低域通過フィルタ)8に音声信号を
通した出力信号を、また有音区間の場合は入力端子1か
らの音声信号を、スイッチ17を介して切替え入力し、
聴覚重み付け音声信号を出力する。
Further, when the VOX mode information input from the sound / silence detector 3 is in a silence state, the auditory weighting filter 7 is an LPF (low band) for blocking and attenuating a predetermined high frequency component of the audio signal. An output signal passing the audio signal through a pass filter 8 and, in the case of a sound section, an audio signal from the input terminal 1 are switched and input via a switch 17,
An auditory weighted audio signal is output.

【0041】聴覚重み付け合成フィルタ9は、量子化L
PCと零信号を入力し、零入力応答信号を出力する。減
算器10は、聴覚重み付けフィルタ7の出力信号から零
入力応答信号を減算する。
The auditory weighting synthesis filter 9 calculates the quantization L
A PC and a zero signal are input, and a zero input response signal is output. The subtractor 10 subtracts the quiescent response signal from the output signal of the auditory weighting filter 7.

【0042】適応符号帳検索器11は、減算器10の出
力信号と量子化LPCと複数のラグ候補を入力し、各々
のラグ候補に対して重み付け合成した信号と、聴覚重み
付けされた音声信号から零入力応答出力信号を減算した
音声信号との相互相関を求め、これを最大にする適応符
号ベクトル信号を検索し、適応符号帳インデックスと適
応符号ベクトル信号を出力する。
The adaptive codebook search unit 11 receives the output signal of the subtracter 10, the quantized LPC, and a plurality of lag candidates, and weights and synthesizes each lag candidate, and obtains a perceptually weighted speech signal. A cross-correlation with a speech signal obtained by subtracting the quiescent response output signal is obtained, an adaptive code vector signal that maximizes the correlation is searched, and an adaptive codebook index and an adaptive code vector signal are output.

【0043】適応符号帳検索器11は、特に有音無音検
出器3から入力するVOXモード情報が無音状態の場合
には、適応符号帳インデックスとして、固有の値(例え
ば適応符号帳を使用しないインデックス)を出力する。
The adaptive codebook searcher 11 uses a unique value (for example, an index not using the adaptive codebook) as an adaptive codebook index, particularly when the VOX mode information input from the sound / silence detector 3 is in a silent state. ) Is output.

【0044】この場合、適応符号帳検索器11は、固定
のインデックスを送出するため、検索処理を省略するこ
とができ、演算量・消費電力の削減が可能となる。
In this case, since the adaptive codebook searcher 11 sends out a fixed index, the search processing can be omitted, and the amount of calculation and power consumption can be reduced.

【0045】雑音符号帳検索器12は、減算器10の出
力信号と量子化LPCと適応符号ベクトル信号を入力
し、各々の雑音符号ベクトルに対して適応符号ベクトル
信号と直交化処理を行い重み付け合成した信号と、聴覚
重み付けされた音声信号から零入力応答出力信号を減算
した音声信号との相互相関を求め、これを最大にする雑
音符号ベクトル信号を検索し、雑音符号帳インデックス
と雑音符号ベクトル信号を出力する。
The noise codebook search unit 12 receives the output signal of the subtractor 10, the quantized LPC and the adaptive code vector signal, and performs an adaptive code vector signal and orthogonalization processing on each noise code vector to perform weighting synthesis. Cross-correlation between the obtained signal and the audio signal obtained by subtracting the zero input response output signal from the auditory weighted audio signal, searching for a noise code vector signal that maximizes this, a noise codebook index and a noise code vector signal Is output.

【0046】利得符号帳検索器13は、減算器10の出
力信号と適応符号ベクトル信号と雑音符号ベクトル信号
と電力値と予測残差利得を入力し、減算器10の出力信
号と、利得を乗算した雑音符号ベクトル信号と適応符号
ベクトル信号の加算値との誤差が最小になる利得符号帳
を検索し、利得符号帳インデックスを出力する。
The gain codebook searcher 13 receives the output signal of the subtractor 10, the adaptive code vector signal, the noise code vector signal, the power value, and the prediction residual gain, and multiplies the output signal of the subtracter 10 by the gain. A gain codebook that minimizes an error between the obtained random code vector signal and the added value of the adaptive code vector signal is searched, and a gain codebook index is output.

【0047】VOXユニークワード発生器14は、VO
Xの固有パターンデータを出力する。
The VOX unique word generator 14 outputs the VO
The unique pattern data of X is output.

【0048】VOXのユニークワードには、符号化イン
デックス送信の中止を伝えるポストアンブルと、符号化
インデックス送信の開始を伝えるプリアンブルがある。
The VOX unique word includes a postamble for notifying the transmission of the encoded index and a preamble for notifying the start of the encoded index transmission.

【0049】データ送出部15は、電力インデックス
と、適応符号帳インデックスと、雑音符号帳インデック
スと、利得符号帳インデックスと、LSPインデックス
とVOXユニークワードと、VOXモード情報を入力
し、予め定められたフォーマットに変換し、符号化デー
タを出力する。
The data transmitting section 15 receives a power index, an adaptive codebook index, a noise codebook index, a gain codebook index, an LSP index, a VOX unique word, and VOX mode information, and Convert to the format and output the encoded data.

【0050】データ送出部15は、VOXモード情報が
状態「0」または「状態」2以上の場合、符号化インデ
ックス(電力インデックス、適応符号帳インデックス、
雑音符号帳インデックス、利得符号帳インデックス、L
SPインデックス)を出力する。
When the VOX mode information is in the state “0” or “state” 2 or more, the data transmitting unit 15 sets the coding index (power index, adaptive codebook index,
Noise codebook index, gain codebook index, L
SP index).

【0051】また、データ送出部15は、VOXモード
情報が状態「1」の場合には、ポストアンブルを出力
し、状態「−1」の場合には、プリアンブルを出力す
る。
The data transmitting section 15 outputs a postamble when the VOX mode information is in the state "1", and outputs a preamble when the VOX mode information is in the state "-1".

【0052】以上本実施例によれば、VOXモード情報
が無音状態を示す場合に、聴覚重み付けフィルタ7に入
力される音声信号にLPF8をかけることにより、合成
音声の聴覚的品質を高めるために使用される適応スペク
トル・ポストフィルタにおいて、背景雑音の周波数強調
を抑制し、また、電力量子化器2では無音区間での電力
値を長時間平均を取ることにより、基地局の復号器で生
成される背景雑音の電力レベルが、突発的な雑音によっ
て急激なレベル変動が起こることを抑制している。
As described above, according to the present embodiment, when the VOX mode information indicates a silent state, the audio signal input to the auditory weighting filter 7 is subjected to the LPF 8 to improve the auditory quality of the synthesized voice. In the adaptive spectrum postfilter to be performed, the frequency emphasis of background noise is suppressed, and the power quantizer 2 averages the power value in a silent period for a long time, thereby generating the signal at the decoder of the base station. The power level of the background noise suppresses a sudden level fluctuation caused by sudden noise.

【0053】また、本実施例においては、適応符号帳検
索器11において、固定のインデックスを出力すること
で、背景雑音の周期的変化を抑制するという効果を有す
る。
In the present embodiment, the adaptive codebook searcher 11 outputs a fixed index, which has the effect of suppressing the periodic change of the background noise.

【0054】さらに、本実施例においては、適応符号帳
検索器11において、固定のインデックスを出力するこ
とで検索処理を省略することができ、演算量が大幅に減
少し、消費電力の削減が可能となる。
Furthermore, in this embodiment, the adaptive codebook searcher 11 can output a fixed index, thereby omitting the search processing, greatly reducing the amount of calculation and reducing power consumption. Becomes

【0055】以上本発明を上記実施例に即して説明した
が、本発明は、上記態様にのみ限定されるものでなく、
本発明の原理に準ずる各種態様を含むものである。
Although the present invention has been described with reference to the above embodiments, the present invention is not limited only to the above embodiments.
It includes various aspects according to the principles of the present invention.

【0056】[0056]

【発明の効果】以上説明したように本発明(請求項1)
によれば、有音無音検出器から出力されるVOXモード
情報により有音状態、無音状態での状態制御を行うこと
により、基地局の復号化器から出力される背景雑音の周
期的音調変化によって生じる違和感を低減できるという
効果を有する。
As described above, the present invention (claim 1)
According to the above, by performing the state control in the voiced state and the silent state based on the VOX mode information output from the voiced / silence detector, the periodic tone change of the background noise output from the decoder of the base station is performed. This has the effect of reducing the sense of discomfort that occurs.

【0057】本発明(請求項2)によれば、VOXモー
ド情報が無音状態を示す場合に、聴覚重み付けフィルタ
に入力される音声信号にLPFをかけることにより、合
成音声の聴覚的品質を高めるために使用される適応スペ
クトル・ポストフィルタにおいて、背景雑音の周波数強
調を抑制している。
According to the present invention (claim 2), when the VOX mode information indicates a silent state, the audio signal input to the auditory weighting filter is subjected to LPF to improve the auditory quality of synthesized speech. In the adaptive spectrum post-filter used in (1), frequency enhancement of background noise is suppressed.

【0058】また、本発明(請求項3)によれば、電力
量子化器において、無音区間での電力値を長時間平均を
取ることで、基地局の復号器で生成される背景雑音の電
力レベルが、突発的な雑音によって急激なレベル変動が
起こることを抑制するという効果を有する。
Further, according to the present invention (claim 3), the power quantizer averages the power value in a silent section for a long time to thereby obtain the power of the background noise generated by the decoder of the base station. The level has an effect of suppressing a sudden level change caused by sudden noise.

【0059】本発明(請求項4)によれば、固定のイン
デックスを出力することで検索処理を省略することがで
き、演算量を大幅に減少すると共に消費電力の削減が可
能となる。
According to the present invention (claim 4), a search process can be omitted by outputting a fixed index, and the amount of calculation can be greatly reduced and power consumption can be reduced.

【0060】さらに本発明(請求項5)によれば、適応
符号帳検索器において、固定のインデックスを出力する
ことで、背景雑音の周期的変化を抑制するという効果を
有する。
Further, according to the present invention (claim 5), in the adaptive codebook searcher, by outputting a fixed index, there is an effect that a periodic change of background noise is suppressed.

【0061】さらにまた、本発明(請求項6)によれ
ば、適応符号帳検索器において、固定のインデックスを
出力することで検索処理を省略することができ、演算量
が大幅に減少し、消費電力の削減が可能となる。
Furthermore, according to the present invention (claim 6), in the adaptive codebook searcher, the search processing can be omitted by outputting a fixed index. Power can be reduced.

【0062】そして、本発明(請求項7)によれば、上
記それぞれの効果を相乗的に達し得る。
According to the present invention (claim 7), each of the above effects can be achieved synergistically.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の音声符号化装置の一実施例の構成を示
すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of an embodiment of a speech encoding device according to the present invention.

【図2】従来の音声符号化装置の構成を示すブロック図
である。
FIG. 2 is a block diagram illustrating a configuration of a conventional speech encoding device.

【符号の説明】[Explanation of symbols]

1 入力端子 2 電力量子化器 3 有音無音検出器 4 LSP量子化器 5 LPC分析器 6 ピッチ分析器 7 聴覚重み付けフィルタ 8 LPF 9 聴覚重み付け合成フィルタ 10 減算器 11 適応符号帳検索器 12 雑音符号帳検索器 13 利得符号帳検索器 14 VOXユニークワード発生器 15 データ送出部 16 出力端子 17 スイッチ Reference Signs List 1 input terminal 2 power quantizer 3 voiced silence detector 4 LSP quantizer 5 LPC analyzer 6 pitch analyzer 7 auditory weighting filter 8 LPF 9 auditory weighting synthesis filter 10 subtractor 11 adaptive codebook searcher 12 noise code Book searcher 13 Gain codebook searcher 14 VOX unique word generator 15 Data transmission unit 16 Output terminal 17 Switch

Claims (6)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】音声信号を入力し、前記音声信号の電力値
を算出して量子化し、電力インデックスと量子化した電
力値を出力する電力量子化器と、 前記音声信号を入力し、LPC(Linear Predictive
Coefficient)を算出して出力し、且つ前記LPCから
LSP(Line Spectrum Pair)に変換して出力するL
PC分析器と、 前記音声信号を入力し、線形予測逆フィルタを施し、L
PC予測残差信号の自己相関から複数のラグ候補を出力
するピッチ分析器と、 前記音声信号とLSP量子化器から出力される予測残差
利得を入力して、音声の有無・無音検出を行い、有音状
態または無音状態を示すVOXモード情報を出力する有
音無音検出器と、 を並列形態に備え、 前記LSPを入力して量子化し、量子化LSPから量子
化LPCに変換し、LSPインデックスと前記量子化L
PCと前記予測誤差利得を出力する前記LSP量子化器
と、 前記LPCを入力し聴覚重み付けを行うためのフィルタ
係数を算出し、且つ、前記音声信号を入力し、聴覚重み
付け音声信号を出力する聴覚重み付けフィルタと、 前記量子化LPCと零信号を入力し、零入力応答信号を
出力する聴覚重み付け合成フィルタと、 前記聴覚重み付けフィルタの出力信号から前記零入力応
答信号を減算する減算器と、 前記減算器の出力信号と前記量子化LPCと前記ラグ候
補を入力し、各々のラグ候補に対して重み付け合成した
信号と、聴覚重み付けされた音声信号から零入力応答出
力信号を減算した音声信号との相互相関を求め、これを
最大にする適応符号ベクトル信号を検索し、適応符号帳
インデックスと適応符号ベクトル信号を出力する適応符
号帳検索器と、 前記減算器の出力信号と前記量子化LPCと前記適応符
号ベクトル信号を入力し、各々の雑音符号ベクトルに対
して前記適応符号ベクトル信号と直交化処理を行い重み
付け合成した信号と、前記聴覚重み付けされた音声信号
から前記零入力応答出力信号を減算した音声信号との相
互相関を求め、相互相関を最大にする雑音符号ベクトル
信号を検索し、前記雑音符号帳インデックスと雑音符号
ベクトル信号を出力する雑音符号帳検索器と、 前記減算器の出力信号と前記適応符号ベクトル信号と前
記雑音符号ベクトル信号と前記電力値と前記予測残差利
得を入力し、前記減算器の出力信号と、利得を剰算した
前記雑音符号ベクトル信号と前記適応符号ベクトル信号
の加算値との誤差が最小になる利得符号帳を検索し、利
得符号帳インデックスを出力する利得符号帳検索器と、 VOXの固有パターンデータを出力するVOXユニーク
ワード発生器と、 前記電力インデックスと、前記適応符号帳インデックス
と、前記雑音符号帳インデックスと、前記利得符号帳イ
ンデックスと、前記LSPインデックスと、前記VOX
ユニークワード発生器から出力されるVOXユニークワ
ードと、前記VOXモード情報とを入力して予め定めら
れたフォーマットに変換し、符号化データを出力するデ
ータ送出部と、前記音声信号を入力し、高域周波数成分を抑圧して出力
するLPF(低域通過フィルタ)と、 を備え、 前記聴覚重み付けフィルタが、前記音声信号と前記LP
Fの出力信号のいずれか一方を前記有音無音検出器から
出力されるVOXモード情報に基づき切替え入力し、聴
覚重み付け音声信号を出力する ことを特徴とする音声符
号化装置。
A power quantizer that receives an audio signal, calculates and quantizes a power value of the audio signal, and outputs a power index and a quantized power value; Linear Predictive
Coefficient) is calculated and output, and L is converted from the LPC to an LSP (Line Spectrum Pair) and output.
A PC analyzer, and inputting the audio signal, performing a linear prediction inverse filter,
A pitch analyzer that outputs a plurality of lag candidates from the autocorrelation of a PC prediction residual signal, and a prediction residual gain that is output from the voice signal and an LSP quantizer to detect presence / absence of voice and silence. , A voiced / silent detector that outputs VOX mode information indicating a voiced state or a voiceless state, and a voice / silence detector in a parallel form. And the quantization L
A PC and the LSP quantizer for outputting the prediction error gain; a hearing device for inputting the LPC to calculate a filter coefficient for performing auditory weighting, inputting the audio signal, and outputting an auditory weighted audio signal A weighting filter, an auditory weighting synthesis filter that inputs the quantized LPC and the zero signal, and outputs a zero input response signal, a subtractor that subtracts the zero input response signal from an output signal of the auditory weighting filter, Of the quantizer output signal, the quantized LPC and the lag candidate, and a signal obtained by weighting and synthesizing each lag candidate, and an audio signal obtained by subtracting a zero-input response output signal from an auditory-weighted audio signal. An adaptive code that obtains a correlation, searches for an adaptive code vector signal that maximizes the correlation, and outputs an adaptive codebook index and an adaptive code vector signal. A book searcher, a signal obtained by inputting the output signal of the subtractor, the quantized LPC, and the adaptive code vector signal, performing a weighting synthesis by performing an orthogonalization process with the adaptive code vector signal for each noise code vector, and Finding the cross-correlation with the audio signal obtained by subtracting the quiescent response output signal from the auditory weighted audio signal, searching for a noise code vector signal that maximizes the cross-correlation, the noise codebook index and the noise code vector A noise codebook searcher that outputs a signal, an output signal of the subtractor, the adaptive code vector signal, the noise code vector signal, the power value, and the prediction residual gain, and an output signal of the subtractor. Searching for a gain codebook in which an error between the noise code vector signal obtained by adding the gain and the added value of the adaptive code vector signal is minimized. A gain codebook searcher for outputting a dex, a VOX unique word generator for outputting VOX unique pattern data, the power index, the adaptive codebook index, the noise codebook index, and the gain codebook index. , The LSP index, and the VOX
A VOX unique word output from a unique word generator and the VOX mode information are input and converted into a predetermined format, and a data transmitting unit that outputs encoded data ; Output with suppressed frequency components
And LPF (low pass filter) that, wherein the perceptual weighting filter, the audio signal and the LP
Either one of the output signals of F
Switching input based on the output VOX mode information,
A speech coding apparatus for outputting a sense-weighted speech signal .
【請求項2】前記電力量子化器が、前記有音無音検出器
から出力されるVOXモード情報を入力し、該VOXモ
ード情報が無音状態中の場合において、長時間平均をと
った電力値から求められた電力インデックスを出力する
ことを特徴とする請求項1記載の音声符号化装置。
2. The sound quantizer according to claim 2, wherein said power quantizer is said sound / silence detector.
Input the VOX mode information output from the
If the load information is in a silent state, the average
Output the power index calculated from the measured power value
The speech encoding device according to claim 1, wherein:
【請求項3】前記LPC分析器が、前記有音無音検出器
から出力されるVOXモード情報を 入力し、該VOXモ
ード情報が無音状態中の場合において、LPCを固有の
値に制御して出力し、 前記LSP量子化器が、前記有音無音検出器から出力さ
れるVOXモード情報を入力し、該VOXモード情報が
無音状態中の場合において、LPCの固有の値にした場
合の量子化LSPインデックスと量子化LPCを出力す
ることを特徴とする請求項1記載の音声符号化装置。
3. The sound / silence detector according to claim 1 , wherein
Input the VOX mode information output from the
When the card information is in the silent state, the LPC
The LSP quantizer outputs the output from the sound / silence detector.
Is input, and the VOX mode information is
In the case of silence, if the
Output the quantized LSP index and the quantized LPC
The speech encoding device according to claim 1, wherein
【請求項4】前記適応符号帳検索器が、有音無音検出器
から出力されるVOXモード情報を入力し、該VOXモ
ード情報が無音状態中の場合において、前記適応符号帳
インデックスを固有の値に制御して出力することを特徴
とする請求項1記載の音声符号化装置。
4. The voice codebook searcher according to claim 1, wherein said adaptive codebook searcher is a soundless / silence detector.
Input the VOX mode information output from the
When the code information is in a silent state, the adaptive codebook
The index is controlled to a unique value and output
The speech encoding device according to claim 1, wherein
【請求項5】前記適応符号帳検索器が、前記有音無音検
出器から出力されるVOXモード情報を入力し、該VO
Xモード情報が無音状態中の場合において、前記適応符
号帳インデックスを固有の値に制御し、検索処理を行わ
ないように制御することを特徴とする請求項4記載の音
声符号化装置。
5. The voice codebook searcher according to claim 1 , wherein
The VOX mode information output from the output device is input, and the VO
When the X mode information is in a silent state, the adaptive code
Performs search processing by controlling the issue book index to a unique value
5. The sound according to claim 4, wherein the sound is controlled so as not to exist.
Voice coding device.
【請求項6】音声信号を入力し所定の高域周波数成分を
減衰させるLPF(低域通過フィルタ)と、 前記音声信号と前記音声信号のLPFの出力のいずれか
一方を、有音無音検出器から出力されるVOXモード情
報により切替え入力し聴覚重み付け音声信号を出力する
聴覚重み付けフィルタと、 前記有音無音検出器から出力されるVOXモード情報を
入力し、該VOXモード情報が無音状態の場合に、長時
間平均をとった電力値から求めた電力インデックスを出
力する電力量子化器と、 前記有音無音検出器から出力されるVOXモード情報を
入力し、該VOXモード情報が無音状態中の場合に、L
PCを固有の値に制御して出力するLPC分析器と、 前記有音無音検出器から出力されるVOXモード情報を
入力し、該VOXモー ド情報が無音状態中の場合に、L
PCを固有の値にした場合の量子化LSPインデックス
と量子化LPCを出力するLSP量子化器と、 前記音声信号を入力し、線形予測逆フィルタを施し、L
PC予測残差信号の自己相関から複数のラグ候補を出力
するピッチ分析器と、 前記有音無音検出器から出力されるVOXモード情報を
入力し、該VOXモード情報が無音状態中の場合に、適
応符号帳インデックスを固有の値に制御し、検索処理を
行わないように制御した適応符号帳検索器と、 雑音符号ベクトル信号を検索し、雑音符号帳インデック
スと雑音符号ベクトル信号を出力する雑音符号帳検索器
と、 利得符号帳インデックスを出力する利得符号帳検索器
と、 VOXの固有パターンデータを出力するVOXユニーク
ワード発生器と、 前記電力インデックスと、前記適応符号帳インデックス
と、前記雑音符号帳インデックスと、前記利得符号帳イ
ンデックスと、前記LSPインデックスと、前記VOX
ユニークワード発生器から出力されるVOXユニークワ
ードと、前記VOXモード情報を入力し、予め定められ
たフォーマットに変換して符号化データを出力するデー
タ送出部と、 を少なくとも含むことを特徴とする音声符号化装置。
6. An audio signal is inputted and a predetermined high frequency component is generated.
LPF (low-pass filter) to be attenuated , and either the audio signal or the LPF output of the audio signal
One is the VOX mode information output from the sound / silence detector.
Switch and input auditory weighted audio signal
An auditory weighting filter and VOX mode information output from the sound / silence detector.
If the VOX mode information is silent,
Output the power index calculated from the averaged power value.
Power quantizer and VOX mode information output from the sound / silence detector.
Input, and when the VOX mode information is in a silent state,
An LPC analyzer that controls and outputs a PC to a unique value, and VOX mode information that is output from the sound / silence detector.
Type, when the VOX mode information is in silence, L
Quantized LSP index when PC is set to a unique value
And an LSP quantizer that outputs a quantized LPC and the audio signal , performs a linear prediction inverse filter,
Output multiple lag candidates from autocorrelation of PC prediction residual signal
And a VOX mode information output from the sound / silence detector.
If the VOX mode information is in a silent state,
The codebook index is controlled to a unique value, and search processing is performed.
An adaptive codebook searcher controlled not to perform the search and a random codebook vector signal
Codebook searcher that outputs noise and random code vector signals
When the gain codebook search outputting a gain codebook index
And VOX unique which outputs VOX unique pattern data
A word generator, the power index, and the adaptive codebook index
And the noise codebook index and the gain codebook index.
Index, the LSP index, and the VOX
VOX unique word output from unique word generator
Mode and the VOX mode information, and
Output encoded data after converting to
And a data transmission unit .
JP6293666A 1994-11-04 1994-11-04 Audio coding device Expired - Fee Related JP2762938B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6293666A JP2762938B2 (en) 1994-11-04 1994-11-04 Audio coding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6293666A JP2762938B2 (en) 1994-11-04 1994-11-04 Audio coding device

Publications (2)

Publication Number Publication Date
JPH08139688A JPH08139688A (en) 1996-05-31
JP2762938B2 true JP2762938B2 (en) 1998-06-11

Family

ID=17797683

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6293666A Expired - Fee Related JP2762938B2 (en) 1994-11-04 1994-11-04 Audio coding device

Country Status (1)

Country Link
JP (1) JP2762938B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240383B1 (en) 1997-07-25 2001-05-29 Nec Corporation Celp speech coding and decoding system for creating comfort noise dependent on the spectral envelope of the speech signal
KR100399057B1 (en) * 2001-08-07 2003-09-26 한국전자통신연구원 Apparatus for Voice Activity Detection in Mobile Communication System and Method Thereof

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NTT R&D vol.43[4](1994)P.363−388

Also Published As

Publication number Publication date
JPH08139688A (en) 1996-05-31

Similar Documents

Publication Publication Date Title
RU2262748C2 (en) Multi-mode encoding device
Chen et al. Real-time vector APC speech coding at 4800 bps with adaptive postfiltering
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
US5933803A (en) Speech encoding at variable bit rate
KR20070087222A (en) Spectral magnitude quantization for a speech coder
JPH09152898A (en) Synthesis method for audio signal without encoded parameter
JPH02155313A (en) Coding method
Ordentlich et al. Low-delay code-excited linear-predictive coding of wideband speech at 32 kbps
US6424942B1 (en) Methods and arrangements in a telecommunications system
US6243674B1 (en) Adaptively compressing sound with multiple codebooks
JPH03102921A (en) Conditional probabilistic excitation coding method
KR100421648B1 (en) An adaptive criterion for speech coding
JP2007525723A (en) Method of generating comfort noise for voice communication
US10672411B2 (en) Method for adaptively encoding an audio signal in dependence on noise information for higher encoding accuracy
JP3087591B2 (en) Audio coding device
JP2000308167A (en) Voice encoding device
US5802109A (en) Speech encoding communication system
JP2762938B2 (en) Audio coding device
JPH11504733A (en) Multi-stage speech coder by transform coding of prediction residual signal with quantization by auditory model
JP4295372B2 (en) Speech encoding device
JP3055608B2 (en) Voice coding method and apparatus
JP2638522B2 (en) Audio coding device
JP4230550B2 (en) Speech encoding method and apparatus, and speech decoding method and apparatus
JP3580906B2 (en) Voice decoding device
CA2235275C (en) Repetitive sound compression system

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980224

LAPS Cancellation because of no payment of annual fees